北京,五道口,早7點(diǎn)。不出意外,這里又如往常一樣堵了個(gè)水泄不通。原本被用來疏導(dǎo)交通流量、提高道路通行能力,減少交通事故的紅綠信號燈,此時(shí)早已失去了原有的功能。每當(dāng)遇到這種情況,如果想要使交通重新恢復(fù)順暢,一般情況下就只有兩種方法:一是等待交警來組織車輛進(jìn)行疏通,另外一個(gè)就得靠熱心群眾來幫忙了。
無論是經(jīng)驗(yàn)豐富的交警,亦或是首次遇到這種情況的菜鳥司機(jī),雖然可能耗時(shí)不同,但最終應(yīng)該都能順利疏通車流,使交通恢復(fù)正常。
而原本被用來疏導(dǎo)交通流量、提高道路通行能力的紅綠信號燈,此時(shí),依然"傻乎乎"的按照設(shè)定好的時(shí)間間隔來回變換,對于擁堵的交通毫無助益。
警察、路人與交通燈,在交通中同樣扮演著疏通者的角色,但為什么警察與路人最終能夠順利疏通車流,而交通燈卻不能呢?因?yàn)榫炫c路人是自然智能的擁有者,而控制交通燈變化的,只是慣常設(shè)定好的程序,不會(huì)隨機(jī)應(yīng)變。
近些年,人工智能大潮迅速席卷全球。人工智能相關(guān)技術(shù)與應(yīng)用,已經(jīng)逐漸滲透到各個(gè)領(lǐng)域。同時(shí),隨著通信技術(shù)的發(fā)展、物聯(lián)網(wǎng)的發(fā)展、深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的"物"開始擁有"智慧",比如能跟孩子交流的音箱、能夠自動(dòng)調(diào)節(jié)亮度的電燈、能夠自動(dòng)"判斷"白天還是夜晚的窗簾,亦或者能夠更加智能的疏通車流的交通信號燈等等。
人工智能能解決堵車問題嗎?
這些變化為大眾帶來更多便利的同時(shí),也使我們處在了一個(gè)更加智能化的世界。但是,這樣所謂的智能就足夠了嗎?
就像上面提到的堵車問題,即便五道口的紅綠燈接入物聯(lián)網(wǎng)、接入深度學(xué)習(xí)庫,在面對復(fù)雜的交通擁堵時(shí),依然無法像人類那樣憑借經(jīng)驗(yàn)去迅速疏導(dǎo)車流。這就是現(xiàn)階段絕大多數(shù)所謂的人工智能設(shè)備為何無法真正被稱為"智能"的主要原因。
那么,有辦法讓機(jī)器像人一樣擁有或近似擁有自然智能,以應(yīng)對突發(fā)狀況,甚至作出隨機(jī)應(yīng)變嗎?
·深度學(xué)習(xí)有哪些局限性?
時(shí)下,賦予機(jī)器以"智能"的手段通常是通過"機(jī)器學(xué)習(xí)"來實(shí)現(xiàn)的,而機(jī)器學(xué)習(xí)中最為大家所熟知的莫過于"深度學(xué)習(xí)"。
在2016年之前,人工智能領(lǐng)域大多使用有監(jiān)督的深度學(xué)習(xí)方法。有監(jiān)督的學(xué)習(xí)方法就是訓(xùn)練者通過手工設(shè)定學(xué)習(xí)特征的方法,來讓機(jī)器學(xué)會(huì)某件事情。這就像我們上小學(xué)的時(shí)候,大多數(shù)情況下是老師在教我們識字一樣,老師教的是什么,我們就學(xué)什么,很少去自己進(jìn)行思考性的拓展學(xué)習(xí)。
有監(jiān)督的深度學(xué)習(xí)就像是在給機(jī)器上課
而近兩年,人工智能領(lǐng)域開始大范圍使用無監(jiān)督的深度學(xué)習(xí)方法。即讓機(jī)器通過從大數(shù)據(jù)中尋找規(guī)律、挖掘價(jià)值,去認(rèn)識某些事物。這就像我們即便不知道一種花的確切名字是什么,但通過歸納花這類植物的特征,我們在遇見不同的花時(shí),都至少知道它是花,而且在遇到相同的花時(shí),我們也知道它們是相同的。雖然這個(gè)比喻不夠確切,但相信大家能明白它與有監(jiān)督深度學(xué)習(xí)的區(qū)別。
不過,雖然時(shí)下大都采用深度學(xué)習(xí)方法,通過數(shù)據(jù)挖掘來賦予機(jī)器以智能,但歸根到底,一種深度學(xué)習(xí)訓(xùn)練方法訓(xùn)練出來的機(jī)器,絕大多數(shù)情況下還是只能應(yīng)對一類事物。況且深度學(xué)習(xí)只是在圖像和語音等富媒體的分類和識別上取得非常好的效果,它并非人工智能的終極方法。
最熟悉的例子莫過于谷歌AlphaGO,它是一款專注于圍棋的人工智能,在沒有進(jìn)行象棋相關(guān)的深度學(xué)習(xí)之前的時(shí)候,AlphaGO只能用來下圍棋。這就是現(xiàn)階段以深度學(xué)習(xí)方法為主的人工智能行業(yè)所面臨的一個(gè)問題。
AlphaGO在圍棋界是大師,但在其它方面則是"智障"
但是在人類的愿景中,要達(dá)到的是讓人工智能變得和人一樣聰明,能夠應(yīng)對不同種類的事件,甚至能夠在面對不同突發(fā)狀況時(shí),迅速作出隨機(jī)應(yīng)變的反應(yīng)?,F(xiàn)階段的深度學(xué)習(xí)方法、或更大一個(gè)范疇的機(jī)器學(xué)習(xí)很難達(dá)成這樣的結(jié)果。因此,需要讓機(jī)器在某種程度上具備接近自然智能、或具備真正自然智能的新的方法,來推動(dòng)人工智能在"智慧"層面的發(fā)展。而目前,神經(jīng)擬態(tài)計(jì)算就是這樣一種神奇的技術(shù)。
·如何讓機(jī)器像人腦一樣工作
要想了解神經(jīng)擬態(tài)計(jì)算,那么首先要了解自然智能。
神經(jīng)擬態(tài)學(xué)工程師、德國海德堡大學(xué)物理學(xué)家卡爾海因茨·邁耶(Karlheinz Meier)認(rèn)為,人類的大腦相對于計(jì)算機(jī)而言有三大特性:
其一、低能耗。人腦的功率大約是20瓦特,而當(dāng)前試圖模擬人腦的超級計(jì)算機(jī)需要幾百萬瓦特;
其二、容錯(cuò)性。失去一個(gè)晶體管就能破壞一個(gè)微處理器,但大腦時(shí)刻都在失去神經(jīng)元;
其三、無須編程。大腦在與外界交互的過程中自發(fā)地學(xué)習(xí)和改變,而非遵循預(yù)設(shè)算法所限制的路徑和分支。
這三大特性,尤其是第三項(xiàng)特性,使人類的智能與計(jì)算機(jī)、機(jī)器的智能區(qū)隔開來,形成了獨(dú)特的自然智能。
自然智能使人類能夠應(yīng)對不同的突發(fā)狀況
而神經(jīng)擬態(tài),就是科學(xué)家們?yōu)榱藢?shí)現(xiàn)這些目標(biāo),力求讓計(jì)算機(jī)去實(shí)現(xiàn)對人類大腦的模擬,同時(shí)了解大腦的工作機(jī)制,最終讓計(jì)算機(jī)或機(jī)器具備如人腦一樣的近自然智能特性,從而讓計(jì)算機(jī)或機(jī)器具備更低能耗、更加高效、容錯(cuò)率更高的能力。
當(dāng)前,人類大腦單個(gè)神經(jīng)細(xì)胞--即神經(jīng)元--的工作模式大體上已被科學(xué)家們掌握,大腦中每個(gè)可見的腦葉和神經(jīng)節(jié)的作用也已被探明,但是腦葉和神經(jīng)節(jié)中的神經(jīng)元如何組織依舊是個(gè)謎??茖W(xué)家們認(rèn)為神經(jīng)元的組織方式?jīng)Q定了大腦的思考方式,同時(shí)也很可能是意識的存在方式。因此,想要實(shí)現(xiàn)神經(jīng)擬態(tài)計(jì)算,首先就需要構(gòu)建出一顆模擬大腦神經(jīng)元工作的計(jì)算芯片。
這就是神經(jīng)擬態(tài)計(jì)算的核心原則。
正如前面所言,如果說深度學(xué)習(xí)、機(jī)器學(xué)習(xí)是從大量有過標(biāo)注的數(shù)據(jù)中去提取出來一些方式,來解決某一領(lǐng)域的問題的話,那么神經(jīng)擬態(tài)計(jì)算就是通過模擬人腦神經(jīng)元工作機(jī)制,使人工智能從數(shù)據(jù)的各種形態(tài)中提取出更多有價(jià)值的東西,而非只局限于某一領(lǐng)域。
那么有人可能就會(huì)問,"這樣做究竟有何意義呢?"
·神經(jīng)擬態(tài)計(jì)算的意義在哪?
我們還是回到現(xiàn)實(shí)中的堵車這件事上來。
拋開人為因素造成的堵車不談?,F(xiàn)在的交通燈都是預(yù)先進(jìn)行了編程,什么時(shí)候是紅燈,什么時(shí)候是綠燈,以及怎么切換,都是編程好的。但我們都知道,實(shí)際交通環(huán)境中,不同時(shí)間段、不同地點(diǎn)的車流量是完全不同的。明明車很多的時(shí)間段、或地點(diǎn)、或方向上,綠燈的時(shí)間不夠長,有的車為了少等幾個(gè)燈時(shí),可能就會(huì)趁黃燈硬闖,車流量大的時(shí)候就很容易發(fā)生擁堵了。
普通交通燈不夠智能,無法應(yīng)對越來越復(fù)雜的路況
那么如何讓交通燈變得更加智能,從而能夠應(yīng)對不同時(shí)間、不同地點(diǎn)、不同方向上的不同車流,盡量避免因機(jī)械性的控制讓交通變得擁堵呢?
如果靠機(jī)器學(xué)習(xí)的方法訓(xùn)練出一個(gè)模型,可以通過某一種檢測的方法讓交通燈做這樣或那樣的變化,可能會(huì)有一定的效果,但并不會(huì)適用于所有的路口。這時(shí)候,其實(shí)最需要的是在每一個(gè)路口放一個(gè)人,警察、熱心群眾都可以,不需要有博士一樣的智商,甚至不需要有一定的經(jīng)驗(yàn)的人都可以幫助這個(gè)路口最大程度避免擁堵。但是如果這樣做的話,就太過勞民傷財(cái)了。
而神經(jīng)擬態(tài)計(jì)算,就能夠通過不斷的訓(xùn)練完成這樣的事情。
與深度學(xué)習(xí)、機(jī)器學(xué)習(xí)不同。如果給紅綠燈安裝一顆神經(jīng)擬態(tài)計(jì)算芯片,那么這個(gè)紅綠燈就可以從一個(gè)初始規(guī)則狀態(tài)開始學(xué)習(xí),通過視覺的輸入,通過其它體系信息的輸入,逐漸"知道"怎么樣按照當(dāng)前的情況,自適應(yīng)的去調(diào)整信號燈的切換,讓這個(gè)路口保持最大、最高效的通過率,以避免因車流大、綠燈時(shí)間短而造成路口堵塞的問題。
其實(shí)在自動(dòng)駕駛領(lǐng)域,類似的問題最為普遍。
比如一輛自動(dòng)駕駛汽車是通過深度學(xué)習(xí)來"了解"北京路況下如何駕駛的話,那么它如果到了滿大街都是小三輪的其它城市,這輛自動(dòng)駕駛汽車可能就傻眼了。而重新為這輛車制定一套當(dāng)?shù)氐纳疃葘W(xué)習(xí)框架,又非常的費(fèi)事。因此,就需要這輛車具備進(jìn)一步的自主學(xué)習(xí)能力。不需要人為去重新制定方案,只要通過多次實(shí)際行駛中對新環(huán)境的數(shù)據(jù)分析和學(xué)習(xí),就能適應(yīng)新環(huán)境的路況規(guī)則,這就才是人工智能想要達(dá)成的目標(biāo)。
而神經(jīng)擬態(tài)計(jì)算正是模擬人腦結(jié)構(gòu),讓基于其的設(shè)備具有自主學(xué)習(xí)能力的技術(shù)。
那么神經(jīng)擬態(tài)計(jì)算芯片是如何模擬人腦結(jié)構(gòu)的呢?以英特爾的LOIHI芯片為例我們可以大致了解其中奧妙。
人類大腦有800億神經(jīng)元,每個(gè)神經(jīng)元又可以跟上萬個(gè)神經(jīng)元進(jìn)行連接。怎么讓一個(gè)系統(tǒng)和軟硬件結(jié)合的設(shè)備可以以人腦的方式去學(xué)習(xí)呢?LOIHI就是模擬腦神經(jīng)元模式,把學(xué)習(xí)規(guī)則放入到每個(gè)神經(jīng)元里去進(jìn)行學(xué)習(xí)。
比如一個(gè)人不管是聰明還是不太聰明的人,其實(shí)都可以去學(xué)很多種技能,會(huì)說話,又會(huì)唱歌,又會(huì)寫字,又可以炒菜做飯,所有這些都是一個(gè)大腦解決的,沒有人會(huì)切換不同大腦來做不同事情。
人類可以同時(shí)掌握多項(xiàng)技能,甚至不需要經(jīng)過特殊的訓(xùn)練
英特爾研發(fā)的LOIHI神經(jīng)擬態(tài)計(jì)算芯片,就是首個(gè)可以自主學(xué)習(xí)的芯片。神經(jīng)擬態(tài)計(jì)算不是馮·諾依曼體系結(jié)構(gòu)上的計(jì)算--存儲體系:CPU主要負(fù)責(zé)運(yùn)算,而取得的指令在存儲序列,數(shù)據(jù)也在存儲序列。任何的計(jì)算過程都是取指令、數(shù)據(jù)、算出來的結(jié)果又存在內(nèi)存里,這是標(biāo)準(zhǔn)的計(jì)算架構(gòu)。
神經(jīng)擬態(tài)計(jì)算的計(jì)算和存儲是在一起的,會(huì)形成很多分布式的單元,而且采用了異步計(jì)算方式,這種計(jì)算方式與馮·諾依曼結(jié)構(gòu)的同步時(shí)鐘驅(qū)動(dòng)不同模塊工作的方式不同。
比如英特爾LOIHI神經(jīng)擬態(tài)計(jì)算芯片。它的整個(gè)芯片就像人類大腦,比如當(dāng)你在聽歌的時(shí)候,其實(shí)只有一個(gè)區(qū)域在工作,不是所有都在負(fù)責(zé)聽歌這件事。神經(jīng)擬態(tài)的好處是以很高的能效比解決一些計(jì)算問題,而且特別是一些比較復(fù)雜的問題,比如說稀疏編碼、詞典學(xué)習(xí)、約束滿足等等。
其實(shí)神經(jīng)擬態(tài)計(jì)算的出現(xiàn),就是要解決那些現(xiàn)在機(jī)器學(xué)習(xí)都做不了的事情,而這些事情通過類腦芯片能夠得到很好的解決。
·神經(jīng)擬態(tài)計(jì)算為何不具有取代性?
神經(jīng)擬態(tài)研究并非什么新鮮事,但神經(jīng)擬態(tài)落地到計(jì)算芯片上、落地到實(shí)際應(yīng)用中,英特爾LOIHI實(shí)屬首例。LOIHI每一個(gè)單芯片包含128個(gè)核,每一個(gè)核可以實(shí)現(xiàn)布局多個(gè)神經(jīng)元,每個(gè)神經(jīng)元可以跟其它神經(jīng)元產(chǎn)生互相連接。
英特爾的LOIHI神經(jīng)擬態(tài)計(jì)算芯片
LOIHI核芯里面的神經(jīng)元可以接收其它神經(jīng)元發(fā)送的脈沖,與深度學(xué)習(xí)卷積神經(jīng)網(wǎng)不同,LOIHI構(gòu)成的是脈沖神經(jīng)網(wǎng)。脈沖神經(jīng)網(wǎng)同時(shí)處理時(shí)空信號,時(shí)間在里面是一個(gè)訓(xùn)練參數(shù),脈沖早一點(diǎn)來和晚一點(diǎn)來,其訓(xùn)練結(jié)果會(huì)產(chǎn)生差異。脈沖到達(dá)之后會(huì)驅(qū)動(dòng)神經(jīng)元里面原本記憶和存儲的以往被激發(fā)過的某些狀況,如果剛好這個(gè)脈沖來的時(shí)候?qū)е铝爽F(xiàn)在可以被激活發(fā)出一個(gè)信號的話,那么它就會(huì)發(fā)出一個(gè)信號給別的神經(jīng)元,同時(shí)配合相應(yīng)的算法,從而產(chǎn)生訓(xùn)練和學(xué)習(xí)的過程,這也是LOIHI最底層的一種學(xué)習(xí)方式。
引入時(shí)空信號處理器的特性,使得LOIHI芯片上的神經(jīng)元里面的很多參數(shù)都可被實(shí)時(shí)調(diào)整,這使得LOIHI在工作時(shí)可以修改自己,實(shí)現(xiàn)自主學(xué)習(xí)、自我學(xué)習(xí)的能力,這是其與之前所有芯片的根本差異。如果都是在深度學(xué)習(xí)框架下訓(xùn)練好一個(gè)模型,然后放到一個(gè)芯片里,那么這個(gè)芯片工作的時(shí)候永遠(yuǎn)都是原來的參數(shù),不設(shè)定新的框架就不會(huì)再改變。而神經(jīng)擬態(tài)計(jì)算芯片通過實(shí)時(shí)自主修改參數(shù)、并進(jìn)行學(xué)習(xí)訓(xùn)練,就可以很好的解決人工智能的"智能"問題,使機(jī)器能夠更接近自然智能的處理方式。
·結(jié)語
在深度學(xué)習(xí)、機(jī)器學(xué)習(xí)之后,到量子計(jì)算真正付諸實(shí)際應(yīng)用之前,神經(jīng)擬態(tài)計(jì)算堪稱推動(dòng)人工智能發(fā)展的重要手段。
那么既然更加先進(jìn)的技術(shù)出現(xiàn)了,深度學(xué)習(xí)、機(jī)器學(xué)習(xí)就應(yīng)該被淘汰掉嗎?筆者認(rèn)為這種觀點(diǎn)并不正確。
對于時(shí)下的人工智能行業(yè)來說,多形態(tài)技術(shù)的存在有極大的必要性,機(jī)器學(xué)習(xí)在很多領(lǐng)域依然是目前最好的訓(xùn)練、學(xué)習(xí)手段之一。而深度學(xué)習(xí)在圖像、語音等領(lǐng)域的應(yīng)用效果,也并非其它方法可以輕易去替代。
神經(jīng)擬態(tài)計(jì)算的出現(xiàn),給人工智能發(fā)展開拓了一條新的道路。它與深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù)之間并非是誰取代誰、誰淘汰誰的關(guān)系,而是互補(bǔ)共進(jìn)的關(guān)系,只有將多種技術(shù)靈活的運(yùn)用到人工智能領(lǐng)域,這個(gè)行業(yè)才能真正的發(fā)展起來,才能真正成為惠及民生的產(chǎn)業(yè)。
從算法的角度看,機(jī)器學(xué)習(xí)有很多種算法,例如回歸算法、基于實(shí)例的算法、正則化算法、決策樹算法、貝葉斯算法、聚合算法、關(guān)聯(lián)規(guī)則學(xué)習(xí)算法和人工神經(jīng)網(wǎng)絡(luò)算法。很多算法可以應(yīng)用于不同的具體問題;很多具體的問題也需要同時(shí)應(yīng)用好幾種不同的算法。由于篇幅有限,我們僅介紹其中(可能是公眾心目中名氣最大的)一種:人工神經(jīng)網(wǎng)絡(luò)。
人工神經(jīng)網(wǎng)絡(luò):
既然人工智能要模擬人類的思考過程,一些人工智能科學(xué)家想,不如我們先看看人類是怎樣思考的吧?
人類的大腦是一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)。它的組成單元是神經(jīng)元。每一個(gè)神經(jīng)元看起來很簡單,它們先接收上一個(gè)神經(jīng)細(xì)胞的電信號刺激,再向下一個(gè)神經(jīng)細(xì)胞發(fā)出電信號刺激。
別看神經(jīng)元細(xì)胞很簡單,但如果神經(jīng)元的數(shù)量很多,它們彼此之間的連接恰到好處,變成神經(jīng)網(wǎng)絡(luò),就可以從簡單中演生出復(fù)雜的智能來。例如,人類的大腦中含有1千億個(gè)神經(jīng)元,平均每個(gè)神經(jīng)元跟其他的神經(jīng)元存在7000個(gè)突觸連接。一個(gè)三歲小孩大腦中,大約會(huì)形成1千萬億個(gè)突觸。隨著年齡的增長,人類大腦的突觸數(shù)量會(huì)逐漸減少。成年人的大腦中,大約會(huì)有1百萬億到5百萬億個(gè)突觸。
雖然科學(xué)家還沒有完全搞清楚人類大腦的神經(jīng)網(wǎng)絡(luò)的運(yùn)作方式,但人工智能科學(xué)家想,不理解沒關(guān)系,先在計(jì)算機(jī)中模擬一組虛擬的神經(jīng)網(wǎng)絡(luò)試試看,這就是人工神經(jīng)網(wǎng)絡(luò)。
在人工神經(jīng)網(wǎng)絡(luò)中,每一個(gè)小圓圈都是在模擬一個(gè)“神經(jīng)元”。它能夠接收從上一層神經(jīng)元傳來的輸入信號(也就是一堆數(shù)字);根據(jù)不同神經(jīng)元在它眼中的重要性,分配不同的權(quán)重,然后將輸入信號按照各自的權(quán)重加起來(一堆數(shù)字乘以權(quán)重的大小,再求和);接著,它將加起來結(jié)果代入某個(gè)函數(shù)(通常是非線性函數(shù)),進(jìn)行運(yùn)算,得到最終結(jié)果;最后,它再將這個(gè)結(jié)果輸出給神經(jīng)網(wǎng)絡(luò)中的下一層神經(jīng)元。
人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元看起來很簡單,只知道傻傻地將上一層神經(jīng)元的輸入數(shù)據(jù)進(jìn)行簡單的運(yùn)算,然后再傻傻地輸出。沒想到這一套還真的很管用,運(yùn)用一系列精巧的算法,再給它投喂大量的數(shù)據(jù)之后,人工神經(jīng)網(wǎng)絡(luò)居然能夠像人腦的神經(jīng)網(wǎng)絡(luò)一樣,從復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)一系列“特征”,產(chǎn)生“聰明的思考結(jié)果”。
那么人工神經(jīng)網(wǎng)絡(luò)是怎么學(xué)習(xí)的呢?所謂的學(xué)習(xí),本質(zhì)上是讓人工神經(jīng)網(wǎng)絡(luò)嘗試調(diào)節(jié)每一個(gè)神經(jīng)元上的權(quán)重大小,使得整個(gè)人工神經(jīng)網(wǎng)絡(luò)在某一個(gè)任務(wù)的測試中的表現(xiàn)達(dá)到某個(gè)要求(例如,識別汽車的正確率達(dá)到90%以上)。
請回憶一下前面講過的“梯度下降法”。人工神經(jīng)網(wǎng)絡(luò)嘗試不同的權(quán)重大小,相當(dāng)于在一個(gè)參數(shù)空間的地圖上四處游走。每一種權(quán)重的組合對應(yīng)的人工神經(jīng)網(wǎng)絡(luò)執(zhí)行任務(wù)時(shí)的錯(cuò)誤率,相當(dāng)于這個(gè)地圖上的每一點(diǎn)都有一個(gè)海拔高度。尋找一組權(quán)重,使得人工神經(jīng)網(wǎng)絡(luò)的表現(xiàn)最好,錯(cuò)誤率最低,就相當(dāng)于在地圖上尋找海拔最低的地方。所以,人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,常常要用到某種“梯度下降法”,這就是為什么如果將來你要學(xué)習(xí)人工智能,第一個(gè)要掌握的就是“梯度下降法”。
機(jī)器學(xué)習(xí)的分類:
從學(xué)習(xí)風(fēng)格的角度看,機(jī)器學(xué)習(xí)有很很多種學(xué)習(xí)方法,我們簡要地列舉其中幾種方法:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和遷移學(xué)習(xí)。
監(jiān)督學(xué)習(xí):
比方說,你想教計(jì)算機(jī)如何識別一張照片上的動(dòng)物是不是貓。你先拿出幾十萬張動(dòng)物的照片,凡是有貓的,你就告訴計(jì)算機(jī)有貓;凡是沒有貓的,你就告訴計(jì)算機(jī)沒有貓。也就是說,你預(yù)先給計(jì)算機(jī)要學(xué)習(xí)的數(shù)據(jù)進(jìn)行了分類。這相當(dāng)于你監(jiān)督了計(jì)算機(jī)的學(xué)習(xí)過程。
經(jīng)過一段監(jiān)督學(xué)習(xí)的過程之后
非監(jiān)督學(xué)習(xí):
比方說,你想教計(jì)算機(jī)區(qū)分貓和狗的照片。你拿出幾十萬張貓和狗的照片(沒有其他動(dòng)物)。你并不告訴計(jì)算機(jī)哪些是貓,哪些是狗。也就是說,你沒有預(yù)先給計(jì)算機(jī)要學(xué)習(xí)的數(shù)據(jù)進(jìn)行分類,所以你并沒有監(jiān)督計(jì)算機(jī)的學(xué)習(xí)過程。
經(jīng)過一段監(jiān)督學(xué)習(xí)的過程之后,計(jì)算機(jī)就能把你輸入的照片按照相似性分成兩個(gè)大類(也就是區(qū)分了貓和狗)。只不過計(jì)算機(jī)只是從數(shù)字照片的數(shù)學(xué)特征的角度進(jìn)行了分類,而不是從動(dòng)物學(xué)的角度進(jìn)行了分類。
強(qiáng)化學(xué)習(xí):
比方說,你想教計(jì)算機(jī)控制一只機(jī)械臂打乒乓球。一開始,計(jì)算機(jī)控制機(jī)械臂像傻瓜一樣,拿著球拍做很多隨機(jī)的動(dòng)作,完全不得要領(lǐng)。
但是,一旦機(jī)械臂湊巧接到一個(gè)球,并把球擊打到對手的球桌上,我們就讓計(jì)算機(jī)得一分,這叫做獎(jiǎng)勵(lì)。一旦機(jī)械臂沒有正確地接到球、或沒有把球擊打到正確的位置上,我們就給計(jì)算機(jī)扣一分,這叫做懲罰。經(jīng)過大量的訓(xùn)練之后,機(jī)械臂漸漸地從獎(jiǎng)勵(lì)和懲罰中,學(xué)會(huì)了接球、擊打球的基本動(dòng)作。
遷移學(xué)習(xí):
比方說,你讓計(jì)算機(jī)學(xué)會(huì)了控制機(jī)械臂打乒乓球之后,又叫它學(xué)習(xí)打網(wǎng)球。這個(gè)時(shí)候,你不需要讓計(jì)算機(jī)從零開始重新學(xué),因?yàn)槠古仪蚝途W(wǎng)球的規(guī)則是相似的。例如,這兩種球都要把球擊打到對方的球場/球桌上。所以,計(jì)算機(jī)可以將之前學(xué)到的動(dòng)作遷移過來。這樣一種學(xué)習(xí),就叫做遷移學(xué)習(xí)。
聯(lián)系客服