雷鋒網按:在去年年底北京大學舉辦的人工智能前沿論壇上,黃鐵軍教授做了題為《強人工智能之路》的演講。從人工智能的發(fā)展史出發(fā),他闡釋了強人工智能的意義,以及它會對人類可能所產生的影響,在這一點上,他表示同意霍金和馬斯克的威脅論觀點。
其次,盡管學界對人工智能是否能擁有自我意識存在爭議,但他堅持認為這是實現強人工智能不可回避的問題。他提出“智能為用,機器為體”的觀點,表示不做機器,只談智能很難有顛覆性變化產生,要產生強人工智能,就一定要制造新一代機器。他預測,未來15—30年,人類將親眼見證人造大腦變成現實。
以下為黃鐵軍教授演講內容實錄,雷鋒網做了不改變原意的編輯。
我今天給大家報告的題目是《強人工智能之路》。第一,什么是人工智能,人工智能我想最經典的定義是“以機器為載體的智能”,我不想用“人工”這個詞,因為這個詞就好像人賦予它才叫智能。不是這樣的,人的智能來自人和環(huán)境的互動和進化,機器也可以與環(huán)境互動,通過學習擁有越來越強的智能。
第二,“強”意味著“更強”。新一代人工智能國家規(guī)劃都出來的,等會兒我會提到它比經典人工智能更強在什么地方。
強還意味著“最強”。什么是最強的人工智能?這就是強人工智能,這是人工智能的終極目標,我們制造出強人工智能,才算完成了歷史使命。
在歷史上,一般我們講人工智能60年,1956年到2016年。但事實上,在1956年之前,在計算機發(fā)明之前就有提出了相關思想,可以說人工智能和計算機一樣差不多走過了八十年左右的時間。我還會講一下未來,但做預測從來都是吃力不討好的事情,或者說給自己立Flag,但是我還得立,不立我們往哪個方向走?所以我要講一下未來15到30年可能發(fā)生的一些重要的事情。
強人工智能避不開自我意識
先說強人工智能,強人工智能是一個學術詞語,不是一個媒體詞語。在人工智能發(fā)展到上世紀七八十年代的時候,就已經有了很多爭論,最后把人工智能分為兩類,一類叫強人工智能,一類叫弱人工智能,或者一類叫通用人工智能,另一類叫專用人工智能。
通用人工智能或強人工智能說的是什么?它有一個根本的特征——就是能夠適應環(huán)境,應對未知挑戰(zhàn),具有自我意識,達到人類水平,因此能超越人類,這種智能才能叫強人工智能,其他我們今天說的這些都不叫強人工智能。當然,這個話馬上就有爭議,具有自我意識這個詞是很敏感的一個說法,所以大家寫學術論文,做這個政府文件的時候都不用這個詞,因為一用這個詞就知道你要說什么了。
但我想,我們今天要探討的就是這樣一種人工智能。
在我們國家文件里邊,比如說中共中央國務院2016年的《國家創(chuàng)新驅動發(fā)展戰(zhàn)綱要》里邊用的詞叫“類人智能”;新一代人工智能發(fā)展規(guī)劃中提到了大數據智能、跨媒體智能、群體智能、混合增加智能、自主無人系統(tǒng)和類腦智能,為什么都繞開這個核心詞不去碰?
這個詞特別敏感,但我今天還是要講一下,再敏感的事情我們也要去討論。我個人對這件事的看法跟霍金、埃隆·馬斯克的類似。他們在媒體上說這個人工智能很厲害,如果我們做出超級人工智能的話,人類就會招致滅頂之災。很多人不以為然,一個搞物理的,一個搞創(chuàng)業(yè)的,他們怎么就對人工智能做出這樣的判斷呢?
他們正式公開表態(tài)是在2015年1月12日,大家可以搜一下。我說跟他們的看法一樣,其實在一個星期之前,我就發(fā)表了一篇非學術文章《人類能制造出超級大腦嗎?》,認為這件事會發(fā)生,而且會在不久的將來發(fā)生。多長時間呢?我認為,樂觀地說,差不多就是15—30年之內。又給自己立Flag了,我立這個是因為反正30年之后我還得活著,我說對了大家就能記住我當年說的,如果我說得不對那北大本來也應該做創(chuàng)新性事情的(笑)。
我說的不是開玩笑,我們真正要認真想這件事。為什么會發(fā)生?因為歷史已經進展到了這樣一個階段,以2016年作為歷史坐標的話,我們看深度學習發(fā)展了十年,人工智能發(fā)展了60年,從1956年開始,第一臺計算機發(fā)明70周年,1946年圖靈提出計算機模型80周年,在這樣的一個時間點上看,整個技術和思想在往什么方向發(fā)展?
1956年,在提出人工智能概念的達特茅斯學院會議上,就提到通過計算機仿真實現人工智能,提出雖然當時計算機很慢,存儲很小,但這不是主要問題,問題是在于能不能寫出把這個潛力發(fā)揮出來的程序。計算機的能力會逐漸提高的,我們只要把這個程序(算法、模型、軟件)寫出來,關鍵應該在這個地方,這是他們當時的一個想法。60年來,人工智能發(fā)展有很多里程碑性的進步,一般總結人工智能我們有三大流派,符號主義、連接主義和行為主義,我不展開了。
我們關注什么問題呢?我們關注智能和人工智能背后實現的載體到底是什么。智能是一種功能,是一種現象,這種能力是靠什么東西來實現的?人的智能靠人的大腦和人的身體實現,那人工智能呢?承載智能的那臺機器到底是什么?似乎最后一個跟沒問一樣,那不就是計算機嗎?但實際我們不能這么簡單的看。
大腦——強人工智能的唯一參照物
經典計算機承載得了人工智能嗎?我們看80年代的歷史,我挑幾個最重要的,圖靈1936年為了解決不可計算數存在這樣一個數學問題提出了圖靈機模型,這就是沿用至今的計算機概念模型。但計算機是個副產品,圖靈是為了證明一個數學問題,就是計算機能夠計算的數是很稀疏的,不可計算的數才是更廣的。所以計算機的理論邊界,在1936年它沒出現的時候,就已經確定了。
大家要明白,因為這個機器出來之后,就想讓它發(fā)揮更多作用,所以1956年開始就想在計算機上編算法、寫程序,實現人工智能,但大家看看,計算機發(fā)明70周年都干了些什么?從科學計算到今天的大數據、云計算,哪一個真正觸及了智能的核心問題?我們不能說這些系統(tǒng)沒有智能,我的意思是都沒有觸碰智能的核心問題,它只是在解決規(guī)模越來越大和越來越復雜的應用問題。不是智能,只是有一些智能的表現,為什么是這樣?
因為計算機的成功得益于晶體管,得益于集成電路,得益于摩爾定律,速度越來越快,規(guī)模越來越大,我們計算機專業(yè)就趕上了一個順風車,但這不等于他自然就是人工智能的載體,它只不過是一個很好用的,很強的一個計算工具而已。我們看今天的人工智能,例如神經網絡這樣一種結構,為什么要在計算機這個平臺上去實現?
我覺得不用做深度理論分析就知道,圖靈、馮諾依曼提出了一個CPU、存儲器,中間有一個總線這樣的架構,憑什么就成了我們說的以神經網絡為基礎的新一代人工智能和未來人工智能的平臺了?這兩種結構沒有什么相關性。計算機是為了解決計算和邏輯問題,而神經網絡是大量神經元相互作用,這兩個結構沒有任何天然上的可比性。干嘛我們一定要在計算機上去實現這樣的一種智能?
事實上,我們再回到1956年,我們看他們討論了七大問題,分成兩類,藍色的部分就是我們今天計算機學科,包括今天我們給本科生上課設置的課程體系,包括計算機硬件、軟件、算法、編程以及計算理論。但還有四個問題還不是計算機學科覆蓋的主要內容,第三個,神經網絡,第五個,自我改進,第六個,抽象,第七個,隨機性和創(chuàng)造性。這些問題至今應該說還剛剛起步,還遠遠沒有解決。
關于神經網絡最根本的一個問題是第三個問題,即“一群神經元如何形成概念”。神經元、神經網絡是物理存在,包括我們生物大腦的生物神經元和神經網絡,而概念、思維、意識、精神是抽象存在,憑什么這樣的物理存在就冒出了精神存在?不管是對人還是對機器,物理到精神的這一步怎么跨出去的?這一定是智能的根本性問題,但現在還沒有解決。
回過來,靠什么樣的平臺實現人工智能?有很多,計算機是圖靈提出來的,但圖靈并不認為計算機是實現智能的合適平臺,這在歷史上很清楚。他跟信息論創(chuàng)始人香農在1943年的時候有一個爭論,香農的提議,也就是我們今天大多數人認為的人工智能:把文化的東西,把知識、邏輯、理性這些東西灌輸給大腦,這叫做人工智能系統(tǒng)。
而圖靈觀點截然相反,他說,“我對造一個能力越來越強的大腦不感興趣,我要的只不過是一個尋常的大腦,這個大腦跟你們老板的腦袋一樣,就是跟AT&T公司老板的腦袋一樣,不需要很聰明,但是我需要一個這樣的腦,我不關心你裝很多東西給這樣的機器,這是1943年,第一臺計算機還沒出現的時候,圖靈就這么認為的。
后來,到了1950年,圖靈的《計算機與智能》這篇論文提出“機器能思考嗎?”的問題,是人工智能的真正的起點。在這篇文章里,他也確實說了:制造一個真正的智能機器必須具有學習能力,而制造這種機器的方法就是先制造一個模擬童年的大腦。因為沒有這顆大腦,你想訓練出智能是不可能的。
馮·諾依曼也是這么認為的,他留給我們后人的是1958年出版的《計算機與人腦》,他一個數學家,一個提出計算機體系結構的人為什么要去研究人腦?為什么要去研究神經元?就是要為真正的智能找一個合適的平臺。
所以大家都認為要從大腦這邊學。學什么?怎么學?這是一個關鍵問題,毫無疑問,我們的大腦有強人工智能,那好,我們從這個唯一的參照物里邊怎么學?有很多人認為,比如最近熱門的類腦計算,說要按照大腦怎么工作的這個原理設計算法,設計模型出來,就是模擬大腦功能這樣一個思路。
這個思路對于有些簡單問題是可能的,但是走不遠,因為對于大腦的功能機理很難給出一個詳細的描述,事實上這是人類面臨的最大問題:意識的生物學基礎是什么?靠怎么樣的生物學機理意識就冒出來了?如果這個問題能解決,那自然我們搞信息的人照著這個模型去做算法就可以了。
造腦——神經計算機
問題是,這個問題什么時候能夠解決?誰要敢告訴你這個問題三百年能解決,他就是很樂觀的了。他要是告訴你,永遠解決不了,這我也可以理解,因為這太難了。如果腦科學家回答不出這個問題,搞不清楚大腦是怎么思考的,我們搞信息的人就老老實實等著吧。如果是這樣,那我現在就報告結束,不用做了。事實上不是這樣的,我們不能這樣等,不能等到他們把這個原理背后的機制搞清楚,我們才去做。
首先要搞清楚工程技術和科學的關系問題。工程技術絕大多數情況下都是領先于科學的,我說得太絕對可能大家不高興,因為北大很多人都是搞科學的,但事實就是我們搞工程技術的先做出東西,搞科學的人再去解釋這個東西背后的原理,而不是先有科學原理,再按照科學原理去做這個系統(tǒng),后面這種情況不是真正的創(chuàng)新,真正的創(chuàng)新都是做出來一個科學原理都沒法解釋的系統(tǒng),然后去解釋,找科學原理。
對于大腦和這個未來的機器也是一樣,我們要先去造一個機器。當然機器也不能亂造,你說造一個機器,憑什么就能產生智能?所以第一,要回到大腦,不是回到認知科學,而是要回到神經科學,我們要知道是什么樣的神經網絡產生了人類智能,是從大腦的物理層面看這件事,并不是從精神、意識這樣的思維層面去看。
大腦的神經網絡可以解析出來,然后基于這個圖譜造神經計算機,進行訓練讓它產生智能,然后再去解釋機器為什么就產生了智能呢,如果我們理解了背后的機理,我們再告訴腦科學家去檢驗生物大腦是否也是按照同樣原理產生智能的。
當然這是一個工程量很大的事情,但是差不多十年左右把大腦精細解析是有可能的。歐洲的人類大腦計劃,實際很多工作也在做這件事,美國腦計劃也是一樣的,首先要把大腦圖譜弄出來,然后我們搞信息的人把它造出來做一臺機器。
結構剛才說了,就是這樣子,我們要做很多事,這臺機器現在還沒有名字,我們叫它神經計算機,或者叫神經形態(tài)機,它實際是按生物神經網絡,用神經形態(tài)器件做的,這個器件就是人工突觸和人工神經元,它處理的信息不是邏輯,不是要做計算,它就像一個生物要把感知這個世界的那些模態(tài)信息作為重要對象的一個機器。
這種機器如果我們跟經典計算機對比的話,每一層次都很清楚:基本器件是什么?結構應該怎么樣?你怎么樣訓練這樣的機器產生智能?你的科學基礎是什么?科學基礎主要是神經科學,不是認知科學,我說得有點絕對,但確實如此,認知科學是下一步的事情,現在我們需要的是神經科學。
這個也是2015年開始的北京腦計劃中“腦認知與類腦計算”專項規(guī)劃的一個技術思路。美國也是這樣的,它在2015年10月29號發(fā)布了一個報告,這也是會議的一個結果,也就是從材料到系統(tǒng)結構做這樣的一個神經形態(tài)計算系統(tǒng)。這個方向已經發(fā)展了三十年,從1986年到今天已經三十多年了,但在國內的動靜還比較小。斯坦福大學2030人工智能報告里,最后一項講的也是這項技術,是對人工智能未來影響最大的。
我說2016年是神經形態(tài)計算的元年,是因為全世界已有四套神經形態(tài)計算系統(tǒng)在運行,這四套系統(tǒng)從規(guī)模上當然都比不上人腦,但大家都在往這個方向逼近,包括IBM的SyNAPSE,這大家都知道,2006年定的目標就是要做一個電子大腦皮層。然后海德堡大學,我們2015年去看歐洲人類大腦計劃支持的剛剛在加電上線的系統(tǒng),這個系統(tǒng)的目標是2022年做出一個硬件的電子大腦,信息處理能力和人腦相當。
我們國家的新一代人工智能規(guī)劃里邊也有這樣一些東西,但是觸不觸碰這樣一個核心問題,要不要造這樣的機器,一直還有爭論。我雖然堅決支持它,但畢竟還是人微言輕,還有很多不同的觀點??偟膩碚f,我覺得這是方向,必須去做。因為很簡單,一個真正影響歷史的東西不能停留在想法上,必須最終會變成物理的實現。
這種新型機器做出來之后,對通用人工智能的實現是基礎性的。我們不能光在今天的計算機上玩算法,而是要造一個身體,造一個物理形態(tài),這個物理形態(tài)要依賴于神經科學,也要依賴數理科學,要分析它的復雜功能,沒有強大的數學物理,包括復雜系統(tǒng)理論,這個秘密我們最終是破解不了的。北大的有時就是學科齊全,有學術交叉基礎,例如我們有最好的微電子基礎做神經形態(tài)器件,也許還只有北大這種跨學科的學校才能做出來。
造眼——讓強人工智能睜開眼睛
機器要想具有真正的智能,必須有一個真正的眼睛,像人的眼睛一樣,這個眼睛不是攝像頭,它要像生物研究一樣工作。那生物眼睛怎么工作的?
現在所有的計算機視覺都是用視頻,這是錯的。視頻是騙人眼睛的,生物視覺以及我們將來要做的超級人工智能的視覺,不能采用視頻,而是要仿照生物信息處理的模式,這個模式就是神經脈沖,光電轉換之后就變成神經脈沖,神經脈沖送出大腦,大腦是脈沖神經網絡,采用脈沖進行信息的表達和處理。這里邊有很多秘密,有很多科學問題要解決。
在北大,兩年多時間我們做了一些工作,我給大家看一個結果,我們要把視網膜中每個神經元長什么樣,以及生理特性測出來,然后在計算機上把它精確仿真出來,先不問為什么,生物是怎么做的,我們就去把它實現出來,這是一個神經元和它的發(fā)放過程。
把這樣一些神經元都做出來之后,再連在一起。生物是怎么連在一起的,視網膜內的神經網絡怎么連我們也怎么連。連完之后,它就是一個仿真的視網膜,到了這種規(guī)模,必須上超級計算機才能進行計算。把一個圖像閃一下給它看,然后我們現在能看到這些神經元是怎么響應的。
這是神經節(jié)細胞,閃光的就是它在向大腦發(fā)放神經脈沖,把這個過程重構出來。重構出來之后干嗎?當然要變成電子載體,所以今年的北京腦科學研究計劃就支持我們做了一顆芯片。
這個是仿視網膜的芯片。做芯片的時候不能把所有的生物細節(jié)都帶進去,這樣做不起,我們這個芯片只需要普通攝像頭的成本,將來幾十塊錢就給大家用,比如用到機器人上,所以做了很多簡化。這個芯片我還沒拿到,我現在還都不能說百分之百做出來這種效果,下面是仿真的結果。
這是芯片看到的電扇轉的過程,為了大家看清,慢速播放。左邊是芯片產生的脈沖,然后我們就基于這個脈沖流重構,就像大腦皮層根據神經脈沖把這個畫面重構出來一樣。右邊這個,能看清楚葉片上的數字,人做不到,我們肉眼看電扇,它一轉起來就變成一團灰了。
它最大的一個特點就是,根據神經脈沖序列可以重構任意時刻的影像,視頻的概念是每秒鐘多少幀,也就是頻率。而采用這種新型芯片,我們可以計算出任何一個時刻的影像,這是生物視覺。我們睜開眼看世界從來沒有頻率,為什么?因為你本身的信息處理機制不是按視頻那種方式做的,這個芯片現在自然也具有這樣的基本功能。
接著一個問題就是把速度做得更快,現在已經夠快了,但是將來想做得更快,快到能看子彈、導彈,這都不是問題,只不過是一個速度加快的問題。這個當然都要花時間,現在目前定的就是五年,把眼睛完全搞透,然后把這個芯片做出來,后邊還有很多工作要做。十年能把視皮層搞出來,我們就能搬到神經計算機上去實現。好在國家有腦科學和類腦研究這些重大科技項目,中國有資源可以做這件事情。
智能為用,機器為體
我們回過頭來看,人工智能發(fā)展了這么多年,60年的經典時代,未來的15年,國家要做更強的人工智能,這是歷史的發(fā)展過程,但是我們不能光看智能這個水面上的層次,而要看是什么樣的一個物理載體支撐著這些智能的實現,那具體來說,就是經典計算機還是新的神經計算機?
1946年的計算機已經過去七十年,高速增長,這是我們今天人工智能談的一個物理平臺,但是它不是永遠的平臺,它也不是一個好的平臺。好的平臺,圖靈1943年就想到了。從1986年開始,進入神經形態(tài)計算工程實驗階段,2016年,已經可以說有四套神經計算系統(tǒng),預計不會超過15年,更強的、真正的神經計算機就會造出來,這種機器結構仿腦、功能類腦、性能超腦,它才是真正的強人工智能的一個物理平臺。
我再簡化一下說,這就叫“智能為用,機器為體”。不做機器,光說智能,很難有顛覆性的、革命性的變化,歷史一再證明今天的人工智能發(fā)展了三十年,有起有落,深度學習發(fā)展這么些年,有了今天的熱潮,但是我們如果往歷史看的話,這些出現都是因為計算機的出現,而往未來看的話,就是我們一定要造新一代的機器。
明年北京大學建校120年。北京大學1898年建校,在前兩年,也就是1896年就有人說了一句話,這個人叫特斯拉,他說:我認為任何對人類心靈的沖擊都比不過親眼見證人把人造大腦變?yōu)楝F實。我認為這件事情的發(fā)生,很可能就在北京大學建校150周年之前。
聯(lián)系客服