也許是有史以來(lái)最強(qiáng)大的人工智能“阿爾法圍棋”(AlphaGo)昨天戰(zhàn)勝了韓國(guó)圍棋高手李世石九段,成為學(xué)界熱議的焦點(diǎn)———人工智能(AI)專家們從中看到了具有深度學(xué)習(xí)功能的AI一日千里的進(jìn)步;腦科學(xué)家們則在考慮當(dāng)人類更深刻地理解大腦后,是否能制造出比AlphaGo更強(qiáng)的神經(jīng)網(wǎng)絡(luò)。
贏在意料之中
上海紐約大學(xué)研究人工智能的教授張崢此前已經(jīng)斷言,AlphaGo贏棋毫無(wú)懸念?!鞍凑誂lphaGo的學(xué)習(xí)和自學(xué)習(xí)規(guī)則,一日千里的行軍速度,不要說(shuō)是在過(guò)去五個(gè)月中進(jìn)步飛速,即便是把圍棋改成3D模式,它也一定會(huì)超過(guò)人類棋手。因?yàn)橥粋€(gè)棋盤(pán),AlphaGo一天可以死上萬(wàn)次,人一天才只能摔幾個(gè)跟頭而已?!?/p>
張崢?lè)Q,此前認(rèn)為人工智能百分百會(huì)贏,是基于AlphaGo的技術(shù)細(xì)節(jié)。因?yàn)锳lphaGo的卷積網(wǎng)絡(luò)從小局部開(kāi)始總結(jié),小局部的經(jīng)驗(yàn)可以自然遷移(和位置無(wú)關(guān))。圍棋戰(zhàn)斗中局部纏斗居多,抖動(dòng)全局的蝴蝶效應(yīng)該有,但不多,這是AlphaGo占便宜的另一個(gè)地方。也就是說(shuō),19×19的經(jīng)驗(yàn)可以挪用到20×20。所以,如果想勝,多造蝴蝶。
人和機(jī)器間的思維鴻溝在昨天的棋局中“一覽無(wú)遺”。他舉一個(gè)例子,在昨天的實(shí)戰(zhàn)評(píng)論中出現(xiàn)了“AlphaGo在這里尖了一步”、“AlphaGo這里一步是打劫”、“補(bǔ)了這里”、“壓了那里”……張崢說(shuō),“AlphaGo如果聽(tīng)了這些評(píng)論簡(jiǎn)直要笑死。不是因?yàn)樗?tīng)明白了,而是因?yàn)樗韭?tīng)不懂,也不會(huì)這么去思考。”AlphaGo的策略就是,哪里價(jià)值大就下哪里,頭腦簡(jiǎn)單而粗暴。事實(shí)上,“飛”“尖”“壓”這樣的標(biāo)簽,對(duì)機(jī)器來(lái)說(shuō)是個(gè)很難的分類任務(wù):相對(duì)哪部分棋子是“飛”,為什么不是對(duì)那部分的“尖”? 這是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)傳統(tǒng)老問(wèn)題:what-where?!按蚪佟边@種時(shí)間序列上的標(biāo)簽就更難了。AlphaGo根本就不理這種問(wèn)題,要消化這類問(wèn)題會(huì)難死它。
靠什么一日千里
據(jù)上海紐約大學(xué)副校長(zhǎng)、計(jì)算神經(jīng)生物學(xué)教授汪小京介紹,AlphaGo的工作方式是經(jīng)典的多層前饋卷積神經(jīng)網(wǎng)絡(luò)。這類網(wǎng)絡(luò)的出現(xiàn)很大程度是受到神經(jīng)科學(xué)的啟發(fā),其中尤其重要的是上世紀(jì)50年代諾貝爾獎(jiǎng)獲得者胡貝爾和威塞爾對(duì)視覺(jué)皮層的工作。AlphaGo的進(jìn)展很大程度上來(lái)源于谷歌強(qiáng)大的計(jì)算資源和工程師團(tuán)隊(duì)以及對(duì)于若干經(jīng)典算法的整合和改良。
所謂“深度學(xué)習(xí)”是植根于對(duì)大腦視覺(jué)系統(tǒng)的研究。視覺(jué)系統(tǒng)由很多“層”神經(jīng)網(wǎng)絡(luò)組成,神經(jīng)信號(hào)經(jīng)第一層處理后送至第二層,經(jīng)第二層進(jìn)一步處理后送至第三層,以此類推。層與層之間的網(wǎng)絡(luò)連接是通過(guò)學(xué)習(xí)訓(xùn)練而形成的。深度學(xué)習(xí)系統(tǒng)在完成某些任務(wù)上已接近人的能力。然而目前這個(gè)理論還有相當(dāng)大的局限。例如,深度網(wǎng)絡(luò)模型通常只有“前饋”連接(從第一層到第二層、第二層到第三層,等等),而人腦的神經(jīng)系統(tǒng)有很多“反饋”連接(從第三層回到第二層,等等),比如視覺(jué)注意力就來(lái)自于從高級(jí)“控制”腦區(qū)到初級(jí)視覺(jué)腦區(qū)的反饋信號(hào)。
簡(jiǎn)單來(lái)說(shuō),AlphaGo有三套網(wǎng)絡(luò),可以看作是兩個(gè)大腦,一套是走棋網(wǎng)絡(luò)和快速下棋網(wǎng)絡(luò)可以看作是一個(gè)大腦,還有一套估值網(wǎng)絡(luò)則是對(duì)大局進(jìn)行判斷。
第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)”,也是落子選擇器,主要是觀察棋盤(pán)布局并預(yù)測(cè)每一個(gè)合法下一步的最佳概率,并找到這個(gè)下一步?!皬?qiáng)化學(xué)習(xí)的策略網(wǎng)絡(luò)”則是更強(qiáng)的落子選擇器,這一策略網(wǎng)絡(luò)不是簡(jiǎn)單審視單一棋盤(pán)位置,再提出從那個(gè)位置分析出來(lái)的落子。也不模擬任何未來(lái)的走法,而是分析最佳策略。這展示了簡(jiǎn)單的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的力量。同時(shí),還有快速落子選擇器,這個(gè)神經(jīng)網(wǎng)絡(luò)觀察對(duì)手之前下的子和新下的子,觀察棋盤(pán)的局部,使得決策更快。
第二個(gè)大腦則是估值神經(jīng)網(wǎng)絡(luò)大腦,也是棋局評(píng)估器。這個(gè)大腦并不猜測(cè)具體下一步,而是預(yù)測(cè)每一個(gè)棋手贏棋的可能。通過(guò)整體局面判斷來(lái)輔助落子選擇器。這個(gè)判斷僅僅是大概的,但對(duì)于閱讀速度提高很有幫助。通過(guò)分類潛在的未來(lái)局面的“好”與“壞”,AlphaGo能夠決定是否通過(guò)特殊變種去深入閱讀。如果局面評(píng)估器說(shuō)這個(gè)特殊變種不行,那么AI就取消這一思路上的任何落子。
在學(xué)界看來(lái),AlphaGo這類AI可以說(shuō)是目前類腦人工智能一個(gè)比較好的實(shí)現(xiàn)。那么,當(dāng)我們更深刻地理解大腦后,能夠制造出比AlphaGo更強(qiáng)的神經(jīng)網(wǎng)絡(luò),還是我們對(duì)類腦智能有了更好的研究后能推動(dòng)對(duì)人腦的理解呢? 這在業(yè)界學(xué)者看來(lái)是一個(gè)目前令人困惑的問(wèn)題。汪小京認(rèn)為,發(fā)展腦科學(xué)基礎(chǔ)研究,將促進(jìn)“深度學(xué)習(xí)”等類腦智能技術(shù)的蓬勃發(fā)展。而在張崢看來(lái),類腦神經(jīng)網(wǎng)絡(luò)中的估值判斷網(wǎng)絡(luò)就是由優(yōu)美的數(shù)學(xué)算法來(lái)架構(gòu)表達(dá)。這也使得一些頂尖的神經(jīng)科學(xué)家和數(shù)學(xué)家在研究,目前這一數(shù)學(xué)算法是否可以推廣到對(duì)人類大腦神經(jīng)網(wǎng)絡(luò)的研究中。
消滅機(jī)器和人類之間的理解鴻溝
每當(dāng)AI取得進(jìn)展都會(huì)引起爭(zhēng)議,有人認(rèn)為AI是要超越人類,甚至威脅全人類了。AlphaGo贏棋也引起了這類爭(zhēng)論。
“AlphaGo也許會(huì)打破人類的心理安全底線,但是‘打不過(guò),難道不是制造任何工具的目的?如果買來(lái)的錘子還沒(méi)你拳頭硬,那誰(shuí)會(huì)買。日常生活中所有工具的存在就在于它們強(qiáng)過(guò)你?!睆垗樥f(shuō):“研究AlphaGo難道不是為造一個(gè)我們打不過(guò)的圍棋AI?”
上海交通大學(xué)研究人工智能的教授俞凱也稱,從某種程度上而言,每次技術(shù)的進(jìn)步都是人的某一個(gè)器官的延伸,汽車是腿的延伸,AI則是大腦的延長(zhǎng)線。就目前來(lái)說(shuō),沒(méi)有擔(dān)憂的必要。
在張崢看來(lái),現(xiàn)在機(jī)器不能真正理解人類,人類也不能真正理解機(jī)器,而消滅這一鴻溝,可說(shuō)是業(yè)界和學(xué)界之間的制高點(diǎn)。“我常常告誡學(xué)生,不要被現(xiàn)在語(yǔ)音識(shí)別達(dá)到99%而迷惑,因?yàn)檫@并非真正的智能,只能算是‘智能界面,?!辈贿^(guò),張崢也稱,機(jī)器學(xué)習(xí)仍然有自身的缺陷:無(wú)法總結(jié)規(guī)律,或者說(shuō)無(wú)法吐出一套規(guī)整自洽的規(guī)律;泛化能力差,無(wú)法在復(fù)盤(pán)中舉一反三,即便告訴它哪步走錯(cuò)了,恐怕它也不知道為啥,只是一氣兒死磕到撞了南墻才完事。
聯(lián)系客服