2017-11-05 08:11
來源:文匯報 作者:田淵棟
阿爾法狗的升級版——阿爾法元擁有自我學習的能力,只學習了三天就打敗了阿爾法狗;沙特阿拉伯王國最近剛授予“女性”機器人索菲婭沙特公民身份,使之成為有史以來首個獲得公民身份的機器人……人工智能的發(fā)展會威脅到人類社會嗎? 機器人控制人類的那一天已經(jīng)逼近了嗎?
大多數(shù)時候,恐慌來源于大眾對于技術(shù)的無知。在人工智能科學家的眼中,目前的人工智能與人類大腦相比,就如同幾個簡單的符號與一部小說之間的差距。
阿爾法元的成功只是一種投緣
阿爾法狗在業(yè)內(nèi)的影響力并不像在大眾中那么大。因為在人工智能領(lǐng)域,每個方法都有局限性,沒有一種方法是萬能的。等到對新出現(xiàn)人工智能的每個部分都有比較清晰的了解時,它的神秘感也就和現(xiàn)在的這些疑惑和擔憂一起,煙消云散了。
阿爾法狗的厲害之處在于結(jié)合了工程和科研兩方面的工作,通過大量計算資源和工程優(yōu)化將人工智能在某一個方向推向了極致。它同時借鑒了十年來大家在圍棋上以及在計算機視覺上的點滴進展,比如圍棋和強化學習方向上蒙特卡羅樹搜索、自對弈(俗稱“左右互搏”)、隨機走子盤面估值、用人工特征加淺層網(wǎng)絡(luò)進行快速走子、權(quán)衡廣度和深度搜索、權(quán)衡從頭探索和先驗知識,計算機視覺方向上像卷積神經(jīng)網(wǎng)絡(luò)(CNN)、殘差網(wǎng)絡(luò)(ResNet)、旋轉(zhuǎn)翻折樣本增強等等。這些都不是“深思”(DeepMind) 團隊率先想出來的,而是過去的經(jīng)驗一點點積累起來得到的。只是過去的點滴進步并沒有進入公眾的視野,而阿法爾狗達成了這最后的一步。
這個成功有幾個先決條件。
其一是模型和問題相互匹配。對阿爾法狗來說,模型和問題的匹配度非常重要。卷積神經(jīng)網(wǎng)絡(luò)和圍棋非常匹配,所以僅用490萬樣本就可以學到超過人類的能力。
對于人類來說,這種匹配性是通過各種直覺和實驗去找的,而機器則可以快速試錯,并很快地實現(xiàn)人的想法。若是模型和問題不匹配,那樣本再多,用處也不大,因為機器學習中“維數(shù)災難”的問題,要憑暴力填滿高維空間,實在不是目前任何數(shù)目的計算資源所能搞定的。
卷積神經(jīng)網(wǎng)絡(luò)能和圍棋如此投緣,還是因為圍棋本身的規(guī)則比較純粹,存在某種內(nèi)在美,而CNN很適合這種美,一旦適應了,計算機所具備的高速計算能力就可以全面發(fā)動,即便從零開始,完全不通過人類棋譜,僅靠左右互搏,也可以成功。路線正確之后,計算機所具備的穩(wěn)定性、精確性,和超過人類幾十億倍的計算速度疊加起來,這才是使得阿爾法元能在三天內(nèi)遠遠超過人類作為一個整體用三千年走過的路程的關(guān)鍵。
其二是要身處一個完全信息透明的理想世界,并且在做出決策之后,對這個世界的規(guī)則、變化和發(fā)展有絕對正確的認知。
圍棋每下一子,大家都非常清楚地知道局面會變成什么樣子,輸贏也非常清楚明白。阿爾法元雖然沒有使用人類棋譜,但它已經(jīng)從人類這里得到了圍棋世界的規(guī)則,對于過去七步之內(nèi)雙方下了哪些招法也完全知曉。這讓它對局面的推演變得非常容易,在先天上就比人類強太多。從零開始到超越人類,這確實非常厲害,但僅僅在圍棋世界這個規(guī)則分明的地方可以做到。
第三個條件就是要有大量的計算資源。發(fā)表于《自然》雜志的兩篇阿爾法元的文章,無一例外都強調(diào)了對戰(zhàn)時所用的資源數(shù),而有意無意地隱去了訓練時所用的資源數(shù)。后者從文章(及實驗)可以推算,大約在上萬臺甚至更多。這還僅僅只是復現(xiàn)結(jié)果需要的資源數(shù)目。而作為開拓者,能成功的路線百中無一,那綜合各種探索試錯的耗費,最后使用的資源更加是個天文數(shù)字了。
阿爾法狗能如此驚人地處理圍棋問題,是因為滿足這三個條件,然而人工智能在處理其它問題上,就沒有那么容易了。智能對話系統(tǒng)就是個很典型的例子。人類的語言既有基本語法規(guī)則,又有大量打破這個規(guī)則的例外;既有此時此境下的約定慣例,又有與時俱進的林林總總的變化。一個能與別人對話的智能系統(tǒng),既要從過去的含糊的交互中深刻了解現(xiàn)在的基本規(guī)則,又要時刻更新自己的知識體系,能夠抽象計劃出說話的大概方案,還要及時推測別人的隱藏狀態(tài)和世界的發(fā)展趨勢———這些都是現(xiàn)在人工智能的難點。
所以說,阿爾法狗在業(yè)內(nèi)的影響力并不像在大眾中那么大。因為在阿爾法狗上做出驚人結(jié)果的卷積神經(jīng)網(wǎng)絡(luò),早先在計算機視覺上已獲得巨大的成功,但讓它去擬合含有大量離散特征的廣告數(shù)據(jù),大家都知道效果不佳。同樣,“左右互搏”對其它游戲也有相當不錯的效果,但讓它去做優(yōu)化機器翻譯,未必有人工標定的數(shù)據(jù)好。
相比之下,國外對于阿爾法狗的看法要理性很多,在各大論壇上也有更多技術(shù)上的深入探討。等到大家有實力將阿爾法狗拆解得七零八落,對它的每個部分都有比較清晰的了解時,它的神秘感也就會和現(xiàn)在的這些疑惑和擔憂,一起煙消云散了。
人工智能還無法與大腦中的神經(jīng)系統(tǒng)相比擬
腦科學和人工智能本質(zhì)上都是尋找一個算法,有效構(gòu)建世界模型。大腦經(jīng)過長久的進化,固有自己的運行方式,而人工智能則可以在數(shù)學原理和大數(shù)據(jù)的基礎(chǔ)上獨立發(fā)展,就像飛鳥和飛機一樣,找到各自的規(guī)律。
現(xiàn)實的神經(jīng)元是由微分方程描述的連續(xù)信號處理器,有精細的時序結(jié)構(gòu),有電生理、離子通道和神經(jīng)遞質(zhì)受體,有能量供應和免疫系統(tǒng)。礙于測量的局限和生物系統(tǒng)的復雜性,我們現(xiàn)在對于大腦的單個神經(jīng)元還沒有完全了解清楚,更不用說大量神經(jīng)元組合在一起的系統(tǒng)了。
而現(xiàn)有的人工智能算法基本上是和腦科學相互獨立的。在各類問題上卓有成效的統(tǒng)計學習方法,比如說線性及非線性擬合方法、最近鄰、決策樹、隨機森林、支持向量機等,在大腦結(jié)構(gòu)中鮮有對應。即便在深度學習中所謂的神經(jīng)元,也不過是線性疊加及非線性操作的組合,是現(xiàn)實大腦中神經(jīng)元的極大簡化,簡化到腦科學家都不承認其為神經(jīng)元的程度。
不過,這兩門學科之間的確是可以相互啟發(fā)的。比如CNN的思路,就和大腦中感視野受限的神經(jīng)元相似。最近,神經(jīng)網(wǎng)絡(luò)之父、加拿大多倫多大學計算機科學系教授杰弗里·辛頓試著用大腦中的柱狀體思路,去改進現(xiàn)有神經(jīng)網(wǎng)絡(luò)的性能;也有學者用統(tǒng)計學習及神經(jīng)網(wǎng)絡(luò)的方法,對大腦中某些神經(jīng)元的行為進行建模。
我個人的意見是,不管是腦科學也好,人工智能也罷,本質(zhì)上還是如何找到一個算法有效地構(gòu)建世界模型的問題。大腦經(jīng)過長久的進化,固然有自然界的鬼斧神工,但也帶著大量增量進化而帶來的累贅,不必對它頂禮膜拜,奉為智能的唯一模板。人工智能完全可以在數(shù)學原理和大數(shù)據(jù)的基礎(chǔ)上獨立發(fā)展,就像飛鳥和飛機的區(qū)別一樣,找到自己的規(guī)律。
以前教科書上高估了人的能力,把人類特殊化了。其實在歷史長河中來看,人沒有那么特殊,人作為一種智能體,遵從自己的發(fā)展規(guī)律,在自然進化的基礎(chǔ)上,一點點認識自身及完成對自身的改造。而我們被進化賜予的那些優(yōu)點、缺點和弱點,也會縮寫成茫茫歷史中的某一頁,成為將來叱咤星海的地球文明的注腳。
我們剛隱約看到了人工智能的一絲月光
人并不需要恐懼害怕機器,因為機器也需要人?,F(xiàn)實世界無比復雜,其中暗含著無法準確預測的未來。在現(xiàn)實世界這個龐然大物面前,機器和人一樣渺小,也必然會攜手同行。
站在業(yè)內(nèi)人士的角度,人工智能還有很多問題沒有解決。比如,我們可以模糊地說CNN和圍棋很匹配,或者CNN和計算機視覺非常匹配,所以放在一起得到了出乎意料的效果。但究竟怎樣才算匹配?什么是“匹配”這個詞定量及精確的定義? 對于其它問題,什么是最好的模型,需要用什么樣的數(shù)據(jù)?神經(jīng)網(wǎng)絡(luò)究竟建模了什么,和我們的認知有什么區(qū)別? 這些本質(zhì)問題都還沒有答案,而且目前看來,不論是從工具上還是從觀念上看,離摸到答案的邊緣還遠得很。
二十世紀初,除了上空有兩朵烏云之外,物理學的大廈基本建成;與之相比,人工智能可以說是還處在鉛云密布、大雪彌漫的漫漫極夜,人們才隱約看到頭頂黑云縫中有那么一點點的月光。我們只是摸黑摸久了,不習慣看到光罷了——其實,太陽還遠未升起。
不過,首先基本肯定的一點是,未來世界必然是人與機器合作,并且逐步融合的世界。在短短十年中,我們都已經(jīng)離不開電腦和手機,以后如果能有更強記憶、更快推理、更準預測的人工智能產(chǎn)品出現(xiàn),可以幫助人類看得更遠、聽得更清,大家一定會爭相使用,并在這基礎(chǔ)之上制造出更好的物品。試想,如果有裝入大腦就可以提高一倍反應速度的芯片,那誰會拒絕?這樣的大潮,無人能夠反抗。
所以說,與其害怕,不如融入。人工智能你不做,我不做,總有人做,而做出來之后,就會有極大的競爭優(yōu)勢。現(xiàn)在基于機器學習的廣告系統(tǒng)已經(jīng)是這樣了———寫好了程序,躺著可以賺錢,而人要做的是如何改進它。這和傳統(tǒng)行業(yè)需要不停維護才能有穩(wěn)定利潤率相比,已是高了一個境界。以后人工智能做得更好的話,可以自動改進算法,那又是高了一個境界。而且這并非幾百年后才會出現(xiàn)的事情,而是在當下就會發(fā)生的現(xiàn)實。歷史的列車正在加速前進,以前或許還可以小跑跟隨,以后只能搭車借力。
最后,我不覺得人需要去恐懼害怕機器,因為機器也需要人?,F(xiàn)實世界暗含著無法準確預測的未來、牽一發(fā)而動全身的復雜聯(lián)系,龐大到不可想象的行動空間,以及千億億億種自洽自足的目標和意義。圍棋棋枰上的狀態(tài)數(shù)已遠遠超過了宇宙中的原子總數(shù),然而它不過是后院的一張茶幾,和煦春日下的幾粒石子,還有隨風飄散的一口香茗。
在現(xiàn)實世界這個龐然大物面前,機器和人必然會攜手同行。
聯(lián)系客服