2017年10月,《自然》(Nature)雜志刊出了谷歌Deep Mind團(tuán)隊的新成果。他們推出的新一代圍棋人工智能程序阿爾法元(Alpha Go Zero)以100比0的絕對優(yōu)勢戰(zhàn)勝上一代人工智能圍棋程序阿爾法狗(Alpha Go)。關(guān)鍵是,阿爾法元是在沒有人類經(jīng)驗指導(dǎo)的情況下,僅僅憑借圍棋基本規(guī)則和自我學(xué)習(xí)而獲得了高超的圍棋技能。這一勝績再一次引起公眾的震驚和擔(dān)憂。人們擔(dān)憂的是,計算機(jī)可以不需要人類經(jīng)驗作基礎(chǔ),卻遠(yuǎn)遠(yuǎn)高于人類學(xué)習(xí)的水平。這似乎在說,人類的智力已經(jīng)遠(yuǎn)遠(yuǎn)不敵計算機(jī)了。在計算機(jī)的智力飛速發(fā)展的情況下,人類的生存價值和活動空間不可避免地會被這種“更聰明”的人工智能所侵占。目前我們遭遇的事實真的是這樣的嗎?“阿爾法們”真的來搶人類的奶酪了嗎?
如何理解“阿爾法們”的勝利
從阿爾法狗到阿爾法元,計算機(jī)的圍棋技藝進(jìn)步神速。但是,這兩代阿爾法的勝利究竟意味著什么呢?
在新聞報道中,我們讀到這樣的敘述: Alpha Go Zero僅用一張神經(jīng)網(wǎng)絡(luò)、一臺機(jī)器和4個TPU,經(jīng)過自我對弈式的訓(xùn)練,在3天的時間里實現(xiàn)了近500萬局自我對弈,便能夠超越人類并打敗之前的Alpha Go版本。谷歌Deep Mind團(tuán)隊總結(jié)道:Alpha Go Zero相比與Alpha Go 的更強(qiáng)大之處在于:“它再也不會受到人類經(jīng)驗的限制,而是可以不斷向世界上最強(qiáng)的圍棋手——也就是它自己學(xué)習(xí)到非既定的能力?!?/p>
當(dāng)Alpha Go戰(zhàn)勝人類棋手時,人們還可以這樣安慰自己:因為Alpha Go是學(xué)習(xí)了大量人類棋手的實際對弈棋局而獲得了下棋的技能,它戰(zhàn)勝了某一個棋手其實意味著人類的整體知識和智能的積累戰(zhàn)勝了一個個別的人。所以,對棋手個人而言,敗給Alpha Go可以說雖敗猶榮。但是這一次,Alpha Go Zero完全不從人類的經(jīng)驗中學(xué)習(xí),而是僅僅依靠最初的幾條圍棋基本規(guī)則,通過自我對弈的方式自我訓(xùn)練,三天自我對弈500萬盤(這個數(shù)字與上一代Alpha Go學(xué)習(xí)了海量棋局,并且自我對弈3000萬盤,歷經(jīng)數(shù)月訓(xùn)練相比,可謂進(jìn)步神速)就取得斐然的成就。這很容易讓人做出這樣的解釋,上一代的Alpha Go不敵新一代的Alpha Go Zero,是因為從人類智能中學(xué)習(xí)的Alpha Go敗給了師從純粹人工智能的Alpha Go Zero,人類的知識或智能限制了Alpha Go的學(xué)習(xí),而在拋棄了人類的經(jīng)驗制約以后,計算機(jī)的智能可能遠(yuǎn)遠(yuǎn)把人類拋在后面。也就是說,這是人類智能對人工智能的失敗。
面對這樣的擔(dān)憂,人類比以往更加需要確證自己的存在價值。這種確證開始于對“智能”的理解。于是,我們不禁要追問:人工智能的“智能”的真正含義是什么呢?
首先,人工智能在根本上是“計算機(jī)”。因此,它們在計算任務(wù)上超過人類并不應(yīng)是一件需要擔(dān)憂的事件,而應(yīng)是值得高興的事件。正如人類制造了汽車——可以被稱為“移動機(jī)”。當(dāng)汽車的移動速度遠(yuǎn)遠(yuǎn)超過人的極限時,并沒有人為此擔(dān)憂人類移動能力的價值受到了威脅。計算機(jī)最初被發(fā)明出來,是為了讓它幫人處理“按照既定規(guī)則進(jìn)行計算”的任務(wù)。計算機(jī)在計算任務(wù)上超越人類,正像汽車的移動能力超越人類一樣,它們所體現(xiàn)出來的“優(yōu)勢”不正是由人類智能所“創(chuàng)造”的嗎?
其次,對弈是人類發(fā)明的一種智力游戲。這類游戲的共同特征是有明確的規(guī)則和清晰的邊界,并且對游戲的最后成果有精確的衡量指標(biāo)。對弈雙方必須在規(guī)則和邊界的限制下,通過合理性計算而實現(xiàn)“贏棋”的目標(biāo)。這樣的活動是“結(jié)構(gòu)良好任務(wù)”。針對結(jié)構(gòu)良好任務(wù),解決辦法是按照既有的規(guī)則“計算”盡可能多的中間狀態(tài),并對每一種中間狀態(tài)的效價進(jìn)行評估,并選擇最佳的路徑。對弈者能夠評估的中間狀態(tài)越多,贏棋的可能性就越大。但是這種評估顯然受到計算能力的限制。我們把計算過程中的中間狀態(tài)的總和稱為“問題空間”,那么初始規(guī)則越少,問題空間就越大。在人類的棋類游戲中,圍棋是初始規(guī)則最簡單、棋盤格子最多的一種,所以,圍棋對弈計算的問題空間非常巨大。在Alpha Go誕生之前,有很多人相信計算機(jī)的計算能力無法處理圍棋的問題空間。谷歌的研究團(tuán)隊在計算方式上的革新讓計算機(jī)的計算能力有了長足的進(jìn)步,所以才有了戰(zhàn)勝人類棋手的成績。但是我們也應(yīng)該看到Alpha Go和新一代的Alpha Go Zero所處理的都是“結(jié)構(gòu)良好問題”。解決結(jié)構(gòu)良好問題的關(guān)鍵是計算能力,所以,兩代Alpha Go的成就其實是基于計算能力的提升。那么,計算能力能不能等同于人類的“智能”呢?
通過“反轉(zhuǎn)圖靈測試”理解人的智慧價值
要比較人工智能和人類的“智能”的異同或高下,我們需要對人類的“智能”做出界定。但是人的智能究竟意味著什么,這個問題至今尚未有定論。在這里,我們可以嘗試著通過“反轉(zhuǎn)圖靈測試”的思維實驗來厘清人類“心智”或“智能”的一些重要特征。
“圖靈測試”是圖靈在提出人工智能的基礎(chǔ)模型時為鑒定人工智能的“智能”水平而設(shè)計的一種評價標(biāo)準(zhǔn)。如果一個計算機(jī)程序可以在限定的范圍內(nèi)讓測試者不能分辨是計算機(jī)還是人類,那么我們就可以說這個計算機(jī)程序具有了和人類一樣的“智能”?!皥D靈測試”作為一個標(biāo)準(zhǔn),一直在指引著人工智能的設(shè)計理念,即努力讓計算機(jī)的表現(xiàn)更像人。可以看出,“圖靈測試”實際上基于一個潛在的預(yù)設(shè),即人類的智能應(yīng)該或可能是什么樣的,并且以此指引著計算機(jī)朝著這個假設(shè)發(fā)展。但是,人的智能實際上具有什么特征,其實我們至今是不清楚的。于是,我們不妨把圖靈測試顛倒過來,讓人去模仿計算機(jī),也就是以我們能夠清晰認(rèn)識的東西作為參照,反過來觀照人類智能的意義。假如我們讓一個人去模擬一臺計算機(jī),那么測試者將如何識別呢?這就是“反轉(zhuǎn)圖靈測試”。為了辨別對方是真實的人或是計算機(jī),測試者只需要讓他(或它)在有限時間內(nèi)完成大量的計算任務(wù)。這是計算機(jī)可以輕易完成而人絕對難以做到的。通過這個思維實驗,我們發(fā)現(xiàn),人類和計算機(jī)的差異正是在于計算能力的差異。這樣看來,我們不難理解,弈棋任務(wù)作為結(jié)構(gòu)良好問題,其核心在于對問題空間的計算,因此,在這類任務(wù)中人不敵計算機(jī)是理所當(dāng)然的。關(guān)鍵是,人類以有限的計算能力卻能夠創(chuàng)造出如此豐富的知識和技能,這說明,計算能力并不是做出這些成績的唯一基礎(chǔ);此外,除了不那么強(qiáng)大的計算能力——和計算機(jī)相比,人類一定還擁有其他更強(qiáng)大的能力。
從知識論的角度看,人類的知識建構(gòu)有兩條途徑,一種是自上而下的演繹,另一種是自下而上的歸納。演繹是依據(jù)既定的論證規(guī)則而實現(xiàn)知識的精致化加工;歸納則是從經(jīng)驗中形成一般化的認(rèn)識。關(guān)于演繹,人類已經(jīng)形成了相對完備的規(guī)則,即邏輯規(guī)則。正是在已有的形式化邏輯規(guī)則的指導(dǎo)下,計算機(jī)才可能完成各種“思維”活動。然而,關(guān)于歸納則始終沒有統(tǒng)一有效的“歸納邏輯”。計算機(jī)的“歸納學(xué)習(xí)”也是通過大量嘗試性練習(xí)而形成的一種概率評估,比如貝葉斯計算。我們知道,人和動物的天然傾向顯然不是通過概率計算來進(jìn)行歸納推理的,也就是說,歸納不是一個計算過程。于是,我們可以將演繹和歸納分別對應(yīng)于“可計算”的任務(wù)和“不可計算”的任務(wù)。
顯然,計算機(jī)被制造出來就是讓它幫助人類應(yīng)對“可計算”任務(wù)。計算機(jī)科學(xué)家讓今天的計算機(jī)能夠出色地完成這一類任務(wù),而這正是作為制造者的人類的“智能”的成就。計算機(jī)在“可計算”任務(wù)中的表現(xiàn)超越了人類,但是人類依然在“不可計算”任務(wù)中保持自己的優(yōu)勢。哪些事情屬于“不可計算”任務(wù)呢?諸如:真正的創(chuàng)造性問題,結(jié)論超出了前提閾界的問題等。新聞報道說Alpha Go Zero僅僅依靠幾條圍棋的初始規(guī)則就“實現(xiàn)了從0到1的轉(zhuǎn)變”等。實際上,Alpha Go Zero所做的事情和歐幾里德從幾條公理出發(fā),演繹出數(shù)百條幾何定律一樣,是通過演繹途徑對初始規(guī)則的分析,從而實現(xiàn)知識的精致化演變。這樣的推衍固然顯示了演繹推理的創(chuàng)造力,而真正創(chuàng)造性地“從0到1”的轉(zhuǎn)變卻是“發(fā)明”圍棋的人提出圍棋初始規(guī)則的那一步。
假如,我們只是給計算機(jī)一把棋子,沒有任何規(guī)則,也沒有任何要求,那么,它會計算出什么樣的結(jié)果呢?它會不會突然停下正在執(zhí)行的任務(wù),“看著”這些棋子發(fā)呆,并開始在“地上”畫出一些格子,并想象出一些規(guī)則,然后開始“玩”一種叫做“棋”的游戲呢?如果真的有一天計算機(jī)能夠自己“生成”一系列規(guī)則,發(fā)明了圍棋、象棋之類的游戲,那才是人類應(yīng)該擔(dān)憂的情況。
(作者單位:西南民族大學(xué)社會學(xué)與心理學(xué)學(xué)院)
原標(biāo)題:阿爾法元動了誰的奶酪
聯(lián)系客服