來(lái)源:機(jī)器算法工程師 作者:機(jī)器之心
當(dāng)部分人工智能正偏離其工程本源,AI 研究的方向變化,超出了我們的預(yù)料。
當(dāng)前的人工智能(AI)處在一個(gè)奇妙的時(shí)代,時(shí)常會(huì)出現(xiàn)讓人驚嘆的隱性知識(shí)(Polanyi 的復(fù)仇和人工智能的新型浪漫與隱性知識(shí),https://bit.ly/3qYrAOY),但可以確信在未來(lái)相當(dāng)長(zhǎng)的一段時(shí)間,計(jì)算機(jī)無(wú)法完成這個(gè)任務(wù)。最近出現(xiàn)的讓人感興趣的研究是基于 Transformer 架構(gòu)的大型學(xué)習(xí)系統(tǒng),基于大網(wǎng)絡(luò)規(guī)模的多模態(tài)語(yǔ)料庫(kù)和數(shù)十億參數(shù)的訓(xùn)練。典型例子如大型語(yǔ)言模型、響應(yīng)任意形式文本 prompt 的 GPT3 和 PALM、將文本轉(zhuǎn)換成圖像的語(yǔ)言 / 圖像模型 DALL-E 和 Imagen(甚至具有通用行為的模型如 GATO)。
大型學(xué)習(xí)模型的出現(xiàn)從根本上改變了人工智能研究的性質(zhì)。最近研究人員在使用 DALL-E 時(shí),認(rèn)為它似乎已經(jīng)發(fā)展出自己的特有語(yǔ)言,如果人類能掌握它,或許可以更好地與 DALL-E 交互。也有研究人員發(fā)現(xiàn),可以通過在 prompt 中添加某些神奇的咒語(yǔ)(比如「讓我們一步步地思考」)來(lái)改善 GPT3 對(duì)推理問題的表現(xiàn)?,F(xiàn)在 GPT3 和 DALL-E 這樣的大型學(xué)習(xí)模型就像是「外星物種」一樣,我們要嘗試解碼它們的行為。
對(duì)于人工智能來(lái)說(shuō),這無(wú)疑是一個(gè)奇怪的轉(zhuǎn)折點(diǎn)。自出現(xiàn)以來(lái),人工智能一直是介于工程學(xué)(特定功能的系統(tǒng))和科學(xué)(發(fā)現(xiàn)自然現(xiàn)象規(guī)律)之間的「無(wú)人區(qū)」地帶。人工智能的科學(xué)部分源于其最初的主張,即對(duì)人類智能本質(zhì)的洞察;而工程部分則源于對(duì)智能功能(讓計(jì)算機(jī)展示智能行為)的關(guān)注,而不是對(duì)人類智能的洞察。
而目前的情況正在迅速變化,特別是人工智能已成為大型學(xué)習(xí)模型的同義詞。當(dāng)前的現(xiàn)狀是,人們對(duì)于訓(xùn)練過的模型是如何擁有特定功能一無(wú)所知,甚至它們可能具有的其它功能一無(wú)所知(如 PALM 所謂的「解釋笑話」的能力)。即使是它們的創(chuàng)造者,通常也對(duì)這些系統(tǒng)能做的事情始料不及。探索這些系統(tǒng)以了解其「功能」范圍,已成為近來(lái)人工智能研究的趨勢(shì)。
越來(lái)越清楚的是,部分人工智能正偏離其工程本源。如今很難將大型學(xué)習(xí)系統(tǒng)看作傳統(tǒng)意義上有特定目標(biāo)的工程設(shè)計(jì)。畢竟人們不能說(shuō)自己的孩子是「設(shè)計(jì)」出來(lái)的。工程學(xué)領(lǐng)域通常不會(huì)為設(shè)計(jì)的系統(tǒng)出現(xiàn)意料之外的新特性而慶祝(就如同土木工程師不會(huì)因?yàn)樗麄冊(cè)O(shè)計(jì)的抵御五級(jí)颶風(fēng)的橋梁被發(fā)現(xiàn)還能懸浮而激動(dòng)興奮的慶祝)。
越來(lái)越多地證據(jù)表明,這些經(jīng)過訓(xùn)練(但未經(jīng)設(shè)計(jì))的大型系統(tǒng)的研究注定要成為自然科學(xué):觀察系統(tǒng)的功能;做消融研究;對(duì)最佳實(shí)踐進(jìn)行定性的分析。
考慮到目前研究表象而非內(nèi)里的事實(shí),這類似于生物學(xué)中想在沒有實(shí)際證據(jù)的情況下達(dá)到「弄清楚」的宏偉目標(biāo)。機(jī)器學(xué)習(xí)屬于研究工作,更多地關(guān)注系統(tǒng)為什么會(huì)做它正在做的事情(可以想象成對(duì)大型學(xué)習(xí)系統(tǒng)做「核磁共振成像」研究),而不是證明設(shè)計(jì)系統(tǒng)就是為了這樣做。這些研究收獲的知識(shí)能提升微調(diào)系統(tǒng)的能力(就像醫(yī)學(xué)一樣)。當(dāng)然表象的研究允許比內(nèi)里設(shè)置進(jìn)行更具針對(duì)性的干預(yù)。
人工智能變成自然科學(xué),也會(huì)對(duì)整個(gè)計(jì)算機(jī)科學(xué)產(chǎn)生影響,考慮到人工智能會(huì)對(duì)幾乎所有計(jì)算領(lǐng)域都產(chǎn)生巨大影響。計(jì)算機(jī)科學(xué)的「科學(xué)」二字也受到過質(zhì)疑和諷刺。但現(xiàn)在情況已有改變,因?yàn)槿斯ぶ悄芤呀?jīng)成為研究大型人工學(xué)習(xí)系統(tǒng)的自然科學(xué)。當(dāng)然,這一轉(zhuǎn)變可能存在很大的阻力和意見,因?yàn)橛?jì)算機(jī)科學(xué)長(zhǎng)期以來(lái)一直是「建構(gòu)修正的方法 (correct by construction)」圣杯,從最開始計(jì)算機(jī)科學(xué)就相當(dāng)于生活在充滿激勵(lì)的系統(tǒng)中,它像訓(xùn)練有素的狗不犯錯(cuò),就像人類一樣正確。
早在 2003 年,圖靈獎(jiǎng)得主 Leslie Lamport 對(duì)計(jì)算未來(lái)屬于生物學(xué)而非邏輯的可能性敲響警鐘,稱計(jì)算機(jī)科學(xué)將讓我們生活在順勢(shì)療法和信仰療愈的世界。當(dāng)時(shí)他的焦慮主要是針對(duì)人類通過編程完成的復(fù)雜軟件系統(tǒng),而不是現(xiàn)在更神秘的大型學(xué)習(xí)模型。
當(dāng)從一個(gè)主要關(guān)注有意設(shè)計(jì)和「通過構(gòu)造保證正確」的領(lǐng)域,轉(zhuǎn)向試圖探索或理解現(xiàn)有的(未經(jīng)設(shè)計(jì)的)人工產(chǎn)物,它將帶來(lái)的方法學(xué)轉(zhuǎn)變值得思考。與生物學(xué)研究野外生物不同,人工智能研究人類創(chuàng)造的缺乏「設(shè)計(jì)感」的人工產(chǎn)物,對(duì)于創(chuàng)造和部署那些不被理解的人工產(chǎn)物,倫理問題是肯定會(huì)出現(xiàn)的。大型學(xué)習(xí)模型不太可能保證支持可證明的能力,無(wú)論是關(guān)于準(zhǔn)確性、透明度還是公平性,然而這些是部署和實(shí)踐這些系統(tǒng)的關(guān)鍵問題。雖然人類也無(wú)法提供關(guān)于其自身決定和行為正確性的證據(jù),但確實(shí)有法律制度來(lái)讓人類遵守懲罰,如罰款、譴責(zé)甚至監(jiān)禁。而對(duì)于大型學(xué)習(xí)系統(tǒng),有什么是等價(jià)的制度?
計(jì)算研究的美學(xué)也會(huì)發(fā)生改變。目前的研究者可以用論文中包含定理與定義的比例來(lái)評(píng)價(jià)論文。但隨著計(jì)算機(jī)科學(xué)的目標(biāo),越來(lái)越像生物學(xué)等自然科學(xué)的目標(biāo),就需要開發(fā)新的計(jì)算美學(xué)方法論(因?yàn)榱愣ɡ砼c零定義比例不會(huì)有很大的區(qū)別)。有跡象表明,計(jì)算復(fù)雜性分析在人工智能研究中已處于次要地位。
聯(lián)系客服