什么才是真正的人工智能
騰訊數(shù)碼訊(肖恩)人工智能如今已經(jīng)成為科技產(chǎn)業(yè)所討論的普遍話題。這項技術(shù)已經(jīng)被應(yīng)用在了Gmail、自動駕駛汽車和照片整理上面,Mark Zuckerberg甚至還打算開發(fā)一位人工智能管家。但問題在于,人工智能這個概念有點太科幻了,它總是讓人想起操縱宇宙飛船的超級計算機(jī),而不是特別聰明的垃圾郵件過濾器。如此一來,人們已經(jīng)開始擔(dān)心人工智能會在何時造反并統(tǒng)治人類了。
科技公司在一定程度上也鼓勵著人們忽略人工智能到科幻人工智能之間的差距,但當(dāng)你試圖去理解計算機(jī)所做的事情時,就會很容易了解到它們的區(qū)別。本文要講的就是人工智能在消費應(yīng)用領(lǐng)域里最常見的應(yīng)用方向,當(dāng)前技術(shù)的限制,以及為什么說我們還沒必要擔(dān)心機(jī)器人的崛起。
這3個名詞如今擁有相當(dāng)高的出現(xiàn)頻率。它們可以被看作是3個不同的層次:神經(jīng)網(wǎng)絡(luò)位于底層,它是建立人工智能的計算機(jī)結(jié)構(gòu);機(jī)器學(xué)習(xí)是下一層,它是可以在神經(jīng)網(wǎng)絡(luò)上運行的一個程序,可訓(xùn)練計算機(jī)在數(shù)據(jù)當(dāng)中尋找特定的答案;深度學(xué)習(xí)處在頂層,這是一種在最近10年里才流行起來的特性類型的機(jī)器學(xué)習(xí),而它的流行主要得益于廉價處理性能和互聯(lián)網(wǎng)數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)的概念可以追溯到50年代人工智能的開端。簡單來說,它是一種建造計算機(jī)的方式,使其看上去像是一個卡通化的大腦,當(dāng)中由神經(jīng)一樣的節(jié)點連結(jié)成網(wǎng)絡(luò)。這些節(jié)點本身都很笨,只能回答最基本的問題??梢坏┙M合在一起,它們就可以解決復(fù)雜問題。更為重要的是,有了正確的算法之后,它們還能擁有學(xué)習(xí)能力。
紐約大學(xué)計算機(jī)科學(xué)教授Ernest Davis這樣介紹道,假如你想讓計算機(jī)學(xué)習(xí)如何過馬路,在傳統(tǒng)編程方式下,你需要給他一套非常具體的規(guī)則,告訴它如何左右看,等待車輛,使用斑馬線等等,然后讓它嘗試。而在面對機(jī)器學(xué)習(xí)時,你只需向它展示10000部安全橫穿馬路的視頻(以及10000部過馬路被車撞的視頻)就行了。
在這件事上面,如何讓計算機(jī)吸收視頻當(dāng)中的所有信息是一大難點。在過去的幾十年里,研究者嘗試過各種辦法來教計算機(jī),其中就包括增強(qiáng)學(xué)習(xí)和遺傳算法。前者需要你在計算機(jī)達(dá)成目標(biāo)時給予其獎勵,以逐漸優(yōu)化最佳解決方案;后者則會以類似物競天擇的方式對解決問題的不同方法進(jìn)行對比。
在如今的計算機(jī)領(lǐng)域,有一種教學(xué)方法變得特別實用,那就是深度學(xué)習(xí)。它是機(jī)器學(xué)習(xí)的一種類型,會利用神經(jīng)網(wǎng)絡(luò)中的諸多層面以不同的抽象化方法對數(shù)據(jù)進(jìn)行分析。當(dāng)深度學(xué)習(xí)系統(tǒng)面對著一幅畫時,神經(jīng)網(wǎng)絡(luò)的每一層會對其進(jìn)行不同程度的放大。底層可能會關(guān)注5x5像素網(wǎng)格,然后判斷是否有東西在當(dāng)中出現(xiàn)。如果有的話,它上面的那一層就會開始查看該網(wǎng)格是如何適配到更大的圖案中的。這個過程會逐漸累計起來,讓軟件利用逐步分解的方式去理解哪怕是最復(fù)雜的數(shù)據(jù)。
接下來,假設(shè)我們想要使用深度學(xué)習(xí)讓計算機(jī)了解到貓的樣子,我們首先需要利用神經(jīng)網(wǎng)絡(luò)的不同層面來識別貓身上的不同元素:爪子、腳掌和胡須等。然后,神經(jīng)網(wǎng)絡(luò)會觀察一大堆貓和其他動物的圖片,并被告訴哪些是貓哪些不是。隨著時間推移,它會記住哪些層面是重要的,并增強(qiáng)或忽略當(dāng)中的部分聯(lián)系。比如說,它可能會發(fā)現(xiàn)爪子和貓具備強(qiáng)烈的關(guān)聯(lián),但同樣會出現(xiàn)在其他動物身上,因此它就知道去尋找爪子和胡須同時出現(xiàn)的情況。
這是一個漫長而又重復(fù)的過程,系統(tǒng)會根據(jù)反饋緩慢提升自身能力。在這個過程當(dāng)中,人類可以去糾正計算機(jī),而如果網(wǎng)絡(luò)本身擁有足夠多的標(biāo)簽數(shù)據(jù),它也能自己進(jìn)行測試,來查看如何利用自身的所有層面才能產(chǎn)生最準(zhǔn)確的結(jié)果。認(rèn)出一只貓已經(jīng)如此困難,那些需要去識別世間萬物的系統(tǒng)的復(fù)雜程度也可想而知。這也正是為什么微軟會推出一款應(yīng)用來辨別不同品種的狗。在我們?nèi)祟惪磥?,杜賓和雪納瑞之間的區(qū)別可能非常明顯,但計算機(jī)在能夠分清兩者之前需要去定義大量的區(qū)別。
大體上講的確如此。
深度學(xué)習(xí)技術(shù)如今已經(jīng)被應(yīng)用在了各種日常任務(wù)上面。許多大公司都擁有自己的AI部門,F(xiàn)acebook和谷歌還通過軟件開源的方式公開了自己的研究成果。谷歌甚至推出了一個為其3個月的免費在線課程來介紹深度學(xué)習(xí)。學(xué)術(shù)研究者或許可以相對低調(diào)地進(jìn)行研究,但這些企業(yè)幾乎每周都會為這項技術(shù)推出創(chuàng)新的應(yīng)用方式,從微軟的情緒識別網(wǎng)頁應(yīng)用到谷歌的超現(xiàn)實Deep Dream圖像。這也正是我們在最近會頻繁看到深度學(xué)習(xí)相關(guān)信息的原因:大型消費類技術(shù)公司都在搗鼓這項技術(shù),并向我們分享自己奇奇怪怪的工作成果。
但是,雖然深度學(xué)習(xí)在語音和圖像識別方面具備出色能力,但它同樣存在相當(dāng)多的限制。這項技術(shù)不僅需要大量的數(shù)據(jù)和微調(diào),它們的智慧也是狹窄且脆弱的。就像認(rèn)知心理學(xué)家Gary Marcus所說的,這種熱門技術(shù)“缺乏呈現(xiàn)因果關(guān)系(比如疾病和癥狀)的方式,在學(xué)習(xí)抽象概念上面也存在困難。它無法執(zhí)行邏輯推理,在整合抽象知識(比如某個物體的名稱、用途和使用方式)上面也還有很長的路要走。”換句話說,深度學(xué)習(xí)并沒有任何常識。
舉個例子,在谷歌的一個研究項目當(dāng)中,他們首先向神經(jīng)網(wǎng)絡(luò)呈現(xiàn)啞鈴的樣圖,然后讓它獨立生成一張圖片。從結(jié)果來看,神經(jīng)網(wǎng)絡(luò)所生成的圖片還不錯:一根橫向握把連接著兩個灰色的圓環(huán)。但握把的中間總是會出現(xiàn)手臂肌肉的輪廓,這是因為訓(xùn)練時所用圖片當(dāng)中通常都有健身愛好者舉著啞鈴。深度學(xué)習(xí)或許可以了解到成千上萬圖片當(dāng)中啞鈴的基本視覺屬性,但它永遠(yuǎn)都不能作出認(rèn)知上的跨越,認(rèn)識到啞鈴并沒有長胳膊。這種問題并不單單存在于常識的范疇。由于檢驗數(shù)據(jù)的具體方式,深度學(xué)習(xí)網(wǎng)絡(luò)還能被隨機(jī)的像素圖案所欺騙。
不過這種限制可以被巧妙地隱藏。就拿Siri這樣的數(shù)字助手為例,它們經(jīng)??梢岳斫庥脩舻拿?,或是抖點小機(jī)靈。但就像計算機(jī)科學(xué)家Hector Levesque說指出的那樣,這些小花招恰好顯示出了人工智能和真正的智能之間巨大的差距。他提到了圖靈測試,稱在這項挑戰(zhàn)中取得最佳成績的機(jī)器都會利用小花招來讓人們認(rèn)為它正在和自己講話。它們會使用笑話、引用、情緒爆發(fā)、錯誤引導(dǎo)和所有的語言回避來混淆和干擾提問者。沒錯,在去年通過圖靈測試的計算機(jī)號稱自己是一位13歲的烏克蘭男孩,這也成為了它偶爾出現(xiàn)無知遣詞不當(dāng)?shù)慕杩凇?/p>
Levesque認(rèn)為,測試人工智能的一種更好方式是向計算機(jī)提出超現(xiàn)實但邏輯合理,同時需要廣泛因果知識才能回答的問題,比如“鱷魚可以參加越野障礙賽馬嗎?”,或者是“棒球運動員可以在帽子上粘上小翅膀嗎?”可想而知,計算機(jī)在嘗試回答這些問題之前需要擁有多么大的知識儲備。
這正是使用人工智能這個名詞的困難之一:它太難以去定義了。業(yè)界對此所達(dá)成的共識是,只要機(jī)器完成了一項之前只有人類才能做到的任務(wù)——比如玩國際象棋或認(rèn)臉——那它就不再被認(rèn)為是智能的標(biāo)志了。就像計算機(jī)科學(xué)家Larry Tesler所說,智能指的是那些機(jī)器還做不到的事情。而即便計算機(jī)能夠完成某些任務(wù),它們也無法取代人類智慧?!拔覀冋f神經(jīng)網(wǎng)絡(luò)就像人類大腦,但事實并非如此,”Facebook人工智能研究團(tuán)隊主管Yann LeCun說道,“這就好像飛機(jī)不是鳥一樣。它們不能扇動翅膀,也沒有羽毛或肌肉。”如果我們真得創(chuàng)造出了人工智能,它也“不會像人類或動物的智慧”。比如說,我們就很難去想象一個智慧體會沒有自我保護(hù)的意識。
許多AI領(lǐng)域的業(yè)內(nèi)人士都不認(rèn)為我們會創(chuàng)造出具備真正有感知能力的人工智能?!澳壳暗姆绞綗o法(讓人工智能)具備靈活性,或是處理多任務(wù)和執(zhí)行編程范圍之外任務(wù)的能力?!盡IT大腦、思維和機(jī)器中心Andrei Barbu教授這樣說道。他還提到,效率的AI搜索不過是創(chuàng)造出為解決特定問題微調(diào)過的系統(tǒng)。盡管研究者曾經(jīng)嘗試過無人監(jiān)管的機(jī)器學(xué)習(xí)——讓系統(tǒng)觀察未被分類和標(biāo)記的數(shù)據(jù)——但這目前還處于非常初級的階段。谷歌就有一個類似的神經(jīng)網(wǎng)絡(luò)項目,通過隨機(jī)觀察來自1000萬部視頻的縮略圖,它最終教會自己貓的樣子,但制作者并未公布任何除此之外的能力。就像LeCun在2年前出席Orange Institute的一場活動時所說的:“我們不知道如何進(jìn)行無監(jiān)督學(xué)習(xí),這是最大的障礙?!?/p>
作為一個研究項目,人工智能還經(jīng)常會受到夸張宣傳的影響。當(dāng)一種新方法被發(fā)現(xiàn)且研發(fā)進(jìn)度加快時,評論者(通常還包括計算機(jī)科學(xué)家)會大膽假設(shè)這種發(fā)展速度會很快讓機(jī)器人管家成為現(xiàn)實。紐約時報早在1958年就曾有過類似報道,當(dāng)中把一種非常早期的AI形式——可以分辨左和右的區(qū)別——描述為電子“胚胎”,未來某天將能夠“走路、交談、觀察、書寫、繁殖,并具備自我存在意識。”當(dāng)這類承諾未能兌現(xiàn)時,該領(lǐng)域便會陷入所謂的AI寒冬,也就是悲觀主義盛行和資金減少的時期。歷史上出現(xiàn)過十幾次小規(guī)模的AI寒冬,70年代末和90年代初還有兩次大寒冬。雖說每一個科研領(lǐng)域都會經(jīng)歷類似的時期,但值得注意的是,很少有一門學(xué)科會如此“可靠地”讓自己的信徒一再失望,以至后者為此想出了一個專有名詞。
人工智能只不過是噱頭和糊弄人的把戲嗎?
這樣說有些以偏概全了。如何看待人工智能取決于你對它有著怎樣的期待。我們的機(jī)器的確越來越智能,但這并不是我們可以輕松歸類的。就拿特斯拉的自動駕駛軟件為例,公司總裁Elon Musk將其描述為一種匯集數(shù)據(jù)的“快速學(xué)習(xí)網(wǎng)絡(luò)”,好讓旗下所有汽車在同時進(jìn)行學(xué)習(xí)。這個研究項目的最終目的不會是一般的人工智能,但它的整個計算機(jī)網(wǎng)絡(luò)的確會具備相當(dāng)高的智能性,這也就是被LeCun稱作是“隱形智能”的東西。
試想一下,未來你將擁有一臺不會出差錯的自動駕駛汽車,當(dāng)中還有一位先進(jìn)的數(shù)字助手。這或許是Levesque教授看不上眼的那種欺騙把戲,但卻能讓任何人將其當(dāng)作人類來對待。你們會在早上上班時互相說笑話,聊聊新聞,安排自己的行程表,或是在需要時改變目的地——一切都會在這部不僅了解道路規(guī)則、還能應(yīng)對其他車輛的自動駕駛汽車中進(jìn)行。到了那時,我們真的還會在乎這種人工智能到底是真是假嗎?
來源:The Verge
聯(lián)系客服