選自Gigaom
機(jī)器之心編譯
吳恩達(dá),百度首席科學(xué)家、百度大腦項(xiàng)目負(fù)責(zé)人,一位與 Geoffrey Hinton、Yoshua Bengio、Yann LeCun 齊名的人工智能專家。近日,吳恩達(dá)接受了技術(shù)研究和分析公司 Gigaom 的專訪,談及了未來五年人工智能重要研究領(lǐng)域、中國(guó)人工智能研究以及人工智能與經(jīng)濟(jì)、社會(huì)關(guān)系等問題。
問:談?wù)勀阍诎俣鹊娜粘9ぷ靼伞D銈兊娜斯ぶ悄軋F(tuán)隊(duì)在做什么?
答:我們從事基礎(chǔ)人工智能技術(shù)的開發(fā)工作。所有技術(shù),從語音識(shí)別到計(jì)算機(jī)視覺、自然語言處理、數(shù)據(jù)倉(cāng)庫、用戶理解,我們用人工智能技術(shù)支持很多百度國(guó)際業(yè)務(wù)并孵化新業(yè)務(wù)方向。比如,在百度,所有主要業(yè)務(wù)線都已經(jīng)轉(zhuǎn)型使用了人工智能。從網(wǎng)頁搜索、廣告到機(jī)器翻譯、給用戶推薦飯館等。所以,人工智能在百度很普遍了。除此之外,我們也看到了人工智能所帶來的許多新機(jī)遇,比如改善基于對(duì)話的(基于聊天窗口)的醫(yī)療助理,或使用面部識(shí)別打造自動(dòng)開門的十字轉(zhuǎn)門。我們所有團(tuán)隊(duì)也在追求那些新的垂直領(lǐng)域里的機(jī)遇。
問:在基礎(chǔ)研究領(lǐng)域,你有沒有什么想做的事情?比如,那些或許有用但我們卻搞不清楚其所以然的事情?
答:我們?cè)诨A(chǔ)研究領(lǐng)域做了很多工作,有趣的是,成功的基礎(chǔ)研究一開始會(huì)以基礎(chǔ)研究的面貌出現(xiàn),但是,一旦你看到了它的應(yīng)用價(jià)值,過一段時(shí)間后就會(huì)變得不那么基礎(chǔ)了。我們做了很多這樣的研究??梢哉f,在百度,早期的面部識(shí)別是以基礎(chǔ)研究的面貌起步的,但是,這個(gè)服務(wù)如今融入產(chǎn)品中了,也服務(wù)著產(chǎn)品的百萬用戶。神經(jīng)機(jī)器翻譯最初也是一項(xiàng)基礎(chǔ)研究。實(shí)際上,這個(gè)故事有著不廣為人知的另一面:神經(jīng)機(jī)器翻譯是在中國(guó)開創(chuàng)、研發(fā)和使用的。美國(guó)公司的研發(fā)和使用是在百度之后。中國(guó)團(tuán)隊(duì)在某個(gè)研究領(lǐng)域領(lǐng)先其他國(guó)家,這只是例子之一。我們?cè)谟?jì)算機(jī)視覺方面的基礎(chǔ)研究,比如,面部識(shí)別,也一直處于領(lǐng)先位置。今天,我們正在會(huì)學(xué)習(xí)的機(jī)器人和機(jī)器學(xué)習(xí)領(lǐng)域進(jìn)行廣泛的基礎(chǔ)研究。我們的研究覆蓋了從非常基礎(chǔ)的研究到非常應(yīng)用的研究的所有階段。
問:百度團(tuán)隊(duì)是什么樣子?通常你的團(tuán)隊(duì)的都是小規(guī)模的嗎?團(tuán)隊(duì)以開發(fā)人員為重?你找到了一個(gè)成功的分配有限資源的辦法了嗎?
答:這個(gè)問題比較復(fù)雜。很多項(xiàng)目開始時(shí)是小規(guī)模的。比如,一年前,自動(dòng)駕駛團(tuán)隊(duì)有 22 個(gè)人。但是在團(tuán)隊(duì)展現(xiàn)了自己的實(shí)力、初步顯示出前景并制定一個(gè)深思熟慮過的商業(yè)計(jì)劃后,公司就有理由為其團(tuán)隊(duì)建設(shè)注入龐大資源,如今團(tuán)隊(duì)可能有幾百個(gè)成員。團(tuán)隊(duì)從最初的一個(gè)基礎(chǔ)研究項(xiàng)目變成一個(gè)嶄新的業(yè)務(wù)分支。所以很多項(xiàng)目都是從相對(duì)小的團(tuán)隊(duì)開始的,不過,在其邁入正軌而且價(jià)值也清晰了后,我們就能將其嵌入一個(gè)擁有很多成員(幾十人甚至幾百人)的團(tuán)隊(duì)中。
問:如今人工智能領(lǐng)域,你認(rèn)為五年內(nèi)可以解決的難題之一是什么? 也就是今天很難解決但是五年后就會(huì)普遍加以實(shí)現(xiàn)的事情?
答:從研究角度出發(fā),我認(rèn)為遷移學(xué)習(xí)和多任務(wù)學(xué)習(xí)是我想試著解決的問題之一。今天,機(jī)器學(xué)習(xí)全部經(jīng)濟(jì)價(jià)值都是應(yīng)用學(xué)習(xí),從針對(duì)特定任務(wù)的標(biāo)記數(shù)據(jù)中學(xué)習(xí),比如通過大量標(biāo)記數(shù)據(jù)人臉數(shù)據(jù)庫學(xué)習(xí)識(shí)別面部。對(duì)于很多任務(wù)來說,特定垂直領(lǐng)域的數(shù)據(jù)并不足以支持系統(tǒng)建構(gòu)。因此,遷移學(xué)習(xí)會(huì)是一個(gè)很有活力的領(lǐng)域,機(jī)器機(jī)器可以學(xué)會(huì)一個(gè)不同的任務(wù)。比如,學(xué)會(huì)大體上識(shí)別物體。學(xué)會(huì)大體上識(shí)別物體后,這個(gè)知識(shí)中有多少會(huì)對(duì)識(shí)別面部的特定目的有用。
從研究角度看,我認(rèn)為這個(gè)非常非常有前途,現(xiàn)在也有廣泛使用著的用于這類遷移學(xué)習(xí)的技術(shù),不過有關(guān)如何實(shí)現(xiàn)的理論和最佳實(shí)踐仍然處于相當(dāng)早期階段。我們之所以對(duì)遷移學(xué)習(xí)感到興奮,其原因在于現(xiàn)代深度學(xué)習(xí)的巨大價(jià)值是針對(duì)我們擁有海量數(shù)據(jù)的問題。但是,也有很多問題領(lǐng)域,我們沒有足夠數(shù)據(jù)。比如語音識(shí)別。在一些語言中,比如普通話,我們有很多數(shù)據(jù),但是那些只有少數(shù)人說的語言,我們的數(shù)據(jù)就不夠龐大。所以,為了針對(duì)數(shù)據(jù)量不那么多的中國(guó)少數(shù)人所說的方言進(jìn)行語音識(shí)別,能將從學(xué)習(xí)普通話中得到的東西進(jìn)行遷移嗎?我們的技術(shù)確實(shí)可以做到這一點(diǎn),我們也正在做,但是,這一領(lǐng)域的進(jìn)步能讓人工智能有能力解決廣泛得多的問題。
問:人工智能可以告訴我們?nèi)魏斡嘘P(guān)人類智能的有用信息嗎?或者,反過來,從人工智能那里獲取的線索能幫助 AI 更好地工作嗎?亦或是這種情形,人工智能和人類智能只是都用了「智能」這個(gè)詞而已,兩者沒有任何相似之處?
答:從神經(jīng)科學(xué)中獲取的知識(shí)對(duì)當(dāng)前人工智能的發(fā)展只有一丁點(diǎn)用?,F(xiàn)實(shí)一點(diǎn)說,盡管神經(jīng)科學(xué)研究了幾個(gè)世紀(jì),今天我們對(duì)人類大腦的工作方式幾乎還是完全不了解,對(duì)大腦工作原理那點(diǎn)極為少量的知識(shí)僅能為人工智能提供一些并不可靠的靈感,不過,實(shí)際一點(diǎn)說,今天人工智能取得的成績(jī)更多的是受計(jì)算機(jī)科學(xué)原理驅(qū)動(dòng)的,而不是神經(jīng)科學(xué)原理。我已經(jīng)說過,在自動(dòng)化人類所能的事情上,人工智能已經(jīng)變得非常擅長(zhǎng)了。比如,人非常善于語音識(shí)別,但是人工智能在語音識(shí)別上表現(xiàn)不好。人非常善于人臉識(shí)別,人工智能正在人臉識(shí)別上進(jìn)展迅速。
事實(shí)證明,當(dāng)我們?cè)囍鴮⑷祟惪梢宰龅囊患虑樽詣?dòng)化而不是解決人類都無法完成的任務(wù)時(shí),用于推進(jìn)該人工智能技術(shù)的工具也會(huì)更好地發(fā)揮作用。原因很多,但是原因之一在于,當(dāng)我們?cè)囍x擇一個(gè)人類也可以勝任的任務(wù),讓人工智能參與進(jìn)來時(shí),我們就能深入找出人類怎么可以迅速完成這一任務(wù)原因。因此,在展望很多人工智能垂直領(lǐng)域時(shí),我們當(dāng)然可以做一些甚至人類自己都不很擅長(zhǎng)的事情。我認(rèn)為,現(xiàn)在亞馬遜向我推薦的書目甚至比我妻子推薦的還要好。我妻子當(dāng)然非常了解我,但是亞馬遜能做到這個(gè)程度是因?yàn)樗e累了大量有關(guān)我的瀏覽和閱讀書目數(shù)據(jù),這些數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于被妻子看到的閱讀書目。我大致認(rèn)為,有了幾個(gè)類似這樣的例外,當(dāng)人工智能試著自動(dòng)化至少人類也能做到的事情時(shí),就會(huì)進(jìn)展神速。
問:您總是在預(yù)測(cè)人工智能將實(shí)現(xiàn)這個(gè)問題持保守意見,我認(rèn)為您這樣做的部分原因是因?yàn)閾?dān)心公眾狂熱的期望會(huì)對(duì)人工智能研究科學(xué)造成災(zāi)難性后果,特別是關(guān)乎資金方面,我這樣說對(duì)嗎?
答:我很傾向?qū)嵱眯?,并努力成為一名?shí)用主義者。但是在這一點(diǎn)上我想提出一個(gè)略有不同的觀點(diǎn)。如果我開始組建一個(gè)團(tuán)隊(duì)來治療所有人的疾病,這是非常值得慶祝的事,因?yàn)檫@聽起來簡(jiǎn)直就像是一個(gè)偉大的使命。但是坦率地說,在硅谷有時(shí)候目標(biāo)太高就會(huì)不受歡迎并一定會(huì)有反對(duì)的觀點(diǎn)出現(xiàn)。我們比較喜歡討論怎么錨定月亮那樣的話題,因?yàn)榧词刮覀兪×诉€能錨定星星。但我認(rèn)為實(shí)際上目標(biāo)太高會(huì)存在一個(gè)成本,所以如果你的目標(biāo)是解決瘧疾而不是組建團(tuán)隊(duì)解決世界所有的疾病,那么它可能會(huì)更有成效,對(duì)世界產(chǎn)生更大更好的影響。所以我認(rèn)為,將人工智能應(yīng)用于世界會(huì)產(chǎn)生更有意義的影響。我認(rèn)為我們不僅可以通過自動(dòng)駕駛汽車、人工智能物流改變交通運(yùn)輸,還可以通過人工智能完全地改變醫(yī)療。我們可以通過人工智能在世界上做出重大的改進(jìn)。所以我所做的很多努力都是在為這些具體的、可行的事情做準(zhǔn)備。因?yàn)槲艺J(rèn)為這對(duì)世界實(shí)際上更有成效,我們不會(huì)花時(shí)間去研究也幾百年都不會(huì)到來的科幻小說場(chǎng)景。我認(rèn)為這種為科幻小說花時(shí)間的事在硅谷是不受歡迎的。
話雖如此,但作為一個(gè)社會(huì),我們需要從事做各種各樣的事情。所以我認(rèn)為有一些人努力解決瘧疾,并希望通過蓋茨基金會(huì)(Gates Foundations)和世界衛(wèi)生組織(World Health Organization)幫助工作,而另外一些人努力解決人類所有疾病會(huì)讓社會(huì)變得更好。我認(rèn)為社會(huì)以不同的方式分配資源是一件好事。但我也認(rèn)為這對(duì)我們領(lǐng)域的進(jìn)步也是十分有幫助的。當(dāng)我們思考「什么是我們有信心可以實(shí)現(xiàn)的任務(wù)?」對(duì)抗「什么是我們應(yīng)該投資的進(jìn)一步夢(mèng)想?」,我們團(tuán)隊(duì)有一部分人在做這個(gè),不過那只是我們整體努力的一個(gè)小方向。
問:你相信人工通用智能(AGI)的可能性嗎?如果是的話,如果是的話,那你認(rèn)為它是沿著我們已知技術(shù)的進(jìn)化路徑實(shí)現(xiàn)么,背后的摩爾定律,或者 AGI 是不是需要一個(gè)整體的根本性突破,而這個(gè)突破甚至是不能預(yù)料到的東西?
答:我認(rèn)為實(shí)現(xiàn) AGI 肯定需要多個(gè)突破,但這很可能會(huì)發(fā)生。因?yàn)橛熊浖惴ǖ耐黄坪陀布赡艿耐黄啤H欢?,我發(fā)現(xiàn)很難預(yù)測(cè)這一突破是在十年后還是千年后出現(xiàn)。
問:您認(rèn)為人類的創(chuàng)造力,如編寫劇本或小說的能力是否需要另外一個(gè) AGI,或者就是現(xiàn)在我們掌握的技術(shù)?
答:我認(rèn)為很多創(chuàng)造力其實(shí)是我們不太了解我們創(chuàng)造它的過程。例如,Garry Kasparov 說他看到了深藍(lán)(Deep Blue)創(chuàng)造性的下棋。作為技術(shù)專家,我知道國(guó)際象棋程序是如何運(yùn)行的,在任務(wù)中通過投入驚人的計(jì)算量,深藍(lán)能夠下一步妙棋,而這一步妙棋可能在象棋大師眼里就是一種創(chuàng)造性的舉措。我自己也研究過創(chuàng)造性過程,創(chuàng)造力是十分困難的工作,因?yàn)閯?chuàng)造力是增加許多小模塊并拼合到一起,然后建立起一個(gè)好像是從無到有的巨大事物。但是,如果有人沒有看到所有的小模塊,或拼合這些小模塊成為創(chuàng)造性的物體有多難,那么我認(rèn)為創(chuàng)造力的實(shí)質(zhì)比它外表上看起來更加神奇。
我的藝術(shù)家朋友一遍又一遍地練習(xí)單個(gè)畫筆,并一遍又一遍地畫出類似的畫,然后他就逐漸取得了進(jìn)步。我的祖母是一個(gè)畫家,她在完成一幅驚人的作品前都是一點(diǎn)點(diǎn)進(jìn)步的,當(dāng)你只看到最終的成果,而沒有看到在完成最終成果之前做所的努力,那么你就會(huì)感到神奇。我認(rèn)為你所做的所有工作都是通過一點(diǎn)點(diǎn)小增量達(dá)成的。
問:所以如果你回顧剛才所談的內(nèi)容,人類的創(chuàng)造力是可以計(jì)算化和可實(shí)現(xiàn)的,在合理的時(shí)間范圍內(nèi)。人類的創(chuàng)造力不是什么非常神秘的東西,或者說是超出我們能實(shí)現(xiàn)的范圍的。您同意嗎?
答:是的。要么通過偶然的絕佳的棋子移動(dòng),尋求一個(gè)人類還未想到的句子的解釋,創(chuàng)造一個(gè)簡(jiǎn)單的藝術(shù)作品,我認(rèn)為我們正在見證機(jī)器行為具有某種程度的創(chuàng)造性。我們很可能會(huì)繼續(xù)看到這樣循序漸進(jìn)的進(jìn)展,機(jī)器在今后幾年內(nèi)逐漸變得更有「創(chuàng)造性」。
問:您的團(tuán)隊(duì)在地理分布上是怎樣的?大部分團(tuán)隊(duì)成員在哪里?
答:主要在北京。我們?cè)诿绹?guó)有一個(gè) 100 人的團(tuán)隊(duì),在北京也有一個(gè)大的團(tuán)隊(duì),同時(shí)在上海和深圳也有一些小團(tuán)隊(duì)。
問:在機(jī)器人技術(shù)領(lǐng)域,你能看到不同國(guó)家和地區(qū)的發(fā)展重點(diǎn)。例如在日本,能明顯看到將更多重心放在制造友好機(jī)器人上,去制造與人情感化連接的機(jī)器人,而不是與世界上其他部分所連接的機(jī)器人。那么在人工智能里面,是不是也有類似的情況?因?yàn)閯偛拍岬侥槻孔R(shí)別來自中國(guó)。在人工智能領(lǐng)域,不同的公司、不同的地區(qū)或者是不同的國(guó)家是不是會(huì)對(duì)有些事情的看法也不同?
答:首先我認(rèn)為在中國(guó),語音識(shí)別是經(jīng)濟(jì)和商業(yè)模式帶動(dòng)發(fā)展的一個(gè)很好的例子。從產(chǎn)品層面來講,我認(rèn)為不同的商業(yè)壓力和產(chǎn)品優(yōu)先性會(huì)導(dǎo)致不同的國(guó)家在不同領(lǐng)域的投資更多或者是更少。在中國(guó)就有這樣一些例子。
在中國(guó),用手機(jī)鍵盤打中文字要比打英文更加痛苦。所以這反過來也推動(dòng)了更好的移動(dòng)端手機(jī)語音識(shí)別的發(fā)展。因此我覺得百度領(lǐng)先在語音識(shí)別領(lǐng)域取得的突破也是由于要為用戶帶來語音識(shí)別體驗(yàn)的強(qiáng)大產(chǎn)品壓力的驅(qū)使。
至于機(jī)器翻譯,你知道美國(guó)有很多關(guān)于神經(jīng)機(jī)器翻譯的 PR。很多人都不知道的一點(diǎn)是,神經(jīng)機(jī)器翻譯其實(shí)是在中國(guó)首次開創(chuàng)并得到發(fā)展的,之后又成為了產(chǎn)品。美國(guó)的一些大型公司都在這之后,我認(rèn)為導(dǎo)致這個(gè)現(xiàn)象的其中一個(gè)原因是因?yàn)樵谥袊?guó),對(duì)將一些公開的內(nèi)容翻譯成中文的需求很大,而在美國(guó)這樣一個(gè)說英語國(guó)家中,英語的內(nèi)容非常多。當(dāng)然中文的內(nèi)容也很多,但是外國(guó)的內(nèi)容譯成中文會(huì)特別快,這是一種文化現(xiàn)象。然而世界上的英語內(nèi)容已經(jīng)非常多,所以說英語的人尋求對(duì)外語內(nèi)容的翻譯沒有那么緊需。
人臉識(shí)別作為一種商業(yè)在中國(guó)發(fā)展迅猛,因?yàn)樽鳛橐苿?dòng)優(yōu)先的社會(huì),中國(guó)人習(xí)慣了在移動(dòng)端進(jìn)行大筆的金融交易。例如,你可以通過百度獲得教育貸款,我們會(huì)基于你的貸款批給你一大筆錢,而這個(gè)申請(qǐng)你在手機(jī)上就可以完成。在我們通過手機(jī)給某個(gè)人發(fā)一大筆錢的時(shí)候,我們對(duì)確認(rèn)這個(gè)人的身份就會(huì)產(chǎn)生強(qiáng)烈的興趣。所以人臉識(shí)別就成為了要實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵技術(shù)。那些壓力也意味著中國(guó)的人臉識(shí)別是另外一個(gè)發(fā)展迅猛的領(lǐng)域,其發(fā)展勢(shì)頭比其他國(guó)家都要快。
不管是在美國(guó)還是中國(guó),在人工智能方面都有很多的創(chuàng)新。我猜還有其他的一些領(lǐng)域。英國(guó)在人工智能玩視頻游戲方面進(jìn)行了大量的投資。我個(gè)人不會(huì)在這一方面進(jìn)行投資,但是我想不同的組織有不同的興趣和優(yōu)先性。
我認(rèn)為如今人工智能的進(jìn)步成為了一個(gè)全球化現(xiàn)象,而且中國(guó)有很多的創(chuàng)新正在發(fā)生,而英語世界國(guó)家還沒有意識(shí)到這一點(diǎn)。這并不是因?yàn)楸C艿膯栴},我認(rèn)為這是因?yàn)槿狈φZ言的流暢性。
例如,幾周前我去參加 NIPS 大會(huì),在不到一天的時(shí)間之內(nèi),所有會(huì)議上最重要的演講都被總結(jié)或者是轉(zhuǎn)寫為中文 ,并發(fā)布在中國(guó)的網(wǎng)絡(luò)上。所以說巴塞羅那一個(gè)英語會(huì)議轉(zhuǎn)變成中文的知識(shí),中國(guó)做的非??觳⑶曳浅8咝?。在不到一天的時(shí)間之內(nèi),很多中國(guó)的研究者就可以閱讀我們在西班牙演講的中文版。我認(rèn)為正是很多中國(guó)人熟練的英語口語和寫作能力才讓這成為可能。
不幸的是,逆向的知識(shí)轉(zhuǎn)換要慢得多。因?yàn)閺娜蚍秶鷣砜?,?dāng)前中國(guó)之外很多的研究者不說中文。所以當(dāng)人們發(fā)明了很多東西,甚至已經(jīng)在中國(guó)廣泛傳播,一些英語觀眾都渾然不知,有時(shí)候甚至是在一年之后,一個(gè)英語國(guó)家的公司發(fā)明了類似的東西之后這些技術(shù)才能傳播開來。所以我希望自己能做的其中一件事情就是幫助提高相反方向知識(shí)轉(zhuǎn)換的速度,因?yàn)槿绻覀兡軌蜃屟芯可鐓^(qū)更加的全球化,那么全球的研究社區(qū)就會(huì)進(jìn)步的越快。
我想有一些具體的例子。首先是在中國(guó),普通話短句的語音識(shí)別在一年前超越了人類水平,但是這一成果在全球范圍的知名度并不廣,直到最近才被很多人熟知。我可以看到很多的例子,從語音識(shí)別領(lǐng)域取得的進(jìn)步到神經(jīng)機(jī)器翻譯領(lǐng)域所取得的進(jìn)步,再到中國(guó)率先建立了深度學(xué)習(xí) GPU 處理器,但是我希望能夠在中國(guó)初次發(fā)明之后,在美國(guó)也能夠盡快看到這些成就。
問:您有沒有一些網(wǎng)站或者是期刊可以推薦給我們的讀者,以便讓他們能夠更加容易地查找信息?
答:在中國(guó),傳播知識(shí)的方式和美國(guó)不太相同。在中國(guó),人工智能在社交媒體上傳播特別快,而是傳播的方式特別強(qiáng)大,如果不是親身經(jīng)歷的話可能無法理解。另外,相關(guān)的網(wǎng)站非常多,但是很多都是中文網(wǎng)站。你們可以在 Twitter/微博上關(guān)注我,我會(huì)看看該怎么幫助大家。
問:在你看來人類意識(shí)是什么?或者更確切地說,你相信人類意識(shí)從根本上來說是可計(jì)算的嗎?
答:我不知道意識(shí)到底是什么。在哲學(xué)領(lǐng)域,對(duì)周圍的人是否真正具有意識(shí),或者說他們像是僵尸一樣,以及機(jī)器人通過計(jì)算表現(xiàn)得好像它們具有意識(shí)一樣等這些問題一直存在著爭(zhēng)論??偠灾覀?nèi)绾沃莱宋覀冎獾钠渌硕颊嬲哂幸庾R(shí)?還是說他們是機(jī)器人?
我并不認(rèn)為意識(shí)是計(jì)算機(jī)從根本上來說無法實(shí)現(xiàn)的,確切地說,是我們應(yīng)該如何去實(shí)現(xiàn),而實(shí)現(xiàn)這一點(diǎn)是需要幾十年還是幾百年,我們還不清楚。
聯(lián)系客服