打開(kāi)AI的黑盒是人工智能落地產(chǎn)業(yè)界面臨的越來(lái)越迫切的問(wèn)題,如同人類對(duì)世界因果關(guān)系的認(rèn)知支撐了種種復(fù)雜的預(yù)測(cè)和決策。概率論的提出為數(shù)學(xué)描述現(xiàn)實(shí)世界充滿不確定性的因果關(guān)系給出了可能性,那么在AI可解釋性、因果建模方面可以如何利用?2019年的圖靈獎(jiǎng)得主Yoshua Bengio為我們帶來(lái)了最新成果和講座。
今年3月,Yoshua Bengio因?qū)ι疃葘W(xué)習(xí)的發(fā)展做出的貢獻(xiàn)而獲得了計(jì)算機(jī)科學(xué)領(lǐng)域的最高榮譽(yù):圖靈獎(jiǎng)。深度學(xué)習(xí)技術(shù)引發(fā)了人工智能的復(fù)興,推動(dòng)了自動(dòng)駕駛汽車、實(shí)時(shí)語(yǔ)音翻譯和面部識(shí)別等技術(shù)的應(yīng)用。現(xiàn)在,Bengio表示深度學(xué)習(xí)技術(shù)需要修復(fù)和完善。他認(rèn)為,如果深度學(xué)習(xí)技術(shù)不能跨出模式識(shí)別之外,不能實(shí)現(xiàn)對(duì)因果關(guān)系等更多信息的了解,就無(wú)法實(shí)現(xiàn)全部潛力,也不會(huì)帶來(lái)真正的AI革命。換句話說(shuō),深度學(xué)習(xí)不僅需要弄清“是什么”,更需要開(kāi)始問(wèn)“為什么”。他說(shuō),深度學(xué)習(xí)在理想的情況下效果很好,但是如果不能推理因果關(guān)系,就無(wú)法接近復(fù)現(xiàn)人類智力的水平。Bengio說(shuō):“如何將因果關(guān)系集成到AI技術(shù)中是一件大事?!?“當(dāng)前的機(jī)器學(xué)習(xí)方法假定,經(jīng)過(guò)訓(xùn)練的AI系統(tǒng)將與訓(xùn)練數(shù)據(jù)應(yīng)用于相同類型的數(shù)據(jù)。在現(xiàn)實(shí)生活中,情況往往并非如此。”包括深度學(xué)習(xí)在內(nèi)的機(jī)器學(xué)習(xí)系統(tǒng)是高度特定化的,這些針對(duì)特定化任務(wù)進(jìn)行訓(xùn)練,比如識(shí)別圖像中的貓或音頻中的口頭命令。自深度學(xué)習(xí)技術(shù)于2012年左右問(wèn)世以來(lái),展現(xiàn)出了令人印象深刻的識(shí)別數(shù)據(jù)模式的能力。從醫(yī)學(xué)成像中發(fā)現(xiàn)癌癥,到發(fā)現(xiàn)財(cái)務(wù)數(shù)據(jù)欺詐的跡象,深度學(xué)習(xí)技術(shù)落地越來(lái)越廣泛。
但是在因果關(guān)系上,深度學(xué)習(xí)從根本上說(shuō)是無(wú)能為力的。與真正的醫(yī)生不同,深度學(xué)習(xí)算法無(wú)法解釋為什么某些特定圖像模式可能代表著疾病。這意味著在危急情況下必須謹(jǐn)慎使用深度學(xué)習(xí)。了解因果關(guān)系將使現(xiàn)有的AI系統(tǒng)更智能,更高效。如果機(jī)器人知道東西掉在地上會(huì)摔壞,就不需要將幾十個(gè)花瓶扔到地板上來(lái)進(jìn)行訓(xùn)練了。自動(dòng)駕駛汽車也是如此。他說(shuō):“人類無(wú)需經(jīng)歷很多事故,就可以謹(jǐn)慎駕駛?!蔽覀冎皇强梢韵胂笫鹿实膱?chǎng)景,就能為發(fā)生的實(shí)際情況做好心理準(zhǔn)備。”問(wèn)題是如何賦予AI系統(tǒng)這種能力。Bengio在他的研究實(shí)驗(yàn)室中正在研究一種能夠識(shí)別簡(jiǎn)單因果關(guān)系的深度學(xué)習(xí)模型。他和他的同事最近發(fā)表了一篇研究論文,概述了該方法。研究人員使用了一個(gè)數(shù)據(jù)集,以概率的形式繪制了諸如吸煙和肺癌等現(xiàn)實(shí)世界現(xiàn)象之間的因果關(guān)系,還生成了因果關(guān)系的綜合數(shù)據(jù)集。論文中的算法本質(zhì)上形成了關(guān)于哪些變量具有因果關(guān)系的假設(shè),然后測(cè)試了對(duì)不同變量的變化。例如,即使癌癥與其他因素(比如去醫(yī)院就診的行為)相關(guān),吸煙不僅與癌癥有關(guān),而且實(shí)際上會(huì)導(dǎo)致癌癥的事實(shí)仍然應(yīng)該是顯而易見(jiàn)的。這樣,AI機(jī)器人最終可能會(huì)使用這種方法來(lái)形成關(guān)于當(dāng)物體掉落時(shí)會(huì)發(fā)生什么的假設(shè),然后看到幾件東西砸在地板被摔壞,從而確認(rèn)這種因果關(guān)系的假設(shè)。目前,利用深度學(xué)習(xí)可以將訓(xùn)練數(shù)據(jù)(圖像或音頻)被饋送到神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)調(diào)整,直到以正確的方式做出響應(yīng)為止。只要能夠提供大量訓(xùn)練圖像,并具備足夠的算力,就可以訓(xùn)練深度學(xué)習(xí)程序就能夠?qū)崿F(xiàn)高精度地識(shí)別照片中的目標(biāo)。但是,深度學(xué)習(xí)算法并不善于概括,也不善于將一種情況下學(xué)習(xí)到的知識(shí)用在另一種情況中。深度學(xué)習(xí)可以捕獲相關(guān)現(xiàn)象,例如公雞啼叫和太陽(yáng)升起,但并不知曉這兩件事情之間的因果關(guān)系。Bengio北大演講:通過(guò)深度學(xué)習(xí)理解世界的構(gòu)成實(shí)際上,Bengio不僅致力于研究機(jī)器學(xué)習(xí)技術(shù)與因果關(guān)系的理論和模型,更致力于應(yīng)用這一重要理論和模型的應(yīng)用和傳播。近日,他來(lái)到北京大學(xué)前沿計(jì)算研究中心做了一個(gè)在線報(bào)告,題為《通過(guò)深度學(xué)習(xí)來(lái)理解世界的構(gòu)成》(Towards Compositional Understanding of the World by Deep Learning)。
Bengio的演講主要內(nèi)容包括:
在處理out-of-distribution方面,人類比現(xiàn)有的AI系統(tǒng)更擅長(zhǎng)。AI怎樣能更接近人類的能力水平呢?Bengio在講座中提出四種組合:- 元學(xué)習(xí):端到端地學(xué)習(xí)以推廣到修改后的分布,從分布中采樣;
- 設(shè)計(jì)模塊化的架構(gòu),其中模塊彼此相互獨(dú)立,稀疏交互,同時(shí)易于以新的方式組成;
- 捕獲因果結(jié)構(gòu)分解成獨(dú)立的機(jī)制,從而正確地推斷智能體修改數(shù)據(jù)分布干預(yù)的效果,以及利用學(xué)習(xí)者與其環(huán)境之間的相互作用來(lái)學(xué)習(xí)語(yǔ)義高級(jí)變量及其相互作用,即,采用agent的學(xué)習(xí)視角,有利于抽象表象的深度學(xué)習(xí)。
這意味著單純從文本中學(xué)習(xí)是不夠的,我們需要努力尋找建立世界模型的學(xué)習(xí)主體,語(yǔ)言標(biāo)簽可以與之關(guān)聯(lián)。雖然這種agent視角讓人聯(lián)想到深度強(qiáng)化學(xué)習(xí),但重點(diǎn)不是深度學(xué)習(xí)如何幫助強(qiáng)化學(xué)習(xí),而是在強(qiáng)化學(xué)習(xí)中常見(jiàn)的agent視角如何幫助深度學(xué)習(xí)發(fā)現(xiàn)更好的知識(shí)表示。深度學(xué)習(xí)與因果關(guān)系,前人早有關(guān)注實(shí)際上,關(guān)于因果關(guān)系的問(wèn)題,AI之外其他領(lǐng)域已經(jīng)進(jìn)行了長(zhǎng)期研究,近幾十年來(lái),陸續(xù)出現(xiàn)了探索因果關(guān)系的數(shù)學(xué)技術(shù),徹底改變了包括社會(huì)科學(xué),經(jīng)濟(jì)學(xué)和流行病學(xué)在內(nèi)的各個(gè)領(lǐng)域的研究狀態(tài)?,F(xiàn)在,研究人員正在努力將因果關(guān)系和機(jī)器學(xué)習(xí)結(jié)合起來(lái)。因因果推理研究工作在2011年獲得圖靈獎(jiǎng)的朱迪亞·珀?duì)枺↗udea Pearl)說(shuō),他對(duì)Bengio的想法印象深刻。他最近與他人合著一本書(shū)《因果的新科學(xué)》(The Book of Why:The New Science of Cause and Effect)提出了從根本上限制AI而沒(méi)有某種因果推理能力的情況。認(rèn)知科學(xué)實(shí)驗(yàn)還表明,了解因果關(guān)系對(duì)人類的發(fā)展和智力研究至關(guān)重要,雖然我們還不清楚人類如何形成這種知識(shí)的。
Bengio關(guān)于因果關(guān)系的研究可能是向回答這一問(wèn)題邁出的一小步,但它也反映了深度學(xué)習(xí)方面的更多現(xiàn)實(shí)主義。即使隨著該技術(shù)的應(yīng)用成倍增加,越來(lái)越多的專家也指出了該技術(shù)在諸如語(yǔ)言理解之類的關(guān)鍵領(lǐng)域中的局限性。Bengio還對(duì)目前企業(yè)過(guò)分夸大AI和深度學(xué)習(xí)的能力的現(xiàn)象表示擔(dān)憂。他表示:“我認(rèn)為,商業(yè)世界中最好能改正這種現(xiàn)象,因?yàn)槟嵌际浅醋??!?/section>其他人則認(rèn)為,專注于深度學(xué)習(xí)可能是問(wèn)題的一部分。紐約大學(xué)名譽(yù)教授加里·馬庫(kù)斯(Gary Marcus)最近的著作著重介紹了深度學(xué)習(xí)的局限性。他在書(shū)中表示說(shuō):“太多的深度學(xué)習(xí)側(cè)重于沒(méi)有因果關(guān)系的關(guān)聯(lián)性,這常常使深度學(xué)習(xí)系統(tǒng)在運(yùn)行條件變化的測(cè)試時(shí)會(huì)出現(xiàn)性能下降?!?br>Bengio這篇論文對(duì)機(jī)器學(xué)習(xí)因果推理的興趣可能預(yù)示著研究界的觀點(diǎn)開(kāi)始出現(xiàn)了有益的變化。在這一點(diǎn)上,來(lái)自人類的經(jīng)驗(yàn)是顯而易見(jiàn)的。“當(dāng)孩子問(wèn)‘為什么?’時(shí),他們實(shí)際上問(wèn)的是因果關(guān)系。而當(dāng)機(jī)器開(kāi)始問(wèn)‘為什么’時(shí),它們會(huì)變得更加智能。”馬庫(kù)斯說(shuō)。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。