想要推理能力比肩人類 AI先得換種學(xué)習(xí)方式
不管是人類,還是動物,在學(xué)習(xí)大多數(shù)事物時(shí),都是在自我監(jiān)督的模式下進(jìn)行的,而不是強(qiáng)化學(xué)習(xí)模式。這個(gè)模式本質(zhì)上就是觀察這個(gè)世界,然后不斷與之互動,這種觀察是自發(fā)的,而不是在測試條件下完成的。
本報(bào)記者 金 鳳
人類在漫長的進(jìn)化中,獲得了一種能通過感知、邏輯推理來與世界互動、認(rèn)識世界的能力。當(dāng)一個(gè)梨擺在我們面前時(shí),我們能夠通過嗅覺、視覺等,判斷出它是梨而非蘋果。當(dāng)在路上行駛時(shí),即使行人被部分遮擋住,我們也能從露出的部分體貌特征判斷出這是一個(gè)人,從而進(jìn)行避讓。
在人工智能領(lǐng)域,科學(xué)家們也一直試圖讓機(jī)器擁有像人一樣的邏輯思維能力,幫助人完成更多工作。
近日,在2020 ICLR大會上,圖靈獎得主舒亞·本吉?dú)W(Yoshua Bengio)和揚(yáng)·勒昆(Yann LeCun)發(fā)表觀點(diǎn)稱,自監(jiān)督學(xué)習(xí)有望使AI產(chǎn)生類人的推理能力。本吉?dú)W相信機(jī)器最終可以習(xí)得關(guān)于這個(gè)世界的各種知識,這種知識的獲得并不需要機(jī)器去親身體驗(yàn)各種真實(shí)發(fā)生的事件,而是通過習(xí)得語言化的知識來實(shí)現(xiàn)。
那么機(jī)器如何具備類人的推理能力?想具備類人的推理能力還要逾越哪些障礙?
“死記硬背”讓機(jī)器難有邏輯能力
購物時(shí),無需出示支付碼,將面部特征綁定銀行卡就能輕松消費(fèi);回家路上,查詢手機(jī)地圖,可以看出哪些地段擁堵;到飯點(diǎn)了,跟機(jī)器人對話叫外賣……這些基于機(jī)器學(xué)習(xí)的應(yīng)用,正在讓人工智能變得可觀可感。但機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)便是,需要大量數(shù)據(jù)的積累以及很強(qiáng)的算力。
機(jī)器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)?!氨O(jiān)督學(xué)習(xí)需要對數(shù)據(jù)進(jìn)行標(biāo)簽分類,數(shù)據(jù)需要涵蓋所有可能的場景,此外,完成學(xué)習(xí),機(jī)器還需要大量的算力。例如,如果希望創(chuàng)建圖像分類模型,則必須為系統(tǒng)提供經(jīng)過適當(dāng)分類標(biāo)記的大量圖像,讓模型在其中進(jìn)行充分訓(xùn)練。有時(shí)數(shù)據(jù)量達(dá)到百萬、千萬級規(guī)模,需要幾百萬、上千萬次的迭代?!敝袊茖W(xué)院自動化研究所研究員、視語科技創(chuàng)始人王金橋告訴科技日報(bào)記者。
因此,減少對數(shù)據(jù)的依賴,一直是研究人員最重要的探索方向之一。在南京航空航天大學(xué)計(jì)算機(jī)學(xué)院教授陳松燦看來,監(jiān)督學(xué)習(xí)往往需要大量的帶有注釋、標(biāo)記的數(shù)據(jù),而標(biāo)記這些數(shù)據(jù),需要人工完成,既耗時(shí)又昂貴。
然而,即使是在有大量數(shù)據(jù)“打底”的監(jiān)督學(xué)習(xí)環(huán)境中,一旦機(jī)器遇到不同于訓(xùn)練示例的全新狀況,也面臨著失控的風(fēng)險(xiǎn)。
“例如無人駕駛汽車行駛在一條陌生的道路上,前方雖然出現(xiàn)了路桿,但如果此前系統(tǒng)沒有遇到過這種道路模式,就會撞上去。進(jìn)入攝像頭視野的行人,如果未露出全貌,那系統(tǒng)就無法判斷出這是一個(gè)人,也會撞上去。還有我們進(jìn)入停車場時(shí),有些停車桿不能及時(shí)抬起,是因?yàn)榭拷\嚄U的行駛角度超出了此前設(shè)定的范圍?!蓖踅饦虮硎荆m然數(shù)據(jù)標(biāo)簽的質(zhì)量,對于監(jiān)督學(xué)習(xí)的效果非常重要,但監(jiān)督學(xué)習(xí)不應(yīng)局限于這種模式,應(yīng)該提高對未知環(huán)境的探索和理解能力。
自監(jiān)督學(xué)習(xí)可利用規(guī)律舉一反三
對于機(jī)器學(xué)習(xí)的未來,揚(yáng)·勒昆和約舒亞·本吉?dú)W有著相同的期待,他們認(rèn)為,自監(jiān)督學(xué)習(xí)會創(chuàng)造出更像人類的人工智能。
正如勒昆所解釋的,大多數(shù)人可以在30小時(shí)內(nèi)學(xué)會駕駛汽車,因?yàn)樗麄円呀?jīng)憑借直覺構(gòu)建了一個(gè)關(guān)于汽車行動方式的物理模型。
“自監(jiān)督學(xué)習(xí)是無監(jiān)督學(xué)習(xí)中的一種,它可以通過揭示數(shù)據(jù)各部分之間的關(guān)系、內(nèi)在結(jié)構(gòu),從數(shù)據(jù)中生成標(biāo)簽,這種標(biāo)簽便于對數(shù)據(jù)進(jìn)行分類。自監(jiān)督學(xué)習(xí)需要學(xué)習(xí)的樣本量很少,但需要有基礎(chǔ)知識的積累?!蓖踅饦蛘f。
王金橋進(jìn)一步解釋,例如下圍棋,如果機(jī)器可以將頂尖高手的棋路都學(xué)會,就能舉一反三。又例如,假設(shè)世界上有5000種蘋果的類型,植物學(xué)家又培育出一種新蘋果,與其他蘋果長得很像,那么自監(jiān)督學(xué)習(xí)就可以通過數(shù)據(jù)的分析,識別出這是蘋果,但又能認(rèn)識到它是不同于以往的蘋果類型。也就是說,通過自監(jiān)督學(xué)習(xí),機(jī)器不需要訓(xùn)練,就可以通過自動分析內(nèi)部數(shù)據(jù)的結(jié)構(gòu)關(guān)系,并且應(yīng)用分析數(shù)據(jù)得到的規(guī)律,對各種新情況作出判斷。這種能力類似于人,在嬰幼兒時(shí)期,人類能用嗅覺、觸覺、視覺等感知世界,進(jìn)入學(xué)校學(xué)習(xí)后,能將萬事萬物的物理特征,與知識結(jié)合起來,慢慢形成推理能力。
王金橋認(rèn)為,這有點(diǎn)類似于勒昆說的,自監(jiān)督學(xué)習(xí)無需創(chuàng)建大量帶有標(biāo)簽的數(shù)據(jù)集,例如用大量貓和狗的圖片,讓機(jī)器認(rèn)識貓和狗的不同;也不用花費(fèi)數(shù)千個(gè)小時(shí)訓(xùn)練“Alpha Zero”這樣的國際象棋游戲機(jī)器人,而是只需獲取一些豐富的原始數(shù)據(jù),例如視頻,然后“喂”給計(jì)算機(jī),訓(xùn)練機(jī)器預(yù)測視頻中即將出現(xiàn)的畫面。
“不管是人類,還是動物,在學(xué)習(xí)大多數(shù)事物時(shí),都是在自我監(jiān)督的模式下進(jìn)行的,而不是強(qiáng)化學(xué)習(xí)模式。這個(gè)模式本質(zhì)上就是觀察這個(gè)世界,然后不斷與之增進(jìn)互動,這種觀察是自發(fā)的,而不是在測試條件下完成的?!崩绽ピ?020 ICLR大會上表示。
達(dá)到類人水平還需算法理論突破
在幾位專家看來,目前想通過自監(jiān)督學(xué)習(xí)實(shí)現(xiàn)機(jī)器的類人邏輯能力,還前路漫漫。
陳松燦認(rèn)為,自監(jiān)督學(xué)習(xí)需要解決數(shù)據(jù)的不確定性問題,即積累的數(shù)據(jù)與要完成的任務(wù)的匹配性問題。“例如,利用自監(jiān)督學(xué)習(xí)訓(xùn)練的自動駕駛系統(tǒng),可以通過機(jī)載的測速儀、方向儀,學(xué)習(xí)安全行駛的方向和速度信息。但以現(xiàn)在的技術(shù)水平來說,如果行人橫穿馬路,而此前標(biāo)記的信息與行人橫穿馬路不搭界,那自動駕駛系統(tǒng)就會無法做出判斷,發(fā)出指令。”
王金橋表示:“從監(jiān)督學(xué)習(xí)到自監(jiān)督學(xué)習(xí),就像先讓機(jī)器知道什么是1234,才能算加減乘除一樣。目前的自監(jiān)督學(xué)習(xí)還非常初級,僅有一些小的、封閉的數(shù)據(jù)集。”
他說,目前制約自監(jiān)督學(xué)習(xí)的因素涉及大數(shù)據(jù)積累、小樣本監(jiān)督,以及自主進(jìn)化、認(rèn)知未知數(shù)據(jù)的能力?!霸跀?shù)據(jù)積累階段,還需要把數(shù)據(jù)做得更規(guī)范,搭建的深度學(xué)習(xí)網(wǎng)絡(luò)要有能支持自監(jiān)督學(xué)習(xí)的能力,能讓機(jī)器自己生成標(biāo)簽。在樣本監(jiān)督學(xué)習(xí)階段,要解決樣本不均衡的問題,例如要讓機(jī)器學(xué)會分辨貓和狗,那么貓和狗的案例數(shù)量要匹配,同時(shí)要去除數(shù)據(jù)噪音,不要把干擾圖像混入?!?div style="height:15px;">
“關(guān)鍵是要讓自監(jiān)督學(xué)習(xí)產(chǎn)生認(rèn)知的能力,而不只是代替人類的視覺、聽覺、觸覺,要從感知智能過渡到認(rèn)知智能,讓機(jī)器建立自己的知識圖譜,能與人的思辨能力和知識圖譜對接,能進(jìn)行知識表述和高階推理。”王金橋說。
但目前所有的不完美,并不影響兩位圖靈獎得主的信心。本吉?dú)W認(rèn)為,相比于動物,人類之所以聰明,是因?yàn)槲覀冇凶约旱奈幕?,讓我們能夠解決這個(gè)世界的問題。要想讓人工智能在現(xiàn)實(shí)世界中發(fā)揮作用,我們需要它不僅僅是有翻譯功能,更需要它能夠真正理解自然語言。