什么是第三代人工智能,其發(fā)展趨勢(shì)是什么?
人工智能從1956年第一次提出來(lái),人工智能已經(jīng)發(fā)展了63年多,最初的第一代人工智能是用計(jì)算機(jī)來(lái)解決問(wèn)題,第二代是以AlphaGo為標(biāo)志的深度學(xué)習(xí),但是深度學(xué)習(xí)是基于真正的大數(shù)據(jù),在目前似乎也遇到了瓶頸,于是,科學(xué)家們提出了第三代人工智能,但是目前來(lái)看,還沒(méi)有人真正明確第三代人工智能是什么,但是其趨勢(shì)是清晰的。
第一代、第二代人工智能
下面是清華大學(xué)人工智能研究院院長(zhǎng)、中國(guó)科學(xué)院院士張鈸在《邁向第三代人工智能的新征程》中對(duì)三代人工智能的詮釋。
第一代人工智能提出符號(hào)模型,以知識(shí)經(jīng)驗(yàn)為基礎(chǔ)的推理模型,這是人工智能的第一個(gè)重大突破。這個(gè)突破后來(lái)產(chǎn)生了一個(gè)結(jié)果,就是這個(gè)理論提出時(shí)有個(gè)非常樂(lè)觀的估計(jì),1956年由西蒙提出,基于這種模型,十年之后機(jī)器可以打敗所有棋手,二十年以后機(jī)器取代人類(lèi)所有的工作。實(shí)際并不是這樣,六十年以后機(jī)器才打敗棋手,機(jī)器究竟代替人類(lèi)的所有工作是什么時(shí)間,可能還很遙遠(yuǎn),這也是人工智能的另外一個(gè)特點(diǎn),往往被高估。
人工智能的第一代模型,有優(yōu)點(diǎn),但是也有很大局限性。這個(gè)優(yōu)點(diǎn)是顯然的,因?yàn)樗悄7氯祟?lèi)的,它可解釋?zhuān)敯粜院軓?qiáng),但是它的局限性也非常大。因?yàn)樽畲蟮膯?wèn)題是人類(lèi)的知識(shí)經(jīng)驗(yàn),很難準(zhǔn)確表達(dá),這就是產(chǎn)生的后來(lái)人工智能冬天的根本原因。當(dāng)時(shí)的應(yīng)用很有限,幾乎沒(méi)有推廣,但是,有了大數(shù)據(jù)以后,這個(gè)問(wèn)題得到了很大改善,特別是機(jī)器的能力提高以后,可以把大量的數(shù)據(jù)作為知識(shí)放在機(jī)器里,這就是最典型的沃森系統(tǒng)。
沃森系統(tǒng)可以做癌癥的免疫治療,這里面用多少知識(shí)呢?100萬(wàn)個(gè)醫(yī)學(xué)雜志中抽取的2500個(gè)摘要,400萬(wàn)病人的數(shù)據(jù),再加上1861年以前所有藥物的專(zhuān)利,它有醫(yī)學(xué)知識(shí),并聯(lián)的數(shù)據(jù)再加上藥物知識(shí),就可以做癌癥的免疫治療。當(dāng)然了,很多慢性病的治療和管理,這個(gè)系統(tǒng)也做得很好,中國(guó)的國(guó)內(nèi)也有大量這方面的工作在探索和研究。
第二代人工智能,一個(gè)最重要的成果就是深度學(xué)習(xí)。也就是說(shuō),第一代人工智能提出來(lái),如果能夠很好地利用人類(lèi)的知識(shí),就可以建立很好的人工智能系統(tǒng),如果我們有充分?jǐn)?shù)據(jù),也有可能建立起有用的人工智能的系統(tǒng)。
深度學(xué)習(xí)為什么這么受重視?一個(gè)很重要的原因,它有兩個(gè)重大變化。當(dāng)網(wǎng)絡(luò)層次增加以后,有兩個(gè)重大變化:第一個(gè)變化,輸入只要原始數(shù)據(jù),不需要預(yù)處理。第二個(gè)是性能提高很多,這就造成了深度學(xué)習(xí)的重大突破。也就是說(shuō),它從一定意義上有通用工具,對(duì)領(lǐng)域的知識(shí)要求不高,同時(shí)能夠處理大數(shù)據(jù)。
這就帶來(lái)很大的變化,大家也看到了,語(yǔ)音識(shí)別,2001年時(shí)它的識(shí)別率停留在80%,也就是20%的誤識(shí)別率;2016年誤識(shí)率就降到了5.9%,達(dá)到專(zhuān)業(yè)速記員的水平,到了2017年,所有產(chǎn)品包括谷歌、微軟,包括中國(guó)的訊飛、百度,用的全是深度學(xué)習(xí)。
變化更大的是圖像識(shí)別。有一個(gè)標(biāo)準(zhǔn)的圖像識(shí)別數(shù)據(jù)集 ImageNet,大家知道,2011年,它的誤識(shí)率是50%,有一半認(rèn)錯(cuò)了。但是四年以后,2015年就超過(guò)了人類(lèi)水平,原因也是利用了深度學(xué)習(xí)。
最后一個(gè),給大家印象最深就是AlphaGo,大家都知道了。因此就有很多估計(jì),十年之內(nèi)代替40%以上人類(lèi)的工作,三五年里面,智能駕駛車(chē)就可以量產(chǎn),等等,剛剛李院士說(shuō)到了這個(gè)問(wèn)題,他分析得很深刻。實(shí)際三五年里面不可能量產(chǎn)。
技術(shù)已經(jīng)完全成熟,我們現(xiàn)在的研究已不成熟,主要是應(yīng)用問(wèn)題。為什么在人工智能上往往產(chǎn)生樂(lè)觀估計(jì)?主要原因有兩個(gè):一個(gè)是對(duì)發(fā)展人工智能的困難性估計(jì)不足,對(duì)取得的成果估計(jì)過(guò)高。一個(gè)估計(jì)不足,一個(gè)估計(jì)過(guò)高,就產(chǎn)生了問(wèn)題。另外一個(gè)很重要的原因,受歷史事件的影響。過(guò)去我們發(fā)現(xiàn),有了蒸汽機(jī)以后就產(chǎn)生了工業(yè)革命,有了電動(dòng)機(jī)發(fā)動(dòng)機(jī)以后就產(chǎn)生了電氣革命,有了計(jì)算機(jī)以后產(chǎn)生了信息革命,大家很希望有一個(gè)東西出來(lái)以后引起人工智能的革命。
現(xiàn)在的問(wèn)題是,有沒(méi)有?至今為止,還沒(méi)有發(fā)現(xiàn)人工智能里面的蒸汽機(jī)和計(jì)算機(jī)。曾經(jīng)最開(kāi)始寄希望于符號(hào)模型,結(jié)果發(fā)現(xiàn)符號(hào)模型也沒(méi)有那么管用。第二次發(fā)現(xiàn)的是大數(shù)據(jù)+深度學(xué)習(xí),以為大數(shù)據(jù)+深度學(xué)習(xí)就是人工智能的蒸汽機(jī)和計(jì)算機(jī),為什么這樣?
這不能不考慮到人工智能的特點(diǎn),我們說(shuō)深度學(xué)習(xí)根本不是AI的通用機(jī)。現(xiàn)在大家在尋找通用的人工智能,到底有沒(méi)有,還有爭(zhēng)論,不去管它,但至少深度學(xué)習(xí)不是人工智能。這個(gè)非常明顯,第一代人工智能也好,第二代人工智能也好,它的應(yīng)用場(chǎng)景必須滿足以下五個(gè)條件。
從正面來(lái)講,所有的應(yīng)用場(chǎng)景,如果滿足以下五個(gè)條件,計(jì)算機(jī)絕對(duì)能夠戰(zhàn)勝人類(lèi),不管這個(gè)問(wèn)題多么復(fù)雜:具有豐富的數(shù)據(jù)或知識(shí),完全信息,確定性信息,靜態(tài),單領(lǐng)域和單任務(wù)。
最明顯的例子是圍棋,圍棋多么復(fù)雜,但是圍棋滿足這五個(gè)條件,所以計(jì)算機(jī)戰(zhàn)勝在圍棋上戰(zhàn)勝人類(lèi)是早晚的事情。所以從正面來(lái)講,如果你滿足這五個(gè)條件,不管多復(fù)雜,計(jì)算機(jī)絕對(duì)戰(zhàn)勝人類(lèi)。長(zhǎng)遠(yuǎn)來(lái)看,如果你的應(yīng)用場(chǎng)景不完全滿足這五個(gè)條件,其中有些條件不滿足,你這個(gè)工作就變成困難。自動(dòng)駕駛為什么如此困難?根本的原因在這里。為什么我們難以做出來(lái)廉價(jià)、可靠的自動(dòng)駕駛呢?背后的原因就在這里,因?yàn)樽詣?dòng)駕駛很多條件都不滿足,它不是完全信息,它不是確定性信息,它不是靜態(tài)的環(huán)境,或者是按照確定性規(guī)律演化的,它的很多東西是不可預(yù)測(cè)的,它也不是單領(lǐng)域的,里面有人駕駛的車(chē)、行人、其它車(chē)輛。所以剛剛李院士提出來(lái)專(zhuān)用道,就是把這些東西弄干凈,變成單領(lǐng)域。所以我們一直說(shuō),如果有些條件是不符合這五條,你就需要下功夫。
現(xiàn)在人工智能能夠在這些領(lǐng)域里面得到應(yīng)用,換句話說(shuō),這些領(lǐng)域里面有很多應(yīng)用產(chǎn)品符合剛才講的五個(gè)條件。如果這些領(lǐng)域里面的應(yīng)用場(chǎng)景符合五個(gè)條件,大家大膽去做,絕對(duì)會(huì)超過(guò)人。根據(jù)現(xiàn)在計(jì)算機(jī)強(qiáng)大的力量,是可以做到這一點(diǎn)的。但是,這些應(yīng)用里面,也有大量不符合那五個(gè)條件的,大家必須下功夫,不能指望靠現(xiàn)在的第一代、第二代人工智能去解決它。
舉個(gè)簡(jiǎn)單的例子,復(fù)合場(chǎng)景下的決策,完全信息條件下的決策或者完全信息下的博弈,計(jì)算機(jī)戰(zhàn)勝人類(lèi)是絕對(duì)的。下面一個(gè)問(wèn)題,不完全信息的博弈及打牌,大家都知道,今年5月份對(duì)撲克牌這個(gè)問(wèn)題也解決了。換句話說(shuō),6人無(wú)限注的德州撲克,計(jì)算機(jī)能戰(zhàn)勝人類(lèi),這就意味著概率意義下的不確定性,機(jī)器也可以戰(zhàn)勝人類(lèi)。但是人類(lèi)的決策環(huán)境都不符合前面兩個(gè)條件。所以在復(fù)合環(huán)境下的博弈或者復(fù)雜環(huán)境下的決策,機(jī)器跟人類(lèi)還差得比較遠(yuǎn)。從這里來(lái)講,應(yīng)用場(chǎng)景是極為重要的。
第二個(gè),我們必須要重視的,用數(shù)據(jù)驅(qū)動(dòng)的方法做出來(lái)的系統(tǒng),有大量毛病,或者說(shuō)這些毛病是根本性的,是極為危險(xiǎn)的。這里面列出來(lái)的,簡(jiǎn)單舉個(gè)例子,一個(gè)圖像識(shí)別系統(tǒng),都可以說(shuō)它的識(shí)別率超過(guò)人類(lèi),但是這個(gè)圖象識(shí)別系統(tǒng)跟人類(lèi)的感知完全不同。
就是這樣的系統(tǒng),你給它噪聲,它可以識(shí)別為知更鳥(niǎo)。你給它一個(gè)噪聲,它可以識(shí)別為獵豹。換句話說(shuō),模式識(shí)別系統(tǒng)并沒(méi)有達(dá)到人類(lèi)認(rèn)知的水平,只達(dá)到低等動(dòng)物的水平,所以感知這個(gè)詞翻譯得非常好,感覺(jué)+知覺(jué),低等動(dòng)物只有感覺(jué),沒(méi)有認(rèn)知。所以機(jī)器現(xiàn)在達(dá)到的水平是低等動(dòng)物的水平,它可以分辨不同的物體,但是它本質(zhì)上不認(rèn)識(shí)這個(gè)物體。另外是它非常脆弱,非常容易受攻擊。
這是阿爾卑斯山圖片,人起來(lái)是,機(jī)器看起來(lái)也是,只要給它加上噪聲,右邊這個(gè)圖和左邊那個(gè)圖,唯一的區(qū)別是噪聲多一點(diǎn),人看起來(lái)還是阿爾卑斯山,機(jī)器看起來(lái)是一條狗,而且它的置信度是99.99%,它99.99%認(rèn)為這是一條狗,非常容易受欺騙,這就說(shuō)明機(jī)器跟人的認(rèn)知差異非常大。
語(yǔ)音也是同樣的道理,前面的英文說(shuō)的是一句話,我們加上一點(diǎn)點(diǎn)噪聲,人聽(tīng)起來(lái)還是一樣的,機(jī)器聽(tīng)起來(lái)就是另外的內(nèi)容,這就非常危險(xiǎn)。
搞軍事的人說(shuō),過(guò)去你語(yǔ)音傳過(guò)去,它進(jìn)行干擾,你聽(tīng)不見(jiàn)而已?,F(xiàn)在語(yǔ)音傳過(guò)去,它說(shuō)進(jìn)攻,可以讓你聽(tīng)成退卻,加一點(diǎn)噪聲就行了,這就是AI的安全性。
另外,缺少自我知識(shí),這是非常重要的。你說(shuō)我用這個(gè)話,讓它翻譯,「說(shuō)你行的人行」,這句話計(jì)算機(jī)怎么翻呢?「說(shuō)你專(zhuān)業(yè)的人行道」,瞎翻,為什么瞎翻?它不知道自己不知道,沒(méi)有任何自知之明。這是很危險(xiǎn)的。為什么翻譯成人行道呢?「人行」,它以為是人行道。為什么翻譯成「你的專(zhuān)業(yè)」呢?「你行」。這是非常危險(xiǎn)的。大家想想,我?guī)Я艘粋€(gè)翻譯,翻譯水平挺高的,大多數(shù)翻譯是很準(zhǔn)確的,但是他會(huì)瞎說(shuō),你敢用嗎?人類(lèi)不會(huì),因?yàn)樗肋@句話如果沒(méi)有聽(tīng)明白會(huì)再問(wèn)是什么意思,計(jì)算機(jī)沒(méi)有自知之明,人貴有自知之明,這是人類(lèi)智慧的一個(gè)部分。怎么讓機(jī)器有自知之明?這是很困難的事。
下一步,我們現(xiàn)在有個(gè)新的歷史機(jī)遇,就是邁向第三代人工智能。第三代人工智能就要糾正前面說(shuō)的兩個(gè)局限性,建立可解釋、魯棒的人工智能理論,發(fā)展安全、可信、可用的人工智能技術(shù),促進(jìn)人工智能的創(chuàng)新應(yīng)用。
第三代人工智能趨勢(shì)
近日,AI2000人工智能全球2000位最具影響力學(xué)者榜單在清華大學(xué)發(fā)布,中國(guó)學(xué)者規(guī)模位列世界第二,但高水平學(xué)者集中的研究機(jī)構(gòu)匱乏,人工智能領(lǐng)域的人才隊(duì)伍亟待加強(qiáng)。
AI2000榜單由清華-中國(guó)工程院知識(shí)智能聯(lián)合研究中心和清華大學(xué)人工智能研究院發(fā)布。AI2000人工智能全球最具影響力學(xué)者(200名)和提名學(xué)者(1800名)分布于全球不同高校和學(xué)術(shù)機(jī)構(gòu),美國(guó)有1128人次,中國(guó)171人次,歐盟有307人次上榜。
發(fā)布會(huì)上,清華大學(xué)人工智能研究院院長(zhǎng)、中國(guó)科學(xué)院張鈸院士做了熱情洋溢的報(bào)告和精彩點(diǎn)評(píng)發(fā)言。
人工智能研究必須國(guó)際化
基礎(chǔ)研究,尤其是人工智能領(lǐng)域的基礎(chǔ)研究必須國(guó)際化,因?yàn)橹挥邪讶澜绲难芯咳藛T共同團(tuán)結(jié)起來(lái)、利用起來(lái),才能夠引領(lǐng)基礎(chǔ)研究的發(fā)展。為什么目前人工智能領(lǐng)域大多由美國(guó)來(lái)引領(lǐng),就是因?yàn)槊绹?guó)把全世界最優(yōu)秀的人才利用了起來(lái)。
中國(guó)要想在基礎(chǔ)研究上引領(lǐng)世界,必須走國(guó)際化道路。今天有很多外國(guó)留學(xué)生來(lái)華求學(xué),這是一個(gè)好事兒,但我們還可以做一定平衡調(diào)整,吸引更廣泛國(guó)家地區(qū)的優(yōu)秀學(xué)生來(lái)華學(xué)習(xí)。
把數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)結(jié)合起來(lái)
人工智能的四大基礎(chǔ)是:知識(shí)、數(shù)據(jù)、算法和算力,回顧歷史,這四個(gè)因素都在不斷地發(fā)揮作用。第一代人工智能也叫符號(hào)人工智能,比較強(qiáng)調(diào)知識(shí)對(duì)智能的作用,因?yàn)槟菚r(shí)算法和算力都還沒(méi)有跟上。
進(jìn)入新世紀(jì)后,深度學(xué)習(xí)把大家的目標(biāo)凝聚到了數(shù)據(jù)上,這時(shí)大數(shù)據(jù)的出現(xiàn),再加上很好的算法,就形成了基于概念的深度學(xué)習(xí),再加上云計(jì)算等手段,使以數(shù)據(jù)為基礎(chǔ)的連接主義模型得到了極大推廣和應(yīng)用。
數(shù)據(jù)主義喊了許多口號(hào),導(dǎo)致了我們今天遇到一些困難,按照大數(shù)據(jù)建起來(lái)人工智能系統(tǒng)似乎不可信、不可靠、不安全、不易推廣,這都是目前用深度學(xué)習(xí)進(jìn)行人工智能研究帶來(lái)的問(wèn)題,也可以說(shuō)是大數(shù)據(jù)遇到的挑戰(zhàn)。怎么來(lái)解決這個(gè)挑戰(zhàn)呢?唯一的辦法,就是重新引入知識(shí),把數(shù)據(jù)驅(qū)動(dòng)和知識(shí)驅(qū)動(dòng)結(jié)合起來(lái),達(dá)成可信安全的第三代人工智能。
常識(shí)往往不在數(shù)據(jù)里
自然語(yǔ)言理解是人工智能領(lǐng)域最核心的問(wèn)題。不管做機(jī)器翻譯也好,做自然語(yǔ)言應(yīng)用也好,都試圖通過(guò)分析符號(hào)序列來(lái)理解相關(guān)內(nèi)容,這是第一代人工智能所謂符號(hào)主義的核心做法。到了第二代人工智能,又走上深度學(xué)習(xí)的道路,這條路充滿希望,但又非常危險(xiǎn),因?yàn)榻鉀Q不了可信安全的問(wèn)題。
機(jī)器翻譯現(xiàn)在只能翻譯不重要的東西,因?yàn)榉e(cuò)了也沒(méi)有關(guān)系,真正重要的場(chǎng)合還需要人力同聲翻譯。機(jī)器最大的問(wèn)題,就在于它缺乏常識(shí),根本不知道自己不知道,這是一個(gè)很大的問(wèn)題。知識(shí)包含兩方面,一是我知道什么,二是我不知道什么。一個(gè)有學(xué)問(wèn)的人,不僅僅表現(xiàn)在他知道的多,更表現(xiàn)在他清楚自己不知道的更多。那些狂妄自大的人,都是沒(méi)有學(xué)問(wèn)的人,不知道自己能吃幾碗干飯,機(jī)器翻譯也是這個(gè)問(wèn)題。給機(jī)器任何句子,它都能翻,根本不懂也能瞎翻。
所以常識(shí)是必要的,簡(jiǎn)單翻譯幾句話也需要大量嘗試積淀,“說(shuō)你行,不行也行”,機(jī)器沒(méi)有常識(shí),就很難理解這句話,人反而覺(jué)得很簡(jiǎn)單,這就是常識(shí)的重要性。但常識(shí)庫(kù)的建立非常之難,現(xiàn)在沒(méi)法從數(shù)據(jù)中去建立常識(shí)庫(kù),因?yàn)槌WR(shí)往往不表示在數(shù)據(jù)之中。
建立常識(shí),必須下功夫去做,只有這個(gè)問(wèn)題解決了,自然語(yǔ)言的理解才能達(dá)到目標(biāo)。而自然語(yǔ)言理解,則是第三代人工智能的終極目標(biāo),這是一個(gè)艱巨的任務(wù)。如果這個(gè)問(wèn)題解決了,人工智能的其他問(wèn)題將會(huì)迎刃而解。
聯(lián)系客服