【精彩內(nèi)容回放】
胡郁:今晚我所有的發(fā)言都用語音輸入。
今天的分享主要包括三個方面的內(nèi)容。
一、國內(nèi)外人工智能研究進展
首先我們來看現(xiàn)在國際上人工智能研究處于什么狀態(tài)。
美國政府在過去的十年投了38億美金用于人類基因測序,這是一個生物科技和信息科技交叉的學(xué)科,在過去的十年中帶來了八千億美金的回報。
在完成這個自然科學(xué)方面的重大創(chuàng)新以后,美國政府和歐洲也在考慮對人腦進行更深入的研究。最近,美國政府啟動了為期十年的人腦圖譜計劃,投資高達40億美金。而歐洲政府也啟動了新一輪的人腦模擬計算計劃。
這些新的計劃都為人類最終了解大腦打開了一個新的、自然科學(xué)的切入點。這里得到的一些知識,也必將對計算機領(lǐng)域的人工智能產(chǎn)生影響。
除了政府機構(gòu)以外,國際各大信息產(chǎn)業(yè)巨頭也提出了自己的人工智能計劃和產(chǎn)品。
相信很多大家都已經(jīng)知道了,包括IBM的Watson,Google的GoogleNow,蘋果的Siri,但是這些人工智能都是對真正人類智能的簡單模仿,離真正實現(xiàn)人的智能還有很大的距離。
國際上對人工智能高端人才的爭奪非常激烈,谷歌花四千多萬美金邀請國際人工智能方面的專家Geoffrey Hinton,F(xiàn)ACEBOOK邀請了因發(fā)明圖像識別方面的神經(jīng)網(wǎng)絡(luò)架構(gòu)而著名的Yann Lecun。前段時間,百度也宣布任命吳恩達博士為百度首席科學(xué)家,負(fù)責(zé)百度大腦計劃。
IBM也沒有閑著,于近期推出了一個叫做“真北”的人工智能芯片,這個芯片是完全模擬人腦的結(jié)構(gòu)設(shè)計的,號稱在同樣的計算能力下,計算的能耗要比傳統(tǒng)的芯片低兩個數(shù)量級以上。
因此,最近國際上在人工智能領(lǐng)域爆發(fā)出來的熱度不是沒有道理的,是多個方面聯(lián)合作用的結(jié)果??茖W(xué)界和工業(yè)界都覺得,人工智能也許可以在計算機性能不斷提升,數(shù)據(jù)量不斷增大的情況下在短期內(nèi)突破。
大家都在做“人工智能”,那么大家做的人工智能是不是都是一樣的呢?我們訊飛要做的人工智能又是從哪個角度來做的呢?
下面我們就來進入第二部分。看看訊飛是如何讓計算機從“能聽會說”,到“能理解會思考”的。
二、訊飛超腦計劃
首先我們來看看這張圖。
我們認(rèn)為機器能夠?qū)崿F(xiàn)的人工智能應(yīng)該能夠從幾個角度去看。
1、計算智能,即快速計算和記憶存儲能力。原來IBM的深藍計算機就是利用其超強的計算和存儲能力戰(zhàn)勝了當(dāng)時的國際象棋大師卡斯帕羅夫,這就屬于計算智能。
2、感知智能,即視覺、聽覺、觸覺等感知能力。人和動物都具備,能夠通過各種智能感知能力與自然界進行交互。自動駕駛汽車,就是通過激光雷達等感知設(shè)備和人工智能算法,實現(xiàn)這樣的感知智能的。
3、認(rèn)知智能。通俗講是“能理解會思考”。人類有語言,才有概念,才有推理,所以概念、意識、觀念等都是人類認(rèn)知智能的表現(xiàn),這也使人類能夠明顯區(qū)別于動物。
計算智能就是利用機器強大的計算能力和存儲能力。如果大家看過一個節(jié)目叫做《最強大腦》的話,你們就會發(fā)現(xiàn)那里面用來測試人能力的方法,比如要記住一百個四位數(shù)字組合之類,這對計算機來說易如反掌。
象棋機器人能夠戰(zhàn)勝人類,就是要靠記的棋譜比較多,能夠預(yù)測到十幾步以后的結(jié)果,現(xiàn)在計算智能的這個問題已經(jīng)解決的差不多了。
感知智能是最近幾十年我們在語音識別和圖像識別方面一直在解決的問題。
最形象的一個人工智能的項目就是自動駕駛汽車,不需要了解各種知識,只需要用各種傳感器對周圍的環(huán)境進行處理、自動控制就可以實現(xiàn)自動駕駛。
我們經(jīng)常說到的語音識別,就是把語音這種信息轉(zhuǎn)化為另外一種符號的組合,我們并不真正理解這些句子中的含義,應(yīng)該說,語音智能處理,包括識別,是感知智能中非常難的問題。
其實,人類智能中最難的就是認(rèn)知智能。在計算機領(lǐng)域中,評價機器是不是真正和人一樣智能的測試叫“圖靈測試”,而“圖靈測試”測的就是認(rèn)知智能,
這幾年因為人工神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,圖像識別問題和語音識別問題,初步得到解決,所以,大家現(xiàn)在可以看到采用以上技術(shù)的應(yīng)用已較為普遍。但是目前這些都還屬于感知智能的范疇。
那么如果要實現(xiàn)認(rèn)知智能的突破,需要解決哪些問題呢?
大家其實可以想一想,人類的知識主要還是通過自然語言獲取,當(dāng)然這里面還要配合很多的圖片、聲音和錄像。
因此,要實現(xiàn)人工智能在認(rèn)知智能領(lǐng)域的突破,就必須把人類知識的表達問題給解決,首先要解決的是自然語言理解的問題。
如果對比認(rèn)知智能和感知智能的區(qū)別,我們可以看到,感知智能對于數(shù)據(jù)來說只需要用一個數(shù)學(xué)統(tǒng)計模型得出最后的感知結(jié)果就可以了。但是對于認(rèn)知智能來說,必須能夠把里面的知識表達結(jié)構(gòu)描述清楚。
在過去的幾十年中在人工智能領(lǐng)域,對認(rèn)知智能的突破一直沒有停止過。但是早期都是希望能夠通過規(guī)則,或者是簡單數(shù)據(jù)統(tǒng)計的方法來解決。這些方法到現(xiàn)在為止已經(jīng)取得了一些成績,比如IBM的Watson系統(tǒng)。
但是大家覺得可能現(xiàn)在還有更好的方法。
我們先來看看人的大腦是怎么運作的。
通過“人類大腦圖譜計劃”,我們現(xiàn)在已經(jīng)認(rèn)識到人腦的神經(jīng)元的數(shù)量非常多。
所以很多的科學(xué)家在想,也許如果我們能夠用計算機模擬到人腦的神經(jīng)元數(shù)量系統(tǒng)建立人工神經(jīng)網(wǎng)絡(luò),這樣我們就可以模仿人腦的認(rèn)知智能做最復(fù)雜的運算。
在這種情況下,我們利用人工神經(jīng)網(wǎng)絡(luò)最新的進展向人工智能最高的目標(biāo)——認(rèn)知智能發(fā)起挑戰(zhàn)。
現(xiàn)在,我們就一起來看“訊飛超腦計劃”的內(nèi)涵,也就是這個計劃最核心的部分。
我們希望能夠建立一個和人腦規(guī)模差不多大小的人工神經(jīng)網(wǎng)絡(luò),并且利用這個人工神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對人類認(rèn)知,知識表達,邏輯推理等方面的模擬和學(xué)習(xí),從而最終突破人類認(rèn)知智能的挑戰(zhàn)。
現(xiàn)在人人都說要做人工智能,但是解決人工智能問題最重要的三個方向我覺得要講清楚。
第一個問題:你想解決什么樣的人工智能?
只有真正瞄準(zhǔn)“認(rèn)知智能”這個方向去解決的才是當(dāng)前人工智能的最大挑戰(zhàn)。
第二個問題:你打算采用什么樣的方法去解決認(rèn)知智能的挑戰(zhàn)?
我剛才說過采用傳統(tǒng)的規(guī)則的方法,或者是數(shù)據(jù)統(tǒng)計的方法,或者是搜索的方法。這些在過去的幾十年中已經(jīng)都嘗試過了。采用人工神經(jīng)網(wǎng)絡(luò)并且采用類腦神經(jīng)元結(jié)構(gòu)去增強,是當(dāng)前最有前途的途徑之一。
第三個問題:這樣的人工智能系統(tǒng)做出來后可以應(yīng)用在什么地方?
我們都知道工業(yè)機器人解決了部分的體力勞動,而“訊飛超腦”這樣的認(rèn)知智能系統(tǒng)就是為了解決簡單的腦力勞動。
如果這三個問題不仔細地進行闡述,就籠統(tǒng)地概括自己做的工作是研究人工智能,我覺得那是不夠深入和系統(tǒng)的。
訊飛的目標(biāo)就是要實現(xiàn)一個真正的中文的認(rèn)知智能計算引擎。最后我們還希望這個人工智能引擎的知識不是我們硬灌輸?shù)模撬约和ㄟ^自我不斷學(xué)習(xí)獲得的。
在進行訊飛超腦的過程中,我覺得還有一個問題需要闡述清楚。
即,為什么我們能做這樣的事情?
首先,我們做語音識別研究取得的人工神經(jīng)網(wǎng)絡(luò)方面的經(jīng)驗是一個非常大的優(yōu)勢。現(xiàn)在國內(nèi)在做人工神經(jīng)網(wǎng)絡(luò)方面很少能夠有我們這樣多的專家團隊。
另外,我們在知識表達的相關(guān)語音和文本方面有著非常雄厚的積累。現(xiàn)在我作為863重點項目類人答題系統(tǒng)的首席科學(xué)家,帶領(lǐng)全國三十多個單位的頂級專家在進行一項工作,要實現(xiàn)一個能夠自動學(xué)習(xí)中學(xué)課本知識的機器人系統(tǒng)去參加2018年的高考,并且可以考上一本。
在攻克認(rèn)知智能的過程中,我們準(zhǔn)備了兩套方案:一套是采用類人神經(jīng)結(jié)構(gòu)的模擬方案,但是風(fēng)險較大。另外一套方案是傳統(tǒng)規(guī)則統(tǒng)計加神經(jīng)網(wǎng)絡(luò)結(jié)合,風(fēng)險比較低。
最后,我們在人工智能方面取得的各種成果能夠在我們的研究過程中不斷地和各方面的業(yè)務(wù)緊密對接。我想這也是非常重要的。
執(zhí)行訊飛超腦計劃的研究組、實驗室建設(shè)現(xiàn)在進展非常順利,包括長期以來和我們共同在語音識別領(lǐng)域做出突出成果的江輝教授、國內(nèi)在自然語言處理方面最強大的團隊——哈工大劉挺教授的團隊,都將在豐富經(jīng)驗的基礎(chǔ)上,合作進行新的研究嘗試。
說到訊飛超腦的系統(tǒng),大家一定對訊飛超腦采用什么樣的硬件架構(gòu)組織非常感興趣。
我們在神經(jīng)網(wǎng)絡(luò)訓(xùn)練方面,因為做語音識別已經(jīng)有非常豐厚的積累。這方面我們研究院和公司平嵌事業(yè)部形成的聯(lián)合開發(fā)組,已經(jīng)打了一個很好的基礎(chǔ)。
正如人腦一樣,人腦不僅有認(rèn)知智能的功能,在感知智能和計算智能方面也是疊加的。
從廣義上來講,“訊飛超腦計劃”的外延也包括了計算智能和感知智能的疊加。這也意味著我們將來在圖像識別甚至運動識別方面也會采用類似的技術(shù)路線不斷地進行延伸,把它作為“訊飛超腦計劃”外延的重要組成內(nèi)容。
最后,想跟大家分享,如果“訊飛超腦計劃”取得突破,我們能夠在哪些方面與應(yīng)用進行最快的結(jié)合。
我想最重要的是萬變不離其宗,“訊飛超腦計劃”是訊飛向人工智能領(lǐng)域深度進發(fā)的一個非常重要的風(fēng)向標(biāo),它一定是符合訊飛自身需求并且和訊飛現(xiàn)在業(yè)務(wù)發(fā)展能夠緊密配合的。
最后我想說的是,訊飛一定要把訊飛超腦想清楚、講清楚、做清楚、用清楚,讓它真正代表中國人工智能的水平。
聯(lián)系客服