□文/余 凱
過去60年的大部分時間,人工智能一直基于規(guī)則的系統(tǒng)進行發(fā)展。從上世紀80年代末以來數(shù)據(jù)驅(qū)動的人工智能成為主流,一旦將數(shù)據(jù)導(dǎo)入機器,機器就可通過消化和吸收生成對世界認知的模型。而未來,所有設(shè)備最終都將成為廣義的機器人,可以進行感知、理解、決策。這將為人類發(fā)展提供更多可能性。人工智能的偉大之處不在于讓機器更偉大,而在于開發(fā)智能機器來輔助人,讓每個平凡的人變得更偉大。
1956年,人工智能(artificial intelligence)這個詞匯誕生于Dartmouth會議,參會學者提出了非常有遠見的思考,如何讓機器仿真實現(xiàn)智能。當然,這樣的思想,更早甚至可以追溯到十七世紀末的哲學家、數(shù)學家萊布尼茨,他最早提出通過數(shù)學演算來模擬智能。參加Dartmouth會議的先賢們雖然有遠見,但有些過分樂觀,他們認為人工智能的基本問題可以在一個夏天解決,但是這些問題至今也沒有完全解決。
人工智能首先應(yīng)具有感知的能力,通過傳感器能夠感知到環(huán)境的變化;其次是理解力,從感知階段上升到對世界的理解;第三是決策能力,通過理解之后做出決策。
人工智能最簡單的形式是通過觀測到的現(xiàn)象、數(shù)據(jù)、知識,映射成預(yù)測、判斷。例如,輸入圖像輸出“物體”的名字的映射,就是圖像識別;輸入語音訊號輸出“文本序列”,就是語音識別;輸入一段話輸出“解析的樹狀結(jié)構(gòu)”,就是云儲;輸入車輛行使周邊路況情況輸出“控制決策”,就是自動駕駛。
過去基于規(guī)則的人工智能系統(tǒng),多以演繹的方式來建立系統(tǒng),其概念類似“一生二,二生三,三生萬物”。從一個基本法則出發(fā),推導(dǎo)出一個紛繁復(fù)雜的系統(tǒng)。這種方法主要受自然科學的方法論的影響,通常從不言自明的公理出發(fā),但從這一思維出發(fā)所得到的人工智能系統(tǒng),常常會過于簡單。
傳統(tǒng)基于規(guī)則的人工智能系統(tǒng),沒有取得積極的成果,但卻得到了很多教訓。其一是這個世界是紛繁的,存在著很多因素和要素,彼此之間有復(fù)雜的影響,形成復(fù)雜的網(wǎng)絡(luò)和系統(tǒng),難以用一個公式來描述;其二是有很多因素和參量不能觀測到,所以系統(tǒng)具備不確定性;如果用確定性的規(guī)則,無法掌握這樣的復(fù)雜系統(tǒng),要采用基于統(tǒng)計的概念;其三是現(xiàn)實世界紛繁復(fù)雜很難完整描述,只有從數(shù)據(jù)中不斷地學習、加深對問題的理解,同時跟隨數(shù)據(jù)的演化和進化,才是關(guān)鍵。這也是“大數(shù)據(jù)”的重要意義,數(shù)據(jù)在本質(zhì)上,為人提供了了解世界的可能。
如果說2000年以來,由于互聯(lián)網(wǎng)帶來的數(shù)據(jù)極大豐富,人工智能在搜索、推薦、廣告等互聯(lián)網(wǎng)的應(yīng)用上扮演了關(guān)鍵角色,人工智能處于“潤物細無聲”的萌芽期。那么在2010年以來,人工智能所處的階段,筆者稱之為“于無聲處聽驚雷”的發(fā)展階段,因為我們還是能隱約聽到“轟隆隆的雷聲”。人類一直在思考,是否可以通過技術(shù)的手段復(fù)制人類非凡的大腦和智力,這也是人工智能令人著迷之處?;仡櫺畔⒓夹g(shù)的發(fā)展歷程,從信息理論到圖靈測試、通信技術(shù)發(fā)展、計算機信息科學等發(fā)展都是為了一個結(jié)果,即通過計算讓機器具有智能。
現(xiàn)在提到人工智能,一個頗具浪漫主義的觀點認為,“強人工智能”擁有跟人一樣的智能,有強大的學習能力。偉大科學家圖靈的圖靈測試,提出如果人類分辨不出幕布背后是機器人還是人,其幕布背后的機器就具有“強人工智能”。今天的“人工智能”離真正意義上的“強人工智能”還差得很遠。另一種觀點認為,機器人具備部分的人工智能,我們稱之為“弱人工智能”,它在某個不確定的環(huán)境下,完成某類特定任務(wù)。
對人工智能,大家也常常有哲學思辨的熱情。曾經(jīng)有一個叫做“思想實驗”的例子:如果一個房間里關(guān)著一個不懂中文的英國人,但是在房間的桌子上有一本中文書需要他來進行認知。而這時從門外遞進一張英文說明,需要他按照說明查閱書里內(nèi)容后寫出一份中文翻譯,結(jié)果是他寫出來了。這看起來很智能,但是這個英國人并不懂中文,他寫出翻譯的表象行為是否是他的智能呢?其實行為方面表現(xiàn)的智能,并不是真正的智能。有一種解釋是這個英國人不懂中文,所以體現(xiàn)不出他的智能,但是“英國人+書+房間”,這個系統(tǒng)是智能的。
在紛繁復(fù)雜的世界里,為解釋人和世界的關(guān)系,孔子提出了“仁”,宗教提出了“彼岸世界”,互聯(lián)網(wǎng)提出了“人和世界的連接”。人和世界的連接包括人和信息、人和商品、人和人、人和服務(wù)的連接,這也催生了一系列行業(yè)機會,創(chuàng)造了巨大的社會價值?;ヂ?lián)網(wǎng)帶來的重要啟示,就是高效連接非常重要。
網(wǎng)絡(luò)索引的趨勢是從無序到有序,讓無結(jié)構(gòu)化的信息變得有序,更加方便人們獲取信息;從數(shù)據(jù)到語義,方便人們了解數(shù)據(jù)背后的內(nèi)容;從線下到線上,檢索虛擬信息、商品信息、線下服務(wù)信息。
搜索引擎就是一個人工智能系統(tǒng),因為它有一個非常精致的結(jié)構(gòu):其擁有感知能力,借助免費服務(wù),用戶都在為搜索引擎提供數(shù)據(jù),真實的信息也因此在不斷分層,即外顯信息(在社交上曬出的)、部分信息(在特定地方分享)、隱私信息?;ヂ?lián)網(wǎng)最精巧的商業(yè)模式之一,就是拿著用戶信息實現(xiàn)商業(yè)價值。正因為對用戶的了解足夠正確,就可以推出符合用戶當下的廣告或商品,這就是一個強大的基于大數(shù)據(jù)的人工智能系統(tǒng)。
一切的連接都需要通過媒介,互聯(lián)網(wǎng)通過個人電腦、手機、智能硬件等延展人的能力,使人和世界的連接更加緊密。通過大數(shù)據(jù)的支撐,人可以用自然的方式和機器交互,而機器可以更好地索引世界。未來交互的終極形態(tài)將是“心靈感應(yīng)”和“腦機交互”。
所有這些,都與機器的進化息息相關(guān),即從個人電腦到智能手機,再分化出智能硬件,最后的趨勢是發(fā)展出“智能助手”,類似人的助理幫助人完成任何事情。未來通過無處不在的傳感器和強大的計算能力,人和機器將完全融為一體,機器將變成在計算機控制下,具有自主行為的機器,它完全懂得人的想法,并能夠自主完成人們想做的事。
機器變聰明后其在很多方面將超越人類。如對機器而言,學習將是一瞬間可完成的事,只需通過光纖網(wǎng)絡(luò)傳輸。而人要學習知識則需要通過語言、交流以及很長的時間記憶,才能真正地理解。機器卻能在極短的時間內(nèi)復(fù)制知識、交流知識,其對人類將可能產(chǎn)生威脅。而規(guī)避這個威脅的方式,是在交互上取得突破性進展,使人和機器的交互變成零距離。這樣,人也可以具有機器的能力,例如將小型芯片植入人體內(nèi)。
余凱 地平線機器人科技創(chuàng)始人、CEO
目前人工智能面臨的問題是,如何從數(shù)據(jù)中學習映射函數(shù),形成訓練樣本。例如將多個圖片定義為“長頸鹿”這個標簽,系統(tǒng)通過訓練學習,然后自動再將類似新圖片打上這個標簽。
從有限推導(dǎo)無限是不可能的,除非設(shè)定了假設(shè),如果沒有假設(shè)就無法做出判斷?!敖煺叱啵吆凇本吞N涵了一個樸素的智慧,即在判斷的時候一定要隱含假設(shè):兩個在某些方面相似的人,在其它方面具有相似的特征和特性。
這就反映人工智能的本質(zhì)問題,即假設(shè)的合理性。人們希望從數(shù)據(jù)得出的結(jié)論是簡單的、光滑的,而不是復(fù)雜的。所以哲學上有一個詞匯——剃刀原理,它指在能夠同時解釋某個現(xiàn)象的幾條規(guī)律中,我們喜歡選擇其中最簡單的規(guī)律??偠灾?,我們希望能夠找到一個規(guī)律,既能找到觀測樣本,又能得出簡單的結(jié)果。
從紛繁復(fù)雜的樣本中抽取并總結(jié)規(guī)律的最好機制,就是人類的大腦。它能夠舉一反三、不斷地學習。在學習中,最簡單的單元就是神經(jīng)元,它有很多神經(jīng)簇,這些神經(jīng)簇和其它的神經(jīng)元相連,神經(jīng)元接收到外部的信息輸入后,把對信息信號的反應(yīng)通過神經(jīng)末梢傳到其它神經(jīng)元,這個構(gòu)造可以用感知機模型這個簡單的數(shù)學公式描述?;趩蝹€神經(jīng)元構(gòu)造具有學習能力的人工智能系統(tǒng),像神經(jīng)元一樣,從外界獲得輸入后,傳遞到中央處理的地方,通過簡單的運算再向外輸出。
今天,這個簡單的模型正向幾個維度擴展,其將從線性的輸入/輸出,發(fā)展到深度神經(jīng)網(wǎng)絡(luò),最后形成具備學習功能的人工智能系統(tǒng)。
模擬人類大腦的分層結(jié)構(gòu)以及行為
今天已經(jīng)發(fā)現(xiàn)了基于視覺的神經(jīng)網(wǎng)絡(luò)(科學家在研究過程中受到了大腦內(nèi)視覺信息分層表述的啟發(fā)。隨著視覺輸入流從視網(wǎng)膜傳輸?shù)匠跫壱暺樱俚较嘛D葉皮質(zhì),在識別物體前,每層都會進行處理,從而準確地識別物體)。因此,可以用數(shù)據(jù)訓練系統(tǒng),讓系統(tǒng)能夠反映出視覺神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和行為。為了模擬這一過程,神經(jīng)網(wǎng)絡(luò)的設(shè)計者們在模型中設(shè)計了幾層計算。剛開始,最底層的神經(jīng)元對顏色不敏感,對邊界和朝向敏感,它能復(fù)原出物體的輪廓,把輪廓提取出來;上面一層的神經(jīng)元具備一些更有意思的行為,對物體的部位很敏感;更高一層的神經(jīng)元對物體開始敏感,它是一個逐層的、從局部到整體的敏感過程。這就是從數(shù)據(jù)開始呈現(xiàn)的視覺網(wǎng)絡(luò)行為。
在聽覺神經(jīng)系統(tǒng)中也有類似現(xiàn)象,我們用數(shù)據(jù)的深度訓練也得到類似的結(jié)果。
深度學習特別適合大數(shù)據(jù)
過去的模型和方法對大數(shù)據(jù)的處理存在許多問題,通常衡量一個模型的優(yōu)劣是用推廣誤差進行測試。通過推廣誤差找到原因并得到控制,從而找到一個更好的學習辦法。推廣誤差來自于以下幾方面:
其一是對模型進行假設(shè),但模型假設(shè)會存在誤差。在概率統(tǒng)計學中有一個著名的說法:你所有的模型都是錯的,但有些模型是有用的;
其二是數(shù)據(jù)的不完美,因為樣本有限、或有噪聲、或有偏差。這幾種情況都會帶來誤差,因為典型的統(tǒng)計學范疇忽略了一點,即假設(shè)了無限的計算資源;
其三是計算機完成的實際問題也會導(dǎo)致計算的不完美,會導(dǎo)致誤差。所以要盡量讓假設(shè)完美、讓假設(shè)足夠?qū)挿?、收集大量的?shù)據(jù)并尋求算法處理大數(shù)據(jù)。
傳統(tǒng)人工智能算法不能處理更大規(guī)模的數(shù)據(jù),因為如果算法的復(fù)雜性和樣本是立方的關(guān)系,當計算機設(shè)備數(shù)量和樣本成同比立方增長時,將意味著數(shù)據(jù)增加算法更難,這就是為什么深度學習應(yīng)該受到重視,它特別適應(yīng)于大數(shù)據(jù),數(shù)據(jù)越大,算法越好。
深度學習是一套靈活的建模語言
寫出一篇好文章和做出一個好的人工智能系統(tǒng)是相通的,即對語言有足夠靈活的駕御能力、需要對所面臨的生活和問題有深刻的感悟和思考,靈活的建模語言和內(nèi)在洞察相結(jié)合,才能夠做好。
深度學習是歷史上第一次出現(xiàn)的端到端學習,不管是語音識別還是從感知、預(yù)處理到預(yù)測、判斷,過去絕大部分的工作是做最后一個部分,而沒有完成前面的幾個動作。從計算上來講,在沒有深度學習之前,上面幾個步驟是消耗計算資源的、人工手動的,但深度學習是一氣呵成的,減少人工手動。這個變化是革命性的,今天這已經(jīng)成為共識了。
人類大腦是通用處理器嗎?人從猴子到現(xiàn)在的人類,人之所以能夠從物種中脫穎而出,是因為大腦對人類所需要的特殊能力在不斷進行優(yōu)化。從本質(zhì)上說,大腦是專用處理器,并非通用處理器。
大腦的計算過程較慢,但是人腦對諸如開車、打乒乓球等行為進行了加速處理,從結(jié)構(gòu)上做了專門的優(yōu)化。
圖2 深度學習特別適合大數(shù)據(jù)
人工智能大規(guī)模的應(yīng)用,伴隨著互聯(lián)網(wǎng)的發(fā)展。
2000年-2009年,是人工智能重新起步的發(fā)展階段,其最大的應(yīng)用在于PC互聯(lián)網(wǎng)領(lǐng)域,如搜索、廣告等。
2010年-2019年,語音、圖像、機器人操作,將獲得突飛猛進的發(fā)展。同時,傳統(tǒng)行業(yè)不斷地被顛覆,這是一個“于無聲處聽驚雷”的時代。
2020年-2029年將是一個“陽光燦爛”的時代。交互將無處不在,人與機器的操作距離越來越短,生產(chǎn)線的工人將會被替代。簡單、重復(fù)性的工作將被解放,從萬物互聯(lián)到萬物智能,數(shù)據(jù)將成為商品。但我們也無需對機器有太多的擔心,2029年的機器仍是沒有好奇心、沒有情感、沒有自我意識的。
筆者認為,智能不等于智慧。在未來,從萬物互聯(lián)到萬物智能將有幾大趨勢,即所有設(shè)備都有智能傳感器;所有設(shè)備都與云端結(jié)合;所有設(shè)備都連接人和服務(wù);所有設(shè)備最終都成為廣義的機器人,可以進行感知、理解和決策。
(經(jīng)余凱本人審閱,根據(jù)近期公開發(fā)言整理)
聯(lián)系客服