作為第四范式首席科學(xué)家、范式大學(xué)的導(dǎo)師,楊強教授近日在第四范式公司內(nèi)部進行了一場主題為“人工智能的下一個三年”的培訓(xùn),深入淺出地分享了自己在人工智能產(chǎn)業(yè)推廣上的經(jīng)驗,并預(yù)判了人工智能即將爆發(fā)的技術(shù)風(fēng)口與商業(yè)風(fēng)口。此前,楊強教授與第四范式曾提出人工智能的五個必要條件,為人工智能行業(yè)提供了權(quán)威的準(zhǔn)入標(biāo)準(zhǔn)。
作者:楊強
作為第四范式首席科學(xué)家、范式大學(xué)的導(dǎo)師,楊強教授近日在第四范式公司內(nèi)部進行了一場主題為“人工智能的下一個三年”的培訓(xùn),深入淺出地分享了自己在人工智能產(chǎn)業(yè)推廣上的經(jīng)驗,并預(yù)判了人工智能即將爆發(fā)的技術(shù)風(fēng)口與商業(yè)風(fēng)口。此前,楊強教授與第四范式曾提出人工智能的五個必要條件,為人工智能行業(yè)提供了權(quán)威的準(zhǔn)入標(biāo)準(zhǔn)。
以下內(nèi)容根據(jù)楊強教授主題演講編寫,略微有所刪減。
大家記得在2016年3月,AlphaGo橫空出世對戰(zhàn)李世乭,這對于人工智能的社會影響非常大。這里,我們問一下:AlphaGo到底為我們帶來了什么?
在AlphaGo的搜索中,Deepmind團隊引入了一個新概念——即用深度學(xué)習(xí)和強化學(xué)習(xí)的結(jié)合來做兩種任務(wù)的判別,即來判別現(xiàn)在所在的棋盤是好是壞,同時來預(yù)測未來有利的走向。講到這里大家應(yīng)該能看出AlphaGo的算法和未來商業(yè)模式的關(guān)聯(lián),即:通過對大數(shù)據(jù)的分析,讓我們對“現(xiàn)在狀態(tài)”有了一個靠譜的理解;這個狀態(tài)可以是棋盤、可以是足球運動中兩隊交鋒的狀態(tài),也可以是當(dāng)前營銷的一個狀態(tài)。同時,下圍棋中的一步,可以理解成對未來走向的預(yù)判,在商業(yè)活動中,這可以是營銷活動中的下一步。這里很重要的一點,是區(qū)分我們商業(yè)行為中的兩個任務(wù),即對現(xiàn)實的判斷和對商業(yè)未來走向的預(yù)估。這兩個任務(wù)同樣重要,也同樣都需要大數(shù)據(jù)的支持。 因為圍棋是一個封閉式的游戲(即沒有外界因素的干擾),為了得到更多的數(shù)據(jù),AlphaGo也引入了自我博弈。所謂自我博弈就是自己玩游戲,你會得到不斷的反饋,然后來更新自己的策略,經(jīng)過無數(shù)次這樣的比賽,最后會得到一個好的策略,你的最終輸出是一個行為的策略。所以AlphaGo 也告訴我們,在一個封閉場景中,可以用自我博弈的模擬方法得到更多的數(shù)據(jù)。
從AlphaGo到人工智能的應(yīng)用流程
我們?nèi)绻刂聡宓牟襟E走,就要面對這些問題:你的人工智能算法的目標(biāo)是什么?有沒有數(shù)據(jù)?數(shù)據(jù)在哪里?問題的邊界是否清晰?什么叫合理的走法、什么叫犯規(guī)的走法?你的特征在哪里?又如何得到這些特征?是否可以得到一個持續(xù)的反饋?這樣的一個流程是AlphaGo設(shè)計團隊所走過的路。不妨把這些步驟記下來,變成一個workflow,看看其他的領(lǐng)域是不是可以重復(fù)AlphaGo的成功。 比如,如果用AlphaGo治療癌癥,如何治療呢?治療癌癥一般是用放射性來殺掉癌細胞,而每一個癌癥患者需要的劑量、角度、頻次可能都不一樣,如果能把所有的這些信息都記錄下來,再記錄治療結(jié)果,因為結(jié)果不是馬上就知道的,而是經(jīng)過一段時間才知道,這樣就有了數(shù)據(jù)、有了特征、有了問題持續(xù)的反饋,并且有了非常清楚的目標(biāo),即在副作用最小的情況下殺死癌細胞。并且這個workflow是可以重復(fù)的。
AI的發(fā)展歷史還有前30年,這些年的積累也很有用
剛剛我們說了AlphaGo的一路歷程,但我們對人工智能的理解不應(yīng)該片面地認為人工智能就是機器學(xué)習(xí)。人工智能的發(fā)展歷史還有前30年,前30年是從50年代中一直發(fā)展到80年代中。這30年AI是在干什么呢?是在做人工輸入的規(guī)則型的知識表達研究,以及基于這些規(guī)則的符號空間的推理和搜索。我認為,這個人工規(guī)則型的知識表達在AI的應(yīng)用當(dāng)中也是必不可少的,因為在眾多領(lǐng)域當(dāng)中還會碰到冷啟動的問題,以及如何規(guī)范一個領(lǐng)域的邊界的問題。這就是說,邏輯推理,邏輯知識表達,以及在符號空間的搜索的人工智能這個分支,在今后幾年會和統(tǒng)計學(xué)習(xí)相結(jié)合,會大有發(fā)展。 這種發(fā)展會也涉及技術(shù)和商業(yè)兩個層面。
二、AI的技術(shù)風(fēng)口在哪?
我們大家會關(guān)心的一個問題, 是人工智能的技術(shù)在哪些方向可能會有大的突破。
深度學(xué)習(xí)
首先,是深度學(xué)習(xí)會繼續(xù)發(fā)展。這里的發(fā)展不僅是在層次的增加,還包括深度學(xué)習(xí)的可解釋性、以及對深度學(xué)習(xí)所獲的的結(jié)論的自我因果表達。例如,如何把非結(jié)構(gòu)化的數(shù)據(jù)作為原始數(shù)據(jù),訓(xùn)練出一個統(tǒng)計模型,再把這個模型變成某種知識的表達——這是一種表示學(xué)習(xí)。這種技術(shù)對于非結(jié)構(gòu)化數(shù)據(jù),尤其對于自然語言里面的知識學(xué)習(xí),是很有幫助的。另外,深度學(xué)習(xí)模型的結(jié)構(gòu)設(shè)計是深度學(xué)習(xí)的一個難點。這些結(jié)構(gòu)在今天都是非常需要由人來設(shè)計的。還有一個研究問題是如何讓邏輯推理和深度學(xué)習(xí)一起工作,這樣也可以增加深度學(xué)習(xí)的可解釋性。比如,建立一個貝葉斯模型需要有很多的設(shè)計者的經(jīng)驗,到現(xiàn)在為止,基本上是由人來設(shè)定的。如果我們能從深度學(xué)習(xí)的學(xué)習(xí)過程中衍生出一個貝葉斯模型,那么,學(xué)習(xí)、解釋和推理就可以統(tǒng)一起來了。
遷移學(xué)習(xí)
遷移學(xué)習(xí)也是我和戴文淵(第四范式創(chuàng)始人、首席執(zhí)行官)一直在做的工作。給定一個深度學(xué)習(xí)的網(wǎng)絡(luò),比如一個encoder網(wǎng)絡(luò)和一個decoder網(wǎng)絡(luò),我們可以看它學(xué)習(xí)和遷移的過程,作為新的數(shù)據(jù)來訓(xùn)練另外一個可解釋的模型,也可以作為一個新的遷移學(xué)習(xí)算法的輸出。即一個學(xué)生A在觀察另外一個學(xué)生B學(xué)習(xí),A的目的是學(xué)習(xí)B的學(xué)習(xí)方法,B就不斷地在學(xué)新的領(lǐng)域,每換一個領(lǐng)域就為A提供一個新的數(shù)據(jù)樣本,A利用這些新的樣本就能學(xué)會在領(lǐng)域之間做遷移。所以這種過程叫做觀察網(wǎng)絡(luò)。有了這種一邊學(xué)習(xí)、一邊學(xué)習(xí)學(xué)習(xí)方法的算法,就可以在機器學(xué)習(xí)的過程中,學(xué)會遷移的方法。
自然語言的表示學(xué)習(xí)與機器閱讀
表示學(xué)習(xí)是當(dāng)數(shù)據(jù)和任務(wù)沒有直接相關(guān)時也可以學(xué),一個重要的例子叫做self-taught learning,即我們通過很多supervise的數(shù)據(jù)、圖像,可以學(xué)出一種最好的表達。用這個表達加上任務(wù),就可以很快地學(xué)會這種知識表示。這時非結(jié)構(gòu)化的數(shù)據(jù)就相當(dāng)有用了。比如,給出一段話讓機器去閱讀,機器學(xué)習(xí)可以自動地發(fā)現(xiàn)一些值得關(guān)注的點。比如,給定一個文章中的實體和一個未知變量有這樣的關(guān)系,然后用戶可以問你這個未知變量是什么。能夠達到這樣的效果是因為深度模型已經(jīng)具有了一種關(guān)注,這種關(guān)注是可以通過觀眾的學(xué)習(xí)(Attention)來表達。其結(jié)果就好像我們一目了然地看了一本書,我們會把關(guān)鍵詞和它們的關(guān)系抓取出來。這實際上是利用類似人的一種直覺來進行學(xué)習(xí)。
人機對話系統(tǒng)
應(yīng)該說有一個領(lǐng)域已經(jīng)發(fā)展到了臨界點,就是人機對話系統(tǒng)領(lǐng)域。現(xiàn)在在這個領(lǐng)域,某些相對垂直的方面已經(jīng)收取了足夠多的數(shù)據(jù),一個是客服,一個是汽車(車內(nèi)的人車對話);還有一種是特定場景的特定任務(wù),像Amazon Echo,你可以跟它講話,可以說“你給我放個歌吧”或者“你播一下新聞”,Amazon Echo里面是圍了一圈的8個麥克風(fēng),這個陣列可以探測到人是否在和它說話,比如我和別人說話的時候,臉轉(zhuǎn)過去,它就不會有反應(yīng)。這種喚醒功能是非常準(zhǔn)確的。它的另外一個功能是當(dāng)你的雙手沒辦法去控制手機的時候,可以用語音來控制,案例場景是客廳和廚房,在美國Amazon Echo特別受家庭主婦的歡迎,所以像這種特定的場景,如果收集了足夠的數(shù)據(jù),是可以訓(xùn)練出這樣強大的對話系統(tǒng)來的。
強化遷移學(xué)習(xí)
我們可以想象,未來深度學(xué)習(xí)、強化學(xué)習(xí)和遷移學(xué)習(xí)的結(jié)合,可以實現(xiàn)以下幾個突破——反饋可以延遲、可以個性化,把一個通用模型施加到任何個體上面,這樣一個復(fù)合模型可以叫做強化遷移學(xué)習(xí)模型。
人工智能的可靠性模型
AI as Reliable Services是AAAI 前主席Thomas Dietterich在AAAI 2016上給出的一個主題,人工智能只能作為一些例證證明能夠做哪些事情,比如下棋,無人駕駛,但很多時候它還是不可靠的。它不像現(xiàn)在的一個商用軟件一樣,能讓你放心地去使用,以保證它的錯誤率肯定不會超過很小的比例。相反,AI 在犯錯的時候可能錯得非常厲害,所以用平均值來代表一個準(zhǔn)確率是不恰當(dāng)?shù)?,相反,?yīng)該更多地要考慮它的置信區(qū)間。換言之,小白用戶拿一些人工智能的模塊來搭一個系統(tǒng),這個系統(tǒng)就應(yīng)該能被搭出來,而且它的效果應(yīng)該是在一個固定的范圍以內(nèi)的,所以人工智能應(yīng)該像軟件工程一樣做出來。
第四范式核心產(chǎn)品“先知平臺”一直就在往這個方向發(fā)展,先知把人工智能的模塊工程化、并在一定程度上保證了可靠性,從而讓普通用戶用來搭建自己的人工智能系統(tǒng)。
三、AI的商業(yè)風(fēng)口在哪?
上面我們考慮了人工智能的技術(shù)發(fā)展。下面我們看看商業(yè)領(lǐng)域。我們剛才列舉了AI 成功的5大必要條件:高質(zhì)量的大數(shù)據(jù)、清晰的問題定義和領(lǐng)域邊界、懂人工智能且擅長應(yīng)用和算法的跨界人才、足夠的計算資源、持續(xù)的外部反饋。滿足這五個條件的領(lǐng)域,才有可能在未來出現(xiàn)人工智能的爆發(fā)。
智能客服
人機交互的智能客服,產(chǎn)生了很多外界公開的數(shù)據(jù)以及內(nèi)部的數(shù)據(jù)、知識庫等,都可以用來制造機器人。尤其是可以用客服過去的數(shù)據(jù)來做訓(xùn)練,這個數(shù)據(jù)量現(xiàn)在在垂直領(lǐng)域是逐漸在增加的?,F(xiàn)在的對話系統(tǒng)也已經(jīng)逐漸成為深度學(xué)習(xí)和強化學(xué)習(xí)的焦點。
新聞領(lǐng)域
另外一個比較看好的領(lǐng)域是新聞領(lǐng)域,新聞的分發(fā)和自動寫作。有很多編輯、解說、自動校對、作家等,其實是數(shù)據(jù)量足夠多的,有這么多的文本,而且外界反饋也越來越多了。給一篇文章,可以用機器學(xué)習(xí)來做自動摘要。 這樣一個工作的外部反饋來自哪里呢?實際上我們寫的那些paper就是一個外部反饋,因為每篇paper都有摘要,如果一篇paper被收了,就說明摘要寫的還不錯,所以外部反饋還是可以實現(xiàn)的。
這里分享一個有趣的實驗,是香港科大同學(xué)做的“自動寫小說”項目。主要有兩個步驟,一步是讓它讀很多書,一步是這樣訓(xùn)練出一個模型,這個模型再讓它變成一個生成式的模型,這樣就能用來寫小說了。舉個例子,我們提供《射雕英雄傳》和《笑傲江湖》,把這兩個結(jié)合起來,就可以寫一部新的小說了。
特定任務(wù)的智能機器人
例如Amazon 的KIVA機器人,大家可能知道Amazon一個很大的優(yōu)勢就是所有的倉儲都是由機器人來完成的,但是它也有工人,被雇來用手做抓取,因為現(xiàn)在機器人的抓取是非常難的,那么人和機器的優(yōu)點就結(jié)合起來了。此外,醫(yī)療機器人也是非常專業(yè)的一個領(lǐng)域,它可以給人開刀縫線,但它不是自動的,而是通過遠程控制的,但控制的精密度非常高,如果它收集到足夠量的數(shù)據(jù),是可以達到自動的效果的,以后我們可能開刀就由機器人來代勞了。
在醫(yī)護領(lǐng)域,無障礙輔助的應(yīng)用領(lǐng)域痛點特別強烈,現(xiàn)在數(shù)據(jù)量可能還不是特別多,因為畢竟這一群體還是少數(shù)人,但是痛點很強,所以未來也許會有數(shù)據(jù)。
AI+有機食品
我們在香港曾去訪問過一個有機食品工廠,這個實驗室里的每一株菜,周邊的所有環(huán)境全都記錄起來,比如濕度、溫度、光照,然后就可以收集這樣的數(shù)據(jù)訓(xùn)練一個機器學(xué)習(xí)的模型,最后用這個模型來做蔬菜。所以得來的蔬菜滋味可以控制,要脆感還是要甜的,都可以通過模型學(xué)習(xí)出來。
FINTECH智能投顧
最后來說一說金融,其實金融是一個非常好的領(lǐng)域,第四范式在金融領(lǐng)域也積累了很多成功案例。金融領(lǐng)域里的任務(wù)都是非常清楚的,而且每個任務(wù)的數(shù)據(jù)都有痕跡、有數(shù)據(jù)足跡,數(shù)據(jù)的維度也是多維度的數(shù)據(jù),有外界的、也有內(nèi)界的,非結(jié)構(gòu)數(shù)據(jù)比較多,例如文本和報告。數(shù)據(jù)也是形成了孤島,鏈條也非常長,并且鏈條里面都有銜接。
在金融領(lǐng)域現(xiàn)在美國比較時髦的一個概念叫投研、投顧和投資。投研是說研究整個市場的基本面,就好像我們研究輿情分析一樣,但輿情只是其中的一部分;投顧是說在美國的銀行給很多客戶做理財分析,然后做理財?shù)呐渲?,這些工作可以由機器人來做;投資是說機器人自己就是一個客戶,它可以去投資。
四、多年后的AI社會
最后說一下我認為多年后的AI社會是怎么樣的。我覺得未來應(yīng)該是幾個人在運行一個公司,每一個人都能率領(lǐng)成千上萬個機器人,這些機器人在做不同的事情,也是它被訓(xùn)練得很擅長的事情。我們現(xiàn)在在一個傳統(tǒng)行業(yè)里,往往是20%的人在做80%的工作,那么這20%的人就是未來的運營公司的人,剩下80%的人所做的工作將交由機器來完成。一個公司的自動化,智能化程度,也代表了這個公司在商業(yè)上的反應(yīng)速度和競爭力。
人工智能給人類帶來的變革是非常深遠的,人工智能不僅僅是一場比賽、一個應(yīng)用,而是整個社會真正地徹底地在改變。機器和人將成為一個共同的“軍隊”不斷地攻克堡壘,推動人類進程向更好的方向發(fā)展。
聯(lián)系客服