九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
人工智能 = 深度學(xué)習(xí)?

 



今天要向大家隆重推薦由Facebook研究科學(xué)家、前微軟亞洲研究院主管研究員王仲遠(yuǎn)博士撰寫(xiě)的一本新書(shū)《短文本數(shù)據(jù)理解》


短文本數(shù)據(jù)理解



該書(shū)選取了如何讓機(jī)器“智能”地理解“短文本”(比如搜索查詢(xún)、廣告關(guān) 鍵字、標(biāo)簽、微博、問(wèn)答、聊天記錄等)這一前沿研究課題,匯集了王仲遠(yuǎn)博士及其合作作者在國(guó)際頂級(jí)學(xué)術(shù)會(huì)議發(fā)表的前沿論文,介紹了在微軟和Facebook實(shí)際產(chǎn)品中所應(yīng)用的相關(guān)技術(shù),是一本同時(shí)適合學(xué)術(shù)界和工業(yè)界人士閱讀的書(shū)籍。

近年來(lái),“人工智能”這個(gè)已經(jīng)存在幾十年的詞重新成為一個(gè)熱詞。尤其是隨著AlphaGo的橫空出世,一般百姓對(duì)于人工智能都有所耳聞,許多公司更是宣布把人工智能作為未來(lái)最重要的戰(zhàn)略方向。由于近期在圖片、語(yǔ)音識(shí)別的技術(shù)突破,以及AlphaGo背后的技術(shù),都采用的是深度學(xué)習(xí)技術(shù),使得許多人認(rèn)為人工智能就是深度學(xué)習(xí)。

然而,在許多業(yè)內(nèi)人士看來(lái),盡管深度學(xué)習(xí)確實(shí)推動(dòng)了一撥技術(shù)變革,但其所代表的人工智能技術(shù)仍然是“弱人工智能”技術(shù)。其典型特征是: (1) 面向某一個(gè)具體問(wèn)題(比如下圍棋,識(shí)別視頻中的貓,打某一款游戲,等等);(2)需要大量訓(xùn)練數(shù)據(jù)。雖然許多系統(tǒng)宣稱(chēng)能夠“遷移學(xué)習(xí)”到不同的領(lǐng)域,但在實(shí)際系統(tǒng)中,總是還遇到這樣或那樣的困難。這也是為何深度學(xué)習(xí)在圖像、語(yǔ)音領(lǐng)域已經(jīng)有突破性進(jìn)展,但在自然語(yǔ)言處理領(lǐng)域,雖然大量論文涌現(xiàn),并且在一些系統(tǒng)中也實(shí)際應(yīng)用,但仍然只是處在“厚積”的階段,等待“薄發(fā)”的那一刻。

與此同時(shí),學(xué)術(shù)界始終存在著不同觀點(diǎn)的爭(zhēng)論。例如,2015年12月美國(guó)《科學(xué)》雜志封面文章《Human-level concept learning through probabilistic program induction(通過(guò)概率程序歸納法實(shí)現(xiàn)人類(lèi)層次的概念學(xué)習(xí))》中, 三名分別來(lái)自麻省理工學(xué)院、紐約大學(xué)和多倫多大學(xué)的研究就指出:人類(lèi)常常只需要一個(gè)或數(shù)個(gè)例子就可以學(xué)習(xí)出一個(gè)新的概念,而機(jī)器卻需要數(shù)百個(gè)例子才能達(dá)到相似的識(shí)別精度。例如,當(dāng)人們看到一個(gè)新型的二輪平衡車(chē)實(shí)例后,可以很容易將它從獨(dú)輪車(chē)、自行車(chē)、摩托車(chē)、汽車(chē)中識(shí)別出來(lái)。但是對(duì)于機(jī)器而言,目前還不具備這樣的能力。深度學(xué)習(xí)仍然像是一個(gè)深不見(jiàn)底的“記憶黑盒子”,需要通過(guò)大量的訓(xùn)練樣例,才能夠?qū)W出超出人類(lèi)能力的本領(lǐng)。在這篇《科學(xué)》雜志封面論文中,作者直指深度學(xué)習(xí)的軟肋,并聲稱(chēng)通過(guò)“貝葉斯程序?qū)W習(xí)”能夠模擬人類(lèi)認(rèn)知,并通過(guò)了圖靈測(cè)試。雖然三位作者和深度學(xué)習(xí)頂尖大牛Geoffrey Hinton相互之間都禮貌地表明,“貝葉斯程序?qū)W習(xí)”和“深度學(xué)習(xí)”在不同的任務(wù)上各領(lǐng)風(fēng)騷,假如能彼此借鑒,一定能互相彌補(bǔ),但是學(xué)術(shù)界中的“貝葉斯派”和“神經(jīng)網(wǎng)絡(luò)派”的“暗戰(zhàn)”還在持續(xù)。


言歸正傳,在自然語(yǔ)言處理領(lǐng)域,文本理解仍然是人工智能尚未攻克的難題。雖然“微軟小冰”已經(jīng)能夠陪人聊天,并且在微軟研究院研究團(tuán)隊(duì)的鼎力支持下,正在具備“情感”以及“個(gè)性”,但是業(yè)內(nèi)人士仍然清楚地意識(shí)到,基于檢索方式以及LSTM的技術(shù)方案,或許能夠讓產(chǎn)品顯得“人工智能”,但是離真正地能夠“自主學(xué)習(xí)”的“人工智能”仍然相去甚遠(yuǎn)。這是因?yàn)?,雖然計(jì)算機(jī)當(dāng)下能輕而易舉地戰(zhàn)勝世界圍棋冠軍,但是它的學(xué)習(xí)能力以及文本理解的能力可能都遠(yuǎn)不及一個(gè)三四歲的孩童。

去年10月底,微軟研究院發(fā)布了Microsoft Concept Graph(微軟概念圖譜,https://concept.research.microsoft.com/)。其核心知識(shí)庫(kù)包含了超過(guò)540萬(wàn)條概念。除了包含一些被絕大部分通用知識(shí)庫(kù)包含的概念,例如“城市”、“音樂(lè)家”等,Microsoft Concept Graph還包含數(shù)百萬(wàn)長(zhǎng)尾概念,例如“抗帕金森治療”、“名人婚紗設(shè)計(jì)師”、“基礎(chǔ)的水彩技巧”等,而這些概念在其他的知識(shí)庫(kù)中很難被找到。這個(gè)概念知識(shí)圖譜,可以讓計(jì)算機(jī)掌握“常識(shí)”(這是人類(lèi)理解萬(wàn)物的基礎(chǔ)),從而模仿人類(lèi)進(jìn)行簡(jiǎn)單推理。

基于概念知識(shí)圖譜進(jìn)行推理的過(guò)程叫做概念化,它是模擬人類(lèi)看到短文本時(shí)在腦海中形成推理的過(guò)程。例如,當(dāng)我們看到“蘋(píng)果”的時(shí)候,我們會(huì)知道它有可能是一種水果,也有可能是一家公司;當(dāng)我們看到“蘋(píng)果工程師”的時(shí)候,我們腦海中會(huì)形成簡(jiǎn)單的推理,認(rèn)為這個(gè)“蘋(píng)果”很有可能是指蘋(píng)果公司;更進(jìn)一步,當(dāng)我們看到“蘋(píng)果工程師在吃蘋(píng)果”,由于“吃”這個(gè)動(dòng)詞的存在,這個(gè)短文本中的第二個(gè)“蘋(píng)果”指的就應(yīng)該是水果。這種基于不同上下文進(jìn)行推理的過(guò)程就是“概念化”(Conceptualization)。目前,機(jī)器已經(jīng)能夠完全模擬這一過(guò)程,進(jìn)行“常識(shí)推理”,從而對(duì)文本產(chǎn)生一種顯性理解結(jié)果:“概念化向量”。這種向量與基于深度學(xué)習(xí)產(chǎn)生的詞向量類(lèi)似,可以用于進(jìn)行語(yǔ)義相似度計(jì)算,但是不同點(diǎn)是“概念化向量”是可解釋的,而由深度學(xué)習(xí)產(chǎn)生的詞向量是不可解釋的。

在大數(shù)據(jù)管理叢書(shū)主編孟小峰教授以及機(jī)械工業(yè)出版社的協(xié)調(diào)下,Microsoft Concept Graph(微軟概念圖譜)前負(fù)責(zé)人以及其概念化核心算法設(shè)計(jì)者王仲遠(yuǎn)博士將其發(fā)表的眾多頂級(jí)學(xué)術(shù)會(huì)議論文以及前沿算法匯集成冊(cè),即《短文本數(shù)據(jù)理解》,由機(jī)械工業(yè)出版社大數(shù)據(jù)管理叢書(shū)在今年5月出版。


本書(shū)作者王仲遠(yuǎn)博士,現(xiàn)在是美國(guó)Facebook公司Research Scientist(研究科學(xué)家)。他帶領(lǐng)一個(gè)團(tuán)隊(duì),負(fù)責(zé)Facebook網(wǎng)站每天數(shù)十億Query(查詢(xún))以及Post(帖子)中的實(shí)體識(shí)別與鏈接。他的團(tuán)隊(duì)僅用半年時(shí)間就將原有產(chǎn)品的關(guān)鍵指標(biāo)F1提升了80%,達(dá)到業(yè)界最高水準(zhǔn)。加入Facebook前,他是微軟亞洲研究院的主管研究員,領(lǐng)導(dǎo)微軟研究院的兩個(gè)知識(shí)圖譜項(xiàng)目Probase(即微軟的概念知識(shí)圖譜/Microsoft Concept Graph)和Enterprise Dictionary(企業(yè)知識(shí)圖譜項(xiàng)目),以及一個(gè)人工智能助手項(xiàng)目Digtal Me。他多年來(lái)專(zhuān)注于知識(shí)圖譜及其在文本理解方面的研究,已在SIGMOD、VLDB、ICDE、IJCAI、AAAI、CIKM、EMNLP等國(guó)際頂級(jí)學(xué)術(shù)會(huì)議上發(fā)表論文30余篇,其中包括ICDE 2015最佳論文獎(jiǎng)。他也是國(guó)際自然語(yǔ)言頂級(jí)學(xué)術(shù)會(huì)議ACL 2016 Tutorial “Understanding Short Texts”的主講人之一。目前已出版技術(shù)專(zhuān)著2本,擁有美國(guó)專(zhuān)利5項(xiàng)。他的研究興趣包括:文本理解、知識(shí)庫(kù)系統(tǒng)、自然語(yǔ)言處理、深度學(xué)習(xí)、數(shù)據(jù)挖掘等。

書(shū)中所介紹的方法已經(jīng)在微軟以及Facebook的許多產(chǎn)品中成功應(yīng)用。因此,本書(shū)既介紹了短文本理解前沿科研技術(shù),又是為數(shù)不多能夠具體落地的產(chǎn)品技術(shù)。適合學(xué)術(shù)界和工業(yè)界相關(guān)研究人員閱讀,也適合對(duì)人工智能、自然語(yǔ)言處理技術(shù)、知識(shí)圖譜感興趣的讀者。


近期精彩活動(dòng)(直接點(diǎn)擊查看):

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
【深度解讀】五大科技巨頭千億布局 智能醫(yī)療進(jìn)入AI時(shí)代
一文讀懂蘋(píng)果和Google的人工智能理念、布局和預(yù)期【鈦媒體】
微軟深度學(xué)習(xí)人工智能首次亮相中國(guó)
《智能語(yǔ)音時(shí)代》的讀書(shū)筆記
大數(shù)據(jù)云計(jì)算技術(shù):自然語(yǔ)言處理到底哪家強(qiáng)?
35 歲以下科技創(chuàng)新 35 人之一,這位博士解開(kāi)美團(tuán) AI 的冰山一角!
更多類(lèi)似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服