自然語(yǔ)言處理(NLP)素有“人工智能皇冠上的明珠”盛譽(yù),這也意味著語(yǔ)言與知識(shí)等認(rèn)知層面的技術(shù)突破將進(jìn)一步促進(jìn)AI深入發(fā)展。下面是小編對(duì)百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)的回顧,我們一起來(lái)看下:
j近日,以“掌握知識(shí)、理解語(yǔ)言、擁有智能”為主題的百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)舉行,百度CTO王海峰發(fā)表主旨演講,解讀百度語(yǔ)言與知識(shí)技術(shù)的發(fā)展歷程與最新成果,與產(chǎn)學(xué)研各界分享技術(shù)及產(chǎn)業(yè)發(fā)展趨勢(shì)和展望,百度集團(tuán)副總裁吳甜和百度技術(shù)委員會(huì)主席吳華分別發(fā)布百度語(yǔ)言與知識(shí)技術(shù)系列產(chǎn)品和數(shù)據(jù)集共建計(jì)劃,重磅推出5款產(chǎn)品的新發(fā)布,全面加速AI技術(shù)大規(guī)模應(yīng)用。這是一場(chǎng)凝聚了百度在語(yǔ)言與知識(shí)領(lǐng)域十年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的盛會(huì),必將帶來(lái)深遠(yuǎn)影響。
?。ò俣菴TO王海峰)
十年:開(kāi)拓者、深耕者、引領(lǐng)者
語(yǔ)言與知識(shí)技術(shù)是人工智能認(rèn)知能力的核心。2010年,百度成立自然語(yǔ)言處理部,在前瞻技術(shù)與產(chǎn)業(yè)格局上不斷引領(lǐng)、創(chuàng)新,十年間已成為中國(guó)NLP發(fā)展的一面旗幟。
峰會(huì)上,王海峰回顧,“在百度語(yǔ)言與知識(shí)技術(shù)的布局和發(fā)展中,我們始終在注意把握兩個(gè)趨勢(shì),即技術(shù)發(fā)展趨勢(shì)和產(chǎn)業(yè)發(fā)展趨勢(shì),并力爭(zhēng)引領(lǐng)趨勢(shì)?!?/p>
縱覽百度語(yǔ)言與知識(shí)技術(shù)發(fā)展歷程,從研究方法、研究對(duì)象、研究方向、產(chǎn)業(yè)應(yīng)用等各個(gè)層面,布局完整,不斷打磨成熟,始終與應(yīng)用的發(fā)展趨勢(shì)、需求一脈相承,與產(chǎn)業(yè)接軌。
十年來(lái),百度大腦語(yǔ)言與知識(shí)技術(shù)成果豐碩,獲得包括國(guó)家科技進(jìn)步獎(jiǎng)在內(nèi)的20多個(gè)獎(jiǎng)項(xiàng),30多項(xiàng)國(guó)際競(jìng)賽冠軍,發(fā)表學(xué)術(shù)論文超過(guò)300篇,申請(qǐng)專(zhuān)利2000多項(xiàng)。技術(shù)不斷突破創(chuàng)新的同時(shí),也在產(chǎn)品上創(chuàng)新探索,同時(shí)將領(lǐng)先的技術(shù)輸出給開(kāi)發(fā)者與合作伙伴,提升各行業(yè)智能化水平。
全面分享語(yǔ)言與知識(shí)技術(shù)成果
王海峰全面分享了百度語(yǔ)言與知識(shí)技術(shù)完整布局和最新成果。
首先,知識(shí)圖譜是機(jī)器認(rèn)知世界的重要基礎(chǔ),百度打造了世界上最大規(guī)模知識(shí)圖譜,擁有超過(guò)50億實(shí)體和5500億事實(shí),并在不斷演進(jìn)和更新。百度知識(shí)圖譜應(yīng)用于各行各業(yè),每天的調(diào)用次數(shù)超過(guò)400億次。
其次,在融入知識(shí)的基礎(chǔ)上,語(yǔ)言理解能力不斷增強(qiáng)。2019年3月,百度提出知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識(shí),同時(shí)具備持續(xù)學(xué)習(xí)能力,曾一舉登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,首次突破90分大關(guān),刷新榜單歷史。基于知識(shí)圖譜和語(yǔ)義表示,突破了閱讀理解、對(duì)話(huà)理解以及跨模態(tài)深度語(yǔ)義理解等技術(shù)。
再者,語(yǔ)言生成是語(yǔ)言與知識(shí)技術(shù)中的重要組成部分。基于預(yù)訓(xùn)練技術(shù)的成功經(jīng)驗(yàn),百度提出基于多流機(jī)制的語(yǔ)言生成預(yù)訓(xùn)練技術(shù),兼顧詞、短語(yǔ)等不同粒度的語(yǔ)義信息,顯著提升生成效果。百度也探索了多文檔摘要生成,通過(guò)圖結(jié)構(gòu)語(yǔ)義表示引入篇章知識(shí),在單文檔和多文檔摘要生成效果都有提升。
應(yīng)用系統(tǒng)層面,對(duì)話(huà)系統(tǒng)和機(jī)器翻譯等成績(jī)卓著。百度提出了知識(shí)圖譜驅(qū)動(dòng)的對(duì)話(huà)控制技術(shù),以及首個(gè)基于隱空間的大規(guī)模開(kāi)放域?qū)υ?huà)模型PLATO等,并推出智能對(duì)話(huà)定制和服務(wù)平臺(tái)UNIT,幫助開(kāi)發(fā)者高效構(gòu)建智能對(duì)話(huà)系統(tǒng),實(shí)現(xiàn)規(guī)?;瘧?yīng)用。百度翻譯支持200多種語(yǔ)言,每天響應(yīng)超過(guò)千億字符的翻譯請(qǐng)求,支持超過(guò)40多萬(wàn)家第三方應(yīng)用,技術(shù)上,提出了多智能體聯(lián)合學(xué)習(xí)、基于語(yǔ)義單元的同傳模型、稀缺語(yǔ)種分組混合訓(xùn)練算法等。
百度大腦語(yǔ)言與知識(shí)技術(shù)的持續(xù)探索和創(chuàng)新取得了令業(yè)界矚目的成績(jī),同時(shí)這些技術(shù)以平臺(tái)化的方式輸出,賦能千行萬(wàn)業(yè),持續(xù)提升產(chǎn)業(yè)智能化水平。
重磅推出5款產(chǎn)品的新發(fā)布、2大計(jì)劃
王海峰首次發(fā)布了百度大腦語(yǔ)言與知識(shí)產(chǎn)品全景圖。百度集團(tuán)副總裁吳甜接續(xù)發(fā)布語(yǔ)義理解技術(shù)與平臺(tái)文心、智能文檔分析平臺(tái)TextMind和AI同傳會(huì)議解決方案3大新產(chǎn)品,同時(shí)發(fā)布了6項(xiàng)升級(jí),包括智能創(chuàng)作平臺(tái)的3個(gè)場(chǎng)景方案、以及智能對(duì)話(huà)定制與服務(wù)平臺(tái)UNIT的3項(xiàng)全新升級(jí)。
?。ò俣燃瘓F(tuán)副總裁吳甜)
吳甜表示,“我們一直致力于將語(yǔ)言與知識(shí)技術(shù)凝聚成一系列技術(shù)平臺(tái)和產(chǎn)品,在應(yīng)用中產(chǎn)生大量?jī)r(jià)值,為廣大開(kāi)發(fā)者和產(chǎn)業(yè)實(shí)踐者提供以語(yǔ)言與知識(shí)技術(shù)為核心驅(qū)動(dòng)的系列產(chǎn)品?!?/p>
百度推出的語(yǔ)義理解技術(shù)與平臺(tái)文心,基于深度學(xué)習(xí)平臺(tái)飛槳打造,依托領(lǐng)先的語(yǔ)義理解核心技術(shù),集成優(yōu)秀的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開(kāi)發(fā)套件和平臺(tái),提供一站式NLP開(kāi)發(fā)與服務(wù),讓開(kāi)發(fā)者更簡(jiǎn)單、高效地定制企業(yè)級(jí)NLP模型。文心經(jīng)過(guò)了大量真實(shí)應(yīng)用場(chǎng)景的淬煉,具備優(yōu)秀的工業(yè)級(jí)落地實(shí)力。
全新發(fā)布的智能文檔分析平臺(tái)TextMind,基于OCR、NLP技術(shù),以文檔解析為核心能力,支持文檔對(duì)比與文檔審核,具備“多快好省”的核心優(yōu)勢(shì),促進(jìn)企業(yè)辦公智能升級(jí)。
百度大腦智能創(chuàng)作平臺(tái)針對(duì)媒體應(yīng)用場(chǎng)景再升級(jí),全新推出智能策劃、智能采編、智能審校三大媒體場(chǎng)景方案,進(jìn)一步助力媒體人更快、更好地創(chuàng)作,可謂切中媒體人的“痛點(diǎn)”。
智能對(duì)話(huà)定制與服務(wù)平臺(tái)UNIT升級(jí)3大特性:更智能的任務(wù)式對(duì)話(huà)理解、極致便捷的表格問(wèn)答和融合通用的新對(duì)話(huà)引擎。此次UNIT全新升級(jí)的三大能力,將進(jìn)一步降低任務(wù)式對(duì)話(huà)、智能問(wèn)答的定制成本,并融合通用對(duì)話(huà)能力,提升交互體驗(yàn)。
全新發(fā)布的AI同傳會(huì)議解決方案,覆蓋會(huì)議全場(chǎng)景、全流程,旨在打造用戶(hù)隨身的“會(huì)議同傳專(zhuān)家”。吳甜現(xiàn)場(chǎng)展示了如何只用一臺(tái)電腦和一部手機(jī)快速搭建一套同傳服務(wù),只需點(diǎn)點(diǎn)鼠標(biāo)、打幾個(gè)字,就能快速獲得專(zhuān)業(yè)的同傳服務(wù)。
數(shù)據(jù)匱乏、算力不足歷來(lái)是語(yǔ)言與知識(shí)技術(shù)研發(fā)中面臨的瓶頸。為突破瓶頸,百度聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)發(fā)起中文自然語(yǔ)言處理數(shù)據(jù)共建計(jì)劃——千言,解決數(shù)據(jù)稀缺問(wèn)題。千言一期由來(lái)自國(guó)內(nèi)11家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設(shè),已涵蓋開(kāi)放域?qū)υ?huà)、閱讀理解等7大任務(wù),20余個(gè)中文開(kāi)源數(shù)據(jù)集。
百度技術(shù)委員會(huì)主席吳華表示,“未來(lái),我們希望有更多的數(shù)據(jù)集作者能夠參與共建千言,共同推動(dòng)中文信息處理技術(shù)的進(jìn)步,建設(shè)世界范圍的中文信息處理影響力。我們計(jì)劃在未來(lái)3年,面向20多個(gè)任務(wù),收集和建設(shè)不少于100個(gè)中文自然語(yǔ)言處理數(shù)據(jù)集,覆蓋語(yǔ)言與知識(shí)技術(shù)全部領(lǐng)域?!?/p>
?。ò俣燃夹g(shù)委員會(huì)主席吳華(中)與中國(guó)中文信息學(xué)會(huì)副理事長(zhǎng)兼秘書(shū)長(zhǎng)孫樂(lè)(左)、中國(guó)計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專(zhuān)委會(huì)主任周?chē)?guó)棟(右)一起正式啟動(dòng)千言計(jì)劃)
吳華還發(fā)布了百度語(yǔ)言與知識(shí)技術(shù)算力共享計(jì)劃,通過(guò)百度AI STUDIO平臺(tái)提供算力支持,讓廣大開(kāi)發(fā)者破除算力桎梏,專(zhuān)注于技術(shù)創(chuàng)新。
十年征程,百度語(yǔ)言與知識(shí)技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會(huì)上,百度推出以王海峰為代表的百度NLP“十年十人”,十年堅(jiān)守,不忘初心,秉持“技術(shù)信仰”,勇攀技術(shù)高峰,矢志不渝致力于讓機(jī)器更好地理解世界、更好地服務(wù)于人。
正如王海峰所言,“我們致力于更好地與學(xué)術(shù)界、產(chǎn)業(yè)界攜手,推動(dòng)語(yǔ)言與知識(shí)技術(shù)發(fā)展,進(jìn)而推動(dòng)人工智能技術(shù)持續(xù)進(jìn)步,為產(chǎn)業(yè)智能升級(jí)、社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)力量。我們對(duì)未來(lái)充滿(mǎn)信心,堅(jiān)持研究和發(fā)展讓機(jī)器掌握知識(shí)、理解語(yǔ)言、擁有智能,繼續(xù)突破和創(chuàng)新,為技術(shù)和社會(huì)進(jìn)步做出更大貢獻(xiàn)?!?/p>
聯(lián)系客服