從語(yǔ)音識(shí)別到智能家居,從人機(jī)大戰(zhàn)到無人駕駛,人工智能的“演化”給我們社會(huì)上的一些生活細(xì)節(jié),帶來了一次又一次的驚喜,未來更多智能產(chǎn)品依托的人工智能技術(shù)會(huì)發(fā)展成什么樣呢?讓我們來看看2018人工智能標(biāo)準(zhǔn)化白皮書里面,對(duì)人工智能關(guān)鍵技術(shù)的定義。
人工智能技術(shù)關(guān)系到人工智能產(chǎn)品是否可以順利應(yīng)用到我們的生活場(chǎng)景中。在人工智能領(lǐng)域,它普遍包含了機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語(yǔ)言處理、人機(jī)交互、計(jì)算機(jī)視覺、生物特征識(shí)別、AR/VR七個(gè)關(guān)鍵技術(shù)。
一、機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)(Machine Learning)是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科,研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能,是人工智能技術(shù)的核心?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一,研究從觀測(cè)數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用這些規(guī)律對(duì)未來數(shù)據(jù)或無法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。根據(jù)學(xué)習(xí)模式、學(xué)習(xí)方法以及算法的不同,機(jī)器學(xué)習(xí)存在不同的分類方法。
根據(jù)學(xué)習(xí)模式將機(jī)器學(xué)習(xí)分類為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。
根據(jù)學(xué)習(xí)方法可以將機(jī)器學(xué)習(xí)分為傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。
二、知識(shí)圖譜
知識(shí)圖譜本質(zhì)上是結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),是一種由節(jié)點(diǎn)和邊組成的圖數(shù)據(jù)結(jié)構(gòu),以符號(hào)形式描述物理世界中的概念及其相互關(guān)系,其基本組成單位是“實(shí)體—關(guān)系—實(shí)體”三元組,以及實(shí)體及其相關(guān)“屬性—值”對(duì)。不同實(shí)體之間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu)。在知識(shí)圖譜中,每個(gè)節(jié)點(diǎn)表示現(xiàn)實(shí)世界的“實(shí)體”,每條邊為實(shí)體與實(shí)體之間的“關(guān)系”。通俗地講,知識(shí)圖譜就是把所有不同種類的信息連接在一起而得到的一個(gè)關(guān)系網(wǎng)絡(luò),提供了從“關(guān)系”的角度去分析問題的能力。
知識(shí)圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域,需要用到異常分析、靜態(tài)分析、動(dòng)態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識(shí)圖譜在搜索引擎、可視化展示和精準(zhǔn)營(yíng)銷方面有很大的優(yōu)勢(shì),已成為業(yè)界的熱門工具。但是,知識(shí)圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯(cuò)誤或者數(shù)據(jù)存在冗余。隨著知識(shí)圖譜應(yīng)用的不斷深入,還有一系列關(guān)鍵技術(shù)需要突破。
三、自然語(yǔ)言處理
自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問答系統(tǒng)等。
機(jī)器翻譯
機(jī)器翻譯技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)從一種自然語(yǔ)言到另外一種自然語(yǔ)言的翻譯過程?;诮y(tǒng)計(jì)的機(jī)器翻譯方法突破了之前基于規(guī)則和實(shí)例翻譯方法的局限性,翻譯性能取得巨大提升?;谏疃壬窠?jīng)網(wǎng)絡(luò)的機(jī)器翻譯在日??谡Z(yǔ)等一些場(chǎng)景的成功應(yīng)用已經(jīng)顯現(xiàn)出了巨大的潛力。隨著上下文的語(yǔ)境表征和知識(shí)邏輯推理能力的發(fā)展,自然語(yǔ)言知識(shí)圖譜不斷擴(kuò)充,機(jī)器翻譯將會(huì)在多輪對(duì)話翻譯及篇章翻譯等領(lǐng)域取得更大進(jìn)展。
語(yǔ)義理解
語(yǔ)義理解技術(shù)是指利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)文本篇章的理解,并且回答與篇章相關(guān)問題的過程。語(yǔ)義理解更注重于對(duì)上下文的理解以及對(duì)答案精準(zhǔn)程度的把控。隨著 MCTest 數(shù)據(jù)集的發(fā)布,語(yǔ)義理解受到更多關(guān)注,取得了快速發(fā)展,相關(guān)數(shù)據(jù)集和對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)模型層出不窮。語(yǔ)義理解技術(shù)將在智能客服、產(chǎn)品自動(dòng)問答等相關(guān)領(lǐng)域發(fā)揮重要作用,進(jìn)一步提高問答與對(duì)話系統(tǒng)的精度。
問答系統(tǒng)
問答系統(tǒng)分為開放領(lǐng)域的對(duì)話系統(tǒng)和特定領(lǐng)域的問答系統(tǒng)。問答系統(tǒng)技術(shù)是指讓計(jì)算機(jī)像人類一樣用自然語(yǔ)言與人交流的技術(shù)。人們可以向問答系統(tǒng)提交用自然語(yǔ)言表達(dá)的問題,系統(tǒng)會(huì)返回關(guān)聯(lián)性較高的答案。盡管問答系統(tǒng)目前已經(jīng)有了不少應(yīng)用產(chǎn)品出現(xiàn),但大多是在實(shí)際信息服務(wù)系統(tǒng)和智能手機(jī)助手等領(lǐng)域中的應(yīng)用,在問答系統(tǒng)魯棒性方面仍然存在著問題和挑戰(zhàn)。
自然語(yǔ)言處理面臨四大挑戰(zhàn):
一是在詞法、句法、語(yǔ)義、語(yǔ)用和語(yǔ)音等不同層面存在不確定性;
二是新的詞匯、術(shù)語(yǔ)、語(yǔ)義和語(yǔ)法導(dǎo)致未知語(yǔ)言現(xiàn)象的不可預(yù)測(cè)性;
三是數(shù)據(jù)資源的不充分使其難以覆蓋復(fù)雜的語(yǔ)言現(xiàn)象;
四是語(yǔ)義知識(shí)的模糊性和錯(cuò)綜復(fù)雜的關(guān)聯(lián)性難以用簡(jiǎn)單的數(shù)學(xué)模型描述,語(yǔ)義計(jì)算需要參數(shù)龐大的非線性計(jì)算
四、人機(jī)交互
人機(jī)交互主要研究人和計(jì)算機(jī)之間的信息交換,主要包括人到計(jì)算機(jī)和計(jì)算機(jī)到人的兩部分信息交換,是人工智能領(lǐng)域的重要的外圍技術(shù)。人機(jī)交互是與認(rèn)知心理學(xué)、人機(jī)工程學(xué)、多媒體技術(shù)、虛擬現(xiàn)實(shí)技術(shù)等密切相關(guān)的綜合學(xué)科。傳統(tǒng)的人與計(jì)算機(jī)之間的信息交換主要依靠交互設(shè)備進(jìn)行,主要包括鍵盤、鼠標(biāo)、操縱桿、數(shù)據(jù)服裝、眼動(dòng)跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設(shè)備,以及打印機(jī)、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設(shè)備。人機(jī)交互技術(shù)除了傳統(tǒng)的基本交互和圖形交互外,還包括語(yǔ)音交互、情感交互、體感交互及腦機(jī)交互等技術(shù)。
五、計(jì)算機(jī)視覺
計(jì)算機(jī)視覺是使用計(jì)算機(jī)模仿人類視覺系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。自動(dòng)駕駛、機(jī)器人、智能醫(yī)療等領(lǐng)域均需要通過計(jì)算機(jī)視覺技術(shù)從視覺信號(hào)中提取并處理信息。近來隨著深度學(xué)習(xí)的發(fā)展,預(yù)處理、特征提取與算法處理漸漸融合,形成端到端的人工智能算法技術(shù)。根據(jù)解決的問題,計(jì)算機(jī)視覺可分為計(jì)算成像學(xué)、圖像理解、三維視覺、動(dòng)態(tài)視覺和視頻編解碼五大類。
目前,計(jì)算機(jī)視覺技術(shù)發(fā)展迅速,已具備初步的產(chǎn)業(yè)規(guī)模。未來計(jì)算機(jī)視覺技術(shù)的發(fā)展主要面臨以下挑戰(zhàn):
一是如何在不同的應(yīng)用領(lǐng)域和其他技術(shù)更好的結(jié)合,計(jì)算機(jī)視覺在解決某些問題時(shí)可以廣泛利用大數(shù)據(jù),已經(jīng)逐漸成熟并且可以超過人類,而在某些問題上卻無法達(dá)到很高的精度;
二是如何降低計(jì)算機(jī)視覺算法的開發(fā)時(shí)間和人力成本,目前計(jì)算機(jī)視覺算法需要大量的數(shù)據(jù)與人工標(biāo)注,需要較長(zhǎng)的研發(fā)周期以達(dá)到應(yīng)用領(lǐng)域所要求的精度與耗時(shí);
三是如何加快新型算法的設(shè)計(jì)開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針對(duì)不同芯片與數(shù)據(jù)采集設(shè)備的計(jì)算機(jī)視覺算法的設(shè)計(jì)與開發(fā)也是挑戰(zhàn)之一。
六、生物特征識(shí)別
生物特征識(shí)別技術(shù)是指通過個(gè)體生理特征或行為特征對(duì)個(gè)體身份進(jìn)行識(shí)別認(rèn)證的技術(shù)。從應(yīng)用流程看,生物特征識(shí)別通常分為注冊(cè)和識(shí)別兩個(gè)階段。注冊(cè)階段通過傳感器對(duì)人體的生物表征信息進(jìn)行采集,如利用圖像傳感器對(duì)指紋和人臉等光學(xué)信息、麥克風(fēng)對(duì)說話聲等聲學(xué)信息進(jìn)行采集,利用數(shù)據(jù)預(yù)處理以及特征提取技術(shù)對(duì)采集的數(shù)據(jù)進(jìn)行處理,得到相應(yīng)的特征進(jìn)行存儲(chǔ)。
識(shí)別過程采用與注冊(cè)過程一致的信息采集方式對(duì)待識(shí)別人進(jìn)行信息采集、數(shù)據(jù)預(yù)處理和特征提取,然后將提取的特征與存儲(chǔ)的特征進(jìn)行比對(duì)分析,完成識(shí)別。從應(yīng)用任務(wù)看,生物特征識(shí)別一般分為辨認(rèn)與確認(rèn)兩種任務(wù),辨認(rèn)是指從存儲(chǔ)庫(kù)中確定待識(shí)別人身份的過程,是一對(duì)多的問題;確認(rèn)是指將待識(shí)別人信息與存儲(chǔ)庫(kù)中特定單人信息進(jìn)行比對(duì),確定身份的過程,是一對(duì)一的問題。
生物特征識(shí)別技術(shù)涉及的內(nèi)容十分廣泛,包括指紋、掌紋、人臉、虹膜、指靜脈、聲紋、步態(tài)等多種生物特征,其識(shí)別過程涉及到圖像處理、計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、機(jī)器學(xué)習(xí)等多項(xiàng)技術(shù)。目前生物特征識(shí)別作為重要的智能化身份認(rèn)證技術(shù),在金融、公共安全、教育、交通等領(lǐng)域得到廣泛的應(yīng)用。
七、VR/AR
虛擬現(xiàn)實(shí)(VR)/增強(qiáng)現(xiàn)實(shí)(AR)是以計(jì)算機(jī)為核心的新型視聽技術(shù)。結(jié)合相關(guān)科學(xué)技術(shù),在一定范圍內(nèi)生成與真實(shí)環(huán)境在視覺、聽覺、觸感等方面高度近似的數(shù)字化環(huán)境。用戶借助必要的裝備與數(shù)字化環(huán)境中的對(duì)象進(jìn)行交互,相互影響,獲得近似真實(shí)環(huán)境的感受和體驗(yàn),通過顯示設(shè)備、跟蹤定位設(shè)備、觸力覺交互設(shè)備、數(shù)據(jù)獲取設(shè)備、專用芯片等實(shí)現(xiàn)。
虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)從技術(shù)特征角度,按照不同處理階段,可以分為獲取與建模技術(shù)、分析與利用技術(shù)、交換與分發(fā)技術(shù)、展示與交互技術(shù)以及技術(shù)標(biāo)準(zhǔn)與評(píng)價(jià)體系五個(gè)方面。獲取與建模技術(shù)研究如何把物理世界或者人類的創(chuàng)意進(jìn)行數(shù)字化和模型化,難點(diǎn)是三維物理世界的數(shù)字化和模型化技術(shù);分析與利用技術(shù)重點(diǎn)研究對(duì)數(shù)字內(nèi)容進(jìn)行分析、理解、搜索和知識(shí)化方法,其難點(diǎn)是在于內(nèi)容的語(yǔ)義表示和分析;交換與分發(fā)技術(shù)主要強(qiáng)調(diào)各種網(wǎng)絡(luò)環(huán)境下大規(guī)模的數(shù)字化內(nèi)容流通、轉(zhuǎn)換、集成和面向不同終端用戶的個(gè)性化服務(wù)等,其核心是開放的內(nèi)容交換和版權(quán)管理技術(shù);展示與交換技術(shù)重點(diǎn)研究符合人類習(xí)慣數(shù)字內(nèi)容的各種顯示技術(shù)及交互方法,以期提高人對(duì)復(fù)雜信息的認(rèn)知能力,其難點(diǎn)在于建立自然和諧的人機(jī)交互環(huán)境;標(biāo)準(zhǔn)與評(píng)價(jià)體系重點(diǎn)研究虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)基礎(chǔ)資源、內(nèi)容編目、信源編碼等的規(guī)范標(biāo)準(zhǔn)以及相應(yīng)的評(píng)估技術(shù)。
目前虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)面臨的挑戰(zhàn)主要體現(xiàn)在智能獲取、普適設(shè)備、自由交互和感知融合四個(gè)方面。在硬件平臺(tái)與裝置、核心芯片與器件、軟件平臺(tái)與工具、相關(guān)標(biāo)準(zhǔn)與規(guī)范等方面存在一系列科學(xué)技術(shù)問題。總體來說虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)呈現(xiàn)虛擬現(xiàn)實(shí)系統(tǒng)智能化、虛實(shí)環(huán)境對(duì)象無縫融合、自然交互全方位與舒適化的發(fā)展趨勢(shì)。
聯(lián)系客服