導讀
劍橋2019年度《AI全景報告》全方位總結(jié)過去一年來AI領(lǐng)域的研究成果與突破、人才形勢、產(chǎn)業(yè)動態(tài)、政府政策以及中國在AI方面的成就,并做出未來預(yù)測,具有重要參考價值。有鑒于此,筆者將其中的要點進行整理編譯如下,以饗讀者。
關(guān)鍵詞:
人工智能(Artificial Intelligence,AI)、機器學習(Machine Learning,ML)、強化學習(Reinforcement Learning,RL)、深度學習(Deep Learning,DL)、聯(lián)邦學習(Federated Learning)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、自然語言處理(Natural Language Processing,NLP)、自動機器學習(Auto ML)、生成對抗網(wǎng)絡(luò)(Generative Adversarial Nets)
一
研究和技術(shù)突破
01
RL征服新領(lǐng)域
1.《蒙特祖瑪?shù)膹统稹?/strong>
OpenAI在其中所展現(xiàn)出的“隨機網(wǎng)絡(luò)蒸餾(RND)”,技術(shù)激勵RL代理探索不可預(yù)測的狀態(tài)。
2.《星際爭霸2》
AlphaStar使用了多智能體訓練算法,有效地創(chuàng)建了一個相互競爭的智能體聯(lián)盟,共同探索巨大的戰(zhàn)略空間。最終的阿爾法星智能體是由納什平均產(chǎn)生的,它結(jié)合了個體智能體開發(fā)的最有效的策略組合。
3.《雷神之錘III競技場奪旗》
通過使多個代理獨立學習并采取行動來相互協(xié)作和競爭,可以實現(xiàn)人員水平的績效。代理僅使用像素和游戲點作為輸入。
4.OpenAI5性能進一步提高
OpenAI的Dota2的每個機器人都是一個單層,4,096個單元的LSTM,可讀取游戲狀態(tài)并通過自彈式RL進行訓練(相對于自身為80%,較舊版本為20%)。
5.計算方面的改進是OpenAI5競爭性能的當關(guān)
02
RL的下一步
1.游戲訓練單個機器人來執(zhí)行許多復雜的任務(wù)
2.計算機視覺預(yù)測模擬和真實世界來學習靈活性
加州大學創(chuàng)建的7自由度手臂機器人。OpenAI的機械手,以驚人的敏捷度洗凈物理對象。
3.好奇心驅(qū)動的探索
通過反復試驗來學習任務(wù)。在探索(嘗試新的行為)與探索(重復有效的行為)之間取得平衡。
4.學習用于在線規(guī)劃的動力學模型
從圖像中學習環(huán)境動態(tài)模型,并通過快速預(yù)測多個時間步長的收益,通過快速的在線計劃選擇行動。與最新的A3C和D4PG算法相比,模擬環(huán)境之間的交互作用減少了50倍,并且計算時間相似。
5. 應(yīng)用RL來優(yōu)化大規(guī)模生產(chǎn)環(huán)境中的系統(tǒng)
03
自然語言處理的關(guān)鍵年
1. 在非常大量的公開可用(即來自網(wǎng)絡(luò)的無標簽文本)上進行預(yù)訓練的語言模型
2.研究人員開始制定GLUE(通用語言理解評估基準)用于評估NLP系統(tǒng)在一系列跨邏輯,常識理解和詞匯語義的任務(wù)。
3.無bitexts的機器翻譯發(fā)展迅速
4.各大企業(yè)對用于實際產(chǎn)品的聯(lián)邦學習的研究興趣日益濃厚
5.越來越重視數(shù)據(jù)隱私并保護已部署的ML系統(tǒng)免受攻擊
04
深度學習在醫(yī)療中的應(yīng)用
1.診斷眼疾
專家級診斷和治療推薦建議是通過兩階段基于深度學習的分類網(wǎng)絡(luò)實現(xiàn)的。
2.使用心電圖檢測和分類心律不齊
使用針對患者的端到端深度學習,以原始格式處理動態(tài)環(huán)境中的心電圖軌跡,以檢測心律。
3.從腦電波中解讀想法
與機器學習線性回歸方法相比,深度學習的神經(jīng)網(wǎng)絡(luò)方法將人腦電波中語音的清晰度提高了65%。
4.恢復殘疾人的肢體控制
通過電刺激和神經(jīng)網(wǎng)絡(luò)解碼器對四肢癱瘓患者的前臂進行長期修復。
5.合成化學分子
將神經(jīng)網(wǎng)絡(luò)與蒙特卡洛樹搜索結(jié)合使用,通過訓練1,240萬個反應(yīng)來解決逆合成。這種方法比最先進的計算機輔助綜合計劃要快得多。
05
AutoML新發(fā)展
1.用于神經(jīng)網(wǎng)絡(luò)架構(gòu)和超參數(shù)的進化算法
聯(lián)合優(yōu)化超參數(shù),在最大程度降低復雜性和尺寸的同時,最大化網(wǎng)絡(luò)性能。
2.設(shè)計具有實際設(shè)備性能反饋的資源受限的網(wǎng)絡(luò)
Google展示了一種基于RL的多目標方法(MnasNet),以找到具有低真實世界推理延遲的高精度CNN模型。Facebook提出了一種可區(qū)分的神經(jīng)體系結(jié)構(gòu)搜索(DNAS)框架,該框架使用基于梯度的方法在分層搜索空間上優(yōu)化CNN體系結(jié)構(gòu)。
06
GANs新發(fā)展
1.從粒狀到GANgsta
較大的模型和大量的培訓進一步提高了使用GAN生成的圖像的質(zhì)量。
2.從面孔到全身合成
電影放映一次,然后通過將面部與口語單詞匹配(左),以不同的語言生成相同的視頻。下一步是從頭到腳生成整個身體,目前用于零售目的(右)。
07
圖像、視頻、語音處理
1.從單個圖像學習對象的3D形狀
2.對過去25年中對16,625篇AI論文的分析顯示,出版物輸出的巨大增長以ML和RL最受歡迎
二
人才
01
人才形勢
1.谷歌在2018年首屆學術(shù)AI學術(shù)會議NeurIPS上繼續(xù)保持統(tǒng)治地位,并且在研究論文輸出量最高的組織中名列前茅。
2.在NeurIPS,ICML或ICLR發(fā)表論文的4,000位研究人員中,有88%是男性
3.大型科技公司高級工程師的薪酬接近1,000,000美元。另一方面,每小時$1.47的數(shù)據(jù)標簽工作大幅增長。
4.與復雜的電子供應(yīng)鏈(例如富士康)類似,用于AI應(yīng)用程序的“數(shù)據(jù)標簽工廠”也有了大幅增長。
5.神經(jīng)網(wǎng)絡(luò)的先驅(qū)者獲得了圖靈獎,這是計算機科學領(lǐng)域的最高獎項。
02
論文
歐洲發(fā)表AI論文最多,但只有中國的平均被引用率在增長。
03
教育
1.麻省理工學院在計算和AI領(lǐng)域的新10億美元投資
2.AI的大學課程入學人數(shù)正在增長,中國更是突出
3.AI教授和學生的性別差異仍然存在
04
Element.AI人才調(diào)查2019
1.只有19%的學術(shù)作者和16%的行業(yè)作者是女性.
2.44%的作者從美國獲得博士學位,從中國獲得11%,從美國獲得6%英國。
3.五個國家(美國,中國,英國,德國和加拿大)占作者總數(shù)的72%。
4.AI人才的流入和流出
加拿大,英國和瑞士是“平臺國家”,既吸引外國人才,又出口本地培訓的人才。美國和中國的生態(tài)系統(tǒng)更加成熟-流入量和流出量都很低。
05
企業(yè)需要更多的應(yīng)用人才將研究投入生產(chǎn)
三
AI產(chǎn)業(yè)
01
形勢
1.對AI主題的全球風險資本投資以每年超過$27B的速度增長
2.大型科技公司繼續(xù)吞噬AI優(yōu)先初創(chuàng)公司
3.機器人流程自動化:一夜之間的企業(yè)成功(15年的醞釀)
出生于歐洲的RPA市場領(lǐng)導者UiPath的客戶同比增長4倍。
02
現(xiàn)實世界中的機器人
1.清潔和店內(nèi)操作
2.波士頓動力公司機器人的進步
3.大企業(yè)用機器人制造機器人
4.全棧初創(chuàng)企業(yè)進入制造市場
5.應(yīng)用機器人支持的全渠道、自動化執(zhí)行供應(yīng)鏈
6.亞馬遜推出了更多用于物流和分揀的倉儲機器人
03
自動駕駛汽車行業(yè)
1.當現(xiàn)場視音頻飛行員在加利福尼亞乃至世界各地成長時,有幾名玩家撤退,導致錯過了幾個發(fā)布日期以及其他玩家的沉默
2.Waymo在2018年行駛了超過100萬英里,是2.8倍的下一個最佳性能(GMCruise)和16倍的第3最佳性能(Apple)
3. 2018年,自動駕駛汽車公司的行駛里程達到了人類行駛里程的0.00066%
通用/Cruise的問題包括每英里一次的“嚴重駕駛不適”,自動駕駛路線比人類駕駛的同類路線要長80%,以及在備受矚目的投資者測試中出現(xiàn)的故障。
04
需求預(yù)測
1.信息以數(shù)字形式提供,使其可用ML來預(yù)測需求。
2.ML的有效利用
能源、洪水預(yù)測 、旅行、本地企業(yè)、后勤、零售
3.閱讀機器的改進和普及
4.制藥公司與AI驅(qū)動的藥物開發(fā)公司合作
05
AI專利
1.AI專利家族的增長速度超過了AI科學出版物。
2.計算機視覺是最受歡迎的專利領(lǐng)域。在計算機視覺中最受歡迎的領(lǐng)域是生物識別(與生物數(shù)據(jù)相關(guān)的應(yīng)用)。
3.大型科技公司通過云計算獲利,但未通過托管的AI服務(wù)獲利。通過托管的AI服務(wù)獲利還處于初期。
06
AI硬件:巨頭和初創(chuàng)企業(yè)蓬勃發(fā)展的全球格局
1.對移動芯片組執(zhí)行AI任務(wù)的性能進行基準測試
高通的Snapdragon通過為浮點和量化神經(jīng)網(wǎng)絡(luò)展示非常強大的性能和硬件加速而獲勝。
2.對移動設(shè)備執(zhí)行AI任務(wù)的性能進行基準測試
三星、華為和小米位居榜首,而谷歌的Pixel3排在第22位。
3.將計算和競爭推向邊緣
到2025年,谷歌和NVIDIA將在連接設(shè)備產(chǎn)生的40萬億字節(jié)數(shù)據(jù)中應(yīng)用AI計算。亞馬遜使開發(fā)人員可以在其云上訓練ML模型,并導出針對特定邊緣硬件平臺量身定制的優(yōu)化模型。
4.5G作為無處不在的連接和AI計算的骨干
5G為更快,更穩(wěn)定的信息傳輸提供了潛力。擁有5G的組織或國家將為世界其他地區(qū)設(shè)定標準。目前,中國遠遠領(lǐng)先于美國。
四
政治
01
公眾對AI的態(tài)度
1.公平競爭和雙重標準。
美國人不贊成以競爭為目的的AI技術(shù),但是一旦對手開始開發(fā)AI技術(shù),這種情況就會改變。
2.治理
公眾不知道如何衡量AI的開發(fā)和部署的責任者和方式。
3.企業(yè)道德
64%的人認為企業(yè)應(yīng)該設(shè)立一個AI審查委員會,定期討論企業(yè)的道德決策。
4.人口屬性的激勵
人口屬性對開發(fā)高級機器智能的支持差異很大。
02
各國政策
1.“德國制造的AI”
計劃宣布到2025年投資30億歐元。、
2.芬蘭的“1%”AI計劃
芬蘭正在對其1%的人口進行ML的基礎(chǔ)培訓,力求在AI的實際應(yīng)用方面占據(jù)世界領(lǐng)先地位。
3.歐盟AI計劃
通過專注于“合乎道德的AI”及其“安全和高質(zhì)量產(chǎn)品”的聲譽,實現(xiàn)差異化。
4.美國新對策
將出口管制應(yīng)用于機器學習,包括“深度學習”、“強化學習”和“計算機視覺”。并暗示美國制裁名單上的組織成員(例如華為)不能擔任論文審閱者。
03
新挑戰(zhàn)
1.大規(guī)模監(jiān)測監(jiān)視技術(shù)日趨成熟
2.武器化自然語言處理導致的欺詐和計算式宣傳
3.深度偽造影響政治議程
4.旨在讓開發(fā)者限制軟件使用的AI許可證
5.機器算法中的性別偏見
6.AI的倫理道德問題
五
中國
01
人臉識別的應(yīng)用發(fā)展迅速
02
中國互聯(lián)網(wǎng)公司向農(nóng)業(yè)領(lǐng)域擴張,阿里巴巴和京東都進入了畜牧業(yè)
03
研發(fā)支出
中國企業(yè)研發(fā)支出增長迅速,但在市場份額方面存在明顯滯后。中國企業(yè)的研發(fā)支出同比增長34%,但美國企業(yè)仍占全球科技支出的61%。中國的半導體貿(mào)易逆差正在(緩慢)擴大.
04
中國的工業(yè)自動化和工作崗位的轉(zhuǎn)移正在增加。某些中國工業(yè)企業(yè)在過去3年里自動化了40%的勞動力
05
機器貨倉
在中國,機器人正在推動自動化倉儲。京東的上海物流中心每天使用自動化倉庫機器人來組織、挑選和運送20萬份訂單。工廠由4名工人照管。京東的倉庫數(shù)量和表面積同比增長了45%。
06
中國公司仍繼續(xù)在美國公開市場進行IPO(首次公開募股)
07
專利
1. 中國企業(yè)擁有的專利最多,但2017年只有23%是“發(fā)明專利”
2.中國的雙重專利制度使其專利領(lǐng)先于其他國家。
中國的發(fā)明者讓他們的大部分專利在被授予5年后失效。91%的5年設(shè)計專利和61%的5年實用新型專利被放棄。相比之下,美國5年專利的維護費占85.6%。
08
學術(shù)研究
中國公布的ML研究報告數(shù)量已經(jīng)超過美國。艾倫研究所最近的一項分析顯示,中國在質(zhì)量方面的差距也在迅速縮小。
六
預(yù)測
1.利用NLP研究的最新突破,涌現(xiàn)出一批新的創(chuàng)業(yè)公司在接下來的12個月內(nèi)共籌集了超過1億美元。
2.無人駕駛技術(shù)在很大程度上仍處于研發(fā)階段。
3.數(shù)據(jù)安全性和用戶隱私策略研究突破。
4.高等教育機構(gòu)建立專門建立的AI本科學位以填補人才空缺。
5.量子計算硬件方面取得重大突破。
6.對AI的治理將有初步實質(zhì)性進展。
聯(lián)系客服