近日,清華大學(xué)人工智能研究院知識智能研究中心、北京智譜華章科技有限公司聯(lián)合發(fā)布了《2020 年人工智能幾個重點(diǎn)領(lǐng)域頂級國際學(xué)術(shù)會議分析報告》(以下簡稱《報告》)。依托于科技情報大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺 AMiner,《報告》主要從論文、作者、國家、機(jī)構(gòu)等多個維度,詳細(xì)展示了 2020 年機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺等人工智能幾個重點(diǎn)領(lǐng)域頂級國際學(xué)術(shù)會議的前沿研究成果及其特征。
來源 清華大學(xué)人工智能研究院知識智能研究中心
原標(biāo)題:
《2020 年人工智能幾個重點(diǎn)領(lǐng)域 頂級國際學(xué)術(shù)會議分析報告》
作者:張淼 等
報告所研究的人工智能這幾個重點(diǎn)領(lǐng)域的國際頂會在 2020 年共計(jì)收到42683 篇論文投稿,具體分布情況如下圖所示。從單個會議投稿量看,神經(jīng)信息處理系統(tǒng)年會 NeurIPS 在這 10 個會議中所接收到的論文投稿量最多,為 9454篇論文,同時也在機(jī)器學(xué)習(xí)領(lǐng)域三個會議中居首。
其次是計(jì)算機(jī)視覺與模式識別會議 CVPR 和歐洲計(jì)算機(jī)視覺會議 ECCV,分別收到 6656 篇和 5025 篇論文投稿。相比而言,知識發(fā)現(xiàn)和數(shù)據(jù)挖掘會議 KDD 和信息檢索特別興趣小組 SIGIR所收到的論文投稿量較少,均不足 2000 篇。從子領(lǐng)域來看,機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理三個子領(lǐng)域會議收到的論文投稿總量較多,反映出這些領(lǐng)域的論文研究成果豐碩。
人工智能幾個重點(diǎn)子領(lǐng)域頂級國際學(xué)術(shù)會議 2020 年的投稿量情況
錄取率方面,報告所研究的人工智能這幾個重點(diǎn)領(lǐng)域 10 個國際頂會的論文平均錄取率 為 22.1%。各個會議的具體論文收錄情況如下圖所示。
從論文錄取數(shù)量來看,機(jī)器學(xué)習(xí)領(lǐng)域 NeurIPS 會議的論文收錄數(shù)量最多,為1900 篇;計(jì)算機(jī)視覺領(lǐng)域的 CVPR 和 ECCV 的論文收錄數(shù)量次之,分別位于第二、第三位。這反映出,計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域高質(zhì)量研究成果數(shù)量較多。
從論文收錄率來看,信息檢索領(lǐng)域的會議SIGIR 論文錄取率最高,該會議論文錄取率為 28.8%。相比而言,作為人工智能領(lǐng)域的首個國際學(xué)術(shù)性會議,經(jīng)典 AI 領(lǐng)域的國際人工智能聯(lián)合會議IJCAI 的論文錄取率在 2020 年的這 10 個國 際頂會之中最低,為 12.50%,且相比 IJCAI 2019 年的 17.9%錄取率大幅下降,同時也是 IJCAI 會議自 2013 年以來的最低論文接受率,由此可見,隨著 IJCAI論文審稿愈來愈嚴(yán)格,論文被該會議接受變得越來越難。
在機(jī)器學(xué)習(xí)領(lǐng)域,NeurIPS 會議的論文接受量雖然最多,但是該會議的論文收錄率卻最低。在計(jì)算機(jī)視覺領(lǐng)域,CVPR 會議論文的收錄率低于 ECCV。在自然語言處理領(lǐng)域,ACL 與 EMNLP 兩個會議的收錄率差別不大;值得一提的是,在 EMNLP2020 會議中,中國的論文接受率只有 13.2%,遠(yuǎn)低于大會的平均水平,而英國、新加坡和丹麥在該會議中有超過 30%的接受率,美國也有 27%的接受率,可見中國學(xué)者論文的接受率還有待提高。
人工智能幾個重點(diǎn)子領(lǐng)域頂級國際學(xué)術(shù)會議 2020 年的論文錄取情況
基于上文所述的人工智能幾個重點(diǎn)領(lǐng)域 10 個頂級國際學(xué)術(shù)會議所收錄的論文,通過對會議論文的標(biāo)題、摘要和自帶關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析和文本聚類,運(yùn)用TF-IDF 算法對所研究時段內(nèi)的主題相關(guān)論文數(shù)量進(jìn)行計(jì)算,獲取論文數(shù)量 TOP20 的熱點(diǎn)關(guān)鍵詞并制作詞云圖,得到人工智能幾個重點(diǎn)領(lǐng)域的近五年(2015-2020年)來的主題研究熱點(diǎn)。
綜合機(jī)器學(xué)習(xí)領(lǐng)域三個頂級會議(ICLR、NeurIPS、ICML)的論文研究點(diǎn),發(fā)現(xiàn)近年來機(jī)器學(xué)習(xí)最熱門的研究技術(shù)點(diǎn)是深度學(xué)習(xí)(Deep Learning)或深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks)、強(qiáng)化學(xué)習(xí)(Reinforcement Learning)、深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning),尤其是深度學(xué)習(xí)中的生成式對抗網(wǎng)絡(luò)(GAN,Generative Adversarial Networks)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN))兩大算法模型,相關(guān)論文量占比達(dá) 14.8%。此外,還都較多涉及了梯度下降(Gradient Descent )方法。
除了以上共同的研究熱點(diǎn),ICLR 與 ICML 都較多研究了深度學(xué)習(xí)中的對抗樣本(Adversarial Examples)問題。ICLR 與 NeurIPS 會議論文都較多研究了深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)算法。而 ICML和 NeurIPS 兩個會議的論文都較多研究了貝葉斯優(yōu)化 (Bayesian Optimization)、變分推斷(Variational Inference)、高斯過程(Gaussian Process, GP)、主動學(xué)習(xí)(Active Learning)、在線學(xué)習(xí)(Online Learning)等技術(shù)點(diǎn)。
就單個會議而言,ICLR 會議論文還較多研究了學(xué)習(xí)表征(Learning Representations)、遷移學(xué)習(xí)(Transfer Learning)、無監(jiān)督學(xué)習(xí)(UnsupervisedLearning)等方法。ICML 會議論文還涉及了少量的差分隱私(Differential Privacy)、非凸優(yōu)化(Nonconvex Optimization)方法,以及結(jié)構(gòu)化預(yù)測(Structured Prediction)問題;NeurIPS 會議論文還較多研究了樣本復(fù)雜度(Sample Complexity)等問題。
機(jī)器學(xué)習(xí)三大頂會會議論文近年研究熱點(diǎn)詞云圖
綜合分析 CVPR、ECCV 兩個計(jì)算機(jī)視覺領(lǐng)域頂級國際會議的研究點(diǎn)發(fā)現(xiàn),目標(biāo)檢測(Object Detection)與語義分割(Semantic Segmentation)是計(jì)算機(jī)視覺領(lǐng)域近五年(2015-2020)的最熱門研究點(diǎn),相關(guān)論文量占比 8%。此外較熱門的研究點(diǎn)還有行為識別(Action Recognition)、行人重識別(Person Re-Identification)、人體姿態(tài)估計(jì)(Human Pose Estimation)、圖像分類(Image Classification)等問題,所采用的手段較多是深度學(xué)習(xí)(Deep Learning)及其代表算法之一卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)等。
相對而言,CVPR 會議論文還較多研究了視覺問答(Visual Question Answering)、人臉識別(Face Recognition)等問題,以及生成式對抗網(wǎng)絡(luò)(Generative Adversarial Networks)的模型算法;ECCV 會議論文還較多研究了人臉對齊(Face Alignment)、視頻分類(Video Classification)、圖像描述(ImageCaptioning)、無監(jiān)督領(lǐng)域自適應(yīng)(Unsupervised Domain Adaptation)等技術(shù)問題,以及無監(jiān)督學(xué)習(xí)(Unsupervised Learning)方式。
計(jì)算機(jī)視覺頂會 CVPR 與 ECCV 會議論文近年研究熱點(diǎn)詞云圖
綜合分析自然語言處理領(lǐng)域兩個國際頂會 ACL 和 EMNLP 的論文研究熱點(diǎn)可知,神經(jīng)機(jī)器翻譯(Neural Machine Translation)在自然語言處理領(lǐng)域 2015-2020年的研究熱度遙遙領(lǐng)先,其他較熱的研究問題還有詞嵌入(Word Embeddings)、智能問答(QuestionAnswering)、語義解析(Semantic Parsing)、實(shí)體識別(EntityRecognition)、文本分類(Text Classification)、關(guān)系抽?。≧elation Extraction)、自然語言推理(Natural Language Inference)等技術(shù)點(diǎn),較熱門的研究對象是社會媒體(Social Media)。
除此之外,就單個會議而言,ACL 會議論文還較多研究了統(tǒng)計(jì)機(jī)器翻譯(Statistical Machine Translation)、領(lǐng)域自適應(yīng)(Domain Adaptation)、依存分析(Dependency Parsing)等問題,較熱門的研究方法是深度學(xué)習(xí)(Deep Learning)以及深度學(xué)習(xí)之中的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)算法等。EMNLP會議論文還較多研究了包括語言模型(Language Modeling)、語義角色(Semantic Role)、語義分析(Semantic Analysis)等問題,方法較多是關(guān)于深度強(qiáng)化學(xué)習(xí)(DeepReinforcement Learning)的。
自然語言處理頂會 ACL 與 EMNLP 論文近年研究熱點(diǎn)詞云圖
通過分析國際頂會 IJCAI 論文發(fā)現(xiàn),經(jīng)典 AI 領(lǐng)域 2015-2020 年會議論文之中最熱門的研究技術(shù)點(diǎn)主要為強(qiáng)化學(xué)習(xí)(Reinforcement Learning)、深度學(xué)習(xí)(Deep Learning)及其中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)算法,以及遷移學(xué)習(xí)(Transfer Learning)等,較多涉及了問答集編程(Answer Set Programming)、詞嵌入(Word Embeddings)、矩陣分解(Matrix factorization)等研究問題,而社交網(wǎng)絡(luò)(Social Networks)是這些論文較熱門的研究對象。
經(jīng)典 AI 領(lǐng)域國際頂會 IJCAI 近五年會議論文研究熱點(diǎn)詞云圖
人工智能數(shù)據(jù)挖掘領(lǐng)域知名的國際頂級會議是 KDD。通過分析 KDD 會議論文數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)挖掘領(lǐng)域研究熱點(diǎn)近年來主要是以大數(shù)據(jù)(Big Data)、社交網(wǎng)絡(luò)(Social Networks)、社交媒體(Social Media)、異構(gòu)信息網(wǎng)絡(luò)(Heterogeneousinformation network)等為研究對象,通過采用機(jī)器學(xué)習(xí)(Machine Learning)之中的深度學(xué)習(xí)(Deep Learning)、多任務(wù)學(xué)習(xí)(Multi-Task Learning)、主動學(xué)習(xí)(Active Learning)等方法,關(guān)注涉及了數(shù)據(jù)科學(xué)(Data Science)、推薦系統(tǒng)(Recommendation Systems)、異常檢測(Anomaly Detection)、顯示廣告(Display Advertising)、點(diǎn)擊率預(yù)測(Click-Through Rate Prediction)、高效算法(EfficientAlgorithm)等問題。
數(shù)據(jù)挖掘領(lǐng)域國際頂會 KDD 近五年會議論文研究熱點(diǎn)詞云圖
據(jù)信息檢索與推薦領(lǐng)域國際頂級會議 SIGIR 論文數(shù)據(jù)顯示,該領(lǐng)域近五年(2015-2020)科研論文主要是針對社交媒體(Social Media)、電商搜索(eCommerce Search)、社會網(wǎng)絡(luò)(Social Networks)等研究對象,研究關(guān)于信息抽?。↖nformation Retrieval)、網(wǎng)絡(luò)搜索(Web Search)、問答(QuestionAnswering)、推薦系統(tǒng)(Recommendation Systems)、查詢性能預(yù)測(Query PerformancePrediction)等熱點(diǎn)問題,所采用的較熱門技術(shù)方法包括知識圖譜(KnowledgeGraphs)、知識庫(Knowledge Bases)、主動學(xué)習(xí)(Active Learning)、弱監(jiān)督(Weak Supervision)等技術(shù)點(diǎn)。
信息檢索與推薦領(lǐng)域國際頂會 SIGIR 近五年會議論文研究熱點(diǎn)詞云圖
本年度人工智能幾個重點(diǎn)領(lǐng)域國際頂會共計(jì)評選出 13 篇最佳論文,截至本報告時段總引用量達(dá)到 999 次。通過命名消歧和信息抽取等大數(shù)據(jù)分析和挖掘技術(shù),分析發(fā)現(xiàn)這些頂會最佳論文具有如下特征:
在 2020 年人工智能會議中,獲得最佳論文獎項(xiàng)的論文共計(jì) 13 篇,參與作者共計(jì) 51 人。從所屬國家來看,最佳論文的作者分別來自美國、中國、英國、意 大利、新加坡以及以色列。其中美國獲得會議最佳論文的作者有 35 位,占比最高,達(dá)到 68.6%,分別來自于斯坦福大學(xué)、加州大學(xué)伯克利分校、普林斯頓大學(xué)等高校以及 OpenAI、谷歌研究等企業(yè)研究部門,數(shù)量遠(yuǎn)超其他國家。其次是中國獲得頂級學(xué)術(shù)會議最佳論文的作者數(shù)量占比達(dá) 9.8%,位于第三。
人工智能幾個重點(diǎn)領(lǐng)域國際頂會最佳論文作者所屬國家分布
本年度人工智能幾個重點(diǎn)領(lǐng)域頂會最佳論文呈現(xiàn)出跨國跨機(jī)構(gòu)多位作者合 作的特征:在被授予的 13 篇最佳論文中,沒有論文是由單一作者獨(dú)立完成,全部都是由不同國家或不同機(jī)構(gòu)的多位學(xué)者合作而完成的。在這些合作論文之中,論文作者數(shù)量最少為 2 位,最多達(dá) 31 位,詳細(xì)信息如表 5 所示。例如,中國北京理工大學(xué)碩士生 Kaixuan Wei 為一作的論文Tuning-free Plug-and-Play Proximal Algorithm for Inverse Imaging Problems 是他與本校計(jì)算機(jī)學(xué)院教授 Ying Fu(付瑩)、Hua Huang(黃華),以及劍橋大學(xué)博士后 Jingwei Liang(梁經(jīng)緯)、Aviles Rivero Angelica 等 6 位學(xué)者合作完成的。
告所研究會議論文的發(fā)布方主要以各個國家和地區(qū)的大學(xué)為領(lǐng)先機(jī)構(gòu)。例如,在今年 CVPR論文作者量排名前十的機(jī)構(gòu)之中,中國高校占據(jù)了七席,包括清華大學(xué)、上海交通大學(xué)、北京大學(xué)、浙江大學(xué)、中科大、北航、西安電子科技大學(xué),其中,來自清華大學(xué)的作者高達(dá) 340 位,位列第一。
在機(jī)器學(xué)習(xí)領(lǐng)域,2020 年的 ICLR、ICML、NeurIPS 三大國際頂級會議中,論文收錄總量 TOP10 的機(jī)構(gòu)是谷歌、麻省理工學(xué)院、斯坦福大學(xué)、加州伯克利大學(xué)、微軟、卡內(nèi)基梅隆大學(xué)、Deep Mind 、普林斯頓大學(xué)、清華大學(xué)以及牛津大學(xué),如下圖 所示。其中,谷歌被收錄論文總數(shù)最多,為 347 篇,位居榜首。其次是麻省理工學(xué)院,論文被收錄 197 篇,斯坦福大學(xué)論文被收錄量排名第三,為185 篇。國內(nèi)清華大學(xué)論文被收錄 86 篇,位居第九,也是唯一上榜的中國機(jī)構(gòu)。
機(jī)器學(xué)習(xí)國際三大頂會 2020 年論文被收錄總量 TOP10 機(jī)構(gòu)
從單個會議看,ICLR、ICML 和 NeurIPS 論文收錄最多的機(jī)構(gòu)都是以谷歌居首,并且除了中國的清華大學(xué)在 ICLR 會議的論文收錄量位于第三之外,其他 AI頂會的前三席位幾乎都被美國頂尖機(jī)構(gòu)占據(jù)。這反映出美國機(jī)構(gòu)在人工智能機(jī)器學(xué)習(xí)領(lǐng)域具備全球領(lǐng)先的創(chuàng)新實(shí)力。
機(jī)器學(xué)習(xí)國際三大頂會論文收錄前三機(jī)構(gòu)
具體而言,在 NeurIPS 2020 會議上,谷歌、麻省理工學(xué)院和斯坦福大學(xué)分別以 202、109 和 104 篇論文成為論文被收錄量最多的前三機(jī)構(gòu),清華大學(xué)位列第七,有 63 篇,北京大學(xué)有 37 篇入選,排在第 20 位。
NeurIPS2020 論文收錄量前 20 的機(jī)構(gòu)
在經(jīng)典 AI 領(lǐng)域的國際頂會 IJCAI 2020 上,就被收錄論文的所屬機(jī)構(gòu)而言,中國科學(xué)院位居榜首,有 42 篇論文入選;中國科學(xué)院大學(xué)以 34 篇論文排名第二;浙江大學(xué)入選 26 篇論文,排名第三。在論文收錄機(jī)構(gòu)前 15 名中,中國機(jī)構(gòu)占據(jù) 12 席,
IJCAI2020 會議論文入選機(jī)構(gòu)前 15 名
智東西認(rèn)為,頂級國際學(xué)術(shù)會議是全球人工智能學(xué)術(shù)交流和最高成果展示的平臺。中國人工智能學(xué)者及其成果頻頻出現(xiàn)在這些頂會的背后,體現(xiàn)出中國 AI 技術(shù)實(shí)力的不斷提升。作為業(yè)界頂會的重要參與者,我國在人工智能學(xué)術(shù)領(lǐng)域與美國等強(qiáng)國之間的差距逐漸縮小,中國 AI 學(xué)者正不斷提升在國際學(xué)術(shù)圈中的影響力和話語權(quán),這也將為我國人工智能發(fā)展帶來新的機(jī)遇。
聯(lián)系客服