黃鐵軍: 讓AI擁有超人“視力”
實(shí)習(xí)記者 代小佩
受訪者供圖
人物檔案
黃鐵軍,生于1970年12月,籍貫河北省邯鄲市,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、北京智源人工智能研究院院長、國家人工智能標(biāo)準(zhǔn)化總體組副組長,主要研究方向?yàn)橹悄芤曈X信息處理與類腦智能。
愛國情 奮斗者
“剛開完會(huì),上午會(huì)議結(jié)束得晚,咱們邊吃邊聊吧?!钡谝淮我姷奖本┐髮W(xué)信息科學(xué)技術(shù)學(xué)院教授黃鐵軍是在一次會(huì)議間隙,正值午飯時(shí)間,快人快語的他直接招呼記者一起用餐。
1970年,黃鐵軍生于河北省邯鄲市大名縣的一個(gè)普通村莊,和著名歌手鄧麗君是同鄉(xiāng)。若是身處在人群中,中等個(gè)子、衣著樸素的黃鐵軍,顯然不會(huì)像鄧麗君那樣引人注目。但在人工智能(AI)機(jī)器視覺領(lǐng)域,他有著絕對(duì)的發(fā)言權(quán)。
最近他的成果再次成為業(yè)界關(guān)注的焦點(diǎn)。前段時(shí)間,黃鐵軍牽頭研制的超速全時(shí)仿視網(wǎng)膜芯片首次公開亮相。這款芯片采用光電技術(shù),能“看清”高速旋轉(zhuǎn)葉片上的文字,可充當(dāng)AI的“超速電眼”。
從農(nóng)村娃到如今的AI大咖,在黃鐵軍身上,有著怎樣的故事?
高中時(shí)對(duì)編程感興趣
1986年,黃鐵軍上高二。那時(shí)很多人還沒見過計(jì)算機(jī),他卻幸運(yùn)地就用上了電腦。
“當(dāng)時(shí)正值國家在中學(xué)推廣計(jì)算機(jī)學(xué)習(xí),一些電腦被下發(fā)到部分學(xué)校。我所在的高中就有5臺(tái)電腦,而后我參加了學(xué)校組織的計(jì)算機(jī)興趣班。”黃鐵軍回憶道,自己對(duì)計(jì)算機(jī)“一見如故”,沒學(xué)多久就開始自己上機(jī)編程。
因?yàn)樗绦蚓幍煤?,老師把一臺(tái)電腦撥給他專用。如今,黃鐵軍仍心存感激,高中時(shí)這段與計(jì)算機(jī)親密接觸的經(jīng)歷,為他日后的科研選擇埋下了伏筆。
1988年,臨近高考,那時(shí)的他一心想探求世界本源,于是毫不猶豫地填報(bào)了北京大學(xué)物理系。遺憾的是,他高考發(fā)揮失常,沒能進(jìn)入心儀的大學(xué)。正在猶豫是否復(fù)讀時(shí),他收到了武漢工業(yè)大學(xué)(現(xiàn)為武漢理工大學(xué))的補(bǔ)錄錄取通知書,隨后進(jìn)入該校計(jì)算機(jī)學(xué)院應(yīng)用技術(shù)專業(yè)。
1995年,黃鐵軍進(jìn)入華中理工大學(xué)(現(xiàn)為華中科技大學(xué))圖像識(shí)別與人工智能研究所攻讀博士學(xué)位,主要研究方向?yàn)殡p目立體視覺及其在虛擬現(xiàn)實(shí)中的應(yīng)用。畢業(yè)后,1999年他進(jìn)入中國科學(xué)院計(jì)算技術(shù)研究所進(jìn)行博士后研究,研究方向?yàn)閳D像識(shí)別技術(shù),合作導(dǎo)師是時(shí)任所長、現(xiàn)北京大學(xué)教授、中國工程院院士高文。
“逼上梁山”轉(zhuǎn)戰(zhàn)視頻編碼
從博士到博士后,黃鐵軍的研究都圍繞圖像識(shí)別展開。當(dāng)時(shí),他以為自己會(huì)沿著這條路走下去,但命運(yùn)卻把他引向了一條岔路——視頻解碼。
2002年,數(shù)萬臺(tái)我國制造出口的DVD,由于未支付專利許可費(fèi),在歐盟地區(qū)被海關(guān)扣押。在專利大棒的打壓下,集中在廣東地區(qū)的相關(guān)生產(chǎn)工廠大量倒閉。
“那是改革開放后,我國首次遭遇重大知識(shí)產(chǎn)權(quán)問題。”黃鐵軍說,制定中國自主知識(shí)產(chǎn)權(quán)音視頻壓縮標(biāo)準(zhǔn),擺脫受制于人的困境,在當(dāng)時(shí)變得十分迫切。
彼時(shí),主題為“寬帶流媒體”的香山科學(xué)會(huì)議正在召開,大會(huì)主席安排黃鐵軍起草會(huì)議簡報(bào)。會(huì)議期間,工信部、科技部相關(guān)領(lǐng)導(dǎo)明確要求成立數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組(AVS),解決音視頻產(chǎn)品的知識(shí)產(chǎn)權(quán)問題,高文任組長。
對(duì)黃鐵軍來說,視頻編碼是個(gè)“從未涉足過的領(lǐng)域”。但由于簡報(bào)寫得好,博士后剛出站的黃鐵軍就被任命為AVS秘書長。他自嘲道,自己是“被逼上梁山”的秘書長。
“既然是國家需要,自己接下了任務(wù),就得好好干?!秉S鐵軍說,此后他的研究重心逐漸向視頻編碼方向傾斜。
AVS工作組成立后,經(jīng)歷過一段艱難歲月。黃鐵軍說,2004年工作組制定的視頻編解碼技術(shù)標(biāo)準(zhǔn)送審,但直至兩年后才發(fā)布?!耙?yàn)楫a(chǎn)業(yè)化本身涉及芯片、軟件、產(chǎn)品設(shè)備和端到端系統(tǒng)等眾多關(guān)鍵環(huán)節(jié),只有研制出符合標(biāo)準(zhǔn)的芯片,標(biāo)準(zhǔn)才能通過。”他說。
矛盾的是,如果標(biāo)準(zhǔn)不發(fā)布,企業(yè)就不愿研發(fā)芯片。無奈之下,工作組最終決定自己組織芯片設(shè)計(jì)團(tuán)隊(duì)。15年來,這支團(tuán)隊(duì)伴隨著AVS標(biāo)準(zhǔn)制定,研發(fā)出了一系列視頻編碼芯片。
搞研究不走尋常路
參與AVS工作的同時(shí),黃鐵軍也開始了從圖像識(shí)別轉(zhuǎn)戰(zhàn)視頻編碼的旅程。正因是“半路出家”,他的研究視角和長期在此領(lǐng)域研究的人不太一樣。
比如,黃鐵軍巧妙地捕捉到,監(jiān)控視頻具有背景相對(duì)不變的特點(diǎn),提出了基于場(chǎng)景建模的視頻編碼方法。僅靠這項(xiàng)技術(shù),就把視頻編碼的效率提高了1倍?!安捎矛F(xiàn)行標(biāo)準(zhǔn),全國3千萬個(gè)攝像頭采集的視頻,若保質(zhì)保量存儲(chǔ)3個(gè)月的內(nèi)容就需要2千億元。用上這項(xiàng)技術(shù)后,等量的內(nèi)容存儲(chǔ)成本可降至500億元?!彼f。
云計(jì)算改變了信息的應(yīng)用和服務(wù)模式,但大量攝像頭拍攝的視頻很難傳至云端,于是黃鐵軍又“腦洞大開”。
“傳到‘云’里的視頻不是給人看,而是給機(jī)器‘看’(進(jìn)行分析識(shí)別),所以只要傳回機(jī)器識(shí)別所需的視覺特征就可以了?!彼f,采用這個(gè)技術(shù)思路,視頻傳輸流量可減少90%以上,大大減輕了傳輸壓力。
基于上述兩項(xiàng)創(chuàng)新成果,由黃鐵軍牽頭的團(tuán)隊(duì)獲得了2017年度國家技術(shù)發(fā)明獎(jiǎng)二等獎(jiǎng)。
在新領(lǐng)域?qū)覄?chuàng)佳績的黃鐵軍,卻一直沒忘了自己的“老本行”——圖像識(shí)別。在該研究領(lǐng)域,他依舊體現(xiàn)出了與眾不同的研究視角。
長久以來,一些科學(xué)家習(xí)慣以人類自身為標(biāo)準(zhǔn)思考機(jī)器如何“看”,以為機(jī)器視覺和人類視覺一樣,但黃鐵軍卻不這么認(rèn)為。
“人總喜歡把自己的感受強(qiáng)加于別人,現(xiàn)在又強(qiáng)加于機(jī)器。一些人單純地以為,把視頻給機(jī)器看,機(jī)器就能識(shí)別,這種思路有些局限?!秉S鐵軍說,其實(shí)機(jī)器能比人“看”得更準(zhǔn)、更快。
于是,跳出人類思維局限,打造真正的機(jī)器視覺,即類腦視覺,成了黃鐵軍當(dāng)下的目標(biāo)。
做真正有價(jià)值的東西
由黃鐵軍牽頭研制的超速全時(shí)仿視網(wǎng)膜芯片,便是他們向類腦視覺走出的探索一步。黃鐵軍把這款芯片,比作新一代人工智能的“電眼”。
它能干什么?“舉例來說,在高速旋轉(zhuǎn)的電風(fēng)扇葉片上寫2個(gè)字,電風(fēng)扇轉(zhuǎn)起來后,人眼看到的是模糊一片,‘電眼’卻能把字看得清清楚楚?!彼f,“電眼”可用在人工智能界的“網(wǎng)紅”無人駕駛汽車、無人機(jī)和智能機(jī)器人上。
該芯片的研制團(tuán)隊(duì)中,有計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)、醫(yī)學(xué)等眾多領(lǐng)域的專家,形成了一個(gè)強(qiáng)大的跨學(xué)科隊(duì)伍,他們從生物和信息兩個(gè)角度進(jìn)行探索,最終才研制成功。
因?yàn)樵O(shè)計(jì)這只“電眼”,讓黃鐵軍有機(jī)會(huì)將視頻編碼與“老本行”圖像識(shí)別結(jié)合起來,運(yùn)用上這兩種不同領(lǐng)域的技術(shù)?!耙郧?,我們實(shí)驗(yàn)室里的學(xué)生分兩撥搞研究,一撥做圖像識(shí)別,一撥做視頻編碼,就像兩條并行的鐵軌?,F(xiàn)在,他們可以一起做項(xiàng)目,按照全新的技術(shù)體系,創(chuàng)造新的可能?!彼f。
實(shí)驗(yàn)室的學(xué)生對(duì)科技日?qǐng)?bào)記者說,開放性思維是黃鐵軍的標(biāo)志性特點(diǎn)?!包S老師善于從全局角度看問題,常會(huì)把兩種看似沒有關(guān)系的事物聯(lián)系在一起,讓它們碰撞出火花?!?div style="height:15px;">
對(duì)科研,黃鐵軍表示自己喜歡另辟蹊徑,反對(duì)跟隨和模仿?!耙郧?,一些科研人員十分注重成果的數(shù)量,現(xiàn)在則更重視開拓科研‘無人區(qū)’??蒲腥藛T應(yīng)該珍視自己的學(xué)術(shù)生命,做真正有價(jià)值的東西,否則你所做的事情就會(huì)像沙灘上的腳印,一陣?yán)舜蜻^來就會(huì)無影無蹤?!彼f。