AI 百人
未來圖靈推出首檔訪談欄目《AI百人》,專注人工智能垂直領域,邀請頂級AI行業(yè)領軍者,呈現(xiàn)獨家觀點。
本期嘉賓:
格靈深瞳創(chuàng)始人&CEO
趙勇
趙勇
格靈深瞳創(chuàng)始人、CEO。趙勇畢業(yè)于布朗大學,曾是谷歌研究院高級研究員。專注于把先進的人工智能科技轉(zhuǎn)化為具備低成本、大規(guī)模部署能力的產(chǎn)品和服務,并深度結(jié)合應用場景,為用戶提供高性能、可靠實用的智慧解決方案。
北京格靈深瞳信息技術有限公司
格靈深瞳,成立于2013年4月,是一家同時具備計算機視覺和深度學習技術以及嵌入式硬件研發(fā)能力的人工智能公司,作為一家視頻大數(shù)據(jù)產(chǎn)品和方案提供商,自主研發(fā)的深瞳技術在人和車的檢測、跟蹤與識別方面居于世界領先水平,公司主要關注的領域包括公共安全、智能交通、金融安防等,同時公司在無人駕駛、機器人和智能醫(yī)療方面也進行了深入的布局。
走進人工智能企業(yè)格靈深瞳,與其說這是一個辦公室,不如說這是一個試驗場地。有不同的實驗室,有的放置著機器人底盤和不同的智能硬件,發(fā)出嗡嗡嗡的聲音,有的則為未來上千塊顯卡而備,用于完成模型的訓練。
更與眾不同的是,這家公司分布著數(shù)十個攝像頭,其中一個橢圓形的黑盒子尤其引人注目,如同人眼一樣,滴溜溜地轉(zhuǎn),觀察著來往的人群。一會看看這個人,一會看看那個人,每一秒鐘都在做不同的決定。
正是這些攝像頭,記錄著每一個人的行走軌跡,自然,每一個員工的人臉信息也在系統(tǒng)中。打開系統(tǒng),哪怕是輸入員工的側(cè)面背影,也能瞬間知道員工的蹤跡。
“假設你在城市,可以從正面、背面、側(cè)后面多個角度搜尋到一個人。我們的客戶用這樣的方式去尋找他們的目標,甚至有些客戶去幫助老百姓尋找丟失的狗?!壁w勇,格靈深瞳創(chuàng)始人兼CEO說,“我希望這項技術以后使得找人成為一件更容易的事。”
安防將成為第一個“翻篇”的行業(yè)
博士時期,趙勇就開始研究人工智能其中的計算機視覺技術,畢業(yè)后,就職于英偉達、惠普、谷歌等知名公司研究院。
隨著深度學習的興起,2012年,趙勇看到人工智能帶來的機遇,堅信人工智能即將爆發(fā),隨即離開居住10余年的美國,回國創(chuàng)業(yè),將計算機視覺應用于安防領域。
張學友被稱為 “逃犯克星”,實際上,格靈深瞳同樣貢獻了這樣的破案案例。
2018年上半年,格靈深瞳的智能攝像機抓拍到某個人,竟是失蹤20年的殺人犯。一樁懸案就此破解。
趙勇表示,如今破案,90%以上的線索,都來自攝像機。然而中國是安防大國,就拿北京來說,就有200多萬個攝像機,由此產(chǎn)生的圖像數(shù)據(jù),規(guī)模之大,遠非人力能處理。
人工智能則能解決這樣的問題,警方將線索輸入系統(tǒng),通過人臉識別、人體識別、車輛識別等技術,答案在分秒之內(nèi)即可顯示。
“人工智能能夠閱讀這些圖像數(shù)據(jù),并理解其中個體或群體的身份或行為?!壁w勇認為,人工智能改變了安防的現(xiàn)狀,而安防也將是首個通過人工智能“翻篇”的行業(yè),因為相對其他行業(yè),中國作為安防大國,數(shù)據(jù)基礎最好。
而警方一旦使用過這樣的智能工具,他就“翻篇”,再也回不到過去?!澳阋坏┯眠^它,就會發(fā)現(xiàn)你過去使用的東西太糟糕了?!壁w勇說。
基于端 云,格靈深瞳擁有多個行業(yè)解決方案
人工智能改變安防領域,很大程度上在于人臉識別準確率超過了人眼。然而,很長一段時間以來,攝像機的實際作為范圍只有四五米,超出這個距離,抓拍的人臉就會很模糊。
早在2013年,趙勇就已意識到這樣的問題。
一次開車,趙勇發(fā)現(xiàn)50米外的車牌號碼,他能看清楚,而他隨身攜帶的谷歌眼鏡,配有高清攝像頭,拍下的錄像中,十米外的車牌號碼都無法清晰顯示。
這是為何?
趙勇開始研究人眼視網(wǎng)膜,視網(wǎng)膜是一個廣角,大概160度,但視網(wǎng)膜中間的黃斑,雖然只有2.5度,卻集中了人眼75%的像素。
趙勇表示,人眼有兩套光學系統(tǒng),一個充當望遠鏡,一個充當廣角。人的大腦實時分析這兩套光學系統(tǒng)的圖像,指揮眼球轉(zhuǎn)動。
格靈深瞳開始研究人眼攝像機。2016年10月,格靈深瞳推出深瞳人眼攝像機,基于人眼運作原理,深瞳人眼攝像機擁有兩套光學系統(tǒng),一套相當于廣角,一套相當于望遠鏡。一面鏡子,則朝兩個方向,快速的隨意旋轉(zhuǎn)。兩個神經(jīng)網(wǎng)絡則充當大腦,進行決策。
趙勇介紹,深瞳人眼攝像機能捕捉距離50米的物體,適應機場、火車站、商場、廣場等大多數(shù)場景,而那時,市面上的常見監(jiān)控攝像機還無法清楚地遠距離拍攝。
花力氣研發(fā)智能終端設備的同時,格靈深瞳推出深瞳云,基于端 云,如今格靈深瞳已有智慧安防、智慧交通、智慧學校、智慧能源、新零售等行業(yè)解決方案。
最多10年,中國將實現(xiàn)《疑犯追蹤》場景
目前,人工智能在安防領域中的應用,主要在于破案,壞事發(fā)生之后,搜尋罪犯。實際上,基于人工智能算法和大數(shù)據(jù),還可以用于反恐。相比破案,反恐則是阻止恐怖事件的發(fā)生,預測何人在何時實施恐怖事件,是預防行為。
美劇《疑犯追蹤》描述了一個被稱為“The Machine”的系統(tǒng),能夠預測何人會在何時實施犯罪。趙勇希望有一天他們也能達到這樣的目標。
要達成這樣的目標,跟破案相比,就不再是分析跟線索有關的少數(shù)人,而是分析所有人,因為每一個人理論上都可能是嫌疑人。因此,人工智能要做的則不僅僅是找出嫌疑人,而是研究人們的行為以及人與人之間的關系,從而找出異常之處。
如何分析一個人?趙勇說,這可以由他的行為來界定。比如他在室內(nèi)的步行軌跡,在室外駕駛車輛的行駛軌跡,當這些數(shù)據(jù)全部聚合時,就能挖掘不同身份的人,他們在小環(huán)境或大環(huán)境中有何行為,如何與他人接觸,如何與環(huán)境交互等,借此就能判斷一個人,從而預防犯罪。
趙勇認為,要達到這樣的目標,技術已不是問題,關鍵在于數(shù)據(jù),將這一切都數(shù)字化,而這需要人工智能在安防領域的滲透率要足夠高。然而,目前人工智能對安防領域的滲透才1%-3%,剛剛開始。
趙勇指出,基于目前的產(chǎn)品和行業(yè)現(xiàn)狀,一是需要不斷增加人工智能在安防領域的滲透率,而這需要解決成本問題。二是解決方案要不斷從破案轉(zhuǎn)向預防。
當滲透率到達90%這樣的程度,則能基于這些數(shù)據(jù),進行分析和預測,屆時,不僅能實現(xiàn)美劇《疑犯追蹤》和電影《速度與激情7》中展現(xiàn)的能力,而且性能會更好。
趙勇判斷,在中國,這一天的到來,最多需要10年。
“計算機視覺產(chǎn)生了大量的商業(yè)價值,這個賽道既要快,也要慢,它不是簡單的短跑,也不是枯燥的馬拉松,更像足球聯(lián)賽,其中有很多角色,也有很多窗口,該快的時候快,該堅持的時候也得堅持?!壁w勇總結(jié)。
請回答2028
預測2028,趙勇認為到那時,基本會全面數(shù)字化,到時很難分清虛擬世界和現(xiàn)實世界的差異;服務機器人會成熟到今天我們無法想象的程度,它們能夠非常有效地觀察人并跟人去溝通。