九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
港中大DeepID

在幾年前,說到LFW和ImageNet,可能不只是普通大眾覺得陌生,恐怕連科技圈內(nèi)的人士也不知其所以然,但隨著人工智能領(lǐng)域的迅猛發(fā)展,“計(jì)算機(jī)視覺”、“人臉識別”、“物體識別”等詞匯越來越被大眾所熟知,而LFW和ImageNet正是世界范圍內(nèi)計(jì)算機(jī)視覺領(lǐng)域的頂級賽事之一。

王曉剛教授

若有人告訴你,現(xiàn)在的計(jì)算機(jī)視覺已經(jīng)超過了人眼,你可能覺得難以置信,但在香港中文大學(xué)的王曉剛教授看來,這并不值得大驚小怪,“我們的團(tuán)隊(duì)在去年的LFW(Labeled Faces in the Wild)數(shù)據(jù)庫上就獲得了99.15%的識別率,實(shí)驗(yàn)表明,如果僅僅給出人臉中心區(qū)域,人用肉眼在LFW上的識別率為97.52%,”王教授解釋道。

DeepID-Net團(tuán)隊(duì)ImageNet大賽折桂

而與LFW相比,ImageNet對科學(xué)家們提出的挑戰(zhàn)更具難度,ImageNet數(shù)據(jù)庫中一共包含了1400萬經(jīng)過標(biāo)簽分類的材料,囊括五花八門的圖像。其中的“物體檢測”項(xiàng)目是ImageNet里最具挑戰(zhàn)性的任務(wù),它要求計(jì)算機(jī)從四萬張圖像中準(zhǔn)確地識別出200類物體的具體位置,其中的難點(diǎn)是一幅圖像中往往包含多個(gè)不同類別的物體。由于難度較大,在2013年時(shí),計(jì)算機(jī)的檢測率只有22.6%。到2014年,谷歌以43.9%的檢測率贏得比賽,而由香港中文大學(xué)的歐陽萬里、王曉剛和湯曉鷗教授帶領(lǐng)的DeepID-Net團(tuán)隊(duì)首次參加ImageNet大規(guī)模物體檢測任務(wù)比賽便以40.7%的優(yōu)異戰(zhàn)績位居第二名。

幾個(gè)月后,DeepID-Net團(tuán)隊(duì)將此成績大幅提高至50.3%,達(dá)到了全球最高的檢測率。這一成果以論文形式發(fā)表在2015年國際計(jì)算機(jī)視覺與模式識別大會(huì)(CVPR)上,是目前世界上在ImageNet挑戰(zhàn)中最高記錄。

深度學(xué)習(xí)算法的逆襲

“深度學(xué)習(xí)”是目前計(jì)算機(jī)視覺乃至人工智能領(lǐng)域的研究熱點(diǎn),在該方法應(yīng)用于ImageNet大賽之前,第一屆參賽當(dāng)時(shí)冠軍的準(zhǔn)確率(top 5精度)是71.8%,而2011年是74.3%。2012年的冠軍小組采用了深度學(xué)習(xí)的方法一舉將成績提升到84.7%,震驚了機(jī)器學(xué)習(xí)領(lǐng)域,隨后世界各大科研團(tuán)體和公司紛紛投身于深度學(xué)習(xí)領(lǐng)域。截止到目前,這一賽事的精度已經(jīng)達(dá)到95%以上,某種程度上跟人的分辨能力相當(dāng)。

 

DeepID-Net團(tuán)隊(duì)實(shí)驗(yàn)室

據(jù)王曉剛教授介紹,在DeepID-Net團(tuán)隊(duì)的研究中,深度學(xué)習(xí)算法起到了至關(guān)重要的作用,比如在圖像識別的時(shí)候需要提取特征,像顏色、紋理(光滑、粗糙)、形狀等,之前這些特征都需要人工去設(shè)計(jì),有了深度學(xué)習(xí)后,這些特征是可以從大數(shù)據(jù)中自動(dòng)學(xué)習(xí)的,深度學(xué)習(xí)就像飛機(jī)的發(fā)動(dòng)機(jī)一樣,只要做得好,可以帶動(dòng)計(jì)算機(jī)視覺的各個(gè)領(lǐng)域起飛?!皬?9年開始,全球頂尖的小組參加到ImageNet比賽中來,到12年的時(shí)候傳統(tǒng)的計(jì)算機(jī)視覺算法遇到瓶頸,進(jìn)展緩慢。但這一年出現(xiàn)了深度學(xué)習(xí)的方法,對計(jì)算機(jī)視覺來說是革命性的”,王教授說道。

對于計(jì)算機(jī)視覺超越人眼的說法,王教授向記者解釋道,在一些特定任務(wù)上,計(jì)算機(jī)視覺超過人眼是很正常的,人眼其實(shí)并沒有我們想象中的那么高效,“人眼在識別熟人臉的時(shí)候的確非常精準(zhǔn),但在識別陌生人臉的時(shí)候就遠(yuǎn)沒有那么準(zhǔn)確,所以在特定的領(lǐng)域,計(jì)算機(jī)視覺完全可以做到超越人眼的識別準(zhǔn)確率?!钡粝肴娉饺搜?,還有很長的路要走,“計(jì)算機(jī)視覺目前在原理上其實(shí)是在模擬人類,像人的大腦一樣通過分層的神經(jīng)網(wǎng)絡(luò)來提高識別的準(zhǔn)確度。而人自出生以后就不斷的通過眼睛接收外界的信息,接收到的數(shù)據(jù)量非常巨大,以ImageNet為例,計(jì)算機(jī)視覺雖然可以進(jìn)行100萬張圖的大數(shù)據(jù)學(xué)習(xí),與之前相比了長足的進(jìn)步,但和人所看到過的圖片相比,這仍然是一個(gè)微不足道的數(shù)字”,王教授說。不過這也意味著計(jì)算機(jī)視覺在未來有著廣闊的進(jìn)步空間。

計(jì)算機(jī)視覺領(lǐng)域巨頭云集,如何做到彎道超車?

目前各大科研團(tuán)體和公司都在聚焦深度學(xué)習(xí)的研究,谷歌、微軟、Facebook、百度等公司在資源投入方面更是不遺余力,在這種情況下,DeepID-Net團(tuán)隊(duì)是如何做到“彎道超車”的呢?

該論文的第一作者歐陽萬里博士解釋道,谷歌這樣的大公司確實(shí)擁有更多的資源,他們可能會(huì)考慮如何設(shè)計(jì)深度學(xué)習(xí)模型,而深度學(xué)習(xí)的本質(zhì)其實(shí)就是多層神經(jīng)網(wǎng)絡(luò),每一層都可以根據(jù)任務(wù)來進(jìn)行調(diào)整,達(dá)到層與層之間通力合作,并最終大幅提高任務(wù)的準(zhǔn)確度。谷歌可能更傾向于優(yōu)化層與層之間的連接方式和增加層數(shù),DeepID-Net團(tuán)隊(duì)則將重點(diǎn)放在加快模型的驗(yàn)證和訓(xùn)練,在物體識別和模型訓(xùn)練的流程上面做出改變,使得整個(gè)過程能做出更快更準(zhǔn)確的識別結(jié)果,在這個(gè)基礎(chǔ)上進(jìn)行更多的創(chuàng)新,比如在物體識別方面,在描述物體本身時(shí),物體可能是動(dòng)態(tài)的,甚至外表也會(huì)發(fā)生變化,比如一把吉他,它可能是豎著的,也可能是橫著的,甚至可以旋轉(zhuǎn),但這些運(yùn)動(dòng)和形變都是有規(guī)律的,而一個(gè)物體往往不是獨(dú)立的,而是和周圍環(huán)境相關(guān),比如鴨子可以在水上游而不是在天上飛這就需要團(tuán)隊(duì)設(shè)計(jì)一個(gè)新的模型去學(xué)習(xí)這些形變。歐陽萬里博士表示,DeepID-Net團(tuán)隊(duì)的這些創(chuàng)新的研究成果也可以應(yīng)用于谷歌等大公司的模型。

王曉剛教授認(rèn)為,大公司確實(shí)有更多的資金和資源,但是他們可能會(huì)過于依賴自身的這些優(yōu)勢,比如他們可能會(huì)通過增加計(jì)算資源嘗試更多的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)組合,不斷提升成績,而DeepID-Net團(tuán)隊(duì)沒有這些優(yōu)勢,那么就通過創(chuàng)新、優(yōu)化模型和流程,仍然可以達(dá)到同等的甚至更好的研究成果,不過王教授同樣認(rèn)為兩者并不沖突,而是互補(bǔ)的,“我們的研究成果他們可以用,他們做的成果我們也可以用,大家在不同的方向上,但目標(biāo)是一致的。”

論文第一作者歐陽萬里博士

歐陽萬里博士和王曉剛教授向記者強(qiáng)調(diào),雖然DeepID-Net團(tuán)隊(duì)的實(shí)驗(yàn)室硬件資源無法和谷歌等公司相比,但與其他科研團(tuán)體相比則絕對處于一流水準(zhǔn),DeepID-Net團(tuán)隊(duì)的研發(fā)是基于NVIDIA Tesla K40 GPU卡,性能不斷升級的硬件可以讓團(tuán)隊(duì)驗(yàn)證更多的方法,嘗試更多的模型。而NVIDIA已經(jīng)和DeepID-Net團(tuán)隊(duì)聯(lián)合建立了研究中心,為團(tuán)隊(duì)提供硬件和技術(shù)支持,而硬件性能的提升則會(huì)帶來另外一個(gè)問題,隨著技術(shù)的不斷發(fā)展,團(tuán)隊(duì)對硬件的需求也會(huì)隨之變高,現(xiàn)在GPU的性能提升,而團(tuán)隊(duì)設(shè)計(jì)模型也更復(fù)雜,不過此消彼長之下,帶來的是成績的提升。

在談到具體的應(yīng)用領(lǐng)域時(shí),兩位專家一致認(rèn)為,無論是人臉識別還是物體檢測,都有著廣闊的應(yīng)用前景,比如在安防、交通等方面,它可以從一群人中迅速識別出特定的個(gè)體,找到特定的車輛;我們在網(wǎng)絡(luò)上搜索特定圖片,網(wǎng)購時(shí)尋找心儀的商品等等。

目前,DeepID-Net團(tuán)隊(duì)向記者表示,50.3%的物體檢測率雖然已經(jīng)稱冠全球,但與人眼相比準(zhǔn)確度仍然偏低。王曉剛教授表示團(tuán)隊(duì)希望能進(jìn)一步提升檢測率,并且提出了更高難度的任務(wù),比如圖像分割、根據(jù)圖像恢復(fù)三維信息;另外,現(xiàn)在做的只是靜態(tài)的圖像識別,計(jì)算機(jī)視覺在視頻領(lǐng)域還有大量的工作要做,但視頻相比圖像要更為復(fù)雜,信息量也更大,難度將提升一個(gè)數(shù)量級別,DeepID-Net團(tuán)隊(duì)有望在將來挑戰(zhàn)這個(gè)領(lǐng)域。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
【王曉剛】深度學(xué)習(xí)在圖像識別中的研究進(jìn)展與展望
【王曉剛】圖像識別中的深度學(xué)習(xí)
港中大湯曉鷗教授團(tuán)隊(duì)超越谷歌破互聯(lián)網(wǎng)物體檢測世界紀(jì)錄-網(wǎng)易云閱讀
超越微軟、Google、Facebook ! 曠視科技研究院包攬 COCO、Places 三項(xiàng)世界冠...
人工智能“世界杯”落幕,360為何能力壓谷歌微軟奪冠?
李飛飛這堂人工智能公開課 講了那些重要的事實(shí)
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服