一、人臉識別技術(shù)識別率99%以上
近年來,安防行業(yè)掀起了一波人臉識別的熱潮,眾多廠商紛紛推出了相關(guān)產(chǎn)品,一時間,人臉識別成為了行業(yè)內(nèi)的熱點技術(shù)方向。據(jù)筆者統(tǒng)計,在2014年的中國國際社會公共安全博覽會上,至少有20家企業(yè)展示了自己的人臉識別產(chǎn)品。其中既有大華股份、??低曔@樣的大安防廠商,也有漢王、銀晨這樣的智能化廠商。同時,眾多媒體也接連報道了人臉識別技術(shù)在學(xué)術(shù)界和工業(yè)界取得的巨大成果:比如今年,騰訊在LFW人臉識別數(shù)據(jù)集上取得了99.65%的識別率,刷新了年初谷歌的記錄;阿里巴巴集團執(zhí)行主席馬云在德國展會上演示了人臉識別與支付寶的結(jié)合應(yīng)用,“刷臉支付”將走向生活。這些振奮人心的消息似乎在清楚地告訴我們,人臉識別已經(jīng)從“夢想”照進“現(xiàn)實”。
本文將從人臉識別技術(shù)原理、應(yīng)用、未來趨勢等方面介紹人臉識別的現(xiàn)狀與未來。無意去潑冷水也無意去注射“強心劑”,希望大家能理性地看待這項技術(shù),營造一個良好的、規(guī)范的行業(yè)環(huán)境。
廠商/機構(gòu)
算法名稱
識別率
騰訊
TENCENT-BESTIMAGE
0.9965±0.0025
谷歌
FACENET
0.9963±0.0009
香港中文大學(xué)
DEEPID3
0.9953±0.0010
北京曠視科技
FACE++
0.9950±0.0036
表1: 在LFW無約束、有標注的室外照片集上的照片人臉識別率結(jié)果
二、人臉識別技術(shù)結(jié)合人工確認,應(yīng)用將更加妥當(dāng)
1. 人臉識別應(yīng)用廣泛
人臉識別的應(yīng)用范圍很廣,從門禁、設(shè)備登錄到機場、公共區(qū)域的監(jiān)控。表2給出了一些人臉識別的應(yīng)用領(lǐng)域。
類別
應(yīng)用領(lǐng)域
人臉驗證
駕照、簽證、身份證、護照、投票選舉等
接入控制
設(shè)備存取、車輛訪問、智能ATM、電腦接入、程序接入、網(wǎng)絡(luò)接入等
安全
反恐報警、登機、體育場觀眾掃描、計算機安全、網(wǎng)絡(luò)安全等
監(jiān)控
公園監(jiān)控、街道監(jiān)控、電網(wǎng)監(jiān)控、入口監(jiān)控等
智能卡
用戶驗證等
執(zhí)法
嫌疑犯識別、欺騙識別等
人臉數(shù)據(jù)庫
人臉檢索、人臉標記、人臉分類等
多媒體管理
人臉搜索、人臉視頻分割和拼接等
人機交互
交互式游戲、主動計算等
其他
人臉重建、低比特率圖片和視頻傳輸?shù)?div style="height:15px;">
表2:人臉識別的應(yīng)用領(lǐng)域
以公安應(yīng)用為例,利用人臉檢索系統(tǒng),將目標人臉輸入到系統(tǒng)中,系統(tǒng)將自動在海量人口數(shù)據(jù)庫中進行查找比對,列出前若干名相似的人員信息。然后再通過人工干預(yù)的方式,對系統(tǒng)結(jié)果進行篩選,得到目標的真實身份。公安行業(yè)還有一類比較重要的應(yīng)用:人員布控——在一些重要的通道出入口,部署高清探頭,專門用于抓拍經(jīng)過的人臉并傳送給后端系統(tǒng),后端系統(tǒng)將人臉圖片與所關(guān)注的人臉庫(如在逃嫌疑犯等)進行逐一比對,當(dāng)發(fā)現(xiàn)有目標與庫中人員相似度超過設(shè)定閾值時,系統(tǒng)自動提示相關(guān)人員采取措施。
2. 人臉識別技術(shù)結(jié)合人工確認,應(yīng)用將更加妥當(dāng)
雖然人臉識別技術(shù)功用巨大,但在實際應(yīng)用中,我們往往會遇到很多問題。人臉圖像質(zhì)量對識別率的影響較高,圖像質(zhì)量差,辨識度低,有效特征很少,有時即使用肉眼也很難確認身份。圖像質(zhì)量又受多種因素影響,如光照、姿態(tài)、表情、人臉尺寸、清晰度等。圖3是同一個人在不同光照下的圖片,很直觀地可以看出,即使是同一個人,在不同光照下用肉眼也很難辨別。所以說,目前的人臉識別系統(tǒng)只能在一些較規(guī)范的環(huán)境下進行,光線均勻,人臉需要正對著攝像機,并保證人臉在畫面中有一定的像素寬度。但是在實際的安防監(jiān)控場合中,這些限制條件很難一一滿足。
圖2 同一個人在不同光照下的圖片
第二個問題是隨著人臉數(shù)據(jù)庫規(guī)模的不斷擴大,識別率也會隨之下降。傳統(tǒng)的人臉識別算法在訓(xùn)練階段能夠利用的數(shù)據(jù)樣本有限,訓(xùn)練出來的算法模型并沒有特別好的泛化能力。特別是在百萬、千萬級的人臉檢索任務(wù)中,結(jié)果并不理想。所以,控制數(shù)據(jù)庫規(guī)??梢灾苯佑绊憫?yīng)用的識別結(jié)果。例如,前文表1中的某家企業(yè)曾做過一項有趣的測試,其開發(fā)的Face++算法曾在LFW數(shù)據(jù)集上達到99.5%的準確率,但是在一個真實的安防認證應(yīng)用中,他們發(fā)現(xiàn),處理真實場景的人臉識別時,機器與人還存在非常明顯的差距。他們在一個百萬級的中國人群測試集上進行測試,當(dāng)錯誤接受率(FAR)設(shè)定在1e-5時,識別準確率僅為66%,這樣的性能顯然無法滿足安防認證應(yīng)用的需求。而對其中錯判的樣例進行人工測試識別時發(fā)現(xiàn),90%的錯判結(jié)果都可以被人準確判斷。也許換一種思路,將機器識別和人工確認相結(jié)合,對于現(xiàn)在的許多應(yīng)用來說更加妥當(dāng)。
3.行業(yè)標準也在日益完善
為了規(guī)范行業(yè)應(yīng)用,國家和行業(yè)相關(guān)標準委員會也做了很多努力。相關(guān)部門已經(jīng)制訂并發(fā)布了五項人臉識別標準,分別是《GA/T 922.2-2011 安防人臉識別應(yīng)用系統(tǒng) 第2部分:人臉圖像數(shù)據(jù)》、《GA/T 1093-2013 出入口控制人臉識別系統(tǒng)技術(shù)要求》、《GA/T 1126-2013 近紅外人臉識別設(shè)備技術(shù)要求》、《GA/T 1212-2014 安防人臉識別應(yīng)用防假體攻擊測試方法》和《GB/T 31488-2015 安全防范視頻監(jiān)控人臉識別系統(tǒng)技術(shù)要求》。這些標準有利于統(tǒng)一測試標準和應(yīng)用場景,得到對相關(guān)產(chǎn)品的準確評價,進而規(guī)范市場環(huán)境,變無序為有序,無論是對廠商還是用戶來說,都有著非常重要的意義。
三、目前人臉識別理性回歸
在城市治安監(jiān)控中,雖然對人臉識別的需求很大,但是到目前為止,從技術(shù)上還達不到在治安畫面中實現(xiàn)識別的水平。原因主要有三點:治安監(jiān)控看的往往是大局,即使在沒有遮擋的情況下,人臉在圖像中不夠清晰,像素點達不到識別要求;治安監(jiān)控是由高往下看,這種角度下,與正面的平面圖像相貌相差較大;光照影響,在露天環(huán)境下,常常因為背光使得人臉發(fā)黑,無法辨別,或者局部發(fā)黑,形成陰陽臉,這也極大的影響識別的效果。因此,在治安監(jiān)控環(huán)境下,進行人臉識別是目前還實現(xiàn)不了的。
但是,也有不少項目中使用了該技術(shù),在交通樞紐的安檢口,如飛機安檢口、火車站安檢口進行人臉識別的試點,把過往乘客的抓拍照片與在逃庫進行比對,希望達到追逃的效果。在安檢處設(shè)立人臉抓拍機正好彌補了一般治安監(jiān)控的不足:專機專用,保證臉部圖像的像素;角度相對較低,容易拍到人臉的正面圖像;在室內(nèi),無光照變化影響,同時光源分布均勻,無陰陽臉的現(xiàn)象。雖然在成像上克服了治安監(jiān)控的不足,但是筆者認為這樣的應(yīng)用還是難以大面積的推廣,原因有:職責(zé)不清——交通樞紐站的職責(zé)是保持上下客的次序,抓逃不是其工作內(nèi)容,這些職能部門確實也不應(yīng)該去做抓逃的事,除非有硬性規(guī)定;風(fēng)險大于收益——人臉識別只是返回一個相識度比較結(jié)果,對于其身份并無確認能力,而13億中國人中相貌類似的很多,誤判的可能性很大,結(jié)果沒抓到正確的人反而引來旅客的投訴就不劃算了;容易偽裝——有心躲避的逃犯通過粘貼假胡子、帶墨鏡等偽裝可以很容易騙過機器的識別。
那么,是否人臉識別技術(shù)在平安城市中就沒有用武之地了呢?答案是否定的。移動終端與云計算的興起給了人臉識別一個打翻身戰(zhàn)的好機會。
前面說到的治安應(yīng)用與交通樞紐的應(yīng)用都是非接觸式,這些都受制于因為識別的條件與效果。但如果民警要求嫌疑人擺正位置,用手機或其他終端對其人像進行拍攝,并把人臉圖片傳回到數(shù)據(jù)中心進行身份識別,這樣的準確率是很高的,而且業(yè)務(wù)上也有這樣的需求,如民警進行外來人口聚集地排查,當(dāng)對方不提供身份證時,可用類似的方法確認其身份;另外,對于一些沒有身份證信息的尸體,只要面部特征完好,也可以用類似的方法快速確認其身份。由于身份證庫巨大,在真正實施中,還需要應(yīng)用到云計算的技術(shù)進行分布式處理。
四、從技術(shù)與產(chǎn)品角度看人臉識別發(fā)展趨勢
1.人臉識別技術(shù)基于大數(shù)據(jù)的深度學(xué)習(xí)
在人臉識別原理一節(jié)中提到了一些特征提取和分類算法,可以理解為是一種淺層的學(xué)習(xí)模型。淺層學(xué)習(xí)可以在一定規(guī)模的數(shù)據(jù)集下可以發(fā)揮較強的表達能力,但當(dāng)數(shù)據(jù)量不斷增大時,這些模型就會處于欠擬合的狀態(tài)。通俗點說就是數(shù)據(jù)量太大,模型不夠復(fù)雜,覆蓋不了所有數(shù)據(jù)。所以說,深度學(xué)習(xí)是近年來特別熱門的研究課題。
表1中的4種算法都是深度學(xué)習(xí)技術(shù)的擴展。因此基于大數(shù)據(jù)的深度學(xué)習(xí),將是未來人臉識別技術(shù)的主要趨勢之一。深度學(xué)習(xí),往往含有更深的層次結(jié)構(gòu)。越是低層,特征越簡單,越是高層,特征越抽象,但越接近所要表達的意圖。舉個例子,從字到詞,再到句,到語義,是層層深化的過程,這就是一個典型的深層結(jié)構(gòu)。回到圖像分析的范疇,對于一個圖片來說,最低級的特征是像素,也就是0到255的矩陣。通過像素,無法理解圖片里的目標是什么,但我們可以從像素中找到了邊緣特征,然后用邊緣特征組合成不同的部件,最后形成了不同種類的目標物,這個才是我們所想要實現(xiàn)的。
利用深度學(xué)習(xí)提取出的人臉特征,相比傳統(tǒng)技術(shù),更能表示人臉之間的相關(guān)性,輔之有效的分類方法,能夠顯著提高算法識別率。深度學(xué)習(xí)非常依賴大數(shù)據(jù),這也是為什么這項技術(shù)在近幾年取得突破的原因。更多更豐富的樣本數(shù)據(jù)加入到訓(xùn)練模型中,意味著算法模型將更通用,更貼近現(xiàn)實世界模型。另一方面,深度學(xué)習(xí)的理論性還需要加強,模型還需要優(yōu)化。這一點,相信在眾多學(xué)術(shù)界和工業(yè)界同仁的努力下,深度學(xué)習(xí)將取得更大的成功。屆時人臉識別應(yīng)用,或許能如現(xiàn)在的車牌識別技術(shù)一樣,深入到我們的生活中。
圖3 分層特征學(xué)習(xí)示意圖
2. 3D人臉識別技術(shù)
3D人臉識別技術(shù)是未來的另外一個趨勢。本文到目前為止所討論的范疇限定在2D圖像上。人臉實質(zhì)上是一個立體模型,而2D人臉識別容易受到姿態(tài)、光照、表情等因素影響,是因為2D圖像本身有一個缺陷,無法很好地表示深度信息。如果說深度學(xué)習(xí)是從人的認知角度來理解人臉識別,那么3D技術(shù)就是從現(xiàn)實模型來反映人臉識別。
目前關(guān)于3D人臉識別方向的算法研究并沒有2D人臉識別技術(shù)那么豐富和深入,許多因素限制了這項技術(shù)的發(fā)展。首先,3D人臉識別往往需要特定的采集設(shè)備,如3D攝像機或雙目攝像機。目前這類采集設(shè)備價格還比較昂貴,主要用于特定場景。其次,3D建模過程需要的計算量較大,對硬件要求較高,也限制了目前的應(yīng)用。第三,3D人臉識別數(shù)據(jù)庫比較稀少,研究者缺少訓(xùn)練樣本和測試樣本,無法開展更深入的理論研究。相信隨著未來芯片技術(shù)和傳感器的發(fā)展,當(dāng)計算能力不再收到制約,3D采集設(shè)備成本大幅下降的時候,3D人臉識別將取得重要突破。
五、結(jié)語
近年來安防行業(yè)的迅速發(fā)展,為人臉識別應(yīng)用提供了可以發(fā)揮的舞臺,另一方面,人臉識別技術(shù)的發(fā)展又為安防行業(yè)開拓了新的市場。有業(yè)內(nèi)人士指出,智能視頻分析將是大安防市場未來的發(fā)展方向之一,而人臉識別是其中非常重要的技術(shù)和應(yīng)用。
在市場需求不斷變化的今天,人臉識別技術(shù)雖然取得了一定的突破,但仍然面臨著許多挑戰(zhàn),無論是廠商還是用戶,都需要正視目前存在的困難,迎接挑戰(zhàn),在項目中不斷磨練,產(chǎn)品和技術(shù)才會趨于實用,性能和品質(zhì)才能不斷提升。當(dāng)然,國家和行業(yè)標準正逐步地建立與實施,在標準的引導(dǎo)下,人臉識別產(chǎn)品和技術(shù)迎來新一輪的發(fā)展也會是必然趨勢。
【聲明】轉(zhuǎn)載本微信平臺原創(chuàng)文章時應(yīng)遵循以下規(guī)則:1、保持原創(chuàng)文章中圖表、圖片、音視頻的完整性;2、完整標注文章作者[文章前后有說明];3、轉(zhuǎn)載原創(chuàng)中部分內(nèi)容也要完整標注來源'中國安全防范產(chǎn)品行業(yè)協(xié)會',違者本協(xié)會將依法追究。