大數(shù)據(jù)文摘出品
作者:劉俊寰
俗話說(shuō)得好,相由心生。
在中國(guó),面相是陰陽(yáng)五行學(xué)說(shuō)的重要分支,古人認(rèn)為,只要把握規(guī)律就可從面部特征中推算出一個(gè)人的命運(yùn)走勢(shì)和富貴貧賤。
但隨著科學(xué)技術(shù)的發(fā)展,我們逐漸拋棄了這個(gè)概念,算命先生由此成了玄學(xué)的代言人,面相這個(gè)概念也和“封建迷信”聯(lián)系在了一起。
用AI為面相研究正名也不是什么新鮮事了,比如之前大火的“面相研究所”,不過(guò)現(xiàn)在看來(lái),或許面相研究是假,坑錢是真。那么,用AI看面相就這么宣告失敗了嗎?
現(xiàn)在,新證據(jù)來(lái)了,而且是目前最有力的證據(jù),研究表明,一個(gè)人的面相與性格存在著很大關(guān)系,以面相識(shí)人也存在可循的規(guī)律。
5月22日,Nature發(fā)表了一篇論文,由莫斯科大學(xué)(Moscow universities),HSE大學(xué)(高等經(jīng)濟(jì)學(xué)院,Higher School of Economics)和開(kāi)放大學(xué)人文與經(jīng)濟(jì)學(xué)院(Open University for the Humanities and Economics)組成的研究團(tuán)隊(duì)征集了12000名志愿者,利用31000張自拍,學(xué)習(xí)了128種人臉特征,在與志愿者自己填寫(xiě)的信息相比之后,研究者們發(fā)現(xiàn),AI識(shí)別的準(zhǔn)確率達(dá)到了58%,并且,AI的表現(xiàn)比算命先生更穩(wěn)定。
論文鏈接如下,感興趣的朋友們可千萬(wàn)別錯(cuò)過(guò)了:
https://www.nature.com/articles/s41598-020-65358-6
為了打破“看面相=玄學(xué)”的刻板印象,研究團(tuán)隊(duì)招募到了12000名志愿者,收集到了31000張自拍,在此基礎(chǔ)上,還用到神經(jīng)網(wǎng)絡(luò)評(píng)估了人臉的128個(gè)特征,比如嘴巴寬度、嘴唇或眼睛高度,確保了實(shí)驗(yàn)覆蓋的數(shù)據(jù)量級(jí)和多樣性。
為了進(jìn)一步地確保實(shí)驗(yàn)的準(zhǔn)確性和客觀性,得到數(shù)據(jù)之后,研究人員將數(shù)據(jù)分為兩組,一個(gè)用來(lái)訓(xùn)練AI,一個(gè)用來(lái)用來(lái)測(cè)試神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性。
在對(duì)志愿者識(shí)別結(jié)果的分類上,研究人員參考了五大人格特征(Big Five),即責(zé)任心(conscientiousness)、神經(jīng)質(zhì)(neuroticism)、外向性(extraversion)、親和性(agreeableness)、開(kāi)放(openness)。
在結(jié)果中,除了面相與性格的關(guān)系,研究人員還針對(duì)此對(duì)不同標(biāo)簽下的群體可能過(guò)著的生活進(jìn)行了調(diào)查和總結(jié),讓實(shí)驗(yàn)結(jié)果更貼近生活,也…更有“AI版算命先生”內(nèi)味兒了。
比如,在AI看來(lái),從長(zhǎng)相中也能看出一個(gè)人到底掙得多不多。系統(tǒng)認(rèn)為,性格越開(kāi)放的人,他們的收入往往越高,如下圖所示,從左至右就是開(kāi)放度從低到高的變化過(guò)程。
想知道自己掙得多不多,可以對(duì)比一下自己的面相和下圖右邊的面相到底有幾分相似。
除此之外,一個(gè)有責(zé)任心的人的面相變化也是有變化規(guī)律的,從左到右,一個(gè)人的責(zé)任心逐漸增強(qiáng),同時(shí),一個(gè)有責(zé)任心的人身體健康的可能性也越大,與周圍人的關(guān)系也會(huì)更融洽。
下圖從左至右表現(xiàn)的是一個(gè)人的性格從內(nèi)向逐漸向外向的變化,研究者發(fā)現(xiàn),外向的人在生活中更容易獲得快樂(lè),也更喜歡挑戰(zhàn)自己,比如他們會(huì)更喜歡刺紋身。
在神經(jīng)質(zhì)的標(biāo)簽下,一個(gè)人的面相變化如下圖所示,可以想見(jiàn),他們會(huì)遇到更多的心理健康問(wèn)題,也更需要朋友和親人的支持。
親和的人在各個(gè)場(chǎng)合下都很受歡迎,他們身邊也往往有很多可以傾心的朋友,這類人的面相變化如下圖所示。
在對(duì)結(jié)果的評(píng)判上,研究者們以志愿者們自己填寫(xiě)的資料為標(biāo)準(zhǔn),確保在實(shí)驗(yàn)前,AI系統(tǒng)并沒(méi)有關(guān)于這個(gè)人的任何信息。
以性別為軸,AI對(duì)女性的識(shí)別比男性更為準(zhǔn)確,在五個(gè)性格標(biāo)簽分類上,AI對(duì)責(zé)任心的識(shí)別最準(zhǔn)確??偟膩?lái)說(shuō),AI的識(shí)別準(zhǔn)確率達(dá)到了58%,在50%的時(shí)間內(nèi),AI識(shí)別的結(jié)果都是準(zhǔn)確的,并且,他們將AI與人類算命先生比較后發(fā)現(xiàn),AI的表現(xiàn)更穩(wěn)定。
論文共同作者Evgeny Osin表示,一個(gè)人的面部包含了很多信息,可以從中看到人的內(nèi)在,“借助AI選擇另一半,可以幫助個(gè)人獲得更令人滿意的互動(dòng)結(jié)果”。
論文中指出,該AI系統(tǒng)可以幫助老板面試員工,也可以運(yùn)用到相親網(wǎng)站上進(jìn)行更好地匹配對(duì)象,在客戶服務(wù)、在線輔導(dǎo)等領(lǐng)域都可以發(fā)揮很大的作用。
Osin說(shuō):“我們的研究結(jié)果表明,即使是沒(méi)有條件限制下拍攝的照片,也可以用復(fù)雜的計(jì)算機(jī)視覺(jué)算法來(lái)預(yù)測(cè)人格特質(zhì)。我們方法的優(yōu)勢(shì)在于它相對(duì)簡(jiǎn)單,不依賴3D掃描儀或3D面部地標(biāo)地圖,可以使用臺(tái)式計(jì)算機(jī)輕松實(shí)現(xiàn)?!?/p>
研究最初的樣本參與者達(dá)到25202名,照片總數(shù)達(dá)到了77346張,經(jīng)過(guò)數(shù)據(jù)篩選程序,最終得以保留的數(shù)據(jù)集包含12447份有效問(wèn)卷和31367張照片。
這些參與者的年齡介于18至60歲之間,其中女性占比59.4%,男性占比40.6%。在實(shí)驗(yàn)中的兩類數(shù)據(jù)上,用于訓(xùn)練的數(shù)據(jù)集占比90%,用于驗(yàn)證的數(shù)據(jù)集占比10%,驗(yàn)證數(shù)據(jù)集包括505位提供1224張面部圖像的男性和740位提供1913張圖像的女性。
實(shí)驗(yàn)所用的照片都保證了充足的光線,沒(méi)有其他人,也統(tǒng)一了不帶妝,以及保持無(wú)表情的狀態(tài)。
在AI系統(tǒng)的設(shè)計(jì)上,研究人員開(kāi)發(fā)了一種計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)(NNCV),旨在確定靜態(tài)面部圖像的不變特征,將一張臉與另一張臉區(qū)分開(kāi),但在同一人的不同圖像中保持不變。在拍攝靜態(tài)單色圖像(大小為224×224像素)后,NNCV能生成128個(gè)32位尺寸矢量,這些矢量描述了源圖像中的獨(dú)特面部特征。
同時(shí),研究團(tuán)隊(duì)訓(xùn)練了人格診斷神經(jīng)網(wǎng)絡(luò)(NNPD),該網(wǎng)絡(luò)被實(shí)現(xiàn)為多層感知器。NNPD將從NNCV獲得的不變量的向量作為輸入,預(yù)測(cè)輸出五種人格特質(zhì),整個(gè)過(guò)程分別針對(duì)男性和女性面部識(shí)別進(jìn)行。
計(jì)算機(jī)視覺(jué)神經(jīng)網(wǎng)絡(luò)和個(gè)性診斷神經(jīng)網(wǎng)絡(luò)(NNPD)的層體系結(jié)構(gòu)如下圖所示:
正如Evgeny Osin所說(shuō),面部實(shí)際上包含著大量信息,除了鑒定性格,在其他領(lǐng)域,AI也有較好的發(fā)展。
比如醫(yī)療,去年1月,Nature Medicine刊登了一篇論文,論文中提出了一種深度學(xué)習(xí)算法DeepGestalt,該算法能在兒童身上檢測(cè)出罕見(jiàn)遺傳病,而利用到的,正是面部照片。
這項(xiàng)輔助診斷方法搭載到名為Face2Gene的智能手機(jī)APP上,該應(yīng)用依靠深度學(xué)習(xí)算法和類腦神經(jīng)網(wǎng)絡(luò),用以區(qū)分人類照片中與先天性和神經(jīng)發(fā)育障礙有關(guān)的獨(dú)特面部特征,利用從照片中推斷出的模式,最終可以得出可能的診斷結(jié)果,同時(shí)提供可能的選項(xiàng)列表。
在識(shí)別遺傳病Top-10上,Face2Gene準(zhǔn)確率高達(dá)91%,已經(jīng)超過(guò)了人類醫(yī)生,如果在未來(lái)能夠針對(duì)已知問(wèn)題持續(xù)改進(jìn),就可以更好地幫助全球兒童獲得更好的醫(yī)療條件。
更早的例子發(fā)生在2016年,上海交通大學(xué)武筱林和張熙在預(yù)印本網(wǎng)站上發(fā)表論文《使用臉部圖像自動(dòng)推斷罪犯》(Automated Inference on Criminality Using Face Images),在論文中,吳和張指出,機(jī)器學(xué)習(xí)技術(shù)可以預(yù)測(cè)一個(gè)人是否是犯罪分子(不是犯罪嫌疑人),準(zhǔn)確度幾乎可以達(dá)到90%,他們使用的數(shù)據(jù)僅僅是證件照片。
不過(guò),論文一出,迅速引發(fā)了AI在倫理方面的爭(zhēng)議。一名留學(xué)在外的上海交大校友甚至公開(kāi)表示:“我建議撤銷這篇論文,并且上傳一封公告,為不恰當(dāng)?shù)难芯糠椒ㄖ虑浮!薄斑@篇論文給上海交大的聲譽(yù)帶來(lái)了很糟糕的影響,這對(duì)那些申請(qǐng)美國(guó)高校的上海交大學(xué)子來(lái)說(shuō),將會(huì)是一場(chǎng)災(zāi)難?!?/p>
不僅如此,谷歌研究員寫(xiě)了兩萬(wàn)字長(zhǎng)文對(duì)該論文進(jìn)行批判,Blaise Agüera y Arcas等人一致認(rèn)為,該論文在實(shí)驗(yàn)精度、材料選取、輸入內(nèi)容,和客觀性上都存在較大的問(wèn)題。
論文中使用的6張照片:上排是“罪犯”,下排是“非犯罪分子”。上排的人都皺著眉頭而下排沒(méi)有。谷歌研究人員認(rèn)為,深度學(xué)習(xí)系統(tǒng)可能只是“學(xué)會(huì)”了這些表面的區(qū)別。
他們指出,機(jī)器學(xué)習(xí)可以用作正途,也有被誤用的可能,后者往往是無(wú)意的,這種誤用源于對(duì)技術(shù)問(wèn)題狹隘的偏執(zhí),包括以下四個(gè)方面:
之所以上海交大的事件能引起廣泛關(guān)注,是因?yàn)?strong>這項(xiàng)技術(shù)在科學(xué)和法律這兩種絕對(duì)理性的權(quán)威力量上進(jìn)行了引用和概括。如果只是針對(duì)此事進(jìn)行討論,面相結(jié)構(gòu)其實(shí)是社會(huì)建構(gòu)的產(chǎn)物,一個(gè)人的成長(zhǎng)過(guò)程、成長(zhǎng)環(huán)境都能對(duì)其產(chǎn)生影響,甚至拍攝照片時(shí)的燈光、情緒等都是不確定因子,當(dāng)這些不確定因素聚集起來(lái),論文中宣稱的90%準(zhǔn)確率還剩下多少可信度?
當(dāng)我們跳出上海交大事件,從更大的維度上說(shuō),面部信息的確是尚待開(kāi)發(fā)的廣闊領(lǐng)域,如果能利用其在社會(huì)不平等上做出貢獻(xiàn),如DeepGestalt,那自然是喜聞樂(lè)見(jiàn)。但是還需要注意的是,如果完全依賴這些數(shù)據(jù),似乎也犯下了本質(zhì)主義的過(guò)錯(cuò),或者說(shuō),帶有了優(yōu)生學(xué)的意味。
如今,借由疫情而起,攝像頭部署越來(lái)越密集,監(jiān)控也越來(lái)越大膽,在這樣的情況之下,我們應(yīng)該如何有效避免技術(shù)走向它的反面,應(yīng)該怎樣為技術(shù)敲響警鐘。
這一點(diǎn),現(xiàn)在很重要,未來(lái)會(huì)越來(lái)越重要。
聯(lián)系客服