早在2017年,一位資深動物行為專家稱,未來10年內,我們使用一種手機大小的裝置便能與動物進行“對話”。如今,在人工智能的幫助下,人類有望打破和動物的語言屏障,真正實現(xiàn)跨物種溝通,進行跨物種情感交流。
從聲音中解碼豬情緒,準確率高達92%
由哥本哈根大學、蘇黎世聯(lián)邦理工學院和法國國家農(nóng)業(yè)、食品和環(huán)境研究所(INRAE)等研究人員組成的國際研究小組首次實現(xiàn)通過聲音分辨豬的各種情緒,該項研究以“Classification of pig calls produced from birth to slaughter according to their emotional valence and context of production”(圖1)為題,發(fā)表在Scientific Reports上。
圖1 研究成果(圖源:Scientific Reports)
研究小組通過收集7000多條豬在整個生命過程中的聲音記錄,應用設計好的人工智能算法,成功解碼豬叫聲中所傳遞的喜怒哀樂。
以往研究表明,豬的發(fā)生可以分為高頻和低頻,高頻叫聲(比如尖叫聲)與消極情緒有關,而低頻叫聲(比如呼嚕聲)則與積極或中性情緒相關。因此,高頻叫聲可以用作豬表達負面情感效價的指標。為了進一步研究豬叫聲與其情緒之間的關聯(lián)性,研究人員設置了各種模擬場景。他們發(fā)現(xiàn),在辨別豬的情緒狀態(tài)方面,兩個特定的聲音特性與頻率也很重要,即叫聲的持續(xù)時間和叫聲的振幅。當豬發(fā)出短促的呼嚕聲時,通常表示自己是快樂的;當這種呼嚕聲變長時,說明豬是存在負面情緒的(圖2)。當豬感到痛苦時,它們便會發(fā)出尖叫聲。簡言之,在積極情緒狀態(tài)下,豬叫聲短且幅度波動很?。环粗?,豬叫聲長且幅度波動大。
圖2 不同情緒狀態(tài)下豬叫聲的差異(圖源:Scientific Reports)
研究人員通過使用機器學習算法,評估是否可以將豬叫聲自動分類到準確的情緒狀態(tài)。算法執(zhí)行結果表明,積極情緒的呼叫聲比負面情緒的呼叫聲更短且振幅更低(圖3)。研究人員稱,這種算法的準確高達92%,可以近乎準確地從豬叫聲中辨別其情緒。
圖3 基于機器算法根據(jù)情緒和環(huán)境對聲豬叫聲進行分類(圖源:Scientific Reports)
研究人員的長遠目標是通過這種算法開發(fā)出一種應用程序,可以實時監(jiān)測豬的情緒狀態(tài),以便更好地指導主人改善動物福利。如果有了足夠的數(shù)據(jù)來支撐算法,那么這種方法也可用來跟其他動物溝通,以感受動物的情緒并及時改善其負面情緒。正如哥本哈根大學的Elodie Briefer博士所說“主人可以用這個程序來改善動物的心情”。
借助算法實現(xiàn)人寵溝通已有先例
當今社會,人與寵物的關系已經(jīng)發(fā)生了根本性變化,寵物的存在很大程度上是為了滿足人的情感需要,并且有研究表明,與寵物互動能夠使人放松,引起心率放緩,血壓降低。因此,我們應該關注并善待任何一種動物。社會各界已經(jīng)開始提倡“動物福利”,其中心就在于如何合理地與動物相處,而要想實現(xiàn)這一目標,人類首先要學會與動物進行有效交流。
日本著名聲學專家鈴木松美博士曾經(jīng)發(fā)明過一款“寵物狗翻譯器”,借助這種新型翻譯機器,寵物主人可以通過寵物的叫聲了解它的喜怒哀樂。這一款寵物翻譯機器是在廣泛研究的基礎上研發(fā)而成,寵物主人只需要將一枚迷你麥克風別在衣領上,所收集到的寵物叫聲便會傳輸?shù)椒g器中進行語音識別和轉換,進而向主人傳達寵物想要表達的意思。
時至今日,科學家們還在朝著實現(xiàn)人寵溝通的方向努力,不斷開發(fā)基于機器學習的動物翻譯技術,以對動物的叫聲進行翻譯,非營利組織Wild Dolphin Project(WDP)便是其中一個典型代表。該組織第一階段的目標是使用一種獨特的非侵入性模型來研究巴哈馬的兩個自由放養(yǎng)海豚群落,記錄海豚的超聲波并憑借三代海豚聲學、姿勢和視覺信號的水下視頻數(shù)據(jù)集,以破解海豚通信密碼。第二階段目標是在解碼海豚發(fā)聲的同時,WDP試圖開發(fā)一種水聲接口CHAT(圖4),這種系統(tǒng)可以使人類通過通過海豚的聲音了解其行動,然后進一步研究開發(fā)海豚和人類之間的雙向通信系統(tǒng)。
圖4 WDP項目成員在入水前檢測CHAT設備(圖源:WAP官網(wǎng))
以機器學習為基礎,
科學家打造跨物種交流的“羅塞塔石碑”
在安徒生童話、愛麗絲夢游仙境等文學作品中,跨物種交流是一個比較常見的話題,在現(xiàn)實中,世界各地的學者們也在試圖通過人工智能等途徑實現(xiàn)跨物種交流。
一群幻想實現(xiàn)人鯨對話的專家們聯(lián)合開展了跨學科前沿項目“鯨類翻譯計劃”(Cetacean Translation Initiative,CETI),該項目成員由來自紐約城市大學、UC伯克利、MIT、哈佛、谷歌研究院和《國家地理》等高校機構的專家共同組成,試圖用先進的機器學習和機器人技術來破譯世界上最神秘的海洋物種之——抹香鯨(圖5)的交流,以期實現(xiàn)人鯨對話。
圖5 抹香鯨(圖源:Project CEIT)
研究人員正在使用“自然語言處理”系統(tǒng)或NLP(人工智能的一個子領域)研究分析抹香鯨的40億種交流代碼,計劃通過人工智能將每個聲音與特定的背景聯(lián)系起來,而這一過程至少需要五年。如果可以順利實現(xiàn)初期目標,下一步可能會開發(fā)“鯨語聊天機器人”,嘗試對抹香鯨的表達做出回應。該研究團隊的長期目標在于實現(xiàn)人鯨對話,他們認為,或許可以借用機器學習的思路,找到跨物種溝通的突破口。如果能夠達成這一目標,人類就能更近一層了解抹香鯨的生活、歷史、社會、行為等方面,從而為保護鯨魚做出更多貢獻。
早在2019年,Science Robotics曾經(jīng)發(fā)表過一項研究,瑞士洛桑聯(lián)邦理工大學的研究人員發(fā)明了一款仿生機器人,在仿生機器人的輔助下,位于奧地利的蜜蜂和位于瑞士的斑馬魚實現(xiàn)了跨地域跨物種的信息交流(圖6)。
圖6 研究成果(圖源:Science Robotics)
仿生機器人是指模仿生物外部形狀的一種機器人系統(tǒng),在這項研究中,為了讓斑馬魚和蜜蜂能進行交流,研究人員設計出機器魚和機器蜂作為斑馬魚和蜜蜂兩個群體的信息傳輸媒介。機器魚和機器蜜蜂的媒介作用在于接收斑馬魚和蜜蜂發(fā)出的信號,并將其翻譯成對方群體能夠聽懂的信號。研究人員一共進行了三次模擬試驗,采取三種不同的信息傳輸方式,觀察兩個群體之間的相互作用,得出以下結論:
1、 蜂群的運動信息通過機器蜜蜂傳輸給魚群時,對斑馬魚的運動產(chǎn)生了影響;
2、 魚群的移動信息通過機器魚傳輸給蜂群時,對蜂群的運動產(chǎn)生了影響;
3、 魚群和蜂群分別同時向機器蜜蜂和機器魚傳輸各自的運動信息,蜂群和魚群的運動相應地受到影響。
以上結果說明蜜蜂和斑馬魚成功向對方傳達了信息,對對方的行動產(chǎn)生了影響,從而進行了“有效交流”。研究人員表示,為了證明跨物種交流的適用性,他們特意選擇了斑馬魚和蜜蜂這兩種在自然界中完全不會相互影響的物種,并將它們的物理距離拉長至680公里,這已經(jīng)足夠證明仿生機器人系統(tǒng)的普遍適用性。
盡管尚不能完全實現(xiàn)跨物種自由交流,但是這項研究創(chuàng)造性地運用仿生機器人作為兩種物種間的媒介,實現(xiàn)了以算法為基礎的跨物種交流,這已經(jīng)成功邁出了跨物種交流的第一步。如果這種技術可以應用到人與動物之間,未來某一天也許我們可以跨越物種障礙實現(xiàn)與其他物種的交流??茖W家們正在進行的各項研究,讓我們看到人工智能或許有望解決人類與動物溝通的障礙。
跨物種語言翻譯
山高路遠,AI還需克服哪些困難
人類的語言有規(guī)律可循,因而不同國家的語言是可以遵循規(guī)律去學習。但動物的語言規(guī)則則存在未知壁壘,通過AI算法將人類語言與動物語言對應,需要大量數(shù)據(jù)的采集和場景的訓練來實現(xiàn)“規(guī)則”的總結。那么AI實現(xiàn)跨物種語言翻譯,需要克服哪些困難?
1、規(guī)則的不確定性
借助于算法實現(xiàn)跨物種溝通,是基于算法沒有人類的某些偏見,但事實證明,對已經(jīng)受人為偏見影響的數(shù)據(jù)進行訓練的算法容易使結果導向“歧途”。比如,狗會發(fā)出急促的叫聲,可能是因為想要向主人乞食,也可能是因為警惕陌生人,還可能是對主人不陪自己玩的責怪。如果它想表達的是這一種,而AI的翻譯器卻傳達為另一種,那么就容易將人和寵物之間的溝通引入“歧途”,從而完全喪失了寵語翻譯的意義了。
2、數(shù)據(jù)的廣泛性和多樣性
動物語言的解讀的工作需要在完善數(shù)據(jù)的基礎上進行。廣泛同步采集動物叫聲和腦電波數(shù)據(jù)并進行比對,并將其納入數(shù)據(jù)庫。然而不同犬種聲帶特點不同,面對同一場景的發(fā)聲表現(xiàn)不同,而這樣的場景卻有無數(shù)個,這為數(shù)據(jù)采集工作帶來了巨大的挑戰(zhàn)。
3、精確判斷的技術性難題
AI要實現(xiàn)精確翻譯需要打通形式和內容端的技術壁壘。然而AI技術尚未發(fā)展到“精確”階段,仍然缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷。以科大訊飛為例,基于深度神經(jīng)算法打造的AI翻譯工具在“信、雅、達”方面仍未完全實現(xiàn)。
4、 不同場景下的聲音內涵判斷
漢語中同一個字在不同場景有不同的表達,動物語言同樣如此。聲音的收集從來不是難點,聲音背后對應的場景才是難點,機器學習在理解場景方面仍然缺乏精確性,這導致對聲音背后的豐富信息難以明確理解。
這些問題無法解決,就會出現(xiàn)“馬什么梅”、“什么冬梅”、“馬冬什么”的“人工智障”場景。
從丹妮絲·赫爾辛的野生海豚項目,到試圖實現(xiàn)人鯨對話的CEIT計劃,再到如今借助AI解碼豬情緒,跨物種交流的相關研究與嘗試一直在繼續(xù),盡管這些研究也曾獲得很大的進展,但是其中的問題也無法被忽視。目前來看,相關研究也僅僅只是在一定程度上實現(xiàn)簡單的信息傳遞,離實現(xiàn)真正的跨物種交流,恐怕還有很長一段路要走。但是,正如北亞利桑那大學名譽教授、動物行為學家 Con Slobodchikoff 所說“計算機技術終于讓我們能夠看到動物世界的內部,向我們展示它們是復雜的生物,值得我們理解和尊重。”我們應該看到盡管從短期來看,要想實現(xiàn)跨物種交流有點天方夜譚,但越來越多的研究無疑為其打開了一扇門。
參考資料:
[1]https://www.projectceti.org/
[2]https://www.pingwest.com/a/252663
[3]Briefer EF, Sypherd CC, Linhart P, et al. Classification of pig calls produced from birth to slaughter according to their emotional valence and context of production. Sci Rep. 2022 Mar 7;12(1):3409. doi: 10.1038/s41598-022-07174-8. PMID: 35256620; PMCID: PMC8901661.
[4]Bonnet F, Mills R, Szopek M, et al. Robots mediating interactions between animals for interspecies collective behaviors. Sci Robot. 2019 Mar 20;4(28):eaau7897. doi: 10.1126/scirobotics.aau7897. PMID: 33137747.
[5]Slobodchikoff CN, Paseka A, Verdolin JL. Prairie dog alarm calls encode labels about predator colors. Anim Cogn. 2009 May;12(3):435-9. doi: 10.1007/s10071-008-0203-y. Epub 2008 Dec 31. PMID: 19116730.
聯(lián)系客服