發(fā)布 | 大腦中文詞匯理解(語(yǔ)義認(rèn)知圖譜)數(shù)據(jù)集,探索大腦語(yǔ)言理解機(jī)理
【摘要】近日,自動(dòng)化所團(tuán)隊(duì)構(gòu)造了一個(gè)大腦中文詞匯理解(語(yǔ)義認(rèn)知圖譜)數(shù)據(jù)集,該數(shù)據(jù)集有望為后續(xù)深入研究大腦語(yǔ)言理解機(jī)理提供數(shù)據(jù)基礎(chǔ)。語(yǔ)言認(rèn)知是人類智能最顯著的體現(xiàn)。大腦如何在多模態(tài)環(huán)境中表征詞匯含義,如何將詞匯含義整合為更大粒度語(yǔ)言單元的含義,以及如何進(jìn)行知識(shí)記憶和推理都是人類迫切希望破解的謎題。新近興起的認(rèn)知神經(jīng)科學(xué)研究結(jié)合神經(jīng)影像學(xué)和計(jì)算機(jī)建模手段,已經(jīng)能在一定程度上從人腦活動(dòng)模式中推測(cè)出其所正在觀察的物體和正在思考的詞匯和句子,為人們揭示語(yǔ)義記憶和整合的神經(jīng)機(jī)制并最終解碼思維和腦神經(jīng)活動(dòng)間的映射關(guān)系點(diǎn)燃了希望。語(yǔ)義記憶需要表征外部世界中的各種概念。盡管在目前對(duì)物體和名詞語(yǔ)義的研究中,人們已經(jīng)取得了十分可喜的突破,但對(duì)其他類型的語(yǔ)義表征(如動(dòng)詞,抽象詞、功能詞等)還缺乏充分的研究和了解。大部分已有研究都集中在英文上,對(duì)于中文的神經(jīng)編碼研究相對(duì)較少,對(duì)于不同語(yǔ)言之間的大腦編碼的區(qū)別和聯(lián)系并不清楚。針對(duì)上述問(wèn)題,團(tuán)隊(duì)構(gòu)造了一個(gè)大腦在理解中文詞匯含義時(shí)的神經(jīng)影像數(shù)據(jù)集,希望為后續(xù)深入研究大腦語(yǔ)言理解機(jī)理提供數(shù)據(jù)基礎(chǔ)。
隨著技術(shù)的進(jìn)步,腦電圖(EEG)、腦磁圖(MEG)、正電子發(fā)射斷層成像(PET),功能磁共振(fMRI)等技術(shù)相繼出現(xiàn),為研究正常大腦的語(yǔ)言功能提供了有力手段。其中,團(tuán)隊(duì)采用fMRI采集神經(jīng)影像數(shù)據(jù),這是一種沒(méi)有放射性、無(wú)創(chuàng)性的檢測(cè)腦功能動(dòng)態(tài)活動(dòng)的手段。其檢測(cè)腦組織血流和含氧量變化引起的磁場(chǎng)變化,一次成像可以同時(shí)獲取功能和解剖圖像, 已經(jīng)被廣泛應(yīng)用于腦的基礎(chǔ)研究和臨床治療。如何采集大腦的中文詞匯理解數(shù)據(jù)?? 首先,團(tuán)隊(duì)從同義詞詞林中選出不同詞類的代表性詞匯672個(gè)(涵蓋了312個(gè)名詞、262個(gè)動(dòng)詞和98個(gè)形容詞);? 然后,利用fMRI技術(shù)采集不同被試在理解這些詞匯時(shí)的神經(jīng)影像數(shù)據(jù);? 最后,進(jìn)行數(shù)據(jù)處理還原不同被試?yán)斫饷總€(gè)詞匯時(shí)的大腦激活數(shù)據(jù)。此次實(shí)驗(yàn)分29次進(jìn)行(每次1-2小時(shí)),共采集了約58小時(shí)神經(jīng)影像數(shù)據(jù),其中有11個(gè)被試采集了完整的672個(gè)詞匯的語(yǔ)言理解數(shù)據(jù)。這是目前最大規(guī)模的詞匯理解fMRI數(shù)據(jù),可用于后續(xù)探索人腦詞匯表征規(guī)律,進(jìn)而啟發(fā)更加智能的詞匯表征模型。下面展示單一被試部分詞匯的fMRI激活圖:
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。