引語(yǔ):大家在做漢譯英時(shí),肯定會(huì)遇到一個(gè)痛點(diǎn):不知道詞匯搭配或某個(gè)詞的具體用法,進(jìn)而導(dǎo)致用詞不當(dāng)。實(shí)際上,除了個(gè)人平時(shí)的閱讀積累,漢譯英還與寫(xiě)作水平有關(guān)。但是再牛的大咖也不可避免遇到某些詞組搭配問(wèn)題,想要快速查到權(quán)威表達(dá),并不是一件容易的事。今天就為大家介紹一下世界上最權(quán)威的語(yǔ)料庫(kù)之一:美國(guó)當(dāng)代英語(yǔ)語(yǔ)料庫(kù)(Corpus of Contemporary American English,簡(jiǎn)稱COCA)的用法。COCA用起來(lái)很棒,功能豐富,但是操作要難一些,所以小伙伴們想熟練使用,平時(shí)就要多實(shí)踐。
本文只能介紹一些常用的操作技能,更多技能,歡迎大家下來(lái)探索,同時(shí)歡迎各位大咖留言。
01
一、與傳統(tǒng)詞典相比,COCA 的優(yōu)勢(shì)
(1)文本實(shí)時(shí)性強(qiáng)。
COCA從1999年創(chuàng)立至今持續(xù)保持更新,每年都要更新大約2000萬(wàn)的詞匯數(shù)量,所以比起普通的詞典,COCA 則包含更多的最新語(yǔ)料。比如Trumpism、post-truth這樣的詞,很多傳統(tǒng)詞典都沒(méi)有收錄,但在語(yǔ)料庫(kù)中都可以查到。
(2)搜索速度較快。
即使有這么龐大的語(yǔ)料庫(kù),但在COCA 搜尋的速度依然較快,能在短時(shí)間內(nèi)找到結(jié)果。說(shuō)明一下,在不登錄的情況下,每個(gè)用戶每天可以使用10到15次的搜尋。注冊(cè)一個(gè)賬號(hào)之后,就可以增加使用搜尋功能的次數(shù)。但用戶即便是注冊(cè)了賬號(hào),在連續(xù)查詞后,也可能會(huì)出現(xiàn)延遲,然后會(huì)看到這個(gè)提示:
若看到此圖,先返回到Search,再點(diǎn)一下搜索,或等它恢復(fù)正常,就可以了。
(3)來(lái)自專業(yè)正式文本,更接近正式的語(yǔ)法。
COCA的語(yǔ)料來(lái)自于美國(guó)英語(yǔ)使用情境下的口語(yǔ)演講、小說(shuō)書(shū)籍、雜志報(bào)紙、學(xué)術(shù)期刊,比起搜尋網(wǎng)絡(luò)用語(yǔ)素材,COCA的語(yǔ)料來(lái)自于有更多嚴(yán)謹(jǐn)檢查與使用的專業(yè)或正式文件,所以相對(duì)起來(lái)更能避開(kāi)有爭(zhēng)議的方法,而更接近正式的語(yǔ)法。
這對(duì)有漢譯英文稿翻譯、英文正式報(bào)告、英文職場(chǎng)書(shū)信需求的使用者來(lái)說(shuō),提供了更專業(yè)正確的查詢渠道,并且查詢時(shí)可以找到各種詞匯在這些文件里的使用方法參考。
(4)語(yǔ)料庫(kù)可以提供單詞的詞頻信息。
提供單詞的詞頻信息將有助于我們了解該單詞在實(shí)際應(yīng)用中的出現(xiàn)頻率,從而實(shí)現(xiàn)準(zhǔn)確用詞。
(5) 語(yǔ)料庫(kù)還能提供模糊搜索、同義詞、單詞搭配、搜尋一個(gè)詞匯的所有變化型態(tài)等的功能。
02
二、界面簡(jiǎn)介
(一)基礎(chǔ)界面
List: 列表視圖,默認(rèn)視圖。
Chart: 用于比較檢索項(xiàng)在五種領(lǐng)域和不同時(shí)間段內(nèi)的分布。
Collocates: 用于研究詞語(yǔ)搭配,比如thick/look into后跟哪些名詞,money前的動(dòng)詞等。
Compare: 用于比較兩個(gè)詞的搭配現(xiàn)象,研究在意義和用法上有何不同。如small和little的區(qū)別,修飾boy和girl的形容詞有什么不同等。
KWIC: Key Word In Context,通過(guò)對(duì)檢索項(xiàng)相鄰的左邊或右邊若干個(gè)詞排序,研究檢索詞的用法。
(二)視圖切換下方的高級(jí)功能:
Sections: 條件檢索,指定要檢索的子庫(kù)、時(shí)間、時(shí)間段等
Texts/Virtual: 基于COCA內(nèi)的語(yǔ)料創(chuàng)建自己的語(yǔ)料庫(kù)(新功能)
Sort/Limit: 設(shè)置結(jié)果排序規(guī)則,可以按頻率、相關(guān)性和英文字母三種方式排序。設(shè)置最低頻率,最小互信息值(MI Score)
Options: 其它設(shè)置
(三)搜索結(jié)果欄:
Frequency: 顯示這一詞組搭配在COCA語(yǔ)料中出現(xiàn)的次數(shù)
Context: 顯示該詞組出現(xiàn)的上下文
(四)Context下,More一欄中各類(lèi)文體縮寫(xiě):
SPOK: 口語(yǔ)
MAG: 雜志
NEWS: 新聞
FIC: 小說(shuō)
ACAD: 學(xué)術(shù)類(lèi)期刊
03
三、用法
注:與谷歌、必應(yīng)等搜索引擎不同,COCA不能直接使用模糊搜索,必須配合相應(yīng)的搜索指令(即通配符),才有可能找到對(duì)應(yīng)詞組搭配。
(一)直接查詞:
在搜索欄里輸入詞匯你想查的詞匯,點(diǎn)擊Find Matching Strings,就可以跳轉(zhuǎn)到Frequency。在Frequency里點(diǎn)擊該詞條,跳轉(zhuǎn)到Context,可以查看該詞組用在什么樣的語(yǔ)境中。如圖所示,在Context中,點(diǎn)擊欄中的任意縮寫(xiě),可查看更詳細(xì)的語(yǔ)境。
A、B、C是用于將搭配結(jié)果分類(lèi),點(diǎn)擊后每條結(jié)果背景色發(fā)生變化,同一類(lèi)的背景色相同。比如可以根據(jù)檢索詞的意義和用法將他們分成1-3類(lèi),然后再點(diǎn)擊Save List,保存到自己創(chuàng)建的列表中。
(二)Chart功能:更直觀看到該詞匯在各種文體和年代中的總頻率,用戶可以通過(guò)這一功能,了解到哪些詞匯適合更加正式的文體,還可以查看該詞匯的語(yǔ)法結(jié)構(gòu)。下次遇到不確定的詞組搭配時(shí),不妨先放到語(yǔ)料庫(kù)中查一查,如果你發(fā)現(xiàn)它在某一文體中出現(xiàn)頻率很低,就可以考慮不用它。
(三)Collocates功能:
注意:每個(gè)標(biāo)點(diǎn)都很重要!
點(diǎn)擊Collocates,可以看到兩個(gè)搜索欄,第一個(gè)搜索欄后面標(biāo)的是Word/phrase,在這里輸入短語(yǔ)中的核心詞;在Collocates一欄,輸入搭配的介詞、冠詞、形容詞等內(nèi)容,如果不知道核心詞后面應(yīng)該搭配哪種介詞或冠詞,或想限定詞性搜索,可以在兩個(gè)搜索欄后面的POS(Part of Speech,詞性)加入想限定的詞性即可。
以want為例,假設(shè)想搜索want后面跟哪些介詞,就按照?qǐng)D中輸入:
可以看到Frequency中的高頻搭配詞:
但假如我們想搜索want作為名詞時(shí)與什么介詞搭配,那就要限定want詞性。如圖所示:
其中want.[n*]表示want被限定為名詞,[_i*]是介詞。
附個(gè)別詞性規(guī)則:
名詞:[n*]
動(dòng)詞:[v*]
形容詞:[j*]
副詞:[r*]
代詞:[p*]
連詞:[c*]
(四)Compare功能
當(dāng)你在對(duì)比兩個(gè)近義詞或同義詞,但不知道各自的搭配時(shí),可以用Compare功能,如對(duì)比wide和broad分別與哪些名詞搭配使用:
(五)其他功能:
1. 搜索近義詞:在words的方格里輸入[=beautiful],表示和beautiful語(yǔ)義相近的所有形容詞。
2. 若要得到某種詞性且詞中帶有部分帶有某些字母的形式時(shí),如要得到以un-開(kāi)頭、-ed結(jié)尾的所有形容詞的所有形式,那么輸入:un*ed.[j*];
若要得到動(dòng)詞 任何詞 ground的所有詞組,那么輸入:[vv*] * [ground]即可(方括號(hào)中間有空格,切記)。
前者用來(lái)研究詞匯,后者用來(lái)查詢特定詞性的搭配。
3. 輸入通配符(wildcards),如分別輸入un*ly和r?n*,結(jié)果如圖:
說(shuō)明:第一個(gè)指令可以幫你找到所有以un開(kāi)頭、ly結(jié)尾的全部單詞,第二個(gè)指令可以搜索以r開(kāi)頭、第三個(gè)字母包括n的任意單詞(? 代替一個(gè)字母;* 代替任意數(shù)量字母)
4. KWIC(Key Word in Context)也叫語(yǔ)境共現(xiàn)(Concordance),以檢索詞為中心,兩端都有該詞出現(xiàn)的語(yǔ)境,便于學(xué)習(xí)者觀察該詞的使用情況。
藍(lán)色——名詞
紫色——?jiǎng)釉~
綠色——形容詞
棕色——副詞
灰色——代詞
黃色——介詞
賞個(gè)咖啡錢(qián)吧^_^
聯(lián)系客服