本文為《算詞匯量,怎樣才算一個(gè)詞?有沒有高頻詞匯列表?專有名詞算不算詞匯量?(英語教學(xué)法原著選讀68)》一文中英文原文的中文翻譯。建議朋友們先認(rèn)真看過原文,力爭(zhēng)讀通讀透,再來看本文。
------------------------
兩項(xiàng)各自獨(dú)立的研究(杜普伊,1974;古爾頓,納辛和里德,1990)關(guān)注到《韋伯斯特第三版國際詞典》(1963),這是出版時(shí)最大的非歷史性英語詞典。去掉合成詞、古奧詞、縮略詞、專有名詞、異體字、方言形式,把剩下的單詞分成包含基礎(chǔ)詞、詞形變化形式和直接衍生詞在內(nèi)的詞族,《韋三》的詞匯量約有54000詞族。這一學(xué)習(xí)目標(biāo)對(duì)二語學(xué)習(xí)者來說實(shí)在是難以觸及,而我們將看到,對(duì)絕大多數(shù)母語者來說也是如此。
有許多英語常見詞的列表,現(xiàn)將其中最有名的幾份簡(jiǎn)述如下:
通用詞表(韋斯特,1953):GSL包含2000基本詞,是1940年代開發(fā)出來的。絕大多數(shù)單詞的詞頻數(shù)字都是基于一個(gè)500萬詞的書面語料庫統(tǒng)計(jì)出來的。(該詞表)給出了基礎(chǔ)詞不同詞義、詞性的百分比數(shù)字。盡管已經(jīng)有些年歲,也有一些錯(cuò)誤,并且僅僅基于書面語,這份詞表仍然是現(xiàn)有列表中最佳的,因?yàn)樗o出了每個(gè)詞不同意思的不同詞頻,而韋斯特也認(rèn)真應(yīng)用了詞頻和使用范圍以外的判斷標(biāo)準(zhǔn)。
教師用30000詞匯本(索恩代克和洛吉,1944):這份30000詞元的列表可換算成13000詞族(古爾頓,納辛和里德,1990),基于1800萬詞的書面語料庫開發(fā)。其價(jià)值在于其容量。這份詞表基于大型語料庫,包含了大量的詞匯。然而,由于開發(fā)時(shí)基于60年前的計(jì)數(shù),這份詞表已經(jīng)老化了。
美國傳統(tǒng)詞頻表(卡羅爾,戴維斯和利奇曼,1971):這份綜合性列表基于500萬取自用于美國學(xué)校的書面文本的行文,涵蓋各年級(jí)、各種主題領(lǐng)域。這份列表的主要價(jià)值在于其對(duì)學(xué)校文本的聚焦及對(duì)使用范圍數(shù)字的羅列——即各單詞在各年級(jí)、各主題領(lǐng)域的出現(xiàn)頻率。
布朗(弗朗西斯和庫切拉,1982)、LOB及其他相關(guān)語料庫:現(xiàn)在有多份100萬詞書面語料庫,各代表了一種英語方言。其中一些語料庫重點(diǎn)突出了以詞元為單位的詞匯列表,排列依據(jù)是詞頻。
聯(lián)系客服