成人午夜免费视频毛片,久久精品国产色蜜蜜麻豆,欧美精品久久天天躁

(一) 國家語委

1國家語委現(xiàn)代漢語語料庫http://www.cncorpus.org/

現(xiàn)代漢語通用平衡語料庫現(xiàn)在重新開放網(wǎng)絡查詢了。重開后的在線檢索速度更快，功能更強，同時提供檢索結(jié)果下載。現(xiàn)代漢語語料庫在線提供免費檢索的語料約2000萬字，為分詞和詞性標注語料。

2古代漢語語料庫http://www.cncorpus.org/login.aspx

網(wǎng)站現(xiàn)在還增加了一億字的古代漢語生語料，研究古代漢語的也可以去查詢和下載。同時，還提供了分詞、詞性標注軟件、詞頻統(tǒng)計、字頻統(tǒng)計軟件，基于國家語委語料庫的字頻詞頻統(tǒng)計結(jié)果和發(fā)布的詞表等，以供學習研究語言文字的老師同學使用。

(二) 北京大學計算語言學研究所

1《人民日報》標注語料庫http://www.icl.pku.edu.cn/icl_res/

《人民日報》標注語料庫中一半的語料(1998年上半年)共1300萬字已經(jīng)通過《人民日報》新聞信息中心公開提供許可使用權(quán)。其中一個月的語料(1998年1月)近200萬字在互聯(lián)網(wǎng)上公布，供自由下載。

(三) 北京語言大學

漢語國際教育技術(shù)研發(fā)中心：HSK動態(tài)作文語料庫http://202.112.195.192:8060/hsk/login.asp

語言研究所：北京口語語料查詢系統(tǒng)（B J K Y）http://www.blcu.edu.cn/yys/6_beijing/6_beijing_chaxun.asp

（四）臺灣中央研究院

中研院語料庫ＷＷＷ版所有功能均開放使用，但為防主機資源耗用過劇及顧及數(shù)據(jù)傳輸之實際限制，暫以檢索結(jié)果為限制的條件：院內(nèi)檢索限兩萬行數(shù)據(jù)，院外檢索限兩千行數(shù)據(jù)。

1現(xiàn)代漢語平衡語料庫http://www.sinica.edu.tw/SinicaCorpus/

專門針對語言分析而設計的，每個文句都依詞斷開，并標示詞類。語料的搜集也盡量做到現(xiàn)代漢語分配在不同的主題和語式上，是現(xiàn)代漢語無窮多的語句中一個代表性的樣本?，F(xiàn)有語料庫主要針對語言分析而設計，由中央研究院信息所、語言所詞庫小組完成，內(nèi)含有簡介、使用說明，現(xiàn)行的語料庫是4.0的版本。

2古漢語語料庫http://www.sinica.edu.tw/ftms-bin/ftmsw

古漢語語料庫包含以下五個語料庫: 上古漢語、中古漢語(含大藏經(jīng))、近代漢語、其他、出土文獻。部分數(shù)據(jù)取自史語所漢籍全文數(shù)據(jù)庫，故兩者間略有重迭。此語料庫之出土文獻語料庫，全部取自史語所漢簡小組所制作的數(shù)據(jù)庫。

3近代漢語標記語料庫http://www.sinica.edu.tw/Early_Mandarin/

為應漢語史研究需求而建構(gòu)的語料庫。目前素語料庫所搜集的語料已含蓋上古漢語（先秦至西漢）、中古漢語（東漢魏晉南北朝）、近代漢語（唐五代以后）大部分的重要語料，并己陸續(xù)開放使用；在標記語料庫方面，上古漢語及近代漢語都已有部分語料完成標注的工作，并視結(jié)果逐步提供上線檢索。

4樹圖數(shù)據(jù)庫http://treebank.sinica.edu.tw/

「中文句結(jié)構(gòu)樹資料庫」(Sinica Treebank Version 3.0)包含了6個檔案，61,087個中文樹圖，361,834個詞，是中央研究院詞庫小組從中央研究院平衡語料庫(SinicaCorpus)中抽取句子，經(jīng)由電腦剖析成結(jié)構(gòu)樹，並加以人工修正、檢驗後所得的成果。在中文句結(jié)構(gòu)樹中，我們標示了中文句語意和語法的訊息。此一「中文句結(jié)構(gòu)樹資料庫」目前開放網(wǎng)上檢索及資料移轉(zhuǎn)，以供學者專家在中文句法、語意關(guān)係研究參考之用。另有1000個句結(jié)構(gòu)樹開放下載。

5中英雙語知識本體詞網(wǎng)http://bow.sinica.edu.tw/

結(jié)合詞網(wǎng)，知識本體，與領(lǐng)域標記的詞匯知識庫。

6搜文解字http://words.sinica.edu.tw/

包含「搜詞尋字」、「文學之美」、「游戲解惑」、「古文字的世界」四個單元，可由部件、部首、字、音、詞互查，并可查詢在四書、老、莊、唐詩中的出處，及直接連結(jié)到出處，閱讀原文。

7文國尋寶記http://www.sinica.edu.tw/wen/

在搜文解字的基礎之上，以華語文學習者為對象，進一步將字、詞、音的檢索功能與國編、華康、南一等三種版本的國小國語課本結(jié)合，與唐詩三百首、宋詞三百首、紅樓夢、水滸傳等文學典籍結(jié)合，提供網(wǎng)絡上國語文學習的素材。

8唐詩三百首http://cls.admin.yzu.edu.tw/300/

以國中、小學學生為主要使用對象，提供吟唱、繪畫、書法等多媒體數(shù)據(jù)，文字數(shù)據(jù)報含作者生平、讀音標注、翻譯、批注、評注、典故出處等資料；檢索點包含作者、詩題、詩句、綜合資料、體裁分類等；檢索結(jié)果可以列出全文，并選擇標示相關(guān)之文字及多媒體數(shù)據(jù)。并提供了一套可以自動檢查格律、韻腳、批改的「依韻入詩格律自動檢測索引教學系統(tǒng)」，協(xié)助孩子們依韻作詩，協(xié)助教師批改習作。

9漢籍電子文獻http://www.sinica.edu.tw/~tdbproj/handy1/

包含整部25史整部阮刻13經(jīng)、超過2000萬字的臺灣史料、1000萬字的大正藏以及其他典籍。

10紅樓夢網(wǎng)絡教學研究數(shù)據(jù)中心http://cls.hs.yzu.edu.tw/HLM/home.htm

元智大學中國文學網(wǎng)絡系統(tǒng)研究室所開發(fā)的「網(wǎng)絡展書讀—中國文學網(wǎng)絡系統(tǒng)」，為研究中心負責人羅鳳珠老師主持，紅樓夢是其中一個子系統(tǒng)，其他還包括善本書、詩經(jīng)、唐宋詩詞、作詩填詞等子系統(tǒng)。此網(wǎng)站為國內(nèi)Internet最大中國文學研究數(shù)據(jù)庫，提供用戶最完整的中國文學研究數(shù)據(jù)。

（五）中國傳媒大學

1中國傳媒大學文本語料庫檢索系統(tǒng)
http://ling.cuc.edu.cn/RawPub/

2在線分詞標注系統(tǒng)
http://ling.cuc.edu.cn/cucseg/
3新詞語研究資源庫
http://ling.cuc.edu.cn/newword/web/index.asp
4音視頻語料檢索系統(tǒng)
http://ling.cuc.edu.cn/mmcpub（目前系統(tǒng)正在升級改造中）

（六）哈爾濱工業(yè)大學

1哈工大信息檢索研究室對外共享語料庫資源http://ir.hit.edu.cn/demo/ltp/Sharing_Plan.htm

該語料庫為漢英雙語語料庫，10萬對齊雙語句對，文本文件格式，同義詞詞林擴展版，77,343條詞語，秉承《同義詞詞林》的編撰風格，同時采用五級編碼體系，多文檔自動文摘語料庫，40個主題，文本文件格式，同一主題下是同一事件的不同報道，漢語依存樹庫，不帶關(guān)系5萬句，帶關(guān)系1萬句，LTML化，分詞、詞性、句法部分人工標注，可以圖形化查看，問答系統(tǒng)問題集，6264句，已標注問題類型，LTML化，分詞、詞性、句法、詞義、淺層語義等程序處理得到，單文檔自動文摘語料庫，211篇，分不同體裁，LTML化，文摘句標注，分詞、詞性、句法、詞義、淺層語義、文本分類、指代消解等程序處理得到。

（七）清華大學

漢語均衡語料庫TH-ACorpus：http://www.lits.tsinghua.edu.cn/ainlp/source.htm（似乎在改版，一直上不去）

（八）香港教育學院

語言資訊科學中心及其語料庫實驗室http://www.livac.org/index.php?lang=sc

自1995年開始，以「共時」方式處理了超常的大量漢語語料，通過精密的技術(shù)，累積眾多精確的統(tǒng)計數(shù)據(jù)，建立了LIVAC (Linguistic Variation in Chinese SpeechCommunities)共時語料庫。本語料庫最大特點是采用「共時性」視窗模式，嚴謹?shù)囟〞r分別收集來自多地的定量同類語料，可供各種客觀的比較研究，方便有關(guān)的信息科技發(fā)展與應用。此外，語料庫又兼顧了「歷時性」，方便各方人士客觀地觀察與研究視窗內(nèi)的有代表性的語言發(fā)展全面動態(tài)。

（九）中國科學院計算技術(shù)研究所

跨語言語料庫http://mtgroup.ict.ac.cn/new/resource/index.php（目前不可用，不知道是否在升級）

目前的雙語句對數(shù)據(jù)庫中有約180,000對已對齊的中英文句子。本數(shù)據(jù)庫支持簡單的中英文查詢服務。查詢結(jié)果包括句對編號、中文句子、英文句子、句對來源。

（十）中文語言資源聯(lián)盟

中文語言資源聯(lián)盟http://www.chineseldc.org/

(Chinese Linguistic DataConsortium,簡稱ChineseLDC)的建立。ChineseLDC是吸收國內(nèi)高等院校,科研機構(gòu)和公司參加的開放式語言資源聯(lián)盟。其目的是建成能代表當今中文信息處理水平的,通用的中文語言信息知識庫。ChineseLDC將建設和收集中文信息處理所需要的各種語言資源,包括詞典,語料庫,數(shù)據(jù),工具等。在建立和收集語言資源的基礎上,分發(fā)資源,促成統(tǒng)一的標準和規(guī)范,推薦給用戶,并且針對中文信息處理領(lǐng)域的關(guān)鍵技術(shù)建立評測機制,為中文信息處理的基礎研究和應用開發(fā)提供支持。（之所以排名這么后，是因為是國家出錢的項目，卻沒有什么免費資源）

本站僅提供存儲服務，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区