语料库资源
文章目錄
- 國(guó)內(nèi)可用免費(fèi)語(yǔ)料庫(kù)
- (一) 國(guó)家語(yǔ)委
- (二) 北京大學(xué)計(jì)算語(yǔ)言學(xué)研究中心
- (三) 北京語(yǔ)言大學(xué)
- 國(guó)外可用免費(fèi)語(yǔ)料庫(kù)
國(guó)內(nèi)可用免費(fèi)語(yǔ)料庫(kù)
(一) 國(guó)家語(yǔ)委
國(guó)家語(yǔ)委現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù) http://www.cncorpus.org/
??現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)在線提供免費(fèi)檢索的語(yǔ)料約2000萬(wàn)字,為分詞和詞性標(biāo)注語(yǔ)料。
??網(wǎng)站現(xiàn)在還增加了一億字的古代漢語(yǔ)生語(yǔ)料,研究古代漢語(yǔ)的也可以去查詢和下載。同時(shí),還提供了分詞、詞性標(biāo)注軟件、詞頻統(tǒng)計(jì)、字頻統(tǒng)計(jì)軟件,基于國(guó)家語(yǔ)委語(yǔ)料庫(kù)的字頻詞頻統(tǒng)計(jì)結(jié)果和發(fā)布的詞表等,以供學(xué)習(xí)研究語(yǔ)言文字的老師同學(xué)使用。
(二) 北京大學(xué)計(jì)算語(yǔ)言學(xué)研究中心
現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)http://ccl.pku.edu.cn/corpus.asp?item=1
古代漢語(yǔ)語(yǔ)料庫(kù)http://ccl.pku.edu.cn/corpus.asp?item=2
漢英雙語(yǔ)語(yǔ)料庫(kù)http://ccl.pku.edu.cn/corpus.asp?item=3
(三) 北京語(yǔ)言大學(xué)
HSK動(dòng)態(tài)作文語(yǔ)料庫(kù)http://202.112.195.192:8060/hsk/login.asp
北京口語(yǔ)語(yǔ)料查詢系統(tǒng)http://www.blcu.edu.cn/yys/6_beijing/6_beijing_chaxun.asp
現(xiàn)代漢語(yǔ)平衡語(yǔ)料庫(kù) http://rocling.iis.sinica.edu.tw/new/20corpus.htm
LIVAC共時(shí)語(yǔ)料庫(kù)http://www.livac.org/index.php
蘭開(kāi)斯特漢語(yǔ)語(yǔ)料庫(kù)http://ling.cass.cn/dangdai/LCMC/LCMC.htm
洛杉磯加州大學(xué)漢語(yǔ)語(yǔ)料庫(kù)http://www.lancs.ac.uk/fass/projects/corpus/UCLA/
中文新聞分類語(yǔ)料庫(kù)http://www.nlpir.org/?action-viewnews-itemid-145
NLPIR 500萬(wàn)條twitter內(nèi)容語(yǔ)料庫(kù) http://www.nlpir.org/?action-viewnews-itemid-263
NLPIR微博博主語(yǔ)料庫(kù)100萬(wàn)條 http://www.nlpir.org/?action-viewnews-itemid-232
現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)詞頻統(tǒng)計(jì)http://elearning.ling.sinica.edu.tw/CWordfreq.html
中文句結(jié)構(gòu)樹(shù)資料庫(kù)http://turing.iis.sinica.edu.tw/treesearch/
搜狗文本分類語(yǔ)料庫(kù)http://www.sogou.com/labs/dl/c.html
哈工大信息檢索研究室對(duì)外共享語(yǔ)料庫(kù) http://ir.hit.edu.cn/demo/ltp/Sharing_Plan.htm
傳媒大學(xué)文本語(yǔ)料庫(kù) http://ling.cuc.edu.cn/RawPub/
詞語(yǔ)研究資源庫(kù) 對(duì)外漢語(yǔ)北京http://ling.cuc.edu.cn/newword/web/index.asp
BFSU CQPweb多語(yǔ)言在線語(yǔ)料庫(kù)檢索平臺(tái) http://www.iresearch.ac.cn/paper/detail.php?ItemID=6358
英漢雙語(yǔ)平行語(yǔ)料庫(kù)http://www.luweixmu.com/ec-corpus/
babel 漢英平行語(yǔ)料庫(kù)http://icl.pku.edu.cn/icl_groups/parallel/default.htm
中國(guó)法律法規(guī)漢英平行語(yǔ)料庫(kù)(大陸)http://corpus.zscas.edu.cn/lawcorpus1/index.asp
國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心 http://www.clr.org.cn/
British National Corpus http://www.natcorp.ox.ac.uk/
該部分轉(zhuǎn)載于鄧旭東的博客,感謝原作者。
http://blog.sina.com.cn/s/blog_c685f68e0102wdxg.html
同時(shí)參考:
http://www.sohu.com/a/196504864_236505
國(guó)外可用免費(fèi)語(yǔ)料庫(kù)
目前還用不到,以后用到了再補(bǔ)充。
總結(jié)
- 上一篇: n型半导体和p型半导体的区别_VNX系列
- 下一篇: Spring的refresh()方法调用