自然语言处理语言资源项目
生活随笔
收集整理的這篇文章主要介紹了
自然语言处理语言资源项目
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
項目地址:https://github.com/liuhuanyong/LanguageResources
致力于利用web公開信息,采用爬蟲腳本,加工處理形成語言資源包括詞匯知識庫,領域語料等語言資源,該資源可用于自然語言處理任務.
1、 corpus_resources.py:詞庫,包括:
2 word_resources.py:領域語料
包括:
3 wordvector_resource.py:預訓練詞向量文件
name:多領域詞向量link:https://pan.baidu.com/s/10j2Ozt9rOspVDsn_UNIfdwpwd:cw04desc:基于騰訊歷時滾動新聞訓練的多領域詞向量,包括財經、軍事、體育、科技等領域***********name:中文字向量link:https://pan.baidu.com/s/1m7E86igkOglQsl7hwn0QVwpwd:b2mgdesc:基于維基百科生成的字向量資源已經共享至百度網盤,詳細見相應的.py文件
If any question about the project or me ,see https://liuhuanyong.github.io/
項目地址:https://github.com/liuhuanyong/LanguageResources
總結
以上是生活随笔為你收集整理的自然语言处理语言资源项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从源码说说dispatchTouchEv
- 下一篇: 【HTML/CSS】margin塌陷和合