中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研
為了找到最流行的中文自然語言處理工具,我進行了一番調研.
| 開源工具包 | 百度返回網頁數 |
| NLTK | 4470000 |
| LTP 哈工大 | 542,000 |
| OpenNLP | 249,000 |
| ICTCLAS | 919,000 |
| THULAC | 360,000 |
| ANTLR | 3,280,000 |
| DDParser | 1,840,000 |
| Gensim | 2,780,000 |
| spaCy | 1,400,000 |
| Stanford CoreNLP | 597,000 |
| IKAnalyzer | 2,430,000 |
| NLPIR | 885,000 |
| 東北大學NIUParser | 5,890 |
| jieba | 5,630,000 |
| FudanNLP | 216,000 |
| HanLP | 1,430,000 |
?
下面我們用python代碼對上述開源工具進行排序:
import numpy as np names=["NLTK","LTP 哈工大","OpenNLP","ICTCLAS","THULAC","ANTLR","DDParser","Gensim","spaCy","Stanford CoreNLP","IKAnalyzer","NLPIR","東北大學NIUParser","jieba","FudanNLP","HanLP"] popular=np.array([4470000,542000,249000,919000,360000,3280000,1840000,2780000,1400000,597000,2430000,885000,5890,5630000,216000,1430000])y=popular.argsort()print("----------------------------輸出下標-------------------------------") print(y) result=[] for item in y:result.append(names[item])# 最終結果 result2="" for index,item in enumerate(result):if index==len(result)-1:result2=result2+" "+itemelse:result2=result2+" "+item+" <" print("---------------------------百度中開源中文自然語言處理工具流行度結果-------------------------------") print(result2)輸出結果如下:
?
-------------------------------------------------------------輸出下標-----------------------------------------------------------------
[12 14 ?2 ?4 ?1 ?9 11 ?3 ?8 15 ?6 10 ?7 ?5 ?0 13]
---------------------------百度中開源中文自然語言處理工具流行度結果------------------------------------------------
?東北大學NIUParser < FudanNLP < OpenNLP < THULAC < LTP 哈工大 < Stanford CoreNLP < NLPIR < ICTCLAS < spaCy < HanLP < DDParser < IKAnalyzer < Gensim < ANTLR < NLTK < jieba
可以看到最著名的是jieba和NLTK
?
------------------------------------------------------------------支持句法依存樹可視化的開源工具------------------------------------------------------
| 開源工具 | 參考 |
| stanford coreNLP+nltk | [1] |
| Hanlp | [2] |
| LTP哈工大 | [3] |
南京大學那個句法依存樹只支持windows所以不在上面列出.
?
Reference:
[1]利用nltk可視化stanford coreNLP構建的中文句法樹
[2]自然語言處理 依存樹的可視化
[3]NLP(十二)依存句法分析的可視化及圖分析
?
?
總結
以上是生活随笔為你收集整理的中文-自然语言处理-开源工具-流行度调查+句法依存树可视化调研的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 班级优化大师如何编辑点评(如何搞好班级建
- 下一篇: 一起来捉妖小可怜怎么配