新闻文本内容知识图谱表示项目
TextGrapher
項目地址:https://github.com/liuhuanyong/TextGrapher
Text Content Grapher based on keyinfo extraction by NLP method。輸入一篇文檔,將文檔進行關鍵信息提取,進行結構化,并最終組織成圖譜組織形式,形成對文章語義信息的圖譜化展示。
項目介紹
如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文本內容進行最佳的語義表示是個難題。 本項目將對這一問題進行嘗試,采用的方法為:輸入一篇文檔,將文檔進行關鍵信息提取,并進行結構化,并最終組織成圖譜組織形式,形成對文章語義信息的圖譜化展示。
使用方式
from text_grapher import * content = '你要分析的文本' handler = CrimeMining() handler.main(content)結果保存在graph.html文件當中。
事件舉例
1) 中興事件
魏則西事件
雷洋事件
同學殺人事件
總結
1)如何用圖譜和結構化的方式,即以簡潔的方式對輸入的文本內容進行最佳的語義表示是個難題。
2)本項目采用了高頻詞,關鍵詞,命名實體識別,主謂賓短語識別等抽取方式,并嘗試將三類信息進行圖譜組織表示,這種表示方式是一種嘗試。
3)命名實體識別以及關鍵信息抽取受限于NLP的性能,在算法和方式上還存在多處不足。
Question?
send mail to lhy_in_blcu@126.com
項目地址:https://github.com/liuhuanyong/TextGrapher
If any question about the project or me ,see https://liuhuanyong.github.io/
總結
以上是生活随笔為你收集整理的新闻文本内容知识图谱表示项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 简明扼要的反射入门教程
- 下一篇: PersonGraphDataSet近十