基于中文主观性知识库的句子主观性计算项目
ChineseZhuguanDectection
項目地址:https://github.com/liuhuanyong/ZhuguanDetection
Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主觀性知識庫的句子主觀性評定方法。
#項目介紹
主觀性是中文輿情和文本挖掘一個必不可少的一項環節。
對于英文而言,我調研過textblob的主觀性接口,對于輸入一個句子,textblob用的是詞語主觀性詞典+加權的打法,相應的介紹可以查看我的總結材料(documents下的pdf文件)
而針對目前github開源平臺上還缺少有對中文句子主觀性評定的接口,本項目將嘗試彌補這一空缺。
本項目將從中文自身的特點出發,通過總結并挖掘中文句子主觀性線索知識庫和客觀性線索知識庫,提供一個面向中文句子的主觀性判定方法。
主觀性字典
主觀性計算規則
使用方式:
from zhuguang import * handler = ZhuguanDetect() sent = '''你要分析的文本''' score = handler.detect(sent) print(score)效果
content = '今天天氣晴朗' score = 0.0 ********************** content = '江龍船艇:臺風“山竹”造成直接經濟損失400萬至500萬' score = 0.09375 ********************** content = '中華人民共和國萬歲' score = 0.200 ********************** content = '這兩天經濟不景氣,恐怕這單子有得毀掉了' score = 0.2092 ********************** content = '9月底美聯儲再次加息幾乎板上釘釘,央行大概率小幅跟隨加息,與此同時的定向降準對沖顯得更為重要。預計10月前后可能再次實施定向降準措施。' score = 0.237 ********************** content = '預計明后兩天江西會有大到暴雨' score = 0.36 ********************** content = '我喜歡你' score = 0.767 *****************************總結
1)本項目以詞匯知識庫的方式,通過總結歸納出主觀性線索詞,并加以規則進行計算。
2) 從上面的效果來看,還像是那么回事,但還有提升空間。
3) 主觀性配合情感得分,相信能夠在輿情分析上起到一定作用。
4)詞庫歡迎補充。send mail to: lhy_in_blcu@126.com
項目地址:https://github.com/liuhuanyong/ZhuguanDetection
If any question about the project or me ,see https://liuhuanyong.github.io/
總結
以上是生活随笔為你收集整理的基于中文主观性知识库的句子主观性计算项目的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: “猜心思”的Hard模式:问答系统在智能
- 下一篇: 加速你的Python