jieba提取关键词时筛选词性时单词性选择的一点注意事项
生活随笔
收集整理的這篇文章主要介紹了
jieba提取关键词时筛选词性时单词性选择的一点注意事项
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
最近又在迭代特征工程,發(fā)現(xiàn)jieba提取特征詞有個需要注意的地方,直接看例子
例子1
>>> import jieba >>> import jieba.posseg as pseg >>> s = '我們喜歡支付寶, 蘋果' >>> ws = pseg.cut(s) >>> for i in ws: ... print i ... 我們/r 喜歡/v 支付寶/nr ,/x/x 蘋果/n >>> allow_pos = ('nr',) >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 支付寶>>> allow_pos = ('nr') >>> tags = jieba.analyse.extract_tags(s, topK=10, withWeight=False, allowPOS=allow_pos) >>> for t in tags: ... print t ... 蘋果 我們allow_pos = (‘nr’,) 帶逗號,allow_pos是tuple, 結果只選取’nr’詞性的詞
allow_pos = (‘nr’), allow_pos是一個string, 結果選取了’n’ 和’r’的詞性
這個差別造成了關鍵詞提取方法中詞性選取的差異
總結
以上是生活随笔為你收集整理的jieba提取关键词时筛选词性时单词性选择的一点注意事项的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android开机速度优化
- 下一篇: 利用matlab绘制二维均匀流线和向量场