使用jieba 提取 关键词
生活随笔
收集整理的這篇文章主要介紹了
使用jieba 提取 关键词
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
如何提取句子的關(guān)鍵詞?
以前用textrank4zh
https://blog.csdn.net/weixin_44510615/article/details/89548486
竟然不知道 jieba.analyse 也可以提取關(guān)鍵詞,還封裝了tfidf 的接口
from jieba import analyse tfidf = analyse.extract_tagsif __name__ == '__main__':text="""據(jù)半島電視臺援引敘利亞國家電視臺稱,敘利亞已經(jīng)對美國、英國、法國的空襲進(jìn)行了反擊。據(jù)介紹,在敘軍武器庫中,對西方最具威懾力的當(dāng)屬各型戰(zhàn)術(shù)地對地彈道導(dǎo)彈。盡管美英法是利用巡航導(dǎo)彈等武器發(fā)動遠(yuǎn)程空襲,但敘軍要對等還擊卻幾乎是“不可能完成的任務(wù)”。目前敘軍仍能作戰(zhàn)的戰(zhàn)機(jī)仍是老舊的蘇制米格-29、米格-23、米格-21戰(zhàn)斗機(jī)和蘇-22、蘇-24轟炸機(jī),它們在現(xiàn)代化的西方空軍面前難有自保之力,因此敘軍的遠(yuǎn)程反擊只能依靠另一個撒手锏——地對地戰(zhàn)術(shù)彈道導(dǎo)彈。"""# 關(guān)鍵詞提取所使用停用詞文本語料庫可以切換成自定義語料庫的路徑。analyse.set_stop_words("stopwords.txt")# 引入TextRank關(guān)鍵詞抽取接口textrank = analyse.textrank# 基于TextRank算法進(jìn)行關(guān)鍵詞抽取keywords_textrank = textrank(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz'))# 輸出抽取出的關(guān)鍵詞for keyword in keywords_textrank:print (keyword + "/")print ("TFIDF")# TFIDFkeywords_tfidf = analyse.extract_tags(text,topK = 10, withWeight = False, allowPOS = ('n','ns','vn','v','nz'))# 輸出抽取出的關(guān)鍵詞for keyword in keywords_tfidf:print (keyword + "/") 敘軍/ 遠(yuǎn)程/ 空襲/ 電視臺/ 戰(zhàn)術(shù)/ 反擊/ 空軍/ 現(xiàn)代化/ 敘利亞/ 地對地/ TFIDF **************************************************** 敘軍/ 地對地/ 空襲/ 彈道導(dǎo)彈/ 遠(yuǎn)程/ 敘利亞/ 電視臺/ 反擊/ 戰(zhàn)術(shù)/ 撒手锏/看來要重新認(rèn)識一些jieba
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的使用jieba 提取 关键词的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 有机化学芳烃 芳香性
- 下一篇: 近邻算法分类