【Python】《三国演义》人物出场统计
生活随笔
收集整理的這篇文章主要介紹了
【Python】《三国演义》人物出场统计
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
jieba是Python中一個重要的第三方中文分詞函數庫,由于是第三方庫,不是安裝包自帶,需要通過pip指令安裝。
jieba庫的解析
利用jieba庫進行文本詞頻統計
《三國演義》人物出場統計
import jieba txt = open("三國演義.txt", "r", encoding='utf-8').read() words = jieba.lcut(txt) counts = {} for word in words:if len(word) == 1:continueelse:counts[word] = counts.get(word,0) + 1 items = list(counts.items()) items.sort(key=lambda x:x[1], reverse=True) for i in range(15):word, count = items[i]print("{0:<10}{1:>5}".format(word, count))運行結果:
由于在小說中,同一個人物會有不同的名字,這種情況需要進行整合處理。同時,需要排除一些人名無關詞匯,如“卻說”、“將軍”等,還需對上述代碼進行優化。
優化后的代碼如下:
運行結果:
總結
以上是生活随笔為你收集整理的【Python】《三国演义》人物出场统计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: R语言学习-问题解决-Error in
- 下一篇: 浏览器点击链接总是跳转到百度首页界面