统计文本中出现的单词个数频率
生活随笔
收集整理的這篇文章主要介紹了
统计文本中出现的单词个数频率
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
import rewith open('a.txt','r') as f:dict={} # 對應存放 單詞 和 頻率for line in f.readlines():word_list = re.findall('[a-zA-Z]+',line.lower()) # 把文本字符串變成列表 存放單詞for word in word_list:word_count = len(re.findall(word,line.lower()))dict[word] = dict.get(word,0) + word_count# 對字典進行排序 排序完之后是一個列表ret = sorted(dict.items(), key=lambda x:x[1],reverse=True) # x 就是獲取的鍵值對 x[1] 表示以值為排序標準, x[0]表示以鍵為排序標準 for i in ret:print(i)
?
轉(zhuǎn)載于:https://www.cnblogs.com/kenD/p/11093971.html
總結(jié)
以上是生活随笔為你收集整理的统计文本中出现的单词个数频率的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第五节 RabbitMQ在C#端的应用-
- 下一篇: [JLOI2013]地形生成