统计托福100篇阅读文章中的单词及其词频并且存入excel表格中
生活随笔
收集整理的這篇文章主要介紹了
统计托福100篇阅读文章中的单词及其词频并且存入excel表格中
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
完成這個(gè)任務(wù),我們需要掌握以下python的知識(shí)點(diǎn):
1.jieba模塊的使用;
2.python中對(duì)txt文本文件的操作;
3.python四大容器的使用;
4.openpyxl模塊的使用。
代碼如下:
import jieba with open('./toefl100.txt','r',encoding='utf-8') as f:contents = f.read() content_list = list(jieba.cut(contents)) word_list =[] for content in content_list:if content.isalpha() and len(content)>4:word_list.append(content.lower()) word_set = set(word_list) word_dict = {} max_lengh = 0 for word in word_set:count = 0if len(word)>max_lengh:max_lengh = len(word)for element in word_list:if word == element:count += 1word_dict[word] = countprint(word_dict) from openpyxl import Workbook workbook = Workbook() ws=workbook.create_sheet() worksheet= workbook['Sheet'] del workbook['Sheet1'] row_num = 1 for key in sorted(word_dict,key=word_dict.__getitem__,reverse=True):worksheet['A'+str(row_num)] = keyworksheet['B'+str(row_num)]= word_dict[key]row_num += 1 workbook.save(filename='Peterwords.xlsx')運(yùn)行代碼之后,我們可以得到一個(gè)“Peterwords.xlsx”的excel表格文件,我們打開之后,就可以看到統(tǒng)計(jì)好了的托福詞頻表了,效果如下:
總結(jié)
以上是生活随笔為你收集整理的统计托福100篇阅读文章中的单词及其词频并且存入excel表格中的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【JZOJ A组省选】词典
- 下一篇: 12.20-12.21北大医药