Python基础之文件读写和列表字典使用 ——《侠客行》文本分析
生活随笔
收集整理的這篇文章主要介紹了
Python基础之文件读写和列表字典使用 ——《侠客行》文本分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Python基礎之文件讀寫和列表字典使用
《俠客行》文本分析
目標
1. 統計《俠客行》中共出現了幾個漢字
2. 每個漢字出現的次數
3. 記錄出現頻繁的漢字
代碼
# -*- coding: utf-8 -*- """ Created on Thu Sep 7 12:57:41 2017@author: Zhangzs """fr = open('俠客行 作者:金庸.txt','r',encoding = 'utf-8')list1 = [] dict1 = {}def Chinese(str):if str >= '\u4e00' and str <= '\u9fa5': #漢字的編碼區間return Trueelse:return Falsefor line in fr:for i in range(len(line)):if not Chinese(line[i]):continueif not line[i] in list1:list1.append(line[i])if not line[i] in dict1.keys():dict1[line[i]] = 0dict1[line[i]] += 1fr.close()#print(len(list1)) #統計出現了多少個漢字item=sorted(dict1.items(),key=lambda x:x[1],reverse=True) #for i in range(20): # print(item[i]) #輸出了漢字出現次數前20個fw = open('xkx.csv','w') #保存成.csv表的格式fw.write('不同漢字個數'+','+str(len(list1))+'\n') for i in range(20): #記錄前20個頻繁漢字fw.write(item[i][0]+','+str(item[i][1])+'\n')fw.close()生成的表
俠客行 作者:金庸.txt 下載地址
注意編碼格式:可用編輯器notepad++轉成utf-8無BOM編碼格式
總結
以上是生活随笔為你收集整理的Python基础之文件读写和列表字典使用 ——《侠客行》文本分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux history操作的路径,绝
- 下一篇: 关于spring MVC 绑定json字