當前位置：首頁 > 编程语言 > python >内容正文

python

Python数据分析微信朋友圈

發布時間：2024/3/13 python 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 Python数据分析微信朋友圈小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

個人興趣愛好，通過python對微信朋友圈進行了分析,主要對微信好友進行提取，對好友地區分布，簽名等進行可視化

需要安裝包如下：

pip3 install itchat pip3 install pandas pip3 install echarts-countries-pypkg pip3 install echarts-china-provinces-pypkg pip3 install echarts-china-cities-pypkg pip3 install pyecharts pip3 install jieba pip3 install wordcloud pip3 install numpy

獲取微信圈好友信息

import itchat ? # 按照key得到相關list def get_attr(friends, key):return list(map(lambda user: user.get(key), friends)) ? ? def get_friends():itchat.auto_login(hotReload=True)friends = itchat.get_friends()users = dict(province=get_attr(friends, "Province"),city=get_attr(friends, "City"),nickname=get_attr(friends, "NickName"),sex=get_attr(friends, "Sex"),signature=get_attr(friends, "Signature"),remarkname=get_attr(friends, "RemarkName"),pyquanpin=get_attr(friends, "PYQuanPin"),displayname=get_attr(friends, "DisplayName"),isowner=get_attr(friends, "IsOwner"))return users itchat.auto_login(hotReload=True)

登錄微信圈好友，hotReload參數表示短時間
內不需要掃碼可登陸(在項目下生成itchat.pkl文件)，執行上述代碼，彈出登錄二維碼，只需要拿出手機—>掃碼登錄即可。處理后數據為一個dict

數據分析

好友性別

先來看下朋友圈好友性別比例

import numpy import pandas as pd from pyecharts import Pie, Map, Style, Page, Bar ? def sex_stats(users):df = pd.DataFrame(users)sex_arr = df.groupby(['sex'], as_index=True)['sex'].count()data = dict(zip(list(sex_arr.index), list(sex_arr)))data['不告訴你'] = data.pop(0)data['帥哥'] = data.pop(1)data['美女'] = data.pop(2)return data.keys(), data.values() ? def create_charts():users = get_friends() ?page = Page()style = Style(width=1100, height=600)style_middle = Style(width=900, height=500)data = sex_stats(users)attr, value = datachart = Pie('微信性別') # title_pos='center'chart.add('', attr, value, center=[50, 50],radius=[30, 70], is_label_show=True, legend_orient='horizontal', legend_pos='center',legend_top='bottom', is_area_show=True)page.add(chart)page.render()

pandas 為數據分析工具，類似數據庫中的表。df.groupby(['sex'], as_index=True)['sex'].count() 按性別統計好友數，Pie為環形圖類。一共好友190個，帥哥占比57.37，美女38.42，本人屌絲程序員一枚，所有帥哥比較多

省份分布

再來看看各省份好友分布情況

def prov_stats(users):prv = pd.DataFrame(users)prv_cnt = prv.groupby('province', as_index=True)['province'].count().sort_values()attr = list(map(lambda x: x if x != '' else '未知', list(prv_cnt.index)))return attr, list(prv_cnt) def create_charts():?def create_charts():users = get_friends()?data = prov_stats(users)attr, value = datachart = Map('中國地圖', **style.init_style)chart.add('', attr, value, is_label_show=True, is_visualmap=True, visual_text_color='#000')page.add(chart)chart = Bar('柱狀圖', **style_middle.init_style)chart.add('', attr, value, is_stack=True, is_convert=True, label_pos='inside', is_legend_show=True,is_label_show=True)page.add(chart)page.render()

得到各省份好友分布圖，主要集中在廣東和湖北，工作生活一直在廣東。廣東好友112個，那么接下來看看廣東省主要分布在哪些市

廣東省分布

def gd_stats(users):df = pd.DataFrame(users)data = df.query('province == "廣東"')res = data.groupby('city', as_index=True)['city'].count().sort_values()attr = list(map(lambda x: '%s市' % x if x != '' else '未知', list(res.index)))return attr, list(res)def create_charts():users = get_friends()?data = gd_stats(users)attr, value = datachart = Map('廣東', **style.init_style)chart.add('', attr, value, maptype='廣東', is_label_show=True, is_visualmap=True, visual_text_color='#000')page.add(chart)?chart = Bar('柱狀圖', **style_middle.init_style)chart.add('', attr, value, is_stack=True, is_convert=True, label_pos='inside', is_label_show=True)page.add(chart)?page.render()

廣東省主要分布在珠海、深圳、廣州珠三角，因為筆者先后在深圳、珠海工作過

簽名詞云

先用jieba庫對個性簽名進行分詞def jieba_cut(users):signature = users['signature']words = ''.join(signature)res_list = jieba.cut(words, cut_all=True)return res_list 再用WordCloud生成詞云def create_wc(words_list):res_path = os.path.abspath('./resource')?words = ' '.join(words_list)?back_pic = numpy.array(Image.open("%s/china1.png" % res_path))?stopwords = set(STOPWORDS)stopwords = stopwords.union(set(['class','span','emoji','emoji','emoji1f388','emoji1f604']))??wc = WordCloud(background_color="white", margin=0,font_path='%s/hanyiqihei.ttf' % res_path,mask=back_pic,max_font_size=70,stopwords=stopwords).generate(words)?# image_colors = ImageColorGenerator(back_pic)?plt.imshow(wc)?# plt.imshow(wc.recolor(color_func=image_colors))?plt.axis('off')plt.show()

分析時發現有些無用詞語['class','span','emoji','emoji','emoji1f388','emoji1f604']需要排除，加入停詞set。筆者的背景圖片和字體放在項目 './resource' 下，注意:font_path必須設置，否則生成為亂碼，back_pic為背景圖片形狀

通過圖片可以看到最大詞匯為世界、自己、生活，說明朋友還是比較正能量

至此，對朋友圈好友進行了大概分析

源碼地址：https://github.com/TreasureGitHub/weixin_fenxi

執行代碼，用微信掃一掃吧，少年！

總結

以上是生活随笔為你收集整理的Python数据分析微信朋友圈的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【Linux】使用私人服务器搭建qq机器
下一篇：将CAD图纸转换为黑白的PDF文件要怎么

python

Python数据 分析微信朋友圈

總結

Python数据分析微信朋友圈