十二、爬了CSDN,我发现了这些
生活随笔
收集整理的這篇文章主要介紹了
十二、爬了CSDN,我发现了这些
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
最近,有點興趣爬下自己在CSDN 的博客,并做出詞云圖來看下自己究竟寫了什么
說起,就開干,下面是博客主頁:https://blog.csdn.net/weixin_44510615
環境
-
操作系統:Windows
-
Python版本:3.7.2
模塊
本文涉及到的Python第三方模塊,共計五個:分詞模塊jieba,文字云模塊wordcloud,畫圖模塊matplotlib,用來處理背景圖片的模塊cv2,訪問的模塊requests,解析的模塊bs4
這些模塊均可通過pip方式進行安裝。
實現思路
先獲得每個文章的前言,用集合來存儲,這樣可以達到去重,在拼接成字符串。再通過jieba模塊對字符串進行分詞處理,然后對處理后的材料使用wordcloud文字云模塊生成相應的詞云圖片即可。
先判斷是否訪問成功
titles = set() def html(url):if url:r = request總結
以上是生活随笔為你收集整理的十二、爬了CSDN,我发现了这些的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 芒果吃多了好吗为什么?
- 下一篇: 茉莉花茶的卖点是什么?