最炫国漫《雾山五行》用 Python 了解一下到底有多优秀
生活随笔
收集整理的這篇文章主要介紹了
最炫国漫《雾山五行》用 Python 了解一下到底有多优秀
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
看動漫的小伙伴應(yīng)該知道最近出了一部神漫《霧山五行》:
1、極具特色的水墨畫風(fēng)和超燃的打斗場面廣受好評
2、首集播出不到 24 小時登頂 B 站熱搜第一,豆瓣開分 9.5,
火爆程度可見一斑,就打斗場面而言,說是最炫動漫也不為過,當(dāng)然唯一有一點不足之處就是集數(shù)有點少,只有 3 集。
下面放幾張動圖,一起欣賞一下。
看過動圖之后,是不是覺得我所說的最炫動漫,并非虛言,接下來我們爬取一些評論,了解一下大家對這部動漫的看法,這里我們選取 B 站來爬取數(shù)據(jù)。
我們先來爬取 B 站彈幕數(shù)據(jù),動漫鏈接為:https://www.bilibili.com/bangumi/play/ep331423,彈幕鏈接為:http://comment.bilibili.com/186803402.xml,爬取代碼如下:
import jieba import pandas as pd import requests from PIL import Image from bs4 import BeautifulSoup from wordcloud import WordCloudurl = "http://comment.bilibili.com/218796492.xml" req = requests.get(url) html = req.content html_doc = str(html, "utf-8") # 修改成utf-8 print(html_doc) # 解析 soup = BeautifulSoup(html_doc, "html.parser") results = soup.find_all('d') contents = [x.text for x in results] # 保存結(jié)果 dic = {"contents": contents} df = pd.DataFrame(dic) df["contents"].to_csv("bili.csv", encoding="utf-8", index=False)def jieba_():# 打開評論數(shù)據(jù)文件content = open("bili.csv", "rb").read()# jieba 分詞word_list = jieba.cut(content)words = []# 過濾掉的詞# 需新建文本stopwordsstopwords = open("stopwords.txt", "r", encoding="utf-8").read().split("\n")[:-1]for word in word_list:if word not in stopwords:words.append(word)global word_cloud# 用逗號隔開詞語word_cloud = ','.join(words)def cloud():# 打開詞云背景圖cloud_mask = pd.np.array(Image.open("bg.png"))# 定義詞云的一些屬性wc = WordCloud(# 背景圖分割顏色為白色background_color='white',# 背景圖樣mask=cloud_mask,# 顯示最大詞數(shù)max_words=500,# 顯示中文font_path='./fonts/simhei.ttf',# 最大尺寸max_font_size=60,repeat=True)global word_cloud# 詞云函數(shù)x = wc.generate(word_cloud)# 生成詞云圖片image = x.to_image()# 展示詞云圖片image.show()# 保存詞云圖片wc.to_file('cloud.png')jieba_() cloud()效果如下:
素材及來源:https://www.cnblogs.com/ityard/p/13435685.html
總結(jié)
以上是生活随笔為你收集整理的最炫国漫《雾山五行》用 Python 了解一下到底有多优秀的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Django第一天笔记
- 下一篇: 电商网站(Django框架)—— 大纲内