python音乐的数据抓取与分析_python抓取网易云音乐热评做词图数据分析
最近就有一部“懷舊”題材的電影,未播先火,那就是劉若英的處女作——《后來的我們》。青春,愛情,夢想,一直是“懷舊”題材的核心要素,雖然電影現(xiàn)在還未上映,但先行發(fā)布的主題曲《我們》,已經(jīng)虐哭了不少人。在MV里,歌聲清清淺淺,訴說著那些年關(guān)于愛情里的遺憾。
“我最大的遺憾,就是你的遺憾,與我有關(guān)”,下面就一起來感受一下吧。
這首歌是《后來的我們》中的主題曲,網(wǎng)易云音樂上線當(dāng)天便席卷千萬+播放量,現(xiàn)如今光是網(wǎng)易云上面的評論就馬上突破了10萬條。
網(wǎng)易云音樂一直是我向往的“神壇“,聽音樂看到走心的評論的那一刻,高山流水。于是來抓取一下歌曲的熱門評論。并做成圖表、詞云來展示,看看相對于這首歌最讓人有感受的評論內(nèi)容是什么。
感覺這個還挺有意思的,簡單的重復(fù)早了輪子,看看整個一個過程學(xué)習(xí)記錄一下!
爬蟲的基本網(wǎng)絡(luò)操作就不記錄了,下面會放出源碼!
0x01 效果
0x02 知識點1
pip安裝出現(xiàn) failed to create process
解決辦法:python35 -m pip install pyecharts
0x03 知識點2
安裝WordCloud時pip無法安裝
0x04 知識點3
運行成功后,會在當(dāng)前程序目錄下生成一個render.html文件,在瀏覽器中打開即可看到效果
0x05 知識點4
0x05 源碼#抓取網(wǎng)易云音樂熱評
import requests
import re
import json
#req = request.Session()
comm_url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_551816010?csrf_token=814692a9769375fcc43f179fc134a7cc'
header = {
'Origin':'http://music.163.com',
'Host':'music.163.com',
'Referer':'http://music.163.com/song?id=551816010',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}
##########################
#post key 數(shù)據(jù)
user_data = {
'params':'0azFNHOQXrQR3kUdGq6ILvm7trulgN++kAard2ModFG2SiakjPNcHoc6FK//vCQJlG/2uoRQeCdFrmNHgv1TStIAfMQxvQKPoXFymF0NJFsfQClakpk2+qAcFsmckmKV+gsJxFOyt/7h2tK717d1oOPE5KfGRUDXdFyLNOtm5oNq0YTaKZb9wz8XHQEp8L1if4e5xWiWId91eGWS3zvRKFHDh6Bom5cUjp6zlFUrJro=',
'encSecKey':'24105f0c5aa04aa4b24b2c9a06646974e03c8c6b74320fc662bf84432d97f9ed05fd48df6a970f6b377dff894bd3f13e362a870d997732320f51b631b190f4c9a0201070f691591510a858cc54fd962ef1ff445dcc8493e021e4524e8057ceefc82584272176e181501f7e5394da126ea058cedd30544ad304871b82db4cdee4'
}
result = requests.post(comm_url,headers = header,data = user_data,timeout = 8)
result.encoding = "utf-8"
data = json.loads(result.text)
print(result)
hot_comments = []
#獲取熱評
for hot_comment in data['hotComments']:
item = {
'nickname' : hot_comment['user']['nickname'],
'content' : hot_comment['content'],
'likedCount' : hot_comment['likedCount']
}
hot_comments.append(item)
nickname_list = [content['nickname'] for content in hot_comments ]
content_list = [content['content'] for content in hot_comments ]
likedCount_list = [content['likedCount'] for content in hot_comments ]
#統(tǒng)計圖表
from pyecharts import Bar
bar = Bar("熱評中點贊示例圖")
bar.add("點贊數(shù)",nickname_list,likedCount_list,is_stack = True,mark_line = ["min","max"],mark_point=["average"],is_more_utils=True)
bar.render()
#詞圖
from wordcloud import WordCloud
import matplotlib.pyplot as plt
content_text = " ".join(content_list)
wordcloud = WordCloud(font_path=r'C:\Users\S.Assassaisn\Desktop\123.ttf' ,max_words=200,width=1920, height=1080).generate(content_text)
plt.figure()
plt.imshow(wordcloud,interpolation='bilinear')
plt.axis('off')
plt.show()
print("ok!!!")
總結(jié)
以上是生活随笔為你收集整理的python音乐的数据抓取与分析_python抓取网易云音乐热评做词图数据分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 语音识别类产品的分类及应用场景
- 下一篇: Direct3D 12 CreateSw