爬虫python代码网易云_用python爬取网易云音乐歌曲的歌词
今天我來分享一下如何用python爬取網易云音樂歌曲的歌詞,網易云音樂的歌詞的爬取思路同前面介紹過的爬取網易云音樂的歌曲評論的爬取思路一致。由于兩者的加密思路都是一致的,因此我們只需分析出被加密了的參數,再利用前面介紹到的方法便能爬取到網易云音樂的歌詞,這里我順便把大家爬取過程可能遇到的問題說一下。
一,分析Ajax請求
我就以Dream It Possible為例進行講解,這首歌的URL:
https://music.163.com/#/song?id=38592976
打開這首歌所在的頁面,再打開瀏覽器開發者工具,點擊Network–再點擊XHR,重新加載這個頁面。我們會發現URL為https://music.163.com/weapi/song/lyric?csrf_token=的ajax請求的返回內容中包含了我們要爬取的歌詞內容,這時如果你拿這個請求的表單數據(Form Data)去發起post請求,你會發現返回體中并沒有內容。
二,分析加密參數
點擊控制面板的source–右側XHR/fetch Breakpoints,添加一個URL contains “https://music.163.com/weapi/song/lyric?csrf_token=”的斷點,再點擊重新加載,單步調試過去,找到window.asrsea()函數的第一個參數的形式是:
# id為歌曲的id號,后面的lv和tv都是固定值
# 加密得到的params的長度為108,不要拿瀏覽器控制面板中的數據進行測試,那里的params長度為128,不符合
{id: "38592976", lv: -1, tv: -1}
最后把這個參數加到我們前面爬取評論的加密函數中,利用加密得到的params(108位長)和encSecKey(256位長),我們便能獲取到歌曲的歌詞了。獲取源代碼
注意:不要拿瀏覽器控制面板中這個請求的表單數據進行測試,那里的params長度為128,不符合!
喜歡 (12)or分享 (0)
總結
以上是生活随笔為你收集整理的爬虫python代码网易云_用python爬取网易云音乐歌曲的歌词的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kuangbin专题-简单搜索
- 下一篇: 如何在酷狗上下载付费歌曲