Python爬取数据:翻页操作
生活随笔
收集整理的這篇文章主要介紹了
Python爬取数据:翻页操作
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Python爬取視頻在上一章已經實現,如果爬取數據的時候發現不止一頁數據,而是很多頁數據的時候,我們就需要爬蟲自行翻頁操作繼續獲取另一頁的數據。那么如何實現的翻頁操作是本章主要描述內容。
該文章爬取數據例子網址
1、翻頁操作的原理
翻頁操作基本原理實際就是打開另一頁的網址(該文章描述的是換頁網址會發生變化的類型,換頁時地址沒變化的不適用該文章描述方法),知道原理后,我們想翻頁操作時,只需要找到翻頁后的網絡地址并打開即可爬取翻頁后的數據內容。
2、如何實現翻頁
比如爬取數據是如下圖這種翻頁模式的
那么我們只需要在打開該網址后,打開開發者工具,搜索關鍵字 “下一章” ,點擊搜索到的信息,會看到有需要的下一章網址(如下圖所示)
留意記住紅框框柱的內容,這是我們想要的點擊下一章后刷新的網絡地址,只要獲取該網絡地址并對該網址進行網絡請求即可獲取下一章的內容,從而實現自動翻頁操作
3、代碼實現
import requests import reurl = 'https://read.qidian.com/chapter/YvJ9Xu5KMv01/uq-shwCz0Woex0RJOkJclQ2/'headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36 SE 2.X MetaSr 1.0"}response = requests.get(url=url, headers=headers)next_url = re.findall('href="(.*?)" data-eid="qd_R109" >下一章', response.text)[0] print("自動獲取下一章的網址: %s"%("https:" + next_url))4、結果
執行完上面代碼可看到結果:
我們將自動獲取出來的網絡地址復制粘貼到瀏覽器并打開與未翻頁的頁面對比觀看是否實現了下一章的跳轉:
跳轉前頁面:
下一章跳轉后頁面:
通過兩個頁面對比,可以看出是正確自動捕獲到了翻頁后的網址,成功實現了爬蟲翻頁操作。
希望該文章對你有所幫助,作者能力有限,如有不足請多多包涵。
如果你覺得該文章不錯請點個免費的贊吧!
總結
以上是生活随笔為你收集整理的Python爬取数据:翻页操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 有没有好的RFID仓库管理解决方案?RF
- 下一篇: JS中箭头函数写法及5种简写规则