如何利用python在一个wen'dang'li_如何利用Python网络爬虫给自己跟朋友来一份穷游攻略!走到哪里穷到哪里的哦!...
【一、項目背景】
窮游網提供原創實用的出境游旅行指南、攻略,旅行社區和問答交流平臺,以及智能的旅行規劃解決方案,同時提供簽證、保險、機票、酒店預訂、租車等在線增值服務。窮游“鼓勵和幫助中國旅行者以自己的視角和方式體驗世界”。
今天教大家獲取窮游網的城市信息,使用Python將數據寫入csv文檔。
?
【二、項目目標】
實現將獲取對應的城市、圖片鏈接、熱點、批量下載 保存csv文檔。
【三、涉及的庫和網站】
1、網址如下:
https://place.qyer.com/south-korea/citylist-0-0-{}
2、涉及的庫:requests、l****xml、fake_useragent、time、csv
【四、項目分析】
首先需要解決如何對下一頁的網址進行請求的問題。可以點擊下一頁的按鈕,觀察到網站的變化分別如下所示:
https://place.qyer.com/south-korea/citylist-0-0-1
https://place.qyer.com/south-korea/citylist-0-0-2
https://place.qyer.com/south-korea/citylist-0-0-3
觀察到只有citylist-0-0-{}/變化,變化的部分用{}代替,再用for循環遍歷這網址,實現多個網址請求。
【五、項目實施】
1、我們定義一個class類繼承object,然后定義init方法繼承self,再定義一個主函數main繼承self。準備url地址。
?
2、隨機產生UserAgent。
?
3、多頁請求。
?
4、定義get_page方法,進行數據請求。
?
5、定義page_page,xpath解析數據, for循環遍歷數組。
在谷歌瀏覽器上,右鍵選擇開發者工具或者按F12。右鍵檢查,xpath找到對應信息的字段。如下圖所示。
?
?
6、定義csv文件保存數據,寫入文檔。
?
7、在main方法調用。
?
8、time模塊,設置時間延遲。
?
【六、效果展示】
1、點擊運行,輸入起始頁,終止頁。
?
2、將下載成功信息顯示在控制臺。
?
3、保存csv文檔。
?
【七、總結】
1、不建議抓取太多數據,容易對服務器造成負載,淺嘗輒止即可。
2、希望通過這個項目,能夠幫助大家對csv文檔處理有進一步的了解。
3、本文基于Python網絡爬蟲,利用爬蟲庫,實現窮游網的獲取。實現的時候,總會有各種各樣的問題,切勿眼高手低,勤動手,才可以理解的更加深刻。
4、可以根據自己的需要選擇自己的喜歡的城市獲取自己想要的有效信息 。
此文轉載文,著作權歸作者所有,如有侵權聯系小編刪除!
需要源代碼或者想了解更多的(點擊這里下載)
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的如何利用python在一个wen'dang'li_如何利用Python网络爬虫给自己跟朋友来一份穷游攻略!走到哪里穷到哪里的哦!...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 解决Yii2邮件发送问题(结果返回成功,
- 下一篇: QT--2D绘图