七、Python简单爬取学堂在线合作院校页面内容
生活随笔
收集整理的這篇文章主要介紹了
七、Python简单爬取学堂在线合作院校页面内容
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
這是一個(gè)大學(xué)生的爬蟲作業(yè),我是收錢干活的,比較簡(jiǎn)單,來過來分享一下。
就是要爬取到合作院校的名稱及該所院校在學(xué)堂在線開課的數(shù)量,將爬取到的數(shù)據(jù)保存到一個(gè)json文件中!例如:“{“清華大學(xué)”:308}”
直接用xpath就可以了,保存為字典,然后轉(zhuǎn)化成json就OK了。
dict(zip(course,nums))將兩個(gè)列表變成字典,這個(gè)需要知道。
爬取代碼如下。
''' @Author: Runsen @微信公眾號(hào): 潤森筆記 @博客: https://blog.csdn.net/weixin_44510615 @Date: 2020/4/13 '''''' 目標(biāo):爬取學(xué)堂在線合作院校頁面內(nèi)容 網(wǎng)址:http://www.xuetangx.com/partners 要求:爬取到合作院校的名稱及該所院校在學(xué)堂在線開課的數(shù)量,將爬取到的數(shù)據(jù)保存到一個(gè)json文件中!例如:“{"清華大學(xué)":308}” '''總結(jié)
以上是生活随笔為你收集整理的七、Python简单爬取学堂在线合作院校页面内容的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 五十二、Python北京美团汉堡外卖数据
- 下一篇: 华硕win7怎么启动u盘 华硕电脑如何从