Python简单网页爬取
生活随笔
收集整理的這篇文章主要介紹了
Python简单网页爬取
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
使用Python爬取簡單數據
閑暇時間學習Python,不管以后能否使用,就算了解計算機語言知識。
因為有一點Java基礎,所以Python的基本語法就很快的過了一遍,表達或許有點混亂,以后慢慢改進。
一、導入爬取網頁所需的包。
二、Python屬于腳本語言,沒有類似Java的主入口(main),對于這里理解不是很深,就是給這個類添加一個主入口的意思吧。
if __name__ == '__main__':main()三、接著在定義主函數main(),主函數里應包括
四、需對爬取網頁進行數據的采集
五、定義獲取數據方法
3、準備集合裝載數據,解析網頁數據,匹對正則表達式
可以看出爬取的數據由
六、將得到的數據保存在excel中
def saveData(dataList):Book=xlwt.Workbook(encoding="utf-8",style_compression=0)#style_compression:表示是否壓縮,不常用sheet=Book.add_sheet("小說.xls",cell_overwrite_ok=True)#cell_overwrite_ok,表示是否可以覆蓋單元格line = ("詳情鏈接","筆名","簡介")for item in range(len(line)): #此處循環如果line里只有一個字符串,那么生成的xls里,只會出現一個‘詳’字#print(len(line))sheet.write(0,item,line[item])#wirte(row, col, *args)for i in range(len(dataList)):#第一次循環應是將行數,有多少數據有多少行data=dataList[i] #每一條數據應該放在一行里,所以將在一次進行for循環for j in range(len(line)):sheet.write(i+1,j,data[j])Book.save("測試.xls")總結
以上是生活随笔為你收集整理的Python简单网页爬取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GEWorker界面展示及功能组成介绍,
- 下一篇: python批量爬取下载网易云音乐