Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息
生活随笔
收集整理的這篇文章主要介紹了
Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本文會利用requests庫抓取起點中文網上的小說信息,并通過XPath提取相關的內容,最后將經過提取的內容保存到Excel文件中。本例需要使用第三方的xlwt庫,該庫用來通過Python操作Excel文件,需要使用下面的命令安裝xlwt庫。
pip install xlwt
使用xlwt庫非常簡單,首先需要創建一個workbook,相當于一個Excel文件,然后在workbook中添加若干個Sheet,接下來在每一個Sheet中的指定單元格(Cell)添加文本,最后使用workbook的save方法保存Excel文件。完整的實現代碼如下:
import xlwt # 創建Workbook對象,并指定編碼為utf-8 book = xlwt.Workbook(encoding='utf-8') # 添加第1個Sheet,名稱為Sheet1 sheet1 = book.add_sheet('Sheet1') # 添加第2個Sheet,名稱為Sheet2 sheet2 = book.add_sheet('Sheet2') # 向第1個Sheet的Cell(1,1)位置添加文本 sheet1.write(1,1,'世界,你好') # 向第1個Sheet總結
以上是生活随笔為你收集整理的Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一些常用外围电路的设计/硬件电路设计参考
- 下一篇: 网络互联和路由原理