新学了一个用python编写的简单的百度贴吧帖子的爬虫
生活随笔
收集整理的這篇文章主要介紹了
新学了一个用python编写的简单的百度贴吧帖子的爬虫
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
# -*- coding: utf-8 -*-
#---------------------------------------
# 作者:chendn
# 語言:Python 2.7.10
#---------------------------------------import string,urllib2
def tieba(url,beginPage,endPage):for i in range(beginPage,endPage+1):htmlName=string.zfill(i,3)+'.html' #自動填充成3位的文件名,i=1的時候htmlName=001.htmlprint '正在下載第'+str(i)+'個頁面'+htmlNamecreateHtml=open(htmlName, 'w+') #我理解的是創建一個空白的html頁面,名字為htmlName,w+表示讀寫tiebaHtml=urllib2.urlopen(url+str(i)).read() #讀取要抓取的頁面createHtml.write(tiebaHtml) #將抓取的頁面寫入空白頁面createHtml.close() #關閉頁面,完成
url='http://tieba.baidu.com/p/3977277793?pn='
tieba(url,1,5) #顯示該帖的前5頁
轉載于:https://www.cnblogs.com/maixiaopai/p/4769404.html
總結
以上是生活随笔為你收集整理的新学了一个用python编写的简单的百度贴吧帖子的爬虫的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 电动车的头盔如何选择?
- 下一篇: 为什么要抵制四字和吴京?