爬取图片
如下,爬取 http://tieba.baidu.com/p/4229162765 這個頁面的圖片并下載到桌面的 images 文件夾下:
#!/usr/bin/env python #-*- coding:utf-8 -*-''' 以下代碼在 PyCharm 中運行 '''import re import urllib import urllib2# 獲取HTML源碼 def getHTML(url):request = urllib2.urlopen(url)data = request.read()return data
# 對HTML源碼進行過濾,過濾出圖片的url,并下載圖片 def getImages(html):regular = re.compile(r'<img class="BDE_Image" src="(.*?)".*?>')image_list = regular.findall(html)i = 1for image in image_list:urllib.urlretrieve(image, filename='C:\\Users\\Administrator\\Desktop\\images\\%s.jpg' % i)i += 1if __name__ == '__main__':url = 'http://tieba.baidu.com/p/4229162765'html = getHTML(url)getImages(html)
?
?
?
?
?
?
?
? ??
轉載于:https://www.cnblogs.com/pzk7788/p/10372443.html
總結
- 上一篇: 家人们,定制地板跟普通地板有什么区别?柏
- 下一篇: 朋友们说说,高端定制地板环保吗?有没有人