當前位置：首頁 > 编程语言 > python >内容正文

python

用python爬虫爬取无水印图片_使用python 爬虫，爬取图片

發布時間：2025/3/15 python 27 豆豆

生活随笔收集整理的這篇文章主要介紹了用python爬虫爬取无水印图片_使用python 爬虫，爬取图片小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、需求：

用python實現去內涵段子里面下載網頁當中的圖片到本地當中

二、實現：

1、獲取要爬取的URL地址

2、設置headers

3、請求網頁內容，把html內容轉換成XML

4、解析地址內容，進行圖片下載

三、開始操作：以下圖為例子

1、獲取要爬取的URL地址:

url="http://www.neihan8.com/gaoxiaomanhua/index_2.html"

2、設置headers:

headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko"}

3、請求網頁內容，把html內容轉換成XML

request = urllib2.Request(url,headers=headers)

response = urllib2.urlopen(request).read()

xml = etree.HTML(response)#這個etree是需要在前面導入包的 : from lxml import etree

4、解析地址內容，進行圖片下載，我們通過上面的圖片進行獲取到具體的xpath圖片地址.

linklist = content.xpath('/html/body/div[@class="main wrap"]//div[@class="left"]/div[@class="pic-column-list mt10"]/div/a/img/@src')

ps:這個linklist里面存放的是所有這個xpath里面的內容，所以如果需要下載的話需要依次提取

for link in linklist:

image_request = urllib2.Request(link)

response = urllib2.urlopen(image_request).read()

filename = link[10:0]

with open(fileName,"wb") as f:

f.write(response)

上面是分別解釋了一下流程，都是手寫的代碼，第一次寫文章比較粗糙大家見諒了。下面是整個代碼的內容

import urllib2

from lxmlimport etree

class Spider:

pass

def __init__(self):

self.pageNum =2

self.switch =True

def loadImage(self):

url ="http://www.neihan8.com/gaoxiaomanhua/index_"+str(self.pageNum)+".html"

headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko"}

request = urllib2.Request(url,headers=headers)

response= urllib2.urlopen(request).read()

content = etree.HTML(response)

linklist = content.xpath('/html/body/div[@class="main wrap"]//div[@class="left"]/div[@class="pic-column-list mt10"]/div/a/img/@src')

for image_linkin linklist:

print "downLoading..."

self.writeImage(image_link)

def writeImage(self,link_address):

headers = {"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko"}

download_request? =urllib2.Request(link_address)

response = urllib2.urlopen(download_request).read()

fileName = link_address[-10:]

with open(fileName,"wb")as f:

f.write(response)

print "downLoad---FINISH"

if __name__ =="__main__":

spider = Spider()

spider.loadImage()

總結

以上是生活随笔為你收集整理的用python爬虫爬取无水印图片_使用python 爬虫，爬取图片的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 8年了，这几个时间API你用过吗？
下一篇：生产问题分析！delete in子查询不