當前位置：首頁 > 编程语言 > python >内容正文

python

python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例

發布時間：2025/3/20 python 14 豆豆

生活随笔收集整理的這篇文章主要介紹了 python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本例程使用urlib實現的，基于python2.7版本，采用beautifulsoup進行網頁分析，沒有第三方庫的應該安裝上之后才能運行，我用的IDE是pycharm，閑話少說，直接上代碼！

# -*- coding: utf-8 -*

import re

import os

import urllib

import urllib2

from bs4 import BeautifulSoup

def craw(url,page):

html1=urllib2.urlopen(url).read()

html1=str(html1)

soup=BeautifulSoup(html1,'lxml')

imagelist=soup.select('#J_goodsList > ul > li > div > div.p-img > a > img')

namelist=soup.select('#J_goodsList > ul > li > div > div.p-name > a > em')

#pricelist=soup.select('#plist > ul > li > div > div.p-price > strong')

#print pricelist

path = "E:/{}/".format(str(goods))

if not os.path.exists(path):

os.mkdir(path)

for (imageurl,name) in zip(imagelist,namelist):

name=name.get_text()

imagename=path + name +".jpg"

imgurl="http:"+str(imageurl.get('data-lazy-img'))

if imgurl == 'http:None':

imgurl = "http:" + str(imageurl.get('src'))

try:

urllib.urlretrieve(imgurl,filename=imagename)

except:

continue

'''

#J_goodsList > ul > li:nth-child(1) > div > div.p-img > a > img

#plist > ul > li:nth-child(1) > div > div.p-name.p-name-type3 > a > em

#plist > ul > li:nth-child(1) > div > div.p-price > strong:nth-child(1) > i

'''

if __name__ == "__main__":

goods=raw_input('please input the goos you want:')

pages=input('please input the pages you want:')

count =0.0

for i in range(1,int(pages+1),2):

url="https://search.jd.com/Search?keyword={}&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&suggest=1.def.0.T06&wq=diann&page={}".format(str(goods),str(i))

craw(url,i)

count += 1

print 'work completed {:.2f}%'.format(count/int(pages)*100)

圖片的命名為商品的名稱，京東商品圖片地址的屬性很可能會有所變動，所以大家進行編寫的時候應該舉一反三，靈活運用！

這是我下載下來的手機類圖片文件的截圖：

我本地的爬取的速度很快，不到一分鐘就能爬取100頁上千個商品的圖片！

以上這篇python利用urllib實現爬取京東網站商品圖片的爬蟲實例就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持易采站長站。

總結

以上是生活随笔為你收集整理的python爬取京东商品图片_python利用urllib实现爬取京东网站商品图片的爬虫实例的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： mysql 事务数量_如何知道数据库创
下一篇： python脚本创建拓扑_实验 1：Mi