python跟易语言的爬虫_新人Python,第一只爬虫,,我就只会re.findall,你咬我?
[Python] 純文本查看 復(fù)制代碼import requests
import re
import os
# 設(shè)置瀏覽器引擎
headers ={
'User-Agent': 'Mozilla/5.0(Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
}
# 根據(jù)搜索,得到搜索結(jié)果網(wǎng)頁
search = input('你想找怎樣的女盆友 : ')
murl = 'https://www.tujigu.com/search/' + search
response = requests.get(murl, headers=headers)
HTML = response.content.decode('utf-8')
urls = re.findall('
# 從全部圖集URL中,找出單個(gè)圖集的URL進(jìn)行分析
for url in urls:
response = requests.get(url, headers=headers)
HTML = response.content.decode('utf-8')
picsname = re.findall('
(.*?)', HTML)[0] # 圖集的名稱picmax = int(re.findall('
圖片數(shù)量: (.*?)P
', HTML)[0]) # 獲取總的圖片數(shù)量ID = url.split("/")[4] #獲取圖集的ID,方便進(jìn)行圖片URL的拼接
path = '圖集谷\\' + picsname
# 創(chuàng)建圖集目錄
if not os.path.exists(path):
os.makedirs(path)
print('目錄創(chuàng)建完成!,記得設(shè)置為隱私文件哦 ')
else:
print('目錄已創(chuàng)建!!,一看就是老紳士了 ')
# 開始下載圖集
print(picsname)
print('開始下載嗷~~~')
for i in range(1, picmax):
picurl = 'https://lns.hywly.com/a/1/' + ID +'/' + str(i) + '.jpg'
print('(≧^.^≦)喵~~~正在下載:' + picurl + '')
res = requests.get(picurl).content
with open('%s\%s.jpg'%(path, i), 'wb') as f:
f.write(res)
print(picsname + '\n下載完成!\n\n')
總結(jié)
以上是生活随笔為你收集整理的python跟易语言的爬虫_新人Python,第一只爬虫,,我就只会re.findall,你咬我?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是 AJAX?
- 下一篇: 《心动小镇》开启事件和派对方法