爬虫之基于线程池异步抓取
生活随笔
收集整理的這篇文章主要介紹了
爬虫之基于线程池异步抓取
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
from multiprocessing.dummy import Pool #線程池模塊#必須只可以有一個(gè)參數(shù)
def my_requests(url):return requests.get(url=url,headers=headers).textstart = time.time()
urls = ['http://127.0.0.1:5000/bobo','http://127.0.0.1:5000/jay','http://127.0.0.1:5000/tom',
]pool = Pool(3)
#map:兩個(gè)參數(shù)
#參數(shù)1:自定義的函數(shù),必須只可以有一個(gè)參數(shù)
#參數(shù)2:列表or字典
#map的作用就是讓參數(shù)1表示的自定義的函數(shù)異步處理參數(shù)2對應(yīng)的列表或者字典中的元素
page_texes = pool.map(my_requests,urls)
print(page_texes)print(time.time()-start)
?
轉(zhuǎn)載于:https://www.cnblogs.com/songzhixue/p/11303823.html
總結(jié)
以上是生活随笔為你收集整理的爬虫之基于线程池异步抓取的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Maven常用的构建命令
- 下一篇: 【搜索】$P1092$虫食算