Python -bs4反爬虫解决方法
生活随笔
收集整理的這篇文章主要介紹了
Python -bs4反爬虫解决方法
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
爬蟲有時(shí)會(huì)遭遇兩種情況,導(dǎo)致無(wú)法正常爬取
(1)IP封鎖,(貌似美團(tuán)會(huì)出現(xiàn))
(2)禁止機(jī)器人爬取,(比如Amazon)
解決方法:
我們以下面文章里的爬蟲代碼為例
http://blog.csdn.net/co_zy/article/details/77150544
其中的getHTMLText()函數(shù),更改如下,添加fakeHeaders ,proxies
這里的可以通過(guò)ip測(cè)試網(wǎng)站進(jìn)行驗(yàn)證是否成功使用了代理 http://ip.chinaz.com/
總結(jié)
以上是生活随笔為你收集整理的Python -bs4反爬虫解决方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Python-爬取2345电影并写入文件
- 下一篇: Python-爬取音悦台MV列表以及反爬