西北乱跑娃 --- requests爬虫五大反反爬机制
生活随笔
收集整理的這篇文章主要介紹了
西北乱跑娃 --- requests爬虫五大反反爬机制
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
提及爬蟲相信大家都知道,今天為大家介紹五點解決反爬的機制。
1、SSL證書驗證錯誤
錯誤:
requests.exceptions.SSLError: ("bad handshake: Error([('SSL routines', 'tls_process_server_certificate', 'certificate verify failed')],)",)解決辦法
import requests url = "https://www.baidu.com/" response = requests.get(url,verify=False).content.decode() # 默認解碼方式為UTF-8 print(response)2、用戶user-agent過于頻繁
注意:有些網站會統計單個user-agent單位時間訪問服務器的次數。
解決方法:
總結
以上是生活随笔為你收集整理的西北乱跑娃 --- requests爬虫五大反反爬机制的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: udp攻击的PHP木马
- 下一篇: 简述什么是图灵机_图灵机的工作原理是什么