爬虫python漏洞群_如何用爬虫获取cnvd漏洞库?
生活随笔
收集整理的這篇文章主要介紹了
爬虫python漏洞群_如何用爬虫获取cnvd漏洞库?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
CNVD用了知道創宇的加速樂,這個東西有個反爬蟲機制,第一次請求(只帶了__jsluid)會只返回一個js文件。第二次請求的時候會帶上 __jsluid cookies和JS解密計算出來的一個叫做__jsl_clearance的cookies值,只有這兩個cookies驗證匹配才認為是合法的訪問身份。
所以只要得到__jsl_clearance并且和__jsluid一起放到請求頭中就可以返回正常的頁面了
解決方案有兩種:
1、研究并處理返回的js文件得到__jsl_clearance。js是加密的,而且每次算法都不一樣,沒轍了
2、用selenium直接模擬瀏覽器訪問,通過get_cookie方法直接拿到__jsl_clearance和__jsluid,成功
注意請求頭要和webdrive的瀏覽器一樣,尤其是User-Agent。因為我是放在ubuntu上跑的,所以是
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36',
就可以返回正常頁面了
等之后項目上線我把會源代碼扔到github上
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的爬虫python漏洞群_如何用爬虫获取cnvd漏洞库?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 科研工作者结合实验与计算机模拟,理论物理
- 下一篇: 计算机桌面壁纸怎样拉伸,win10桌面壁