python爬虫刷网课答题_python实践:利用爬虫刷网课
利用爬蟲刷網課
1
前言:
用過python的人應該都會知道爬蟲這個東西,網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。
今天就來講講如何利用爬蟲技術刷網課。
2
實戰:
最近學校又推送了一波網課,一個一個的看實在太費時間,于是乎就想到了爬蟲來自動刷網課。
第一步
iukl
分析網站源代碼,看看網站是如何上傳用戶的數據的。
這是我們的主站
這是我們要刷的課程
接下來就開始分析源代碼了哦,
這個就是播放視頻相關的js代碼。
我們點進去找找播放之后上傳相關的函數。
從這個javascript函數我們可以看到這個是播放完畢以后上傳到服務器的json數據包。
我們只需要兩個參數就可以實現這個函數的重放了。
courseId就是url里面的419
couttentkpointId就是url里面的10506
每個視頻的pointid不一樣,我們只需要for循環遍歷就行了。
第二步
接下來我們就需要看看這個網站是如何登錄的了。
看到沒,這個網站連驗證碼都沒有,模擬登錄就是小兒科了。
打開我們的brup suite抓個包看看,當然也可以不需要抓包,直接分析源代碼就可以,照顧一下新手,我們就來抓個包吧。
從這里我們就可以看到這是一個POST方法,三個參數分別是account,password,ipForget。
好的接下來我們就用python來模擬登陸了。
第三步
首先在終端下面安裝一下requests。我的系統是mac os
這個是已經安裝好了的,沒有安裝就安裝一下,windows是需要先安裝python的。這里我就不講如何安裝了。
然后打開我們的代碼編輯器。我這里用的是sublime.
代碼如下:
首先就是一個登陸,登陸之后我們就有了cookie,然后利用這個cookie來發包刷網課就行了。
3
文章結尾:
這個網站還是存在很多問題的,如何登陸缺乏驗證就可快速爆破,在筆記的地方存在xss漏洞,具體分析過程我在這里就不寫了。謝謝大家。
—END—
總結
以上是生活随笔為你收集整理的python爬虫刷网课答题_python实践:利用爬虫刷网课的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java面试题总结
- 下一篇: Redfish接口测试