用Python批量下载MOOC资源
用Python批量下載MOOC資源
簡介
這是我編寫的一個Python腳本,用來批量下載一門MOOC的資源,包括視頻、PDF和課程目錄。
你是否也曾上MOOC學習過?有沒有和我一樣遇到這些情況:
那么,這個python腳本可能會幫到你,下面我來詳細介紹它的使用方法
使用步驟
第一步 運行腳本
第二步 輸入MOOC課程編號
運行后會彈出一個黑色的窗口,提示我們輸入課程編號,課程就是你想要下載的MOOC課程,在網頁中打開該課程后,瀏覽器的URL此時為:https://www.icourse163.org/course/BIT-1001870001 (以《Python網絡爬蟲與信息提取》這門課為例)它的課程編號就是BIT-1001870001,我們直接在黑色的窗口中輸入這個編號后回車。
窗口會不斷更新給出已經下載的課程目錄,耐心等待全部下載完成。
第三步 查看下載結果
回到我們最初放置mooc_dload文件的目錄,此時我們可以看到,文件夾中出現了幾個新的文件,分別是PDFs、Links.txt、TOC.txt和Rename.bat,下面是它們各自的說明:
第四步 下載視頻
你可能發現腳本并沒有直接下載視頻,而是下載了視頻的下載鏈接。因為我考慮到直接下載視頻的話會使腳本運行時間過長,一旦中間不小心關閉窗口或者因為網絡不穩定等原因使腳本終止,就只能刪掉下載好的部分視頻重新來過;對于有的MOOC包含的視頻實在太長太多,我們可能會想要分批下載保存;另外,腳本默認的下載方式往往不是最快的,我們可以用鏈接+下載器的方式更好實現我們的下載。
這里我以迅雷為例
打開Links.txt,復制全部內容;打開迅雷軟件-新增下載任務,迅雷會自動填入剪貼板中的鏈接,選擇好下載目錄開始下載。(最好新建一個專門的文件夾集中存放視頻)
最終下載好的視頻文件是原始名字,一般都是一串看不懂的字符,為了方便找到我們要看的視頻,我們將Rename.bat拷貝到視頻文件的目錄下,雙擊運行,所有視頻的名字就被改正過來了。
寫在最后
總結
以上是生活随笔為你收集整理的用Python批量下载MOOC资源的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: webstorm 破解方法(100%好使
- 下一篇: 【代码笔记】iOS-字体抖动动画