2行代码用 Python「剪藏」网页为 PDF
不知道你有沒有這樣的場景,在網頁上看到一篇很好的文章,你就很想把它保存下來,并對其中重要的內容進行高亮標記。
這樣的工具有很多,像「印象筆記」就可以“剪藏”網頁內容到筆記中。
不過,「印象筆記」的存儲空間是有限的,普通用戶為60MB/月,如果保存的內容圖片很多的話,能夠保存的文章很有限。
這時,我們可以選擇Python的第三方庫pdfkit,這個模塊可以將網頁、html文件以及字符串生成pdf文件。
把我們想要的網頁保存到本地PDF文件,再結合PDF神器(Adobe Acrobat Pro DC)高亮標記文章的重點內容,很舒服~
下面介紹一下使用pdfkit保存網頁、html文件為pdf文件的具體過程。
1、使用pip安裝pdfkit庫
pip?install?pdfkit2、安裝wkhtmltopdf.exe文件
pdfkit是基于wkhtmltopdf的python封裝,需要安裝wkhtmltopdf.exe。wkhtmltopdf是輕量級軟件,非常很容易安裝。
下載地址:
https://wkhtmltopdf.org/downloads.html
下載后,保存到了如下圖的目錄下,這個目錄可以自己選擇。
將安裝目錄下的bin添加到環境變量的path中。
環境變量配置在Windows上的步驟依次為:右鍵“此電腦”->屬性->高級系統設置->環境變量->系統變量->Path
以我的為例:
D:\Anaconda\wk\wkhtmltopdf\bin\??
至此,完成了工具的準備及配置部分,接下來,可以上代碼了。
3、使用pdfkit庫生成pdf文件
網頁生成pdf:pdfkit.from_url()
html文件生成pdf:pdfkit.from_file()
字符串生成pdf:pdfkit.from_string()
其中,第一個參數為準備保存的鏈接地址或者html文件,第二個參數為保存的文件路徑。
#?導入庫 import?pdfkit#?這里傳入我知乎專欄文章url,轉換為pdf pdfkit.from_url(r'https://zhuanlan.zhihu.com/p/90004310',?'tianzuo.pdf') pdfkit.from_file('wenzhang.html','tianzuo1.pdf') pdfkit.from_string('Hello?Pdf!','tianzuo2.pdf')以我的知乎文章為例,保存后的效果如下圖所示,這樣就可以高亮文章內容,并反復查看文章的重點了。
文中提到的PDF高亮神器,有需要的朋友可以留個言哈,或者你有啥好用的PDF工具分享給我唄~
? ???精 彩 文 章?
用了這個方法,我下載GitHub項目速度達5MB/s!
歷害了!教你自己搭建一個私人網盤..
10個 解放雙手的 IDEA 插件,少些冤枉代碼
總結
以上是生活随笔為你收集整理的2行代码用 Python「剪藏」网页为 PDF的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 历害了!教你自己搭建一个私人网盘..
- 下一篇: 你好~520|Python花式表白的几种