网页转 markdown 的工具
文章目錄
- 背景
- 準備工作
- 安裝 clean-mark
- 如何使用
- 效果展示
- 參考資料
背景
想把我在 CSDN 的博客備份下來,最好是 markdown 格式。在探索的過程中發(fā)現(xiàn)了一款工具——clean-mark
它的倉庫地址是:
https://github.com/croqaz/clean-mark
有人問為什么不保存成 html,而是要保存成 markdown 呢?
clean-mark 在項目主頁已經(jīng)說得很清楚了:
- to save interesting articles offline, in a highly readable text format
- it’s easy to read on a tablet, or a Kindle (as it is, or exported to PDF)
- Markdown is easy to export into different formats
- for offline text analysis of multiple articles, using machine learning / AI
準備工作
要用 clean-mark 這個工具,需要安裝 npm 和 nodejs
NPM 的全稱是 Node Package Manager,是隨同 NodeJS 一起安裝的包管理和分發(fā)工具,它很方便讓 JavaScript 開發(fā)者下載、安裝、上傳以及管理已經(jīng)安裝的包。
sudo apt-get install npm除了安裝 npm,還需要安裝 nodejs
sudo apt-get install nodejs-dev我是Ubuntu 的環(huán)境,沒有用上面的命令安裝 nodejs,但是版本太低,需要升級
我搜到的方法是
sudo npm cache clean -f sudo npm install -g n sudo n stable查看版本:
node -v npm -v我升級后查看的結果是
$ node -v v14.15.5 $ npm -v 6.14.11安裝 clean-mark
$ npm install clean-mark --global如何使用
根據(jù)說明,可以指定下載的類型,可以選擇的類型有:
HTML, TEXT and Markdown.
舉例:
$ clean-mark “http://some-website.com/fancy-article” -t html
也可以指定輸出路徑和文件名,比如:
$ clean-mark “http://some-website.com/fancy-article” -o /tmp/article
咱們動手試試。比如我的一篇博客地址是
https://blog.csdn.net/longintchar/article/details/113074860
$ clean-mark "https://blog.csdn.net/u013490896/article/details/113075606"運行后會顯示
=> Processing URL ... > 113075606.md => URL converted!注意:命令中的鏈接也可以沒有兩側的引號
當前目錄下會多出來一個文件 113075606.md
效果展示
參考資料
[0] https://github.com/croqaz/clean-mark
[1] ubuntu安裝nodejs并升級到最新版本
總結
以上是生活随笔為你收集整理的网页转 markdown 的工具的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python爬动态网页json_爬虫再探
- 下一篇: c语言数组左下角便*,数据结构 - 数组