asciidoc转换html,Word文档到Asciidoc转换
原文
Word文檔的內容,需要背轉換為Asciidoc。以下是我發現最有效的步驟:
1. 將Word文檔保存為HTML
2. 編碼為UTF-8
3. 使用pandoc將HTML轉換為AsciiDoc
4. 使用Sublime Text 2搜索和替換(使用一些正則表達式)去除瘋狂的東西
5. 使用Sublime Text 2執行任何剩余的格式
將Word文檔保存為HTML
在Word中打開文檔,然后另存為網頁。保存時選擇“僅保存顯示信息到HTML”選項。從Word退出。
編碼為UTF-8
在Sublime Text 2中打開html文件。重新打開UTF-8編碼并保存文件:
Sublime Text 2重新打開編碼
如果不重新編碼為UTF-8,則下一步將失敗并顯示錯誤:
pandoc:無法解碼字節’\ x6f’:Data.Text.Encoding.decodeUtf8:無效的UTF-8流
使用Pandoc將HTML轉換為AsciiDoc
運行Pandoc。例如,以下命令將AsciiDoc文件file.asc轉換為ConventionSheet.htm:
pandoc -f html -t asciidoc -o file.asc ConventionSheet.htm
使用Sublime Text 2搜索和替換(使用一些正則表達式)去除瘋狂的東西
奇怪的單引號需要去:
Sublime Text 2用單引號替換反引號,如果在Word中進行了審核,則審閱者的評論和更改可能會出現在HTML中。使用搜索刪除這些,并在搜索字段中替換以下正則表達式:
\[line-through\]\*(.+)\*
當匹配行交叉線斷裂時,可以使用?s正則表達式中的單行選項()進行搜索和替換:
(?s)\[line-through\]\*.(.*?)\*
使用Sublime Text 2執行任何剩余的AsciiDoc格式
在文檔中等間隔任何正則表達式或其他特殊字符(這些將導致AsciiDoc解析器的問題)。
根據需要編輯AsciiDoc文檔!請注意,GitHub現在本地顯示AsciiDoc文件(在幕后使用AsciiDoctor),就像Markdown一樣。
總結
以上是生活随笔為你收集整理的asciidoc转换html,Word文档到Asciidoc转换的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue 动态生成二维码 qrcode
- 下一篇: docker启动nginx命令