word和html互换,word与html互转(2) -- html转word
使用忠告
使用該方式進行xhtml到word的轉換, 簡單轉換是可以, 但是可能并沒有想象中那么滿意, 轉換出來的word格式并不完美, 比如目錄和標題都會丟失, 標題顯示看起來一樣, 但是是用正文加粗和加大字號來顯示的. 畢竟word是一種文檔格式, 而html是一種標記性語言, 要想實現完美兼容和轉換很難
加上word與html互轉(1) -- word轉html, 雖然word與html互轉都有實現手段, 但是考慮到轉換的格式復雜度和后期的維護成本, 我們最后放棄去實現這個成本高但是對項目影響不大的功能
實現
實現方式
使用poi+xdocreport來實現
poi:都熟悉, 這邊不作介紹
Docx4j:是github上的一個開源項目, 使用起來很簡單, 可以很輕松的將xhtml轉為docx, 他的具體介紹可以去他的項目地址查看--項目地址
引入相關程序包
org.apache.poi
poi
3.14
org.apache.poi
poi-scratchpad
3.14
org.apache.poi
poi-ooxml
3.14
org.apache.poi
poi-ooxml-schemas
3.14
org.apache.poi
ooxml-schemas
1.3
org.docx4j
docx4j-ImportXHTML
3.0.0
html轉docx
public static void main(String[] args) throws Exception {
String inputfilepath = "C:\\Users\\Administrator\\Desktop\\test.html";
String baseURL = "C:\\Users\\Administrator\\Desktop";
String stringFromFile = FileUtils.readFileToString(new File(inputfilepath), "UTF-8");
String unescaped = stringFromFile;
if (stringFromFile.contains("</") ) {
unescaped = StringEscapeUtils.unescapeHtml(stringFromFile);
}
// 設置字體映射
RFonts rfonts = Context.getWmlObjectFactory().createRFonts();
rfonts.setAscii("Century Gothic");
XHTMLImporterImpl.addFontMapping("Century Gothic", rfonts);
// 創建一個空的docx對象
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.createPackage();
XHTMLImporter importer = new XHTMLImporterImpl(wordMLPackage);
importer.setTableFormatting(FormattingOption.IGNORE_CLASS);
importer.setParagraphFormatting(FormattingOption.IGNORE_CLASS);
NumberingDefinitionsPart ndp = new NumberingDefinitionsPart();
wordMLPackage.getMainDocumentPart().addTargetPart(ndp);
ndp.unmarshalDefaultNumbering();
// 轉換XHTML,并將其添加到我們制作的空docx中
XHTMLImporterImpl XHTMLImporter = new XHTMLImporterImpl(wordMLPackage);
XHTMLImporter.setHyperlinkStyle("Hyperlink");
wordMLPackage.getMainDocumentPart().getContent().addAll(
XHTMLImporter.convert(unescaped, baseURL));
wordMLPackage.save(new java.io.File("C:\\Users\\Administrator\\Desktop\\test.docx"));
}
html轉doc
public void test() throws IOException {
//這邊我為了測試, 使用的是自己拼接出html
String html = getHtml();
byte b[] = html.getBytes("utf-8");
// 根據數組
ByteArrayInputStream bais = new ByteArrayInputStream(b);
POIFSFileSystem poifs = new POIFSFileSystem();
DirectoryEntry directory = poifs.getRoot();
directory.createDocument("WordDocument", bais);
poifs.writeFilesystem(new FileOutputStream("C:\\Users\\Administrator\\Desktop\\test.doc"));
}
public String getHtml() {
StringBuilder html = new StringBuilder();
html.append(""-//W3C//DTD XHTML 1.0 Transitional//EN\" \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\">");
html.append("");
html.append("
");html.append("
");html.append("
html.append("
111
");html.append("
2222
");html.append("
33333
");html.append("
444444
");html.append("
");html.append("
");html.append("
html.append("
html.append("
");html.append("
table1");html.append("
table2
");html.append("
");html.append("
");html.append("
table3");html.append("
table4
");html.append("
");html.append("
");html.append("
html.append("");
return html.toString();
}
總結
以上是生活随笔為你收集整理的word和html互换,word与html互转(2) -- html转word的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何提高linux的时钟精度,Linux
- 下一篇: abap 添加alv上的工具栏的按钮_你