PDF怎么转换成WORD?3大方法助您PDF转Word!
還不知道PDF怎么轉(zhuǎn)換成WORD嗎,本文將提供完整的PDF轉(zhuǎn)Word方案,包括離線、在線或者SDK API等各種方式,總有一款滿足您的需求。
什么是PDF轉(zhuǎn)Word?
PDF是出版和圖形領(lǐng)域的軟件廠商Adobe制定的電子文檔格式標(biāo)準(zhǔn)。PDF轉(zhuǎn)Word就是把PDF文檔中的文字,圖片,表格,注釋等等文檔元素相對(duì)應(yīng)的轉(zhuǎn)換成Word文檔中相對(duì)應(yīng)的文檔元素。
所謂PDF轉(zhuǎn)Word就是指從PDF格式文檔中提取文字、圖形和及其它內(nèi)容并放入Word或者其他格式文檔中(也可以是其他文件格式,如Excel/PPT/HTML/IMAGE等),無需重新排版,支持圖文混合排版,因此你就能重復(fù)利用你的PDF文檔內(nèi)容,在Word中再編輯或者重整布局。
PDF文檔為什么需要轉(zhuǎn)成Word?
PDF是一種適合分享傳播的文件格式,跨平臺(tái)打開能夠保持一致性,很受用戶歡迎。但是PDF文檔很難進(jìn)行編輯修改,如果您需要對(duì)PDF進(jìn)行編輯,就需要將PDF轉(zhuǎn)換為WORD,轉(zhuǎn)換后用WPS或者Office就可以進(jìn)行編輯修改了。
PDF轉(zhuǎn)Word的三大方法
PDF轉(zhuǎn)Word一般來說有三種方式,下面我們就來一一介紹下吧,您可以根據(jù)需要選用不同的方式。
1. 傳統(tǒng)PC端軟件PDF轉(zhuǎn)Word
本方法就是下載一個(gè)PDF軟件到桌面,并安裝。安裝之后就可以離線使用了。
你可以下載Adobe Acrobat Pro試用版 ,有7天的免費(fèi)試用期,Acrobat Pro一次性費(fèi)用大概1800元左右
Aodbe公司是PDF標(biāo)準(zhǔn)的制定者,Acrobat Pro功能強(qiáng)大,除了貴沒有太多毛病
適用人群和場(chǎng)景:
如果您對(duì)PDF處理的準(zhǔn)確性和性能要求很高,高頻對(duì)PDF進(jìn)行各種處理,對(duì)數(shù)據(jù)安全要求頁比較高,而且不差錢,可以購買Acrobat Pro
Acrobat Pro的PDF轉(zhuǎn)Word功能比較強(qiáng)大,轉(zhuǎn)換的效果還原度很高,基本上可以做到99.9%的還原效果
2. 在線轉(zhuǎn)換或者小程序轉(zhuǎn)換PDF文檔
在線的PDF處理,就是在網(wǎng)站或者小程序上直接上傳PDF文件,在線處理完畢之后,下載到本地。
目前在線的PDF處理有免費(fèi)和收費(fèi)兩種,收費(fèi)的一般開放一個(gè)小額的試用,比如1兆大小,10頁等,然后引導(dǎo)到收費(fèi)。免費(fèi)的一般沒有太多限制。
第一步:打開PDF工具箱?PDF轉(zhuǎn)Word
第二步:上傳PDF文件
通過選擇文件或者將PDf文件拖拽到上述區(qū)域(支持doc或者docx格式的word文件)
可以上傳1個(gè)或者多個(gè)PDF文件
第三步點(diǎn)擊轉(zhuǎn)換為Word按鈕
第四步下載
看到?jīng)]有,已經(jīng)成功轉(zhuǎn)為為docx的word格式,里面的文本、圖片都可以隨意編輯修改。Perfect!
在線PDF轉(zhuǎn)Word的效果如何?
目前來說,只有Adobe原生的Acrobat軟件對(duì)PDF的編輯、轉(zhuǎn)Word是最完美、損耗最少的。
但是Acrobat只適合不差錢的大公司,一般用戶都會(huì)選擇免費(fèi)的PDF轉(zhuǎn)換器來進(jìn)行轉(zhuǎn)換,我們來對(duì)比下各種PDF格式下轉(zhuǎn)換的效果如何(圖片、表格、注釋等)
我們來對(duì)比下不同PDF下的word轉(zhuǎn)換效果
1. 純文本+圖片類型的
上面的示例就是純文本+圖片格式的,轉(zhuǎn)換效果還是不錯(cuò)的,字體大小、顏色、布局、圖片位置等,基本無差別的
2.帶有簡單表格的PDF文檔
3.復(fù)雜表格和混合編排的PDF
具體轉(zhuǎn)換效果對(duì)比可以查看效果對(duì)比
適用人群和場(chǎng)景:
在線PDF轉(zhuǎn)換Word需要在線使用,一般是對(duì)數(shù)據(jù)安全沒有非常強(qiáng)的訴求,同時(shí)非高頻的PDF處理編輯,而且對(duì)價(jià)格比較敏感,那么PDF88的各種處理工具,能夠滿足您大部分的PDF處理訴求。
3. 技術(shù)派:三方類庫或者API實(shí)現(xiàn)PDF轉(zhuǎn)Word
技術(shù)派的PDF處理就是用第三方類庫或者OpenAPI,對(duì)pdf進(jìn)行處理,一般是需要批量自動(dòng)的處理PDF文件時(shí),通過類庫和API就能大量的減少時(shí)間。目前PDF的處理類庫較多,我們選擇幾個(gè)有代表的來說下。
開源類庫
pdfbox?Java類庫
PDFBox是一個(gè)BSD許可下的源碼開放項(xiàng)目,為開發(fā)人員讀取和創(chuàng)建PDF文檔而準(zhǔn)備的純Java類庫。地址在 Apache PDFBox | A Java PDF Library 社區(qū)比較活躍,更新速度較快
代碼示例
import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;public class PDFToWord {public static void main(String[] args) {try {//input fileString pdfFile = "test.pdf";//load pdfPDDocument doc = PDDocument.load(new File(pdfFile));//get pdf numberint pagenumber = doc.getNumberOfPages();String fileName="word.doc";File file = new File(fileName);if (!file.exists()) {file.createNewFile();}FileOutputStream fos = new FileOutputStream(fileName);Writer writer = new OutputStreamWriter(fos, "UTF-8");PDFTextStripper stripper = new PDFTextStripper();stripper.setSortByPosition(true);stripper.setStartPage(1);stripper.setEndPage(pagenumber);stripper.writeText(doc, writer);writer.close();doc.close();System.out.println("pdf轉(zhuǎn)word done!");} catch (IOException e) {e.printStackTrace();}} }pdfbox 轉(zhuǎn)換效果一般,對(duì)復(fù)雜的PDF格式,還原度較差,感興趣的可以自己測(cè)試下!
itext Java類庫?
iText是著名的開放源碼的站點(diǎn)sourceforge一個(gè)項(xiàng)目,是用于生成PDF文檔的一個(gè)java類庫。通過iText不僅可以生成PDF或rtf的文檔,而且可以將XML、Html文件轉(zhuǎn)化為PDF文件。
iText的安裝非常方便,下載iText.jar文件后,只需要在系統(tǒng)的CLASSPATH中加入iText.jar的路徑,在程序中就可以使用iText類庫了。或者直接在mavan中引入坐標(biāo)地址?https://github.com/itext/itext7
同時(shí)itext也有收費(fèi)的版本 還有一個(gè).net的itext版本
代碼
import java.io.File; import java.io.FileOutputStream; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfTextExtractor; import com.lowagie.text.Document; import com.lowagie.text.Paragraph; import com.lowagie.text.rtf.RtfWriter2;public class ReadPdfFile {public static void main(String[] args) {try {Document document = new Document();File file = new File("file.doc");if(!file.exists())file.createNewFile();RtfWriter2.getInstance(document, new FileOutputStream("file.doc"));System.out.println("file created");document.open();PdfReader reader = new PdfReader("test.jar");int n = reader.getNumberOfPages();System.out.println("total no of pages:::"+n);String s="";for(int i=1;i<=n;i++){s=PdfTextExtractor.getTextFromPage(reader, i);System.out.println("string:::"+s);System.out.println("====================");document.add(new Paragraph(s));document.newPage();}document.close();System.out.println("completed");} catch (Exception de) {}}}pdf.js JavaScript類庫
準(zhǔn)確的說pdf.js更多的用戶前端的PDF展示和渲染,提供了pdf的讀寫api
地址 GitHub - mozilla/pdf.js: PDF Reader in JavaScript
如果您要用來生成PDF,需要做大量的額外工作,不建議使用!
收費(fèi)類庫:
說完了免費(fèi)的開源類庫,下面說說收費(fèi)的PDF類庫。
開源類庫效果一般,處理復(fù)雜的圖標(biāo)格式的PDF 有點(diǎn)力不從心,收費(fèi)PDF是商業(yè)化軟件,可以處理復(fù)雜的格式文件,但一般費(fèi)用比較高,用于商業(yè)化用途較多。
aspose
Aspose 是一家致力于辦公組件的提供商,數(shù)千機(jī)構(gòu)都有用過aspose組件,包括微軟、IBM、普華永道、安永、杜邦、希爾頓酒店、讀者文摘、美洲銀行、波音、西門子等。Aspose目前旗下一共有41個(gè)控件,Aspose.Total是它的總套包。
能夠用來處理PDF的是Aspose.PDF 工具包,支持java .net C++等,價(jià)格昂貴,一個(gè)授權(quán)1199美金起!
import com.aspose.pdf.DocSaveOptions; import com.aspose.pdf.Document; import com.aspose.pdf.SaveFormat; import com.aspose.pdf.examples.Utils;public class ConvertPDFToDOCOrDOCXFormat {public static void main(String[] args) {runExamples();}public static void runExamples() {// The paths to resources and output directories.String testID = "com/aspose/pdf/examples/AsposePdf/Conversion/pdftodoc/";String dataDir = Utils.getDataDir(testID);String outputDir = Utils.getOutDir(testID);System.out.println("============================");System.out.println("Example savingToDoc start");savingToDoc(dataDir, outputDir);System.out.println("Example savingToDoc end");System.out.println("============================");System.out.println("Example savingToDOCX start");savingToDOCX(dataDir, outputDir);System.out.println("Example savingToDOCX end");System.out.println("============================");System.out.println("Example usingTheDocSaveOptionsClass start");usingTheDocSaveOptionsClass(dataDir, outputDir);System.out.println("Example usingTheDocSaveOptionsClass end");}public static void savingToDoc(String dataDir, String outputDir) {// Open the source PDF documentDocument pdfDocument = new Document(dataDir + "input2.pdf");// Save the file into Microsoft document formatpdfDocument.save(outputDir + "TableHeightIssue.doc", SaveFormat.Doc);}public static void savingToDOCX(String dataDir, String outputDir) {// Load source PDF fileDocument doc = new Document(dataDir + "input.pdf");// Instantiate Doc SaveOptions instanceDocSaveOptions saveOptions = new DocSaveOptions();// Set output file format as DOCXsaveOptions.setFormat(DocSaveOptions.DocFormat.DocX);// Save resultant DOCX filedoc.save(outputDir + "savingToDOCX.docx", saveOptions);}public static void usingTheDocSaveOptionsClass(String dataDir, String outputDir) {// Open a document// Path of input PDF documentString filePath = dataDir + "source.pdf";// Instantiate the Document objectDocument document = new Document(filePath);// Create DocSaveOptions objectDocSaveOptions saveOption = new DocSaveOptions();// Set the recognition mode as FlowsaveOption.setMode(DocSaveOptions.RecognitionMode.Flow);// Set the Horizontal proximity as 2.5saveOption.setRelativeHorizontalProximity(2.5f);// Enable the value to recognize bullets during conversion processsaveOption.setRecognizeBullets(true);// Save the resultant DOC filedocument.save(outputDir + "usingTheDocSaveOptionsClass.doc", saveOption);}}pdf-tools
pdf-tools是一家瑞士的pdf解決方案服務(wù)商,提供了pdf sdk的整合方案!
PDF-tools支持30天免費(fèi)試用,支持java .net c++等多種語言,大家可以下載下來自己試用下!
pdftron
PDFTron SDK是一個(gè)技術(shù)平臺(tái),為任何軟件提供PDF、CAD和MS Office功能。這是構(gòu)建文檔功能的一種更簡單、更快的方式,使您的開發(fā)人員更高效,用戶更快樂。和Aspose類似
代碼案例
Convert.WordOutputOptions wordOutputOptions = new Convert.WordOutputOptions();// Optionally convert only the first page wordOutputOptions.setPages(1, 1);// Requires the Structured Output module Convert.toWord(filename, output_filename, wordOutputOptions);foxit-pdf
foxit是一家專門從事PDF解決方案的供應(yīng)商,為了實(shí)現(xiàn)成為PDF解決方案第一品牌的愿景,Foxit滿足了三個(gè)不同細(xì)分市場(chǎng)的需求。
foxit的高性能庫使用最流行的開發(fā)人員語言和環(huán)境,為所有平臺(tái)的企業(yè)、移動(dòng)和云應(yīng)用程序添加了強(qiáng)大的PDF功能。
結(jié)論:
PDF的解決方案,基本上就是上述三種,當(dāng)然,每一種都有非常多的服務(wù)提供商,篇幅關(guān)系,沒有一一列出。
大家可以根據(jù)自己的需要,選擇不同的方案來使用!
如果是企業(yè)用戶,對(duì)數(shù)據(jù)安全比較敏感,不差錢,建議 用adobe官方的Acrobat Pro如果是個(gè)人用戶,或者企業(yè)中對(duì)PDF處理不頻繁,在線的處理工具就足夠了,比如pdf88.cn提供了主流的PDF處理服務(wù)。
如果對(duì)PDF有海量自動(dòng)化處理的訴求,可以用SDK或者API來滿足,小企業(yè)一般免費(fèi)也差不多夠了,如果追求性能,那就去購買昂貴的商業(yè)SDK,或者使用破解版的!
總結(jié)
以上是生活随笔為你收集整理的PDF怎么转换成WORD?3大方法助您PDF转Word!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于蓝牙(HC-05)的安卓蓝牙 APP
- 下一篇: UBUNTU安装 百度云,360