[转]常用OCR软件介绍
轉載出處:http://blog.csdn.net/zhulinu/article/details/9095585
常用OCR軟件介紹??????????????????????????
1、ABBYY ***ABBYY FineReader 簡介:馳名品牌,全球都在用,國外4大OCR公司之一,眾多打印機、掃描儀都自帶它為ocr軟件。安裝程序約300MB,選擇詞庫安裝后約500MB。 評價:功能齊全,眾多軟件中應該是第一。 缺點:占cpu/內存大。有時會識別出一些不存在的字(和正確的字很相像,但不存在。造字?) 友情提醒:Win有Corporate 和Professional (企業和專業)版,也有蘋果Mac版,大家選自己要的。 ***ABBYY Screenshot Reader 簡介: 功能類似漢王屏幕摘抄、Mini Ocr是專門OCR識別屏幕截圖用的。2、I.R.I.S. Readiris 簡介:馳名品牌,全球都在用,國外4大OCR公司之一,眾多印機、掃描儀都自帶它為ocr軟件。安裝程序約200MB,選擇詞庫安裝后約100MB。 評價:功能可以,對表格的識別率ms比ABBYY FineReader高。沒遇到FineReader的造字問題。 缺點:沒自帶校對功能。 友情提醒: 一定用Asian版,沒寫Asian的不支持中文! 導入圖片時勾上“使用300dpi分辨率” 不然若圖片不達標會彈出提示叫你從掃。 (廢話,我要是有好的干嘛不用,設計師nc) Win有Corporate 和Professional (企業和專業)版,也有蘋果Mac版,大家選自己要的。
3、漢王 簡介:國產企業,值得支持 缺點:不支持多頁單TIF文檔 ***漢王文本王文豪7600 評價:功能滿全的,自帶的幾個小工具不錯(漢王拼圖精靈、漢王屏幕摘抄、漢王照片摘抄) 友情提醒: 1.貌似該公司目前開發重點是硬件,2007后出了文本王文豪7600就沒更新了。 2.網上一個366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 這兩個文件夾,大家裝hwdocsafe 文件夾里的。另166MB的是光光hwdocsafe 這個文件夾。 3.設置里選“忽略段內回車換行”。 4.漢王屏幕摘抄、漢王照片摘抄貌似是用特征庫,效果跟Mini Ocr一樣。所以識別結果跟文本王不一樣。 ***漢王 PDF OCR 簡介: 停止開發文本王但是品牌名聲和功能還是要維護的。這個免費使用的才40MB。 評價: 什么PDF OCR啊?我的一個圖像pdf就根本識別不了.... ***漢王尚書七號 簡介:尚書OCR軟件是MICROTEK中晶科技公司,向漢王科技購買授權,贈送給用戶使用的舊版OEM軟件。安裝程序約60MB. ***Founder 方正OCR 簡介:本來不想寫這個的,方正OCR軟件是方正公司,向漢王科技購買授權,贈送給用戶使用的舊版OEM軟件。安裝程序約40MB. ***漢王文友 簡介:舊版 ***超星閱覽器 簡介:向漢王買的技術。 ***RapidScan高速掃描影像優化OCR識別系統 簡介:向漢王買的技術。
4、清華文通TH-OCR 簡介:國產(清華+文通)+國外企業Scansoft Nuance,值得支持,與漢王不同的是清華國際知名度比較好。微軟向他買技術,滿多印機、掃描儀也帶它為ocr軟件。 評價:功能還可以,(可以把漢王認為是國內的FineReader ,清華則是Readiris....或者反過來?) 嗯nb!還帶語音效稿! 缺點:不支持多頁單TIF文檔 友情提醒:"清華紫光OCR"是舊版 ***文通慧視小靈鼠 簡介:簡單的說就是增加了手寫識別的增強版。 ***CAJViewer 簡介:向清華買的識別程序。 ***《文檔天地》綜合管理與處理系統 簡介:向清華買的技術。 ***netocr.net在線OCR 簡介: 應用了由清華大學電子系研制的國際領先的最新OCR識別技術,提供一天之內不超過99幅圖像的免費的文字識別服務。 還有后臺人工校對識別。。。 由文通搞的,貌似搞不下去了。
6、Microsoft微軟 簡介:微軟,nb公司啊!開玩笑,其實用清華(中文?)和Scansoft Nuance(英文?)的引擎。 Office Document Imaging Office OneNote 評價:用的像是清華早期的特征庫。比較好笑的是,網上有人測試的比清華現在的詞庫識別好。 缺點:懶著寫 友情提醒: 默認裝了跟Office的相同語言的特征庫,其他語言特征庫手動添加,若裝office多語言版ms就免了. ***老馬的UnicornViewer、Pdg2Pic、TextForever 簡介:套用微軟yy過的OCR引擎和詞庫來實現批量OCR http://www.comicer.com/stronghorse/water/software/pdg2text.htm ***創華OCR 簡介:套用微軟yy過的OCR引擎和詞庫
7、Adobe Acrobat Pro 簡介:Adobe,nb公司啊!開玩笑,其實是買IRIS Readiris的技術。 評價: 其實他的OCR技術也是給圖片式PDF用的,識別后會在圖片PDF的文字上附上識別文字,這樣你可以拷貝pdf上的東西. (表達能力有限,類似onenote的使用方法) 缺點:沒自帶校對功能。 友情提醒:不是免費的Reader,是Acrobat Pro或Acrobat Pro Extended版
8、Mini Ocr 簡介:作者馬飛濤知道是誰不?是護花使者的作者。用他的話說: 我在開發護花使者反黃圖像識別軟件的時候,遇到有些圖像里,嵌有某些文字,如果能 把文字識別出來,圖像的含義就很容易讓計算機理解了。
是的,專門設計給截圖用的 評價:看看過濾效果,就知道多利害了吧,而且是他自制的特征庫. 缺點:可惜無法手動選擇識別區域 友情提醒:有點類似漢王屏幕摘抄、漢王照片摘抄
9、文粹OCR 簡介:國產企業,值得支持。識別率不比漢王差! 缺點:功能不夠強大、完善。 友情提醒: 去worldrobot.NET/download.html 下最新2009版。華軍,天空的都不是最新版。 默認快捷方式“文粹OCR”是update.exe,為避免每次升級,把路徑改成WencuiOcr.exe。 ***文粹在線OCR 貌似搞不下去了。
10、Newsoft 丹青文件辨識系統 MaxReader、Presto OCR 簡介:應該是tw的Newsoft公司和國外Presto合搞的(這不重要)。 這Presto公司在9x年代買了ABBYY的識別引擎,然后丹青又買/合作/使用了Presto版的ABBYY識別引擎。(10年前舊版的ABBYY不支持中文,所以有的搞,不過現在。。。。) 評價:看他網上上吹的多nb(10年前的技術也敢吹?!),但是識別繁體豎排或簡體都不見得有多好。安裝程序越越約300MB,安裝后130MB。 缺點:懶著寫 友情提醒:我情愿用漢王,這不過是個舊版的ABBYY
11、Scansoft Nuance 簡介:國外4大OCR公司之一,自己號稱全球都在用(估計沒算中國),微軟、清華還向他買技術 ***OmniPage (最貴的,$499.99 ) ***PaperPort (才$79.99 ) ***TextBridge (才$79.99 ) 友情提醒+評價 缺點:吹的多nb。下一個MULTi LANGUAGE多語言版,500MB,嚇一跳。打開后發現帶2個軟件OmniPage和PDFCreate5。我們當然裝最貴的OmniPage咯,實際安裝程序越越約300MB。選擇安裝后250MB,kao,中文詞庫只不過是做樣子呢!難怪微軟也同時向清華買OCR技術。
12、ExperVision TypeReader 簡介:新人可能不知道,但是n年前還是滿有名的。 (才$395.00 )同時也曾是國外4大OCR公司之一。 評價:ms2008年后就沒更新,以前拿了n多獎,若oem盤有帶,用來ocr英文還可以。 25MB。 缺點:不支持中文算不? 友情提醒:此東東不好下,沒特別需要別下
13、賽酷OCR 簡介:使用云系統來OCR,說土點就是叫你裝一個客戶端,把圖片上傳到服務器上,識別后再發回來。 優點:機子配置不好的,用這東東占資源少。客戶端安裝文件也小。 缺點: 識別率不咋的,可能還沒丹青好。除了簡體,繁體豎排根本不行。 機密文件你甲認為我會安心上傳給你? 萬一斷網,偶要OCR咋辦? 友情提醒:偶就納悶,網上關于該軟件的評價很高。 (有人發帖問用啥OCR軟件好,基本上就有人回“用賽酷”)就首次使用送10次識別,網上可能有那么多有錢的潛水支持者?可見肯定是1毛黨!
14、SimpleOCR 簡介:本來不想寫這個的,但是這免費的東東名聲蠻大的,我不說,人家可能會去下。 缺點:不支持中文
15、奧普ocr 簡介:停止開發的東東。
?
注1:以上,就前9名OCR軟件值得試! 注2:在線網頁OCR不實際 注3:該軟件的比較寫于2010年,估計5年內有效 注4:此貼由winny社長驗證,內容非常包青天 注5:軟件按引擎Engine+詞庫分類
?
備注:
本人測試過Tesseract,漢王,識別看看三款軟件。
識別看看的識別率最高。好像是一個人開發的。牛啊。 順便給他做個推廣吧,http://blog.sina.com.cn/u/2863794612
轉載于:https://www.cnblogs.com/Crysaty/p/6080281.html
總結
以上是生活随笔為你收集整理的[转]常用OCR软件介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ASP.NET Aries 入门开发教程
- 下一篇: We will be discontin