python集成Tesseract-OCR实现光学字符识别
Tesseract-ocr 簡介
Tesseract是一個開源的OCR(Optical Character Recognition,光學字符識別)引擎,可以識別多種格式的圖像文件并將其轉換成文本,目前已支持60多種語言(包括中文)。 Tesseract最初由HP公司開發,后來由Google維護。
Tesseract-ocr 下載地址
大家可以根據自己的需求下載不同的版本,下載網址:https://digi.bib.uni-mannheim.de/tesseract/
,我這里下載的是win10 64位的:tesseract-ocr-w64-setup-v5.0.0.20190623.exe。
安裝tesseract-ocr
雙擊tesseract-ocr-w64-setup-v5.0.0.20190623.exe運行即可安裝,安裝完成后將安裝路徑配置環境變量,我這里安裝路徑是在D盤,如下圖所示:
環境變量配置好后,驗證是否安裝成功,直接cmd輸入命令,結果輸出如下表示安裝OK:
tesseract -v
python環境中使用Tesseract-ocr
需要安裝PIL包和Pillow包以及pytesseract模塊,使用如下命令安裝就好了,
pip install pillow #一個python的圖像處理庫,pytesseract依賴 pip install pytesseractTesseract-ocr的使用
1.測試識別圖test2.jpg純數字,如下:
python代碼如下,識別test2.jpg圖中數字:
運行以上程序,輸出結果如下:
可以看到識別效果還是很不錯的,當然手寫數字也一樣可以識別,相對來說識別效果差一點而已,
2.測試a.png圖片中的中文字符,圖片如下:
將上述代碼稍作修改即可,如下:
程序運行結果如下:
可以看識別效果,識別率在90%以上,當然這里也有調優的余地,比如給圖片做灰度,模糊,去燥,二值化等等,識別率會更好一些。
總結
以上是生活随笔為你收集整理的python集成Tesseract-OCR实现光学字符识别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 安卓手机ppt阅读器_手机文件管理器,安
- 下一篇: 第一颗国产 两端口 LVDS至HDMI2