ocr python opencv_如何使用(opencv/python)来实现OCR处
今天我們來介紹一下如何使用(opencv/python)來實現OCR處理銀行票據。文末有代碼和相關文檔下載!
在第一部分中,我們將討論兩個主題:
1.首先,我們將了解MICR E-13B字體,美國,英國,加拿大等國家用于支票上都是使用的這種字體。
2.其次,我們將討論如何從MICR E-13B參考圖像中提取數字和符號。這將使我們能夠提取每個字符的ROI,然后將其用于OCR銀行支票。
MICR E-13B 字體:
MICR(磁墨字符識別)是處理文件的金融工業技術。
MICR的E-13B變體包含14個字符:
·數字:數字0-9。
·過境:銀行分行分隔。
·金額:交易金額分隔符。
·在我們:客戶帳號分隔符。
·dash:數字分隔符(例如路由和帳號之間)。
銀行支票字符識別看起來更難:
在銀行支票上使用的MICR E-13B字體中,數字有一個輪廓。但是,控制符號對于每個角色具有三個輪廓,使任務稍微更具挑戰性。我們不能使用簡單的輪廓和邊框方法。相反,我們需要設計自己的方法來可靠地提取數字和符號。
用OpenCV提取MICR數字和符號:
創建一個新的文件,命名為bank_check_ocr.py,并插入以下代碼:
# import the necessary packagesfrom skimage.segmentation import clear_border
首先我們先導入各種我們需要的包,以確保程序的正確運行
·OpenCV:從此頁面選擇適合您系統的安裝版本。
·scikit-image:這是通過pip安裝的,pip install-Uscikit-image
·numpy :通過 pip install numpy。
·imutils:這是可以通過 pip 安裝:pip install--upgrade imutils。
接著我們來構建一個從MICR字體中提取字符的函數:
def extract_digits_and_symbols(image, charCnts, minW=5, minH=15):
對于初學者,我們的功能需要4個參數:
·image:MICR E-13B字體圖像(代碼下載中提供)。
·charCnts:包含參考圖像中的字符輪廓的列表。
·minW:表示最小字符寬度的可選參數。默認值為5像素寬度。
·minH:最小字符高度。默認值為15像素。
接著我們初始化我們的charCnts列表的迭代器。列表對象本質上是“可迭代的”,意味著__iter__方法是由生成器完成的。
最后初始化空列表以保存我們的rois(感興趣的區域)和loc(ROI位置)。我們將在函數結尾的一個元組中返回這些列表。
我們開始循環,看一下迭代器的工作原理:
while True:
在我們的函數中,我們開始一個無限循環,我們的退出條件是當我們捕獲StopIterator異常時。為了捕獲這個異常,我們需要設置try-catch塊。對于循環的每次迭代,我們通過調用next(charIter)來獲取下一個字符輪廓。從這個函數調用,我們可以提取矩形的(x,y)坐標和寬度/高度。接著我們初始化一個roi,我們將在短時間內存儲字符圖像。
接下來,我們將檢查我們的邊框寬度和高度的大小,并采取相應的措施:
if cW
總結
以上是生活随笔為你收集整理的ocr python opencv_如何使用(opencv/python)来实现OCR处的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql数据库充值网站程序_MySQL
- 下一篇: jq设置checked是否选中_java