當(dāng)前位置：首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

Halcon中OCR的实现及关键函数解析

發(fā)布時間：2023/12/20 ChatGpt 32 豆豆

生活随笔收集整理的這篇文章主要介紹了 Halcon中OCR的实现及关键函数解析小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

OCR的實現(xiàn)共分為兩步，1是使用字符數(shù)據(jù)來訓(xùn)練OCR。2是使用OCR進(jìn)行字符的識別。

訓(xùn)練分類器

　　訓(xùn)練分類器共分為4步：

1是使用閾值來分割字符區(qū)域；

2是調(diào)用append_ocr_trainf函數(shù)將字符加入訓(xùn)練集；

3是創(chuàng)建分類器；

4是調(diào)用trainf_ocr_class_mlp函數(shù)來訓(xùn)練分類器。

*對字符進(jìn)行訓(xùn)練得到分類器 TrainingNames := ['F','M','1','4','A','4','2'] FontName := 'F:/YM_Project/SZWX/work_x32_MFOL2/function/MFOL2' TrainingFileName := FontName+'.trf' *當(dāng)dev_set_check的參數(shù)為'~give_error'時，這次檢測會被忽略，程序進(jìn)入后面的操作。 dev_set_check ('~give_error') *刪除指定位置的文件 delete_file (TrainingFileName) for i := 0 to |TrainingNames|-1 by 1select_obj (FinalNumbers, CharaterRegions, i+1)*將字符CharaterRegions添加到訓(xùn)練集TrainingFileName中append_ocr_trainf (CharaterRegions, FourthDarkImage, TrainingNames[i], TrainingFileName)disp_message (WindowID, TrainingNames[i], 'image', MeanRow-40, Column[i]-6, 'yellow', 'false') endfor *tuple_uniq( : : Tuple : Uniq) *相鄰重疊的元組只保留一個。常用于tuple_sort( : : Tuple : Sorted)之后，tuple_sort是升序排列。 CharNames := uniq(sort(TrainingNames)) *創(chuàng)建mlp create_ocr_class_mlp (8, 10, 'constant', 'default', CharNames, 5, 'none', 10, 42, OCRHandle) *使用訓(xùn)練集來訓(xùn)練mlp trainf_ocr_class_mlp (OCRHandle, TrainingFileName, 200, 1, 0.01, Error, ErrorLog) write_ocr_class_mlp (OCRHandle, FontName) clear_ocr_class_mlp (OCRHandle)

使用分類器進(jìn)行識別
　　使用分類器進(jìn)行字符識別的函數(shù)有兩個：1是do_ocr_multi_class_mlp，該函數(shù)對一幅圖像內(nèi)的多個字符進(jìn)行一次分類并輸出分類結(jié)果。2是do_ocr_single_class_mlp，該函數(shù)是對一幅圖像中的單個字符進(jìn)行分類。兩者的對比試驗表明，后者的分類準(zhǔn)確度要高，因此，下文使用do_ocr_single_class_mlp算子進(jìn)行字符的分類。?
　　分類的實現(xiàn)分為４步：1是讀取分類器；2是讀取圖片；3是分割單個字符；４分類

*Step1根據(jù)分類器來分類 read_ocr_class_mlp (FontName, OCRHandle) *Step2讀取圖片獲得每一個圖像 read_image (Image, 'F:/YM_Project/SZWX/1024SZWX/SVS900_XFMT1X110_CR6030_S1_4.bmp') *Step３分割單個字符 gen_rectangle1 (Rectangle1, 43, 2243, 707, 3675) reduce_domain (Image, Rectangle1, ImageReduced1) crop_domain (ImageReduced1, ImagePart) median_image (ImagePart, ImageReduced1, 'circle', 3, 'mirrored') threshold (ImageReduced1, Regions, 84, 255) opening_circle (Regions, RegionOpening, 3.5) connection (RegionOpening, ConnectedRegions) select_shape (ConnectedRegions, Numbers, 'area', 'and', 1000, 9999) count_obj (Numbers, CharacterNums) ArrayConfidence := [] for IndexCharacter := 1 to CharacterNums by 1select_obj (Numbers, CharacterSelected, IndexCharacter) *Step４分類do_ocr_single_class_mlp(CharacterSelected, ImagePart, OCRHandle,1, Class, Confidence)ArrayConfidence := [ArrayConfidence,Confidence] endfor

關(guān)鍵函數(shù)解析

create_ocr_class_mlp( : : WidthCharacter, HeightCharacter, Interpolation, Features, Characters, NumHidden, Preprocessing, NumComponents, RandSeed : OCRHandle)WidthCharacter：輸入被分割的字符縮放到指定的寬度 HeightCharacter： Interpolation：設(shè)置縮放的字符的縮放模式，對于多數(shù)應(yīng)用而言，Interpolation = 'constant'。請注意：轉(zhuǎn)換后的字符大小不能太大，因為分類器對較大尺寸的字符分類效果并不好。特別是，如果尺寸較大，一些小的分割誤差會較大程度上影響分類的效果，一般情況下，sizes between 6x8 and 10x14 Features：分類的特征向量的長度 Characters：輸出層神經(jīng)元的個數(shù)；也就是是需要匹配的字符查閱表中字符的個數(shù)。 NumHidden：MLP中隱藏層神經(jīng)元的個數(shù) Preprocessing：矢量特征裝換的預(yù)處理類型 NumComponents：匹配字符的數(shù)量這兩個參數(shù)主要是對輸入的值進(jìn)行預(yù)處理。RandSeed：初始化mlp OCRHandle：輸出OCR_mlp分類器句柄

trainf_ocr_class_mlp( : : OCRHandle, TrainingFile, MaxIterations, WeightTolerance, ErrorTolerance : Error, ErrorLog)
訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)分類器

do_ocr_multi_class_mlp(Character, Image : : OCRHandle : Class, Confidence)
使用OCR分類多個字符
Character是字符區(qū)域
Image是字符圖片
OCRHandle是分類器句柄
Class是輸出的類別
Confidence是輸出的分類精度

do_ocr_single_class_mlp(CharacterSelected, ImagePart, OCRHandle,1, Class, Confidence)
分類單個字符，其分類效果比上述同時分類多個字符的效果要好
---------------------?
作者：羅澤?
來源：CSDN?
原文：https://blog.csdn.net/u013698770/article/details/53842205?
版權(quán)聲明：本文為博主原創(chuàng)文章，轉(zhuǎn)載請附上博文鏈接！

總結(jié)

以上是生活随笔為你收集整理的Halcon中OCR的实现及关键函数解析的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：到底什么是皮基站？
下一篇： python金字塔_高斯金字塔与拉普拉斯