簡介
? ? ? ? OCR(optical character recognition)文字識別是指電子設備(例如掃描儀或數(shù)碼相機)檢查紙上打印的字符,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然后對圖像文件進行分析處理,獲取文字及版面信息的過程。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題。衡量一個OCR系統(tǒng)性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩(wěn)定性,易用性及可行性等。
安裝教程
https://github.com/PaddlePaddle/PaddleOCR/blob/static/doc/doc_ch/installation.md https://github.com/PaddlePaddle/PaddleOCR/blob/static/doc/doc_ch/installation.md
框架結構
1、configs文件夾
這個文件夾下是方向分類、文本檢測、文字識別的配置文件。配置文件中描述的內容包括如何訓練、模型結構、優(yōu)化器、訓練參數(shù)、訓練數(shù)據(jù)來源等。
2、deploy文件夾 這個文件夾主要是部署相關內容,也是最后需要學習的地方,暫時可以略過。
3、doc文件夾 這個文件夾包括一些測試圖片。還有一個很重要的PP-OCR論文。
4、inference文件夾 這個文件夾下放著3個模型,分別是方向分類模型、文本檢測模型、文本識別模型。
5、inference_results文件夾 這個文件夾是運行腳本后生成的目錄,里面存放的是結果標注顯示圖片。
6、ppocr文件夾 這個文件夾是ppocr的主干,具體內容如下:
data:數(shù)據(jù)加載、數(shù)據(jù)擴充。
losses:分類、檢測、識別模型的損失函數(shù)。
metrics:
modeling:模型組建,包含:模型結構、backbone、heads、necks、transforms。
optimizer:學習率、學習策略、優(yōu)化器、正則化。
postprocess:后處理。
utils:實用工具。
7、PPOCRLabel文件夾 標注工具文件夾,等用的時候再詳細筆記。
8、StyleText文件夾 風格遷移文件夾用于生成樣本數(shù)據(jù),擴充訓練樣本。
9、Tools文件夾 包括訓練、推理、評估的python腳本。可以通在根目錄下寫shell文件直接調用。
本小節(jié)轉自:paddleocr 使用教程_落花逐流水的博客-CSDN博客_paddleocr
具體使用
比如有一張圖片如下
from paddleocr import PaddleOCR, draw_ocr
from PIL import Image# Paddleocr目前支持中英文、英文、法語、德語、韓語、日語,可以通過修改lang參數(shù)進行切換
# 參數(shù)依次為`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = 'E:\\PaddleOCR-static\\doc\\imgs\\6.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:print(line)# 顯示結果
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in line]
print(boxes)
txts = [line[1][0] for line in line]
print(txts)
scores = [line[1][1] for line in line]
print(scores)
im_show = draw_ocr(image, boxes, txts, scores, font_path='/path/to/PaddleOCR/doc/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
line的結構是一個list,每個item包含文本框,文字和識別置信度
[[[[614.0, 51.0], [753.0, 51.0], [753.0, 159.0], [614.0, 159.0]], ('38', 0.9994012117385864)], [[[640.0, 163.0], [729.0, 163.0], [729.0, 204.0], [640.0, 204.0]], ('包郵', 0.8606153130531311)], [[[349.0, 415.0], [433.0, 415.0], [433.0, 448.0], [349.0, 448.0]], ('OlAY', 0.7505984306335449)], [[[339.0, 449.0], [445.0, 449.0], [445.0, 484.0], [339.0, 484.0]], ('玉蘭油', 0.9756715297698975)], [[[325.0, 486.0], [462.0, 486.0], [462.0, 503.0], [325.0, 503.0]], ('NaturalWhite', 0.927595317363739)], [[[341.0, 505.0], [446.0, 504.0], [446.0, 522.0], [341.0, 523.0]], ('白里透紅系列', 0.9458746314048767)], [[[289.0, 526.0], [495.0, 523.0], [495.0, 547.0], [289.0, 550.0]], ('日間潤白 SPF24/PA++', 0.9534435868263245)], [[[329.0, 554.0], [454.0, 553.0], [454.0, 571.0], [329.0, 572.0]], ('水養(yǎng)防曬美白霜', 0.9256204962730408)], [[[11.0, 710.0], [315.0, 715.0], [314.0, 781.0], [10.0, 776.0]], ('專柜正品', 0.9986205697059631)], [[[437.0, 716.0], [747.0, 716.0], [747.0, 785.0], [437.0, 785.0]], ('假一賠十', 0.9869048595428467)]]
[[[614.0, 51.0], [753.0, 51.0], [753.0, 159.0], [614.0, 159.0]], [[640.0, 163.0], [729.0, 163.0], [729.0, 204.0], [640.0, 204.0]], [[349.0, 415.0], [433.0, 415.0], [433.0, 448.0], [349.0, 448.0]], [[339.0, 449.0], [445.0, 449.0], [445.0, 484.0], [339.0, 484.0]], [[325.0, 486.0], [462.0, 486.0], [462.0, 503.0], [325.0, 503.0]], [[341.0, 505.0], [446.0, 504.0], [446.0, 522.0], [341.0, 523.0]], [[289.0, 526.0], [495.0, 523.0], [495.0, 547.0], [289.0, 550.0]], [[329.0, 554.0], [454.0, 553.0], [454.0, 571.0], [329.0, 572.0]], [[11.0, 710.0], [315.0, 715.0], [314.0, 781.0], [10.0, 776.0]], [[437.0, 716.0], [747.0, 716.0], [747.0, 785.0], [437.0, 785.0]]]
['38', '包郵', 'OlAY', '玉蘭油', 'NaturalWhite', '白里透紅系列', '日間潤白 SPF24/PA++', '水養(yǎng)防曬美白霜', '專柜正品', '假一賠十']
[0.9994012117385864, 0.8606153130531311, 0.7505984306335449, 0.9756715297698975, 0.927595317363739, 0.9458746314048767, 0.9534435868263245, 0.9256204962730408, 0.9986205697059631, 0.9869048595428467]
總結
以上是生活随笔 為你收集整理的PaddleOCR,图像检测识别 的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔 網(wǎng)站內容還不錯,歡迎將生活随笔 推薦給好友。