python验证码识别接口 服务器_python验证码识别模块
(白嫖)這是一個為麻瓜設計的本地OCR模塊
只需要簡單幾步操作即可擁有兩大通用識別模塊,讓你在工作中暢通無阻。
測試圖片 test1.png
測試圖片 test2.jpg
SDK類參數
參數名
必選
類型
說明
model_type
No
ModelType
指定預置模型類型
conf_path
No
str
指定自定義模型yaml配置文件(絕對路徑)
以上參數兩者選其一即可,默認 model_type 為 ModelType.OCR, 若指定 conf_path 參數則優先使用自定義模型。
核心API
SDK.predict(image_bytes: bytes)
使用指北
注意: 因模塊過新,阿里/清華等第三方源可能尚未更新鏡像,因此手動指定使用境外源,為了提高依賴的安裝速度,可預先自行安裝依賴:tensorflow/numpy/opencv-python/pillow/pyyaml
pip install muggle-ocr
調用示例:
# 1\. 導入包
import muggle_ocr
"""
使用預置模型,預置模型包含了[ModelType.OCR, ModelType.Captcha] 兩種
其中 ModelType.OCR 用于識別普通印刷文本, ModelType.Captcha 用于識別4-6位簡單英數驗證碼
"""
# 打開印刷文本圖片
with open(r"test1.png", "rb") as f:
ocr_bytes = f.read()
# 打開驗證碼圖片
with open(r"test2.jpg", "rb") as f:
captcha_bytes = f.read()
# 2\. 初始化;model_type 可選: [ModelType.OCR, ModelType.Captcha]
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)
# ModelType.Captcha 可識別光學印刷文本
for i in range(5):
st = time.time()
# 3\. 調用預測函數
text = sdk.predict(image_bytes=ocr_bytes)
print(text, time.time() - st)
# ModelType.Captcha 可識別4-6位驗證碼
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
for i in range(5):
st = time.time()
# 3\. 調用預測函數
text = sdk.predict(image_bytes=captcha_bytes)
print(text, time.time() - st)
"""
使用自定義模型
支持基于 https://github.com/kerlomz/captcha_trainer 框架訓練的模型
訓練完成后,進入導出編譯模型的[out]路徑下, 把[graph]路徑下的pb模型和[model]下的yaml配置文件放到同一路徑下。
將 conf_path 參數指定為 yaml配置文件 的絕對或項目相對路徑即可,其他步驟一致,如下示例:
"""
with open(r"test3.jpg", "rb") as f:
b = f.read()
sdk = muggle_ocr.SDK(conf_path="./ocr.yaml")
text = sdk.predict(image_bytes=b)
輸出結果:
曹文軒教授作序推薦 0.010004520416259766
曹文軒教授作序推薦 0.009941339492797852
曹文軒教授作序推薦 0.0109710693359375
曹文軒教授作序推薦 0.00901031494140625
曹文軒教授作序推薦 0.010967493057250977
MuggleOCR Session [captcha] Loaded.
ceey 0.010970592498779297
ceey 0.009973287582397461
ceey 0.010970592498779297
ceey 0.009973526000976562
ceey 0.009973287582397461
OCR和驗證碼識別的速度基本都在10ms左右,低配CPU可能需要15-20ms。本模塊僅支持單行識別,如有多行識別需求請自行采用目標檢測預裁圖片。
總結
以上是生活随笔為你收集整理的python验证码识别接口 服务器_python验证码识别模块的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 打开cmd窗口新技巧get
- 下一篇: 模拟分页效果