當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

dddd带带弟弟OCR识别验证码

發布時間：2024/3/7 编程问答 72 豆豆

生活随笔收集整理的這篇文章主要介紹了 dddd带带弟弟OCR识别验证码小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在 github 上找到一個開源庫，而且還很強大。這個庫叫 ddddocr ，
GitHub - sml2h3/ddddocr: 帶帶弟弟通用驗證碼識別OCR pypi版

ddddorc 安裝使用

安裝 ddddocr

pip install ddddocr -i https://pypi.douban.com/simple

使用方法

參數說明：

Ddddocr?接受兩個參數

參數名默認值說明

use_gpu	False	Bool 是否使用gpu進行推理，如果該值為False則device_id不生效
device_id	0	int cuda設備號，目前僅支持單張顯卡

classification?

參數名默認值說明

img

bytes 圖片的bytes格式

單個圖片的識別：

# -*- coding:utf-8 -*- import ddddocr # 導入 ddddocr ocr = ddddocr.DdddOcr() # 實例化 with open('002.png', 'rb') as f: # 打開圖片img_bytes = f.read() # 讀取圖片 res = ocr.classification(img_bytes) # 識別 print(res)

多個圖片識別：

# -*- coding:utf-8 -*- import ddddocr # 導入 ddddocr ocr = ddddocr.DdddOcr() for i in range(1, 4):with open(str(i) + '.png', 'rb') as f:img_bytes = f.read()res = ocr.classification(img_bytes)print(res)

有些大小寫還是不能識別出來。

封裝一下：

# -*- coding:utf-8 -*- import ddddocr ocr = ddddocr.DdddOcr()def ddocr(file):try:with open(file, 'rb') as f:img_bytes = f.read()res = ocr.classification(img_bytes)return resexcept:print("獲取驗證碼失敗，請繼續！")r = ddocr('3.png') print(r)

結合摳圖一起使用，即獲取驗證碼圖片，然后用dddr 識別驗證碼。

from selenium import webdriver import time from PIL import Image import ddddocr ocr = ddddocr.DdddOcr()# 摳圖 def matting():# 打開谷歌瀏覽器browser = webdriver.Chrome()# 打開網站首頁# browser.get("https://v3pro.houjiemeishi.com/PC/pages/login/login.html")browser.get("http://192.168.139.129:8081/jpress/admin/login")# 網頁最大化browser.maximize_window()# 登錄頁圖片picture_name1 = 'login'+'.png'# 保存第一張截圖browser.save_screenshot(picture_name1)# 定位元素ce = browser.find_element_by_id("captchaImg")# ce = browser.find_element_by_xpath('//*[@class="codeImg"]')# 打印元素位置、元素尺寸print(ce.location, ce.size)# 要摳驗證碼的圖，先獲取元素參數left = ce.location.get('x')top = ce.location.get('y')right = ce.size.get('width') + leftheight = ce.size.get('height') + top# 讀取剛才截的第一張圖im = Image.open(picture_name1)# 摳圖img = im.crop((left, top, right, height))# 驗證碼塊的圖片picture_name2 = 'code'+'.png'# 保存圖片img.save(picture_name2)time.sleep(5)browser.close()# 通過 ddddocr 模塊識別驗證碼 def ddocr(file):try:with open(file, 'rb') as f:img_bytes = f.read()res = ocr.classification(img_bytes)return resexcept:print("獲取驗證碼失敗，請繼續！")if __name__ == '__main__':print("摳圖")matting()print("識別")code = ddocr('code.png')print(code)

常見錯誤處理

運行過程中，有可能會遇到這個問題。

ddddocr模塊的項目使用pyinstaller 打包后報錯 ImportError: Microsoft Visual C++ Redistributable for Visual Studio 2019 not installed on the machine.

解決辦法：
安裝Microsoft Visual C++ Redistributable 2019

https://aka.ms/vs/16/release/VC_redist.x64.exe

直接點擊就可以下載了，下載后直接安裝即可。

總結

以上是生活随笔為你收集整理的dddd带带弟弟OCR识别验证码的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：司马迁的智慧—东方最早的经济学综合论文《
下一篇：你真的知道如何在B站赚钱吗？