绝了,dddd带带弟弟OCR识别验证码
前言
上一篇介紹了通過 python 的 pytesserract 模塊進(jìn)行識(shí)別驗(yàn)證碼,但是他只能識(shí)別一些簡單的驗(yàn)證碼,比如像這種。
遇到稍微復(fù)雜一點(diǎn)的驗(yàn)證碼,就會(huì)識(shí)別不了。
那咋辦?
網(wǎng)上找了一圈,介紹了不同的第三方平臺(tái)識(shí)別驗(yàn)證碼,像百度 ocr 、打碼兔、超級(jí)鷹等,其中百度 ocr 呼聲最高。
鏈接: https://cloud.baidu.com/product/ocr_others/webimage
奈何去試了一下,上面 3T9Q 這個(gè)驗(yàn)證碼都不能識(shí)別出來...
而且收費(fèi)還不低。
算了,后面在 github 上找到一個(gè)開源庫,而且還很強(qiáng)大。這個(gè)庫叫 ddddocr ,
帶帶弟弟,
哲哥的博客地址:https://wenanzhe.com/
不單單可以學(xué)到技術(shù),還可以學(xué)到不少的人生道理。左邊技術(shù),右邊人生道理。
網(wǎng)友們對這個(gè)庫高度評(píng)價(jià),
ddddorc 安裝使用
環(huán)境要求:
python <= 3.9
Windows/Linux/Macos..
以下是在windows上安裝
更新 pip
python -m pip install --upgrade pip -i https://pypi.douban.com/simple
不更新 pip 有可能會(huì)安裝失敗。
安裝 ddddocr
pip install ddddocr -i https://pypi.douban.com/simple
使用方法
# -*- coding:utf-8 -*-
import ddddocr # 導(dǎo)入 ddddocr
ocr = ddddocr.DdddOcr() # 實(shí)例化
with open('002.png', 'rb') as f: # 打開圖片
img_bytes = f.read() # 讀取圖片
res = ocr.classification(img_bytes) # 識(shí)別
print(res)
單個(gè)圖片的識(shí)別:
多個(gè)圖片識(shí)別:
# -*- coding:utf-8 -*-
import ddddocr # 導(dǎo)入 ddddocr
ocr = ddddocr.DdddOcr()
for i in range(1, 4):
with open(str(i) + '.png', 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
print(res)
有些大小寫還是不能識(shí)別出來。
封裝一下:
# -*- coding:utf-8 -*-
import ddddocr
ocr = ddddocr.DdddOcr()
def ddocr(file):
try:
with open(file, 'rb') as f:
img_bytes = f.read()
res = ocr.classification(img_bytes)
return res
except:
print("獲取驗(yàn)證碼失敗,請繼續(xù)!")
r = ddocr('3.png')
print(r)
分界線----------------------------------------------
運(yùn)行過程中,有可能會(huì)遇到這個(gè)問題。
ddddocr模塊的項(xiàng)目使用pyinstaller 打包后報(bào)錯(cuò) ImportError: Microsoft Visual C++ Redistributable for Visual Studio 2019 not installed on the machine.
解決辦法:
安裝Microsoft Visual C++ Redistributable 2019
https://aka.ms/vs/16/release/VC_redist.x64.exe
直接點(diǎn)擊就可以下載了,下載后直接安裝即可。
總結(jié)
以上是生活随笔為你收集整理的绝了,dddd带带弟弟OCR识别验证码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何快糙好猛的使用Shiqi.Yu老师的
- 下一篇: 无效设备解决办法