python智能识别_Python人工智能识别文字内容(OCR)
環(huán)境準(zhǔn)備
安裝pytesseract和PIL安裝這兩個(gè)包可以借助pip命令行安裝
pip install PIL
pip install pytesseract
安裝識(shí)別引擎tesseract-ocr
下載地址:
選擇對(duì)應(yīng)版本下載
實(shí)現(xiàn)及效果
原圖
代碼
from PIL import Image
import pytesseract
#上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別
text=pytesseract.image_to_string(Image.open('1.png'),lang='eng')
print(text)
說(shuō)明:lang=“為模型名稱”。
效果
TesseractNotFoundError錯(cuò)誤,提示未發(fā)現(xiàn)Tesseract-OCR安裝路徑
解決方案:
1、將Tesseract-OCR配置為環(huán)境變量
2、修改pytesseract.py源碼,如下圖:
再次運(yùn)行效果
附錄:
要是實(shí)現(xiàn)中文識(shí)別,需要下載中文模型:
修改源碼的模型名稱即可。
代碼
from PIL import Image
import pytesseract
#上面都是導(dǎo)包,只需要下面這一行就能實(shí)現(xiàn)圖片文字識(shí)別
text=pytesseract.image_to_string(Image.open('test2.jpg'),lang='chi_sim')
print(text)
原圖
效果
謹(jǐn)以此文獻(xiàn)給即將成熟的我們,都成了與想象中截然不同的人
總結(jié)
以上是生活随笔為你收集整理的python智能识别_Python人工智能识别文字内容(OCR)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python网页运行环境_Python小
- 下一篇: 程序如何调堆内存_Java的内存泄漏