Canopy环境下pytesser库的安装配置
最近對Python驗證碼的處理產生了興趣,就從網上找了一個最簡單的源碼。
但是from pytesser import * 這一步是遇到了麻煩,在說之前先介紹下我的Python環境。
我用的是32位的Canopy(canopy-1.5.5-win-32.msi),這個已經集成了很多重要的Python庫。
from PIL import Image from pytesser import *主要就是這兩個包,第一個PIL(Python Imaging Library)已經自帶了。
pytresser主要的功能就是將已經經過處理的驗證碼圖片轉為文本數據。調用的是image_to_string()方法。
開始。
首先下載pytesser以及其依賴插件下載地址:鏈接: http://pan.baidu.com/s/1i3zgpjJ ?密碼: ueyy
解壓后打開,把pytesser_v0.0.1.zip中的文件全部解壓到一個新文件夾中。
文件夾名稱隨意,但是后文還有用。不妨設置文件夾名稱為pytesser_v0.0.1。
再把該文件夾移動到Canopy的包文件夾下,即:....\Lib\site-packages
同時在該目錄....\Lib\site-packages下新建文件pytesser.pth,這個文件的內容就是:pytesser_v0.0.1。(即剛才pytesser文件夾名稱。)
這時打開....\Lib\site-packages\pytesser_v0.0.1文件夾,對pytesser.py文件進行修改。
找到import Image將其更改為from PIL import Image即可(據說是因為我們安裝的Canopy里面的PIL不是原版的PIL,而是其代替版pillow所以要把這個改一下)。
本來到這里就已經可以完事兒了。
但是pytresser依賴另一個東西tresseract。
打開最開始百度云下載的“pytesser及其依賴插件”,里面有tesseract-ocr-setup-3.02.02.exe。
運行后,安裝。打開安裝目錄找到其中的tesseract文件夾。
然后用它替換掉....\Lib\site-packages\pytesser_v0.0.1目錄下的tesseract文件夾。
重啟Canopy即可。
總結
以上是生活随笔為你收集整理的Canopy环境下pytesser库的安装配置的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何修改 Typora 高亮代码颜色
- 下一篇: 深度优先和广度优先算法(例题)