cnn 验证集 参与训练吗_一个简单的零基础的机器学习教程之二,字母数字验证码识别...
一.前言
基于前面我發的貼子
一個非常震撼的目標檢測的例子。上個帖子從環境安裝到調試代碼再到圖片檢測視頻檢測一個詳細的教程,今天我來講一下正真的實戰經歷吧。完全不需要深度相關的知識。
這個項目就是《Python3 反爬蟲原理與繞過實戰》里面的例子,
基礎環境與我上一個深度學習教程的基礎環境一摸一樣,拿過來基本不用改就可以用了。書里面的講了一下原理,還不錯,通俗易懂,但是沒講太深,意猶未盡,畢竟是一本爬蟲書啊
整個項目訓練速度非常快,因為專門為驗證碼檢測設計的,自己的顯卡還不錯,每次訓練就幾分鐘的樣子,測試了一下,最終我把原項目的單次訓練的樣本數量調大了8倍,原先是32的,4分鐘不到3w張圖片。setting.py里面我看到,檢測的內容都限制了,26個字母和10個數字,所有的圖片格式大小都規定了。
二.開始訓練
運行環境看我的上一個深度學習的教程
完全一樣。
下載代碼和相關資源
下載GitHub代碼,下載圖片數據集。相關資源最后會放出來,原項目的代碼導入圖片目錄的時候有點問題。貌似原項目是在ubuntu系統上面運行的,我改了一下setting里面的參數如下圖。
把下載images的圖片放到項目目錄下面如圖,images里面的數據集圖片的文件名就是圖片正確的識別結果,要做自己的數據集要注意哦,train文件夾下面的圖片就是我們訓練時候的圖片集,test文件夾下面的圖片是用來訓練時驗證我們的訓練效果的圖片集,predict文件夾下面的圖片就是我們訓練好之后要預測的圖片集。
接下來打開setting.py根據自己顯卡的算力設置BATCH_SIZE,我的顯卡是2070S,最終設置成了256,CPU和GPU都快到100%了。然后打開train.py運行等待就行了,訓練完成會生成result.pkl文件。
驗證的代碼在verifies.py里面,直接運行,它會先載入模型,遍歷驗證集圖片正確的驗證碼與預測結果對比,算出成功比例。
驗證碼的圖片就是下圖,26個字母和10個數字的混合,長度固定,6位。有干擾線和干擾點,沒有傾斜變形。
三.最后說明
這個項目代碼量非常的少,文章的篇幅也很短,項目的結構簡單可以一步步的詳細分析所有代碼的用處,特別是model.py里面進行了三次卷積和池化操作。loader.py對圖片的灰度化處理和數字化處理。雖然這些東西很抽象,但是只要不要本能的去拒絕它們,還是能夠慢慢的理解的。
關注我,給我動力繼續研究更多有意思的有關python的東西哦。
總結
以上是生活随笔為你收集整理的cnn 验证集 参与训练吗_一个简单的零基础的机器学习教程之二,字母数字验证码识别...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: spring定时器突然不执行了_非标自动
- 下一篇: proxmoxve打造云桌面_微软云电脑