當前位置：首頁 > 编程语言 > python >内容正文

python

python 作物识别_Python-OpenCV —— 物体识别（TrainCascadeClassification）

發布時間：2025/3/20 python 16 豆豆

生活随笔收集整理的這篇文章主要介紹了 python 作物识别_Python-OpenCV —— 物体识别（TrainCascadeClassification）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在上次教程Python-OpenCV —— Machine Learning講述了如何建立模型，進行訓練，然后利用模型對新獲得的照片進行預測并給出預測值，本期教程針對某個特定的物體進行檢測，將其標記出來，分為3個步驟，第一：訓練特定物體，第二：

訓練模型

級聯分類器

前幾天看到一個笑話，很有意思，說的是

理論就是你什么都知道但是什么都干不了

實踐就是你什么都能干但是不知道為什么

我就不一樣了，我可以理論與實踐相結合——什么都干不了而且不知道為什么

開個玩笑，目前有很大一部分的東西都是人們實踐得來的經驗，有些東西也許很好用，但未必是好理論，比如現在的深度學習，扯遠了，繼續今天的話題，到底什么是級聯分類器，其實就是把分類器按照一定的順序聯合到一起。一個分類器也許不好用，沒關系，我給你多加幾個，俗話說得好，三個臭皮匠，頂個諸葛亮呢。

具體來說，OpenCV實現的Cascade(級聯)分類器就是基于多個弱分類器對不同的特征進行依次處理(分類)來完成對目標的檢測，簡單的說有多個弱分類器串起來，然后提取每個平滑窗上的不同特征，把這些特征依次放進不同的弱分類器里判斷，如果所有的弱分類器都判斷正標簽，則表示該該平滑窗內檢測到目標。這樣做的好處是不但通過多個弱分類器來形成一個強的級聯分類器，而且可以減少運算量，比如當一個平滑窗第一個特征沒有通過第一個分類器，那么就沒有必要繼續運算下去，直接拒絕掉當前平滑窗，轉而處理下一個平滑窗，事實上作者的目的就是為了快速拋棄沒有目標的平滑窗，從而達到快速檢測目標。

本次用到了OpenCV的兩個程序，分別是opencv_createsamples.exe和opencv_traincascade.exe，分別用來創建樣本文件和訓練級聯分類器。

準備訓練數據

正樣本

正樣本就是你要檢測的東西，比如說香蕉、車牌、酒瓶、紅綠燈等等，你可以找相關的數據集，或者自己手動截圖，只取你想要識別的那部分，下面我給了一個小程序用來將你截取的圖片都變成統一大小。

#改變圖片尺寸為統一大小,在當前目錄創建一個名為pos的文件夾

#把需要統一尺寸的正樣本放到里面，寫上尺寸，運行程序就可以了，一般來說建議長寬在100像素一下，不然訓練會很慢

import cv2

import os

w = **

h = **

def getimage(file_dir):

images = {}

for root, dirs, files in os.walk(file_dir):

for name in files:

images[name] = os.path.join(root,name)

return images

if __name__ == '__main__':

n=-1

aa = os.getcwd()

dirpath = os.path.join(aa, 'pos')

imagedic = getimage(dirpath)

try :

for key,value in imagedic.items():

img = cv2.imread(value)

img1 = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

img2 = cv2.resize(img1,(w,h))

cv2.imwrite('pos'+str(n+1).rjust(3,'0')+'.jpg',img2)

n+=1

except KeyboardInterrupt:

print('暫停一下')

修改完圖片尺寸之后，需要生成圖片的路徑，我也寫了一個代碼，運行后，會在當前目錄生成一個如圖所示的文件

pos.txt

每一行分別代表文件路徑 1代表里面有幾個目標，咱們用的截取好的，所以只有一個，然后 0 0 60 120 分別代表著圖片的起始像素和終止像素的長寬

#會在當前目錄生成一個如圖所示的文件，記得修改 w h 為上面修改后的尺寸值

import os

def getimage(file_dir):

images = {}

for root, dirs, files in os.walk(file_dir):

for name in files:

images[name] = os.path.join(root,name)

return images

if __name__ == '__main__':

n=0

aa = os.getcwd()

dirpath = os.path.join(aa, 'pos')

imagedic = getimage(dirpath)

#print (imagedic)

try :

for key,value in imagedic.items():

with open ('pos.txt','a') as f:

f.write('pos/'+str(key).rjust(3,'0')+' 1 0 0 w h''\n')

except KeyboardInterrupt:

print('暫停一下')

接下來就要用opencv_createsamples.exe生成正樣本文件了，寫了一個批處理文件，新建crate_samples.bat，打開編輯

"在此處寫上你的opencv_createsamples.exe路徑" -info "pos.txt" -vec pos.vec -num 200 -w 60 -h 120

一些參數解釋：

info 輸入正樣本描述文件

img 輸入圖像文件名，默認NULL

bg 負樣本描述文件，文件中包含一系列的被隨機選作物體背景的圖像文件名，默認NULL

num 生成正樣本的數目，默認1000

bgcolor 背景顏色，表示透明顏色，默認0

bgthresh 顏色容差，所有處于bgcolor- bgthresh和bgcolor+bgthresh之間的像素被置為透明像素，也就是將白噪聲加到前景圖像上，默認80

inv 前景圖像顏色翻轉標志，如果指定顏色翻轉，默認0(不翻轉)

randinv 如果指定顏色將隨機翻轉，默認0

maxidev 前景圖像中像素的亮度梯度最大值，默認40

maxxangle X軸最大旋轉角度，以弧度為單位，默認1.1

maxyangle Y軸最大旋轉角度，以弧度為單位，默認1.1

maxzangle Z軸最大旋轉角度，以弧度為單位，默認0.5

輸入圖像沿著三個軸進行旋轉，旋轉角度由上述3個值限定。

show 如果指定，每個樣本都將被顯示，按下Esc鍵，程序將繼續創建樣本而不在顯示，默認為0(不顯示)

scale 顯示圖像的縮放比例，默認4.0

w 輸出樣本寬度，默認24

h 輸出樣本高度，默認24

vec 輸出用于訓練的.vec文件

負樣本

負樣本只需要生成路徑文件，不需要生成vec文件，具體步驟跟上面類似，要注意的是負樣本要盡可能比正樣本多，大概十倍的樣子吧。

開始訓練

新建一個文件夾TrainCascadeClassification，一會訓練好的文件就在這里

新建一個train.bat，編輯

"你的opencv_traincascade.exe目錄" -data "你的TrainCascadeClassification目錄" -vec pos.vec -bg neg.txt -numPos 160 -numNeg 500 -numStages 15 -precalcValBufSize 3000 -precalcIdxBufSize 3000 -featureType LBP -w 60 -h 120

Pause

一些參數解釋

data 訓練的分類器的存儲目錄

vec 正樣本文件，由open_createsamples.exe生成，正樣本文件后綴名為.vec

bg 負樣本說明文件，主要包含負樣本文件所在的目錄及負樣本文件名

numPos 每級分類器訓練時所用到的正樣本數目，應小于vec文件中正樣本的數目，具體數目限制條件為：numPos+(numStages- 1)numPos(1- minHitRate)<=vec文件中正樣本的數目。根據我的經驗，一般為正樣本文件的80%

numNeg 每級分類器訓練時所用到的負樣本數目，可以大于- bg指定的圖片數目。根據我的經驗，一般為numPos的2-3倍

numStages 訓練分類器的級數，強分類器的個數。根據我的經驗，一般為12-20

precalcValBufSize 緩存大小，用于存儲預先計算的特征值，單位MB，根據自己內存大小分配

precalcIdxBufSize 緩存大小，用于存儲預先計算的特征索引，單位MB，根據自己內存大小分配

featureType 訓練使用的特征類型，目前支持的特征有Haar，LBP和HOG

w 訓練的正樣本的寬度

h 訓練的正樣本的高

進階參數

minHitRate 影響每個強分類器閾值，每一級分類器最小命中率，表示每一級強分類器對正樣本的的分類準確率

maxFalseAlarm 最大虛警率，影響弱分類器的閾值，表示每個弱分類器將負樣本誤分為正樣本的比例，一般默認值為0.5

weightTrimRate 0- 1之間的閾值，影響參與訓練的樣本，樣本權重更新排序后(從小到大)，從前面累計權重小于(1- weightTrimRate)的樣本將不參與下一次訓練，一般默認值為0.95

maxDepth 每一個弱分類器決策樹的深度，默認是1，是二叉樹(stumps)，只使用一個特征。

maxWeakCount 每級強分類器中弱分類器的最大個數，當FA降不到指定的maxFalseAlarm時可以通過指定最大弱分類器個數停止單個強分類器

這個時候先看一下我們的工作目錄下都有那些東西，沒有的話，記得補全它。

工作目錄

然后打開train.bat,等著就可以了，訓練結束后，會得到自己的xml文件，就可以調用了。

總結

以上是生活随笔為你收集整理的python 作物识别_Python-OpenCV —— 物体识别（TrainCascadeClassification）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： lisp读写cass属性_130507A
下一篇： hql可以使用distinct吗_香薰精