目标检测 Chapter1 传统目标检测方法
文章目錄
- 目標檢測問題定義
- 介紹
- 目標檢測和圖像分類、圖像分割的區別
- 目標檢測問題方法
- 傳統目標檢測
- 深度學習目標檢測
- 傳統 Vs 深度學習
- 傳統目標檢測綜述
- Viola-Jones
- HOG+SVM
- DPM
- NMS 非極大值抑制
目標檢測問題定義
介紹
目標種類與數量問題:種類不同。種類越多,難度越大。數量越多(遮擋),難度越大。
目標尺度問題:同一種類的物體,也會有不同的尺度。尺度變化越大,目標檢測的難度越大。尤其是在尺度非常小的時候。由于物體是運動的,所以尺度上也會變化。
一張圖片,他的物體和數量都是不確定的,這就是目標檢測的目的。位置一般是矩形框,在矩形框內,我們還要做目標分類。對于目標檢測問題,我們用到的網絡是多任務的網絡,通常完成目標位置的定位和目標分類。
目標檢測和圖像分類、圖像分割的區別
框上的數值,是置信度,當前檢測框屬于查找目標的概率值。我們通常會設定一個閾值,用于過濾分類概率低的目標。不同顏色的矩形框,表示不同的類別。
分類需要識別類別,檢測還要識別出位置。目標分割,需要找到當前目標所占的區域。第3張圖,是語義分割,第4章圖,是實例分割。
目標檢測問題方法
傳統的手動設計特征,以及滑動窗口。設計特征往往很難設計,而且對于一些條件可能不適應或者不魯邦,設計特征效率也是很低。另外滑動窗口提取目標框,流程也是非常耗時。
2012之后,利用深度學習卷積神經網絡,在做目標檢測,效果得到了很大的提升。一開始RCNN只是用神經網絡用于特征的提取,后面當faster RCNN,徹底完成了端到端的網絡。不需要在滑動窗口提取,而是通過RPN,來做候選框。Yolo是不需要候選框,而是直接用回歸的方法,直接來找目標,他的速度非常的快,后面的精確度也隨著Yolo的改進,得到了很大的提升。
傳統目標檢測
VJ:積分圖特征+Adaboost分類起
HOG+SVM:主要用于行人檢測
DPM:基于HOG的一種變種,DPM加入額外的策略,來提升精度,是除深度學習之外,最強的算法。在深度學習用到了一些DPM的概念,比如候選框。
深度學習目標檢測
One-Stage:Yolo和SSD。
Two0-Stage:Faster-RCNN。先找出候選框,再做回歸和分類。
2013-2018
傳統 Vs 深度學習
深度學習往往通過不同的網絡結構,來學習不同的特征。
傳統目標檢測綜述
關于圖像特征表示的一些方法,基于紋理,顏色,形狀以及一些高層次語義的方法,這些方法是需要學習來找到的,比如抽取直方圖特征或者紋理特征,HOG特征,這些稠密特征,通過PCA降維,或者LDA對特征進行空間的投影,對抽取的基本特征,來學習更魯邦的特征出來。
傳統的特征分類:低層特征、中層次特征(機器方法-特征挖掘-PCA-LDA)、高層次特征(語義特征)(將低、中層的特征,進一步挖掘)。
在傳統目標檢測方法中,主要集中低、中的特征。
對于候選區域提取的特征,進行分類判定。對于單類別目標檢測,只需要判斷窗口對象是否為要檢測的目標即可。對于多分類問題,我們先看是否為背景,如果不是,再做多分類。
候選框可能存在重疊的情況,我們需要用NMS對于候選框進行合并,得到我們要檢測的目標。
對于深度學習的目標檢測方法,區別在于特征提取,變成CNN。區域提取,用RPN網絡。(2-stages)
Viola-Jones
VJ:主要用于人臉檢測。特征抽取采用Haar。
特征表示方式是直方圖。包含不同種類的集成圖特征。對于每一個像素點,我們會計算出一個值,這個值用白色區域減去黑色的區域,作為我們表示的一個值。
Edge表示相鄰的像素點,進行差值。
HOG+SVM
行人的姿態,存在非常多的差異。所以行人的檢測,存在一定的難度。
HOG特征,紋理特征的一種。HOG主要用于灰度圖上。Gamma變化,就是對于值開平方根。計算每一點在x和y方向的梯度值,來計算梯度夾角。再將0-360,量化為若干個方向(18個方向,每個方向20度)。每個cell就是18維,相鄰的4個cell組成block。通過組合,將特征歸一化處理,讓特征更加的魯邦。
這里其實通過cell,可以看到一些yolo的影子。
DPM
DPM在進行特征檢測,會基于HOG,但是比HOG處理的更加精細。HOG是計算梯度方向,所以是紋理特征的一種。對于方向特征,包括0-360度,我們成為有方向的梯度。如果是0-180,是無方向的梯度。
NMS 非極大值抑制
分數就是我們的框上面那個confidence,對于該類物體的置信度。
與最高的框,IOU大于閾值的框,刪掉。完全不重疊,或者重疊很小的,被留下。然后重復。
soft-NMS不是直接刪除,而是軟抑制。是深度學習算法提出的一個小的技巧。
總結
以上是生活随笔為你收集整理的目标检测 Chapter1 传统目标检测方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 举个栗子!Tableau 技巧(113)
- 下一篇: 单片机期末实训---- 密码锁和交通灯