卷积神经网络-目标探测
文章目錄
- 目標探測介紹
- 任務
- 思路
- DPM
- RCNN
- 1)候選區域選擇
- 2)CNN特征提取
- 3)分類與邊界回歸
- R-CNN總結
- 優點
- 缺陷
- FAST-RCNN
- FASTER-RCNN
- YOLO
目標探測介紹
任務
分類+獲取坐標
目標探測
圖片分割
思路
回歸問題:利用神經網絡進行目標識別,同樣目標變為坐標值
該思路問題:在位置嘗試識別,能夠完成識別的地方就是目標位置
如何找到侯選位置?
假如你想構建一個汽車檢測算法,步驟是,首先創建一個標簽訓練集,也就是x和y表示適當剪切的汽車圖片樣本,這張圖片(編號1)x是一個正樣本,因為它是一輛汽車圖片,這幾張圖片(編號2、3)也有汽車,但這兩張(編號4、5)沒有汽車。出于我們對這個訓練集的期望,你一開始可以使用適當剪切的圖片,就是整張圖片x幾乎都被汽車占據,你可以照張照片,然后剪切,剪掉汽車以外的部分,使汽車居于中間位置,并基本占據整張圖片。有了這個標簽訓練集,你就可以開始訓練卷積網絡了,輸入這些適當剪切過的圖片(編號6),卷積網絡輸出y,0或1表示圖片中有汽車或沒有汽車。訓練完這個卷積網絡,就可以用它來實現滑動窗口目標檢測,具體步驟如下。
假設這是一張測試圖片,首先選定一個特定大小的窗口,比如圖片下方這個窗口,將這個紅色小方塊輸入卷積神經網絡,卷積網絡開始進行預測,即判斷紅色方框內有沒有汽車。
滑動窗口目標檢測算法接下來會繼續處理第二個圖像,即紅色方框稍向右滑動之后的區域,并輸入給卷積網絡,因此輸入給卷積網絡的只有紅色方框內的區域,再次運行卷積網絡,然后處理第三個圖像,依次重復操作,直到這個窗口滑過圖像的每一個角落。
為了滑動得更快,我這里選用的步幅比較大,思路是以固定步幅移動窗口,遍歷圖像的每個區域,把這些剪切后的小圖像輸入卷積網絡,對每個位置按0或1進行分類,這就是所謂的圖像滑動窗口操作。
重復上述操作,不過這次我們選擇一個更大的窗口,截取更大的區域,并輸入給卷積神經網絡處理,你可以根據卷積網絡對輸入大小調整這個區域,然后輸入給卷積網絡,輸出0或1。
再以某個固定步幅滑動窗口,重復以上操作,遍歷整個圖像,輸出結果。
然后第三次重復操作,這次選用更大的窗口。
如果你這樣做,不論汽車在圖片的什么位置,總有一個窗口可以檢測到它。
比如,將這個窗口(編號1)輸入卷積網絡,希望卷積網絡對該輸入區域的輸出結果為1,說明網絡檢測到圖上有輛車。
這種算法叫作滑動窗口目標檢測,因為我們以某個步幅滑動這些方框窗口遍歷整張圖片,對這些方形區域進行分類,判斷里面有沒有汽車。
DPM
基本思想: 提取圖像特征,制作出激勵模版,在原
始圖像滑動計算,得到激勵效果圖,根據激勵分布確定
目標位置
缺點:
RCNN
神經網絡分類思想: 對多個位置,不同尺寸,用卷積神經網絡判斷區域內圖片是不是某物
候選位置(proposal)提出方法:EdgeBox
RCNN(Regions with CNN features)是將CNN方法應用到目標檢測問題上的一個里程碑,由年輕有為的RBG大神提出,借助CNN良好的特征提取和分類性能,通過RegionProposal方法實現目標檢測問題的轉化。
1)候選區域選擇
Region Proposal是一類傳統的區域提取方法,可以看作不同寬高的滑動窗口,通過窗口滑動獲得潛在的目標圖像,關于Proposal大家可以看下SelectiveSearch,一般Candidate選項為2k個即可,這里不再詳述;根據Proposal提取的目標圖像進行歸一化,作為CNN的標準輸入。2)CNN特征提取
標準CNN過程,根據輸入進行卷積/池化等操作,得到固定維度的輸出;3)分類與邊界回歸
實際包含兩個子步驟,一是對上一步的輸出向量進行分類(需要根據特征訓練分類器);二是通過邊界回歸(bounding-box regression) 得到精確的目標區域,由于實際目標會產生多個子區域,旨在對完成分類的前景目標進行精確的定位與合并,避免多個檢出。
R-CNN總結
優點
缺陷
FAST-RCNN
FASTER-RCNN
YOLO
總結
以上是生活随笔為你收集整理的卷积神经网络-目标探测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python正则表达式操作指南_第二篇详
- 下一篇: 儿童手表怎么删除联系人_华为儿童手表4X