當前位置：首頁 > 人工智能 > 卷积神经网络 >内容正文

卷积神经网络

卷积神经网络－目标探测

發布時間：2024/7/5 卷积神经网络 84 豆豆

生活随笔收集整理的這篇文章主要介紹了卷积神经网络－目标探测小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

- 目標探測介紹
- 任務
- 思路
- DPM
- RCNN
- 1）候選區域選擇
- 2）CNN特征提取
- 3）分類與邊界回歸
- R-CNN總結
- 優點
- 缺陷
- FAST-RCNN
- FASTER-RCNN
- YOLO

目標探測介紹

任務

分類+獲取坐標
目標探測
圖片分割

思路

回歸問題：利用神經網絡進行目標識別，同樣目標變為坐標值

該思路問題：在位置嘗試識別，能夠完成識別的地方就是目標位置
如何找到侯選位置？

假如你想構建一個汽車檢測算法，步驟是，首先創建一個標簽訓練集，也就是x和y表示適當剪切的汽車圖片樣本，這張圖片（編號1）x是一個正樣本，因為它是一輛汽車圖片，這幾張圖片（編號2、3）也有汽車，但這兩張（編號4、5）沒有汽車。出于我們對這個訓練集的期望，你一開始可以使用適當剪切的圖片，就是整張圖片x幾乎都被汽車占據，你可以照張照片，然后剪切，剪掉汽車以外的部分，使汽車居于中間位置，并基本占據整張圖片。有了這個標簽訓練集，你就可以開始訓練卷積網絡了，輸入這些適當剪切過的圖片（編號6），卷積網絡輸出y，0或1表示圖片中有汽車或沒有汽車。訓練完這個卷積網絡，就可以用它來實現滑動窗口目標檢測，具體步驟如下。

假設這是一張測試圖片，首先選定一個特定大小的窗口，比如圖片下方這個窗口，將這個紅色小方塊輸入卷積神經網絡，卷積網絡開始進行預測，即判斷紅色方框內有沒有汽車。

滑動窗口目標檢測算法接下來會繼續處理第二個圖像，即紅色方框稍向右滑動之后的區域，并輸入給卷積網絡，因此輸入給卷積網絡的只有紅色方框內的區域，再次運行卷積網絡，然后處理第三個圖像，依次重復操作，直到這個窗口滑過圖像的每一個角落。

為了滑動得更快，我這里選用的步幅比較大，思路是以固定步幅移動窗口，遍歷圖像的每個區域，把這些剪切后的小圖像輸入卷積網絡，對每個位置按0或1進行分類，這就是所謂的圖像滑動窗口操作。

重復上述操作，不過這次我們選擇一個更大的窗口，截取更大的區域，并輸入給卷積神經網絡處理，你可以根據卷積網絡對輸入大小調整這個區域，然后輸入給卷積網絡，輸出0或1。

再以某個固定步幅滑動窗口，重復以上操作，遍歷整個圖像，輸出結果。

然后第三次重復操作，這次選用更大的窗口。

如果你這樣做，不論汽車在圖片的什么位置，總有一個窗口可以檢測到它。

比如，將這個窗口（編號1）輸入卷積網絡，希望卷積網絡對該輸入區域的輸出結果為1，說明網絡檢測到圖上有輛車。

這種算法叫作滑動窗口目標檢測，因為我們以某個步幅滑動這些方框窗口遍歷整張圖片，對這些方形區域進行分類，判斷里面有沒有汽車。

DPM

基本思想：提取圖像特征，制作出激勵模版，在原
始圖像滑動計算，得到激勵效果圖，根據激勵分布確定
目標位置

產生多個模版，整體模版以及不同局部模版

不同模版同輸入圖片“卷積”產生特征圖

特征圖組合形成融合特征

對融合特征進行傳統分類，回歸，得到目標位置

優點:

方法直觀簡單

運算速度快

適應運動物體變形
缺點:

性能一般

激勵特征人為設計，工作量大

大幅度旋轉無法適應，穩定性差

RCNN

神經網絡分類思想：對多個位置，不同尺寸，用卷積神經網絡判斷區域內圖片是不是某物
候選位置(proposal)提出方法：EdgeBox
RCNN（Regions with CNN features）是將CNN方法應用到目標檢測問題上的一個里程碑，由年輕有為的RBG大神提出，借助CNN良好的特征提取和分類性能，通過RegionProposal方法實現目標檢測問題的轉化。

算法可以分為四步：

1）候選區域選擇

Region Proposal是一類傳統的區域提取方法，可以看作不同寬高的滑動窗口，通過窗口滑動獲得潛在的目標圖像，關于Proposal大家可以看下SelectiveSearch，一般Candidate選項為2k個即可，這里不再詳述；根據Proposal提取的目標圖像進行歸一化，作為CNN的標準輸入。

2）CNN特征提取

標準CNN過程，根據輸入進行卷積/池化等操作，得到固定維度的輸出；

3）分類與邊界回歸

實際包含兩個子步驟，一是對上一步的輸出向量進行分類（需要根據特征訓練分類器）；二是通過邊界回歸（bounding-box regression) 得到精確的目標區域，由于實際目標會產生多個子區域，旨在對完成分類的前景目標進行精確的定位與合并，避免多個檢出。

R-CNN總結

優點

CNN用于目標探測，利用了CNN高效識別能力，大大提高性能

擺脫人為設計物品模版，方法具有通用性

分類＋回歸，有了找到精確位置的可能

缺陷

為了檢測一個目標，所有候選區域計算，大量卷積運算，非常慢

SVM訓練與CNN斷裂，有效信息不能用于優化模型，not end－to－end。

每一類單獨訓練，異常繁瑣

FAST-RCNN

FASTER-RCNN

YOLO

總結

以上是生活随笔為你收集整理的卷积神经网络－目标探测的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： python正则表达式操作指南_第二篇详
下一篇：儿童手表怎么删除联系人_华为儿童手表4X