人工智能:物体检测之Faster RCNN模型
生活随笔
收集整理的這篇文章主要介紹了
人工智能:物体检测之Faster RCNN模型
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
人工智能:物體檢測之Faster RCNN模型
- 物體檢測
- Faster RCNN模型
- 簡介
- 卷積層
- RPN
- Roi Pooling
- Classifier
物體檢測
- 什么是物體檢測
- 物體檢測應用場景
- 物體檢測開源數據集
Faster RCNN模型
簡介
-
Faster RCNN由Ross Girshick等人于2016年將其用于目標檢測任務中,與傳統RCNN相比,利用RPN(Region Proposal Networks)完成候選框的選擇,Faster RCNN的結構如下所示。
-
Faster R-CNN模型分為兩部分,一是RPN(Region Proposal Network),二是Faster R-CNN。
-
RPN包括proposal和conv layers,Faster R-CNN包括卷積層、ROI Pooling及后面的全連接層部分。
-
首先將整張圖片輸入CNN,提取圖片的features maps,再將圖片特征輸入RPN,得到候選框的特征信息。
-
RPN對于候選框提出的特征,使用分類器判別是否屬于待識別的目標,將屬于某一類別的候選框,用回歸器進一步調整其位置。
-
最后將目標框和圖片特征向量輸入到Roi Pooling中層,再通過分類器進行分類,完成目標檢測的任務。RPN能夠協助Fast RNN將注意力集中在候選框中。
卷積層
- Faster RCNN首先將整張圖片輸進CNN,提取圖片的feature map,再將其輸入到到RPN,得到候選框的特征信息。
- 這里采用VGG16完成feature map的提取。
- 卷積層是被RPN和Fast R-CNN兩部分共享的。
RPN
- 相比于Fast RCNN,Faster R-CNN引入RPN(Region Proposal Network)完成候選框的提取,使得算法效率得到進一步提升。
- RPN將任意尺寸大小的圖片作為輸入,輸出若干個矩形候選框。為了生成區域候選框,在卷積層最后一層feature map上滑動一個(nn)的網絡,將卷積生成的feature map與(nn)的窗口進行卷積運算。
- 每一個滑動窗口都映射為一個更低維的特征。得到的特征送入兩個分支中,一個用于框分類,另一個用于框回歸。此網絡執行滑動窗口形式,所有空間位置都共享全連接層。
Roi Pooling
- Fast R-CNN改進了R-CNN,應用了Roi Pooling。
- 由于在全連接層,需要輸入固定大小的特征向量,R-CNN網絡經過warp操作統一成固定的大小再送入后續網絡,導致圖像的變形和扭曲。
- 而且每一個proposal均需要單獨進行特征提取,重復計算量大。
- Poipooling通過卷積計算將圖像統一成固定大小的特征向量。
- Roi Pooling的輸入是卷積層得到的feature map和RNP得到的anchor,將其分割成7 * 7大小的子窗口,對每個子窗口進行max-pooling操作,輸出ROI(region of interest)的feature map。輸入后續的全連接層判斷目標。
Classifier
在這一步,分類器完成對候選區域的檢測。利用RoI feature maps計算ROI類別,同時再次bounding box regression獲得目標最終的位置。
總結
以上是生活随笔為你收集整理的人工智能:物体检测之Faster RCNN模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI学习与进阶实践-基于行业价值的AI学
- 下一篇: Java软件研发工程师转行之深度学习(D