论文笔记——Rich feature hierarchies for accurate object detection and semantic segmentation
?
最近在看一些目標(biāo)檢測(cè)的論文,本文是經(jīng)典的R-CNN(Regions with CNN features),隨之產(chǎn)生的一系列目標(biāo)檢測(cè)算法:RCNN,Fast RCNN,?Faster RCNN代表當(dāng)下目標(biāo)檢測(cè)的前沿水平。在此之前主要是SIFT和HOG特征。
Code:https://github.com/rbgirshick/rcnn
概述:
?
測(cè)試流程:(1)輸入測(cè)試圖像
??(2)利用selective search算法在輸入圖像中提取大約2000個(gè)region proposals
??(3)將每個(gè)region proposal warp(縮放)成227*227,再輸入到CNN計(jì)算特征(fc7的輸出),提取出的特征向量的維度為4096維
??(4)將提取到的特征輸入到SVMs中分類。
??(5)對(duì)分類好的region proposal做bounding-box regreesion:每個(gè)region都會(huì)給出所對(duì)應(yīng)的score,選出前幾個(gè)對(duì)大數(shù)值,然后再用非極大值抑制canny來進(jìn)行邊緣檢測(cè),最后就會(huì)得到所對(duì)應(yīng)的bounding-box
針對(duì)的問題:localizing objects?with a deep network 和?training a high-capacity model?with only a small quantity of annotated detection data.?
(1)圖像中的目標(biāo)定位兩種思路:把定位當(dāng)做回歸問題或利用滑動(dòng)窗口(sliding-window)
(2)對(duì)于數(shù)據(jù)量不足(labeled data is scarce):在大數(shù)據(jù)集(ImageNet)上進(jìn)行預(yù)訓(xùn)練,之后在特定領(lǐng)域的數(shù)據(jù)集(PASCAL)上對(duì)網(wǎng)絡(luò)進(jìn)行fine-tuning(微調(diào))。
非極大值抑制(NMS)先計(jì)算出每一個(gè)bounding box的面積,然后根據(jù)score進(jìn)行排序,把score最大的bounding box作為選定的框,計(jì)算其余bounding box與當(dāng)前最大score與box的IoU,去除IoU大于設(shè)定的閾值的bounding box
運(yùn)行時(shí)間分析:——快的原因:CNN的參數(shù)共享,低維度的features vectors,所需要的內(nèi)存小
數(shù)據(jù)集的劃分:若region proposal與ground-truth的IoU大于某個(gè)閥值則為正樣本,否則為負(fù)樣本。閥值是由a grid search over{0,0.1,...,0.5}on a validation set產(chǎn)生的。
結(jié)果:將PASCAL VOC上的檢測(cè)率從35.1%提升到53.7%。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的论文笔记——Rich feature hierarchies for accurate object detection and semantic segmentation的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 随机采样方法整理与讲解(MCMC、Gib
- 下一篇: [SPP-NET]Spatial Pyr