【pytorch目标检测】开山之作:R-CNN算法解读
生活随笔
收集整理的這篇文章主要介紹了
【pytorch目标检测】开山之作:R-CNN算法解读
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
背景
- 將“深度學(xué)習(xí)”和傳統(tǒng)的“計(jì)算機(jī)視覺(jué)”的知識(shí)相結(jié)合,沒(méi)有過(guò)多的使用深度學(xué)習(xí)
- 2014年將PASCALVOC數(shù)據(jù)集檢測(cè)率從35%提升到53%
具體步驟
總體的步驟圖:
1.候選區(qū)域生成:ROI(Regions of Interst)
利用 Selective Search 算法通過(guò)圖像分割的方法得到一些原始區(qū)域,然后利用一些合并策略將這些區(qū)域合并,得到一些層次化的區(qū)域結(jié)構(gòu),而這些結(jié)構(gòu)就包含著可能需要的物體。這里的 SS 算法可以詳見(jiàn) 此處,算法原始論文Selective Search for Object Recognition。(初始區(qū)域的獲取是引用另一篇論文的:Efficient Graph-Based Image Segmentation)
2.CNN提取
將固定大小的圖像,利用AlexNet CNN網(wǎng)絡(luò)得到固定維度的特征輸出
3.SVM分類器
- 線性二分類器對(duì)輸出特征進(jìn)行分類
- 得到是否屬于此類的結(jié)果,采用難樣本挖掘來(lái)平衡正負(fù)樣本的不平衡
對(duì)2000x20的每一列近NMS處理
4.位置精修
通過(guò)回歸器對(duì)特征邊界回歸=Bounding Box regression從而得到更為精準(zhǔn)的目標(biāo)區(qū)域
存在的問(wèn)題
- 候選區(qū)域需要提前提取并保存,占用空間較大
- 涉及分類中的全連接網(wǎng)絡(luò),所以尺寸是固定的,精度會(huì)低
- 需要多步訓(xùn)練,步驟繁瑣且訓(xùn)練速度慢
總結(jié)
以上是生活随笔為你收集整理的【pytorch目标检测】开山之作:R-CNN算法解读的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: STL中map的使用要点
- 下一篇: C++ int转string以及源码