當(dāng)前位置：首頁(yè) > 人工智能 > 目标检测 >内容正文

目标检测

【pytorch目标检测】开山之作：R-CNN算法解读

發(fā)布時(shí)間：2023/12/20 目标检测 36 豆豆

生活随笔收集整理的這篇文章主要介紹了【pytorch目标检测】开山之作：R-CNN算法解读小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

背景

將“深度學(xué)習(xí)”和傳統(tǒng)的“計(jì)算機(jī)視覺(jué)”的知識(shí)相結(jié)合，沒(méi)有過(guò)多的使用深度學(xué)習(xí)
2014年將PASCALVOC數(shù)據(jù)集檢測(cè)率從35%提升到53%

具體步驟

總體的步驟圖：

1.候選區(qū)域生成：ROI(Regions of Interst)

Selective Search算法

將圖像分割承小區(qū)域，合并包含同一物體可能性較高的區(qū)域，提取約2000個(gè)候選區(qū)域

歸一化處理，得到固定大小的圖像

利用 Selective Search 算法通過(guò)圖像分割的方法得到一些原始區(qū)域，然后利用一些合并策略將這些區(qū)域合并，得到一些層次化的區(qū)域結(jié)構(gòu)，而這些結(jié)構(gòu)就包含著可能需要的物體。這里的 SS 算法可以詳見(jiàn) 此處，算法原始論文Selective Search for Object Recognition。（初始區(qū)域的獲取是引用另一篇論文的：Efficient Graph-Based Image Segmentation）

2.CNN提取

將固定大小的圖像，利用AlexNet CNN網(wǎng)絡(luò)得到固定維度的特征輸出

3.SVM分類器

線性二分類器對(duì)輸出特征進(jìn)行分類
得到是否屬于此類的結(jié)果，采用難樣本挖掘來(lái)平衡正負(fù)樣本的不平衡

對(duì)2000x20的每一列近NMS處理

4.位置精修

通過(guò)回歸器對(duì)特征邊界回歸=Bounding Box regression從而得到更為精準(zhǔn)的目標(biāo)區(qū)域

存在的問(wèn)題

候選區(qū)域需要提前提取并保存，占用空間較大
涉及分類中的全連接網(wǎng)絡(luò)，所以尺寸是固定的，精度會(huì)低
需要多步訓(xùn)練，步驟繁瑣且訓(xùn)練速度慢

總結(jié)

以上是生活随笔為你收集整理的【pytorch目标检测】开山之作：R-CNN算法解读的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： STL中map的使用要点
下一篇： C++ int转string以及源码