【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation
《Region-based Convolutional Networks for Accurate Object Detection and Segmentation》是將卷積神經網(wǎng)絡應用于物體檢測的一篇經典文章。
整個識別過程可以用下面的一張圖片來清晰的表示:
首先給定一張輸入圖像,采用selective search產生區(qū)域提名,因為區(qū)域提名的長寬比例不一樣,將提取出的區(qū)域縮放為固定的大小和長寬比例以便于送入CNN模型進行運算。通過CNN運算后,得到一個特征向量,然后通過線性SVM來判斷這個區(qū)域是否屬于某個類別。
1.要想做檢測,首先需要的是區(qū)域提名,文章中提到了很多種區(qū)域提名的方法:objectness [51], selective search [21], category-independent?object proposals [52], constrained parametric min-cuts?(CPMC) [22], multi-scale combinatorial grouping [35] 。 本文中用了selective search?(J. Uijlings, K. van de Sande, T. Gevers, and A. Smeulders, “Selective search for object recognition,”IJCV, 2013 )作為區(qū)域提名的方法。通過該方法,對于每張圖片可以產生大概2000個候選區(qū)域。
2.網(wǎng)絡采用的是經典的AlexNet網(wǎng)絡,文中稱之為TorontoNet,其實是同一個網(wǎng)絡。訓練過程中,采用梯度下降法,在VOC和ILSVRC2013?兩類數(shù)據(jù)集上分別進行訓練,在網(wǎng)絡的最后,不是采用softmax而是針對沒一個類別單獨的訓練一個線性SVM。
總結
以上是生活随笔為你收集整理的【论文笔记】Region-based Convolutional Networks for Accurate Object Detection and Segmentation的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: caffe安装,编译(包括CUDA和cu
- 下一篇: 基于边缘的图像分割——分水岭算法(wat