目标检测的算法
基于深度學習的目標檢測算法分為2類:Two Stage和One Stage。
Two Stage:先預設一個區域,改區域稱為region proposal,即一個可能包含待檢測物體的預選框(簡稱RP),再通過卷積神經網絡進行樣本分類計算。流程是:特征提取 -> 生成RP -> 分類/回歸定位。常見的Two Stage算法有:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、R-FCN等。
One Stage:不用生成RP,直接在網絡中提取特征值來分類目標和定位
。流程是:特征提取 -> 分類/回歸定位。常見的One Stage算法有:OverFeat、YOLOv1、YOLOv2、YOLOv3、YOLOv5、SSD、RetinaNet等。
利用滑動窗口生成RP
對于Two Stage的算法,RP的產生是一個很耗時的過程:通過一個窗口從左到右,從上到下的在整張圖片上以一定的步長進行滑動掃描,每次滑動的時候對當前窗口執行分類計算,如果當前窗口得到較高的概率,則認為檢測到了物體。過程如下圖所示,這個方法也叫滑動窗口。
滑動窗口其實就是個窮舉的過程,由于事先不知道要檢測的目標大小,所以要設置不同大小比例的窗口去滑動,而且要選取合適的步長。這樣做就會非常耗時。R-CNN就是針對此的一個改進策略,利用一種啟發式的方法只掃描可能包含目標的子區域。
利用非極大值抑制算法來挑出最優解
不管
總結
- 上一篇: 软件包管理
- 下一篇: linux查看riak版本,Riak学习