行人重识别(1)——行人检测综述
!轉載請注明原文地址!——東方旅行者
更多行人重識別文章移步我的專欄:行人重識別專欄
本文目錄
- 一、行人檢測常用方法
- 1、基于運動檢測的方法
- 1) 思路
- 2) 存在問題
- 3) 原因
- 2、基于傳統機器學習的方法
- 1) 思路
- 2) 特征提取
- 3) 分類器
- 3、基于深度學習的方法
- 二、行人檢測常用數據集
- 三、參考文獻
一、行人檢測常用方法
1、基于運動檢測的方法
1) 思路
通過前面的幀學習得到一個背景模型,然后用當前幀與背景幀進行比較,得到運動的目標,即圖像中變化的區域
2) 存在問題
只能檢測運動的目標,對于靜止的目標無法處理;受光照變化、陰影的影響很大;如果目標的顏色和背景很接近,會造成漏檢和斷裂;容易受到惡劣天氣如雨雪,以及樹葉晃動等干擾物的影響;如果多個目標粘連,重疊,則無法處理
3) 原因
只利用了像素級的信息,沒有利用圖像中更高層的語義信息
2、基于傳統機器學習的方法
1) 思路
特征提取+分類器
2) 特征提取
a) 底層特征
優點:單一特征,計算速度快
缺點:只從某一方面描述行人特征,判別力較差
b) 基于學習的特征
優點:能從大量的樣本中選擇去判別能力較強的特征
缺點:特征的選擇質量與訓練樣本密切相關,若訓練集代表性差則很難選出好的特征
c) 混合特征
優點:從不同方向描述圖像特征
缺點:特征維度增加,訓練與預測的時間長,部分終端設備無法滿足其算力要求
3) 分類器
在傳統機器學習方法中使用最多的分類器就是SVM與AdaBoost
a) 樸素貝葉斯分類器
優點:算法開銷小、穩定性強
缺點:如果不同類別之間存在關聯或某些類間相似度較高,則樸素貝葉斯分類器分類效果較差。該分類器對于基本滿足類間條件獨立的數據樣本分類效果好
b) 神經網絡
優點:分類準確率高,且基于反向傳播算法可以完成輸入到輸出的直接訓練
缺點:可解釋性差、要求的算力高(某些終端設備算力可能無法滿足該方法)
c) AdaBoost
優點:可以利用不同算法的弱分類器進行級聯,具有很高的精度
缺點:要求的算力高,數據不均衡容易導致分類準確度下降
d) 支持向量機(SVM)
優點:可以解決小樣本機器學習問題、可以通過核函數對數據進行映射在更高維度將線性不可分的問題映射為線性可分的問題
缺點:核函數的高維映射解釋力不強、缺失數據敏感、解決多分類問題較困難
3、基于深度學習的方法
除了常見的通用的目標檢測框架如SSD、FPN、YOLO等外
二、行人檢測常用數據集
較早公開的行人數據集。包含正面和背面兩個視角的彩色行人圖像,數據庫未劃分訓練集和測試集,且不包含負樣本。目前較少使用
目前使用較多的靜態行人數據集,包含訓練集和測試集,且均包含正樣本和負樣本。該庫行人所處背景復雜,人的姿態也較多,而且含有光照等環境因素的變化,更加符合實際場景
圖像來源與車載攝像機,分為檢測數據集與分類數據集,圖片均是灰度圖片。每個子數據集均由訓練集和測試集組成。測試集是一段大約27分鐘的視頻,視頻中包含完整的以及被部分遮擋的行人。數據庫中還包含三個只有負樣本的子數據庫。但因為該庫大量正樣本由較少的正樣本經過移位或鏡像生成,所以重要特征會出現在相鄰位置產生模糊效應,導致預測效果不佳
圖像來源與車載攝像機,與現實中圖像的實際遮擋率一致,其中包含一些質量不好的圖像。數據集分為訓練集和測試集,但測試集的標注信息尚未公開
該數據集主要用于評估運動信息在行人檢測中的作用,常用于行人檢測及追蹤中
規模較大的靜態圖像行人數據庫,包含25551張單人圖像和5207張高分辨率非行人圖像,已劃分好訓練集與測試集
基于雙目視覺的行人數據集,采用一對車載攝像頭拍攝獲得。給出了標定信息和行人標注信息。該數據庫主要用于多個行人的檢測與跟蹤研究
目前包含三個數據集:CVC-01,CVC-02和CVC-Virtual。該數據庫主要用于車輛輔助駕駛中的行人檢測研究
大部分來自于監控視頻,是一個比較小的行人數據庫,包含3組數據集:USC-A,USC-B和USC-C。USC-A中包含正面或者背面拍攝的行人,行人之間無相互遮擋;USC-B中包含多個視角下且存在相互遮擋的行人;USC-C包含多視角下無相互遮擋的行人。該數據庫主要用于存在遮擋和多視角情況下的行人檢測研究
三、參考文獻
[1] 【SIGAI綜述】行人檢測算法.(這篇綜述寫的比較詳細,推薦看看)
[2] 蘇松志, 李紹滋, 陳淑媛, 等. 行人檢測技術綜述[J]. 電子學報, 2012, 40(004):814-820.
[3] 蔡小路. 基于分類器算法的行人檢測研究[D]. 成都: 電子科技大學, 2015.
[4] 張春鳳, 宋加濤, 王萬良. 行人檢測技術研究綜述[J]. 電視技術, 2014, 38(3).
[4] W. Ouyang, X. Wang, Joint Deep Learning for Pedestrian Detection[J]. CVPR, 2013: 2056-2063.
[5] Li J, Liang X, Shen S M, 等. Scale-aware Fast R-CNN for Pedestrian Detection[J]. IEEE Transactions on Multimedia, 2015: 1-1.
[6] Zhang L, Lin L , Liang X, 等. Is Faster R-CNN Doing Well for Pedestrian Detection?[J]. ECCV, 2016: 443-457.
[7] Wang X, Xiao T, Jiang Y, 等. Repulsion Loss: Detecting Pedestrians in a Crowd[J]. CVPR, 2017: 7774-7783.
[8] Mao J, Xiao T, Jiang Y, 等. What Can Help Pedestrian Detection?[C]. CVPR: IEEE, 2017.
總結
以上是生活随笔為你收集整理的行人重识别(1)——行人检测综述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何利用OMIM数据库获取肿瘤相关所有突
- 下一篇: 为啥子