读《基于深度学习的跨视角步态识别算法研究》
2020
背景:
作為一種新興的識別技術,步態識別具有在非受控、遠距離、低分辨率的場景下進行身份識別的優點,并且步態不易改變和偽裝,所以近年來得到的關注逐漸增多。
步態識別作為一種新興的身份識別技術,可以根據人們走路姿勢的不同來區分個體身份。與現有的如人臉、指紋等需要近距離采集且需要人員配合的生物特征相比,步態具有低分辨率、受環境影響小、易采集等優點。此外,行人步態可以在個體毫無覺察的情況下被采集到以進行識別,而且行人走路姿勢也難以偽裝和模仿。步態識別的這些優勢使得其最近受到研究人員的關注越來越多。目前,在丹麥、英國等國家和地區,步態分析己經在刑事犯罪案件中投入使用,辦案人員通過步態識別系統分析可疑人員的走路姿態,以提升篩查效率和準確性,降低了因人臉識別、行人重識別等技術失效和人工篩查的低效性所導致嫌犯逃離的可能性。
但是在日常生活中,監控系統中捕獲的步態樣本與注冊的步態樣本往往存在視角差異,這會大大的削弱經典步態識別算法的有效性。所以,解決跨視角步態識別問題、提高步態識別的準確性和實時性,是步態識別產品必須要攻克的技術難題。
當前困難
目前跨角度步態識別的困難在于行人步態在不同視角下的視覺差別巨大。由于步態特征僅包含行人的體型輪廓以及走路姿態信息,不包含顏色和紋理特征,這使得從不同視角的步態中,很難提取表征行人身份的視角不變性特征。為了解決步態識別在跨角度時識別率低的問題
當前解決方法
第一類是通過全景相機或多個校準相機進行3D步態信息構建的跨角度識別方法
這些方法需要復雜的可控攝像機的設置,這在實際應用中難以實現。另一方面,這些方法計算負荷大,進一步限制了其實際應用的可能。
第二類是基于視角轉換模型VTM的跨視角識別方法。這種方法利用來自其他視角的信息集中使用諸如奇異值分解和回歸等技術來構建步態特征。
VTM方法僅僅減小了變換視角的步態特征與原始特征之間的差異,并沒有考慮不同個體間的判別性因素,且這類方法在建模計算時很容易造成噪聲傳播,導致識別率不佳。
第三類是提取具有視角不變性的步態特征。
受限于步態數據跨視角步態標簽不足的問題,很難完成模型訓練,并且通常使用的損失函數都是生搬硬套人臉識別任務中廣泛使用的損失函數
提取對視角變化不敏感的特征可以減小現實場景中視角多變對步態識別技術有效性的影響,實現無論行人以何種角度經過攝像頭,都能準確識別出目標身份的目的,這會大大提高步態識別技術的魯棒性和實際應用價值,推進步態識別技術產業化和標準化,形成完整的產品或服務以在現實生活中發揮作用
當前困難的本質
同一個人的步態從各個角度拍攝成像的步態輪廓是不同的,而且拍攝視角差別越大,同一行人的差異就越大。對于人類而言,這個問題往往可以通過大腦中復雜的運算推理和三維轉換判斷出這些不同視角的步態是否來自同一個人。但是,對于計算機而言,其輸入僅僅是由離散像素點排列而成的二維數字圖像,要通過這些像素點來解決視角不變問題是非常有挑戰性的。另外一方面,步態特征是不包含行人的穿著等顏色和紋理特征,僅包括行人的輪廓以及行走姿勢特征,所以我們無法從顏色和紋理上推理出視角的轉換關系,這無疑增加了跨視角的識別難度。對于步態特征而言,可以認為其僅包含三類信息:視角信息、身份信息以及由不同穿著、背包、輪廓分割誤差所產生的噪聲千擾信息。因此,如果能夠將步態特征中的視角信息和身份信息進行分離,僅用只包含身份信息的特征進行識別,會大大提升跨視角步態識別的精度,提高抗視角千擾能力。
給定一個查詢樣本,跨視角步態識別的目的是從與該查詢樣本視角不同的某視角的注冊數據集中正確找到與該查詢樣本身份相同的注冊樣本。
其中,G表示生成的步態能量圖中位置(i,j)的像素值,s表示步態序列中/時刻的步態剪影圖的位置(i,j)的像素值,T表示此步態序列的長度。實際應用中,在計算步態能量圖之前,要先進行步態的矯正和對齊,使每個時刻的步態剪影圖的重心位置重合。
(將僅有的兩個特征視角和身份拆開分析)
本章提出了身份與視角特征分離的跨視角步態識別算法,將步態特征中的視角信息和身份信息進行分離,僅用只包含身份信息的特征進行識別,提升了跨視角步態識別的精度,提高了抗視角干擾能力。為了保證所提取的身份特征與視角特征是來自該步態樣本的全部信息,本章采用了自編碼器的方式來恢復原始輸入的步態樣本,設計了視角編碼器、身份編碼器和步態解碼器。
(將僅有的兩個特征視角和身份一起分析)
在步態識別任務中,如何提取既具有身份判別能力還具有視角不變性的特征是提高步態識別精度的關鍵。而在現實生活中,人們往往只需要關注行人走路時身體的一部分運動特點和體型特點就可以判斷出該行人的身份,這意味著行人身體的不同部分在步態特征表達中所占的權重是不一樣的,所以對行人身體進行分塊是很有必要的。在具體特征表達方面,水平金字塔是一種在水平方向上的多尺度特征提取方法,并且己經被證明在行人再識別任務上有出色的表現。
展望:
雖然提純身份特征的損失可以提高識別率,但是這只說明組合損失有利于增強表征判別性,但可能特征里還有干擾。解決思路:研究特征的分布,可視化(TSNE?);GAN分解步態樣本
在數據集上的效果并沒有明顯超越前人,原因是數據集視角較少且相鄰視角跨度很小。說明此方法在視角差別很小時對步態樣本的身份和視角特征分離的作用不明顯,所以未來可以設計更精細的網絡來解決此問題;
背包、不同穿著等情況下存在泛化性能挑戰。未來可以嘗試通過特征選擇來解決,對于那些表達背包和穿著的干擾信息,用特征選擇的方法將其濾除,可能會取得更好的識別效果。(行人重識別還好說,有顏色啥的分割,這全是白塊怎么知道哪是背包,哪是穿著)
總結
以上是生活随笔為你收集整理的读《基于深度学习的跨视角步态识别算法研究》的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CentOS,XRDP发生身份验证错误,
- 下一篇: 2022-07-18 Linux df、