深刻揭露步态识别的“谎言”(篇一)
歡迎轉(zhuǎn)載,轉(zhuǎn)載時(shí)必須保證全文完整性并保留署名。
步態(tài)識(shí)別是什么?是根據(jù)人走路的方式來(lái)識(shí)別人的身份,也就是根據(jù)走路方式來(lái)識(shí)別出張三李四。你想想,是不是每個(gè)人走路時(shí)?????♀?????,擺腿風(fēng)格皆不同啊?再加上擺臂、晃肩等特點(diǎn),你是不是可以遠(yuǎn)遠(yuǎn)地認(rèn)出你的朋友。
本人一直做步態(tài)識(shí)別研究,茶余飯后,有時(shí)候跟非同行解釋自己的科研工作。對(duì)方一般立刻會(huì)點(diǎn)頭,“懂了,根據(jù)擺腿風(fēng)格識(shí)別人”。這讓我想起十幾年前跟人科普人臉識(shí)別,也是類似的感覺(jué),“懂了,根據(jù)瞳距、嘴形等特征識(shí)別人”。這樣的理解,也不能說(shuō)是錯(cuò)誤的,但離真正的事實(shí)還有很遠(yuǎn)的距離。
專門研究步態(tài)識(shí)別的專家眼中的技術(shù)原理,如下圖,一團(tuán)亂麻,真的說(shuō)不清楚!所以這幾年興起了一個(gè)新的研究方向“可解釋人工智能”,對(duì)此我持保留態(tài)度。
讓我們從跑題中回來(lái),嘗試解釋一下“步態(tài)識(shí)別”原理。步態(tài)識(shí)別研究起源于2000年前后,是一個(gè)非常新的生物特征識(shí)別技術(shù)。我是在2003年開(kāi)始研究步態(tài)識(shí)別。在那個(gè)步態(tài)識(shí)別的起步階段,很多算法都依照人的直覺(jué)去設(shè)計(jì)。也就是對(duì)人體進(jìn)行建模,如下圖對(duì)四肢和軀干的運(yùn)動(dòng)進(jìn)行建模,然后根據(jù)這些部位的角度變化識(shí)別人的身份[1]。
這類方法很符合人的直覺(jué),但有一個(gè)很大的缺陷:人體精確建模太難了!特別是十幾年前,視頻中人體本來(lái)就較小且模糊,人體建模也只能建一個(gè)大概,用于區(qū)分不同的人十分困難。
后來(lái)的一系列算法都放棄了人體建模方案,直接采用二值人體輪廓(silhouette)。但視頻里有很多幀,每幀一個(gè)輪廓圖,一個(gè)序列至少幾十個(gè)圖像。數(shù)據(jù)維度太高了,傳統(tǒng)的特征提取方法很難對(duì)之進(jìn)行特征提取。2004年有個(gè)方法[2]直接將所有輪廓圖求了個(gè)平均,美其名曰“步態(tài)能量圖”(Gait Energy Image, GEI,如下圖),然后采用一個(gè)L1或L2距離評(píng)價(jià)相似度,這樣就暴虐了幾乎所有其他算法。我依然記得當(dāng)年我的心情“我靠,這樣也可以?”這讓推導(dǎo)了好幾頁(yè)數(shù)學(xué)公式,各種矩陣輪番變換的方法情何以堪?
簡(jiǎn)單的方法中必有天地!我用了幾年的時(shí)間才慢慢理解了這里面的“簡(jiǎn)單之美”。GEI方法解決了兩個(gè)問(wèn)題:人體輪廓質(zhì)量劣和時(shí)序?qū)R的問(wèn)題。因?yàn)楦鞣N因素,人體輪廓中很多圖像都是“缺胳膊少腿”。但GEI把很多幀一平均,缺陷被稀釋。再者,兩個(gè)序列,如果一個(gè)是以并腿狀態(tài)為第一幀,一個(gè)以叉開(kāi)腿狀態(tài)為第一幀,即使這兩個(gè)序列來(lái)自同一個(gè)人,在計(jì)算機(jī)看來(lái),這兩個(gè)數(shù)據(jù)差異很大。這就是模式識(shí)別中典型的類內(nèi)差異大過(guò)類間差異的問(wèn)題。GEI一平均,不用考慮時(shí)序?qū)R問(wèn)題了,完美避開(kāi)了難點(diǎn)。再者,GEI中的像素的數(shù)值是0-1之間,可以用于表示這個(gè)像素點(diǎn)被人體遮擋的概率,這樣也能夠部分地刻畫(huà)人體運(yùn)動(dòng)模式。鑒于這些優(yōu)勢(shì),這種簡(jiǎn)單的GEI特征,統(tǒng)治了步態(tài)識(shí)別近10年時(shí)間。
作者注:本來(lái)想一篇文章寫(xiě)完,寫(xiě)起來(lái)發(fā)現(xiàn)篇幅會(huì)有點(diǎn)長(zhǎng),今天沒(méi)空繼續(xù)寫(xiě)了,過(guò)幾天有空再寫(xiě)后續(xù)。欲知后事如何,可關(guān)注我的公眾號(hào)。
參考文獻(xiàn)
[1]?Liang Wang, Huazhong Ning, Tieniu Tan, and Weiming Hu. Fusion of static and dynamic body biometrics for gait recognition. IEEE Transactions on Circuits and Systems for Video Technology, 14(2):149–158, Feb. 2004.
[2]?Ju Han and Bir Bhanu. Statistical feature fusion for gait-based human recognition. In Proc. of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pages II842–II847. Washington DC, USA, June 2004.
總結(jié)
以上是生活随笔為你收集整理的深刻揭露步态识别的“谎言”(篇一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: React开发(176):导出所有接口供
- 下一篇: React开发(168):...dva调