非监督HMP算法的物体识别
生活随笔
收集整理的這篇文章主要介紹了
非监督HMP算法的物体识别
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
原文Unsupervised Feature Learing for RGB-D Based Object Recognition
應該算是花了比較長時間來看的一篇論文,理解起來也相較容易,而且最近看的論文大都也是使用的K-SVD算法進行編碼,得到的效果十分不錯。
使用HMP對RGB-D圖像進行圖像識別,特點無監督學習特征,使用HMP(hierarchical matching pursuit)進行特征表示 HMP使用稀疏編碼,直接從RGB-D數據中進行無監督學習分層特征表示 學習過程中采用K-SVD算法對特征進行編碼,并且特征采用分層的方式,使用正交匹配跟蹤(orthogonal matching pursuit)以及空間金字塔池化進行學習。 使用核描述符學習patch級特征,對照人工設計的像素描述符,如梯度等進行設計實現。隨后使用K-SVD算法對特征 使用空間編碼對學到的特征進行表示,使用基于特征學習的K-SVD對RGB-D圖像進行表示。 非監督特征學習 -首先使用K-SVD進行字典學習,例,對于一塊5*5像素的RGB-D patch而言,字典所包括的向量大小為5*5*8,其中8的大小是由灰度強度,RGB,深度以及表面法向量值決定的。 -使用正交匹配追蹤計算空間編碼矩陣,在上一步中實現了dict,下面對每一個xn(對應字典矩陣中的每一列)都使用OMP進行迭代計算,在每步迭代過程中,OMP選擇codeword dm,使得能夠最佳匹配當前剩余的,也就是說在選擇當前codeword后,重建后錯誤仍能夠保持。 -使用單值分解(Singular Value Decomposition,SVD)更新字典,在第m步中,第m個codeword以及它的空間編碼能夠通過對剩余的這個codeword的相關矩陣使用SVD計算實現。 在分層匹配追蹤中,使用K-SVD學習字典,第一層提取patches,第二層是對第一層空間編碼的池化。第一層學習的特征有灰度,RGB,深度以及深度圖像的表面法向量。一旦完成通過K-SVD學習的字典,稀疏編碼就可以用于計算新的圖像。-分層匹配追蹤(HMP),通過學習到的字典D,分層匹配追蹤建立了一個特征層級,通過遞歸使用正交匹配追蹤編碼器實現。編碼器由三個模塊組成,包括batch 正交匹配追蹤,金字塔最大池化,以及對比度歸一化。 在分層匹配追蹤過程中,在第一層,稀疏編碼在每個像素上都進行計算,隨后進行空間金字塔最大池化以進入特征向量,表示一個16*16的patch;第二層使用從采樣patch級別的特征向量字典對這些特征向量進行編碼。整幅圖片的特征使用第一層和第二層的稀疏編碼進行表示。 稀疏編碼計算每個像素點--->使用空間金字塔最大池化變為特征向量A--->進入第二層,使用patch級的特征向量字典對這些特征向量再進行編碼B 最終圖片的特征就由特征向量A和特征向量B共同表示
總結
以上是生活随笔為你收集整理的非监督HMP算法的物体识别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 3D CNN框架结构各层计算
- 下一篇: Tensorflow编程遇到的问题汇总【