當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

非监督HMP算法的物体识别

發布時間：2025/4/16 编程问答 25 豆豆

生活随笔收集整理的這篇文章主要介紹了非监督HMP算法的物体识别小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文Unsupervised Feature Learing for RGB-D Based Object Recognition

應該算是花了比較長時間來看的一篇論文，理解起來也相較容易，而且最近看的論文大都也是使用的K-SVD算法進行編碼，得到的效果十分不錯。

使用HMP對RGB-D圖像進行圖像識別，特點無監督學習特征，使用HMP（hierarchical matching pursuit）進行特征表示 HMP使用稀疏編碼，直接從RGB-D數據中進行無監督學習分層特征表示學習過程中采用K-SVD算法對特征進行編碼，并且特征采用分層的方式，使用正交匹配跟蹤（orthogonal matching pursuit）以及空間金字塔池化進行學習。使用核描述符學習patch級特征，對照人工設計的像素描述符，如梯度等進行設計實現。隨后使用K-SVD算法對特征使用空間編碼對學到的特征進行表示，使用基于特征學習的K-SVD對RGB-D圖像進行表示。非監督特征學習 -首先使用K-SVD進行字典學習，例，對于一塊5*5像素的RGB-D patch而言，字典所包括的向量大小為5*5*8，其中8的大小是由灰度強度，RGB，深度以及表面法向量值決定的。 -使用正交匹配追蹤計算空間編碼矩陣，在上一步中實現了dict，下面對每一個xn（對應字典矩陣中的每一列）都使用OMP進行迭代計算，在每步迭代過程中，OMP選擇codeword dm，使得能夠最佳匹配當前剩余的，也就是說在選擇當前codeword后，重建后錯誤仍能夠保持。 -使用單值分解（Singular Value Decomposition，SVD）更新字典，在第m步中，第m個codeword以及它的空間編碼能夠通過對剩余的這個codeword的相關矩陣使用SVD計算實現。在分層匹配追蹤中，使用K-SVD學習字典，第一層提取patches，第二層是對第一層空間編碼的池化。第一層學習的特征有灰度，RGB，深度以及深度圖像的表面法向量。一旦完成通過K-SVD學習的字典，稀疏編碼就可以用于計算新的圖像。
-分層匹配追蹤（HMP），通過學習到的字典D，分層匹配追蹤建立了一個特征層級，通過遞歸使用正交匹配追蹤編碼器實現。編碼器由三個模塊組成，包括batch 正交匹配追蹤，金字塔最大池化，以及對比度歸一化。在分層匹配追蹤過程中，在第一層，稀疏編碼在每個像素上都進行計算，隨后進行空間金字塔最大池化以進入特征向量，表示一個16*16的patch；第二層使用從采樣patch級別的特征向量字典對這些特征向量進行編碼。整幅圖片的特征使用第一層和第二層的稀疏編碼進行表示。稀疏編碼計算每個像素點--->使用空間金字塔最大池化變為特征向量A--->進入第二層，使用patch級的特征向量字典對這些特征向量再進行編碼B 最終圖片的特征就由特征向量A和特征向量B共同表示

《新程序員》：云原生和全面數字化實踐50位技術專家共同創作，文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的非监督HMP算法的物体识别的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 3D CNN框架结构各层计算
下一篇： Tensorflow编程遇到的问题汇总【