机器学习笔记 - 什么是UMAP?
1、UMAP概述
??統(tǒng)一流形逼近和投影 (UMAP) 是一種降維技術(shù),可用于類似于 t-SNE 的可視化,但也可用于一般的非線性降維。UMAP 是一種基于流形學習技術(shù)和拓撲數(shù)據(jù)分析思想的降維算法。它為處理流形學習和降維提供了一個非常通用的框架,但也可以提供具體的具體實現(xiàn)。
??該算法基于對數(shù)據(jù)的三個假設(shè):
??數(shù)據(jù)均勻分布在黎曼流形上;
??黎曼度量是局部常數(shù)(或可以近似);
??歧管是本地連接的。
??根據(jù)這些假設(shè),可以用模糊拓撲結(jié)構(gòu)對流形進行建模。通過搜索具有最接近的等效模糊拓撲結(jié)構(gòu)的數(shù)據(jù)的低維投影來找到嵌入。
??UMAP與 t-SNE 相比,它提供了許多優(yōu)勢,最顯著的是提高了速度并更好地保存了數(shù)據(jù)的全局結(jié)構(gòu)。
??UMAP 的核心與 t-SNE 非常相似——兩者都使用圖形布局算法在低維空間中排列數(shù)據(jù)。在最簡單的意義上,UMAP 構(gòu)建數(shù)據(jù)的高維圖表示,然后優(yōu)化低維圖以使其在結(jié)構(gòu)上盡可能相似。雖然 UMAP 用于構(gòu)建高維圖的數(shù)學是先進的,但它們背后的直覺卻非常簡單。
??為了構(gòu)建初始的高維圖,UMAP 構(gòu)建了一個叫做“模糊單純復形”的東西。這實際上只是加權(quán)圖的表示,邊權(quán)重表示兩個點連接的可能性。為了確定連通性,UMAP 從每個點向外擴展一個半徑,當這些半徑重疊時連接點。選擇這個半徑很關(guān)鍵——選擇太小會導致小而孤立的集群,而選擇太大會將所有東西連接在一起。UMAP 通過根據(jù)到每個點n的距離在本地選擇半徑來克服這一挑戰(zhàn)th 最近的鄰居。UMAP 然后通過隨著半徑的增長降低連接的可能性來使圖形“模糊”。最后,通過規(guī)定每個點必須至少連接到其最近的鄰居,UMAP 確保局部結(jié)構(gòu)與全局結(jié)構(gòu)保持平衡。
2、UMAP安裝
??UMAP
總結(jié)
以上是生活随笔為你收集整理的机器学习笔记 - 什么是UMAP?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jmu-python-函数-找钱
- 下一篇: 解决笔记本,如微星GS65偶尔卡顿,黑屏