sklearn 主成分分析法 PCA和IPCA
主成分分析法 (PCA) 是一種常用的數(shù)據(jù)分析手段。對(duì)于一組不同維度 之間可能存在線性相關(guān)關(guān)系的數(shù)據(jù),PCA 能夠把這組數(shù)據(jù)通過(guò)正交變換變 成各個(gè)維度之間線性無(wú)關(guān)的數(shù)據(jù)。經(jīng)過(guò) PCA 處理的數(shù)據(jù)中的各個(gè)樣本之間 的關(guān)系往往更直觀,所以它是一種非常常用的數(shù)據(jù)分析和預(yù)處理工具。PCA處理之后的數(shù)據(jù)各個(gè)維度之間是線性無(wú)關(guān)的,通過(guò)剔除方差較小的那些維度上的數(shù)據(jù)我們可以達(dá)到數(shù)據(jù)降維的目的。
將原 先的n個(gè)特征用數(shù)目更少的m個(gè)特征取代,新特征是舊特征的線性組合,這些線性組合最大化樣本 方差,從而保留樣本盡可能多的信息,并且m個(gè)特征互不相關(guān)。
用幾何觀點(diǎn)來(lái)看,PCA主成分分析方法可以看成通過(guò)正交變換,對(duì)坐標(biāo)系進(jìn)行旋轉(zhuǎn)和平移,并保留 樣本點(diǎn)投影坐標(biāo)方差最大的前幾個(gè)新的坐標(biāo)。
通過(guò)PCA主成分分析,可以幫助去除樣本中的噪聲信息,便于進(jìn)一步做回歸分析。
import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import datasets from sklearn.</總結(jié)
以上是生活随笔為你收集整理的sklearn 主成分分析法 PCA和IPCA的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 神州k610di7d2怎么进bios 神
- 下一篇: 键盘和u盘坏了怎么办啊 键盘、U盘损坏,