Scikit-learn 数据预处理之标准化StandardScaler
生活随笔
收集整理的這篇文章主要介紹了
Scikit-learn 数据预处理之标准化StandardScaler
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
? ? ? ? ? ? ? ? Scikit-learn 數(shù)據(jù)預(yù)處理之標(biāo)準(zhǔn)化StandardScaler
1 聲明
本文的數(shù)據(jù)來(lái)自網(wǎng)絡(luò),部分代碼也有所參照,這里做了注釋和延伸,旨在技術(shù)交流,如有冒犯之處請(qǐng)聯(lián)系博主及時(shí)處理。
2 StandardScaler簡(jiǎn)介
StandardScaler當(dāng)數(shù)據(jù)(x)按均值(μ)中心化后,再按標(biāo)準(zhǔn)差(σ)縮放,數(shù)據(jù)就會(huì)服從為均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布,該過(guò)程叫數(shù)據(jù)標(biāo)準(zhǔn)化(Standardization,又稱(chēng)Z-score normalization)。
應(yīng)用場(chǎng)景:在分類(lèi)、聚類(lèi)、通過(guò)距離計(jì)算相似性時(shí)、使用PCA技術(shù)進(jìn)行降維時(shí)。
3 StandardScaler
計(jì)算方法:
import pandas as pd from sklearn.preprocessing import StandardScaler data = pd.DataFrame({'a':[1,2,3],'b':[5,6,6],'c':[9,100,2]} )#標(biāo)準(zhǔn)化(StandardScaler),對(duì)列進(jìn)行特征轉(zhuǎn)換。 scale_x = StandardScaler() scale_data = scale_x.fit_transform(data) print(scale_data) print("均值:",round(scale_data.mean())) print("標(biāo)準(zhǔn)差:",round(scale_data.std()))注:數(shù)據(jù)的矩陣形式如下:
計(jì)算過(guò)程示例版:
多種標(biāo)準(zhǔn)化的對(duì)比(圖片來(lái)自網(wǎng)絡(luò))
總結(jié)
以上是生活随笔為你收集整理的Scikit-learn 数据预处理之标准化StandardScaler的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 聊天开场白话术900句(怎样聊天才能让人
- 下一篇: 自制果酱太酸可以加盐吗?