本题中的变量(不包括变量ID)进行z-score标准化
生活随笔
收集整理的這篇文章主要介紹了
本题中的变量(不包括变量ID)进行z-score标准化
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
題目描述
數據標準化是將數據按比例縮放到一個特定區間,其主要包括數據同趨化處理和無量綱化處理兩個方面。數據標準化的方法有很多種,常用的有最小-最大標準化和z-score標準化。
請用戶對本題中的變量(不包括變量ID)進行z-score標準化,標準化公式如下:
Xi′=Xi?μδ
其中:
μ=∑Ni=1XiN
δ=∑Ni=1(Xi?μ)2N?1?????????√
N
=樣本數class Solution(MLWorker):def standardScale(self, dataframe_x):import numpy as np###去除ID列###dataframe_x_new = dataframe_x.drop(['ID'], axis=1)###z-score 標準化 ###def standard_scale(col):return (col - col.mean()) / col.std()dataframe_x_new = dataframe_x_new.apply(standard_scale, axis=0)dataframe_x_new = np.round(dataframe_x_new, 3)###添加ID列###dataframe_x_new['ID'] = dataframe_x['ID']return dataframe_x_new
總結
以上是生活随笔為你收集整理的本题中的变量(不包括变量ID)进行z-score标准化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Gensim Word2vec 使用教程
- 下一篇: 使用imbalanced-learn处理