数据 正则化 python_python3.6怎么单独正则化/标准化DataFrame中的指定列数据
問 題
問題:
讀入一個excel表后,想要正則化(標準化)其中的某一列數據,還試過單獨正則化后,再把兩個DataFrame拼接的,用過insert和cancat,append這些,但是因為索引對不上號,不能直接拼到后面,順序會改變,出現很多NAN
代碼:
zscore = lambda x: (x-x.mean())/x.std()
transformerd = selectPE.groupby('流通市值').transform(zscore)
rr1_normalized = preprocessing.normalize(selectPE['利潤同比%%']).T
rr2_normalized = pd.DataFrame(rr1_normalized)
selectPE.insert(5, 'norm利潤同比%%', rr2_normalized)
單獨正則化得到一列后,不會連接到一起,要是能在DataFrame中直接正則化那一列多好啊,下面是正則化后的利潤同比那一列
rr2_normalized
解決方案
不知道你說的單獨正則化是什么意思,我猜你是想對某列進行處理
import pandas as pd
data = [
[1, 2, 3],
[5, 4, 1],
[3, 3, 2]
]
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
df['D'] = df.apply(lambda x: x.mean(), axis=1)
print df
掃一掃關注IT屋
微信公眾號搜索 “ IT屋 ” ,選擇關注與百萬開發者在一起
總結
以上是生活随笔為你收集整理的数据 正则化 python_python3.6怎么单独正则化/标准化DataFrame中的指定列数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: strcpy用于调用的参数太少_C和汇编
- 下一篇: 2020洪灾地图_卫星地图看洪灾:为何湖