数据嫁接
數(shù)據(jù)嫁接:
?train中的數(shù)據(jù)集得到的新特征,
新特征和兩列或兩列以上的特征相關,挪動到測試集中不可直接復制,需要根據(jù)ID身份(也就是離散特征的取值)來具體操作。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
舉例如下:
%%time #train的card1犯罪率 Fraud_mean = train['isFraud'].groupby([train['card1']]).mean() train['card1_isFraud']=train.groupby(['card1'])['isFraud'].transform('mean') #test1的card1犯罪率 test['card1_isFraud'] = 0 # print("test['card1'].iloc[x]=",means())for x in range(len(test.index)):#xrange使用的是生成器try:test['card1_isFraud'].iloc[x]=Fraud_mean[int(test['card1'].iloc[x])]#數(shù)據(jù)嫁接except Exception as e:pass?
總結
- 上一篇: fill value must be i
- 下一篇: 根据一列生成其他列