excel数据输入模型前的转换
生活随笔
收集整理的這篇文章主要介紹了
excel数据输入模型前的转换
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對于excel的數據輸入神經網絡前要進行數據類型轉換,不然好像會有問題,如果能直接輸入請指教。下面講講對excel數據的轉換。
首先對原始數據進行解釋一下:下圖是部分訓練數據,前20列是特征,第21列是標簽,總共6000個數據:
讀取文件:
劃分數據集和訓練集:
## 導入數據劃分函數 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(train, train_data['Quality_label'])數據的標簽處理:
# 數據的標簽處理 from sklearn.preprocessing import LabelEncoder lb = LabelEncoder() train_data["Quality_label"] = lb.fit_transform(train_data["Quality_label"])之后的標簽類型是數值型:
在轉換成獨熱編碼,以訓練集為例,測試集同理:
import numpy as npy_train_list = np.zeros((len(y_train), 4))y_train_list[y_train==0,0]=1y_train_list[y_train==1,1]=1y_train_list[y_train==2,2]=1y_train_list[y_train==3,3]=1 print(y_train_list)輸出其實是個二維數組:
特征的處理
將特征轉化為二維數組:
輸出為:
這樣轉換后就可以直接輸入模型了。
總結
以上是生活随笔為你收集整理的excel数据输入模型前的转换的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 处理Matlab Coder之后, Co
- 下一篇: 一天1个机器学习知识点(二)