【小代码讲解】独热编码(One-Hot编码)
生活随笔
收集整理的這篇文章主要介紹了
【小代码讲解】独热编码(One-Hot编码)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
獨熱編碼(One-Hot編碼)
- 獨熱編碼介紹
- 獨熱編碼表示
- 獨熱編碼實現
- 使用sklearn
- 不使用sklearn
獨熱編碼介紹
- 在機器學習中,標簽的處理總是需要進行獨熱編碼的處理,因為獨熱編碼有以下優點:
1、能夠處理非連續型數值特征。
2、在一定程度上也擴充了特征。 - 詳細了解請看以下博文連接: 獨熱編碼優缺點、 獨熱編碼介紹
獨熱編碼表示
- 簡單地說:獨熱編碼就是利用一堆0和1表示一些標簽值(就是以下這張圖片表示的)
獨熱編碼實現
使用sklearn
from sklearn.preprocessing import OneHotEncoderdata = np.array([1,2,3,2,1,0]) # 將標簽轉換為獨熱編碼 encoder = OneHotEncoder() data = encoder.fit_transform(data.reshape(data.shape[0], 1)) data = data.toarray().T data = data.astype('uint8') print(data)不使用sklearn
其中使用到了:
numpy.eye()
reshape(-1)
還有其他博主的實現方式
總結
以上是生活随笔為你收集整理的【小代码讲解】独热编码(One-Hot编码)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【论文知识点笔记】GNN流程到GCN流程
- 下一篇: 【小实验讲解】贝叶斯拼写检查器