sklearn中的fit_transform和transform以及什么时候使用
生活随笔
收集整理的這篇文章主要介紹了
sklearn中的fit_transform和transform以及什么时候使用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在使用sklearn對數據進行預處理的時候很有可能會遇到fit_transform和transform,網上不少資料寫的模棱兩可,在這里我回答幾個核心問題,也許看完我寫的這篇文章,一些疑惑就會豁然開朗。
為什么在訓練集進行fit而不在測試集fit
機器學習假設,訓練集和測試集的每個樣本都是從同一分布中抽樣得到的。所以在訓練集中fit之后在測試集就不能再fit了。要不然二者可能不是同一分布模型,預測效果會很糟糕。
fit_transform那么fit到底fit什么
可以說不同的sklearn方法fit的東西都是不一樣的,對于LabelBinar而言,因為fit階段沒有fit東西,所以訓練集和測試集都可以寫成fit_transform(我仍然建議不要這樣寫,統一格式,訓練集fit在測試集transform會更好),而對于StandardScalar而言,fit的是均值和方差。所以一定要在訓練集寫成fit_transform,在測試集寫成transform
總結
以上是生活随笔為你收集整理的sklearn中的fit_transform和transform以及什么时候使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何正确使用迁移学习
- 下一篇: Python剑指offer:分行从上到下