Dummy variable (变量dummy化)
生活随笔
收集整理的這篇文章主要介紹了
Dummy variable (变量dummy化)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
BY joey周琦
總是可以從身邊同學口中聽到說到dummy化,dummy lr, 今天自己看了dummy variable的wiki,這里記下筆記總結:
- dummy variable是用0或1表示某個類別是否出現
- 為什么要dummy化
- 若用數字1-12表示1-12月,那么就潛在表示了12月和1月差的很遠,其實離的很近
- 若用離散數字表示一地域,假如用數字1-23表示23個省,那么數字潛在的意思是,相鄰的數字代表的省比較相似,差距的數字表示的省不相似,然而并沒有這個意思。所以用單純用離散的數字表示類別可能會影響后面回歸或分類的精度
- 另外要注意的是,dummy化不要冗余,比如有1-23個省,我們用22個0,1變量就可以表示,若22個變量都是0則表示第23個省。
總結
以上是生活随笔為你收集整理的Dummy variable (变量dummy化)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 活着有什么意义?
- 下一篇: python绘制登陆时的卫星云图(TBB