Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记
生活随笔
收集整理的這篇文章主要介紹了
Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Titanic: Machine Learning from Disaster
機(jī)器學(xué)習(xí)系列(3)_邏輯回歸應(yīng)用之Kaggle泰坦尼克之災(zāi)
? ? ? ? 1.如果缺值的樣本占總數(shù)比例極高,可能就直接舍棄了,作為特征加入的話,可能反倒帶入noise,影響最后的結(jié)果了;
? ? ? ? 2.如果缺值的樣本適中,而該屬性非連續(xù)值特征屬性(比如說類目屬性),那就把NaN作為一個(gè)新類別,加到類別特征中;
? ? ? ? 3.如果缺值的樣本適中,而該屬性為連續(xù)值特征屬性,有時(shí)候會(huì)考慮給定一個(gè)step(比如這里的age,可以考慮每隔2/3歲為一個(gè)步長(zhǎng)),然后把它離散化,之后把NaN作為一個(gè)type加到屬性類目中;
? ? ? ? 4.有些情況下,缺失的值個(gè)數(shù)并不是特別多,那也可以試著根據(jù)已有的值,擬合一下數(shù)據(jù),補(bǔ)充上。
?
總結(jié)
以上是生活随笔為你收集整理的Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HHT变换基本理论-学习笔记
- 下一篇: Win10常见蓝屏BSoD有哪些 win