过拟合的原因以及解决办法
生活随笔
收集整理的這篇文章主要介紹了
过拟合的原因以及解决办法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、什么是過擬合?
欠擬合是指模型沒有能夠很好的表現數據的結構,而出現的擬合度不高的情況。?
過擬合是指模型過分的擬合訓練樣本,但對測試樣本預測準確率不高的情況,也就是說模型泛化能力很差。如下圖所示:?
?
左邊的結果過度擬合訓練樣本,導致過擬合。
2、過擬合的原因?
(1)數據特征的角度?
數據噪聲導致的過擬合:噪聲具有一定的隨機性與欺騙性,如果把噪聲作為有效信息的話,將會導致過擬合。?
缺乏代表性樣本導致的過擬合:訓練數據集不能很好的反應整體分布可能會導致過擬合;訓練數據集較小,但模型過度細化會導致過擬合。?
(2)模型的角度?
由于模型過度復雜,使得模型對訓練數據擬合較好,但同時擬合了噪聲或者與目標不相關的信息導致了過擬合。?
3、過擬合、欠擬合的解決方法?
過擬合的可能解決方法:?
a、減少特征:刪除與目標不相關特征,如一些特征選擇方法?
b、正則化:正則化會保證每個特征有一定的效用,不會使某一特征特別重要。
?c、得到更多的訓練樣本
?d、遷移學習-----可以解決由于訓練數據較小引起的過擬合。
?
欠擬合可能的解決方法:?
a、選擇更復雜的模型?
b、增加新特征,如特征構建
?
?
?
總結
以上是生活随笔為你收集整理的过拟合的原因以及解决办法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Recurrence along Dep
- 下一篇: CAD不支持实时调试