5.7 随机采样最小二乘法
生活随笔
收集整理的這篇文章主要介紹了
5.7 随机采样最小二乘法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
5.7 隨機采樣最小二乘法
如果萬一出現差錯,又難以檢測出,則強影響點影響很大,此時可以采用一種隨機方法,盡量避免差錯帶來的影響。
隨機最小二乘法不采用所有測量數據,而是隨機抽取部分測量數據,根據這些部分測量數據進行最小二乘。如果沒有抽取到強影響點,則由抽取到的部分測量數據進行最小二乘法能獲得滿意的結果,所以隨機最小二乘法關鍵是怎么保證沒有抽取到強影響點。由于隨機抽取到強影響點的概率與強影響點所占比例成正比,故強影響點越少,抽取到的可能性越低。具體做法如下:
為了避免實際抽取到了強影響點,但由于巧合,第 222 步卻沒有發現強影響點,導致擬合徹底失敗,可以多次運行上面流程,得到多個模型,選取最好的模型。
該方法最大優點是能適用于強影響點比例很大的場景,比如強影響點比例達 60%60\%60% ,缺點是運行時間不定,效果不定,有一定運氣成分。需要設定幾個閾值,比如第一步的比例 ppp ,第二步的判斷強影響點的殘差設定,第三步的預測殘差與殘差大小相當的設定,最后判斷最好模型的設定,總的來說,最終結果對這些閾值不是很敏感,閾值能在較大范圍內變動,而不影響最終結果。該方法和 RANSACRANSACRANSAC 隨機采樣一致性算法十分類似。
總結
以上是生活随笔為你收集整理的5.7 随机采样最小二乘法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 5.6 稳健最小二乘法
- 下一篇: 5.8 正则化和数据标准化