當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

交叉验证 cross validation 与 K-fold Cross Validation K折叠验证

發(fā)布時間：2023/11/30 编程问答 53 豆豆

生活随笔收集整理的這篇文章主要介紹了交叉验证 cross validation 与 K-fold Cross Validation K折叠验证小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

交叉驗證，cross validation是機器學(xué)習(xí)中非常常見的驗證模型魯棒性的方法。其最主要原理是將數(shù)據(jù)集的一部分分離出來作為驗證集，剩余的用于模型的訓(xùn)練，稱為訓(xùn)練集。模型通過訓(xùn)練集來最優(yōu)化其內(nèi)部參數(shù)權(quán)重，再在驗證集上檢驗其表現(xiàn)。

比較常見的交叉驗證方法K折疊交叉驗證,(K-fold Cross Validation)如下圖所示，我們將數(shù)據(jù)分為K個部分，其中K-1個部分作為訓(xùn)練集，剩余的作為驗證集。每個epoch循環(huán)，都選取不一樣的一個部分作為驗證集。

在使用K折疊或者別的交叉驗證的方法時，我們需要注意的是，在很多問題中，類與類在數(shù)據(jù)集中的分布不一定是均勻的。因此，我們往往需要在折疊的過程中使得每個fold都有著相同或至少近似的類的分布。

例如在下列性別二分類問題中，原始數(shù)據(jù)中女性與男性的樣本數(shù)量如下。那么我們在劃分K折疊的時候，也要將這個分布情況在每個折疊上還原，即保證在每個折疊上女性與男性的樣本數(shù)量的比例與整體數(shù)據(jù)的比例是一致的。如果沒有滿足這個條件，在上述例子中，很可能出現(xiàn)訓(xùn)練時模型過多得受到了了男性樣本得影響，而導(dǎo)致其在女性樣本為主的驗證集上表現(xiàn)很差。因此，保證K折疊每一個部分的類分布是均勻的，也能在一定程度上提升訓(xùn)練后模型的魯棒性。

總結(jié)

以上是生活随笔為你收集整理的交叉验证 cross validation 与 K-fold Cross Validation K折叠验证的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： unity如何让canvas总是显示在所
下一篇： softmax函数与交叉熵损失函数