机器学习中关于偏差、方差和误差的理解
在模型預(yù)測中,模型可能出現(xiàn)的誤差來自兩個主要來源:
??1、因模型無法表示基本數(shù)據(jù)的復(fù)雜度而造成的偏差(bias);
??2、因模型對訓(xùn)練它所用的有限數(shù)據(jù)過度敏感而造成的方差(variance)。
??誤差是測量值與真實值之間的差值。用誤差衡量測量結(jié)果的準(zhǔn)確度,用偏差衡量測試結(jié)果的精確度;誤差是以真實值為標(biāo)準(zhǔn),偏差是以多次測量結(jié)果的平均值為標(biāo)準(zhǔn)。
??而方差在統(tǒng)計學(xué)中是指各個數(shù)據(jù)與其平均數(shù)之差的平方的和的平均數(shù),它表示的是一種偏離程度:當(dāng)數(shù)據(jù)分布比較分散時,方差就較大;因此方差越大,數(shù)據(jù)的波動越大;方差越小,數(shù)據(jù)的波動就越小。
??從上面定義可以看出,偏差可以衡量我們所建立模型的精確度,精確度越高,我們用模型計算出的值與實際值越接近;而方差表示的是一種偏離程度,在一定程度上可以表示我們的模型對于任何給定的測試樣本會出現(xiàn)多大的變化。
??下面以一個圖片為例進(jìn)一步說明。
??這張圖比較形象地展現(xiàn)了偏差和方差的區(qū)別:偏差越小,箭的位置總體離靶心較近,說明射手的水平較高;方差越小的話,箭射的位置大體在一小塊區(qū)域,說明射手發(fā)揮的很穩(wěn)定,但不一定代表他射的很好。
偏差造成的誤差:
??如果模型具有足夠的數(shù)據(jù),但因不夠復(fù)雜而無法捕捉基本關(guān)系,則會出現(xiàn)偏差。這樣一來,模型一直會系統(tǒng)地錯誤表示數(shù)據(jù),從而導(dǎo)致準(zhǔn)確率降低。這種現(xiàn)象叫做欠擬合(underfitting)。
方差造成的誤差:
??出現(xiàn)方差是正常的,但方差過高表明模型無法將其預(yù)測結(jié)果泛化到更多的數(shù)據(jù)。對訓(xùn)練集高度敏感也稱為過擬合(overfitting),而且通常出現(xiàn)在模型過于復(fù)雜或我們沒有足夠的數(shù)據(jù)支持它時。
總結(jié)
以上是生活随笔為你收集整理的机器学习中关于偏差、方差和误差的理解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 通过Buildroot自制根文件系统
- 下一篇: 各种门禁系统接线详细图解(含中控)