5.4 加权最小二乘法
5.4 加權最小二乘法
最小二乘法是使 ∑i(bi?ariTx)2\sum_i (b_i-\mathbf{a}^T_{ri}\mathbf{x})^2∑i?(bi??ariT?x)2 最小,這表明每次測量的重要性一樣,但實際中有時存在某些測量更重要,某些更不重要。以第一個例子為例說明,假設測量直徑,用了兩個精度不同的設備各測一次,分別為 dh,dld_h,d_ldh?,dl? ,設備的測量精度即方差分別為 σh2,σl2\sigma^2_h,\sigma^2_lσh2?,σl2? ,設備精度越高方差越小。如何綜合這兩個測量結果來獲得比僅用高精度設備更好的結果?如果設備精度相同,則結果為 D=(dh+dl)/2D=(d_h+d_l)/2D=(dh?+dl?)/2 ,即這兩個測量權重相同。如果精度不同,則顯然精度高的權重要大,權重要與精度成正比,所以測量結果應該為 D=σl2σh2+σl2dh+σh2σh2+σl2dlD= \frac {\sigma^2_l} {\sigma^2_h+\sigma^2_l}d_h + \frac {\sigma^2_h} {\sigma^2_h+\sigma^2_l}d_lD=σh2?+σl2?σl2??dh?+σh2?+σl2?σh2??dl? ,該估計值方差為 σ2(D)=(σl2σh2+σl2)2σh2+(σh2σh2+σl2)2σl2=σh2σl2σh2+σl2\sigma^2(D)=(\frac {\sigma^2_l} {\sigma^2_h+\sigma^2_l})^2\sigma^2_h + (\frac {\sigma^2_h} {\sigma^2_h+\sigma^2_l})^2\sigma^2_l=\frac {\sigma^2_h\sigma^2_l}{\sigma^2_h+\sigma^2_l}σ2(D)=(σh2?+σl2?σl2??)2σh2?+(σh2?+σl2?σh2??)2σl2?=σh2?+σl2?σh2?σl2?? ,此值小于 σh2\sigma^2_hσh2? ,這說明估計值的精度高于 dhd_hdh? 。
假設每次測量精度不同,方差為 σi2\sigma^2_iσi2? ,則此時應該使 ∑i1σi2(bi?ariTx)2\sum_i \frac {1}{\sigma^2_i} (b_i-\mathbf{a}^T_{ri}\mathbf{x})^2∑i?σi2?1?(bi??ariT?x)2 最小,即精度高的測量權重要大。根據前面結果知 ∑i(bi?ariTx)2=(b?Ax)T(b?Ax)\sum_i (b_i-\mathbf{a}^T_{ri}\mathbf{x})^2=(\mathbf{b}-Ax)^T(\mathbf{b}-A\mathbf{x})∑i?(bi??ariT?x)2=(b?Ax)T(b?Ax) 即向量 b?Ax\mathbf{b}-A\mathbf{x}b?Ax 的內積,也就是向量 b\mathbf{b}b 到子空間 colAcol AcolA 的距離平方。現在要求加權距離平方的最小值,加權距離平方可以通過矩陣獲得!令對角陣為:D=diag(1σ12,1σ22,?,1σn2)D =diag(\frac{1}{\sigma^2_1},\frac{1}{\sigma^2_2},\cdots,\frac{1}{\sigma^2_n})D=diag(σ12?1?,σ22?1?,?,σn2?1?) ,F=diag(1σ1,1σ2,?,1σn)F =diag(\frac{1}{\sigma_1},\frac{1}{\sigma_2},\cdots,\frac{1}{\sigma_n})F=diag(σ1?1?,σ2?1?,?,σn?1?) ,則 D=FTFD=F^TFD=FTF
∑i1σi2(bi?ariTx)2=(b?Ax)TD(b?Ax)=(b?Ax)TFTF(b?Ax)=(Fb?(FA)x)T(Fb?(FA)x)\sum_i \frac {1}{\sigma^2_i} (b_i-\mathbf{a}^T_{ri}\mathbf{x})^2=\\ (\mathbf{b}-A\mathbf{x})^TD(\mathbf{b}-A\mathbf{x})=\\ (\mathbf{b}-A\mathbf{x})^TF^TF(\mathbf{b}-A\mathbf{x})=\\ (F\mathbf{b}-(FA)\mathbf{x})^T(F\mathbf{b}-(FA)\mathbf{x}) i∑?σi2?1?(bi??ariT?x)2=(b?Ax)TD(b?Ax)=(b?Ax)TFTF(b?Ax)=(Fb?(FA)x)T(Fb?(FA)x)
令 b′=Fb\mathbf{b'}=F\mathbf{b}b′=Fb , A′=FAA'=FAA′=FA ,則上式為 (b′?A′x)T(b′?A′x)(\mathbf{b'}-A'\mathbf{x})^T(\mathbf{b'}-A'\mathbf{x})(b′?A′x)T(b′?A′x) ,要最小,則近似解為
x^=(A′TA′)?1A′Tb′=((FA)TFA)?1(FA)TFb=(ATFTFA)?1ATFTFb=(ATDA)?1ATDb\mathbf{\hat{x}} = (A'^TA')^{-1}A'^T\mathbf{b'}=\\ ((FA)^TFA)^{-1}(FA)^TF\mathbf{b}=\\ (A^TF^TFA)^{-1}A^TF^TF\mathbf{b}=\\ (A^TDA)^{-1}A^TD\mathbf{b} x^=(A′TA′)?1A′Tb′=((FA)TFA)?1(FA)TFb=(ATFTFA)?1ATFTFb=(ATDA)?1ATDb
這就是加權最小二乘法的解!
我們還可以進行推廣,上式是 (b?Ax)TD(b?Ax)(\mathbf{b}-A\mathbf{x})^TD(\mathbf{b}-A\mathbf{x})(b?Ax)TD(b?Ax) 最小解,其中 DDD 是對角陣,其實對稱陣 SSS 也可以。只要對稱陣滿足對任意非零向量 x\mathbf{x}x ,有 xTSx>0\mathbf{x}^TS\mathbf{x} > 0xTSx>0 成立,xTSx\mathbf{x}^TS\mathbf{x}xTSx 稱為廣義距離,即保證廣義距離非負,此時對稱陣 SSS 稱為正定矩陣。
定義 正定矩陣 對稱陣 SSS 對應的廣義距離 xTSx\mathbf{x}^TS\mathbf{x}xTSx 非負,稱對稱陣為正定矩陣。
根據對稱陣的 LDLDLD 分解,有 S=LDLT=LFFTLT=LF(LF)TS=LDL^T=LFF^TL^T=LF(LF)^TS=LDLT=LFFTLT=LF(LF)T ,令 F′=(LF)TF' = (LF)^TF′=(LF)T ,則 S=F′TF′S=F'^TF'S=F′TF′ ,與對角陣 D=FTFD=F^TFD=FTF 分解一致,所以最優解為 x^=(ATSA)?1ATSb\mathbf{\hat{x}} = (A^TSA)^{-1}A^TS\mathbf{b}x^=(ATSA)?1ATSb
如何確定對角陣或對稱陣元素的值,這是一個困難的問題。有時可以根據先驗知識來人為指定對角陣元素值,比如根據測量精度。但指定對稱陣元素的值十分困難,在機器學習中,這稱為度量學習。
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的5.4 加权最小二乘法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 5.3 递归最小二乘法
- 下一篇: 5.5 强影响点