数学建模学习笔记(四)——拟合算法
文章目錄
- 擬合算法簡介
- 一個線性規(guī)劃的例子
- 最小二乘法
- 求解最小二乘法
- 擬合檢驗
- 總結(jié)
擬合算法簡介
一個線性規(guī)劃的例子
顯然,由圖中的數(shù)據(jù)可以得到,可以設(shè)置該擬合曲線為 y=kx+by = kx + by=kx+b,要估計 kkk 和 bbb 的值,可以使用高中所學(xué)知識——最小二乘法。
最小二乘法
設(shè)樣本點數(shù)據(jù)為 (xi,yi)(x_i, y_i)(xi?,yi?),i=1,2,?,ni = 1, 2, \cdots, ni=1,2,?,n,那么最小二乘法有如下兩種定義:
其中:ki^,bi^=argk,bmin(∑i=1n∣yi?yi^∣)\hat{k_i}, \hat{b_i} = arg_{k, b} min(\sum_{i=1}^{n}|y_i-\hat{y_i}|)ki?^?,bi?^?=argk,b?min(i=1∑n?∣yi??yi?^?∣)表示表達(dá)式的參數(shù)為kkk和bbb,而 k^\hat{k}k^ 和 b^\hat{b}b^ 能夠使得表達(dá)式取得最小值。
其中:k^,b^=argk,bmin(∑i=1n(yi?yi^)2)\hat{k}, \hat{b} = arg_{k, b}min(\sum_{i = 1}^{n}(y_i - \hat{y_i})^2)k^,b^=argk,b?min(i=1∑n?(yi??yi?^?)2)表達(dá)的意義與第一種定義相同,只是表達(dá)式不同而已。
在平常的應(yīng)用中,我們常常使用第二種定義。原因是第一種定義中含有絕對值,函數(shù)圖像有拐點,不易求導(dǎo)。由此可以引申出以下結(jié)論:
?\bullet? 不用奇數(shù)次原因
使用奇數(shù)次會有負(fù)數(shù)出現(xiàn),那么誤差就會奇偶相抵
?\bullet? 不用偶數(shù)次原因
像4次這樣的次數(shù)太高,結(jié)果易受極端數(shù)據(jù)(比如當(dāng)自變量很大時)的影響。
求解最小二乘法
令L=∑i=1n(yi?kxi?b)2L = \sum_{i = 1}^{n}(y_i - kx_i - b)^2L=∑i=1n?(yi??kxi??b)2,現(xiàn)在要尋找能夠使 LLL 最小的 kkk 和 bbb 的值:{?L?k=?2∑i=1nxi(yi?kxi?b)=0?L?b=?2∑i=1n(yi?kxi?b)=0\left\{ \begin{aligned} & \frac{\partial L}{\partial k} = -2\sum_{i = 1}^{n}x_i(y_i - kx_i - b) = 0 \\ & \frac{\partial L}{\partial b} = -2\sum_{i = 1}^{n}(y_i - kx_i - b) = 0 \end{aligned} \right.??????????????k?L?=?2i=1∑n?xi?(yi??kxi??b)=0?b?L?=?2i=1∑n?(yi??kxi??b)=0? ?{∑i=1nxiyi=k∑i=1nxi2+b∑i=1nxi∑i=1nyi=k∑i=1nxi+bn\Rightarrow \left\{ \begin{aligned} & \sum_{i = 1}^{n}x_iy_i = k\sum_{i = 1}^{n}x_i^2 + b\sum_{i = 1}^{n}x_i \\ & \sum_{i = 1}^{n}y_i = k\sum_{i = 1}^{n}x_i + bn \end{aligned} \right.??????????????i=1∑n?xi?yi?=ki=1∑n?xi2?+bi=1∑n?xi?i=1∑n?yi?=ki=1∑n?xi?+bn? ?{n∑i=1nxiyi=kn∑i=1nxi2+bn∑i=1nxI∑i=1nyi∑i=1nxi=k∑i=1nxi∑i=1nxi+bn∑i=1nxi\Rightarrow \left\{ \begin{aligned} & n\sum_{i = 1}^{n}x_iy_i = kn\sum_{i = 1}^{n}x_i^2 + bn\sum_{i = 1}^{n}x_I \\ & \sum_{i = 1}^{n}y_i\sum_{i = 1}^{n}x_i = k\sum_{i = 1}^{n}x_i\sum_{i = 1}^{n}x_i + bn\sum_{i = 1}^{n}x_i \end{aligned} \right.??????????????ni=1∑n?xi?yi?=kni=1∑n?xi2?+bni=1∑n?xI?i=1∑n?yi?i=1∑n?xi?=ki=1∑n?xi?i=1∑n?xi?+bni=1∑n?xi??
因此:n∑i=1nxiyi?∑i=1nyi∑i=1nxi=kn∑i=1nxi2?k∑i=1nxi∑i=1nxin\sum_{i = 1}^{n}x_iy_i - \sum_{i = 1}^{n}y_i\sum_{i = 1}^{n}x_i = kn\sum_{i = 1}^{n}x_i^2 - k\sum_{i = 1}^{n}x_i\sum_{i = 1}^{n}x_ini=1∑n?xi?yi??i=1∑n?yi?i=1∑n?xi?=kni=1∑n?xi2??ki=1∑n?xi?i=1∑n?xi? ?k^=n∑i=1nxiyi?∑i=1nyi∑i=1nxin∑i=1nxi2?∑i=1nxi∑i=1nxi\Rightarrow \hat{k} = \frac{n\sum_{i = 1}^{n}x_iy_i - \sum_{i = 1}^{n}y_i\sum_{i = 1}^{n}x_i}{n\sum_{i = 1}^{n}x_i^2 - \sum_{i = 1}^{n}x_i\sum_{i = 1}^{n}x_i}?k^=n∑i=1n?xi2??∑i=1n?xi?∑i=1n?xi?n∑i=1n?xi?yi??∑i=1n?yi?∑i=1n?xi?? ?b^=∑i=1nxi2∑i=1nyi?∑i=1nxi∑i=1nxiyin∑i=1xxi2?∑i=1nxi∑i=1nxi\Rightarrow \hat{b} = \frac{\sum_{i = 1}^{n}x_i^2\sum_{i = 1}^{n}y_i - \sum_{i = 1}^{n}x_i\sum_{i = 1}^{n}x_iy_i}{n\sum_{i = 1}^{x}x_i^2 - \sum_{i = 1}^{n}x_i\sum_{i = 1}^{n}x_i}?b^=n∑i=1x?xi2??∑i=1n?xi?∑i=1n?xi?∑i=1n?xi2?∑i=1n?yi??∑i=1n?xi?∑i=1n?xi?yi??
擬合檢驗
在函數(shù)時線性函數(shù)(注意:這里的線性函數(shù)是指參數(shù)是線性的,而不是自變量是線性的,例如:y=ax2+by=ax^2 + by=ax2+b同樣也是線性函數(shù))時,可以使用擬合優(yōu)度(可決系數(shù))R2R^2R2 來判斷擬合好壞
?\bullet? 總體平方和 SST=∑i=1n(yi?yˉ)2SST = \sum_{i = 1}^{n}(y_i - \bar{y})^2SST=i=1∑n?(yi??yˉ?)2
?\bullet? 誤差平方和 SSE=∑i=1n(yi?yi^)2SSE = \sum_{i = 1}^{n}(y_i - \hat{y_i})^2SSE=i=1∑n?(yi??yi?^?)2
?\bullet? 回歸平方和 SSR=∑i=1n(yi^?yˉ)2SSR = \sum_{i = 1}^{n}(\hat{y_i} - \bar{y})^2SSR=i=1∑n?(yi?^??yˉ?)2其中,SST=SSE+SSRSST = SSE + SSRSST=SSE+SSR
此時可以定義擬合優(yōu)度 R2=SSRSST=SST?SSESSR=1?SSESSTR^2 = \frac{SSR}{SST} = \frac{SST - SSE}{SSR} = 1 - \frac{SSE}{SST}R2=SSTSSR?=SSRSST?SSE?=1?SSTSSE?,R2R^2R2 越接近于0,說明誤差越小,擬合度越好 。
下面證明 SST=SSE+SSRSST = SSE + SSRSST=SSE+SSR:∑i=1n(yi?yˉ)2=∑i=1n(yi?yi^+yi^?yˉ)2=∑i=1n(yi?yi^)2+∑i=1n(yi^?yˉ)2+2∑i=1n(yi?yi^)(yi^?yˉ)\sum_{i = 1}^{n}(y_i - \bar{y})^2 = \sum_{i = 1}^{n}(y_i - \hat{y_i} + \hat{y_i} - \bar{y})^2 \\= \sum_{i = 1}^{n}(y_i - \hat{y_i})^2 + \sum_{i = 1}^{n}(\hat{y_i} - \bar{y})^2 + 2\sum_{i = 1}^{n}(y_i - \hat{y_i})(\hat{y_i} - \bar{y})i=1∑n?(yi??yˉ?)2=i=1∑n?(yi??yi?^?+yi?^??yˉ?)2=i=1∑n?(yi??yi?^?)2+i=1∑n?(yi?^??yˉ?)2+2i=1∑n?(yi??yi?^?)(yi?^??yˉ?)因此,只需證明:∑i=1n(yi?yi^)(yi^?yˉ)=0\sum_{i = 1}^{n}(y_i - \hat{y_i})(\hat{y_i} - \bar{y}) = 0i=1∑n?(yi??yi?^?)(yi?^??yˉ?)=0由一階導(dǎo)數(shù)條件:{?L?k=?2∑i=1nxi(yi?kxi?b)=0?L?b=?2∑i=1n(yi?kxi?b)=0\left\{ \begin{aligned} & \frac{\partial L}{\partial k} = -2\sum_{i = 1}^{n}x_i(y_i - kx_i - b) = 0 \\ & \frac{\partial L}{\partial b} = -2\sum_{i = 1}^{n}(y_i - kx_i - b) = 0\end{aligned} \right.??????????????k?L?=?2i=1∑n?xi?(yi??kxi??b)=0?b?L?=?2i=1∑n?(yi??kxi??b)=0? ?{∑i=1nxi(yi?yi^)=0∑i=1n(yi?yi^)=0\Rightarrow \left\{ \begin{aligned} & \sum_{i = 1}^{n}x_i(y_i - \hat{y_i}) = 0 \\ & \sum_{i = 1}^{n}(y_i - \hat{y_i}) = 0 \end{aligned} \right.??????????????i=1∑n?xi?(yi??yi?^?)=0i=1∑n?(yi??yi?^?)=0?因此,∑i=1n(yi?yi^)(yi^?yˉ)=∑i=1nyi^(yi?yi^)?yˉ∑i=1n(yi?yi^)=∑i=1n(kxi+b)(yi?yi^)=0\begin{aligned} & \sum_{i = 1}^{n}(y_i - \hat{y_i})(\hat{y_i} - \bar{y}) \\ = & \sum_{i = 1}^{n}\hat{y_i}(y_i - \hat{y_i}) - \bar{y}\sum_{i = 1}^{n}(y_i - \hat{y_i}) \\ = & \sum_{i = 1}^{n}(kx_i + b)(y_i - \hat{y_i}) = 0 \end{aligned}==?i=1∑n?(yi??yi?^?)(yi?^??yˉ?)i=1∑n?yi?^?(yi??yi?^?)?yˉ?i=1∑n?(yi??yi?^?)i=1∑n?(kxi?+b)(yi??yi?^?)=0?(參數(shù))線性函數(shù)可以使用 R2R^2R2 來判斷擬合的好壞,其他非線性的函數(shù)直接看 SSESSESSE 的大小即可。
總結(jié)
像擬合這類型的問題,最簡便的方法時使用 MatlabMatlabMatlab 中的擬合工具箱來擬合。里面有許多內(nèi)置的擬合函數(shù)類型,且能計算 R2R^2R2 或者 SSESSESSE,通過輸入?yún)?shù),確定擬合類型即可獲得擬合函數(shù)。
總結(jié)
以上是生活随笔為你收集整理的数学建模学习笔记(四)——拟合算法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何用手机打开dcm格式图片_压缩图片用
- 下一篇: 山东大学 2020级数据库系统 实验四