使用EXCEL进行线性回归
文章目錄
- 數(shù)據(jù)集
- EXCEL設(shè)置
- 線性回歸步驟
- 結(jié)果解讀
數(shù)據(jù)集
Boston房產(chǎn)數(shù)據(jù)集總共有14個(gè)字段。前13個(gè)字段表示可能對(duì)某一處房產(chǎn)的價(jià)值產(chǎn)生影響的因素。最后第14個(gè)字段是房產(chǎn)的價(jià)值。下面表格中的第三欄,是數(shù)據(jù)集本身對(duì)于數(shù)據(jù)字段的描述。
數(shù)據(jù)集: boston_housing數(shù)據(jù)集。
數(shù)據(jù)集字段:
| 1 | CRIM | per capita crime rate by town |
| 2 | ZN | proportion of residential land zoned for lots over 25,000 sq.ft |
| 3 | INDUS | proportion of non-retail business acres per town |
| 4 | CHAS | Charles River dummy variable (= 1 if tract bounds river; 0 otherwise) |
| 5 | NOX | nitric oxides concentration (parts per 10 million) |
| 6 | RM | average number of rooms per dwelling |
| 7 | AGE | proportion of owner-occupied units built prior to 1940 |
| 8 | DIS | weighted distances to five Boston employment centers |
| 9 | RAD | index of accessibility to radial highways |
| 10 | TAX | full-value property-tax rate per $10,000 |
| 11 | PTRATIO | pupil-teacher ratio by town |
| 12 | B | 1000(Bk?0.63)21000(B_k - 0.63)^21000(Bk??0.63)2 where BkB_kBk? is the proportion of blacks by town |
| 13 | LSTAT | % lower status of the population |
| 14 | MEDV | Median value of owner-occupied homes in $1000’s |
我們?cè)賮碚故疽幌聰?shù)據(jù)集中的真實(shí)數(shù)據(jù)——前11條數(shù)據(jù)。
EXCEL設(shè)置
在默認(rèn)的EXCEL程序中,是沒有“數(shù)據(jù)分析”這一選項(xiàng)的。因此,需要進(jìn)入“選項(xiàng)”啟用“數(shù)據(jù)分析”功能。
在初始界面點(diǎn)擊“文件”面板,選擇“選項(xiàng)”。
在彈出的界面下,選擇“加載項(xiàng)”,然后右面會(huì)出現(xiàn)“分析工具庫(kù)”,點(diǎn)擊之,再點(diǎn)擊“轉(zhuǎn)到”。
在后面跳出的對(duì)話框中,把“分析工具庫(kù)”勾中,點(diǎn)擊確定。在“數(shù)據(jù)”面板中就會(huì)出現(xiàn)“數(shù)據(jù)分析”按鈕。
線性回歸步驟
為了使用“數(shù)據(jù)分析”工具箱,需要跳轉(zhuǎn)至“數(shù)據(jù)”面板。
點(diǎn)擊“數(shù)據(jù)分析”按鈕,就會(huì)跳出下圖所示的“數(shù)據(jù)分析工具箱”。里面有很多統(tǒng)計(jì)分析方法。本文中,只使用“回歸”功能。
選擇“回歸”,并且點(diǎn)擊“確定”。
隨后根據(jù)需求,設(shè)定回歸的參數(shù)。“Y值輸入?yún)^(qū)域”就是MEDV列;“X值輸入?yún)^(qū)域”就是前面的13列。注意,如果把第一行的標(biāo)志行也選中的話,需要將“標(biāo)志框”勾上,否則會(huì)報(bào)錯(cuò)。
上圖就是回歸的結(jié)果。左側(cè)是回歸的數(shù)據(jù),右側(cè)堆疊起來放置的是各種圖像。在上一個(gè)對(duì)話框中可以選擇是不是進(jìn)行繪制。
結(jié)果解讀
第一個(gè)表格計(jì)算了相關(guān)系數(shù)、R2R^2R2、修正RRR值、標(biāo)準(zhǔn)誤差和觀測(cè)值。
第二張表就有些難以解釋了,但是可以用下表表示。
| 回歸分析 | 自變量數(shù)自變量數(shù)自變量數(shù) | SSRSSRSSR | SSR自變量數(shù)\frac{SSR}{自變量數(shù)}自變量數(shù)SSR? | SSR自變量數(shù)×觀測(cè)值?1?自變量數(shù)SSE\frac{SSR}{自變量數(shù)}\times\frac{觀測(cè)值-1-自變量數(shù)}{SSE}自變量數(shù)SSR?×SSE觀測(cè)值?1?自變量數(shù)? | p?valuep-valuep?value from F |
| 殘差 | 觀測(cè)值?1?自變量數(shù)觀測(cè)值-1-自變量數(shù)觀測(cè)值?1?自變量數(shù) | SSESSESSE | SSE觀測(cè)值?1?自變量數(shù)\frac{SSE}{觀測(cè)值-1-自變量數(shù)}觀測(cè)值?1?自變量數(shù)SSE? | ||
| 總計(jì) | 觀測(cè)值?1觀測(cè)值-1觀測(cè)值?1 | SSTSSTSST |
最后一張表記錄了線性回歸的系數(shù)、每個(gè)變量的標(biāo)準(zhǔn)誤差、置信區(qū)間等等。
至于其它表格中的計(jì)算結(jié)果,是關(guān)于每個(gè)數(shù)據(jù)點(diǎn)的偏離程度分析。
總結(jié)
以上是生活随笔為你收集整理的使用EXCEL进行线性回归的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OSPF路由协议实验配置命令
- 下一篇: 基于物理的渲染:从理论到实现 PBRT