多云回归分析入门(老阿姨要重新开始学习概率论了~)
在數量分析中,經常會看到變量與變量之間存在著一定的聯系。要了解變量之間如何發生相互影響的,就需要利用相關分析和回歸分析。在上一章講述了相關分析有關內容。本章介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析以及邏輯回歸分析等。
j基本概念:
相關分析和回歸分析都是研究變量間關系的統計學課題。在應用中,兩種分析方法經常相互結合和滲透,但它們研究的側重點和應用面不同。 在回歸分析中,變量y稱為因變量,處于被解釋的特殊地位;而在相關分析中,變量y與變量x處于平等的地位,研究變量y與變量x的密切程度和研究變量x與變量y的密切程度是一樣的。
在回歸分析中,因變量y是隨機變量,自變量x可以是隨機變量,也可以是非隨機的確定變量;而在相關分析中,變量x和變量y都是隨機變量。 相關分析是測定變量之間的關系密切程度,所使用的工具是相關系數;而回歸分析則是側重于考察變量之間的數量變化規律,并通過一定的數學表達式來描述變量之間的關系,進而確定一個或者幾個變量的變化對另一個特定變量的影響程度。
具體地說,回歸分析主要解決以下幾方面的問題。
1)通過分析大量的樣本數據,確定變量之間的數學關系式。?
2)對所確定的數學關系式的可信程度進行各種統計檢驗,并區分出對某一特定變量影響較為顯著的變量和影響不顯著的變量。
3)利用所確定的數學關系式,根據一個或幾個變量的值來預測或控制另一個特定變量的取值,并給出這種預測或控制的精確度。
作為處理變量之間關系的一種統計方法和技術,回歸分析的基本思想和方法以及“回歸(Regression)”名稱的由來都要歸功于英國統計學家F·Galton(1822~1911)。
在實際中,根據變量的個數、變量的類型以及變量之間的相關關系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析和邏輯回歸分析等類型。
本案例只講解多元線性回歸
在實際問題中,影響因變量的因素往往有多個。
例如,商品的需求除了受自身價格的影響外,還要受到消費者收入、其他商品的價格、消費者偏好等因素的影響;影響水果產量的外界因素有平均氣溫、平均日照時數、平均濕度等。
因此,在許多場合,僅僅考慮單個變量是不夠的,還需要就一個因變量與多個自變量的聯系來進行考察,才能獲得比較滿意的結果。這就產生了測定多因素之間相關關系的問題。
研究在線性相關條件下,兩個或兩個以上自變量對一個因變量的數量變化關系,稱為多元線性回歸分析,表現這一數量關系的數學公式,稱為多元線性回歸模型。多元線性回歸模型是一元線性回歸模型的擴展,其基本原理與一元線性回歸模型類似,只是在計算上更為復雜,一般需借助計算機來完成。
對多元線性回歸,也需要測定方程的擬合程度、檢驗回歸方程和回歸系數的顯著性。
(1)擬合優度檢驗
測定多元線性回歸的擬合程度,與一元線性回歸中的判定系數類似,使用多重判定系數,其定義為
(2)回歸方程的顯著性檢驗(F檢驗)
多元線性回歸方程的顯著性檢驗一般采用F檢驗,利用方差分析的方法進行。
(3)回歸系數的顯著性檢驗(t檢驗)
回歸系數的顯著性檢驗是檢驗各自變量x1,x2,…,對因變量y的影響是否顯著,從而找出哪些自變量對y的影響是重要的,哪些是不重要的。
與一元線性回歸一樣,要檢驗解釋變量對因變量y的線性作用是否顯著,要使用t檢驗。
總結
以上是生活随笔為你收集整理的多云回归分析入门(老阿姨要重新开始学习概率论了~)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 详细申请评分卡模型
- 下一篇: 你应该知道的模型评估的五个方法