高等数理统计(四)
引言
【比較官方的簡(jiǎn)介】數(shù)理統(tǒng)計(jì)學(xué)是一門(mén)以概率論為基礎(chǔ),應(yīng)用性很強(qiáng)的學(xué)科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出正確的推斷和預(yù)測(cè),為采取正確的決策和行動(dòng)提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。
【簡(jiǎn)單的講】,就是通過(guò)樣本分析來(lái)推斷整體。
【意義或者重要性】在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)是非常重要的。怎樣挖掘數(shù)據(jù)內(nèi)部的規(guī)律或者隱含的信息,變得尤為重要。當(dāng)時(shí)我們是不可能獲得整體的數(shù)據(jù)的,所以我們只能通過(guò)抽取樣本,進(jìn)而通過(guò)樣本來(lái)推斷整體的規(guī)律。
【目錄】
第一章、樣本與統(tǒng)計(jì)量
一、引言:
二、總體與樣本:
三、統(tǒng)計(jì)量:
四、常用分布:
第二章、參數(shù)估計(jì)
一、引言:
二、點(diǎn)估計(jì)——矩估計(jì)法:
三、點(diǎn)估計(jì)——極大似然估計(jì):
四、估計(jì)量的優(yōu)良性準(zhǔn)則
五、區(qū)間估計(jì)——正態(tài)分布
1、引入
2、單個(gè)正態(tài)總體參數(shù)的區(qū)間估計(jì)
3、兩個(gè)正態(tài)總體的區(qū)間估計(jì)
六、區(qū)間估計(jì)——非正態(tài)分布:
1、大樣本正態(tài)近似法
2、二項(xiàng)分布
3、泊松分布
第三章、假設(shè)檢驗(yàn)
一、引言:
二、正態(tài)總體均值的假設(shè)檢驗(yàn)
1、單正態(tài)總體 N(μ, σ2)均值 μ?的檢驗(yàn)
(1) 雙邊檢驗(yàn) H0: μ = μ0;H1: μ≠μ0?
(2) 單邊檢驗(yàn) H0: μ = μ0;H1: μ>μ0
2、兩個(gè)正態(tài)總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較
(1) 雙邊檢驗(yàn) H0:?μ1?=?μ2;H1:?μ1≠μ2?
? ? (2) 單邊檢驗(yàn) H0:?μ1?>=?μ2;H1:?μ1<μ2?
(3) 單邊檢驗(yàn) H0:?μ1?<=?μ2;H1:?μ1>μ2?
三、正態(tài)總體方差的檢驗(yàn)
1、單個(gè)正態(tài)總體方差的?χ2 檢驗(yàn)
(1) H0: σ2?=σ02;H1: σ2?≠σ02
(2) H0: σ2?=σ02;H1: σ2?>σ02
(3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)
2、兩正態(tài)總體方差比的?F 檢驗(yàn)
(1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.
?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22
?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22
? 第四章、回歸分析
一、引言
二、一元線性回歸 1、一元線性回歸模型 2、回歸系數(shù)的最小二乘估計(jì): 3、回歸方程的顯著性檢驗(yàn) (1)F 檢驗(yàn) (2)T?檢驗(yàn) ? ?(3)相關(guān)系數(shù)檢驗(yàn)4、估計(jì)與預(yù)測(cè)
(1)?E(y0)的估計(jì)
(2)?y0的預(yù)測(cè)區(qū)間
? 三、廣義線性回歸模型
?
四、非線性回歸模型
?
?
第四章、回歸分析
一、引言:
變量間的兩類(lèi)關(guān)系:十九世紀(jì),英國(guó)生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾頓研究發(fā)現(xiàn):
? ? ?其中x表示父親身高, y 表示成年兒子的身高(單位:英寸,1英寸=2.54厘米)。這表明子代的平均高度有向中心回歸的意思,使得一段時(shí)間內(nèi)人的身高相對(duì)穩(wěn)定。之后回歸分析的思想滲透到了數(shù)理統(tǒng)計(jì)的其它分支中。
? 回歸分析處理的是變量與變量間的關(guān)系。變量間常見(jiàn)的關(guān)系有兩類(lèi):確定性關(guān)系與相關(guān)關(guān)系。 ? 變量間的相關(guān)關(guān)系不能用完全確切的函數(shù)形式表示,但在平均意義下有一定的定量關(guān)系表達(dá)式,尋找這種定量關(guān)系表達(dá)式就是回歸分析的主要任務(wù)。 ? 回歸分析便是研究變量間相關(guān)關(guān)系的一門(mén)學(xué)科。它通過(guò)對(duì)客觀事物中變量的大量觀察或試驗(yàn)獲得的數(shù)據(jù),去尋找隱藏在數(shù)據(jù)背后的相關(guān)關(guān)系,給出它們的表達(dá)形式——回歸函數(shù)的估計(jì)。 二、一元線性回歸 1、一元線性回歸模型設(shè)y與x間有相關(guān)關(guān)系,稱(chēng)x為自變量(預(yù)報(bào)變量),y為因變量(響應(yīng)變量),在知道x取值后,y有一個(gè)分布p(y|x),我們關(guān)心的是y的均值E(Y|x):
這便是y關(guān)于x的理論回歸函數(shù)——條件期望,也就是我們要尋找的相關(guān)關(guān)系的表達(dá)式。通常,相關(guān)關(guān)系可用下式表示:y =f (x)+?ε,其中ε是隨機(jī)誤差,一般假設(shè)ε ~N(0,σ2)。
進(jìn)行回歸分析首先是回歸函數(shù)形式的選擇。當(dāng)只有一個(gè)自變量時(shí),通常可采用畫(huà)散點(diǎn)圖 的方法進(jìn)行選擇。
【例1】合金的強(qiáng)度y (×107Pa) 與合金中碳的含量x (%) 有關(guān)。為研究?jī)蓚€(gè)變量間的關(guān)系。首先是收集數(shù)據(jù),我們把收集到的數(shù)據(jù)記為(xi,yi) ,i=1,2, ... , n。本例中,我們收集到12組數(shù)據(jù),列于表1中
為找出兩個(gè)量間存在的回歸函數(shù)的形式,可以畫(huà)一張圖:把每一對(duì)數(shù)(xi,yi)看成直角坐標(biāo)系中的一個(gè)點(diǎn),在圖上畫(huà)出n個(gè)點(diǎn),稱(chēng)這張圖為散點(diǎn)圖,見(jiàn)圖1
從散點(diǎn)圖我們發(fā)現(xiàn)12個(gè)點(diǎn)基本在一條直線附近,這說(shuō)明兩個(gè)變量之間有一個(gè)線性相關(guān)關(guān)系,這個(gè)相關(guān)關(guān)系可以表示為
??????????????????????? y =Β0+ Β1x+ ε? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
??? 這便是y關(guān)于x的一元線性回歸的數(shù)據(jù)結(jié)構(gòu)式。通常假定
??????????????????????? E(ε) =0,? Var(ε) = σ2???????????????????????????????????????????????????? ?(3)
??? 在對(duì)未知參數(shù)作區(qū)間估計(jì)或假設(shè)檢驗(yàn)時(shí),還需要假定誤差服從正態(tài)分布,即
??????????????????????? y ~N(Β0+?Β1x?, σ2?)???????????????????????????????? (4)
顯然,假定(4) 比 (3) 要強(qiáng)。
由于 Β0, Β1均未知,需要我們從收集到的數(shù)據(jù)(xi,yi),i=1,2,…,n,出發(fā)進(jìn)行估計(jì)。在收集數(shù)據(jù)時(shí),我們一般要求觀察獨(dú)立地進(jìn)行,即假定y1, y2,…, yn,相互獨(dú)立。綜合上述諸項(xiàng)假定,我們可以給出最簡(jiǎn)單、常用的一元線性回歸的數(shù)學(xué)模型:
由數(shù)據(jù)(xi,yi),i=1,2,…,n,可以獲得Β0, Β1的估計(jì) ,稱(chēng)
為y關(guān)于x的經(jīng)驗(yàn)回歸函數(shù),簡(jiǎn)稱(chēng)為回歸方程,其圖形稱(chēng)為回歸直線。給定x=x0后,?稱(chēng)為回歸值(在不同場(chǎng)合也稱(chēng)其為擬合值、預(yù)測(cè)值)。
2、回歸系數(shù)的最小二乘估計(jì):
【例2】使用例1中合金鋼強(qiáng)度和碳含量數(shù)據(jù),我們可求得回歸方程,見(jiàn)下表.
【性質(zhì)】關(guān)于最小二乘估計(jì)的一些性質(zhì)羅列在如下定理之中
【證明】定理1證明如下:
? 3、回歸方程的顯著性檢驗(yàn)
在使用回歸方程作進(jìn)一步的分析以前,首先應(yīng)對(duì)回歸方程是否有意義進(jìn)行判斷。如果Β1=0,那么不管x如何變化,E(y)不隨x的變化作線性變化,那么這時(shí)求得的一元線性回歸方程就沒(méi)有意義,稱(chēng)回歸方程不顯著。如果Β1≠0,E(y)隨x的變化作線性變化,稱(chēng)回歸方程是顯著的。
??? 綜上,對(duì)回歸方程是否有意義作判斷就是要作如下的顯著性檢驗(yàn):H0:Β1=0????? vs????? H1: Β1≠0 ?。拒絕H0表示回歸方程是顯著的。
在一元線性回歸中有三種等價(jià)的檢驗(yàn)方法,下面分別加以介紹。
(1)F 檢驗(yàn):采用方差分析的思想,我們從數(shù)據(jù)出發(fā)研究各yi不同的原因。
?
【證明】公式(13)證明如下:
【推論】
?
? 關(guān)于SR 和 Se所含有的成分可由如下定理說(shuō)明
進(jìn)一步,有關(guān)SR 和 Se的分布,有如下定理。
如同方差分析那樣,我們可以考慮采用F比作為檢驗(yàn)統(tǒng)計(jì)量:
【例3】在合金鋼強(qiáng)度的例2中,我們已求出了回歸方程,這里我們考慮關(guān)于回歸方程的顯著性檢驗(yàn)。
?
(2)T?檢驗(yàn):
對(duì)H0 : Β1 =0的檢驗(yàn)也可基于t分布進(jìn)行。
(3)相關(guān)系數(shù)檢驗(yàn)
一元線性回歸方程是反映兩個(gè)隨機(jī)變量x與y間的線性相關(guān)關(guān)系,它的顯著性檢驗(yàn)還可通過(guò)對(duì)二維總體相關(guān)系數(shù)r的檢驗(yàn)進(jìn)行。(相關(guān)系數(shù)的概念可見(jiàn)【第一章------>三、統(tǒng)計(jì)量】)
【總結(jié)】在一元線性回歸場(chǎng)合,三種檢驗(yàn)方法是等價(jià)的:在相同的顯著性水平下,要么都拒絕原假設(shè),要么都接受原假設(shè),不會(huì)產(chǎn)生矛盾。? F 檢驗(yàn)可以很容易推廣到多元回歸分析場(chǎng)合,而其他二個(gè)則否,所以,F檢驗(yàn)是最常用的關(guān)于回歸方程顯著性檢驗(yàn)的檢驗(yàn)方法。
? 4、估計(jì)與預(yù)測(cè):
當(dāng)回歸方程經(jīng)過(guò)檢驗(yàn)是顯著的后,可用來(lái)做估計(jì)和預(yù)測(cè)。這是二個(gè)不同的問(wèn)題:
(1)?E(y0)的估計(jì)
在x=x0時(shí),其對(duì)應(yīng)的因變量y0是一個(gè)隨機(jī)變量,有一個(gè)分布,我們經(jīng)常需要對(duì)該分布的均值給出估計(jì)。
(2) y0的預(yù)測(cè)區(qū)間
【詳細(xì)過(guò)程】
?
? 三、廣義線性回歸模型
?
四、非線性回歸模型
?
?
轉(zhuǎn)載于:https://www.cnblogs.com/mo-wang/p/4988754.html
總結(jié)
- 上一篇: 三、spring boot 1.5.4
- 下一篇: Android studio ERROR