正态分布/卡方分布/F分布/T分布
正態(tài)分布:
正態(tài)分布(Normal distribution)又名高斯分布(Gaussiandistribution),若隨機變量X服從一個數(shù)學期望為μ、方差為σ^2的高斯分布,記為N(μ,σ^2)。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置,其標準差σ決定了分布的幅度。我們通常所說的標準正態(tài)分布是μ = 0,σ = 1的正態(tài)分布。
當μ=0,σ=1時,正態(tài)分布就成為標準正態(tài)分布N(0,1)。概率密度函數(shù)為:
正態(tài)分布的密度函數(shù)的特點是:關于μ對稱,并在μ處取最大值,在正(負)無窮遠處取值為0,在μ±σ處有拐點,形狀呈現(xiàn)中間高兩邊低,圖像是一條位于x軸上方的鐘形曲線。
卡方分布:
若n個相互獨立的隨機變量ξ?、ξ?、……、ξn ,均服從標準正態(tài)分布N(0,1)(也稱獨立同分布于標準正態(tài)分布),則這n個服從標準正態(tài)分布的隨機變量的平方和構成一新的隨機變量,其分布規(guī)律稱為分布(chi-squaredistribution)。其中參數(shù)n稱為自由度(通俗講,樣本中獨立或能自由變化的自變量的個數(shù),稱為自由度),正如正態(tài)分布中均值或方差不同就是另一個正態(tài)分布一樣,自由度不同就是另一個分布。記為。 分布的均值為自由度 n,記為 E( ) = n; 分布的方差為2倍的自由度(2n),記為 D( ) = 2n。
從卡方分布圖可以看出:卡方分布在第一象限內(nèi),卡方值都是正值,呈正偏態(tài)(右偏態(tài)),隨著參數(shù) n 的增大;卡方分布趨近于正態(tài)分布;隨著自由度n的增大,卡方分布向正無窮方向延伸(因為均值n越來越大),分布曲線也越來越低闊(因為方差2n越來越大)。
t分布:
首先要提一句u分布,正態(tài)分布(normal distribution)是許多統(tǒng)計方法的理論基礎。正態(tài)分布的兩個參數(shù)μ和σ決定了正態(tài)分布的位置和形態(tài)。為了應用方便,常將一般的正態(tài)變量X通過u變換[(X-μ)/σ]轉(zhuǎn)化成標準正態(tài)變量u,以使原來各種形態(tài)的正態(tài)分布都轉(zhuǎn)換為μ=0,σ=1的標準正態(tài)分布(standard normaldistribution),亦稱u分布。根據(jù)中心極限定理,通過抽樣模擬試驗表明,在正態(tài)分布總體中以固定 n 抽取若干個樣本時,樣本均數(shù)的分布仍服從正態(tài)分布,即N(μ,σ)。所以,對樣本均數(shù)的分布進行u變換,也可變換為標準正態(tài)分布N (0,1)。
由于在實際工作中,往往σ(總體方差)是未知的,常用s(樣本方差)作為σ的估計值,為了與u變換區(qū)別,稱為t變換,統(tǒng)計量t 值的分布稱為t分布。假設X服從標準正態(tài)分布N(0,1),Y服從卡方 (n)分布,那么Z=X/sqrt(Y/n)的分布稱為自由度為n的t分布,記為 Z~t(n)。
可以看出,t分布以0為中心,左右對稱的單峰分布;t分布是一簇曲線,其形態(tài)變化與n(確切地說與自由度ν)大小有關。自由度ν越小,t分布曲線越低平;自由度ν越大,t分布曲線越接近標準正態(tài)分布(u分布)曲線。
F分布:
設X、Y為兩個獨立的隨機變量,X服從自由度為n的卡方分布,Y服從自由度為m的卡方分布,這兩個獨立的卡方分布除以各自的自由度以后的比率服從F分布。即:
F分布是一種非對稱分布;它有兩個自由度,即n-1和m-1,相應的分布記為F( n–1,m-1), n-1通常稱為分子自由度, m-1通常稱為分母自由度;F分布是一個以自由度(n-1)和(m-1)為參數(shù)的分布族,不同的自由度決定了F 分布的形狀。
總結
以上是生活随笔為你收集整理的正态分布/卡方分布/F分布/T分布的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: simhash mysql_海量数据相似
- 下一篇: win7右键新建菜单删减与排序