Matlab概率统计编程指南
Matlab概率統(tǒng)計(jì)編程指南
第4章 概率統(tǒng)計(jì)
本章介紹MATLAB在概率統(tǒng)計(jì)中的若干命令和使用格式,這些命令存放于MatlabR12\Toolbox\Stats中.
4.1 隨機(jī)數(shù)的產(chǎn)生
4.1.1 二項(xiàng)分布的隨機(jī)數(shù)據(jù)的產(chǎn)生
命令 參數(shù)為N,P的二項(xiàng)隨機(jī)數(shù)據(jù)
函數(shù) binornd
格式 R = binornd(N,P) %N,P為二項(xiàng)分布的兩個(gè)參數(shù),返回服從參數(shù)為N,P的二項(xiàng)分布的隨機(jī)數(shù),N,P大小相同.
R = binornd(N,P,m) %m指定隨機(jī)數(shù)的個(gè)數(shù),與R同維數(shù).
R = binornd(N,P,m,n) %m,n分別表示R的行數(shù)和列數(shù)
例4-1
>> R=binornd(10,0.5)
R =
3
>> R=binornd(10,0.5,1,6)
R =
8 1 3 7 6 4
>> R=binornd(10,0.5,[1,10])
R =
6 8 4 6 7 5 3 5 6 2
>> R=binornd(10,0.5,[2,3])
R =
7 5 8
6 5 6
>>n = 10:10:60;
>>r1 = binornd(n,1./n)
r1 =
2 1 0 1 1 2
>>r2 = binornd(n,1./n,[1 6])
r2 =
0 1 2 1 3 1
4.1.2 正態(tài)分布的隨機(jī)數(shù)據(jù)的產(chǎn)生
命令 參數(shù)為μ,σ的正態(tài)分布的隨機(jī)數(shù)據(jù)
函數(shù) normrnd
格式 R = normrnd(MU,SIGMA) %返回均值為MU,標(biāo)準(zhǔn)差為SIGMA的正態(tài)分布的隨機(jī)數(shù)據(jù),R可以是向量或矩陣.
R = normrnd(MU,SIGMA,m) %m指定隨機(jī)數(shù)的個(gè)數(shù),與R同維數(shù).
R = normrnd(MU,SIGMA,m,n) %m,n分別表示R的行數(shù)和列數(shù)
例4-2
>>n1 = normrnd(1:6,1./(1:6))
n1 =
2.1650 2.3134 3.0250 4.0879 4.8607 6.2827
>>n2 = normrnd(0,1,[1 5])
n2 =
0.0591 1.7971 0.2641 0.8717 -1.4462
>>n3 = normrnd([1 2 3;4 5 6],0.1,2,3) %mu為均值矩陣
n3 =
0.9299 1.9361 2.9640
4.1246 5.0577 5.9864
>> R=normrnd(10,0.5,[2,3]) %mu為10,sigma為0.5的2行3列個(gè)正態(tài)隨機(jī)數(shù)
R =
9.7837 10.0627 9.4268
9.1672 10.1438 10.5955
4.1.3 常見分布的隨機(jī)數(shù)產(chǎn)生
常見分布的隨機(jī)數(shù)的使用格式與上面相同
表4-1 隨機(jī)數(shù)產(chǎn)生函數(shù)表
函數(shù)名
調(diào)用形式
注 釋
Unifrnd
unifrnd ( A,B,m,n)
[A,B]上均勻分布(連續(xù)) 隨機(jī)數(shù)
Unidrnd
unidrnd(N,m,n)
均勻分布(離散)隨機(jī)數(shù)
Exprnd
exprnd(Lambda,m,n)
參數(shù)為L(zhǎng)ambda的指數(shù)分布隨機(jī)數(shù)
Normrnd
normrnd(MU,SIGMA,m,n)
參數(shù)為MU,SIGMA的正態(tài)分布隨機(jī)數(shù)
chi2rnd
chi2rnd(N,m,n)
自由度為N的卡方分布隨機(jī)數(shù)
Trnd
trnd(N,m,n)
自由度為N的t分布隨機(jī)數(shù)
Frnd
frnd(N1, N2,m,n)
第一自由度為N1,第二自由度為N2的F分布隨機(jī)數(shù)
gamrnd
gamrnd(A, B,m,n)
參數(shù)為A, B的分布隨機(jī)數(shù)
betarnd
betarnd(A, B,m,n)
參數(shù)為A, B的分布隨機(jī)數(shù)
lognrnd
lognrnd(MU, SIGMA,m,n)
參數(shù)為MU, SIGMA的對(duì)數(shù)正態(tài)分布隨機(jī)數(shù)
nbinrnd
nbinrnd(R, P,m,n)
參數(shù)為R,P的負(fù)二項(xiàng)式分布隨機(jī)數(shù)
ncfrnd
ncfrnd(N1, N2, delta,m,n)
參數(shù)為N1,N2,delta的非中心F分布隨機(jī)數(shù)
nctrnd
nctrnd(N, delta,m,n)
參數(shù)為N,delta的非中心t分布隨機(jī)數(shù)
ncx2rnd
ncx2rnd(N, delta,m,n)
參數(shù)為N,delta的非中心卡方分布隨機(jī)數(shù)
raylrnd
raylrnd(B,m,n)
參數(shù)為B的瑞利分布隨機(jī)數(shù)
weibrnd
weibrnd(A, B,m,n)
參數(shù)為A, B的韋伯分布隨機(jī)數(shù)
binornd
binornd(N,P,m,n)
參數(shù)為N, p的二項(xiàng)分布隨機(jī)數(shù)
geornd
geornd(P,m,n)
參數(shù)為 p的幾何分布隨機(jī)數(shù)
hygernd
hygernd(M,K,N,m,n)
參數(shù)為 M,K,N的超幾何分布隨機(jī)數(shù)
Poissrnd
poissrnd(Lambda,m,n)
參數(shù)為L(zhǎng)ambda的泊松分布隨機(jī)數(shù)
4.1.4 通用函數(shù)求各分布的隨機(jī)數(shù)據(jù)
命令 求指定分布的隨機(jī)數(shù)
函數(shù) random
格式 y = random('name',A1,A2,A3,m,n) %name的取值見表4-2;A1,A2,A3為分布的參數(shù);m,n指定隨機(jī)數(shù)的行和列
例4-3 產(chǎn)生12(3行4列)個(gè)均值為2,標(biāo)準(zhǔn)差為0.3的正態(tài)分布隨機(jī)數(shù)
>> y=random('norm',2,0.3,3,4)
y =
2.3567 2.0524 1.8235 2.0342
1.9887 1.9440 2.6550 2.3200
2.0982 2.2177 1.9591 2.0178
4.2 隨機(jī)變量的概率密度計(jì)算
4.2.1 通用函數(shù)計(jì)算概率密度函數(shù)值
命令 通用函數(shù)計(jì)算概率密度函數(shù)值
函數(shù) pdf
格式 Y=pdf(name,K,A)
Y=pdf(name,K,A,B)
Y=pdf(name,K,A,B,C)
說(shuō)明 返回在X=K處,參數(shù)為A,B,C的概率密度值,對(duì)于不同的分布,參數(shù)個(gè)數(shù)是不同;name為分布函數(shù)名,其取值如表4-2.
表4-2 常見分布函數(shù)表
name的取值
函數(shù)說(shuō)明
'beta'
或
'Beta'
Beta分布
'bino'
或
'Binomial'
二項(xiàng)分布
'chi2'
或
'Chisquare'
卡方分布
'exp'
或
'Exponential'
指數(shù)分布
'f'
或
'F'
F分布
'gam'
或
'Gamma'
GAMMA分布
'geo'
或
'Geometric'
幾何分布
'hyge'
或
'Hypergeometric'
超幾何分布
'logn'
或
'Lognormal'
對(duì)數(shù)正態(tài)分布
'nbin'
或
'Negative Binomial'
負(fù)二項(xiàng)式分布
'ncf'
或
'Noncentral F'
非中心F分布
'nct'
或
'Noncentral t'
非中心t分布
'ncx2'
或
'Noncentral Chi-square'
非中心卡方分布
'norm'
或
'Normal'
正態(tài)分布
'poiss'
或
'Poisson'
泊松分布
'rayl'
或
'Rayleigh'
瑞利分布
't'
或
'T'
T分布
'unif'
或
'Uniform'
均勻分布
'unid'
或
'Discrete Uniform'
離散均勻分布
'weib'
或
'Weibull'
Weibull分布
例如二項(xiàng)分布:設(shè)一次試驗(yàn),事件A發(fā)生的概率為p,那么,在n次獨(dú)立重復(fù)試驗(yàn)中,事件A恰好發(fā)生K次的概率P_K為:P_K=P{X=K}=pdf('bino',K,n,p)
例4-4 計(jì)算正態(tài)分布N(0,1)的隨機(jī)變量X在點(diǎn)0.6578的密度函數(shù)值.
解:>> pdf('norm',0.6578,0,1)
ans =
0.3213
例4-5 自由度為8的卡方分布,在點(diǎn)2.18處的密度函數(shù)值.
解:>> pdf('chi2',2.18,8)
ans =
0.0363
4.2.2 專用函數(shù)計(jì)算概率密度函數(shù)值
命令 二項(xiàng)分布的概率值
函數(shù) binopdf
格式 binopdf (k, n, p) %等同于, p — 每次試驗(yàn)事件A發(fā)生的概率;K—事件A發(fā)生K次;n—試驗(yàn)總次數(shù)
命令 泊松分布的概率值
函數(shù) poisspdf
格式 poisspdf(k, Lambda) %等同于
命令 正態(tài)分布的概率值
函數(shù) normpdf(K,mu,sigma) %計(jì)算參數(shù)為μ=mu,σ=sigma的正態(tài)分布密度函數(shù)在K處的值
專用函數(shù)計(jì)算概率密度函數(shù)列表如表4-3.
?
?
admin 2007-11-29 20:43
表4-3 專用函數(shù)計(jì)算概率密度函數(shù)表
函數(shù)名
調(diào)用形式
注 釋
Unifpdf
unifpdf (x, a, b)
[a,b]上均勻分布(連續(xù))概率密度在X=x處的函數(shù)值
unidpdf
Unidpdf(x,n)
均勻分布(離散)概率密度函數(shù)值
Exppdf
exppdf(x, Lambda)
參數(shù)為L(zhǎng)ambda的指數(shù)分布概率密度函數(shù)值
normpdf
normpdf(x, mu, sigma)
參數(shù)為mu,sigma的正態(tài)分布概率密度函數(shù)值
chi2pdf
chi2pdf(x, n)
自由度為n的卡方分布概率密度函數(shù)值
Tpdf
tpdf(x, n)
自由度為n的t分布概率密度函數(shù)值
Fpdf
fpdf(x, n1, n2)
第一自由度為n1,第二自由度為n2的F分布概率密度函數(shù)值
gampdf
gampdf(x, a, b)
參數(shù)為a, b的分布概率密度函數(shù)值
betapdf
betapdf(x, a, b)
參數(shù)為a, b的分布概率密度函數(shù)值
lognpdf
lognpdf(x, mu, sigma)
參數(shù)為mu, sigma的對(duì)數(shù)正態(tài)分布概率密度函數(shù)值
nbinpdf
nbinpdf(x, R, P)
參數(shù)為R,P的負(fù)二項(xiàng)式分布概率密度函數(shù)值
Ncfpdf
ncfpdf(x, n1, n2, delta)
參數(shù)為n1,n2,delta的非中心F分布概率密度函數(shù)值
Nctpdf
nctpdf(x, n, delta)
參數(shù)為n,delta的非中心t分布概率密度函數(shù)值
ncx2pdf
ncx2pdf(x, n, delta)
參數(shù)為n,delta的非中心卡方分布概率密度函數(shù)值
raylpdf
raylpdf(x, b)
參數(shù)為b的瑞利分布概率密度函數(shù)值
weibpdf
weibpdf(x, a, b)
參數(shù)為a, b的韋伯分布概率密度函數(shù)值
binopdf
binopdf(x,n,p)
參數(shù)為n, p的二項(xiàng)分布的概率密度函數(shù)值
geopdf
geopdf(x,p)
參數(shù)為 p的幾何分布的概率密度函數(shù)值
hygepdf
hygepdf(x,M,K,N)
參數(shù)為 M,K,N的超幾何分布的概率密度函數(shù)值
poisspdf
poisspdf(x,Lambda)
參數(shù)為L(zhǎng)ambda的泊松分布的概率密度函數(shù)值
例4-6 繪制卡方分布密度函數(shù)在自由度分別為1,5,15的圖形
>> x=0:0.1:30;
>> y1=chi2pdf(x,1); plot(x,y1,':')
>> hold on
>> y2=chi2pdf(x,5);plot(x,y2,'+')
>> y3=chi2pdf(x,15);plot(x,y3,'o')
>> axis([0,30,0,0.2]) %指定顯示的圖形區(qū)域
則圖形為圖4-1.
4.2.3 常見分布的密度函數(shù)作圖
1.二項(xiàng)分布
例4-7
>>x = 0:10;
>>y = binopdf(x,10,0.5);
>>plot(x,y,'+')
2.卡方分布
例4-8
>> x = 0:0.2:15;
>>y = chi2pdf(x,4);
>>plot(x,y)
圖4-2
3.非中心卡方分布
例4-9
>>x = (0:0.1:10)';
>>p1 = ncx2pdf(x,4,2);
>>p = chi2pdf(x,4);
>>plot(x,p,'--',x,p1,'-')
4.指數(shù)分布
例4-10
>>x = 0:0.1:10;
>>y = exppdf(x,2);
>>plot(x,y)
圖4-3
5.F分布
例4-11
>>x = 0:0.01:10;
>>y = fpdf(x,5,3);
>>plot(x,y)
6.非中心F分布
例4-12
>>x = (0.01:0.1:10.01)';
>>p1 = ncfpdf(x,5,20,10);
>>p = fpdf(x,5,20);
>>plot(x,p,'--',x,p1,'-')
圖4-4
7.Γ分布
例4-13
>>x = gaminv((0.005:0.01:0.995),100,10);
>>y = gampdf(x,100,10);
>>y1 = normpdf(x,1000,100);
>>plot(x,y,'-',x,y1,'-.')
8.對(duì)數(shù)正態(tài)分布
例4-14
>>x = (10:1000:125010)';
>>y = lognpdf(x,log(20000),1.0);
>>plot(x,y)
>>set(gca,'xtick',[0 30000 60000 90000 120000])
>>set(gca,'xticklabel',str2mat('0','$30,000','$60,000',…
'$90,000','$120,000'))
圖4-5
9.負(fù)二項(xiàng)分布
例4-15
>>x = (0:10);
>>y = nbinpdf(x,3,0.5);
>>plot(x,y,'+')
10.正態(tài)分布
例4-16
>> x=-3:0.2:3;
>> y=normpdf(x,0,1);
>> plot(x,y)
圖4-6
11.泊松分布
例4-17
>>x = 0:15;
>>y = poisspdf(x,5);
>>plot(x,y,'+')
12.瑞利分布
例4-18
>>x = [0:0.01:2];
>>p = raylpdf(x,0.5);
>>plot(x,p)
圖4-7
13.T分布
例4-19
>>x = -5:0.1:5;
>>y = tpdf(x,5);
>>z = normpdf(x,0,1);
>>plot(x,y,'-',x,z,'-.')
14.威布爾分布
例4-20
>> t=0:0.1:3;
>> y=weibpdf(t,2,2);
>> plot(y)
圖4-8?
?
admin 2007-11-29 20:43
4.3 隨機(jī)變量的累積概率值(分布函數(shù)值)
4.3.1 通用函數(shù)計(jì)算累積概率值
命令 通用函數(shù)cdf用來(lái)計(jì)算隨機(jī)變量的概率之和(累積概率值)
函數(shù) cdf
格式
說(shuō)明 返回以name為分布,隨機(jī)變量X≤K的概率之和的累積概率值,name的取值見表4-1 常見分布函數(shù)表
例4-21 求標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量X落在區(qū)間(-∞,0.4)內(nèi)的概率(該值就是概率統(tǒng)計(jì)教材中的附表:標(biāo)準(zhǔn)正態(tài)數(shù)值表).
解:
>> cdf('norm',0.4,0,1)
ans =
0.6554
例4-22 求自由度為16的卡方分布隨機(jī)變量落在[0,6.91]內(nèi)的概率
>> cdf('chi2',6.91,16)
ans =
0.0250
4.3.2 專用函數(shù)計(jì)算累積概率值(隨機(jī)變量的概率之和)
命令 二項(xiàng)分布的累積概率值
函數(shù) binocdf
格式 binocdf (k, n, p) %n為試驗(yàn)總次數(shù),p為每次試驗(yàn)事件A發(fā)生的概率,k為n次試驗(yàn)中事件A發(fā)生的次數(shù),該命令返回n次試驗(yàn)中事件A恰好發(fā)生k次的概率.
命令 正態(tài)分布的累積概率值
函數(shù) normcdf
格式 normcdf() %返回F(x)=的值,mu,sigma為正態(tài)分布的兩個(gè)參數(shù)
例4-23 設(shè)X~N(3, 22)
(1)求
(2)確定c,使得
解(1) p1=
p2=
p3=
p4=
則有:
>>p1=normcdf(5,3,2)-normcdf(2,3,2)
p1 =
0.5328
>>p2=normcdf(10,3,2)-normcdf(-4,3,2)
p2 =
0.9995
>>p3=1-normcdf(2,3,2)-normcdf(-2,3,2)
p3 =
0.6853
>>p4=1-normcdf(3,3,2)
p4 =
0.5000
專用函數(shù)計(jì)算累積概率值函數(shù)列表如表4-4.
表4-4 專用函數(shù)的累積概率值函數(shù)表
函數(shù)名
調(diào)用形式
注 釋
unifcdf
unifcdf (x, a, b)
[a,b]上均勻分布(連續(xù))累積分布函數(shù)值 F(x)=P{X≤x}
unidcdf
unidcdf(x,n)
均勻分布(離散)累積分布函數(shù)值 F(x)=P{X≤x}
expcdf
expcdf(x, Lambda)
參數(shù)為L(zhǎng)ambda的指數(shù)分布累積分布函數(shù)值 F(x)=P{X≤x}
normcdf
normcdf(x, mu, sigma)
參數(shù)為mu,sigma的正態(tài)分布累積分布函數(shù)值 F(x)=P{X≤x}
chi2cdf
chi2cdf(x, n)
自由度為n的卡方分布累積分布函數(shù)值 F(x)=P{X≤x}
tcdf
tcdf(x, n)
自由度為n的t分布累積分布函數(shù)值 F(x)=P{X≤x}
fcdf
fcdf(x, n1, n2)
第一自由度為n1,第二自由度為n2的F分布累積分布函數(shù)值
gamcdf
gamcdf(x, a, b)
參數(shù)為a, b的分布累積分布函數(shù)值 F(x)=P{X≤x}
betacdf
betacdf(x, a, b)
參數(shù)為a, b的分布累積分布函數(shù)值 F(x)=P{X≤x}
logncdf
logncdf(x, mu, sigma)
參數(shù)為mu, sigma的對(duì)數(shù)正態(tài)分布累積分布函數(shù)值
nbincdf
nbincdf(x, R, P)
參數(shù)為R,P的負(fù)二項(xiàng)式分布概累積分布函數(shù)值 F(x)=P{X≤x}
ncfcdf
ncfcdf(x, n1, n2, delta)
參數(shù)為n1,n2,delta的非中心F分布累積分布函數(shù)值
nctcdf
nctcdf(x, n, delta)
參數(shù)為n,delta的非中心t分布累積分布函數(shù)值 F(x)=P{X≤x}
ncx2cdf
ncx2cdf(x, n, delta)
參數(shù)為n,delta的非中心卡方分布累積分布函數(shù)值
raylcdf
raylcdf(x, b)
參數(shù)為b的瑞利分布累積分布函數(shù)值 F(x)=P{X≤x}
weibcdf
weibcdf(x, a, b)
參數(shù)為a, b的韋伯分布累積分布函數(shù)值 F(x)=P{X≤x}
binocdf
binocdf(x,n,p)
參數(shù)為n, p的二項(xiàng)分布的累積分布函數(shù)值 F(x)=P{X≤x}
geocdf
geocdf(x,p)
參數(shù)為 p的幾何分布的累積分布函數(shù)值 F(x)=P{X≤x}
hygecdf
hygecdf(x,M,K,N)
參數(shù)為 M,K,N的超幾何分布的累積分布函數(shù)值
poisscdf
poisscdf(x,Lambda)
參數(shù)為L(zhǎng)ambda的泊松分布的累積分布函數(shù)值 F(x)=P{X≤x}
說(shuō)明 累積概率函數(shù)就是分布函數(shù)F(x)=P{X≤x}在x處的值.?
?
admin 2007-11-29 20:44
4.4 隨機(jī)變量的逆累積分布函數(shù)
MATLAB中的逆累積分布函數(shù)是已知,求x.
逆累積分布函數(shù)值的計(jì)算有兩種方法
4.4.1 通用函數(shù)計(jì)算逆累積分布函數(shù)值
命令 icdf 計(jì)算逆累積分布函數(shù)
格式
說(shuō)明 返回分布為name,參數(shù)為,累積概率值為P的臨界值,這里name與前面表4.1相同.
如果,則
例4-24 在標(biāo)準(zhǔn)正態(tài)分布表中,若已知=0.975,求x
解:>> x=icdf('norm',0.975,0,1)
x =
1.9600
例4-25 在分布表中,若自由度為10,=0.975,求臨界值Lambda.
解:因?yàn)楸碇薪o出的值滿足,而逆累積分布函數(shù)icdf求滿足的臨界值.所以,這里的取為0.025,即
>> Lambda=icdf('chi2',0.025,10)
Lambda =
3.2470
例4-26 在假設(shè)檢驗(yàn)中,求臨界值問題:
已知:,查自由度為10的雙邊界檢驗(yàn)t分布臨界值
>>lambda=icdf('t',0.025,10)
lambda =
-2.2281
4.4.2 專用函數(shù)-inv計(jì)算逆累積分布函數(shù)
命令 正態(tài)分布逆累積分布函數(shù)
函數(shù) norminv
格式 X=norminv(p,mu,sigma) %p為累積概率值,mu為均值,sigma為標(biāo)準(zhǔn)差,X為臨界值,滿足:p=P{X≤x}.
例4-27 設(shè),確定c使得.
解:由得,=0.5,所以
>>X=norminv(0.5, 3, 2)
X=
3
關(guān)于常用臨界值函數(shù)可查下表4-5.
表4-5 常用臨界值函數(shù)表
函數(shù)名
調(diào)用形式
注 釋
unifinv
x=unifinv (p, a, b)
均勻分布(連續(xù))逆累積分布函數(shù)(P=P{X≤x},求x)
unidinv
x=unidinv (p,n)
均勻分布(離散)逆累積分布函數(shù),x為臨界值
expinv
x=expinv (p, Lambda)
指數(shù)分布逆累積分布函數(shù)
norminv
x=Norminv(x,mu,sigma)
正態(tài)分布逆累積分布函數(shù)
chi2inv
x=chi2inv (x, n)
卡方分布逆累積分布函數(shù)
tinv
x=tinv (x, n)
t分布累積分布函數(shù)
finv
x=finv (x, n1, n2)
F分布逆累積分布函數(shù)
gaminv
x=gaminv (x, a, b)
分布逆累積分布函數(shù)
betainv
x=betainv (x, a, b)
分布逆累積分布函數(shù)
logninv
x=logninv (x, mu, sigma)
對(duì)數(shù)正態(tài)分布逆累積分布函數(shù)
nbininv
x=nbininv (x, R, P)
負(fù)二項(xiàng)式分布逆累積分布函數(shù)
ncfinv
x=ncfinv (x, n1, n2, delta)
非中心F分布逆累積分布函數(shù)
nctinv
x=nctinv (x, n, delta)
非中心t分布逆累積分布函數(shù)
ncx2inv
x=ncx2inv (x, n, delta)
非中心卡方分布逆累積分布函數(shù)
raylinv
x=raylinv (x, b)
瑞利分布逆累積分布函數(shù)
weibinv
x=weibinv (x, a, b)
韋伯分布逆累積分布函數(shù)
binoinv
x=binoinv (x,n,p)
二項(xiàng)分布的逆累積分布函數(shù)
geoinv
x=geoinv (x,p)
幾何分布的逆累積分布函數(shù)
hygeinv
x=hygeinv (x,M,K,N)
超幾何分布的逆累積分布函數(shù)
poissinv
x=poissinv (x,Lambda)
泊松分布的逆累積分布函數(shù)
例4-28 公共汽車門的高度是按成年男子與車門頂碰頭的機(jī)會(huì)不超過1%設(shè)計(jì)的.設(shè)男子身高X(單位:cm)服從正態(tài)分布N(175,36),求車門的最低高度.
解:設(shè)h為車門高度,X為身高
求滿足條件的h,即,所以
>>h=norminv(0.99, 175, 6)
h =
188.9581
例4-29 卡方分布的逆累積分布函數(shù)的應(yīng)用
在MATLAB的編輯器下建立M文件如下:
n=5; a=0.9; %n為自由度,a為置信水平或累積概率
x_a=chi2inv(a,n); %x_a 為臨界值
x=0:0.1:15; yd_c=chi2pdf(x,n); %計(jì)算的概率密度函數(shù)值,供繪圖用
plot(x,yd_c,'b'), hold on %繪密度函數(shù)圖形
xxf=0:0.1:x_a; yyf=chi2pdf(xxf,n); %計(jì)算[0,x_a]上的密度函數(shù)值,供填色用
fill([xxf,x_a], [yyf,0], 'g') %填色,其中:點(diǎn)(x_a, 0)使得填色區(qū)域封閉
text(x_a*1.01,0.01, num2str(x_a)) %標(biāo)注臨界值點(diǎn)
text(10,0.10, ['\fontsize{16}X~{\chi}^2(4)'])
%圖中標(biāo)注
text(1.5,0.05, '\fontsize{22}alpha=0.9' ) %圖中標(biāo)注
結(jié)果顯示如圖4-9.
4.5 隨機(jī)變量的數(shù)字特征
4.5.1 平均值,中值
命令 利用mean求算術(shù)平均值
格式 mean(X) %X為向量,返回X中各元素的平均值
mean(A) %A為矩陣,返回A中各列元素的平均值構(gòu)成的向量
mean(A,dim) %在給出的維數(shù)內(nèi)的平均值
說(shuō)明 X為向量時(shí),算術(shù)平均值的數(shù)學(xué)含義是,即樣本均值.
例4-30
>> A=[1 3 4 5;2 3 4 6;1 3 1 5]
A =
1 3 4 5
2 3 4 6
1 3 1 5
>> mean(A)
ans =
1.3333 3.0000 3.0000 5.3333
>> mean(A,1)
ans =
1.3333 3.0000 3.0000 5.3333
命令 忽略NaN計(jì)算算術(shù)平均值
格式 nanmean(X) %X為向量,返回X中除NaN外元素的算術(shù)平均值.
nanmean(A) %A為矩陣,返回A中各列除NaN外元素的算術(shù)平均值向量.
例4-31
>> A=[1 2 3;nan 5 2;3 7 nan]
A =
1 2 3
NaN 5 2
3 7 NaN
>> nanmean(A)
ans =
2.0000 4.6667 2.5000
命令 利用median計(jì)算中值(中位數(shù))
格式 median(X) %X為向量,返回X中各元素的中位數(shù).
median(A) %A為矩陣,返回A中各列元素的中位數(shù)構(gòu)成的向量.
median(A,dim) %求給出的維數(shù)內(nèi)的中位數(shù)
例4-32
>> A=[1 3 4 5;2 3 4 6;1 3 1 5]
A =
1 3 4 5
2 3 4 6
1 3 1 5
>> median(A)
ans =
1 3 4 5
命令 忽略NaN計(jì)算中位數(shù)
格式 nanmedian(X) %X為向量,返回X中除NaN外元素的中位數(shù).
nanmedian(A) %A為矩陣,返回A中各列除NaN外元素的中位數(shù)向量.
例4-33
>> A=[1 2 3;nan 5 2;3 7 nan]
A =
1 2 3
NaN 5 2
3 7 NaN
>> nanmedian(A)
ans =
2.0000 5.0000 2.5000
命令 利用geomean計(jì)算幾何平均數(shù)
格式 M=geomean(X) %X為向量,返回X中各元素的幾何平均數(shù).
M=geomean(A) %A為矩陣,返回A中各列元素的幾何平均數(shù)構(gòu)成的向量.
說(shuō)明 幾何平均數(shù)的數(shù)學(xué)含義是,其中:樣本數(shù)據(jù)非負(fù),主要用于對(duì)數(shù)正態(tài)分布.
例4-34
>> B=[1 3 4 5]
B =
1 3 4 5
>> M=geomean(B)
M =
2.7832
>> A=[1 3 4 5;2 3 4 6;1 3 1 5]
A =
1 3 4 5
2 3 4 6
1 3 1 5
>> M=geomean(A)
M =
1.2599 3.0000 2.5198 5.3133
命令 利用harmmean求調(diào)和平均值
格式 M=harmmean(X) %X為向量,返回X中各元素的調(diào)和平均值.
M=harmmean(A) %A為矩陣,返回A中各列元素的調(diào)和平均值構(gòu)成的向量.
說(shuō)明 調(diào)和平均值的數(shù)學(xué)含義是,其中:樣本數(shù)據(jù)非0,主要用于嚴(yán)重偏斜分布.
例4-35
>> B=[1 3 4 5]
B =
1 3 4 5
>> M=harmmean(B)
M =
2.2430
>> A=[1 3 4 5;2 3 4 6;1 3 1 5]
A =
1 3 4 5
2 3 4 6
1 3 1 5
>> M=harmmean(A)
M =
1.2000 3.0000 2.0000 5.2941
4.5.2 數(shù)據(jù)比較
命令 排序
格式 Y=sort(X) %X為向量,返回X按由小到大排序后的向量.
Y=sort(A) %A為矩陣,返回A的各列按由小到大排序后的矩陣.
[Y,I]=sort(A) % Y為排序的結(jié)果,I中元素表示Y中對(duì)應(yīng)元素在A中位置.
sort(A,dim) %在給定的維數(shù)dim內(nèi)排序
說(shuō)明 若X為復(fù)數(shù),則通過|X|排序.
例4-36
>> A=[1 2 3;4 5 2;3 7 0]
A =
1 2 3
4 5 2
3 7 0
>> sort(A)
ans =
1 2 0
3 5 2
4 7 3
>> [Y,I]=sort(A)
Y =
1 2 0
3 5 2
4 7 3
I =
1 1 3
3 2 2
2 3 1
命令 按行方式排序
函數(shù) sortrows
格式 Y=sortrows(A) %A為矩陣,返回矩陣Y,Y按A的第1列由小到大,以行方式排序后生成的矩陣.
Y=sortrows(A, col) %按指定列col由小到大進(jìn)行排序
[Y,I]=sortrows(A, col) % Y為排序的結(jié)果,I表示Y中第col列元素在A中位置.
說(shuō)明 若X為復(fù)數(shù),則通過|X|的大小排序.
例4-37
>> A=[1 2 3;4 5 2;3 7 0]
A =
1 2 3
4 5 2
3 7 0
>> sortrows(A)
ans =
1 2 3
3 7 0
4 5 2
>> sortrows(A,1)
ans =
1 2 3
3 7 0
4 5 2
>> sortrows(A,3)
ans =
3 7 0
4 5 2
1 2 3
>> sortrows(A,[3 2])
ans =
3 7 0
4 5 2
1 2 3
>> [Y,I]=sortrows(A,3)
Y =
3 7 0
4 5 2
1 2 3
I =
3
2
1
命令 求最大值與最小值之差
函數(shù) range
格式 Y=range(X) %X為向量,返回X中的最大值與最小值之差.
Y=range(A) %A為矩陣,返回A中各列元素的最大值與最小值之差.
例4-38
>> A=[1 2 3;4 5 2;3 7 0]
A =
1 2 3
4 5 2
3 7 0
>> Y=range(A)
Y =
3 5 3
4.5.3 期望
命令 計(jì)算樣本均值
函數(shù) mean
格式 用法與前面一樣
例4-39 隨機(jī)抽取6個(gè)滾珠測(cè)得直徑如下:(直徑:mm)
14.70 15.21 14.90 14.91 15.32 15.32
試求樣本平均值
解:>>X=[14.70 15.21 14.90 14.91 15.32 15.32];
>>mean(X) %計(jì)算樣本均值
則結(jié)果如下:
ans =
15.0600
命令 由分布律計(jì)算均值
利用sum函數(shù)計(jì)算
例4-40 設(shè)隨機(jī)變量X的分布律為:
X
-2
-1
0
1
2
P
0.3
0.1
0.2
0.1
0.3
求E (X) E(X2-1)
解:在Matlab編輯器中建立M文件如下:
X=[-2 -1 0 1 2];
p=[0.3 0.1 0.2 0.1 0.3];
EX=sum(X.*p)
Y=X.^2-1
EY=sum(Y.*p)
運(yùn)行后結(jié)果如下:
EX =
0
Y =
3 0 -1 0 3
EY =
1.6000
4.5.4 方差
命令 求樣本方差
函數(shù) var
格式 D=var(X) %var(X)=,若X為向量,則返回向量的樣本方差.
D=var(A) %A為矩陣,則D為A的列向量的樣本方差構(gòu)成的行向量.
D=var(X, 1) %返回向量(矩陣)X的簡(jiǎn)單方差(即置前因子為的方差)
D=var(X, w) %返回向量(矩陣)X的以w為權(quán)重的方差
命令 求標(biāo)準(zhǔn)差
函數(shù) std
格式 std(X) %返回向量(矩陣)X的樣本標(biāo)準(zhǔn)差(置前因子為)即:
std(X,1) %返回向量(矩陣)X的標(biāo)準(zhǔn)差(置前因子為)
std(X, 0) %與std (X)相同
std(X, flag, dim) %返回向量(矩陣)中維數(shù)為dim的標(biāo)準(zhǔn)差值,其中flag=0時(shí),置前因子為;否則置前因子為.
例4-41 求下列樣本的樣本方差和樣本標(biāo)準(zhǔn)差,方差和標(biāo)準(zhǔn)差
14.70 15.21 14.90 15.32 15.32
解:
>>X=[14.7 15.21 14.9 14.91 15.32 15.32];
>>DX=var(X,1) %方差
DX =
0.0559
>>sigma=std(X,1) %標(biāo)準(zhǔn)差
sigma =
0.2364
>>DX1=var(X) %樣本方差
DX1 =
0.0671
>>sigma1=std(X) %樣本標(biāo)準(zhǔn)差
sigma1 =
0.2590
命令 忽略NaN的標(biāo)準(zhǔn)差
函數(shù) nanstd
格式 y = nanstd(X) %若X為含有元素NaN的向量,則返回除NaN外的元素的標(biāo)準(zhǔn)差,若X為含元素NaN的矩陣,則返回各列除NaN外的標(biāo)準(zhǔn)差構(gòu)成的向量.
例4-42
>> M=magic(3) %產(chǎn)生3階魔方陣
M =
8 1 6
3 5 7
4 9 2
>> M([1 6 8])=[NaN NaN NaN] %替換3階魔方陣中第1,6,8個(gè)元素為NaN
M =
NaN 1 6
3 5 NaN
4 NaN 2
>> y=nanstd(M) %求忽略NaN的各列向量的標(biāo)準(zhǔn)差
y =
0.7071 2.8284 2.8284
>> X=[1 5]; %忽略NaN的第2列元素
>> y2=std(X) %驗(yàn)證第2列忽略NaN元素的標(biāo)準(zhǔn)差
y2 =
2.8284
命令 樣本的偏斜度
函數(shù) skewness
格式 y = skewness(X) %X為向量,返回X的元素的偏斜度;X為矩陣,返回X各列元素的偏斜度構(gòu)成的行向量.
y = skewness(X,flag) %flag=0表示偏斜糾正,flag=1(默認(rèn))表示偏斜不糾正.
說(shuō)明 偏斜度樣本數(shù)據(jù)關(guān)于均值不對(duì)稱的一個(gè)測(cè)度,如果偏斜度為負(fù),說(shuō)明均值左邊的數(shù)據(jù)比均值右邊的數(shù)據(jù)更散;如果偏斜度為正,說(shuō)明均值右邊的數(shù)據(jù)比均值左邊的數(shù)據(jù)更散,因而正態(tài)分布的偏斜度為 0;偏斜度是這樣定義的:
其中:μ為x的均值,σ為x的標(biāo)準(zhǔn)差,E(.)為期望值算子
例4-43
>> X=randn([5,4])
X =
0.2944 0.8580 -0.3999 0.6686
-1.3362 1.2540 0.6900 1.1908
0.7143 -1.5937 0.8156 -1.2025
1.6236 -1.4410 0.7119 -0.0198
-0.6918 0.5711 1.2902 -0.1567
>> y=skewness(X)
y =
-0.0040 -0.3136 -0.8865 -0.2652
>> y=skewness(X,0)
y =
-0.0059 -0.4674 -1.3216 -0.3954?
?
admin 2007-11-29 20:48
4.5.5 常見分布的期望和方差
命令 均勻分布(連續(xù))的期望和方差
函數(shù) unifstat
格式 [M,V] = unifstat(A,B) %A,B為標(biāo)量時(shí),就是區(qū)間上均勻分布的期望和方差,A,B也可為向量或矩陣,則M,V也是向量或矩陣.
例4-44
>>a = 1:6; b = 2.*a;
>>[M,V] = unifstat(a,b)
M =
1.5000 3.0000 4.5000 6.0000 7.5000 9.0000
V =
0.0833 0.3333 0.7500 1.3333 2.0833 3.0000
命令 正態(tài)分布的期望和方差
函數(shù) normstat
格式 [M,V] = normstat(MU,SIGMA) %MU,SIGMA可為標(biāo)量也可為向量或矩陣,則M=MU,V=SIGMA2.
例4-45
>> n=1:4;
>> [M,V]=normstat(n'*n,n'*n)
M =
1 2 3 4
2 4 6 8
3 6 9 12
4 8 12 16
V =
1 4 9 16
4 16 36 64
9 36 81 144
16 64 144 256
命令 二項(xiàng)分布的均值和方差
函數(shù) binostat
格式 [M,V] = binostat(N,P) %N,P為二項(xiàng)分布的兩個(gè)參數(shù),可為標(biāo)量也可為向量或矩陣.
例4-46
>>n = logspace(1,5,5)
n =
10 100 1000 10000 100000
>>[M,V] = binostat(n,1./n)
M =
1 1 1 1 1
V =
0.9000 0.9900 0.9990 0.9999 1.0000
>>[m,v] = binostat(n,1/2)
m =
5 50 500 5000 50000
v =
1.0e+04 *
0.0003 0.0025 0.0250 0.2500 2.5000
常見分布的期望和方差見下表4-6.
表4-6 常見分布的均值和方差
函數(shù)名
調(diào)用形式
注 釋
unifstat
[M,V]=unifstat ( a, b)
均勻分布(連續(xù))的期望和方差,M為期望,V為方差
unidstat
[M,V]=unidstat (n)
均勻分布(離散)的期望和方差
expstat
[M,V]=expstat (p, Lambda)
指數(shù)分布的期望和方差
normstat
[M,V]=normstat(mu,sigma)
正態(tài)分布的期望和方差
chi2stat
[M,V]=chi2stat (x, n)
卡方分布的期望和方差
tstat
[M,V]=tstat ( n)
t分布的期望和方差
fstat
[M,V]=fstat ( n1, n2)
F分布的期望和方差
gamstat
[M,V]=gamstat ( a, b)
分布的期望和方差
betastat
[M,V]=betastat ( a, b)
分布的期望和方差
lognstat
[M,V]=lognstat ( mu, sigma)
對(duì)數(shù)正態(tài)分布的期望和方差
nbinstat
[M,V]=nbinstat ( R, P)
負(fù)二項(xiàng)式分布的期望和方差
ncfstat
[M,V]=ncfstat ( n1, n2, delta)
非中心F分布的期望和方差
nctstat
[M,V]=nctstat ( n, delta)
非中心t分布的期望和方差
ncx2stat
[M,V]=ncx2stat ( n, delta)
非中心卡方分布的期望和方差
raylstat
[M,V]=raylstat ( b)
瑞利分布的期望和方差
Weibstat
[M,V]=weibstat ( a, b)
韋伯分布的期望和方差
Binostat
[M,V]=binostat (n,p)
二項(xiàng)分布的期望和方差
Geostat
[M,V]=geostat (p)
幾何分布的期望和方差
hygestat
[M,V]=hygestat (M,K,N)
超幾何分布的期望和方差
Poisstat
[M,V]=poisstat (Lambda)
泊松分布的期望和方差
4.5.6 協(xié)方差與相關(guān)系數(shù)
命令 協(xié)方差
函數(shù) cov
格式 cov(X) %求向量X的協(xié)方差
cov(A) %求矩陣A的協(xié)方差矩陣,該協(xié)方差矩陣的對(duì)角線元素是A的各列的方差,即:var(A)=diag(cov(A)).
cov(X,Y) %X,Y為等長(zhǎng)列向量,等同于cov([X Y]).
例4-47
>> X=[0 -1 1]';Y=[1 2 2]';
>> C1=cov(X) %X的協(xié)方差
C1 =
1
>> C2=cov(X,Y) %列向量X,Y的協(xié)方差矩陣,對(duì)角線元素為各列向量的方差
C2 =
1.0000 0
0 0.3333
>> A=[1 2 3;4 0 -1;1 7 3]
A =
1 2 3
4 0 -1
1 7 3
>> C1=cov(A) %求矩陣A的協(xié)方差矩陣
C1 =
3.0000 -4.5000 -4.0000
-4.5000 13.0000 6.0000
-4.0000 6.0000 5.3333
>> C2=var(A(:,1)) %求A的第1列向量的方差
C2 =
3
>> C3=var(A(:,2)) %求A的第2列向量的方差
C3 =
13
>> C4=var(A(:,3))
C4 =
5.3333
命令 相關(guān)系數(shù)
函數(shù) corrcoef
格式 corrcoef(X,Y) %返回列向量X,Y的相關(guān)系數(shù),等同于corrcoef([X Y]).
corrcoef (A) %返回矩陣A的列向量的相關(guān)系數(shù)矩陣
例4-48
>> A=[1 2 3;4 0 -1;1 3 9]
A =
1 2 3
4 0 -1
1 3 9
>> C1=corrcoef(A) %求矩陣A的相關(guān)系數(shù)矩陣
C1 =
1.0000 -0.9449 -0.8030
-0.9449 1.0000 0.9538
-0.8030 0.9538 1.0000
>> C1=corrcoef(A(:,2),A(:,3)) %求A的第2列與第3列列向量的相關(guān)系數(shù)矩陣
C1 =
1.0000 0.9538
0.9538 1.0000
4.6 統(tǒng)計(jì)作圖
4.6.1 正整數(shù)的頻率表
命令 正整數(shù)的頻率表
函數(shù) tabulate
格式 table = tabulate(X) %X為正整數(shù)構(gòu)成的向量,返回3列:第1列中包含X的值第2列為這些值的個(gè)數(shù),第3列為這些值的頻率.
例4-49
>> A=[1 2 2 5 6 3 8]
A =
1 2 2 5 6 3 8
>> tabulate(A)
Value Count Percent
1 1 14.29%
2 2 28.57%
3 1 14.29%
4 0 0.00%
5 1 14.29%
6 1 14.29%
7 0 0.00%
8 1 14.29%
4.6.2 經(jīng)驗(yàn)累積分布函數(shù)圖形
函數(shù) cdfplot
格式 cdfplot(X) %作樣本X(向量)的累積分布函數(shù)圖形
h = cdfplot(X) %h表示曲線的環(huán)柄
[h,stats] = cdfplot(X) %stats表示樣本的一些特征
例4-50
>> X=normrnd (0,1,50,1);
>> [h,stats]=cdfplot(X)
h =
3.0013
stats =
min: -1.8740 %樣本最小值
max: 1.6924 %最大值
mean: 0.0565 %平均值
median: 0.1032 %中間值
std: 0.7559 %樣本標(biāo)準(zhǔn)差
4.6.3 最小二乘擬合直線
函數(shù) lsline
格式 lsline %最小二乘擬合直線
h = lsline %h為直線的句柄
例4-51
>> X = [2 3.4 5.6 8 11 12.3 13.8 16 18.8 19.9]';
>> plot(X,'+')
>> lsline
4.6.4 繪制正態(tài)分布概率圖形
函數(shù) normplot
格式 normplot(X) %若X為向量,則顯示正態(tài)分布概率圖形,若X為矩陣,則顯示每一列的正態(tài)分布概率圖形.
h = normplot(X) %返回繪圖直線的句柄
說(shuō)明 樣本數(shù)據(jù)在圖中用"+"顯示;如果數(shù)據(jù)來(lái)自正態(tài)分布,則圖形顯示為直線,而其它分布可能在圖中產(chǎn)生彎曲.
例4-53
>> X=normrnd(0,1,50,1);
>> normplot(X)
圖4-12
4.6.5 繪制威布爾(Weibull)概率圖形
函數(shù) weibplot
格式 weibplot(X) %若X為向量,則顯示威布爾(Weibull)概率圖形,若X為矩陣,則顯示每一列的威布爾概率圖形.
h = weibplot(X) %返回繪圖直線的柄
說(shuō)明 繪制威布爾(Weibull)概率圖形的目的是用圖解法估計(jì)來(lái)自威布爾分布的數(shù)據(jù)X,如果X是威布爾分布數(shù)據(jù),其圖形是直線的,否則圖形中可能產(chǎn)生彎曲.
例4-54
>> r = weibrnd(1.2,1.5,50,1);
>> weibplot(r)
圖4-13
4.6.6 樣本數(shù)據(jù)的盒圖
函數(shù) boxplot
格式 boxplot(X) %產(chǎn)生矩陣X的每一列的盒圖和"須"圖,"須"是從盒的尾部延伸出來(lái),并表示盒外數(shù)據(jù)長(zhǎng)度的線,如果"須"的外面沒有數(shù)據(jù),則在"須"的底部有一個(gè)點(diǎn).
boxplot(X,notch) %當(dāng)notch=1時(shí),產(chǎn)生一凹盒圖,notch=0時(shí)產(chǎn)生一矩箱圖.
boxplot(X,notch,'sym') %sym表示圖形符號(hào),默認(rèn)值為"+".
boxplot(X,notch,'sym',vert) %當(dāng)vert=0時(shí),生成水平盒圖,vert=1時(shí),生成豎直盒圖(默認(rèn)值vert=1).
boxplot(X,notch,'sym',vert,whis) %whis定義"須"圖的長(zhǎng)度,默認(rèn)值為1.5,若whis=0則boxplot函數(shù)通過繪制sym符號(hào)圖來(lái)顯示盒外的所有數(shù)據(jù)值.
例4-55
>>x1 = normrnd(5,1,100,1);
>>x2 = normrnd(6,1,100,1);
>>x = [x1 x2];
>> boxplot(x,1,'g+',1,0)
圖4-14
4.6.7 給當(dāng)前圖形加一條參考線
函數(shù) refline
格式 refline(slope,intercept) % slope表示直線斜率,intercept表示截距
refline(slope) slope=[a b],圖中加一條直線:y=b+ax.
例4-56
>>y = [3.2 2.6 3.1 3.4 2.4 2.9 3.0 3.3 3.2 2.1 2.6]';
>>plot(y,'+')
>>refline(0,3)
圖4-15
4.6.8 在當(dāng)前圖形中加入一條多項(xiàng)式曲線
函數(shù) refcurve
格式 h = refcurve(p) %在圖中加入一條多項(xiàng)式曲線,h為曲線的環(huán)柄,p為多項(xiàng)式系數(shù)向量,p=[p1,p2, p3,…,pn],其中p1為最高冪項(xiàng)系數(shù).
例4-57 火箭的高度與時(shí)間圖形,加入一條理論高度曲線,火箭初速為100m/秒.
>>h = [85 162 230 289 339 381 413 437 452 458 456 440 400 356];
>>plot(h,'+')
>>refcurve([-4.9 100 0])
圖4-16
4.6.9 樣本的概率圖形
函數(shù) capaplot
格式 p = capaplot(data,specs) %data為所給樣本數(shù)據(jù),specs指定范圍,p表示在指定范圍內(nèi)的概率.
說(shuō)明 該函數(shù)返回來(lái)自于估計(jì)分布的隨機(jī)變量落在指定范圍內(nèi)的概率
例4-58
>> data=normrnd (0,1,30,1);
>> p=capaplot(data,[-2,2])
p =
0.9199
圖4-17
4.6.10 附加有正態(tài)密度曲線的直方圖
函數(shù) histfit
格式 histfit(data) %data為向量,返回直方圖
和正態(tài)曲線.
histfit(data,nbins) % nbins指定bar的個(gè)數(shù),
缺省時(shí)為data中數(shù)據(jù)個(gè)數(shù)的平方根.
例4-59
>>r = normrnd (10,1,100,1);
>>histfit(r)
4.6.11 在指定的界線之間畫正態(tài)密度曲線
函數(shù) normspec
格式 p = normspec(specs,mu,sigma) %specs指定界線,mu,sigma為正態(tài)分布的參數(shù)p 為樣本落在上,下界之間的概率.
例4-60
>>normspec([10 Inf],11.5,1.25)
圖4-19?
?
admin 2007-11-29 20:50
4.7 參數(shù)估計(jì)
4.7.1 常見分布的參數(shù)估計(jì)
命令 β分布的參數(shù)a和b的最大似然估計(jì)值和置信區(qū)間
函數(shù) betafit
格式 PHAT=betafit(X)
[PHAT,PCI]=betafit(X,ALPHA)
說(shuō)明 PHAT為樣本X的β分布的參數(shù)a和b的估計(jì)量
PCI為樣本X的β分布參數(shù)a和b的置信區(qū)間,是一個(gè)2×2矩陣,其第1例為參數(shù)a的置信下界和上界,第2例為b的置信下界和上界,ALPHA為顯著水平,(1-α)×100%為置信度.
例4-61 隨機(jī)產(chǎn)生100個(gè)β分布數(shù)據(jù),相應(yīng)的分布參數(shù)真值為4和3.則4和3的最大似然估計(jì)值和置信度為99%的置信區(qū)間為:
解:
>>X = betarnd (4,3,100,1); %產(chǎn)生100個(gè)β分布的隨機(jī)數(shù)
>>[PHAT,PCI] = betafit(X,0.01) %求置信度為99%的置信區(qū)間和參數(shù)a,b的估計(jì)值
結(jié)果顯示
PHAT =
3.9010 2.6193
PCI =
2.5244 1.7488
5.2776 3.4898
說(shuō)明 估計(jì)值3.9010的置信區(qū)間是[2.5244 5.2776],估計(jì)值2.6193的置信區(qū)間是[1.7488 3.4898].
命令 正態(tài)分布的參數(shù)估計(jì)
函數(shù) normfit
格式 [muhat,sigmahat,muci,sigmaci] = normfit(X)
[muhat,sigmahat,muci,sigmaci] = normfit(X,alpha)
說(shuō)明 muhat,sigmahat分別為正態(tài)分布的參數(shù)μ和σ的估計(jì)值,muci,sigmaci分別為置信區(qū)間,其置信度為;alpha給出顯著水平α,缺省時(shí)默認(rèn)為0.05,即置信度為95%.
例4-62 有兩組(每組100個(gè)元素)正態(tài)隨機(jī)數(shù)據(jù),其均值為10,均方差為2,求95%的置信區(qū)間和參數(shù)估計(jì)值.
解:>>r = normrnd (10,2,100,2); %產(chǎn)生兩列正態(tài)隨機(jī)數(shù)據(jù)
>>[mu,sigma,muci,sigmaci] = normfit(r)
則結(jié)果為
mu =
10.1455 10.0527 %各列的均值的估計(jì)值
sigma =
1.9072 2.1256 %各列的均方差的估計(jì)值
muci =
9.7652 9.6288
10.5258 10.4766
sigmaci =
1.6745 1.8663
2.2155 2.4693
說(shuō)明 muci,sigmaci中各列分別為原隨機(jī)數(shù)據(jù)各列估計(jì)值的置信區(qū)間,置信度為95%.
例4-63 分別使用金球和鉑球測(cè)定引力常數(shù)
(1)用金球測(cè)定觀察值為:6.683 6.681 6.676 6.678 6.679 6.672
(2)用鉑球測(cè)定觀察值為:6.661 6.661 6.667 6.667 6.664
設(shè)測(cè)定值總體為,μ和σ為未知.對(duì)(1),(2)兩種情況分別求μ和σ的置信度為0.9的置信區(qū)間.
解:建立M文件:LX0833.m
X=[6.683 6.681 6.676 6.678 6.679 6.672];
Y=[6.661 6.661 6.667 6.667 6.664];
[mu,sigma,muci,sigmaci]=normfit(X,0.1) %金球測(cè)定的估計(jì)
[MU,SIGMA,MUCI,SIGMACI]=normfit(Y,0.1) %鉑球測(cè)定的估計(jì)
運(yùn)行后結(jié)果顯示如下:
mu =
6.6782
sigma =
0.0039
muci =
6.6750
6.6813
sigmaci =
0.0026
0.0081
MU =
6.6640
SIGMA =
0.0030
MUCI =
6.6611
6.6669
SIGMACI =
0.0019
0.0071
由上可知,金球測(cè)定的μ估計(jì)值為6.6782,置信區(qū)間為[6.6750,6.6813];
σ的估計(jì)值為0.0039,置信區(qū)間為[0.0026,0.0081].
泊球測(cè)定的μ估計(jì)值為6.6640,置信區(qū)間為[6.6611,6.6669];
σ的估計(jì)值為0.0030,置信區(qū)間為[0.0019,0.0071].
命令 利用mle函數(shù)進(jìn)行參數(shù)估計(jì)
函數(shù) mle
格式 phat=mle %返回用dist指定分布的最大似然估計(jì)值
[phat, pci]=mle %置信度為95%
[phat, pci]=mle %置信度由alpha確定
[phat, pci]=mle %僅用于二項(xiàng)分布,pl為試驗(yàn)次數(shù).
說(shuō)明 dist為分布函數(shù)名,如:beta(分布),bino(二項(xiàng)分布)等,X為數(shù)據(jù)樣本,alpha為顯著水平α,為置信度.
例4-64
>> X=binornd(20,0.75) %產(chǎn)生二項(xiàng)分布的隨機(jī)數(shù)
X =
16
>> [p,pci]=mle('bino',X,0.05,20) %求概率的估計(jì)值和置信區(qū)間,置信度為95%
p =
0.8000
pci =
0.5634
0.9427
常用分布的參數(shù)估計(jì)函數(shù)
表4-7 參數(shù)估計(jì)函數(shù)表
函數(shù)名
調(diào) 用 形 式
函 數(shù) 說(shuō) 明
binofit
PHAT= binofit(X, N)
[PHAT, PCI] = binofit(X,N)
[PHAT, PCI]= binofit (X, N, ALPHA)
二項(xiàng)分布的概率的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的參數(shù)估計(jì)和置信區(qū)間
poissfit
Lambdahat=poissfit(X)
[Lambdahat, Lambdaci] = poissfit(X)
[Lambdahat, Lambdaci]= poissfit (X, ALPHA)
泊松分布的參數(shù)的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的λ參數(shù)和置信區(qū)間
normfit
[muhat,sigmahat,muci,sigmaci] = normfit(X)
[muhat,sigmahat,muci,sigmaci] = normfit(X, ALPHA)
正態(tài)分布的最大似然估計(jì),置信度為95%
返回水平α的期望,方差值和置信區(qū)間
betafit
PHAT =betafit (X)
[PHAT, PCI]= betafit (X, ALPHA)
返回β分布參數(shù)a和 b的最大似然估計(jì)
返回最大似然估計(jì)值和水平α的置信區(qū)間
unifit
[ahat,bhat] = unifit(X)
[ahat,bhat,ACI,BCI] = unifit(X)
[ahat,bhat,ACI,BCI]=unifit(X, ALPHA)
均勻分布參數(shù)的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的參數(shù)估計(jì)和置信區(qū)間
expfit
muhat =expfit(X)
[muhat,muci] = expfit(X)
[muhat,muci] = expfit(X,alpha)
指數(shù)分布參數(shù)的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的參數(shù)估計(jì)和置信區(qū)間
gamfit
phat =gamfit(X)
[phat,pci] = gamfit(X)
[phat,pci] = gamfit(X,alpha)
γ分布參數(shù)的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回最大似然估計(jì)值和水平α的置信區(qū)間
weibfit
phat = weibfit(X)
[phat,pci] = weibfit(X)
[phat,pci] = weibfit(X,alpha)
韋伯分布參數(shù)的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的參數(shù)估計(jì)及其區(qū)間估計(jì)
Mle
phat = mle('dist',data)
[phat,pci] = mle('dist',data)
[phat,pci] = mle('dist',data,alpha)
[phat,pci] = mle('dist',data,alpha,p1)
分布函數(shù)名為dist的最大似然估計(jì)
置信度為95%的參數(shù)估計(jì)和置信區(qū)間
返回水平α的最大似然估計(jì)值和置信區(qū)間
僅用于二項(xiàng)分布,pl為試驗(yàn)總次數(shù)
說(shuō)明 各函數(shù)返回已給數(shù)據(jù)向量X的參數(shù)最大似然估計(jì)值和置信度為(1-α)×100%的置信區(qū)間.α的默認(rèn)值為0.05,即置信度為95%.
4.7.2 非線性模型置信區(qū)間預(yù)測(cè)
命令 高斯—牛頓法的非線性最小二乘數(shù)據(jù)擬合
函數(shù) nlinfit
格式 beta = nlinfit(X,y,FUN,beta0) %返回在FUN中描述的非線性函數(shù)的系數(shù).FUN為用戶提供形如的函數(shù),該函數(shù)返回已給初始參數(shù)估計(jì)值β和自變量X的y的預(yù)測(cè)值.
[beta,r,J] = nlinfit(X,y,FUN,beta0) %beta為擬合系數(shù),r為殘差,J為Jacobi矩陣,beta0為初始預(yù)測(cè)值.
說(shuō)明 若X為矩陣,則X的每一列為自變量的取值,y是一個(gè)相應(yīng)的列向量.如果FUN中使用了@,則表示函數(shù)的柄.
例4-65 調(diào)用MATLAB提供的數(shù)據(jù)文件reaction.mat
>>load reaction
>>betafit = nlinfit(reactants,rate,@hougen,beta)
betafit =
1.2526
0.0628
0.0400
0.1124
1.1914
命令 非線性模型的參數(shù)估計(jì)的置信區(qū)間
函數(shù) nlparci
格式 ci = nlparci(beta,r,J) %返回置信度為95%的置信區(qū)間,beta為非線性最小二乘法估計(jì)的參數(shù)值,r為殘差,J為Jacobian矩陣.nlparci可以用nlinfit函數(shù)的輸出作為其輸入.
例4-66 調(diào)用MATLAB中的數(shù)據(jù)reaction.
>>load reaction
>>[beta,resids,J] = nlinfit(reactants,rate,'hougen',beta)
beta =
1.2526
0.0628
0.0400
0.1124
1.1914
resids =
0.1321
-0.1642
-0.0909
0.0310
0.1142
0.0498
-0.0262
0.3115
-0.0292
0.1096
0.0716
-0.1501
-0.3026
J =
6.8739 -90.6536 -57.8640 -1.9288 0.1614
3.4454 -48.5357 -13.6240 -1.7030 0.3034
5.3563 -41.2099 -26.3042 -10.5217 1.5095
1.6950 0.1091 0.0186 0.0279 1.7913
2.2967 -35.5658 -6.0537 -0.7567 0.2023
11.8670 -89.5655 -170.1745 -8.9566 0.4400
4.4973 -14.4262 -11.5409 -9.3770 2.5744
4.1831 -41.7896 -16.8937 -5.7794 1.0082
11.8286 -51.3721 -154.1164 -27.7410 1.5001
9.1514 -25.5948 -76.7844 -30.7138 2.5790
3.3373 0.0900 0.0720 0.1080 3.5269
9.3663 -102.0611 -107.4327 -3.5811 0.2200
4.7512 -24.4631 -16.3087 -10.3002 2.1141
>>ci = nlparci(beta,resids,J)
ci =
-0.7467 3.2519
-0.0377 0.1632
-0.0312 0.1113
-0.0609 0.2857
-0.7381 3.1208
命令 非線性擬合和顯示交互圖形
函數(shù) nlintool
格式 nlintool(x,y,FUN,beta0) %返回?cái)?shù)據(jù)(x,y)的非線性曲線的預(yù)測(cè)圖形,它用2條紅色曲線預(yù)測(cè)全局置信區(qū)間.beta0為參數(shù)的初始預(yù)測(cè)值,置信度為95%.
nlintool(x,y,FUN,beta0,alpha) %置信度為(1-alpha)×100%
例4-67 調(diào)用MATLAB數(shù)據(jù)
>> load reaction
>> nlintool(reactants,rate,'hougen',beta)
圖4-20
命令 非線性模型置信區(qū)間預(yù)測(cè)
函數(shù) nlpredci
格式 ypred = nlpredci(FUN,inputs,beta,r,J) % ypred 為預(yù)測(cè)值,FUN與前面相同,beta為給出的適當(dāng)參數(shù),r為殘差,J為Jacobian矩陣,inputs為非線性函數(shù)中的獨(dú)立變量的矩陣值.
[ypred,delta] = nlpredci(FUN,inputs,beta,r,J) %delta為非線性最小二乘法估計(jì)的置信區(qū)間長(zhǎng)度的一半,當(dāng)r長(zhǎng)度超過beta的長(zhǎng)度并且J的列滿秩時(shí),置信區(qū)間的計(jì)算是有效的.[ypred-delta,ypred+delta]為置信度為95%的不同步置信區(qū)間.
ypred = nlpredci(FUN,inputs,beta,r,J,alpha,'simopt','predopt') %控制置信區(qū)間的類型,置信度為100(1-alpha)%.'simopt' = 'on' 或'off' (默認(rèn)值)分別表示同步或不同步置信區(qū)間.'predopt'='curve' (默認(rèn)值) 表示輸入函數(shù)值的置信區(qū)間, 'predopt'='observation' 表示新響應(yīng)值的置信區(qū)間.nlpredci可以用nlinfit函數(shù)的輸出作為其輸入.
例4-68 續(xù)前例,在[100 300 80]處的預(yù)測(cè)函數(shù)值ypred和置信區(qū)間一半寬度delta
>> load reaction
>> [beta,resids,J] = nlinfit(reactants,rate,@hougen,beta);
>> [ypred,delta] = nlpredci(@hougen,[100 300 80],beta,resids,J)
結(jié)果為:
ypred =
10.9113
delta =
0.3195
命令 非負(fù)最小二乘
函數(shù) nnls(該函數(shù)已被函數(shù)lsnonneg代替,在6.0版中使用nnls將產(chǎn)生警告信息)
格式 x = nnls(A,b) %最小二乘法判斷方程A×x=b的解,返回在x≥0的條件下使得最小的向量x,其中A和b必須為實(shí)矩陣或向量.
x = nnls(A,b,tol) % tol為指定的誤差
[x,w] = nnls(A,b) %當(dāng)x中元素時(shí),,當(dāng)時(shí).
[x,w] = nnls(A,b,tol)
例4- 69
>> A =[0.0372 0.2869;0.6861 0.7071;0.6233 0.6245;0.6344 0.6170];
>> b=[0.8587 0.1781 0.0747 0.8405]';
>> x=nnls(A,b)
Warning: NNLS is obsolete and has been replaced by LSQNONNEG.
NNLS now calls LSQNONNEG which uses the following syntax:
[X,RESNORM,RESIDUAL,EXITFLAG,OUTPUT,LAMBDA]
=lsqnonneg(A,b,X0, Options) ;
Use OPTIMSET to define optimization options, or type
'edit nnls' to view the code used here. NNLS will be
removed in the future; please use NNLS with the new syntax.
x =
0
0.6929
命令 有非負(fù)限制的最小二乘
函數(shù) lsqnonneg
格式 x = lsqnonneg(C,d) %返回在x≥0的條件下使得最小的向量x,其中C和d必須為實(shí)矩陣或向量.
x = lsqnonneg(C,d,x0) % x0為初始點(diǎn),x0≥0
x = lsqnonneg(C,d,x0,options) %options為指定的優(yōu)化參數(shù),參見options函數(shù).
[x,resnorm] = lsqnonneg(…) %resnorm表示norm(C*x-d).^2的殘差
[x,resnorm,residual] = lsqnonneg(…) %residual表示C*x-d的殘差
例4- 70
>> A =[0.0372 0.2869;0.6861 0.7071;0.6233 0.6245;0.6344 0.6170];
>> b=[0.8587 0.1781 0.0747 0.8405]';
>> [x,resnorm,residual] = lsqnonneg(A,b)
x =
0
0.6929
resnorm =
0.8315
residual =
0.6599
-0.3119
-0.3580
0.4130
4.7.3 對(duì)數(shù)似然函數(shù)
命令 負(fù)分布的對(duì)數(shù)似然函數(shù)
函數(shù) Betalike
格式 logL=betalike(params,data) %返回負(fù)分布的對(duì)數(shù)似然函數(shù),params為向量[a, b],是分布的參數(shù),data為樣本數(shù)據(jù).
[logL,info]=betalike(params,data) %返回Fisher逆信息矩陣info.如果params 中輸入的參數(shù)是極大似然估計(jì)值,那么info的對(duì)角元素為相應(yīng)參數(shù)的漸近方差.
說(shuō)明 betalike是分布最大似然估計(jì)的實(shí)用函數(shù).似然函數(shù)假設(shè)數(shù)據(jù)樣本中,所有的元素相互獨(dú)立.因?yàn)閎etalike返回負(fù)對(duì)數(shù)似然函數(shù),用fmins函數(shù)最小化betalike與最大似然估計(jì)的功能是相同的.
例4-71 本例所取的數(shù)據(jù)是隨機(jī)產(chǎn)生的分布數(shù)據(jù).
>>r = betarnd(3,3,100,1);
>>[logL,info] = betalike([2.1234,3.4567],r)
logL =
-12.4340
info =
0.1185 0.1364
0.1364 0.2061
命令 負(fù)分布的對(duì)數(shù)似然估計(jì)
函數(shù) Gamlike
格式 logL=gamlike(params,data) %返回由給定樣本數(shù)據(jù)data確定的分布的參數(shù)為params(即[a,b])的負(fù)對(duì)數(shù)似然函數(shù)值
[logL,info]=gamlike(params,data) %返回Fisher逆信息矩陣info.如果params中輸入的參數(shù)是極大似然估計(jì)值,那么info的對(duì)角元素為相應(yīng)參數(shù)的漸近方差.
說(shuō)明 gamlike是分布的最大似然估計(jì)函數(shù).因?yàn)間amlike返回對(duì)數(shù)似然函數(shù)值,故用fmins函數(shù)將gamlike最小化后,其結(jié)果與最大似然估計(jì)是相同的.
例4-72
>>r=gamrnd(2,3,100,1);
>>[logL,info]=gamlike([2.4212, 2.5320],r)
logL =
275.4602
info =
0.0453 -0.0538
-0.0538 0.0867
命令 負(fù)正態(tài)分布的對(duì)數(shù)似然函數(shù)
函數(shù) normlike
格式 logL=normlike(params,data) %返回由給定樣本數(shù)據(jù)data確定的,負(fù)正態(tài)分布的,參數(shù)為params(即[mu,sigma])的對(duì)數(shù)似然函數(shù)值.
[logL,info]=normlike(params,data) %返回Fisher逆信息矩陣info.如果params中輸入的參數(shù)是極大似然估計(jì)值,那么info的對(duì)角元素為相應(yīng)參數(shù)的漸近方差.
命令 威布爾分布的對(duì)數(shù)似然函數(shù)
函數(shù) Weiblike
格式 logL = weiblike(params,data) %返回由給定樣本數(shù)據(jù)data確定的,威布爾分布的,參數(shù)為params(即[a,b])的對(duì)數(shù)似然函數(shù)值.
[logL,info]=weiblike(params,data) %返回Fisher逆信息矩陣info.如果params中輸入的參數(shù)是極大似然估計(jì)值,那么info的對(duì)角元素為相應(yīng)參數(shù)的漸近方差.
說(shuō)明 威布爾分布的負(fù)對(duì)數(shù)似然函數(shù)定義為
例4-73
>>r=weibrnd(0.4,0.98,100,1);
>>[logL,info]=weiblike([0.1342,0.9876],r)
logL =
237.6682
info =
0.0004 -0.0002
-0.0002 0.0078
4.8 假設(shè)檢驗(yàn)
4.8.1 已知,單個(gè)正態(tài)總體的均值μ的假設(shè)檢驗(yàn)(U檢驗(yàn)法)
函數(shù) ztest
格式 h = ztest(x,m,sigma) % x為正態(tài)總體的樣本,m為均值μ0,sigma為標(biāo)準(zhǔn)差,顯著性水平為0.05(默認(rèn)值)
h = ztest(x,m,sigma,alpha) %顯著性水平為alpha
[h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail) %sig為觀察值的概率,當(dāng)sig為小概率時(shí)則對(duì)原假設(shè)提出質(zhì)疑,ci為真正均值μ的1-alpha置信區(qū)間,zval為統(tǒng)計(jì)量的值.
說(shuō)明 若h=0,表示在顯著性水平alpha下,不能拒絕原假設(shè);
若h=1,表示在顯著性水平alpha下,可以拒絕原假設(shè).
原假設(shè):,
若tail=0,表示備擇假設(shè):(默認(rèn),雙邊檢驗(yàn));
tail=1,表示備擇假設(shè):(單邊檢驗(yàn));
tail=-1,表示備擇假設(shè):(單邊檢驗(yàn)).
例4-74 某車間用一臺(tái)包裝機(jī)包裝葡萄糖,包得的袋裝糖重是一個(gè)隨機(jī)變量,它服從正態(tài)分布.當(dāng)機(jī)器正常時(shí),其均值為0.5公斤,標(biāo)準(zhǔn)差為0.015.某日開工后檢驗(yàn)包裝機(jī)是否正常,隨機(jī)地抽取所包裝的糖9袋,稱得凈重為(公斤)
0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512
問機(jī)器是否正常
解:總體μ和σ已知,該問題是當(dāng)為已知時(shí),在水平下,根據(jù)樣本值判斷μ=0.5還是.為此提出假設(shè):
原假設(shè):
備擇假設(shè):
>> X=[0.497,0.506,0.518,0.524,0.498,0.511,0.52,0.515,0.512];
>> [h,sig,ci,zval]=ztest(X,0.5,0.015,0.05,0)
結(jié)果顯示為
h =
1
sig =
0.0248 %樣本觀察值的概率
ci =
0.5014 0.5210 %置信區(qū)間,均值0.5在此區(qū)間之外
zval =
2.2444 %統(tǒng)計(jì)量的值
結(jié)果表明:h=1,說(shuō)明在水平下,可拒絕原假設(shè),即認(rèn)為包裝機(jī)工作不正常.
4.8.2 未知,單個(gè)正態(tài)總體的均值μ的假設(shè)檢驗(yàn)( t檢驗(yàn)法)
函數(shù) ttest
格式 h = ttest(x,m) % x為正態(tài)總體的樣本,m為均值μ0,顯著性水平為0.05
h = ttest(x,m,alpha) %alpha為給定顯著性水平
[h,sig,ci] = ttest(x,m,alpha,tail) %sig為觀察值的概率,當(dāng)sig為小概率時(shí)則對(duì)原假設(shè)提出質(zhì)疑,ci為真正均值μ的1-alpha置信區(qū)間.
說(shuō)明 若h=0,表示在顯著性水平alpha下,不能拒絕原假設(shè);
若h=1,表示在顯著性水平alpha下,可以拒絕原假設(shè).
原假設(shè):,
若 tail=0,表示備擇假設(shè):(默認(rèn),雙邊檢驗(yàn));
tail=1,表示備擇假設(shè):(單邊檢驗(yàn));
tail=-1,表示備擇假設(shè):(單邊檢驗(yàn)).
例4-75 某種電子元件的壽命X(以小時(shí)計(jì))服從正態(tài)分布,,σ2均未知.現(xiàn)測(cè)得16只元件的壽命如下
159 280 101 212 224 379 179 264 222 362 168 250
149 260 485 170
問是否有理由認(rèn)為元件的平均壽命大于225(小時(shí))
解:未知,在水平下檢驗(yàn)假設(shè)::,:
>> X=[159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170];
>> [h,sig,ci]=ttest(X,225,0.05,1)
結(jié)果顯示為:
h =
0
sig =
0.2570
ci =
198.2321 Inf %均值225在該置信區(qū)間內(nèi)
結(jié)果表明:H=0表示在水平下應(yīng)該接受原假設(shè),即認(rèn)為元件的平均壽命不大于225小時(shí).
4.8.3 兩個(gè)正態(tài)總體均值差的檢驗(yàn)(t檢驗(yàn))
兩個(gè)正態(tài)總體方差未知但等方差時(shí),比較兩正態(tài)總體樣本均值的假設(shè)檢驗(yàn)
函數(shù) ttest2
格式 [h,sig,ci]=ttest2(X,Y) %X,Y為兩個(gè)正態(tài)總體的樣本,顯著性水平為0.05
[h,sig,ci]=ttest2(X,Y,alpha) %alpha為顯著性水平
[h,sig,ci]=ttest2(X,Y,alpha,tail) %sig為當(dāng)原假設(shè)為真時(shí)得到觀察值的概率,當(dāng)sig為小概率時(shí)則對(duì)原假設(shè)提出質(zhì)疑,ci為真正均值μ的1-alpha置信區(qū)間.
說(shuō)明 若h=0,表示在顯著性水平alpha下,不能拒絕原假設(shè);
若h=1,表示在顯著性水平alpha下,可以拒絕原假設(shè).
原假設(shè):, (為X為期望值,為Y的期望值)
若 tail=0,表示備擇假設(shè):(默認(rèn),雙邊檢驗(yàn));
tail=1,表示備擇假設(shè):(單邊檢驗(yàn));
tail=-1,表示備擇假設(shè):(單邊檢驗(yàn)).
例4-76 在平爐上進(jìn)行一項(xiàng)試驗(yàn)以確定改變操作方法的建議是否會(huì)增加鋼的產(chǎn)率,試驗(yàn)是在同一只平爐上進(jìn)行的.每煉一爐鋼時(shí)除操作方法外,其他條件都盡可能做到相同.先用標(biāo)準(zhǔn)方法煉一爐,然后用建議的新方法煉一爐,以后交替進(jìn)行,各煉10爐,其產(chǎn)率分別為
(1)標(biāo)準(zhǔn)方法:78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3
(2)新方法: 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1
設(shè)這兩個(gè)樣本相互獨(dú)立,且分別來(lái)自正態(tài)總體和,,,均未知.問建議的新操作方法能否提高產(chǎn)率 (取α=0.05)
解:兩個(gè)總體方差不變時(shí),在水平下檢驗(yàn)假設(shè)::,:
>> X=[78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3];
>>Y=[79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1];
>> [h,sig,ci]=ttest2(X,Y,0.05,-1)
結(jié)果顯示為:
h =
1
sig =
2.1759e-004 %說(shuō)明兩個(gè)總體均值相等的概率很小
ci =
-Inf -1.9083
結(jié)果表明:H=1表示在水平下,應(yīng)該拒絕原假設(shè),即認(rèn)為建議的新操作方法提高了產(chǎn)率,因此,比原方法好.
4.8.4 兩個(gè)總體一致性的檢驗(yàn)——秩和檢驗(yàn)
函數(shù) ranksum
格式 p = ranksum(x,y,alpha) %x,y為兩個(gè)總體的樣本,可以不等長(zhǎng),alpha為顯著性水平
[p,h] = ranksum(x,y,alpha) % h為檢驗(yàn)結(jié)果,h=0表示X與Y的總體差別不顯著h=1表示X與Y的總體差別顯著
[p,h,stats] = ranksum(x,y,alpha) %stats中包括:ranksum為秩和統(tǒng)計(jì)量的值以及zval為過去計(jì)算p的正態(tài)統(tǒng)計(jì)量的值
說(shuō)明 P為兩個(gè)總體樣本X和Y為一致的顯著性概率,若P接近于0,則不一致較明顯.
例4-77 某商店為了確定向公司A或公司B購(gòu)買某種商品,將A和B公司以往的各次進(jìn)貨的次品率進(jìn)行比較,數(shù)據(jù)如下所示,設(shè)兩樣本獨(dú)立.問兩公司的商品的質(zhì)量有無(wú)顯著差異.設(shè)兩公司的商品的次品的密度最多只差一個(gè)平移,取α=0.05.
A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5
B:5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3
解:設(shè),分別為A,B兩個(gè)公司的商品次品率總體的均值.則該問題為在水平α=0.05下檢驗(yàn)假設(shè)::,:
>> A=[7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5];
>> B=[5.7 3.2 4.1 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3];
>> [p,h,stats]=ranksum(A,B,0.05)
結(jié)果為:
p =
0.8041
h =
0
stats =
zval: -0.2481
ranksum: 116
結(jié)果表明:一方面,兩樣本總體均值相等的概率為0.8041,不接近于0;另一方面,H=0也說(shuō)明可以接受原假設(shè),即認(rèn)為兩個(gè)公司的商品的質(zhì)量無(wú)明顯差異.
4.8.5 兩個(gè)總體中位數(shù)相等的假設(shè)檢驗(yàn)——符號(hào)秩檢驗(yàn)
函數(shù) signrank
格式 p = signrank(X,Y,alpha) % X,Y為兩個(gè)總體的樣本,長(zhǎng)度必須相同,alpha為顯著性水平,P兩個(gè)樣本X和Y的中位數(shù)相等的概率,p接近于0則可對(duì)原假設(shè)質(zhì)疑.
[p,h] = signrank(X,Y,alpha) % h為檢驗(yàn)結(jié)果:h=0表示X與Y的中位數(shù)之差不顯著,h=1表示X與Y的中位數(shù)之差顯著.
[p,h,stats] = signrank(x,y,alpha) % stats中包括:signrank為符號(hào)秩統(tǒng)計(jì)量的值以及zval為過去計(jì)算p的正態(tài)統(tǒng)計(jì)量的值.
例4-78 兩個(gè)正態(tài)隨機(jī)樣本的中位數(shù)相等的假設(shè)檢驗(yàn)
>> x=normrnd(0,1,20,1);
>> y=normrnd(0,2,20,1);
>> [p,h,stats]=signrank(x,y,0.05)
p =
0.3703
h =
0
stats =
zval: -0.8960
signedrank: 81
結(jié)果表明:h=0表示X與Y的中位數(shù)之差不顯著
4.8.6 兩個(gè)總體中位數(shù)相等的假設(shè)檢驗(yàn)——符號(hào)檢驗(yàn)
函數(shù) signtest
格式 p=signtest(X, Y, alpha) % X,Y為兩個(gè)總體的樣本,長(zhǎng)度必須相同,alpha為顯著性水平,P兩個(gè)樣本X和Y的中位數(shù)相等的概率,p接近于0則可對(duì)原假設(shè)質(zhì)疑.
[p, h]=signtest(X, Y, alpha) % h為檢驗(yàn)結(jié)果:h=0表示X與Y的中位數(shù)之差不顯著,h=1表示X與Y的中位數(shù)之差顯著.
[p,h,stats] = signtest(X,Y,alpha) % stats中sign為符號(hào)統(tǒng)計(jì)量的值
例4-79 兩個(gè)正態(tài)隨機(jī)樣本的中位數(shù)相等的假設(shè)檢驗(yàn)
>> X=normrnd(0,1,20,1);
>> Y=normrnd(0,2,20,1);
>> [p,h,stats]=signtest(X,Y,0.05)
p =
0.2632
h =
0
stats =
sign: 7
結(jié)果表明:h=0表示X與Y的中位數(shù)之差不顯著
4.8.7 正態(tài)分布的擬合優(yōu)度測(cè)試
函數(shù) jbtest
格式 H = jbtest(X) %對(duì)輸入向量X進(jìn)行Jarque-Bera測(cè)試,顯著性水平為0.05.
H = jbtest(X,alpha) %在水平alpha而非5%下施行 Jarque-Bera 測(cè)試,alpha在0和1之間.
[H,P,JBSTAT,CV] = jbtest(X,alpha) %P為接受假設(shè)的概率值,P越接近于0,則可以拒絕是正態(tài)分布的原假設(shè);JBSTAT為測(cè)試統(tǒng)計(jì)量的值,CV為是否拒絕原假設(shè)的臨界值.
說(shuō)明 H為測(cè)試結(jié)果,若H=0,則可以認(rèn)為X是服從正態(tài)分布的;若X=1,則可以否定X服從正態(tài)分布.X為大樣本,對(duì)于小樣本用lillietest函數(shù).
例4-80 調(diào)用MATLAB中關(guān)于汽車重量的數(shù)據(jù),測(cè)試該數(shù)據(jù)是否服從正態(tài)分布
>> load carsmall
>> [h,p,j,cv]=jbtest(Weight)
h =
1
p =
0.0267
j =
7.2448
cv =
5.9915
說(shuō)明 p=2.67%表示應(yīng)該拒絕服從正態(tài)分布的假設(shè);h=1也可否定服從正態(tài)分布;統(tǒng)計(jì)量的值j = 7.2448大于接受假設(shè)的臨界值cv =5.9915,因而拒絕假設(shè)(測(cè)試水平為5%).
4.8.8 正態(tài)分布的擬合優(yōu)度測(cè)試
函數(shù) lillietest
格式 H = lillietest(X) %對(duì)輸入向量X進(jìn)行Lilliefors測(cè)試,顯著性水平為0.05.
H = lillietest(X,alpha) %在水平alpha而非5%下施行Lilliefors測(cè)試,alpha在0.01和0.2之間.
[H,P,LSTAT,CV] = lillietest(X,alpha) %P為接受假設(shè)的概率值,P越接近于0,則可以拒絕是正態(tài)分布的原假設(shè);LSTAT為測(cè)試統(tǒng)計(jì)量的值,CV為是否拒絕原假設(shè)的臨界值.
說(shuō)明 H為測(cè)試結(jié)果,若H=0,則可以認(rèn)為X是服從正態(tài)分布的;若X=1,則可以否定X服從正態(tài)分布.
例4-81
>> Y=chi2rnd(10,100,1);
>> [h,p,l,cv]=lillietest(Y)
h =
1
p =
0.0175
l =
0.1062
cv =
0.0886
說(shuō)明 h=1表示拒絕正態(tài)分布的假設(shè);p = 0.0175表示服從正態(tài)分布的概率很小;統(tǒng)計(jì)量的值l = 0.1062大于接受假設(shè)的臨界值cv =0.0886,因而拒絕假設(shè)(測(cè)試水平為5%).
>>hist(Y)
從圖中看出,數(shù)據(jù)Y不服從正態(tài)分布.
4.8.9 單個(gè)樣本分布的 Kolmogorov-Smirnov 測(cè)試
函數(shù) kstest
格式 H = kstest(X) %測(cè)試向量X是否服從標(biāo)準(zhǔn)正態(tài)分布,測(cè)試水平為5%.
H = kstest(X,cdf) %指定累積分布函數(shù)為cdf的測(cè)試(cdf=[ ]時(shí)表示標(biāo)準(zhǔn)正態(tài)分布),測(cè)試水平為5%
H = kstest(X,cdf,alpha) % alpha為指定測(cè)試水平
[H,P,KSSTAT,CV] = kstest(X,cdf,alpha) %P為原假設(shè)成立的概率,KSSTAT為測(cè)試統(tǒng)計(jì)量的值,CV為是否接受假設(shè)的臨界值.
說(shuō)明 原假設(shè)為X服從標(biāo)準(zhǔn)正態(tài)分布.若H=0則不能拒絕原假設(shè),H=1則可以拒絕原假設(shè).
例4-82 產(chǎn)生100個(gè)威布爾隨機(jī)數(shù),測(cè)試該隨機(jī)數(shù)服從的分布
>> x=weibrnd(1,2,100,1);
>> [H,p,ksstat,cv]=kstest(x,[x weibcdf(x,1,2)],0.05) %測(cè)試是否服從威布爾分布
H =
0
p =
0.3022
ksstat =
0.0959
cv =
0.1340
說(shuō)明 H=0表示接受原假設(shè),統(tǒng)計(jì)量ksstat小于臨界值表示接受原假設(shè).
>> [H,p,ksstat,cv]=kstest(x,[x expcdf(x,1)],0.05) %測(cè)試是否服從指數(shù)分布
H =
1
p =
0.0073
ksstat =
0.1653
cv =
0.1340
說(shuō)明 H=1表明拒絕服從指數(shù)分布的假設(shè).
>> [H,p,ksstat,cv]=kstest(x,[ ],0.05) %測(cè)試是否服從標(biāo)準(zhǔn)正態(tài)分布
H =
1
p =
3.1285e-026
ksstat =
0.5380
cv =
0.1340
說(shuō)明 H=1表明不服從標(biāo)準(zhǔn)正態(tài)分布.
4.8.10 兩個(gè)樣本具有相同的連續(xù)分布的假設(shè)檢驗(yàn)
函數(shù) kstest2
格式 H = kstest2(X1,X2) %測(cè)試向量X1與X2是具有相同的連續(xù)分布,測(cè)試水平為5%.
H = kstest2(X1,X2,alpha) % alpha為測(cè)試水平
[H,P,KSSTAT] = kstest(X,cdf,alpha) %與指定累積分布cdf相同的連續(xù)分布,P為假設(shè)成立的概率,KSSTAT為測(cè)試統(tǒng)計(jì)量的值.
說(shuō)明 原假設(shè)為具有相同連續(xù)分布.測(cè)試結(jié)果為H,若H=0,表示應(yīng)接受原假設(shè);若H=1,表示可以拒絕原假設(shè).這是Kolmogorov-Smirnov測(cè)試方法.
例4-83
>> x=-1:1:5;
>> y=randn(20,1);
>> [h,p,k]=kstest2(x,y)
h =
1
p =
0.0444
k =
0.5643
說(shuō)明 h=1表示可以認(rèn)為向量x與y的分布不相同,相同的概率只有4.4%.
4.9 方差分析
4.9.1 單因素方差分析
單因素方差分析是比較兩組或多組數(shù)據(jù)的均值,它返回原假設(shè)——均值相等的概率
函數(shù) anova1
格式 p = anova1(X) %X的各列為彼此獨(dú)立的樣本觀察值,其元素個(gè)數(shù)相同,p為各列均值相等的概率值,若p值接近于0,則原假設(shè)受到懷疑,說(shuō)明至少有一列均值與其余列均值有明顯不同.
p = anova1(X,group) %X和group為向量且group要與X對(duì)應(yīng)
p = anova1(X,group,'displayopt') % displayopt=on/off表示顯示與隱藏方差分析表圖和盒圖
[p,table] = anova1(…) % table為方差分析表
[p,table,stats] = anova1(…) % stats為分析結(jié)果的構(gòu)造
說(shuō)明 anova1函數(shù)產(chǎn)生兩個(gè)圖:標(biāo)準(zhǔn)的方差分析表圖和盒圖.
方差分析表中有6列:第1列(source)顯示:X中數(shù)據(jù)可變性的來(lái)源;第2列(SS)顯示:用于每一列的平方和;第3列(df)顯示:與每一種可變性來(lái)源有關(guān)的自由度;第4列(MS)顯示:是SS/df的比值;第5列(F)顯示:F統(tǒng)計(jì)量數(shù)值,它是MS的比率;第6列顯示:從F累積分布中得到的概率,當(dāng)F增加時(shí),p值減少.
例4-84 設(shè)有3臺(tái)機(jī)器,用來(lái)生產(chǎn)規(guī)格相同的鋁合金薄板.取樣測(cè)量薄板的厚度,精確至‰厘米.得結(jié)果如下:
機(jī)器1:0.236 0.238 0.248 0.245 0.243
機(jī)器2:0.257 0.253 0.255 0.254 0.261
機(jī)器3:0.258 0.264 0.259 0.267 0.262
檢驗(yàn)各臺(tái)機(jī)器所生產(chǎn)的薄板的厚度有無(wú)顯著的差異
解:
>> X=[0.236 0.238 0.248 0.245 0.243; 0.257 0.253 0.255 0.254 0.261;…
0.258 0.264 0.259 0.267 0.262];
>> P=anova1(X')
結(jié)果為:
P =
1.3431e-005
還有兩個(gè)圖,即圖4-22和圖4-23.
圖4-22 圖4-23
例4-85 建筑橫梁強(qiáng)度的研究:3000磅力量作用在一英寸的橫梁上來(lái)測(cè)量橫梁的撓度,鋼筋橫梁的測(cè)試強(qiáng)度是:82 86 79 83 84 85 86 87;其余兩種更貴的合金橫梁強(qiáng)度測(cè)試為合金1:74 82 78 75 76 77;合金2:79 79 77 78 82 79].
檢驗(yàn)這些合金強(qiáng)度有無(wú)明顯差異
解:
>> strength = [82 86 79 83 84 85 86 87 74 82 78 75 76 77 79 79 77 78 82 79];
>>alloy = {'st','st','st','st','st','st','st','st', 'al1','al1','al1','al1','al1','al1',…
'al2','al2','al2','al2','al2','al2'};
>> [p,table,stats] = anova1(strength,alloy,'on')
結(jié)果為
p =
1.5264e-004
table =
'Source' 'SS' 'df' 'MS' 'F' 'Prob>F'
'Groups' [184.8000] [ 2] [92.4000] [15.4000] [1.5264e-004]
'Error' [102.0000] [17] [ 6.0000] [ ] [ ]
'Total' [286.8000] [19] [ ] [ ] [ ]
stats =
gnames: {3x1 cell}
n: [8 6 6]
source: 'anova1'
means: [84 77 79]
df: 17
s: 2.4495
圖4-24 圖4-25
說(shuō)明 p值顯示,3種合金是明顯不同的,盒圖顯示鋼橫梁的撓度大于另兩種合金橫梁的撓度.
4.9.2 雙因素方差分析
函數(shù) anova2
格式 p = anova2(X,reps)
p = anova2(X,reps,'displayopt')
[p,table] = anova2(…)
[p,table,stats] = anova2(…)
說(shuō)明 執(zhí)行平衡的雙因素試驗(yàn)的方差分析來(lái)比較X中兩個(gè)或多個(gè)列(行)的均值,不同列的數(shù)據(jù)表示因素A的差異,不同行的數(shù)據(jù)表示另一因素B的差異.如果行列對(duì)有多于一個(gè)的觀察點(diǎn),則變量reps指出每一單元觀察點(diǎn)的數(shù)目,每一單元包含reps行,如:
reps=2
其余參數(shù)與單因素方差分析參數(shù)相似.
例4-86 一火箭使用了4種燃料,3種推進(jìn)器作射程試驗(yàn),每種燃料與每種推進(jìn)器的組合各發(fā)射火箭2次,得到結(jié)果如下:
推進(jìn)器(B) B1 B2 B3
A1 58.2000 56.2000 65.3000
52.6000 41.2000 60.8000
A2 49.1000 54.1000 51.6000
燃料A 42.8000 50.5000 48.4000
A3 60.1000 70.9000 39.2000
58.3000 73.2000 40.7000
A4 75.8000 58.2000 48.7000
71.5000 51.0000 41.4000
考察推進(jìn)器和燃料這兩個(gè)因素對(duì)射程是否有顯著的影響
解:建立M文件
X=[58.2000 56.2000 65.3000
52.6000 41.2000 60.8000
49.1000 54.1000 51.6000
42.8000 50.5000 48.4000
60.1000 70.9000 39.2000
58.3000 73.2000 40.7000
75.8000 58.2000 48.7000
71.5000 51.0000 41.4000];
P=anova2(X,2)
結(jié)果為:
P =
0.0035 0.0260 0.0001
顯示方差分析圖為圖4-26.
圖4-26
Matlab6.0數(shù)學(xué)手冊(cè)
?
總結(jié)
以上是生活随笔為你收集整理的Matlab概率统计编程指南的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Asp.net 字符串操作基类(安全,替
- 下一篇: 任务队列和异步接口的正确打开方式(.NE