第三章均数估计与假设检验例题及软件实现(SAS/R/STATA/SPSS)
生活随笔
收集整理的這篇文章主要介紹了
第三章均数估计与假设检验例题及软件实现(SAS/R/STATA/SPSS)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
例3-1
R代碼及結(jié)果
#install.packages("readxl") # 第一運(yùn)行該文件時(shí)加載readxl包用于讀取Excel輸入數(shù)據(jù),將本行開始的#號(hào)刪除即可 library( readxl ) # 調(diào)用外部數(shù)據(jù)程序包readxl# 讀取Data文件夾下的03_01例題的Excel數(shù)據(jù)文件(“../Data/E03_01.xls”代表上一級(jí)文件夾Data中的E03_01.xls) E03_01 <- read_excel( "../Data/E03_01.xls" ) # 符號(hào)“../” 表示回溯到上一級(jí)文件夾#################### 描述讀取的例題數(shù)據(jù) ###########################ls() # 查看工作數(shù)據(jù)文件名稱列表 str(E03_01) # 查看數(shù)據(jù)結(jié)構(gòu):no = 樣本號(hào),mean=樣本均數(shù),sd=標(biāo)準(zhǔn)差 head(E03_01) # 查看數(shù)據(jù)前幾例 summary(E03_01) # 各列的統(tǒng)計(jì)量(未分組) typeof(E03_01) # E03_01的數(shù)據(jù)類型#################### 下面為例題的統(tǒng)計(jì)分析 ###########################shapiro.test(E03_01$mean) # 夏皮羅正態(tài)性檢驗(yàn)-樣本均數(shù)help( shapiro.test ) # 夏皮羅正態(tài)性檢驗(yàn)函數(shù)shapiro.test的詳細(xì)說明結(jié)果表示如下:
library( readxl ) # 調(diào)用外部數(shù)據(jù)程序包readxl > library(readxl) > E03_01 <- read_excel("F:/Data/E03_01.xls") > View(E03_01) > ls() # 查看工作數(shù)據(jù)文件名稱列表 [1] "E03_01" > str(E03_01) # 查看數(shù)據(jù)結(jié)構(gòu):no = 樣本號(hào),mean=樣本均數(shù),sd=標(biāo)準(zhǔn)差 tibble[,3] [100 x 3] (S3: tbl_df/tbl/data.frame)$ no : num [1:100] 1 2 3 4 5 6 7 8 9 10 ...$ mean: num [1:100] 124 121 125 123 124 ...$ sd : num [1:100] 5.94 6.28 3.93 5.17 5.14 3.94 6.02 5.17 3.42 5.12 ... > head(E03_01) # 查看數(shù)據(jù)前幾例 # A tibble: 6 x 3no mean sd<dbl> <dbl> <dbl> 1 1 124. 5.94 2 2 121. 6.28 3 3 125. 3.93 4 4 123. 5.17 5 5 124. 5.14 6 6 124. 3.94 > summary(E03_01) # 各列的統(tǒng)計(jì)量(未分組)no mean sd Min. : 1.00 Min. :119.4 Min. :2.000 1st Qu.: 25.75 1st Qu.:122.8 1st Qu.:4.117 Median : 50.50 Median :123.8 Median :4.865 Mean : 50.50 Mean :123.7 Mean :4.906 3rd Qu.: 75.25 3rd Qu.:124.7 3rd Qu.:5.758 Max. :100.00 Max. :127.1 Max. :8.320 > typeof(E03_01) # E03_01的數(shù)據(jù)類型 [1] "list" > shapiro.test(E03_01$mean) # 夏皮羅正態(tài)性檢驗(yàn)-樣本均數(shù)Shapiro-Wilk normality testdata: E03_01$mean W = 0.99336, p-value = 0.9086 # p>0.5 尚不能認(rèn)為這些樣本的總體不服從正態(tài)分布> help( shapiro.test ) # 夏皮羅正態(tài)性檢驗(yàn)函數(shù)shapiro.test的詳細(xì)說明例3-2 在例3-1中抽得第26號(hào)樣本的均數(shù)為122.96(cm),標(biāo)準(zhǔn)差為4.77(cm),求其總體均數(shù)的95%置信區(qū)間。
用下面公式計(jì)算:
SAS代碼及結(jié)果
data ex3_2;n=10;mean=122.96;std=4.77;t=tinv(0.975,n-1);*t分布的分位數(shù)*pts=t*std/sqrt(n);lclm=mean-pts;uclm=mean+pts; proc print;var lclm uclm; run;STATA代碼及結(jié)果
cii mean 10 122.96 4.77例3-3 某地抽取正常成年人200名,測(cè)得其血清膽固醇的均數(shù)為3.64mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,試估計(jì)該地正常成年人血清膽固醇均數(shù)的95%置信區(qū)間。
本例n>60,可以用正態(tài)近似的方法計(jì)算置信區(qū)間。
SAS代碼及結(jié)果
data ex3_3;n=200;mean=3.64;std=1.20;u=PROBIT(0.975); /* 正態(tài)分布的分位數(shù)*/pts=u*std/sqrt(n);lclm=mean-pts;uclm=mean+pts; proc print;var lclm uclm; run;例3-5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?
SAS代碼1及結(jié)果
data ex3_5;n=36;s_m=130.83;std=25.74;p_m=140;df=n-1;t=(s_m-p_m)/(std/sqrt(n));p=(1-probt(abs(t),df))*2; proc print;var t p; run;SAS代碼2及結(jié)果
data ex3_5;input x@@;cards;112 137 129 126 88 90 105 178 130 128 126 103172 116 125 90 96 162 157 151 135 113 175 129165 171 128 128 160 110 140 163 100 129 116 127;run; proc ttest h0=140;var x; run;
R代碼及結(jié)果
#install.packages("readxl") # 第一運(yùn)行該文件時(shí)加載readxl包用于讀取Excel輸入數(shù)據(jù),將本行開始的#號(hào)刪除即可 library( readxl ) # 調(diào)用外部數(shù)據(jù)程序包readxl # 讀取Data文件夾下的03_05例題的Excel數(shù)據(jù)文件(“../Data/E03_05.xls”代表上一級(jí)文件夾Data中的E03_05.xls) E03_05 <- read_excel( "../Data/E03_05.xls" ) # 符號(hào)“../” 表示回溯到上一級(jí)文件夾#################### 描述讀取的例題數(shù)據(jù) ###########################ls() # 查看工作數(shù)據(jù)文件名稱列表 str(E03_05) # 查看數(shù)據(jù)結(jié)構(gòu):hb=血紅蛋白含量g/L head(E03_05) # 查看數(shù)據(jù)前幾例 summary(E03_05) # 各列的統(tǒng)計(jì)量(未分組)typeof(E03_05) # E03_05的數(shù)據(jù)類型#################### 下面為例題的統(tǒng)計(jì)分析 ############################單樣本t檢驗(yàn),原假設(shè)H0:μ=140 備擇假設(shè)H1:μ!=140 t.test(E03_05$hb,alternative="two.sided",mu=140)help( t.test ) # 單樣本t檢驗(yàn)函數(shù)t.test的詳細(xì)說明結(jié)果:
> E03_05 <- read_excel("F:/Data/E03_05.xls") > View(E03_05) > knitr::opts_chunk$set(echo = TRUE) > ls() # 查看工作數(shù)據(jù)文件名稱列表 [1]"E03_05" > str(E03_05) # 查看數(shù)據(jù)結(jié)構(gòu):hb=血紅蛋白含量g/L tibble[,1] [36 x 1] (S3: tbl_df/tbl/data.frame)$ hb: num [1:36] 112 137 129 126 88 90 105 178 130 128 ... > head(E03_05) # 查看數(shù)據(jù)前幾例 > summary(E03_05) # 各列的統(tǒng)計(jì)量(未分組)hb Min. : 88.0 1st Qu.:112.8 Median :128.0 Mean :130.8 3rd Qu.:152.5 Max. :178.0 > typeof(E03_05) # E03_05的數(shù)據(jù)類型 [1] "list" > #單樣本t檢驗(yàn),原假設(shè)H0:μ=140 備擇假設(shè)H1:μ!=140 > t.test(E03_05$hb,alternative="two.sided",mu=140)One Sample t-testdata: E03_05$hb t = -2.1367, df = 35, p-value = 0.03969 alternative hypothesis: true mean is not equal to 140 95 percent confidence interval:122.1238 139.5428 sample estimates: mean of x 130.8333STATA代碼及結(jié)果
ttest x=140 /*x是變量,140是總體均數(shù)*/ ttesti 36 130.83 25.74 140 /*已知樣本量、均數(shù)、標(biāo)準(zhǔn)差和總體均數(shù)的簡(jiǎn)潔命令*/結(jié)果如上圖
SPSS代碼及結(jié)果
鼠標(biāo)點(diǎn)擊:分析—比較平均值—單樣本T檢驗(yàn)
T-TEST/TESTVAL = 140/MISSING = ANALYSIS/VARIABLES = hb/CRITERIA = CI(.95).例3-6 為比較兩種方法對(duì)乳酸飲料中脂肪含量測(cè)定結(jié)果是否不同,隨機(jī)抽取了10份乳酸飲料制品,分別用脂肪酸水解法和哥特里-羅紫法測(cè)定其結(jié)果如表3-6第(1)~(3)欄。問兩法測(cè)定結(jié)果是否不同?
筆算如下:
SAS代碼及結(jié)果
MEANS或UNIVARIATE或TTEST,三種過程均對(duì)配對(duì)資料做兩樣本均數(shù)比較的t檢驗(yàn)
/*用MEANS作配對(duì)資料兩個(gè)樣本均數(shù)比較的t檢驗(yàn)*/ data ex3_6;input x1 x2 @@;d=x1-x2; cards; 0.840 0.580 0.591 0.509 0.674 0.500 0.632 0.316 0.687 0.337 0.978 0.517 0.750 0.454 0.730 0.512 1.200 0.997 0.870 0.506 ; proc means t prt;var d; run;/*用UNIVARIATE過程作配對(duì)資料兩樣本均數(shù)比較的t檢驗(yàn)*/ proc univariate data=ex3_6;var d; run; /*用TTEST過程作配對(duì)資料兩樣本均數(shù)比較的t檢驗(yàn)*/ proc ttest data=ex3_6;var d; run;
R代碼及結(jié)果
# install.packages("readxl") # 第一運(yùn)行該文件時(shí)加載readxl包用于讀取Excel輸入數(shù)據(jù),將本行開始的#號(hào)刪除即可 library( readxl ) # 調(diào)用外部數(shù)據(jù)程序包readxl# 讀取Data文件夾下的03_06例題的Excel數(shù)據(jù)文件(“../Data/E03_06.xls”代表上一級(jí)文件夾Data中的E03_06.xls) E03_06 <- read_excel( "../Data/E03_06.xls" ) # 符號(hào)“../” 表示回溯到上一級(jí)文件夾#################### 描述讀取的例題數(shù)據(jù) ###########################ls() # 查看工作數(shù)據(jù)文件名稱列表 str(E03_06) # 查看數(shù)據(jù)結(jié)構(gòu):no=編號(hào),X1=哥特里-羅紫法,X2=脂肪酸水解法 head(E03_06) # 查看數(shù)據(jù)前幾例 summary(E03_06) # 各列的統(tǒng)計(jì)量(未分組) typeof(E03_06) # E03_05的數(shù)據(jù)類型#################### 下面為例題的統(tǒng)計(jì)分析 ########################### #配對(duì)樣本t檢驗(yàn)-檢驗(yàn)兩種方法的檢驗(yàn)結(jié)果是否不同 #原假設(shè)H0:μd=0t.test(E03_06$x1-E03_06$x2,mu=0)t.test(E03_06$x1, E03_06$x2, paired=TRUE)help( t.test )結(jié)果如下:
> library(readxl) > E03_06 <- read_excel("F:/Data/E03_06.xls") > View(E03_06) > knitr::opts_chunk$set(echo = TRUE) > ls() # 查看工作數(shù)據(jù)文件名稱列表 [1] "E03_06" > str(E03_06) # 查看數(shù)據(jù)結(jié)構(gòu):no=編號(hào),X1=哥特里-羅紫法,X2=脂肪酸水解法 tibble[,3] [10 x 3] (S3: tbl_df/tbl/data.frame)$ no: num [1:10] 1 2 3 4 5 6 7 8 9 10$ x1: num [1:10] 0.84 0.591 0.674 0.632 0.687 0.978 0.75 0.73 1.2 0.87$ x2: num [1:10] 0.58 0.509 0.5 0.316 0.337 0.517 0.454 0.512 0.997 0.506 > head(E03_06) # 查看數(shù)據(jù)前幾例 > summary(E03_06) # 各列的統(tǒng)計(jì)量(未分組)no x1 x2 Min. : 1.00 Min. :0.5910 Min. :0.3160 1st Qu.: 3.25 1st Qu.:0.6773 1st Qu.:0.4655 Median : 5.50 Median :0.7400 Median :0.5075 Mean : 5.50 Mean :0.7952 Mean :0.5228 3rd Qu.: 7.75 3rd Qu.:0.8625 3rd Qu.:0.5158 Max. :10.00 Max. :1.2000 Max. :0.9970 > typeof(E03_06) # E03_05的數(shù)據(jù)類型 [1] "list" > t.test(E03_06$x1-E03_06$x2,mu=0)One Sample t-testdata: E03_06$x1 - E03_06$x2 t = 7.926, df = 9, p-value = 2.384e-05 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval:0.1946542 0.3501458 sample estimates: mean of x 0.2724 > t.test(E03_06$x1, E03_06$x2, paired=TRUE)Paired t-testdata: E03_06$x1 and E03_06$x2 t = 7.926, df = 9, p-value = 2.384e-05 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:0.1946542 0.3501458 sample estimates: mean of the differences 0.2724STATA代碼及結(jié)果
ttest x1=x2SPSS代碼及結(jié)果
分析—比較平均值----成對(duì)樣本t檢驗(yàn)
T-TESTPAIRS = x1 WITH x2 (PAIRED)/CRITERIA = CI(.95)/MISSING = ANALYSIS.例3-7 為探討青藤堿抗兔動(dòng)脈粥樣硬化作用,采用單純高脂飼料12周喂養(yǎng)方法建立動(dòng)脈粥樣硬化家兔模型。將12周造模成功家兔16只隨機(jī)等分為2組,模型組給予高飼料100g/d;青藤堿組除給予高飼料100g/d,在飼料中添加青藤堿109mg/(kg/d)。連續(xù)喂養(yǎng)3周,實(shí)驗(yàn)結(jié)束后心臟采血測(cè)定心臟血液中高密度脂蛋白,能否認(rèn)為模型組與青藤堿組中高密度脂蛋白含量的總體均數(shù)不同?
本題采用兩樣本T檢驗(yàn)
SAS代碼及結(jié)果
data ex3_7;input x @@;if _n_<9 then c=1;else c=2; cards; 0.66 0.76 0.79 0.88 0.78 0.66 0.75 0.88 0.58 0.69 0.59 0.70 0.69 0.68 0.58 0.60 ; proc ttest;var x;class c; run;
R代碼及結(jié)果
library( readxl ) # 調(diào)用外部數(shù)據(jù)程序包readxl# 讀取Data文件夾下的03_07例題的Excel數(shù)據(jù)文件(“../Data/E03_07.xls”代表上一級(jí)文件夾Data中的E03_07.xls) E03_07 <- read_excel( "../Data/E03_07.xls" ) # 符號(hào)“../” 表示回溯到上一級(jí)文件夾#################### 描述讀取的例題數(shù)據(jù) ###########################ls() # 查看工作數(shù)據(jù)文件名稱列表 str(E03_07) # 查看數(shù)據(jù)結(jié)構(gòu):x=HDL含量(mmol/L),Group=分組(1=青藤堿組;2=模型組) head(E03_07) # 查看數(shù)據(jù)前幾例 summary(E03_07) # 各列的統(tǒng)計(jì)量(未分組) typeof(E03_07) # E03_07的數(shù)據(jù)類型#################### 下面為例題的統(tǒng)計(jì)分析 ########################### #兩獨(dú)立樣本t檢驗(yàn)——檢驗(yàn)?zāi)P徒M和青藤堿組的HDL含量是否不同t.test(x~Group,E03_07,var.equal=TRUE)help( t.test ) # 單樣本t檢驗(yàn)函數(shù)t.test的詳細(xì)說明結(jié)果如下:
> library(readxl) > E03_07 <- read_excel("F:/Data/E03_07.xls") > View(E03_07) > knitr::opts_chunk$set(echo = TRUE) > ls() # 查看工作數(shù)據(jù)文件名稱列表 [1] "E03_06" "E03_07" > str(E03_07) # 查看數(shù)據(jù)結(jié)構(gòu):x=HDL含量(mmol/L),Group=分組(1=青藤堿組;2=模型組) tibble[,2] [16 x 2] (S3: tbl_df/tbl/data.frame)$ Group: num [1:16] 1 1 1 1 1 1 1 1 2 2 ...$ x : num [1:16] 0.66 0.76 0.79 0.88 0.78 0.66 0.75 0.88 0.58 0.69 ... > head(E03_07) # 查看數(shù)據(jù)前幾例 > summary(E03_07) # 各列的統(tǒng)計(jì)量(未分組)Group x Min. :1.0 Min. :0.5800 1st Qu.:1.0 1st Qu.:0.6450 Median :1.5 Median :0.6900 Mean :1.5 Mean :0.7044 3rd Qu.:2.0 3rd Qu.:0.7650 Max. :2.0 Max. :0.8800 > typeof(E03_07) # E03_07的數(shù)據(jù)類型 [1] "list" > > #################### 下面為例題的統(tǒng)計(jì)分析 ########################### > #兩獨(dú)立樣本t檢驗(yàn)——檢驗(yàn)?zāi)P徒M和青藤堿組的HDL含量是否不同 > > t.test(x~Group,E03_07,var.equal=TRUE)Two Sample t-testdata: x by Group t = 3.689, df = 14, p-value = 0.00243 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval:0.05494115 0.20755885 sample estimates: mean in group 1 mean in group 2 0.77000 0.63875STATA代碼及結(jié)果
ttest x,by(group)
代碼說明:
SPSS代碼及結(jié)果
分析–比較平均值–獨(dú)立樣本t檢驗(yàn)
T-TESTGROUPS = grp(1 2)/MISSING = ANALYSIS/VARIABLES = x/CRITERIA = CI(.95).總結(jié)
以上是生活随笔為你收集整理的第三章均数估计与假设检验例题及软件实现(SAS/R/STATA/SPSS)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎样用CMD命令强行删除目录
- 下一篇: 国内***团队“盘古”再出手,最新iPh