假设检验(二)
1.假設檢驗可以分為參數檢驗和非參數檢驗?
2.參數檢驗是在總體服從某一分布情況下,檢驗其參數的可信度
?3.參數檢驗一般包含正態分布參數檢驗和其他分布參數檢驗(指數分布、比率p和大樣本等)
4.正態分布參數檢驗一般分為三種:單個正態分布、兩個正態分布和多個正態分布的均值、方差檢驗?
5.成對數據差d因為消除了試驗單元之間的差別,使得標準差不含有實驗單元的差異,故而合化為單樣本t檢驗所作結論更可信
6.多個正態分布檢驗就是方差分析(本文先不作介紹)
先附一張【假設檢驗戰略地圖】
假設檢驗可以分為參數檢驗和非參數檢驗,參數檢驗是在總體服從某一分布情況下,檢驗其參數的可信度;非參數檢驗則是檢驗分布是否真的服從假設的分布。對于參數檢驗,具體到每一種場景,構造的檢驗統計量會不同。本文介紹參數檢驗的正態分布參數檢驗。(檢驗統計量構造過程請參考《概率論與數理統計第二版》,本文只列出檢驗方式與例子)
1.單個正態分布均值檢驗
對于單個正態分布的均值檢驗,分σ已知和σ未知兩種情況:
σ已知時的u檢驗
從甲地發送一個信號到乙地.設乙地接受到的信號值是一個服從正態分布N(μ,0.22)的隨機變量,其中μ為甲地發送的真實信號值.現甲地重復發送同一信號5次,乙地接收到的信號值為
8.05 8.15 8.2 8.1 8.25
設接受方有理由猜測甲地發送的信號值為8,問能否接受這猜測?
首先,建立原假設與備擇假設:
H0∶u=8 vs H1∶μ≠8
接著構造檢驗統計量,方差已知的均值正態檢驗,故采取u檢驗。再根據題意是一個雙側檢驗問題,取顯著性水平α=0.05,查正態標準分布表可得:
根據該例的五個接收樣本可得:
因此,μ值未落入拒絕域內,不能拒絕原假設,即接受原假設,認為猜測成立。
如果采取p值進行檢驗,則
p大于給定的顯著性水平0.05,因此不能拒絕原假設,即接受原假設,認為猜測成立
σ未知時的t檢驗
某廠生產的某種鋁材的長度服從正態分布,其均值設定為240cm.現從該廠抽取5件產品,測得其長度為(單位∶cm)
239.7 239.6 239 240 239.2
試判斷該廠此類鋁材的長度是否滿足設定要求?
首先,建立原假設與備擇假設:
H0∶u=240?vs H1∶μ≠240
接著構造檢驗統計量,方差未知的均值正態檢驗,故采取t檢驗。再根據題意是一個雙側檢驗問題,取顯著性水平α=0.05,查分布表可得:
根據該例的樣本可得:
統計量t落入拒絕域內,因此,拒絕原假設,認為該生產的鋁材的長度不滿足設定要求。
采用p值檢驗,則
p小于給定的顯著性水平0.05,因此拒絕原假設。
2.兩個正態分布均值差檢驗
兩個正態分布均值差檢驗有四種形式:
我們只展示其中一個例子
某廠鑄造車間為提高鑄件的耐磨性而試制了一種鎳合金鑄件以取代銅合金鑄件,為此,從兩種鑄件中各抽取一個容量分別為8和9的樣本,測得其硬度(一種耐磨性指標)為
鎳合金(X)∶76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34
銅合金(Y)∶73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61.
根據專業經驗,硬度服從正態分布,且方差保持不變,試在顯著性水平α=0.05 下判斷鎳合金的硬度是否有明顯提高.
首先,建立原假設與備擇假設:
H0∶u1=u2?vs H1? u1>u2
由于方差未知且相等,采取t檢驗.對于顯著性水平α=0.05,查分布表得:
根據該例的樣本可計算:
因此,拒絕原假設,可判斷鎳合金硬度有顯著提高.
用P值檢驗為:
p值小于給定的顯著性水平,故拒絕原假設
3.正態分布方差檢驗
單個正態方差檢驗
某類鋼板每塊的重量X服從正態分布,其一項質量指標是鋼板重量(單位∶kg)的方差不得超過0.016.現從某天生產的鋼板中隨機抽取25塊,得其樣本方差s'=0.025,問該天生產的鋼板重量的方差是否滿足要求.
首先,建立原假設與備擇假設:
接著構造檢驗統計量,單個正態方差檢驗采取卡方檢驗。再根據題意是一個單側檢驗問題,取顯著性水平α=0.05,查分布表可得:
根據題意計算可得:
統計值落在拒絕域內,因此,拒絕原假設,認為該天生產的鋼板重量不符合要求.
利用p值檢驗可得:
p值小于事先給定的顯著性水平0.05,故拒絕原假設。
兩個正態方差檢驗
甲、乙兩臺機床加工某種零件,零件的直徑服從正態分布,總體方差反映了加工精度,為比較兩臺機床的加工精度有無差別,現從各自加工的零件中分別抽取 7件產品和8件產品,測得其直徑為
?X(機床甲)∶16.2 16.4 15.8 15.5 16.7 15.6 15.8,
Y(機床乙)∶15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0.
首先建立原假設與備擇假設:
接著構造統計量,兩個正態總體方差檢驗,采用F檢驗,再根據題意是一個雙側檢驗問題,取顯著性水平α=0.05,查分布表可得:
根據樣本計算可得:
統計值未落入拒絕域內,則無法拒絕原假設,即在顯著性水平0.05下可以認為兩臺機床的加工精度無顯著差異。
利用p檢驗有:
由于p值大于事先給定的顯著性水平0.05,故不能拒絕原假設.?
4.成對數據檢驗
在對兩個總體均值進行比較時,有時數據是成對出現的,此時若采用二樣本檢驗所得出的結論有可能是不對的。
為了比較兩種谷物種子的優劣,特選取10塊土質不全相同的土地,并將每塊土地分為面積相同的兩部分,分別種植這兩種種子,施肥與田間管理在 20小塊土地上都是一樣,下面是各小塊上的單位產量∶?
土地?編號1~10?
種子一的單位產量x?:23,35,29,42,39,29,37,34,35,28?
種子二的單位產量y?:30,39,35,40,38,34,36,33,41,31?
差d=x-y:???7 ,-4 ,-6 ,2 ,1 ,-5, 1 ,1 ,-6 ,-3
假定單位產量服從正態分布,試問∶兩種種子的平均單位產量在顯著性水平α=0.05上有無顯著差異?
小編這里不再給出具體計算過程,請參考書本《概率論與數理統計第二版》373頁
如果直接用兩正態分布方差未知但相同的t檢驗,我們可以計算出此處p=0.247.
檢驗p值大于顯著性水平,故無法拒絕原假設,即兩種種子的單位產量均值沒有顯著差別
如果換一個角度,檢驗換成均值差d是否服從均值為0的假設。則求解p=0.0435,
可見,該情況下p值小于顯著性水平,故拒絕原假設,即兩種種子的單位產量均值有顯著差別
成對數據的差d已消除了試驗單元(如土質)之間的差別,從而用于檢驗的標準差s已排除土質差異的影響,只保留種子間的差異.而二樣本t檢驗中用于檢驗的標準差s還含有土質差異,從而使得標準差增大,導致因子不顯著.所以成對數據場合化為單樣本t檢驗所作的結論更可信些.
假如上述問題中10塊土地的土質完全一樣,即參加比較的試驗單元完全一樣,則用二樣本t檢驗會更好一些,因為它可提供更多的自由度去估計誤差.?應注意,成對數據的獲得事先要作周密的安排(即試驗設計).在獲得成對數據時不能發生"錯位",從而準確獲得"成對數據"的信息.
參考資料:
《概率論與數理統計第二版》
總結
- 上一篇: 直观机械动图,一秒看懂原理!
- 下一篇: 关键绩效指标与平衡计分卡(KPI/BSC