第五章 χ2检验
第五章 χ2檢驗
?
一、χ2檢驗的定義
二、χ2檢驗與連續型資料假設檢驗的區別
三、χ2檢驗的用途
?
χ2 檢驗(Chi-square test)
對樣本的頻數分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗,即根據樣本的頻數分布來推斷總體的分布。
χ2檢驗與測量數據假設檢驗的區別
測量數據的假設檢驗,其數據屬于連續變量,而χ2檢驗的數據屬于點計而來的間斷變量。
測量數據所來自的總體要求呈正態分布,而χ2檢驗的數據所來自的總體分布是未知的。
測量數據的假設檢驗是對總體參數或幾個總體參數之差所進行的假設檢驗,而χ2 檢驗在多數情況下不是對總體參數的檢驗,而是對總體分布的假設檢驗。
三、χ2檢驗的用途
適合性檢驗;獨立性檢驗;同質性檢驗
適合性檢驗(吻合度檢驗)
是指對樣本的理論數先通過一定的理論分布推算出來,然后用實際觀測值與理論數相比較,從而得出實際觀測值與理論數之間是否吻合。因此又叫吻合度檢驗。
獨立性檢驗
是指研究兩個或兩個以上的計數資料或屬性資料之間是相互獨立的或者是相互聯系的假設檢驗,通過假設所觀測的各屬性之間沒有關聯,然后證明這種無關聯的假設是否成立。
同質性檢驗
在連續型資料的假設檢驗中,對一個樣本方差的同質性檢驗,也需進行χ2 檢驗。
第一節: χ2檢驗的原理與方法
χ2檢驗的基本原理
χ2檢驗統計量的基本形式
χ2值的特點
χ2檢驗的基本步驟
χ2檢驗的注意事項
?
χ2檢驗就是統計樣本的實際觀測值與理論推算值之間的偏離程度。
實際觀測值與理論推算值之間的偏離程度就決定其χ2值的大小。理論值與實際值之間偏差越大, χ2值就越大,越不符合;偏差越小,χ2值就越小,越趨于符合;若兩值完全相等時, χ2值就為0,表明理論值完全符合。
?
?
?
?
χ2值的特點,可加性,非負值,隨O和E而變化
χ2值與概率P成反比, χ2值越小,P值越大,說明實際值與理論值之差越小,樣本分布與假設的理論分布越相一致;
χ2值與概率P成反比, χ2值越小,P值越大,說明實際值與理論值之差越小,樣本分布與假設的理論分布越相一致;?
?
?
由于檢驗的對象-次數資料是間斷性的,而χ2分布是連續型的,檢驗計算所得的χ2值只是近似地服從χ2分布,所以應用連續型的χ2分布的概率檢驗間斷性資料所得的χ2值就有一定的偏差。
由次數資料算得的χ2均有偏大的趨勢,即概率偏低。當df=1,尤其是小樣本時,必須作連續性矯正。
?
第二節:適合性檢驗
適合性檢驗:比較觀測數與理論數是否符合的假設檢驗。
?
在遺傳學中,有許多顯、隱性比率可以劃分為兩組的資料,如欲測其與某種理論比率的適合性,則χ2值可用下表中的簡式進行計算:
第三節:獨立性檢驗
獨立性檢驗的定義
2×2 列聯表的獨立性檢驗
2×c列聯表的獨立性檢驗
r×c列聯表的獨立性檢驗
獨立性檢驗(independence test)
又叫列聯表(contigency table)χ2檢驗,它是研究兩個或兩個以上因子彼此之間是獨立還是相互影響的一類統計方法。
(一)2×2列聯表的獨立性檢驗
設A,B是一個隨機試驗中的兩個事件,其中A可能出現r1 、r2個結果,B可能出現c1、c2個結果,兩因子相互作用形成4格數,分別以O11 、O12 、O21 、O22表示,下表是2×2列聯表的一般形式
?
?
?
?
?
?
?
?
?
?
?
?
轉載于:https://www.cnblogs.com/think-and-do/p/6519013.html
總結
- 上一篇: 从勾股定理到立方公式的整数解
- 下一篇: 人工智能教程