《统计学》学习笔记之分类数据分析
鄙人學(xué)習(xí)筆記
文章目錄
- 分類數(shù)據(jù)分析
- 分類數(shù)據(jù)與卡方統(tǒng)計(jì)量
- 擬合優(yōu)度檢驗(yàn)
- 獨(dú)立性檢驗(yàn)
- 列聯(lián)表中的相關(guān)測量
- 列聯(lián)分析中應(yīng)注意的問題
分類數(shù)據(jù)分析
分類數(shù)據(jù)與卡方統(tǒng)計(jì)量
卡方檢驗(yàn)是對分類數(shù)據(jù)的頻數(shù)進(jìn)行分析的統(tǒng)計(jì)方法。
- 卡方統(tǒng)計(jì)量
卡方統(tǒng)計(jì)量可以用于測定兩個(gè)分類變量之間的相關(guān)程度。若用fo表示觀察值頻數(shù),用fe表示期望值頻數(shù),則卡方統(tǒng)計(jì)量可以寫為:
- 卡方統(tǒng)計(jì)量的特征
擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn)是用卡方統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)顯著性檢驗(yàn)的重要內(nèi)容之一。
它是依據(jù)總體分布狀況,計(jì)算出分類變量中各類別的期望頻數(shù),與分布的觀察頻數(shù)進(jìn)行對比,判斷期望頻數(shù)與觀察頻數(shù)是否有顯著差異,從而達(dá)到對分類變量進(jìn)行分析的目的。
獨(dú)立性檢驗(yàn)
-
列聯(lián)表
列聯(lián)表是由兩個(gè)以上的變量進(jìn)行交叉分類的頻數(shù)分布表。 -
獨(dú)立性檢驗(yàn)
獨(dú)立性檢驗(yàn)就是分析列聯(lián)表中行變量和列變量是否相互獨(dú)立。
列聯(lián)表中的相關(guān)測量
- φ相關(guān)系數(shù)
φ相關(guān)系數(shù)描述2X2列聯(lián)表數(shù)據(jù)相關(guān)程度最常用的一種相關(guān)系數(shù)。它的計(jì)算公式為:
對于2X2列聯(lián)表中的數(shù)據(jù),計(jì)算出的φ相關(guān)系數(shù)可以控制在0~1這個(gè)范圍,但是當(dāng)行數(shù)R或列數(shù)C大于2時(shí),φ相關(guān)系數(shù)會隨著行數(shù)R或列數(shù)C變大而增大,且φ系數(shù)無上限。
- 列聯(lián)相關(guān)系數(shù)
列聯(lián)相關(guān)系數(shù)又稱列聯(lián)系數(shù),簡稱c系數(shù),主要用于大于2X2列聯(lián)表的情況,c系數(shù)的計(jì)算公式為:
當(dāng)列聯(lián)表中的兩個(gè)變量相互獨(dú)立時(shí),c系數(shù)=0,但它不可能大于1,
c系數(shù)的特點(diǎn)是,其可能的最大值依賴于列聯(lián)表的行數(shù)和列數(shù),且隨著R和C的增大而增大。
- V相關(guān)系數(shù)
鑒于φ相關(guān)系數(shù)無上限,c系數(shù)小于1的情況。克萊默提出了V相關(guān)系數(shù),V相關(guān)系數(shù)的計(jì)算公式為:
當(dāng)兩個(gè)變量相互獨(dú)立時(shí),V=0;當(dāng)兩個(gè)變量完全相關(guān)時(shí),V=1。所以V的取值在0一1之間,如果列聯(lián)表中有一維為2,則V值就等于φ值。
對于同一個(gè)數(shù)據(jù),系數(shù)φ、c、V的結(jié)果不同。同樣,對于不
同的列聯(lián)表,行數(shù)和列數(shù)的差異也會影響系數(shù)值。因此。在對不同列聯(lián)表變量之間的相關(guān)程度進(jìn)行比較時(shí)。不同列聯(lián)表中行與行、列與列的個(gè)數(shù)要相同.并且采用同一種系數(shù),這樣的系數(shù)值才具有可比性。
列聯(lián)分析中應(yīng)注意的問題
- 卡方分布的期望準(zhǔn)則
前面談到的用卡方分布進(jìn)行獨(dú)立性檢驗(yàn),要求樣本量必須足夠大,特別是每個(gè)單元中的期望頻數(shù)(理論頻數(shù))不能過小,否則應(yīng)用卡方檢驗(yàn)可能會得出錯(cuò)誤的結(jié)論。
一條準(zhǔn)則是:
如果只有兩個(gè)單元,每個(gè)單元的期望頻數(shù)必須是5或5以上。
另一條準(zhǔn)則是:
倘若有兩個(gè)以上的單元,如果20%的單元期望頻數(shù)fef_efe?小于5,則不能應(yīng)用卡方檢驗(yàn)。
不滿足準(zhǔn)則時(shí)的解決方法:
將fef_efe?較小的類別合并,使得合并后的類別的fe≥5f_e ≥ 5fe?≥5
總結(jié)
以上是生活随笔為你收集整理的《统计学》学习笔记之分类数据分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 中国第二个陨石坑证实!10万年来最大规模
- 下一篇: iPhone 15都要用 微软Win11