UA MATH566 统计理论 推导卡方拟合优度检验
UA MATH566 統計理論 推導卡方擬合優度檢驗
卡方擬合優度檢驗主要是檢驗categorical data的,假設一共有ddd種category,每一種理論比例為pip_ipi?,滿足
∑i=1dpi=1,pi≥0\sum_{i=1}^d p_i = 1,p_i \ge 0i=1∑d?pi?=1,pi?≥0
假設我們想要檢驗的問題是:
H0:πi=pi,i=1,?,dHa:πi≠pi,?iH_0:\pi_i = p_i,i = 1,\cdots,d \\ H_a:\pi_i \ne p_i,\exists iH0?:πi?=pi?,i=1,?,dHa?:πi??=pi?,?i
假設每一種category的頻數為n1,?,ndn_1,\cdots,n_dn1?,?,nd?,則category data的似然為
L(p1,?,pd)=∏i=1dpiniln?L(p1,?,pd)=∑i=1dniln?piL(p_1,\cdots,p_d) = \prod_{i=1}^d p_i^{n_i} \\ \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_iL(p1?,?,pd?)=i=1∏d?pini??lnL(p1?,?,pd?)=i=1∑d?ni?lnpi?
考慮pip_ipi?的MLE,
max?piln?L(p1,?,pd)=∑i=1dniln?pis.t.∑i=1dpi=1,pi≥0\max_{p_i} \ln L(p_1,\cdots,p_d) = \sum_{i=1}^dn_i\ln p_i \\ s.t.\ \sum_{i=1}^d p_i = 1,p_i \ge 0pi?max?lnL(p1?,?,pd?)=i=1∑d?ni?lnpi?s.t.?i=1∑d?pi?=1,pi?≥0
定義
g(p1,?,pd,λ)=∑i=1dniln?pi?λ(∑i=1dpi?1)?g?pi=nipi?λ=0?pi=niλ?∑i=1dniλ=nλ=1g(p_1,\cdots,p_d,\lambda) = \sum_{i=1}^dn_i\ln p_i - \lambda(\sum_{i=1}^d p_i - 1) \\ \frac{\partial g}{\partial p_i} = \frac{n_i}{p_i} - \lambda = 0 \Rightarrow p_i = \frac{n_i}{\lambda}\Rightarrow \sum_{i=1}^d \frac{n_i}{\lambda} = \frac{n}{\lambda} = 1g(p1?,?,pd?,λ)=i=1∑d?ni?lnpi??λ(i=1∑d?pi??1)?pi??g?=pi?ni???λ=0?pi?=λni???i=1∑d?λni??=λn?=1
所以MLE為
p^i=nin\hat p_i = \frac{n_i}{n}p^?i?=nni??
這個檢驗的似然比為
Λ(n)=∏i=1dπini∏i=1dp^ini=∏i=1d(nπini)ni\Lambda(n) = \frac{\prod_{i=1}^d \pi_i^{n_i}}{\prod_{i=1}^d \hat p_i^{n_i}} = \prod_{i=1}^d \left(\frac{ n\pi_i}{n_i} \right)^{n_i}Λ(n)=∏i=1d?p^?ini??∏i=1d?πini???=i=1∏d?(ni?nπi??)ni?
根據似然比檢驗的原理,當Λ(n)\Lambda(n)Λ(n)比較小的時候應該拒絕原假設。考慮統計量
?2ln?Λ(n)→dχd?12,asn→∞-2\ln \Lambda(n) \to_d \chi^2_{d-1},\ as\ n \to \infty?2lnΛ(n)→d?χd?12?,?as?n→∞
實際計算的時候會用近似:
?2ln?Λ(n)=2∑i=1dniln?ninπi-2\ln \Lambda(n) = 2\sum_{i=1}^d n_i \ln \frac{n_i}{n\pi_i}?2lnΛ(n)=2i=1∑d?ni?lnnπi?ni??
定義Oi=ni,Ei=nπiO_i = n_i, E_i = n\pi_iOi?=ni?,Ei?=nπi?,OiO_iOi?是觀測值,EiE_iEi?是理論值
?2ln?Λ(n)=2∑i=1dOiln?OiEi=∑i=1dln?(OiEi)2Oi=∑i=1dln?(1?Ei?OiEi)2Oi≈∑i=1d(Ei?OiEi)2-2\ln \Lambda(n) = 2\sum_{i=1}^d O_i \ln \frac{O_i}{E_i} = \sum_{i=1}^d \ln \left( \frac{O_i}{E_i} \right)^{2O_i} \\= \sum_{i=1}^d \ln \left(1- \frac{E_i-O_i}{E_i} \right)^{2O_i} \approx \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2?2lnΛ(n)=2i=1∑d?Oi?lnEi?Oi??=i=1∑d?ln(Ei?Oi??)2Oi?=i=1∑d?ln(1?Ei?Ei??Oi??)2Oi?≈i=1∑d?(Ei?Ei??Oi??)2
因此卡方檢驗的統計量為
χ2=∑i=1d(Ei?OiEi)2~χd?12\chi^2 = \sum_{i=1}^d \left( \frac{E_i-O_i}{E_i} \right)^2 \sim \chi^2_{d-1}χ2=i=1∑d?(Ei?Ei??Oi??)2~χd?12?
總結
以上是生活随笔為你收集整理的UA MATH566 统计理论 推导卡方拟合优度检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH571A 回归分析 概念与
- 下一篇: UA MATH571A ANCOVA简介