UA MATH566 统计理论5 假设检验:p值
UA MATH566 統計理論5 假設檢驗:p值
- p-value
做實證研究的paper大多數都要匯報p值,并且幾乎是只看p值的。2016年ASA做了一個關于p值的statement,指出了關于p值的六個錯用與濫用:
Statement指出,p值表示統計數據與某個特定的統計模型之間兼容性的強弱,并不能衡量研究假說為真的概率。科學結論、政策評估不能偏信p值,合理的推斷應該以試驗結果的充分性與透明性為基礎。p值或者說顯著性更不能衡量某種效應的強弱或者某個結果的重要性,因此它并不是支撐研究假說的好論據。
下面是這個statement給出的合理的統計研究的一些特征:
Statement指出,合理的統計研究需要根據研究背景選擇適當的模型、對原始數據做充分的可視化與描述性統計、正確使用統計模型、對模型結果做出合理的解釋、保證試驗結果具有可重復性。
這一講介紹一下p值,幫助大家更好地理解statement的精神。
p-value
假設θ0\theta_0θ0?是真實的參數(也假設這個就是原假設),檢驗統計量T(X)T(X)T(X)(似然比檢驗那一篇會提到)的真實分布為FT(X)(t∣θ0)F_{T(X)}(t|\theta_0)FT(X)?(t∣θ0?),假設這個分布函數可逆。則p值等于
pvalue=1?FT(X)(T(X)∣θ0)pvalue = 1-F_{T(X)}(T(X)|\theta_0)pvalue=1?FT(X)?(T(X)∣θ0?)
做一般性分析的時候,T(X)T(X)T(X)是隨機變量,因此p值本質上也是一個隨機變量。假設u∈[0,1]u \in [0,1]u∈[0,1],計算
P(FT(X)(T(X)∣θ0)≤u∣θ0)=P(T(X)≤FT(X)?1(u∣θ0)∣θ0)=FT(X)(FT(X)?1(u∣θ0)∣θ0)=uP(F_{T(X)}(T(X)|\theta_0) \le u|\theta_0) = P(T(X) \le F_{T(X)}^{-1}(u|\theta_0)|\theta_0) \\ = F_{T(X)}(F_{T(X)}^{-1}(u|\theta_0)|\theta_0)=uP(FT(X)?(T(X)∣θ0?)≤u∣θ0?)=P(T(X)≤FT(X)?1?(u∣θ0?)∣θ0?)=FT(X)?(FT(X)?1?(u∣θ0?)∣θ0?)=u
也就是說FT(X)(T(X)∣θ0)F_{T(X)}(T(X)|\theta_0)FT(X)?(T(X)∣θ0?)服從均勻分布,所以p值也服從均勻分布。
假設顯著性水平為α\alphaα,則備擇假設下(簡單點,假設為θ=θ1\theta=\theta_1θ=θ1?),拒絕域寫成
C={X:T(X)≥kα}C=\{X:T(X) \ge k_{\alpha}\}C={X:T(X)≥kα?}
p值的分布為
P(1?FT(X)(T(X)∣θ0)≤α∣θ1)=P(FT(X)(T(X)∣θ0)≥1?α∣θ1)=P(FT(X)(T(X)∣θ0)≥FT(X)(kα∣θ0)∣θ1)=P(T(X)≥kα∣θ1)=1?β(α)P(1-F_{T(X)}(T(X)|\theta_0) \le \alpha |\theta_1) = P(F_{T(X)}(T(X)|\theta_0) \ge 1-\alpha|\theta_1) \\ =P(F_{T(X)}(T(X)|\theta_0) \ge F_{T(X)}(k_{\alpha}|\theta_0)|\theta_1) = P(T(X)\ge k_{\alpha}|\theta_1) = 1-\beta(\alpha)P(1?FT(X)?(T(X)∣θ0?)≤α∣θ1?)=P(FT(X)?(T(X)∣θ0?)≥1?α∣θ1?)=P(FT(X)?(T(X)∣θ0?)≥FT(X)?(kα?∣θ0?)∣θ1?)=P(T(X)≥kα?∣θ1?)=1?β(α)
正好是ROC。
結合這兩部分推導,p值的本質是隨機變量,在原假設下,p值服從均勻分布;在備擇假設下,p值的分布就是ROC。一般報告出來的p值是對給出的統計量的值在原假設下計算出來的概率,這個概率的含義與用統計量和相應分位點比較的方法本質上是一回事,沒有提供額外的信息。如果是能夠在備擇假設下計算p值反而會稍微有點幫助,因為這樣能直接給出type II error的概率,但實際應用中這個概率應該是求不出來的。綜上,p值的含義其實相當局限,我們要打破唯p值論!
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的UA MATH566 统计理论5 假设检验:p值的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH566 统计理论7 另一个
- 下一篇: UA MATH636 信息论7 高斯信道