假设检验背后的逻辑
內容轉自知乎相關問題答案,寫的很清晰。
1. 概述邏輯:
全稱命題只能被否證而不能被證明。這個道理很簡單,個案當然不足以證明一個全稱命題,但是卻可以否定全稱命題。
研究時,我們當然不希望否證自己的研究假設,所以我們就搞個和研究假設相反的虛無假設。如果我們否證了虛無假設,就相當于我們證明了研究假設。所以假設檢驗就是要試圖否證虛無假設,或者說拒絕虛無假設。這是第一層道理。
第二層道理和抽樣分布有關。由于抽樣的原因,樣本并不可能絕對地否證虛無假設。在個案中,小概率事件可以等同于不可能發生的事件。我們在這個意義上去在一定的事先約定的概率水平上去拒絕虛無假設。
作者:慕容飛宇鏈接:https://www.zhihu.com/question/20254932/answer/14502093
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。 2. 具體解釋: 作者:王小明
鏈接:https://www.zhihu.com/question/20254932/answer/45583793
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。
我說我射擊特別厲害,平均能打到8環,那么如何驗證我是不是在吹牛逼呢,那就讓我做幾次射擊看看我水平到底怎么樣。
首先你選擇相信我,假設我沒吹牛,我的成績在8環附近(這就是原假設)。
我作為一個8環水平的選手,射中的環數應該服從一個平均值為8的高斯分布。
但是事先說好我的原則:
1、可能我當天沒吃飽飯呀、或者心情不好呀,而且也就只讓我射擊幾次,我可能發揮不好等等的,所以你不能輕易懷疑我,如果我打7環、6環甚至4環你也不能懷疑我在吹牛;
2、但是畢竟作為一個8環水平的選手,基本功還應該是在的,如果我只打出了2環,你就會懷疑我是不是在吹牛了,請注意,作為一個8環水平的選手,打出2環可是概率極低的事情!
那么根據這個規則我們設置一個閾值比如3.6環(這個閾值就是臨界值),如果我的成績為2環(我的成績是觀察值),那我就是在吹牛。注意作為一個8環選手,打出小于這個閾值的概率是極低的(這個概率就是顯著性水平)。
還有一種判斷我是不是在吹牛的方法是,我已經打完了,計算打出小于我這個成績的概率(這個概率是p值),如果這個概率小于顯著性水平,則說明我的成績小于于臨界值,則說明我在吹牛;反之則我沒吹牛。(這個部分結合下面那個圖來理解)
用統計的說法就是:
1、不輕易拒絕原假設。原假設即使真的成立,而觀察的樣本由于數量較少,觀察值存在一定的波動。所以我們要給原假設一定范圍的容忍度,這個容忍度要盡可能大,觀察值出現在這個范圍內都是可以容忍的。
2、小概率事件發生不正常。如果小概率事件還是發生了,那么就說明原假設有問題。
結合這兩點,我們設置一個隨機變量的區域,這個區域是偏離原假設的,并且發生在這個區域的概率很小,如果實際觀察到的值還是出現在這個不太可能出現的范圍內,那么我們可以拒絕原假設。
兩種決定是否接受原假設的方法:
1、給定發生偏離原假設極端情況的概率(這就是顯著性水平alpha),可以計算得到對應的臨界值(參照圖1,偏離原假設的陰影部分面積表示顯著性水平,對應的坐標表示臨界值)。若觀察值在臨界值范圍內,表示出現這種現象都是比較正常的,則可接受原假設;若觀察值超出臨界值范圍,則表示在原假設條件下出現了不太可能的現象,那么我們就懷疑原假設的成立性,則拒絕原假設。
2、給定發生偏離原假設極端情況的概率。計算出現觀察值及比觀察值還要偏離原假設的概率(這就是p值)。(參照下面這個圖來理解)若p>alpha,則表示觀察值在臨界值范圍內,則可接受原假設(如圖1);若p<alpha,則表示觀察值在臨界值范圍之外,則拒絕原假設(如圖2)。p值是一個人工定義的東西,它其實還是通過判斷觀察值是否在臨界值范圍內來決定是否接受原假設。
?
總結下:
對于一個假設,我不知道它是否成立,而且實際測試過程中也存在許多非確定性因素可能導致我的測試過程不準確,那么我給出一個出現錯誤的容忍度(也就是顯著性水平alpha),根據這個容忍度可以得到相應臨界值(若觀察值在這個范圍內都是正常的,否則不正常),然后將觀察值和這個值比較。
但是有些情況下觀察值不太好看出來,我們可以計算出發生觀察情況以及更壞情況的值(也就是p值)。若p值比alpha值大,則表明觀察值在臨界值范圍內,可接受原假設(如圖1);若p值比alpha值小,則表明觀察值在臨界值范圍外,則決絕原假設(如圖2)。
轉載于:https://www.cnblogs.com/space-place/p/8544303.html
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
- 上一篇: 好全的Android面试题
- 下一篇: Texture Inspection 纹