讲讲大厂面试必考的假设检验
上次寫了統計學里面的置信度與置信區間以后,文章反響還不錯,這次再來試著寫寫統計學里面的假設檢驗。點擊查看:聊聊置信度與置信區間
假設檢驗的核心其實就是反證法。反證法是數學中的一個概念,就是你要證明一個結論是正確的,那么先假設這個結論是錯誤的,然后以這個結論是錯誤的為前提條件進行推理,推理出來的結果與假設條件矛盾,這個時候就說明這個假設是錯誤的,也就是這個結論是正確的。以上就是反證法的一個簡單思路。
了解完反證法以后,我們開始正式的假設檢驗,這里還是引用一個大家都很熟悉的一個例子『女士品茶』。
女士品茶是一個很久遠的故事,講述了在很久很久以前的一個下午,有一群人在那品茶,這個時候有位女士提出了一個有趣的點,就是把茶加到奶里和把奶加到茶里面最后得到的『奶茶』的味道是不一樣的。大部分人都覺得這位女士在瞎說,只有其中一位男士提出了要用科學的方法去證明到底一樣不一樣(牛人想問題角度永遠都是那么獨特,多想想別人為什么那么說,而不是一上來就不經思考的拒絕)。
接下來,我們具體看一下這一位男士是怎么去證明的。首先他假設了把茶加到奶里和把奶加到茶里面得出來的『奶茶』味道是一樣的。然后隨機把這兩種『奶茶』端給女士,讓女士品,是先加的奶還是先加的茶,如果女士都能品對,說明確實有差異,如果要是品不對,說明是沒差異的。這里面就涉及到一個問題,讓女士品多少杯呢,品一杯肯定是不行的,因為任意一杯猜對(瞎蒙)的概率都有50%。下面是不同杯數對應的猜對的概率(注意,這里是猜對而不是品對)。
通過上表我們可以看出,連續4杯都猜對的概率不足0.1,連續10杯都猜對的概率不足0.001。如果把奶加到茶里和把茶加到奶里面得到的『奶茶』真沒有差別,也就是女士要想品對,基本全靠猜,但是10杯全部猜對的概率不足0.001,我們把這種概率很小很小(這里需要定義一下,具體多小算小概率事件)的事件稱為小概率事件。我們認為小概率事件一般是不會發生的,如果發生了,說明我們的認知就是錯誤的,也就是說女士品茶不是靠猜的,也就是把奶加到茶里和把茶加到奶里面得到的『奶茶』的確是有差別的。
我們把上面這個過程就叫做假設檢驗。
了解完假設檢驗的思想以后,我們來看一下具體步驟:
step1:提出零假設和備擇假設;
零假設(H0)一般是我們要推翻的論點,備擇假設(H1)則是我們要證明的論點。拿上面的女士品茶例子來講。
H0:把茶加到奶里和把奶加到茶里面得到的『奶茶』是一樣的。
H0:把茶加到奶里和把奶加到茶里面得到的『奶茶』是不一樣的。
step2:構造檢驗統計量,并找出在H0假設成立的前提下,該統計量所服從的分布;
檢驗統計量是根據樣本觀測結果計算得到的樣本統計量,并以此對零假設和備擇假設做出決策。
圖片來源于網絡
上面圖片中是三種不同的統計量以及其對應的分布,分別叫做Z檢驗、T建議、卡方檢驗。Z檢驗:一般用于大樣本(即樣本容量大于30)平均值差異性檢驗的方法。它是用標準正態分布的理論來推斷差異發生的概率,從而比較兩個平均數的差異是否顯著。在國內也被稱作u檢驗。
T檢驗:主要用于樣本含量較小(例如n < 30),總體標準差σ未知的正態分布。T檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。
卡方檢驗:卡方檢驗是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。
下面為三種檢驗對應的分布圖:
正態分布
卡方分布,n為自由度
根據不同檢驗的特征,我們可以根據下圖來進行選擇合適的檢驗方式:
step3:根據要求的顯著性水平,求臨界值和拒絕域
還記得我們在前面提到的小概率事件嗎?如果小概率事件發生了,就表示我們的零假設是錯誤的,可是具體多小的概率才算是小概率呢?一般這個概率為0.05,也就是5%,如果一件事情發生的概率小于等于5%,我們就認為這是一個小概率事件,0.05就是顯著性水平,用α表示。顯著性水平把概率分布分為兩個區間:拒絕區間和接受區間,最后計算出來的結果落在拒絕區間,我們就可以拒絕零假設;如果落在了接受區間,我們就需要接受零假設。1-α稱為置信水平(置信度)。
現在我們知道了顯著性水平了,然后就可以根據顯著性水平求得臨界值和拒絕域了。那具體怎么求呢?這里的臨界值就是z值(正太分布用z值)或t值(t分布用t值),以臨界值為端點的區間稱為拒絕域。z值和t值直接根據顯著性水平然后到對應的z值表和t值表中查詢即可。
下圖為雙側檢驗和單側檢驗對應的α、1-α、臨界值、拒絕域、接受域的情況,其中α是表示陰影部分的面積,而不是x軸的值。
雙側檢驗
到這里顯著性水平對應的臨界值和拒絕域就算出來了。
step4:計算檢驗統計量
根據我們在前面選擇檢驗統計量類型,計算對應的檢驗統計量的值。除此之外我們還可以根據樣本量得出P值,P值就是實際樣本中小概率事件的具體概率值。
step5:決策
比較計算出來的檢驗統計量與臨界值和拒絕域,如果值落在了拒絕域內,那我們就要拒絕零假設,否則接受零假設。
比較計算出來的P值和顯著性水平α值,如果P值小于等于α,則拒絕零假設,否則接受原假設。
上面兩種方法分別叫做統計量檢驗和P值檢驗。
以上就是假設檢驗的一般流程。除此之外,假設檢驗里面還有兩種錯誤,第一類錯誤叫做棄真錯誤,通俗一點就是漏診,就是本來是生病了(假設是正確的),但是你沒有檢測出來,所以給拒絕掉了;第二類錯誤是取偽錯誤,通俗一點就是誤診,就是本來沒病(假設是錯誤的),結果你診斷說生病了(假設是正確的),所以就把假設給接受了。
| 拒絕H0假設 | 犯I型錯誤 | 正確 |
| 接受H0假設 | 正確 | 犯II錯誤 |
I型錯誤的值一般為0.05,II型錯誤的值一般為0.1或0.2,除此之外還有一個指標叫做功效(power),power = 1 - II型錯誤的值,power 表示你有多大把握能夠正確的拒絕你的零假設H0。
關于假設檢驗我們就講到這里,后面會分享統計學里面的其他知識,如果有想看的內容,可以評論區留言。
-END-
點分享
點收藏
點點贊
點在看
總結
以上是生活随笔為你收集整理的讲讲大厂面试必考的假设检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何用Python的pyecharts库
- 下一篇: 有住房公积金能贷款吗 有公积金可以贷款吗