UA MATH571B 试验设计I 试验设计简介
UA MATH571B 試驗設(shè)計I 試驗設(shè)計簡介
- 試驗設(shè)計的作用與意義
- 混淆變量
- 相關(guān)性與因果
- 試驗設(shè)計的流程與目標
- 消除偏差
- 對照組
- 隨機試驗
- Blinding
- 減少抽樣誤差
- 重復試驗
- 平衡試驗和區(qū)組設(shè)計
試驗設(shè)計的作用與意義
有兩類常用的統(tǒng)計研究方法,一類是觀察性研究(Observational study),另一類是試驗性研究(Experimental study)。觀察性研究的數(shù)據(jù)是在事情發(fā)生以后我們?nèi)ナ占降?#xff0c;所以變量之間的相關(guān)或者因果關(guān)系已經(jīng)存在了,我們沒辦法去控制。觀察數(shù)據(jù)的分析方法就是上個回歸系列博文介紹的,這個系列要介紹的是試驗性研究的分析方法。試驗性數(shù)據(jù)是進行試驗后收集到的數(shù)據(jù),因此可以通過試驗設(shè)計來控制某些變量對結(jié)果的影響,從而試驗設(shè)計可以估計treatment effect,決定最優(yōu)的treatment,也可以用來預測treatment的效應。
混淆變量
混淆變量(Confounding variable)又叫干擾變量,它會讓兩個不具有因果的事件變得統(tǒng)計上相關(guān),一旦控制了混淆變量,這兩個事件就不再相關(guān)了。在觀察性研究中,我們無法采取主動措施去控制混淆變量,只能用一些被動的手段,例如使用工具變量等。但是在試驗性研究中,我們可以通過試驗設(shè)計去控制混淆變量。
相關(guān)性與因果
統(tǒng)計相關(guān)性與因果是非常容易弄混的,這里舉一個有趣的例子,這個例子來自Matthews, R. (2000), Storks Deliver Babies (p= 0.008). Teaching Statistics, 22: 36-38. doi:10.1111/1467-9639.00013。Stork的意思是白鸛,民間稱其為送子鳥,相傳白鸛在誰家屋頂上筑巢,誰家就會喜得貴子。這篇論文想要回答的問題是送子鳥真的能夠送子嗎?這篇文章用了歐洲17國送子鳥的數(shù)量和出生率的數(shù)據(jù)計算了二者的PPMCC,并對PPMCC做了顯著性檢驗,發(fā)現(xiàn)p值為0.008,忘了PPMCC的同學可以看一元回歸相關(guān)性分析那篇博文。這個結(jié)論說明送子鳥的數(shù)量和出生率具有顯著的正相關(guān)關(guān)系,然而作者提出了一個問題讓大家思考:如果你是一名說客,你會用這個作為依據(jù)建議政治家通過引進送子鳥來提高出生率嗎?顯然這種相關(guān)性是不能用來作為政策干預的依據(jù)的,只有因果關(guān)系才可以。從統(tǒng)計模型上看,觀察性研究比較難得到因果關(guān)系,但試驗性研究是可以的。
試驗設(shè)計的流程與目標
首先是要明確試驗設(shè)計的目標,明確response是什么。然后根據(jù)試驗目標選擇需要的factor以及factor的level。接下來就是設(shè)計試驗計劃,做實驗和數(shù)據(jù)分析了。response、factor和level需要區(qū)分一下。這里舉一個簡單的例子。假設(shè)要研究二氧化碳濃度對天竺葵光合作用強度的影響,那么我們可以選擇單位時間內(nèi)天竺葵葉片累積的淀粉作為光合作用強度的度量,也就是這個試驗的response;我們要研究的treatment factor就是二氧化碳濃度,假設(shè)對照組(Control Group)二氧化碳濃度是410ppm,實驗組(Treatment Group)的二氧化碳濃度是400ppm、420ppm,這里的410ppm、400ppm、420ppm就叫factor的level。
試驗設(shè)計是在做試驗以前的對試驗的規(guī)劃,因此它必須有這三個功能:1)消除偏差;2)減少抽樣誤差;3)確定樣本數(shù)。
消除偏差
先解釋一下偏差的含義。這里舉一個日常生活中的例子。我們都知道六味地黃丸有滋陰補腎的功效,腎虛的人會氣虛,氣虛的話濕氣就會重,濕氣重了就有可能得腳氣,所以我們可以設(shè)想一下,六味地黃丸應該是可以治療腳氣的。假設(shè)我們要研究六味地黃丸到底能不能治療腳氣,用二值隨機變量TTT表示是否服用了六味地黃丸,用隨機變量YYY表示患者左右腳三四趾趾腹真菌數(shù)之和(簡稱真菌數(shù)),對于個體iii而言,如果有腳氣,記真菌數(shù)為Y1iY_{1i}Y1i?,如果沒有腳氣,則記真菌數(shù)為Y0iY_{0i}Y0i?。在做試驗的時候,如果不做任何設(shè)計,我們只能觀察到服用了六味地黃丸的個體的真菌數(shù)E[Yi∣Ti=1]E[Y_i|T_i=1]E[Yi?∣Ti?=1],以及未服用六味地黃丸的個體的真菌數(shù)E[Yi∣Ti=0]E[Y_i|T_i=0]E[Yi?∣Ti?=0],因此我們估計的平均效應(average effect)其實是兩種效應的總和
E[Yi∣Ti=1]?E[Yi∣Ti=0]=(E[Y1i∣Ti=1]?E[Y1i∣Ti=0])+(E[Y1i∣Ti=0]?E[Y0i∣Ti=0])E[Y_i|T_i=1]-E[Y_i|T_i=0] = (E[Y_{1i}|T_i=1]-E[Y_{1i}|T_i=0] )\\ + (E[Y_{1i}|T_i=0] - E[Y_{0i}|T_i=0]) E[Yi?∣Ti?=1]?E[Yi?∣Ti?=0]=(E[Y1i?∣Ti?=1]?E[Y1i?∣Ti?=0])+(E[Y1i?∣Ti?=0]?E[Y0i?∣Ti?=0])
第一種效應是E[Y1i∣Ti=1]?E[Y1i∣Ti=0]E[Y_{1i}|T_i=1]-E[Y_{1i}|T_i=0]E[Y1i?∣Ti?=1]?E[Y1i?∣Ti?=0],它的含義是服用六味地黃丸的患者與未服用六味地黃丸的患者真菌數(shù)之差,顯然這個是我們想估計的真實的treatment effect;第二種效應是E[Y1i∣Ti=0]?E[Y0i∣Ti=0]E[Y_{1i}|T_i=0] - E[Y_{0i}|T_i=0]E[Y1i?∣Ti?=0]?E[Y0i?∣Ti?=0]也就是未服用六味地黃丸的患者和未患腳氣的個體真菌數(shù)之差,這一項一般叫做selection bias,或者簡稱偏差。
在觀察性研究中,我們沒有辦法對數(shù)據(jù)形成的流程進行控制,只能觀察到最終結(jié)果,因此觀察性研究需要諸如DID、RDD等方法從總體數(shù)據(jù)中試圖估計treatment effect。但試驗性研究可以對流程加以控制,直接消除偏差,這是試驗性研究相比觀察性研究最大的優(yōu)勢。試驗設(shè)計一般用三種手段消除偏差,添加對照組(simultaneous control group)、隨機試驗(randomization)、單盲/雙盲試驗(single/double blinding)。
對照組
對照組除了treatment factor以外,其他條件與實驗組完全一致。比如在六味地黃丸這個試驗中,我們可以選擇80個身體狀況相似的患者(一個患者就是一個試驗單位unit),讓其中40個服用六味地黃丸,另外四十個給placebo(安慰劑),這樣的話我們完成試驗收集數(shù)據(jù)估計的結(jié)果就直接是E[Y1i∣Ti=1]?E[Y1i∣Ti=0]E[Y_{1i}|T_i=1]-E[Y_{1i}|T_i=0]E[Y1i?∣Ti?=1]?E[Y1i?∣Ti?=0]。事實上接受安慰劑的患者也會獲得一定的治療效果,這叫placebo effect,安慰劑效應。因為可能存在安慰劑效應,設(shè)置對照組并進行安慰劑處理可能防止高估treatment effect。
隨機試驗
隨機試驗指的是將treatment隨機分配給試驗單位。假設(shè)第iii個unit的confounding variable值為CiC_iCi?,CiC_iCi?與YiY_iYi?的聯(lián)合分布為f(Yi,Ci)f(Y_i,C_i)f(Yi?,Ci?)。如果把試驗對象分為兩組進行兩種不同的處理,但如果分組的時候不隨機分,有可能兩組試驗對象在處理前YiY_iYi?就已經(jīng)有顯著差異了,這個差異會導致偏差。因此要做隨機試驗!
Blinding
單盲指的是被試對象不知道自己在接受試驗,雙盲指的是被試對象和研究者都不知道自己在接受試驗。一個比較簡單的例子,在有的行為科學的試驗中,如果被試對象知道在接受試驗,它可能會變得比較performing,試驗結(jié)果就會不那么可靠。而如果研究者知道自己在做試驗,可能會傾向于收集對自己有利的數(shù)據(jù)。這些都會帶來偏差。
減少抽樣誤差
消除了偏差之后能夠保證treatment effect是無偏的,但無偏性保證的只是抽樣分布的均值與真實分布一致,為了讓估計的treatment effect更精確,我們希望treatment effect的抽樣分布盡可能集中一點,所以需要減少抽樣誤差,抽樣誤差可以簡單理解為抽樣分布的方差。均方誤差等于偏差的平方加上方差,對無偏估計而言,均方誤差就等于方差。在試驗設(shè)計中,均方誤差又被稱為統(tǒng)計誤差,因此在無偏的基礎(chǔ)上,只要再降低抽樣誤差就可以更進一步降低統(tǒng)計誤差了。減少抽樣誤差一般有是那種做法,重復試驗(replication)、平衡設(shè)計(balance)、區(qū)組設(shè)計(blocking)。
重復試驗
重復試驗指的是在相同的條件下進行多次試驗并測量,要區(qū)分重復試驗與重復測量的區(qū)別。假設(shè)nnn次重復試驗的結(jié)果是Xi,i=1,?,nX_i,i=1,\cdots,nXi?,i=1,?,n,則樣本均值的標準差為s/ns/\sqrt{n}s/n?,隨著重復試驗次數(shù)上升,樣本均值的分布會越來越集中,統(tǒng)計誤差會逐漸減少。因為每個樣本XiX_iXi?是隨機變量,重復測量的意思是對XiX_iXi?進行多次觀察,得到XiX_iXi?的多個觀察值,所以重復測量取平均降低的是測量的誤差。
平衡試驗和區(qū)組設(shè)計
平衡試驗指的是接受不同treatment的units數(shù)量一致。這樣做的好處是之后做假設(shè)檢驗的時候檢驗的勢比非平衡試驗大。區(qū)組指的是units的組合,這些組合具有相似的性質(zhì)。區(qū)組設(shè)計主要是想用來解決nuisance factor的,nuisance factor是那些會對試驗結(jié)果造成影響,但不在我們研究興趣之中的那些因素,比如在天竺葵那個試驗中,空氣濕度就是一個nuisance factor。
總結(jié)
以上是生活随笔為你收集整理的UA MATH571B 试验设计I 试验设计简介的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH566 统计理论1 充分统
- 下一篇: UA MATH566 统计理论2 点估计