UA MATH571B 试验设计 总结 试验的类型与选择
UA MATH571B 試驗設計 總結 試驗的類型與選擇
- 試驗的意義,試驗設計的意義
- 單個treatment factor的試驗
- 多個treatment factor的試驗
- 多個treatment factor、且包含隨機效應的試驗
最近做qualify往年題目的時候,發現試驗設計的題目第一小問往往是判斷試驗類型,這個問題才是試驗設計這整個學科的精華。這類題目已知條件多種多樣,有文字描述試驗設計背景的,有展示試驗數據的,還有展示分析試驗數據的SAS輸出的,要準確判斷試驗類型,就需要對所有的試驗設計基本概念有深刻了解。我給自己總結一篇一文總結常見試驗設計類型,希望考試的時候試驗設計不要倒在第一個小問!先給出總結表:
| RCBD | 一個 | 一個 |
| Latin Square Design | 一個 | 兩個 |
| Graeco-Latin Square Design | 一個 | 三個 |
| Factorial Design | kkk個 | 0個 |
| Blocking Factorial Design | kkk個 | 至少一個 |
| 2k2^k2k Design | kkk個 | 0個 |
| Blocking 2k2^k2k Design | kkk個 | 1個 |
| A Half 2k2^k2k Design | kkk個 | 0個 |
| A Quarter 2k2^k2k Design | kkk個 | 0個 |
| Nested Design | kkk個 | 0個 |
| Split-plot Design | kkk個 | 0個 |
叫得出名字的(要考的)設計就這些,前五種根據Treatment Factor數目、Nuisance Factor數目還是比較容易區分的,但后四種區分難度就要大一點了,下面簡單介紹這些試驗設計類型的概念。
試驗的意義,試驗設計的意義
統計學有兩大類研究方法,Observational Study與Experimental Study,這兩類研究的目標都是找因果關系,估計Causal effects。Causal effects are the ceteris paribus response to a change in variable or parameter (Marshall [1961] and Heckman [2000])。ceteris paribus是一個拉丁語短語,ceteris是除了我們感興趣的因素以外的其他因素,paribus的意思是相等,因此這個短語連起來就是除了我們感興趣的因素外的其他因素保持不變。Causal effects也就是在其他因素保持不變的條件下,我們感興趣的因素對被解釋變量的效應。
Observational Study的Data generating process發生在observing之前,因此研究者無法通過控制data generating獲得理想的數據,只能通過后續的統計、計量技術來補救,所以Observational Study的統計理論研究的問題是對于既定的數據,怎么更準確地做推斷;Experimental Study的Data generating process發生在observing之后,因此研究者可以通過控制data generating獲得理想的數據,所以Experimental Study除了怎么做推斷外,更多的研究在回答怎么通過試驗設計來控制Data generating。
試驗設計的要點就在于ceteris paribus。在UA MATH571B 試驗設計II 簡單試驗的分析方法配對t檢驗部分,我介紹了一個例子:某桑拿房宣稱自家定制桑拿配合自創按摩服務可以治療高血脂。某公眾號團隊為了驗證這家桑拿房的說法,隨機選擇了2n2n2n個人。測量并記錄其初始的血清總膽固醇(TC),并將TC相近的分為一對,記其TC均值為{βi}i=1n\{\beta_i\}_{i=1}^n{βi?}i=1n?。在每一對中隨機抽一人去體驗這家桑拿房定制桑拿配合自創按摩服務,另一個人去普通的桑拿房。體驗完畢后測血清總膽固醇記為{(y1i,y2i)}i=1n\{(y_{1i},y_{2i})\}_{i=1}^n{(y1i?,y2i?)}i=1n?,其中111是去體驗定制桑拿配合自創按摩服務那一組。收集到這些數據就可以用配對t檢驗比較兩組的TC均值了。事實上這并不是一個完美的ceteris paribus,最完美的ceteris paribus一定是選nnn個人,然后再把這nnn個人從身體到靈魂都復制一下,獲得另外nnn個人,然后趕緊讓他們去蒸桑拿。
這個例子其實是說,除了我們感興趣的因素(是不是蒸的定制桑拿)還有一些我們不感興趣的因素(性別、年齡、身高、體質比、腰臀比、血糖、血壓、肝功等等)可能會影響TC,稱我們感興趣的這個叫treatment factor,不感興趣但可能影響結果的叫nuisance factor,試驗設計的一個目標就是處理nuisance factor,讓它們不會影響treatment effect。
單個treatment factor的試驗
這類試驗的設計可以用四個字母表示,RCBD,全稱叫randomized complete blocking design。在UA MATH571B 試驗設計I 試驗設計簡介消除偏差部分我舉了一個例子:六味地黃丸有滋陰補腎的功效,腎虛的人會氣虛,氣虛的話濕氣就會重,濕氣重了就有可能得腳氣,所以我們可以設想一下,六味地黃丸應該是可以治療腳氣的。假設我們要研究六味地黃丸到底能不能治療腳氣,用二值隨機變量TTT表示服用了六味地黃丸(T=1T=1T=1)或接受安慰劑處理(T=0T=0T=0),隨機變量YYY表示患者左右腳三四趾趾腹真菌數之和(簡稱真菌數)。但我們又認為經常用腳的人一定很多腳汗,就會更容易感染真菌。所以我們隨機找了6n6n6n個有腳氣的個體,將他們隨機分為222組,然后隨機挑一組讓他們服用六味地黃丸,另外一組讓他們服用和六味地黃丸樣子差不多的丸子;在每組中,將被試對象再隨機分為3組,隨機挑一組讓他們保持每天微信步數在5000以下,再隨機挑一組讓他們保持每天微信步數在5000-15000之間,最后一組每天微信步數保持在15000以上,假設每個人都不會cheat,實施試驗時做double-blinding處理。
這個例子中一共有6n6n6n個試驗單元。試驗設計中提到的各種隨機分配就叫randomized,因為我們感興趣的是是否服用六味地黃丸,因此TTT是treatment factor,微信步數是可能對結果有影響,但我們不感興趣,所以是nuisance factor。我們把nuisance factor分為三個level(<5000,5000-15000,>15000),它與treatment factor是totally crossed(乘法原則,二三得六,一共六種treatment),所以nuisance factor的三個level各自對應的試驗單元就叫三個block,這種設計方法就叫blocking。因為六種treatment每一種都有試驗單元與之對應,所以叫complete。注意到這個試驗每種treatment都包含nnn個試驗單元(數目一致),所以這個試驗也是Balanced,如果每種treatment包含的試驗單元數目不一致,就叫Imbalance。
如果有兩個nuisance factor就需要Latin square design;如果有三個nuisance factor就需要Graeco-Latin square design,再多老師就沒教過了。但Graeco-Latin square其實就是兩個Latin square的Hamada乘積,我估計再四個nuisance factor就用三個Latin square的Hamada乘積就好,以此類推。這部分的知識點請參考UA MATH571B 試驗設計III 單因素試驗設計1、UA MATH571B 試驗設計III 單因素試驗設計2、UA MATH571B 試驗設計III 單因素試驗設計3、UA MATH571B 試驗設計IV RCBD與Latin Square上。
多個treatment factor的試驗
多個treatment factor的試驗知識點可以參考UA MATH571B 試驗設計V 析因設計簡介。Factorial Design,翻譯為析因設計,我覺得這個翻譯還是比較到位的。多個treatment factor的試驗需要考慮不同factor之間的交互項,超過兩個factor還有考慮所有的高階交互項。
2k2^k2k析因試驗是析因試驗的預實驗,因為我們感興趣的factor越多,treatment effect(單個因子和所有的交互項)就越多,并且是指數增長了,為了節省試驗資源,我們需要做預實驗,判斷哪些因子比較重要,然后再對重要的因子做析因試驗。2k2^k2k析因就是對kkk個因子,每個因子都只取low level和high level來做試驗。
2k2^k2k析因試驗有一個很大的問題,如果只做一次試驗,殘差自由度為0,沒有辦法用ANOVA;如果做多次試驗,那么多做一次試驗資源消耗就要翻倍。因此分析只有一次的2k2^k2k析因試驗可以用Confounding技術,具體參考UA MATH571B 試驗設計 2k析因設計理論下。
如果實驗室經費真的很緊張,一次完整的2k2^k2k析因試驗都做不了,那就只能做A half或者A quarter了。會考到的一般是A half 2k2^k2k析因設計,定性分析時為了確定到底是哪種A half 2k2^k2k析因設計,需要先找到Defining relation,然后根據defining relation判斷resolution類型,這樣才能完全確定,具體方法參考UA MATH571B 試驗設計 2k析因設計理論下。
多個treatment factor、且包含隨機效應的試驗
要區分這類試驗首先要掌握一對很重要的概念:固定效應 vs 隨機效應。從模型假設上來講,在對試驗的線性模型做估計的時候,OLS和MLE都會缺少一個方程,如果假設每一個treatment不同level的treatment effect之和為0,那么這種模型就是固定效應模型;如果假設每一個treatment的effect都是隨機變量,這種模型就是隨機效應模型。從實際意義上講,如果treatment factor的level只有肉眼可見的數種可能性(比如一家制造業工廠的幾條不同的八寶粥的灌裝生產線、涼糕的制作工藝等)那就應該用固定效應;如果treatment factor的level有一個很大的population,做試驗的時候是選擇幾個代表性的取值,那就應該用隨機效應。有的題目給的是SAS output,是標明了factor type的。
前面介紹的都是處理固定效應的,處理隨機效應的隨機效應模型與處理兩種效應都有的混合效應模型可以參考UA MATH571B 試驗設計VI 隨機效應與混合效應1、UA MATH571B 試驗設計VI 隨機效應與混合效應2。
處理混合效應的設計方法有兩種,Nested Design和Split-plot design。Nested Design比較好理解,它在level combination的形式上可以是totally crossed,也可以是partially crossed,區分nested和crossed有一個很重要的特征,如果同一個factor B的level只與一個factor A的level構成一個treatment,就稱factor B nested in factor A(可能是totally crossed,也可能是factor B是random factor)。Split-plot design有兩點特征可以輔助判斷:1)給定sub-plot factor的值,whole-plot factor與block的結果構成以whole-plot factor為treatment factor、block為nuisance factor的RCBD;2)整個實驗可以看成以sub-plot factor為treatment factor、block*whole-plot factor為nuisance factor的RCBD。
總結
以上是生活随笔為你收集整理的UA MATH571B 试验设计 总结 试验的类型与选择的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH566 统计理论 Fish
- 下一篇: UA MATH571B 试验设计 总结