UA MATH571B 2K析因设计 SAS实践 分数2k析因设计
UA MATH571B 2K析因設計 SAS實踐 分數2k析因設計
- 試驗數據的定性分析
- 試驗數據的定量分析
這是2016年五月QE第三題。這道題的背景是1988年發在Journal of quality Technology的paper,Journal of quality Technology是制造業質控技術領域的小top期刊。這篇文章要研究的就是最后這個詞組:filling variability。相信大家都買過即食湯包,比如紫菜湯包、番茄蛋花湯包等,開水泡一下就可以喝,非常方便;雖然對使用者很方便,制造商卻面臨一個很大的問題:出于質控的目標,制造商希望每袋湯包灌裝之后重量幾乎是一樣的,但事實上每一袋的重量都不一樣。稱灌裝的湯包重量的差異程度叫做filling variation,質檢合格的要求就是把filling variation控制在一定范圍內。這篇paper就在試圖用一個案例回答filling variability由什么決定這個問題。在預實驗步驟,作者選擇了五個制作灌裝材料階段的factor,分別是攪拌的時候加幾次油、工作溫度、攪拌時間、批次重量、攪拌與灌裝間隔時間,被解釋變量是灌裝湯包重量的標準差,通過析因設計判斷每個因子的重要性。
試驗數據的定性分析
我們先定性分析一下試驗數據,確定之后定量分析的思路與方法。第一列數據告訴我們試驗單位是16個,因為一共五個factor,每個factor取兩個level來做的試驗,如果是252^525設計,就應該有32個試驗結果,但現在只有16,說明這是一個fractional factorial design,更準確一點,是一個25?12^{5-1}25?1 Design。
下面分析這個試驗的Defining relation是什么。最簡單的方法是我們任取一行,比如取第7行,然后用第七行的AAA到EEE這五個factor的值,用乘法/取相反數這兩種運算湊1,很明顯全部相乘再取相反數就是1,因此Defining relation是
I=?ABCDEI = -ABCDEI=?ABCDE
基于這個Defining relation,所有的一階效應會與對應的四階交互效應互為alias(比如A和-BCDE);所有的二階交互效應效應會與對應的三階交互效應互為alias(比如AB和-CDE);因此所有的單個因子的效應或兩個因子的交互效應不會與單個因子的效應或兩個因子的交互效應互為alias,這是一個resolution V設計,或記為2V5?12^{5-1}_{V}2V5?1?。(相關理論參考UA MATH571B 試驗設計 2k析因設計理論下)
現在我們確定了這是一個unreplicated 2V5?12^{5-1}_{V}2V5?1?設計,接下來的分析思路就是估計因子效應,輔助正態概率圖判斷顯著的因子,排除掉不顯著的因子,簡化模型,再對簡化后的模型做統計分析。
試驗數據的定量分析
首先讀取數據
data soup; infile 'D:\Stat PhD\taking course\summer1\Method\2016May\soup.csv' delimiter=',' firstobs=2; input A B C D E y; run;proc print data = soup; run; /*查看輸入的數據是否正確*/因為是csv文件,所以用逗號分隔。下面的代碼是用來計算因子效應的,基本思想是計算用上面的16種factor做回歸的系數乘2:
data effect0; set soup; AE = A*E; BE = B*E; AB = A*B; CE = C*E; AC = A*C; BC = B*C; ABCE = AB*CE; DE = D*E; AD = A*D; BD = B*D; ABD = AB*D; CD = C*D; ACDE = AC*DE; BCDE = BC*DE; ABCD = AB*CD; run;proc reg outest=effect1 data = effect0; model y = A B C D E AE BE AB CE AC BC ABCE DE AD BD ABD CD ACDE BCDE ABCD; run;data effect2; set effect1; drop y intercept _RMSE_; run;proc transpose data = effect2 out = effect3; run;data effect4; set effect3; effect = col1*2; run;proc sort data = effect4; by effect; run;proc transpose data = effect4 out = effect40; run;data effect5; set effect4; where _NAME_ ^= 'block'; run;proc print data = effect5; run;它輸出的結果如下,顯然效應比較大的是E、BE、DE,并且是負效應,說明攪拌時間與灌裝時間間隔越久,灌裝誤差就會越小。其實也不難理解,隔得越久水就蒸發得越干,剩下的風味物質中差一兩片干紫菜總比差一兩片濕紫菜的誤差小。
下面畫出正態概率圖double check一下,
顯然左下方這三個點是偏離集中區域的,因此可以確定E、BE、DE的效應是顯著的。因為BE、DE中也包含B、D這兩個因素,為了避免漏掉可能的顯著因子,我們分析B、D、E,BE、DE這五個因素。
總結
以上是生活随笔為你收集整理的UA MATH571B 2K析因设计 SAS实践 分数2k析因设计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH 571B 回归 QE练习
- 下一篇: UA MATH566 统计理论7 还有一