数学建模之数据比较与影响因素分析
EverydayOneCat
📦🙀正方?圓滾?
🛏?💤🐈💨
知識點
1.筆記
2.兩個正態總體的檢驗
例:某小麥品種經過4代選育,從第5代和第6代中分別抽出10株得到它們株高的觀測值分別為66,65,66,68,62,65,63,66,68,62和64,61,57,65,65,63,62,63,64,60,試檢驗株高這一性狀是否已達到穩定(α=0.05)?
思路:先檢驗方差后檢驗均值
SAS代碼:
data ex; input c$ x@@; cards; a 66 a 65 a 66 a 68 a 62 a 65 a 63 a 66 a 68 a 62 b 64 b 61 b 57 b 65 b 65 b 63 b 62 b 63 b 64 b 60 ; proc ttest;class c;var x; run;ttest表示T檢驗,檢驗兩個水平的,每個水平的都符合正態分布。
class表示分類變量(屬性)
先看方差檢驗
Pr>F概率大于0.05,接受原假設H0:方差相等
再看均值檢驗
T檢驗概率比0.05小,拒絕原假設,認為兩均值不等,第五代和第六代株高有顯著性差異,說明株高性狀沒有達到穩定。
3.兩組樣本非參數檢驗
非參數檢驗(non-parametric test)又稱為分布自由檢驗,一種與總體分布狀況無關的檢驗方法,它不依賴于總體分布的形式。
3.1配對樣本數據符號檢驗法
例1 甲乙兩人分析同一物質中某成份的含量,得到觀測數據(單位:g)為
甲14.7,15.0,15.2,14.8,15.5,14.6,14.9,14.8,15.1,15.0
乙14.6,15.1,15.4,14.7,15.2,14.7,14.8,14.6,15.2,15.0
試在顯著性水平為0.05時用符號檢驗法檢驗兩人的分析無顯著差異.
SAS代碼:
data ex; /*ex為數據名*/ input x1 x2 @@; y=x1-x2; /*y用于存放x1和x2的差值*/ cards; /*數據卡*/ 14.7 14.6 15.0 15.1 15.2 15.4 14.8 14.7 15.5 15.2 14.6 14.7 14.9 14.8 14.8 14.6 15.1 15.2 15.0 15.0 ; proc univariate;/*proc univariate表示調用模塊 univariate*/ var y; /*var y表示調用變量y*/ run; /*執行命令*/結果分析: 由Tests for Location: Mu0=0表可知,M(Sign)的值為05,pr>M的值為1.00>0.05,未落在拒絕域里,故接受原假設H,認為兩人的分析無顯著差異。
3.2總體中位數的符號檢驗法
為了判斷某個總體的中位數是否與已知數m有顯著的差異
例2 試驗品種豬在17個試驗點的月增重(單位:kg)見表:
試問,月增重與35是否有顯著性差異?
SAS代碼:
data ex; input x @@; y=x-35; /*x的值與35的差值作為觀測變量值*/ cards; 51 40 43 48 23 26 30 34 25 40 41 39 42 40 43 30 34 ; proc univariate;var y; run;結果分析:M(Sign)的值為1.5,Pr >= |M|值為0.6291>0.05,故未落在拒絕域里,因此接受原假設,認為該品種豬月增重的中位數與35無顯著差異。
3.3成組樣本數據的秩和檢驗法
例3 測定兩個馬鈴薯品種的淀粉含量(%),得到A品種的觀測值為12.6, 12.4,B品種的觀測值為12.4,12.1,12.5,12.7,12.6,13.1試在顯著性水平為0.05時用秩和檢驗法檢驗兩品種的淀粉含量無顯著差異。
這里一個2個一個6個不是一一配對,我們用到秩和檢驗法。
SAS代碼:
data ex; do a=1 to 2;input n @@;/*a因素有兩個水平,由于每個水平樣本個數不等,故先輸入表示樣本個數的變量n*/do i=1 to n;input x @@;/*每個水平樣本從1輸到n,再輸入數據x*/output;end; end; /*計算公式兩連加號*/ cards; 2 12.6 12.4 6 12.4 12.1 12.5 12.7 12.6 13.1 ; proc npar1way wilcoxon; /*調用模塊npar1way,數據對因素a的秩和檢驗模型*/ class a; var x; run;結果分析:
Kruskal-Wallis Test這一部分,自由度DF為1,Chi-Square value 為Chi-Square且Prob > Chi-Square 為0.7358>0.05,接受原假設H0,認為兩品種的淀粉含量沒有顯著性差異,淀粉含量相同。
4.單因素方差分析
例4《切胚乳試驗》用小麥種子進行切胚乳試驗,設計分3種處理,同期播種在條件較為一致的花盆內,出苗后每盆選留2株,成熟后測量每株粒重(單位:g),得到數據如下:
| 未切去胚乳 | 21,29,24,22,25,30,27,26 |
| 切去一半胚乳 | 20,25,25,23,29,31,24,26,20,21 |
| 切去全部胚乳 | 24,22,28,25,21,26 |
分析粒重和處理方式是否有關。
SAS代碼:
data ex;do a=1 to 3;input n @@; do i=1 to n; input x @@; Output;end;end; Cards; 8 21 29 24 22 25 30 27 26 10 20 25 25 23 29 31 24 26 20 21 6 24 22 28 25 21 26 ; proc anova; class a;model x=a; means a/duncan;run;根據此做出來表格:
F值為0.32,Pr>F概率大于0.05,接受原假設:均值相等
都歸屬于A類,沒有顯著性差異,認為不同的處理方式對粒重并無明顯影響。
5.雙因素方差分析
5.1不考慮交互作用
SAS代碼:
data ex;do a=1 to 4;do b=1 to 5; input x @@;output;end;end; cards; 53 56 45 52 49 47 50 47 47 53 57 63 54 57 58 45 52 42 41 48 ; proc anova;class a b;model x=a b; means a/duncan;means b/duncan;run;5.2考慮交互作用
要是研究交互作用,每個交叉處至少有兩個值。
data ex;do a=1 to 4;do b=1 to 3;do i=1 to 2; input x @@;output;end;end;end; cards; 58.2 52.6 56.2 41.2 65.3 60.8 49.1 42.8 54.1 50.5 51.6 48.4 60.1 58.3 70.9 73.2 39.2 40.7 75.8 71.5 58.2 51 48.7 41.4 ; proc anova;class a b;model x=a b a*b; means a/duncan;means b/duncan;run;6.多組獨立樣本的非參數檢驗
多組獨立樣本的H檢驗法(又稱為Kruskal -Wallis單向秩次方差分析法),是檢驗多組獨立樣本是否來自同分布總體最常用、功效最強的非參數檢驗方法。
例 用3種不同的藥劑處理水稻種子,發芽后觀測到苗高(單位:cm)的觀測值如下,試作單向秩次方差分析。
data ex;do a=1 to 3; do i=1 to 4;input x @@; output;end;end; cards; 21 24 27 20 20 18 19 15 22 25 27 22 ; proc npar1way wilcoxon; /*參數第一種方式檢驗*/ class a;var x;run;7.獨立性檢驗
原假設H0:是否使用預防措施與患感冒情況相互獨立。
編寫程序如下:
data ex;do a=1 to 2;do b=1 to 3; /*兩行三列*/ input f @@;output;end;end; /*輸入樣本數*/ cards; 224 136 140 252 145 103 ; proc freq;weight f; tables a*b/chisq; /*chisq表示檢驗*/ run;第二部分Statistics for Table of a by b才是檢驗結果。其中主要看Chi-Square(卡方)這一行,其自由度為2,χ2(Chi-Square value)=7.5691,且Prob值為0.0227<0.05,故落在拒絕域,接受備擇假設,即預防與感冒這兩因素之間不是相互獨立的,即措施對患感冒是有關系的。
8.協方差分析
如果在單因素、雙因素或多因素試驗中有無法控制的因素x影響試驗的結果Y,且x可以測量、x與Y之間又有顯著的線性回歸時,常常利用線性回歸來矯正Y的觀測值、消去x的差異對Y的影響。
例如,研究施肥對蘋果樹產量的影響,由于蘋果樹的長勢不齊,必須消去長勢對產量的影響。又如,研究飼料對動物增重的影響,由于動物的初重不同,必須消去初重對增重的影響。
8.1單因素協方差分析
SAS代碼:
data ex; do a=1 to 3;do i=1 to 8; input x y @ @;output ;end;end; cards; 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66 ; proc glm;class a;model y=x a/solution; lsmeans a/stderr pdiff;run;x對應的Pr>F概率小于0.05,拒絕原假設H0:x對y沒有影響,說明x差異顯著,所以我們要把x差異性抹掉。
施用三種肥料的產量矯正后有極顯著的差異(有影響)。
8.2雙因素協方差分析
8.2.1不考慮交互作用
data ex;do a=1 to 3 ;do b=1 to 5 ; input x y @ @;output; end; end; cards; 8 2.85 10 4.24 12 3.00 11 4.94 10 2.88 10 3.14 12 4.50 7 2.75 12 5.84 10 4.06 12 3.88 10 3.86 9 2.82 10 4.94 9 2.89 ; proc glm;class a b ;model y=x a b/solution; lsmeans a b/stderr pdiff;run;x對應的Pr>F概率小于0.05,差異性顯著,所以要抹除x的影響。
a對應的Pr>F概率大于0.05,說明不同的小區對產量沒有影響。
各小區的產量矯正后沒有顯著的差異,各品種的產量矯正后有極顯著的差異。
8.2.2考慮交互作用
data ex; do a=1 to 4; do b=1 to 2; do i=1 to 2;input x y@@;output;end;end;end; cards; 14.6 97.8 12.1 94.2 19.5 113.2 18.8 110.1 13.6 100.3 12.9 98.5 18.5 119.4 18.2 114.7 12.8 99.2 10.7 89.618.2 122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.9 proc glm; class a b;model y=x a b a*b/solution;lsmeans a b/stderr pdiff; run;A與B的交互作用矯正后不顯著,促生長劑之間的差異極顯著,試驗批次間的差異不顯著
作業
期貨交易數據主要來源于某商品交易所,包括某水果期貨上市以來的換手率、漲跌幅度、保證金、交易手續費、當日平倉手續費等,其它數據如災害性天氣狀況等來源于網絡資料。
換手率是期貨表現熱度的晴雨表,一般來講,換手率越高,表明該產品越受到消費者青睞。請你查閱相關文獻,研究本數據表,通過建立數學模型或統計分析方法,回答下列問題。
研究換手率的變化規律。
研究哪些因素對換手率是有影響的,哪些是沒有影響的。
保證金、手續費、當日平倉、是否有災害天氣、是否消費旺季這幾個影響因素之間是否有關聯?
數據下載地址:
https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/download/%E7%AC%AC9%E6%AC%A1%E4%BD%9C%E4%B8%9A%E6%95%B0%E6%8D%AE.xlsx
1.第一問
研究數據的變化規律我們主要從數據的周期、數據的趨勢、數據的隨機性、以及數據內部的傳遞性四個方面來研究
編寫SAS代碼:
data a; input x@@; time=_n_; cards; 1.9393939 1.5531915 0.4479495 0.1027190 0.1460055 0.0303030 0.0027624 0.0217984 0.0189189 0.1195652 0.0803109 0.0401003 0.0148883 0.1724138 0.0722101 0.4933862 0.3757030 0.6139410 0.2022090 0.5193165 0.1047904 0.4113009 0.2120098 0.6241173 0.4927114 0.5597057 0.5261997 0.4409524 0.9422921 0.4413395 0.6832524 0.3633678 0.3216830 0.3055872 0.3648144 0.3870395 0.2108352 0.1683833 0.2786482 0.1587838 0.1848568 0.3312333 0.5001322 0.3252688 0.4822900 0.3515249 0.4836197 0.3796296 0.2374334 0.2439367 0.1602456 0.2312500 0.8488216 0.8472093 1.0440485 0.9208815 0.9387877 1.1929144 1.7572786 0.9151355 1.2559558 1.1759934 1.7465747 2.4862373 2.4405618 3.4839917 5.7556963 3.3591598 3.3471258 6.5572674 3.8542786 4.4468939 4.4002278 4.6747778 4.2003163 5.2316854 6.1956928 9.2880570 5.2759323 5.6891960 3.5593666 1.9292312 2.6713994 1.8885801 1.8040694 1.7526615 2.0106814 1.6252591 1.8017329 1.4488495 1.2168779 2.0032830 1.1555587 1.0751166 2.2721227 1.6036624 2.0975010 1.9572098 1.6813667 1.5758161 1.9966546 2.4764227 2.8488007 2.6637306 2.8162721 2.6001077 1.5894797 2.1950105 1.6263468 1.8976734 1.6096398 1.5009201 1.5783214 1.3981174 1.1690259 0.9194704 1.0540232 1.1763860 1.5252878 1.1742093 3.8136751 2.0073488 2.7448852 1.7984086 1.9759923 1.5409623 2.3586512 1.4594724 1.3989078 1.2159621 1.4583811 1.5540499 1.4569306 1.7132759 1.8280245 2.4647509 2.1774181 2.0933134 1.4973353 1.2432843 1.5350945 1.3863774 1.5953973 1.8658197 2.7395673 1.8784120 1.7965255 2.8155407 2.3215706 1.8111513 1.6633678 1.5670568 1.9503250 1.6817802 1.6820488 2.3459841 1.7021874 1.6720504 1.5629485 1.1998658 1.1092371 1.5260981 1.3209728 1.2159580 1.2582135 1.0660533 2.2136745 1.0290641 1.1133371 2.0062529 1.1895146 2.0715051 1.7548775 1.0554558 1.1839372 1.3777651 1.0361367 2.0423229 2.0586479 2.3740129 1.6712147 1.7715363 2.3964418 1.3733103 1.3112867 1.3697364 1.1895383 2.5241314 1.2212908 1.6053514 0.9989995 1.2968232 1.3770413 0.9131243 1.4921420 0.9540247 1.0605178 0.7622555 0.8025549 1.0871273 0.8945853 0.7594745 1.3254880 0.5804381 0.4918341 0.6856156 0.7278238 0.3679483 0.7141156 0.6593457 0.8554738 0.9600813 0.5534354 0.6820879 0.5855344 0.3507366 0.3299955 0.4699115 0.2322538 0.2629292 0.1586035 0.4082599 0.4575238 0.2716628 0.1468593 0.6918954 0.3657791 0.4294517 0.2246681 0.4752675 0.2789720 0.7303103 8.6850394 1.1205674 0.3065134 0.3596491 0.2870370 0.0970874 0.0920245 0.1953125 0.2035398 0.3000000 ; proc gplot; plot x*time; symbol c=black i=join v=star; proc arima; identify var=x; run;得到時序圖:
從圖中我們可以看出數據大致可以判斷為是不具有周期性波動的,且數據波動性較大,故初步判斷該數據不是平穩的。然而由于根據時序圖的判斷嚴謹性不高,于是根據自相關圖進行進一步的判斷。
隨著時間平移長度的增大,自相關系數的數值的變化并未呈周期性變化。從圖片右半邊的表示自相關系數的圖也可以看出:自相關系數并不是是呈周期性波動。綜合時序圖的分析以及自相關圖的分析,得到以下結論:該數據并不具有周期性且不平穩。
由于原始數據不具有平穩性我們需要對原始數據進行差分運算,故對原始數據進行一階差分運算并且需要對運算后得出的數據進行平穩性檢驗,檢驗結果如下。
將數據一階差分后按照月份做出來的時序圖,從圖中我們可以看出運算后數據大致可以判斷為是在一條水平線上下波動,故初步判斷該序列是平穩的。然而由于根據時序圖的判斷嚴謹性不高,于是根據自相關圖進行進一步的判斷。
在時間平移長度較小時,自相關系數的數值較大,當時間平移長度擴大時,自相關系數的數值總體來說是在逐漸趨近于0,由此可以得出自相關系數具有拖尾性。從圖片右半邊的表示自相關系數的圖也可以看出:自相關系數在0.0 這條線的左右波動。綜合時序圖的分析以及自相關圖的分析,得到以下結論:該數據具有平穩性。由于通過一階差分使得數據平穩,故該數據中具有線性趨勢。
已知該序列在進行差分運算后是平穩的,要選擇選擇適當模型擬合該序列的發展還需要證明該序列在差分運算后是非白噪聲的。白噪聲檢
驗結果如下。
延遲6 期、延遲12 期、延遲18 期、延遲24 期的p值分別為<.0001、<.0001、<.0001、0.0005,都遠小于0.05,故拒絕原假設,數據之間存在相關性,該數據在差分運算后是非白噪聲的,故該數據不具有隨機波動。
綜合以上分析,得出以下結論:換手率的變化不具有周期性,具有線性趨勢,數據內部具有相關性,不具有隨機波動。
2.第二問
第二問要求對換手率有影響的因素,要研究的是變量和多個分類變量之間的關系,因此選擇應用多組獨立樣本的H檢驗法進行研究。
SAS代碼:
data ex; input x a b c d e@@; cards; 1.9393939 0.07 0.5 0 0 0 1.5531915 0.07 0.5 0 0 0 0.4479495 0.07 0.5 0 0 0 0.1027190 0.07 0.5 0 0 0 0.1460055 0.07 0.5 0 0 0 0.0303030 0.07 0.5 0 0 0 0.0027624 0.07 0.5 0 0 0 0.0217984 0.07 0.5 0 0 0 0.0189189 0.07 0.5 0 0 0 0.1195652 0.07 0.5 0 0 0 0.0803109 0.07 0.5 0 0 0 0.0401003 0.07 0.5 0 0 0 0.0148883 0.07 0.5 0 0 1 0.1724138 0.07 0.5 0 0 1 0.0722101 0.07 0.5 0 0 1 0.4933862 0.07 0.5 0 0 1 0.3757030 0.07 0.5 0 0 1 0.6139410 0.07 0.5 0 0 1 0.2022090 0.07 0.5 0 0 1 0.5193165 0.07 0.5 0 0 1 0.1047904 0.07 0.5 0 0 1 0.4113009 0.07 0.5 0 0 1 0.2120098 0.07 0.5 0 0 1 0.6241173 0.07 0.5 0 0 1 0.4927114 0.07 0.5 0 0 1 0.5597057 0.07 0.5 0 0 1 0.5261997 0.07 0.5 0 0 1 0.4409524 0.07 0.5 0 0 0 0.9422921 0.07 0.5 0 0 0 0.4413395 0.07 0.5 0 1 0 0.6832524 0.07 0.5 0 0 0 0.3633678 0.07 0.5 0 0 0 0.3216830 0.07 0.5 0 0 0 0.3055872 0.07 0.5 0 0 0 0.3648144 0.07 0.5 0 0 0 0.3870395 0.07 0.5 0 0 0 0.2108352 0.07 0.5 0 0 0 0.1683833 0.07 0.5 1 0 0 0.2786482 0.07 0.5 1 0 0 0.1587838 0.07 0.5 1 0 0 0.1848568 0.07 0.5 1 0 0 0.3312333 0.07 0.5 1 0 0 0.5001322 0.07 0.5 1 0 0 0.3252688 0.07 0.5 1 0 0 0.4822900 0.07 0.5 1 0 0 0.3515249 0.07 0.5 1 0 0 0.4836197 0.07 0.5 1 0 0 0.3796296 0.07 0.5 1 0 0 0.2374334 0.07 0.5 1 0 0 0.2439367 0.07 0.5 1 0 0 0.1602456 0.07 0.5 1 0 0 0.2312500 0.07 0.5 1 0 0 0.8488216 0.07 0.5 1 1 0 0.8472093 0.07 0.5 1 0 0 1.0440485 0.07 0.5 1 0 0 0.9208815 0.07 0.5 1 0 0 0.9387877 0.07 0.5 1 0 0 1.1929144 0.07 0.5 1 0 0 1.7572786 0.07 0.5 1 0 0 0.9151355 0.07 0.5 1 0 0 1.2559558 0.07 0.5 1 0 0 1.1759934 0.07 0.5 1 0 0 1.7465747 0.07 0.5 1 0 0 2.4862373 0.07 0.5 1 0 0 2.4405618 0.07 0.5 1 0 0 3.4839917 0.07 0.5 1 0 0 5.7556963 0.07 0.5 1 0 0 3.3591598 0.07 0.5 1 0 0 3.3471258 0.07 0.5 1 0 0 6.5572674 0.07 0.5 1 0 0 3.8542786 0.07 0.5 1 0 0 4.4468939 0.07 0.5 1 0 0 4.4002278 0.07 0.5 1 0 0 4.6747778 0.07 0.5 1 0 0 4.2003163 0.07 0.5 1 0 0 5.2316854 0.07 0.5 1 0 0 6.1956928 0.07 0.5 1 1 0 9.2880570 0.07 0.5 1 0 0 5.2759323 0.07 0.5 3 0 0 5.6891960 0.07 0.5 3 0 0 3.5593666 0.07 0.5 3 0 0 1.9292312 0.07 0.5 20 0 0 2.6713994 0.07 0.5 20 0 0 1.8885801 0.07 0.5 20 0 0 1.8040694 0.07 0.5 20 0 0 1.7526615 0.07 0.5 20 0 0 2.0106814 0.07 0.5 20 1 0 1.6252591 0.07 0.5 20 0 0 1.8017329 0.07 0.5 20 0 0 1.4488495 0.07 0.5 20 0 0 1.2168779 0.07 0.5 20 0 0 2.0032830 0.07 0.5 20 0 0 1.1555587 0.07 0.5 20 0 0 1.0751166 0.07 0.5 20 0 0 2.2721227 0.07 0.5 20 0 0 1.6036624 0.07 0.5 20 0 0 2.0975010 0.07 0.5 20 0 0 1.9572098 0.07 0.5 20 1 0 1.6813667 0.09 10 20 0 0 1.5758161 0.09 10 20 0 0 1.9966546 0.09 10 20 0 0 2.4764227 0.09 10 20 0 0 2.8488007 0.09 20 20 0 0 2.6637306 0.09 20 20 0 0 2.8162721 0.09 20 20 0 0 2.6001077 0.09 20 20 0 0 1.5894797 0.09 20 20 0 0 2.1950105 0.11 20 20 1 0 1.6263468 0.11 20 20 0 0 1.8976734 0.11 20 20 0 0 1.6096398 0.11 20 20 0 0 1.5009201 0.11 20 20 0 0 1.5783214 0.11 20 20 0 0 1.3981174 0.11 20 20 0 0 1.1690259 0.11 20 20 0 0 0.9194704 0.11 20 20 0 0 1.0540232 0.11 20 20 0 0 1.1763860 0.11 20 20 0 0 1.5252878 0.11 20 20 0 0 1.1742093 0.11 20 20 0 0 3.8136751 0.11 20 20 0 0 2.0073488 0.11 20 20 0 0 2.7448852 0.11 20 20 0 0 1.7984086 0.11 20 20 0 0 1.9759923 0.11 20 20 0 0 1.5409623 0.11 20 20 0 0 2.3586512 0.11 20 20 0 0 1.4594724 0.11 20 20 0 0 1.3989078 0.11 20 20 0 0 1.2159621 0.11 20 20 0 0 1.4583811 0.11 20 20 0 0 1.5540499 0.11 20 20 0 0 1.4569306 0.11 20 20 0 0 1.7132759 0.11 20 20 0 0 1.8280245 0.11 20 20 0 0 2.4647509 0.11 20 20 0 0 2.1774181 0.11 20 20 0 0 2.0933134 0.11 20 20 0 0 1.4973353 0.11 20 20 0 0 1.2432843 0.11 20 20 0 0 1.5350945 0.11 20 20 0 0 1.3863774 0.11 20 20 0 0 1.5953973 0.11 20 20 0 0 1.8658197 0.11 20 20 0 0 2.7395673 0.11 20 20 0 0 1.8784120 0.11 20 20 0 0 1.7965255 0.11 20 20 0 0 2.8155407 0.11 20 20 0 0 2.3215706 0.11 20 20 0 0 1.8111513 0.11 20 20 0 0 1.6633678 0.11 20 20 0 0 1.5670568 0.11 20 20 0 0 1.9503250 0.11 20 20 0 0 1.6817802 0.11 20 20 0 0 1.6820488 0.11 20 20 0 0 2.3459841 0.11 20 20 0 0 1.7021874 0.11 20 20 0 0 1.6720504 0.11 20 20 0 0 1.5629485 0.11 20 20 0 0 1.1998658 0.11 20 20 0 0 1.1092371 0.11 20 20 0 0 1.5260981 0.11 20 20 0 0 1.3209728 0.11 20 20 0 0 1.2159580 0.11 20 20 0 0 1.2582135 0.11 20 20 0 0 1.0660533 0.11 20 20 0 0 2.2136745 0.11 20 20 0 0 1.0290641 0.11 20 20 0 0 1.1133371 0.11 20 20 0 0 2.0062529 0.11 20 20 0 0 1.1895146 0.11 20 20 0 0 2.0715051 0.11 20 20 0 0 1.7548775 0.11 20 20 0 0 1.0554558 0.11 20 20 0 1 1.1839372 0.11 20 20 0 1 1.3777651 0.11 20 20 0 1 1.0361367 0.11 20 20 0 1 2.0423229 0.11 20 20 0 1 2.0586479 0.11 20 20 0 1 2.3740129 0.11 20 20 0 1 1.6712147 0.11 20 20 0 1 1.7715363 0.11 20 20 0 1 2.3964418 0.11 20 20 0 1 1.3733103 0.11 20 20 0 1 1.3112867 0.11 20 20 0 1 1.3697364 0.11 20 20 0 1 1.1895383 0.11 20 20 0 1 2.5241314 0.11 20 20 0 1 1.2212908 0.11 20 20 0 1 1.6053514 0.11 20 20 0 1 0.9989995 0.11 20 20 0 1 1.2968232 0.11 20 20 0 1 1.3770413 0.11 20 20 0 1 0.9131243 0.11 20 20 0 1 1.4921420 0.11 20 20 0 1 0.9540247 0.11 20 20 0 1 1.0605178 0.11 20 20 0 1 0.7622555 0.11 20 20 0 1 0.8025549 0.11 20 20 0 1 1.0871273 0.11 20 20 0 1 0.8945853 0.11 20 20 0 1 0.7594745 0.11 20 20 0 1 1.3254880 0.15 20 20 0 1 0.5804381 0.15 20 20 0 1 0.4918341 0.15 20 20 0 1 0.6856156 0.15 20 20 0 1 0.7278238 0.15 20 20 0 1 0.3679483 0.15 20 20 0 1 0.7141156 0.15 20 20 0 1 0.6593457 0.15 20 20 0 1 0.8554738 0.15 20 20 0 1 0.9600813 0.15 20 20 0 1 0.5534354 0.15 20 20 0 1 0.6820879 0.2 20 20 0 0 0.5855344 0.2 20 20 0 0 0.3507366 0.2 20 20 0 0 0.3299955 0.2 20 20 0 0 0.4699115 0.2 20 20 0 0 0.2322538 0.2 20 20 0 0 0.2629292 0.2 20 20 0 0 0.1586035 0.2 20 20 0 0 0.4082599 0.2 20 20 0 0 0.4575238 0.2 20 20 0 0 0.2716628 0.2 20 20 0 0 0.1468593 0.2 20 20 0 0 0.6918954 0.2 20 20 0 0 0.3657791 0.2 20 20 0 0 0.4294517 0.2 20 20 0 0 0.2246681 0.2 20 20 0 0 0.4752675 0.2 20 20 0 0 0.2789720 0.2 20 20 0 0 0.7303103 0.2 20 20 0 0 8.6850394 0.2 20 20 0 0 1.1205674 0.2 20 20 0 0 0.3065134 0.2 20 20 0 0 0.3596491 0.2 20 20 0 0 0.2870370 0.2 20 20 0 0 0.0970874 0.2 20 20 0 0 0.0920245 0.2 20 20 0 0 0.1953125 0.2 20 20 0 0 0.2035398 0.2 20 20 0 0 0.3000000 0.2 20 20 0 0 ; proc npar1way wilcoxon;class a;var x; proc npar1way wilcoxon;class b;var x; proc npar1way wilcoxon;class c;var x; proc npar1way wilcoxon;class d;var x; proc npar1way wilcoxon;class e;var x; run;最后得到如下結果:(按abcde排序)
可以做成如下表格:
| Chi-Square | 65.6884 | 7.9437 | 29.3956 | 2.1623 | 6.6572 |
| DF | 4 | 2 | 2 | 1 | 1 |
| Pr > Chi-Square | <.0001 | 0.0188 | <.0001 | 0.1414 | 0.0099 |
可以看出保證金因素、手續費因素、當日平倉因素、是否消費旺季因素這四個因素的P值均小于0.05,落在拒絕域中,拒絕原假設,認為樣本分布與換手率的樣本分布不同,因此認為以上四個因素對換手率沒有顯著的影響;而是否有災害天氣因素的P值為0.1414大于0.05,接受原假設,認為認為樣本分布與換手率的樣本分布相同,因此認為是否有災害天氣因素對換手率有顯著的影響。
3.第三問
第三問要求的是多個分類變量之間的關系,因此選用獨立性檢驗來研究變量之間的關系。
SAS代碼:
data ex; input x a b c d e@@; cards; /*與上面數據相同*/ ; proc freq; tables a*b/chisq; tables a*c/chisq; tables a*d/chisq; tables a*e/chisq; tables b*c/chisq; tables b*d/chisq; tables b*e/chisq; tables c*d/chisq; tables c*e/chisq; tables d*e/chisq; run;得到很多表,綜合下來我們做出一張表:
保證金和手續費之間自由度為8,χ2 (Chi-Square value)=345.7143,且Prob值<0.0001<0.05,故落在拒絕域,接受備擇假設,即保證金和手續費這兩因素之間不是相互獨立的,即保證金對手續費是有關系的,同理可知,保證金和當日平倉,保證金和是否消費旺季,手續費和當日平倉,手續費和是否消費旺季,當日平倉和是否消費旺季這些因素的Prob值均小于0.05,故落在拒絕域,接受備擇假設,所以認為這些因素之間不是相互獨立的,即保證金和對當日平倉,保證金對是否消費旺季,手續費對當日平倉,手續費對是否消費旺季都是有關系的,相反可以知道,保證金和是否有災害天氣,手續費和是否有災害天氣,當日平倉和是否有災害天氣,是否有災害天氣和是否消費旺季這些因素的Prob值均大于0.05,故落在接受域,接受原假設,所以認為這些因素之間是相互獨立的,即保證金對是否有災害天氣,手續費對是否有災害天氣,當日平倉對是否有災害天氣,是否有災害天氣對是否消費旺季是沒有影響的。
結語
潰瘍好了,👴沒理由再偷懶了,555555555
總結
以上是生活随笔為你收集整理的数学建模之数据比较与影响因素分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机专业英语1700+
- 下一篇: 80ms 求解世上最难数独 —— DFS