SPSS常用的几种统计分析
實(shí)驗(yàn)1:地理數(shù)據(jù)的統(tǒng)計(jì)處理
實(shí)驗(yàn)步驟與結(jié)果分析:
1.點(diǎn)擊菜單欄【文件】下拉選項(xiàng)框,打開已經(jīng)下載好的Excel表“"D:\桌面\計(jì)量地理學(xué)實(shí)習(xí)\表2-1某地區(qū)有關(guān)農(nóng)業(yè)統(tǒng)計(jì)數(shù)據(jù).xls"”,如下圖所示:
2.點(diǎn)擊菜單欄上面的【分析】—【描述統(tǒng)計(jì)】—【頻率】工具,如下圖所示:
?3.將需要進(jìn)行統(tǒng)計(jì)分析的變量選中加載到右邊,點(diǎn)擊確定得到如下結(jié)果(每個(gè)變量因子的頻數(shù)統(tǒng)計(jì)表):
4.選中【分析】—【描述統(tǒng)計(jì)】—【描述】工具,將需要進(jìn)行統(tǒng)計(jì)分析的變量選中加載到右邊,如下圖所示:
5.點(diǎn)擊確定得到如下輸出結(jié)果(每個(gè)變量的統(tǒng)計(jì)參數(shù)):
?6.最后將其導(dǎo)出為柱狀圖,更加直觀的查看各個(gè)變量之間的統(tǒng)計(jì)參數(shù)差別,導(dǎo)出圖表如下圖所示:
?
實(shí)驗(yàn)2:相關(guān)分析
實(shí)驗(yàn)步驟與結(jié)果分析
1.實(shí)驗(yàn)數(shù)據(jù)整理準(zhǔn)備后加載到SPSS,如下圖所示:
在進(jìn)行雙變量相關(guān)分析前,我們需要對數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),選中菜單欄【圖形】|【回歸變量圖】
將兩個(gè)變量分別加載進(jìn)來,如下圖所示:
可以看到兩者之間是屬于負(fù)相關(guān)。
4.由于我們的相關(guān)分析是兩個(gè)變量之間的分析,為此我們打開【分析】—【相關(guān)】—【雙變量】工具,將兩個(gè)變量【水土流失面積】和【土壤含氮量】加載進(jìn)去,
5.從表中可以看到,水土流失面積和土壤含氮量存在相關(guān)關(guān)系,其相關(guān)系數(shù)為-0.946,呈現(xiàn)中度相關(guān)性,且在0.01的顯著性水平上顯著,即樣本數(shù)據(jù)中的這個(gè)相關(guān)性在總體中一樣有效。
實(shí)驗(yàn)3:主成分分析
實(shí)驗(yàn)步驟與結(jié)果分析:
1.數(shù)據(jù)準(zhǔn)備,在SPSS載入“"D:\桌面\計(jì)量地理學(xué)實(shí)習(xí)\主成分分析.xlsx"”數(shù)據(jù),如下圖所示:
2.打開【分析】|【降維】|【因子分析】工具,將數(shù)據(jù)中除了【城市】這個(gè)變量,其余變量全部添加進(jìn)去,
3.點(diǎn)擊【描述】,勾選新打開界面的【系數(shù)】選項(xiàng)和【抽取】中的【碎石圖】選項(xiàng)(使得分析結(jié)果更為直觀),如下圖所示:
點(diǎn)擊確定得到主成分分析運(yùn)算結(jié)果。在公因子方差(Communalities)表中,給出了因子載荷陣的初始公因子方差(Initial)和提取公因子方差(Extraction)。
?總方差解釋:
?
5.該表按順序排列出主成分得分的方差(Total),在數(shù)值上=相關(guān)系數(shù)矩陣的各個(gè)特征根λ,因此可以直接根據(jù)特征根計(jì)算每一個(gè)主成分的方差百分比和方差累計(jì)值。由圖可知,主成分是兩個(gè),都是方差(特征根)大于1的,第一主成分占比重62.602%,第二主成分占比重23.514%,這兩個(gè)主成分達(dá)到85.116%,超過了85%,可以說用這兩個(gè)指標(biāo)評價(jià)各省份的經(jīng)濟(jì)可以近似代替原來的10個(gè)指標(biāo)。主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定。相關(guān)系數(shù)矩陣的特征根剛好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。
?6.從碎石圖看的話也可以知道由圖直觀的看出,成分1、2包含了大部分信息,從3開始就基本趨向平穩(wěn)狀態(tài)了。
7.該表是主成分載荷矩陣,每一列載荷值都顯示了各個(gè)變量與有關(guān)主成分的相關(guān)系數(shù)。以第一列為例,0.69實(shí)際上是總?cè)丝谂c第一個(gè)主成分的相關(guān)系數(shù)。
8.事實(shí)上,有如下關(guān)系成立:相關(guān)系數(shù)矩陣的特征根=方差貢獻(xiàn)=主成分得分的方差。兩個(gè)主成分可以解釋各個(gè)變量達(dá)到了最小72.9%,最大97%,如果我們將8個(gè)主成分全部提取,則主成分載荷的行平方和都等1,就是第一張表上面的起始公因子方差。到此可以明白:在Communalities中,Initial對應(yīng)的是初始公因子方差,實(shí)際上是全部主成分的公因子方差,Extraction對應(yīng)的是提取的主成分的公因子方差,我們提取了兩個(gè)主成分,故計(jì)算公因子方差時(shí)只考慮兩個(gè)主成分。
提取主成分的原則上要求公因子方差的各個(gè)數(shù)值盡可能接近,亦即要求它們的方差小,當(dāng)公因子方差完全相等時(shí),它們的方差為0,這就達(dá)到理想狀態(tài)。實(shí)際應(yīng)用中,只要公因子方差數(shù)值彼此不相差太遠(yuǎn)就行了。從上面給出的結(jié)果可以看出:提取兩個(gè)主成分的時(shí)候,變量客運(yùn)總量(萬人)的公因子方差偏小,這暗示提取2個(gè)主成分,客運(yùn)總量(萬人)方面的信息可能有較多的損失。至于方差貢獻(xiàn),反映對應(yīng)主成分的重要程度。
總結(jié),決定主成分?jǐn)?shù)目的3個(gè)原則:1.只取λ>1的特征根對應(yīng)的主成分;2.累計(jì)百分比達(dá)到80%~85%以上的λ值對應(yīng)的主成分;3.根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量;
9.接下來根據(jù)得到的特征值和主成分載荷值(需要復(fù)制到excel表中整理在SPSS打開)計(jì)算每一個(gè)變量的特征向量,打開【轉(zhuǎn)換】|【計(jì)算變量】工具,在目標(biāo)變量中輸入新的名字,輸入公式:V1(第一主成分的載荷值)/SQRT(第一主成分的特征值6.26),對于第二主成分計(jì)算其特征向量也是一樣的操作。
10.兩個(gè)主成分的特征向量計(jì)算結(jié)果:
將Ui與10個(gè)變量的標(biāo)準(zhǔn)化值相乘即可得到兩個(gè)主成分Y1、Y2的表達(dá)式:
Y1=0.28*X1+0.06X2+0.24X3+0.34X4+0.19X5+0.38X6+0.36X7+0.38X8+0.38X9+0.38X10
Y2=0.42*X1-0.55X2+0.44X3-0.21X4+0.44X5-0.03X6-0.22X7-0.12X8-0.01X9-0.17X10
實(shí)驗(yàn)4:因子分析
實(shí)驗(yàn)步驟與結(jié)果分析:
1.數(shù)據(jù)準(zhǔn)備,在SPSS載入“"D:\桌面\計(jì)量地理學(xué)實(shí)習(xí)\因子分析.xlsx"”數(shù)據(jù)。
2.打開【分析】|【降維】|【因子分析】工具,將數(shù)據(jù)中除了【城市】這個(gè)變量,其余變量全部添加進(jìn)去,
3.分別點(diǎn)擊【描述】、【抽取】和【旋轉(zhuǎn)】中的相關(guān)選項(xiàng),如下圖所示:
4.從運(yùn)行結(jié)果上可以看到KMO值為0.762,接近于1,說明這些數(shù)據(jù)適合進(jìn)行因子分析。同時(shí)Bartlett球形度檢驗(yàn)中的Sig值為0.000,小于顯著水平0.05,說明變量之間存在相關(guān)關(guān)系,可以做因子分析。
公因子方差最小值為0.73,所有的變量都可以使用公因子進(jìn)行表達(dá)。
這是旋轉(zhuǎn)成份矩陣。
實(shí)驗(yàn)5:聚類分析
實(shí)驗(yàn)步驟與結(jié)果分析:
1.數(shù)據(jù)準(zhǔn)備,在SPSS載入“"D:\桌面\計(jì)量地理學(xué)實(shí)習(xí)\聚類分析.xlsx"”數(shù)據(jù)。
2.打開【分析】|【分類】|【系統(tǒng)聚類】工具,將數(shù)據(jù)中所有的變量全部添加進(jìn)去,并且設(shè)置相關(guān)選項(xiàng)的設(shè)置,具體如下圖所示:
2.首先給出的是樣品處理摘要(CaseProcessingSummary)。摘要告訴我們?nèi)缦聝?nèi)容:有效樣品的數(shù)目和百分比,缺失樣品的數(shù)目和百分比,全部樣品的數(shù)目和百分比。由于沒有數(shù)據(jù)缺失,故全部21個(gè)樣本參與聚類,有效樣品為100%。
3.從進(jìn)度表可以看出,第1階段(Stage1),首先將第12號樣品和第13號樣品聚為一類,這兩個(gè)樣品的夾角余弦值最大,為623.445。
4.根據(jù)樹形圖,選擇適當(dāng)?shù)某叨确譃槿舾深悺H缓髮Ψ诸惤Y(jié)果進(jìn)行分析,考察結(jié)果是否符合實(shí)際。
實(shí)驗(yàn)6:多元線性回歸分析
實(shí)驗(yàn)步驟與結(jié)果分析:
1.數(shù)據(jù)準(zhǔn)備,在SPSS載入“"D:\桌面\計(jì)量地理學(xué)實(shí)習(xí)\多元線性回歸分析.xlsx"”數(shù)據(jù)。
打開【分析】|【回歸】|【線性】工具,將數(shù)據(jù)中所有的變量全部添加進(jìn)去,并且設(shè)置相關(guān)選項(xiàng)的設(shè)置,具體如下圖所示:
3.相關(guān)選項(xiàng)設(shè)置如下圖所示:
將標(biāo)準(zhǔn)化殘差“*ZRESID”選入“Y”中,將標(biāo)準(zhǔn)化預(yù)測值“*ZPRED”選入“X”中,勾選直方圖和正態(tài)概率圖,點(diǎn)擊繼續(xù)。
4.結(jié)果解讀
由表可知DW值接近于2,自變量的自相關(guān)性不明顯,模型設(shè)計(jì)得好,調(diào)整后的R方為0.99,模型擬合度非常好。
顯著性表示自變量對因變量的影響程度,小于0.05表示于顯著影響,越小影響越大,由表可以知道年降水量和年蒸發(fā)量對徑流深度有顯著影響。
VIF用于共線性診斷(變量之間的關(guān)聯(lián)度),當(dāng)0<VIF<10時(shí),不存在多重共線性,由表可知年降水量和年蒸發(fā)量之間不存在多重共線性。
但是根據(jù)直方圖可以知道直方圖和正態(tài)曲線較為不吻合,說明殘差不符合正態(tài)分布。
實(shí)驗(yàn)7:馬爾可夫分析
實(shí)驗(yàn)步驟與結(jié)果分析:
1.時(shí)間序列數(shù)據(jù)整理后加載到Excel中,如下圖所示:
?其中E1、E2和E3分別使用1、2和3代替,年份統(tǒng)一使用1-40代替,
2.為了計(jì)算狀態(tài)的轉(zhuǎn)移矩陣,我使用二維折線圖直觀顯示3個(gè)狀態(tài)隨著年份之間的相互轉(zhuǎn)變:
由圖可知,
?從而得到初始轉(zhuǎn)移矩陣
?3.2004年是E2狀態(tài),也就是2,預(yù)測2030年的農(nóng)業(yè)收成,需要求出26步轉(zhuǎn)移矩陣,為此我們需要計(jì)算初始轉(zhuǎn)移矩陣的26次方,如下圖所示:
?經(jīng)過專業(yè)軟件計(jì)算初始轉(zhuǎn)移矩陣的26次方結(jié)果為:
4.由于2004年的狀態(tài)向量為(7/13,2/13,4/13),也就是(0.538,0.154,0.308),求出26年后的狀態(tài)向量:
計(jì)算結(jié)果為(0.365,0.353,0.282),為此可以知道在2030年的農(nóng)業(yè)收成狀態(tài)大概率是E1(很好)。
總結(jié)
以上是生活随笔為你收集整理的SPSS常用的几种统计分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: IDEA的依赖包报红问题
- 下一篇: python木马程序设计_基于HTTP的