因子分析在SPSS中的操作过程及结果解读
因子分析在SPSS中的操作過程及結果解讀
筆者在做該項研究時在網絡上查閱了大量資料,都寫得比較專業,所以該篇文章將因子分析從前到后做一個通俗易懂的解釋,全文并不涉及非常晦澀的公式原理。
一.因子分析是什么:
1.因子分析:
因子分析模型中,假定每個原始變量由兩部分組成:共同因子和唯一因子。共同因子是各個原始變量所共有的因子,解釋變量之間的相關關系。唯一因子顧名思義是每個原始變量所特有的因子,表示該變量不能被共同因子解釋的部分。
(幫助解讀:舉個例子,現在一個excel表有10個變量,因子分析可以將這10個變量通過某種算法變為3個,4個,5個等等因子,而每個因子都能表達一種涵義,從而達到了降維的效果,方便接下來的數據分析)
2.因子分析與主成分分析的區別:
主成分分析是試圖尋找原有變量的一個線性組合。這個線性組合方差越大,那么該組合所攜帶的信息就越多。也就是說,主成分分析就是將原始數據的主要成分放大。
因子分析,它是假設原有變量的背后存在著一個個隱藏的因子,這個因子可以可以包括原有變量中的一個或者幾個,因子分析并不是原有變量的線性組合。
(幫助解讀:主成分分析降維凸顯變量中起主導作用的變量,因子分析尋找變量背后可以概括變量特征的因子)
---------------------------算法及原理就不介紹了,比較禿頭-----------------------------
二.因子分析怎么做(在spss中):
1.數據準備:
下圖數據是一份某城市的空氣質量數據,一共6個變量,分別是:二氧化硫、二氧化氮、可吸入顆粒物、一氧化碳、臭氧、細顆粒物。在SPSS中打開數據如下:
2.操作步驟:
1)打開因子分析工具:
2)選擇要進行因子分析的變量:
3)設置因子分析模型:(可以按照以下截圖設置模型,一般來說足夠)
a.描述:這里要說一下KMO和Bartlett的球形度檢驗,
KMO檢驗統計量是用于比較變量間簡單相關系數和偏相關系數的指標。主要應用于多元統計的因子分析。KMO統計量是取值在0和1之間。Kaiser給出了常用的kmo度量標準: 0.9以上表示非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。KMO統計量是取值在0和1之間。當所有變量間的簡單相關系數平方和遠遠大于偏相關系數平方和時,KMO值接近1.KMO值越接近于1,意味著變量間的相關性越強,原有變量越適合作因子分析;當所有變量間的簡單相關系數平方和接近0時,KMO值接近0.KMO值越接近于0,意味著變量間的相關性越弱,原有變量越不適合作因子分析。
Bartlett’s球形檢驗用于檢驗相關陣中各變量間的相關性,是否為單位陣,即檢驗各個變量是否各自獨立。如果變量間彼此獨立,則無法從中提取公因子,也就無法應用因子分析法。Bartlett球形檢驗判斷如果相關陣是單位陣,則各變量獨立,因子分析法無效。由SPSS檢驗結果顯示Sig.<0.05(即p值<0.05)時,說明各變量間具有相關性,因子分析有效。
b.抽取:一般來說方法我們都選擇主成分方法,但是在python中進行因子分析時用的不是這個方法。
c.旋轉:旋轉的作用是為了方便最后看什么變量屬于哪個因子。
d.得分:
e.選項:
到此模型設置完畢,點擊確定即可在SPSS窗口中看到分析結果。
三.因子分析結果解讀:
主要看以下幾部分的結果。
1.KMO和Bartlett的檢驗結果:
首先是KMO的值為0.733,大于閾值0.5,所以說明了變量之間是存在相關性的,符合要求;然后是Bartlett球形檢驗的結果,在這里只需要看Sig.這一項,其值為0.000,所以小于0.05。那么也就是說,這份數據是可以進行因子分析的。
2.公因子方差:
公因子方差表的意思就是,每一個變量都可以用公因子表示,而公因子究竟能表達多少呢,其表達的大小就是公因子方差表中的“提取”,“提取”的值越大說明變量可以被公因子表達的越好,一般大于0.5即可以說是可以被表達,但是更好的是要求大于0.7才足以說明變量能被公因子表的很合理。在本例中可以看到,“提取”的值都是大于0.7的,所以變量可以被表達的很不錯。
3.解釋的總方差和碎石圖:
簡單地說,解釋地總方差就是看因子對于變量解釋的貢獻率(可以理解為究竟需要多少因子才能把變量表達為100%)。這張表只需要看圖中紅框的一列,表示的就是貢獻率,藍框則代表四個因子就可以將變量表達到了91.151%,說明表達的還是不錯的,我覺得一般都要表達到90%以上才可以,否則就要調整因子數據。再看碎石圖,也確實就是四個因子之后折線就變得平緩了。
4.旋轉成分矩陣:
這一張表是用來看哪些變量可以包含在哪些因子里,一列一列地看:第一列,最大的值為0.917和0.772,分別對應的是細顆粒物和可吸入顆粒物,因此我們可以把因子歸結為顆粒物。第二列,最大值為0.95對應著二氧化硫,因此我們可以把因子歸結為硫化物。第三列,最大值為0.962,對應著臭氧,因此可以把因子歸結為臭氧。第四列,最大值為0.754和0.571,分別對應著二氧化氮和一氧化碳,因子歸結為什么這個我也不清楚,可能要請教一下環工環科的同學們,此處我選擇滑稽…
四.總結:
因子分析還是非常好用的一種降維方式的,在SPSS中進行操作十分簡單方便,結果一目了然。喜好機器學習的同學們自然也知道,這么好的方法怎么能少得了python呢,沒錯python也可以做因子分析,代碼量也并不是很大,但是,python做因子分析時會有一些功能需要自己根據算法寫(頭皮發麻),比如說KMO檢驗。喜歡本文的話請點贊或留言哦,接下來還會有一些數據分析和機器學習方面的知識與大家分享~
總結
以上是生活随笔為你收集整理的因子分析在SPSS中的操作过程及结果解读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是系统安全状态
- 下一篇: 网络爬虫--9.正则表达式