【R生态】方差分解分析及其显著性检验(Variation partition analysis)
- 💂 個人信息:酷在前行
- 👍 版權: 博文由【酷在前行】原創、需要轉載請聯系博主
- 👀 如果博文對您有幫助,歡迎點贊、關注、收藏 + 訂閱專欄
- 🔖 本文收錄于【R生態】,該專欄主要介紹R語言在微生態等領域的應用,如降維分析,物種與物種間及環境因子的關系,群落構建機制等等。請大家多多關注點贊和支持,共同進步~ 歡迎大家訂閱!
📋文章目錄
- 🐣 一、方差分解分析的簡介
- 🐤 二、VPA分析的R語言實現過程
- 🦅 三、VPA分析中不同變量的顯著性檢驗
??高分期刊中頻頻登場的 方差分解分析(VPA) 到底是啥?這個分析可能還有很多同學沒接觸過。目前,群落分析中常見的環境因子分析包括典范對應分析(canonical correspondence analysis)和冗余分析 (Redundancy analysis),這兩種類型分析都是基于降維的思想,將樣本、物種、環境因子的信息映射到二維平面上,從而判斷三者間的關系,可用于發現對群落結構有影響的環境變量。而VPA分析可以看做是CCA/RDA分析的一種升級。用幾組解釋變量(如環境、氣候、土壤因子等數據)來共同解釋一組響應變量的變化(如微生物數據),當我們需要某個解釋變量所能夠解釋的方差變異程度信息(即某個環境因子對群落結構變化的貢獻度)時,就可以采用VPA分析加以補充。 但是需要注意的是 ,該分析主要用于矩陣之間的評估(也就是多變量,多行多列的樣本),如果是單變量不建議用該方法,需要選擇其他途經!
🐣 一、方差分解分析的簡介
?? 方差分解的數學原理,可以參考該鏈接,有比較清晰且易理解的介紹方差分解原理
?? 從土壤微生物生態領域的角度:就是將每個解釋變量(環境因子)進行獨立運行CCA或RDA,獲得每個解釋變量(環境因子)對于響應變量(微生物群落)的方差變異的解釋貢獻度,之后通過將多組數據取交并集的方式獲得每個解釋變量(環境因子)的獨立解釋貢獻度以及環境因子共同解釋的貢獻度。
🐤 二、VPA分析的R語言實現過程
?? 這里主要到"vegan"包中的varpart()函數并使用自帶的數據集來進行VPA分析,并使用plot以圖形式輸出結果。溫馨提示:關于VPA分析時所用的環境因子的分類是可以根據你自己選擇來劃分的,例如現有氣候因子年均溫、年降雨量;土壤理化因子有pH、SOC、TN、TP、TK、含水率、陽離子交換量。響應變量為土壤微生物豐度數據。因此,我將所有變量劃分為兩個解釋變量:氣候和土壤理化。
加載自帶數據集 “mite”、“mite.env”、“mite.pcnm”。其中mite為物種豐度數據,mite.env和mite.pcnm為環境因子數據。
# intall.packages("vegan") # 加載vegan包 library(vegan) # 讀取vegan包自帶數據集 data(mite) head(mite) # Brachy PHTH HPAV RARD SSTR Protopl MEGR MPRO TVIE HMIN HMIN2 NPRA TVEL ONOV SUCT LCIL Oribatl1 Ceratoz1 PWIL Galumna1 Stgncrs2 # 1 17 5 5 3 2 1 4 2 2 1 4 1 17 4 9 50 3 1 1 8 0 # 2 2 7 16 0 6 0 4 2 0 0 1 3 21 27 12 138 6 0 1 3 9 # 3 4 3 1 1 2 0 3 0 0 0 6 3 20 17 10 89 3 0 2 1 8 # 4 23 7 10 2 2 0 4 0 1 2 10 0 18 47 17 108 10 1 0 1 2 # 5 5 8 13 9 0 13 0 0 0 3 14 3 32 43 27 5 1 0 5 2 1 # 6 19 7 5 9 3 2 3 0 0 20 16 2 13 38 39 3 5 0 1 1 8 # HRUF Trhypch1 PPEL NCOR SLAT FSET Lepidzts Eupelops Miniglmn LRUG PLAG2 Ceratoz3 Oppiminu Trimalc2 # 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 # 2 1 1 1 2 2 2 1 0 0 0 0 0 0 0 # 3 0 3 0 2 0 8 0 0 0 0 0 0 0 0 # 4 1 2 1 3 2 12 0 0 0 0 0 0 0 0 # 5 0 1 0 0 0 12 2 0 0 0 0 0 0 0 # 6 0 4 0 1 0 10 0 0 0 0 0 0 0 0data("mite.env") head(mite.env) # SubsDens WatrCont Substrate Shrub Topo # 1 39.18 350.15 Sphagn1 Few Hummock # 2 54.99 434.81 Litter Few Hummock # 3 46.07 371.72 Interface Few Hummock # 4 48.19 360.50 Sphagn1 Few Hummock # 5 23.55 204.13 Sphagn1 Few Hummock # 6 57.32 311.55 Sphagn1 Few Hummockdata("mite.pcnm") head(mite.pcnm)# V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 # 1 0.01936957 -0.03564740 -0.004243617 0.013606215 -0.05189017 -0.03474468 0.04783919 -0.026592487 0.151774834 -0.12300738 # 2 0.02327134 -0.04809322 -0.004319021 -0.004129358 -0.06717623 -0.05795898 0.16017261 0.001190912 0.195925637 -0.24690953 # 3 0.02553531 -0.05844679 -0.003091072 -0.025699042 -0.07594608 -0.07619106 0.22316903 0.038178673 0.155709724 -0.21935603 # 4 0.03065998 -0.07805595 -0.001108683 -0.056124820 -0.08546514 -0.09535844 0.27612594 0.070969519 0.131881864 -0.19932613 # 5 0.03105726 -0.08758357 0.003294018 -0.092445741 -0.05775704 -0.08126478 0.21478882 0.098269886 -0.068740442 0.05495368 # 6 0.04127819 -0.12060082 0.004167658 -0.126085915 -0.10026023 -0.13218923 0.35013357 0.147698598 0.005177207 -0.02570014 # V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 # 1 -0.26517774 0.023371850 0.005195660 0.3626868085 0.34076414 0.170882098 -0.059228827 -0.03939074 -0.11782730 -0.01147239 # 2 -0.37584499 -0.075700042 0.022159511 0.0006411373 0.01202768 0.087636037 -0.001942823 0.05588741 -0.22830818 -0.15116529 # 3 -0.28061570 -0.099198666 0.008921100 -0.2035796515 -0.18501351 -0.007381247 0.027437893 0.06861847 0.02131584 -0.02865909 # 4 -0.23039945 -0.102046893 0.004433267 -0.2052618137 -0.16789083 0.009568853 0.007357390 0.01615628 -0.01806509 -0.03897287 # 5 0.14857244 0.009435476 0.014393038 0.0297003749 0.07653256 -0.032179051 -0.137244148 -0.29799001 0.34456985 0.23947188 # 6 0.05764401 -0.042577994 -0.030850935 -0.1161627137 -0.08461676 -0.013815945 -0.005356515 -0.01820232 0.25465418 0.17103563 # V21 V22 # 1 -0.21718792 -0.239723133 # 2 -0.05943333 -0.138925891 # 3 0.08954033 0.074659665 # 4 0.11164163 0.136237788 # 5 0.03596404 -0.047024199 # 6 -0.02836968 -0.004707296注意,數據格式的模仿:數據集的行為樣本編號,列為物種或者環境變量。
接著,我們利用varpart()函數進行擬合模型。由于mite.pcnm的數據集太大了,我們就取了取了前5個作為第二個環境因子。
# 擬合模型 ?varpart # 簡單了解函數用法 fit <- varpart (mite, mite.env, mite.pcnm[,1:5], transfo="hel") fit進行VPA分析時,需要記住:第一個數據物種數據,之后兩個數據分別代表不同的環境變量,transfo表示對數據進行轉換,hel為hellinger轉換,避免“弓形效應”。
第一個函數介紹的結果: 大家可以利用help查閱相關資料;
為了讓大家更好的理解VPA分析的結果,這里舉例解讀
如圖所示微生物群落的方差總體解釋量為Y,檢測了兩個環境因子數據X1、X2。VPA是將兩個環境因子的數據各自獨立運行RDA分析(RDA則為標準化后的解釋變量對響應變量逐一進行多元回歸分析,獲得擬合值、殘差值,最終整合成為擬合值矩陣,該矩陣進行PCA、然后排序所得結果),獲得每個環境因子對于群落整體變差校正解釋量,再運行兩者共同存在時獲得校正后解釋度數據R方,具體得到如下結果:
-
[獨立運行X1的RDA]:A+C部分解釋貢獻度占比
-
[獨立運行X2的RDA]:B+C部分解釋貢獻度占比
-
[共同運行X1和X2的RDA]:A+B+C部分解釋貢獻度占比
最后可以得到:
[A]= [共同運行X1、X2的RDA]- [獨立運行X2的RDA]
[B]= [共同運行X1、X2的RDA]- [獨立運行X1的RDA]
[C]= [共同運行X1、X2的RDA]- [A]- [B]
[未被這兩種環境因子解釋到的殘差(D)]=Y- [A]-[B]- [C]
第二個結果:
使用plot函數可視化得到的VPA分析結果:
通過維恩圖的展示就可以清楚的看到每種環境因子對于總體變異的解釋程度、共有解釋程度以及殘差。需要注意的事,圖中共有的部分產生的原因在于環境因子數據對微生物解釋存在著共線性而產生,如果環境因子完全相互獨立理論上重疊部分=0;此外,如果解釋貢獻度出現負數,則說明這組環境因子數據對群落數據方差變化解釋程度比使用隨機變量的解釋程度還要低,一般當做貢獻度為0進行解釋,建議在選擇環境因子時減少共線性程度較高的環境因子以及貢獻度為負數的環境因子數據,以保證結果準確。
🦅 三、VPA分析中不同變量的顯著性檢驗
實際上RDA和方差分解的結果是相同的(這里不做展示),可以發現環境X1與X2共同解釋了26% 的群落結構變異,其中X1解釋了 16% 的群落組成變異,氣候解釋了5% 的群落組成變異。然而對于二者是否顯著,是可以做進一步檢驗。特殊情況,關于冗余分析(RDA)中環境因子共同解釋部分出現負值的說明。我推薦賴江山老師對于該結果的深刻解讀為什么VPA分析的結果會出現負值。
# 首先將兩個環境因子合并 mite.total <- data.frame(mite.env,mite.pcnm[,1:5])# 描述partial RDA的公式 # X1 formula_X1 <- formula(mite ~ SubsDens+WatrCont+Substrate+Shrub+Topo+ Condition(V1)+Condition(V2)+Condition(V3)+Condition(V4)+Condition(V5)) # X2 formula_X2 <- formula(mite ~ Condition(SubsDens)+Condition(WatrCont)+Condition(Substrate)+Condition(Shrub)+Condition(Topo)+V1+V2+V3+V4+V5) # X1和X2 formula_X1X2 <- formula(mite ~ SubsDens:WatrCont:Substrate:Shrub:Topo:V1:V2:V3:V4:V5)# 利用partial RDA進行999次的置換檢驗,最后得出模型的顯著性 anova(rda(formula_X1, data = mite.total)) anova(rda(formula_X2, data = mite.total)) anova(rda(formula_X1X2, data = mite.total))其中:Condition是表示控制一部分變量,只探究非condition部分的變量,即控制mite.pcnm則只探究mite.env。反之,探究另一個環境因子。特別強調:最后一種情況是我理解上的共同解釋部分的顯著性檢驗,但是對錯與否目前我也沒找到正確答案。這里需要更多的統計學專業的同學給出建議來完善。
因此,結論是兩個環境因子對物種的解釋及其共同解釋均不顯著。
總結
以上是生活随笔為你收集整理的【R生态】方差分解分析及其显著性检验(Variation partition analysis)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 3000元投影仪对比评测,当贝D3X完胜
- 下一篇: 互联网摸鱼日报(2023-02-26)