rda冗余分析步骤_群落分析的典范对应分析(CCA)概述
CCA算法的簡化描述
CA的發展過程中出現了兩種計算方法,與此對應,存在兩種CCA的計算方法。盡管計算過程存在區別,但結果都是一致的。以下是CCA計算過程簡述,細節部分可參考Legendre和Legendre(1998)“Numerical Ecology”,594頁后的內容。
基于迭代的CCA(最初方法)
這種CCA?方法的基本思路是在基于迭代的CA過程中,將每輪迭代獲得的樣方得分(坐標值)都與環境因子以多元回歸的方式相結合。簡化步驟如下:
(1)從任意(隨機)樣方得分(xi)開始。
(2)以樣方中物種豐度加權的樣方得分(xi)平均值計算物種得分(uj),權重(wij)代表了物種(j)在樣方(i)中的豐度。
uj?=?∑(wij?* xi) /?∑(wij)
(3)計算新樣方得分(xi),作為樣方中物種豐度加權的物種得分(uj)平均值。
xi?=?∑(wij?* uj) /?∑(wij)
第(1)-(3)步與CA過程完全相同,僅使用響應變量(物種多度)矩陣;第(4)步開始加入解釋變量(環境變量)數據。
(4)通過多元回歸計算樣方與環境變量之間的回歸系數(bk),稱為典范系數(canonical coefficient),它反映了各個環境變量對排序軸所起作用的大小。
(5)通過典范系數計算新樣方得分(xi)。
xi?=?∑bkUki?+ b0
式中xi為第i個樣方的得分,b0是截距(常數),bk是樣方i與第k個環境變量之間的回歸系數,Uki是第k個環境變量在第i個樣方中的測量值。
(6)標準化樣方得分(軸因加權平均而收縮,因此拉伸軸),通過減去均值然后除以標準差實現。
(7)如果新計算的樣方得分與舊樣方得分相同(或幾乎相同,即達到收斂),可停止運行;若仍存在明顯差異,繼續執行步驟(2)。
結合(1)-(7)過程,可以看到CCA和CA的區別是增加了(4)、(5)兩步,其它步驟沒有變化。并且同CA,無論從任意給定的隨機數開始,然后以特定的方式收斂,最終的解始終是唯一的。
(8)在計算出第1軸的樣方和物種得分之后,可以繼續到第2軸以及更多軸,同時保持與所有先前計算的軸的線性獨立性。以第2排序軸為例,與第1排序軸一樣,進行(1)-(5),在選初始值時可以選第1軸某一步的結果,以加快迭代收斂速度。第(6)步時與CA一樣,先進行正交化,再進行標準化。
(9)計算解釋變量(環境變量)得分。
fkm?= [λm?(1-λm)]1/2?akm
式中fkm為第k個環境變量在第m排序軸上的得分,λm為第1排序軸的特征值,akm為第k個環境變量與第m個排序軸間的相關系數。這一相關系數不同于典范系數,它是最終求出的樣方得分與環境變量之間的相關系數,但其生物學意義與典范系數基本一致。
基于迭代的CCA(目前大多數軟件的方法)
這種CCA?方法為在CA分析中表征χ2統計量的貢獻率的?矩陣中加入RDA的加權模式。
原始的響應變量矩陣(物種多度數據集)首先被轉化為一個描述樣方對對Pearson χ2統計量的貢獻率的?矩陣,通過?矩陣完成回歸集,并使用加權多元回歸代替簡單多元回歸。其中權重為各樣方中所有物種的總和。關于CCA軸的特征
CCA可獲得的約束軸數為min[p–1, m, n–1]。其中,p為響應變量(物種)數量;m為定量解釋變量數量以及定性解釋變量(因子變量)的因子水平的自由度(即該變量因子水平數減1);n為排序對象(樣方)數量。
在CA中,排序軸承載的總變差≠總方差,而是通過一個叫總慣量(total inertia)的指標表征,它代表了?矩陣所有值的平方和。與此對應,CCA中R2即代表了總慣量(而非總方差)被環境變量所解釋的程度,約束軸承載了被成功解釋的慣量部分。
根據計算過程,可以看到CCA與CA共享一套基礎算法,CCA是在CA的基礎上添加約束過程發展而來,其約束算法源自RDA中使用的多元回歸。因此其很多特征與CA(體現在樣方與物種的關系)或RDA(體現在環境變量的解釋規則)相似,可分別參考前文CA或RDA。
CCA排序圖
CCA三序圖中一個非常矚目的特征是物種在約束軸的排序位置反映其生態梯度最適點,這個特征使物種組成的生物學解釋更加直觀和容易。
CCA排序圖中,樣方和物種常用點表示,定性解釋變量同樣以點表示(質心位置),定量解釋變量以向量表示。對于CCA中兩種主要標尺的解讀方式如下所述。
對于樣方和物種的關系,其解釋與CA中的解釋相同。
I型標尺圖中,(1)排序圖內樣方之間的距離近似于它們的χ2距離,排序圖中兩個樣方點越近,代表這些樣方內的物種組成越相似;(2)一個樣方點靠近一個物種點,表示該物種對于該樣方的貢獻比較大。
II型標尺圖中,(1)排序圖內物種之間的距離近似于它們的χ2距離,排序圖中兩個物種點越近,代表它們的相對多度沿樣方分布越相似;(2)一個物種點靠近一個樣方點,表示該物種在該樣方內存在的可能性很大,或在該樣方內的多度比在其它樣方內大。
對于解釋變量(環境變量)與樣方或物種的關系。
I型標尺圖中,(1)將對象點垂直投影到變量向量或延長線上,投影點位置接近該樣方內該解釋變量數值的位置。(2)定性解釋變量質心的點靠近某一樣方,表明其在該樣方中的狀態更可能為“1”。
II型標尺圖中,(1)將物種點垂直投影到變量向量或延長線上,投影點的位置表示該物種在該環境變量梯度上的最適區域。(2)定性解釋變量質心的點靠近某一物種,表明該物種更可能出現在(或大量存在)該變量的狀態為“1”的樣方中。
CCA的一些注意事項
(1)保證物種在生態梯度上呈單峰響應分布。即環境梯度必須足夠長,在所觀測的樣方中具有明顯的物種豐度變化。梯度太短可能會表現出線性響應,盡管CCA也可以處理線性關系,但效果不如RDA。
(2)CCA對稀有物種敏感,低豐度物種經常在CCA排序圖中作為異常值定位,帶來較大的偏差。可選在執行CCA前過濾它們,盡管不是必須的過程。
(3)結果中,解釋變量代表了與響應變量的線性因果關系。如果不確定是否真實存在這種因果關系,則應謹慎進行解釋。
DCCA簡述
類似CA,作為單峰排序方法,CCA中同樣可能會出現弓形效應。可通過去趨勢典范對應分析(DCCA)將第一軸分成數個區間,并在每一區間內通過中心化調整第二軸的坐標值,以去除弓形效應的影響,具體原理和去趨勢對應分析(DCA)類似。關于弓形效應和DCA,可參考前文。
以下是對DCCA方法的簡化描述,基本過程同上述CCA,除了第(8)步。
(1)從任意(隨機)樣方得分開始。
(2)以樣方中物種豐度加權的樣方得分平均值計算物種得分。
(3)以樣方中物種豐度加權的物種得分平均值計算新樣方得分。
(4)計算樣方與環境變量之間的回歸系數。
(5)結合回歸系數計算新樣方得分。
(6)標準化樣方得分。
(7)回到第(2)步,重復迭代過程,得到穩定的值。
(8)可以看到,對于第1軸,計算方法和CCA相同。因為弓形趨勢只影響正交軸,所以在第2軸開始,需將原來CCA中的正交化替換為去趨勢方法。
(9)求環境變量得分。
盡管DCCA較少使用,但不可否認它的實用價值。
參考資料
張金屯.?數量生態學.?科學出版社, 2004.
DanielBorcard, FranoisGillet, PierreLegendre, et al.?數量生態學:R語言的應用(賴江山?譯).?高等教育出版社, 2014.
GUSTA ME Blog:https://mb3is.megx.net/gustame/constrained-analyses/cca
RDA & CCA:https://www.davidzeleny.net/anadat-r/doku.php/en:rda_cca_examples
Robustness of CCA:http://ordination.okstate.edu/robust.htm
Legendre P, Legendre L. Numerical Ecology. Second English edition. Developments in Environmental Modelling, 1998, 20, Elsevier
友情鏈接R包vegan的基于距離的冗余分析(db-RDA)
R包vegan的冗余分析(RDA)
群落分析的冗余分析(RDA)概述
RDA、CCA的解釋變量選擇概述
RDA、CCA的R2校正及約束軸的顯著性檢驗概述
R包vegan實現在物種多度的非約束排序中被動擬合環境變量
R包vegan的非度量多維標度(NMDS)分析
R包vegan的主坐標分析(PCoA)
主坐標分析(PCoA)及非度量多維標度(NMDS)概述
R包vegan的群落去趨勢對應分析(DCA)
R包vegan的群落對應分析(CA)
R包vegan的群落PCA及tb-PCA分析
總結
以上是生活随笔為你收集整理的rda冗余分析步骤_群落分析的典范对应分析(CCA)概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: cookie页面跳转问题 财富值9
- 下一篇: 如何输入一个整数逆序输出_如何匹配DSP