全局空间自相关算法:Join Count
ArcGIS里面,全局空間自相關只提供了一個Moran's I方法,當然要說一招鮮吃遍天也是可以的,不過關于全局自相關還是有不少其他的方法的,這次給大家介紹一種更加簡單并且容易理解的全局空間自相關方法:Join Count方法。
?
這個方法最早是英國劍橋大學的著名地理學家AndrewD. Cliff 教授和美國喬治敦大學的J. Keith Ord提出,就是下面的兩位老帥哥:
?
后面這個為J. KeithOrd更是厲害,以前說的 General G 指數也有他的一份。
?
Join Counts這種算法對比那些公式復雜到抓狂的各種算法來說,簡單到讓人眼前一亮,下面我們來看看他的原理:
?
首先從他的名字上來看,就能夠猜出是怎么完的了。這個算法,就是對兩個要素之間的連接類型進行計數,然后根據這個計數來判定聚類還是離散的。
?
這種類似一種描述二進制之間關系的方式,如黑/白兩種顏色,他們之間的關系就有三種:黑-黑(BB)、白-白(WW)、黑-白(BW)。
如下圖:
?
?
三種情況的概率,就如下所示:(有數學恐懼癥的同學請略過)
?
算出來之后,他們的預期值是:
?
算出三種值來之后,就可以進行比較了,比較的結果如下:
如果BW比我們所期望的數值要低,表示正空間自相關。
如果BW比我們所期望的數值要高,表示負空間自相關。
如果BW比我們所期望的數值均等,表示隨機。
如下圖所示:
?
?
最后,我們來看看分布用我們最屬性的Moran's I和join Counts兩種方法計算出來的全局空間自相關的結果:
?
首先是數據,我們選用2004年美國大選中,小布什的得票率來計算,數據如下圖:
?
通過Moran's I方法技術出來的結果如下:
?
?
下面逐條解答一下上面的各項內容:
- 數據:data數據集里面的小布什得票數
- 空間權重(空間關系概念化):這里是面數據,用的是共點共邊就被認為是近鄰,用的是“Queen's Case”(這點看不懂的,請去看白話空間統計之五:空間關系概念化(下)里面的描述)
- Moran's I統計標準偏差:51.731(統計標準偏差:一種量度數據分布的分散程度之標準,用以衡量數據值偏離算術平均值的程度。標準偏差越小,這些值偏離平均值就越少,反之亦然。標準偏差的大小可通過標準偏差與平均值的倍率關系來衡量。)
- p值:2.2e-16,置信度為99%以上,極高置信度區間,說明這份數據效果非常好。
- alternative hypothesis(備擇假設亦稱研究假設,統計學的基本概念之一。假設檢驗中需要證實的有關總體分布的假設,它包含關于總體分布的一切使原假設不成立的命題。):極大
- Moran's I統計指數:0.5565174275
- 期望值:-0.0003219575
- 方差:0.0001158676
?
因為Moran's I的指數是在-1——1之間,越靠近1的,聚集趨勢就越明顯,所以根據以上數據,我們可以判定,小布什的得票獲勝區域(或者失敗區域)有明顯的聚集趨勢,也就是說,如果他在某個區域獲勝,那么在旁邊的區域也極有可能獲勝,反之亦然。
?
下面是通過Join Count方法進行計算的結果:
因為Join Count只能處理二值化數據,所以第一句就是將值化為二值化,布什獲勝的,設置為1,失敗的設置為0.
結論解讀如下:
- 0:0——失敗區域與失敗區域關聯的計數為130,期望值為54,方差是6.7,Z值是29.466
- 1:1——獲勝區域與獲勝區域關聯的計數為1111,期望值為1030,方差是12.6,Z值是22.596
- 1:0——獲勝區域與失敗區域關聯的計數為311,期望值為472,方差是29.47,Z值是-29.645
- Jtot——不同顏色的計數值計數為311,期望值為472,方差是29.94,Z值為-29.413
?
從上面的數據可以看出,BB和WW都明顯出現了計數值遠高于期望值,所以數據呈現聚類模式,其中BB的值方差要小于WW值的方差,所以小布什的獲勝選區的聚類程度要略大于失敗選區的聚類程度。
?
而BW的計數小于期望值,可以認為,不存在離散趨勢了。
?
檢驗統計量表明,BB和WW都是正值,說明我們假設的值比較貼合實際運算結果,是一份比較可信的運算過程。
?
最后Jtot是所謂的“不同顏色”也就是說,離散偏隨機的計數,可以看見與BW的值非常貼近,所以這份數據也表明了隨機的可能也是比較低的。
總結
以上是生活随笔為你收集整理的全局空间自相关算法:Join Count的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: EGE示例程序——2048
- 下一篇: Mendeley Destop引用格式自