arcgis设置nodata值_新版白话空间统计(6):在ArcGIS中实现莫兰指数计算
上一篇簡單說了一下莫蘭指數的計算原理和計算公式,如果是學生或者基礎研究者,鼓勵好好的學習一下手算或者編程計算,所謂的基礎不牢,地動山搖……但是對于工程界和應用人士,特別是非基礎學,重復造輪子是沒有啥意義的,我們直接使用已有工具來做就行。
今天我們介紹一下,在ArcGIS里面怎么進行莫蘭指數的計算。
首先介紹一下實現莫蘭指數的話,需要什么樣的數據。
既然叫做“空間自相關”,那么我們需要的數據肯定是要有空間屬性,啥叫空間屬性呢?通常說來,就是能夠表達位置的數據,狹義說起來,就需要有坐標,比如下面的表格:
擁有經度和緯度,就能在地球上表示一個固定的位置了,就像上面的表格里面,我們可以看見北京的經緯度坐標就是:東經116.3956度,北緯39.92999度。
這種由X\Y兩個數值所表達的點模型,這是最基礎的空間數據,如果你的數據連這種無法獲取,那么空間自相關分析就真沒法開展了。
如果你需要更精確的研究,那么計量經濟學上或者空間計量學上用的截面數據中,行政區劃的空間承載模型,應該用是面要素模型——
面要素模型,也稱為”多邊形“要素,通常是由一系列的封閉的點所組成的多邊形,形成的空間數據,比如在ArcGIS里面,中國的行政區劃所表達的:
我們看任意一個省,比如山西:
可以看見,山西省的行政區劃,是由若干個點組成的封閉的集合。
當然,點數據的獲取相對來說,還是比較容易的,通過百度坐標拾取就能直接弄到,但是面數據就只能通過專業測繪公司或者單位獲取了(當然,你要是能手繪,也行)。不過還好的是,我國對于1:400萬以上的數據,都是免費可公開的,也就是說,你可以通過互聯網渠道,獲取到全國縣級以上行政區劃的數據,而縣級以下的,你就只能去找相關地方的國土測繪部門去獲得了。
有了空間數據之后,那么就把你需要分析的屬性數據與空間數據進行一對一匹配上面去,比如我要分析2016年的全國各省GDP數據,那么就要有空間數據和屬性數據,才能進行分析:
(什么?有問我怎么去做這種數據的?請學習ArcGIS基礎數據處理與制圖課程……這個不歸我管,完全不懂GIS的同學,可以求助旁邊會GIS的同學)
數據準備好之后,我們就可以通過工具來進行分析了,這里以ArcGIS為例:
首先打開ArcMap,然后把數據加入進去,找到ArcToolbox——空間統計工具箱——空間模式分析——空間自相關(莫蘭指數)工具:
打開之后,出現了這樣一個窗口,而一般來說,默認只需要關注必選項就行(亮綠燈的東西),可選項可以直接不管,就按默認參數來設置(比如第三項,是否輸出分析結果報表),也可以去設置,后面我們還會再說每個參數的意義(特別是后面設置空間權重):
我們要設置的就是輸入要素類和輸入字段:
然后點擊運行即可,如果不出錯的話,會得到下面這樣的結果:
那么這個表示什么意思呢?
首先,前面兩個警告:
額……上面那張圖片不算,請大家忽略:
(不同的ArcGIS版本提示可能不同,一般來說10.4以上的話,提示應該和我一樣的)
第一個警告是說你的數據本身采用的地理坐標系,所以用距離來作為空間關系概念進行分析,會不準確。
第二警告是說,默認設置的臨近要素是1106公里(為什么用這個值呢,以后在說空間關系的時候,會進行解釋——坑.No.1)。
然后下面就是你這次計算的全局莫蘭指數了,莫蘭指數的解讀,需要反著讀,先利用P、Z值來解讀分析結果是否可信,然后讀莫蘭指數的值。關于P\Z值的解讀,我們在以后的統計顯著性說明里面,進行詳細解讀,這里大家只要記住P值大于0.1的就不可靠就行(什么?你問我為什么不可信?還是那句話,請聽后文——坑.No.2)
——現在,請大家叫我挖坑小能手。
為什么會發生這種所謂的不可靠呢?原因太多了,有可能本身數據就不可靠,當然,也有可能你的分析參數設置不正確……
我完全都沒有設置參數,全部用的默認,你所謂的分析參數設置不正確是什么鬼??
實際上這個鍋必須是讓空間關系概念來背的,一般來說,在地理空間分析的時候,距離概念一般會給點要素來用,而以行政區劃為空間要素承載的分析來看,通常采用觸點連接——也就是我們經常所說的“相鄰”或者“接壤”,比如在空間位置上,湖北與陜西、河南、安徽、江西、湖南、重慶四個省(直轄市)直接相鄰:
所以,我們可以選擇一個比較符合我們思維觀念的空間關系方法,比如區域接壤,就算相鄰:
在ArcGIS里面,把這種“接壤”的關系,叫做
“CONTIGUITY_EDGES_CORNERS”——
即所謂的共有一個公共點,或者共有一條公共邊的兩個面要素,被視為相鄰要素。
設置完成之后,再來執行一次,結果如下:
多出了兩個警告,分別說是有兩個要素,沒有找到臨近要素,分別是18號和31號——我們來看看:
18號是海南,31號是臺灣,這兩個島嶼沒有發現與任何省有共點或者共邊,被視為無臨近要素的獨立面,所以這兩個數據也不被加入到分析中。(怎么處理這種情況呢?以后再說,繼續挖坑——坑.No.3)
然后繼續看結果:
Global Moran's I Summary
Moran's Index: ? 0.259547
Expected Index: ?-0.032258
Variance: ? ? ? ?0.011107
z-score: ? ? ? ? 2.768836
p-value: ? ? ? ? 0.005626
p值,小于0.1,嗯,有效,Z得分,與P值對應閱讀,大于1.65,有效……(為什么?參考坑.No.2)
方差:0.011,期望指數-0.032,這里方差和期望指數,都是用于對比莫蘭指數和評估PZ值的,下篇文章做解釋(——坑.No.4)。
最后看最關鍵的全局莫蘭指數:0.259。
回憶一下,莫蘭指數的范圍:
0.259代表的是,在給點的樣本的情況下,數據呈現了空間正相關的表征:即高值與高值發生聚集,低值與低值聚集,空間上呈現正相關模式,傾向于發生了空間聚類現象。
那么白話來解釋,就是:有錢的省,通常旁邊也都存在有錢的省,沒錢的省,旁邊通常也都是沒錢的省……。
那么這一樣個指數,有多大的意義呢?
答案是:統計分析里面,獨立的指數并沒有太大的意義,所有的意義都要來自于對比,如何進行對比呢?我們下期繼續。
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的arcgis设置nodata值_新版白话空间统计(6):在ArcGIS中实现莫兰指数计算的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: c语言delay_利用C语言编程单片机,
- 下一篇: python获取windows窗口_Py