基于图神经网络的图像分类,遥感图像分析
遙感圖像分類法
圖像分類是與圖像信息提取和增強不同的遙感圖像處理中另一重要的方面,與圖像增強后仍需人為解譯不同,它企圖用計算機做出定量的決定來代替人為視覺判譯步驟。因此,分類處理后輸出的是一幅專題圖像。
在此圖像中,原來圖像中的每一個象元依據(jù)不同的統(tǒng)計決定準(zhǔn)則被劃歸為不同的地表覆蓋類,由于是一種統(tǒng)計決定,必然伴隨著某種錯誤的概率。
因此,在邏輯上的合理要求是,對每一個象元所做的決定,應(yīng)是使整個被分類面積即對大量單個象元的分類的某個錯誤判據(jù)為最小。
以下是幾種常用的遙感圖像分類方法:1.最大似然分類(maximumlikelihoodclassification)最大似然分類是一種基于貝葉斯判別準(zhǔn)則的非線性監(jiān)督分類方法,需要知道已知的或確定的訓(xùn)練樣區(qū)典型標(biāo)準(zhǔn)的先驗概率P(wi)和條件概率密度函數(shù)P(wi,x)。
P(wi)通常根據(jù)各種先驗知識給出或假定它們相等:P(wix)則是首先確定其分布形式,然后利用訓(xùn)練樣本估計其參數(shù)。一般假設(shè)為正態(tài)分布,或通過數(shù)學(xué)方法化為正態(tài)分布。
其判別函數(shù)集為:Di(x)=P(wix),i=1,2,…,m(2-2)如果Di(x)≥Dj(x),則x屬于wi類。其中,j≠i,j=1,2,…,m。m為類別數(shù)。
從上述最大似然分類的說明看,其關(guān)鍵就在于已知類別的定義,先驗概率的確定,參與分類的變量的好壞和結(jié)果誤差評價。
直到現(xiàn)在,最大似然分類至少還有兩個缺點:一是事先大量人力已知光譜類的選擇和定義:二是需要長時間的計算機分類計算時間。
實際上這也使得最大似然分類法遙感應(yīng)用受到了限制,因此許多人專門研究改進(jìn)算法以便解決和縮減圖像分類的時間,提高分類的精度。
Solst和Lillesand(1991)為了解決已知類別定義消耗大量人力的缺點,發(fā)展了半自動訓(xùn)練法進(jìn)行已知光譜類的定義。
FabioMaselli等(1992)利用Skidmore和Tumer提出的非參數(shù)分類器計算出各已知類訓(xùn)練集的先驗概率,然后將它們插入常規(guī)的最大似然分類過程中進(jìn)行分類。
該方法融合了非參數(shù)和參數(shù)分類過程的優(yōu)點,提高了分類的精度。
通常情況下,地形會影響到訓(xùn)練集數(shù)據(jù),這樣訓(xùn)練集光譜數(shù)據(jù)就偏離了最大似然分類的假設(shè)條件正態(tài)分布,從而常規(guī)的最大似然分類法在地形起伏較大的地區(qū)效果并不太好。
為了解決這一問題,C.Conese和G.Maracchi和F.Maselli(1993)提出了一種改進(jìn)的最大似然分類算法,即去掉每一類數(shù)據(jù)集中與第一主成分相關(guān)的信息(地形信息)然后再進(jìn)行分類。
通過試驗,這種方法是有效的,分類精度得到了提高。K.Arai(1993)用光譜和空間信息進(jìn)行分類改進(jìn)了最大似然分類方法。該方法簡單易行,大大提高了正確分類的概率。
C.Conese和FabioMaselli(1992)用誤差矩陣提高最大似然分類面積估計的精度。IrinaKerl(1996)加最大似然分類精度的一種方法,即多概率比較法。
他對同一遙感數(shù)據(jù)的原始波段、主成分和植被指數(shù)的22種組合進(jìn)行了最大似然分類,發(fā)現(xiàn)沒有一種波段組合的分類能給出圖像中所有土地利用類型的精確分類,每一波段組合僅對圖像中的一兩類土地利用類型分類有效。
因此他提出將能有效區(qū)分出所要決定的土地利用類型的幾個波段組合的分類結(jié)果進(jìn)行組合來進(jìn)行圖像分類,并稱這種方法為多概率比較法,這種方法的基礎(chǔ)就是圖像數(shù)據(jù)不同波段組合的分類結(jié)果之間分類概率大小的比較。
應(yīng)用這種方法提高了分類的精度。
2.最小距離分類(minimumdistanceclassification)最小距離分類是一種線性判別監(jiān)督分類方法,也需要對訓(xùn)練區(qū)模式樣本進(jìn)行統(tǒng)計分析,是大似然分類法中的一種極為重要的特殊情況。
最小距離分類在算法上比較簡單,首先需選出要區(qū)分類別的訓(xùn)練樣區(qū),并且從圖像數(shù)據(jù)中求出各類訓(xùn)練樣區(qū)各個波段的均值和標(biāo)準(zhǔn)差,然后再計算圖像中其他各個象元的灰度值向量到各已知類訓(xùn)練樣區(qū)均值向量之間的距離。
如果距離小于指定的閾值(一般取標(biāo)準(zhǔn)差的倍數(shù)),且與某一類的距離最近,就將該象元劃歸為某類。因此稱為最小距離分類。該方法的精度主要取決于已知類訓(xùn)練樣區(qū)的多少和樣本區(qū)的統(tǒng)計精度。
另外,距離度量的方法不同,分類的結(jié)果也不相同,常見的有:(1)明氏距離(minkowskidistance)中亞地區(qū)高光譜遙感地物蝕變信息識別與提取當(dāng)q=2時,即為歐氏距離,而當(dāng)q趨于無窮時,得到切比雪夫距離。
明氏距離,特別是其中的歐氏距離,在實際中用得較多,但它存在著兩方面的缺點:一是它與各指標(biāo)的量綱有關(guān);為克服這一缺點,常常采用先將數(shù)據(jù)規(guī)格化的方法。二是它沒有考慮變量之間的相關(guān)性。
一種改進(jìn)的距離就是馬氏距離。(2)馬氏距離(mahalanobisdistance)中亞地區(qū)高光譜遙感地物蝕變信息識別與提取當(dāng)中各特征間完全不相關(guān),這時的馬氏距離即為歐氏距離。
總之,最小距離分類是一個能在程序上經(jīng)濟有效實現(xiàn)的簡單方法,與最大似然方法不同,它在理論上并不使平均分類錯誤為最小,所得到的精度與最大似然分類法可相比擬,而計算時間卻只有后者的一半。
3.平行管道分類(parallelepipedclassification)平行管道分類是一種最簡單的分類方法,是通過研究訓(xùn)練樣區(qū)數(shù)據(jù)的各個光譜成分的直方圖來進(jìn)行分類的圖像直方圖中灰度值的上下限描述了圖像中每個波段中類別的灰度值范圍。
某一光譜類在所有波段的灰度值范圍定義了一個多維的平行管道。通過分類計算,圖像中的未知象元被劃分到屬于已知一光譜類的平行管道內(nèi),因此稱該方法為平行管道分類。
這種方法簡單易行,但也有幾個缺點:①各已知光譜類的平行管道之間必定具有一定的間隔,如果圖像中的象元落在這些間隔內(nèi),則這些象元不被分類。
②對于圖像中相關(guān)性強的光譜類,它們所定義的平行管道之間必定具有某些重疊,結(jié)果落在重疊區(qū)的這些象元不能被很好地分離。③沒有考慮已知光譜類的先驗概率。
④根據(jù)直方圖定義的已知光譜類的平行管道僅僅是通常用來定義光譜類特征的橢圓平面的粗略表示。T.W.Kellenberger和(1996)提出改進(jìn)方法。
改進(jìn)過的平行管道方法基于每個圖像波段內(nèi)兩類之間累積百分比直方圖的最大差值自動分離已知目標(biāo)類,這種分離值和圖像波段都是自動選擇的。
他利用改進(jìn)過的平行管道分類對TM遙感數(shù)據(jù)進(jìn)行了森林覆蓋分類,結(jié)果取得了較好的效果,提高了分類的精度。
4.模糊分類(fuzzyclassification)模糊理論(fuzzytheory)是處理模糊性的理論的總稱,它是以1965年由Zadeh提出的模糊集合論為基礎(chǔ)的。
模糊分類即是建立在模糊理論之上的分類方法。
在常規(guī)遙感圖像分類中,圖像中的每個象元都被劃歸為某一種地物類型,象元和類別之間一一對應(yīng),并沒有考慮遙感圖像中實際存在的混合象元問題,即某一象元中同時存在有幾種地物類型,所以這種分類方法的結(jié)果必然存在有誤差,這也是常規(guī)遙感圖像分類方法的局限性。
模糊分類法正好克服了這一不足,它利用象元隸屬度表示象元的歸屬問題。
當(dāng)一象元對某一類地物的隸屬度為0時,表示該象元不屬于該類;當(dāng)一象元對某一類地物的隸屬度為1時,表示該象元屬于該類;當(dāng)一象元對某一類地物的隸屬度為0和1之間的數(shù)時,表示該象元以該隸屬度屬于該類,也即表明該象元為混合象元。
模糊分類的方法有很多,大多是常規(guī)分類方法的擴展。
F.Wang(1990)詳細(xì)討論了遙感圖像模糊監(jiān)督分類的意義,他認(rèn)為模糊監(jiān)督分類與常規(guī)分類方法相比,在3個方面有所改進(jìn):①用模糊集合表示地學(xué)信息更合理;②光譜空間的模糊劃分;③分類參數(shù)的模糊估計。
PaoloGamba等(1996)利用完全模糊分類鏈對多光譜遙感圖像進(jìn)行了分類,他們不僅考慮了圖像中象元的光譜特征,而且還考慮了圖像中鄰近象元之間空間上的相互關(guān)系,結(jié)果圖像的分類精度得到了提高。
5.神經(jīng)元網(wǎng)絡(luò)分類(neuralnetworkclassification)神經(jīng)元網(wǎng)絡(luò)的結(jié)構(gòu)包含一個輸入層、一個輸出層以及一個或多個隱層。
輸入層結(jié)點數(shù)與參加分類的特征數(shù)相同,輸出層結(jié)點數(shù)與最終類別數(shù)相同,而中間隱含層結(jié)點數(shù)則由實驗來確定。
神經(jīng)元網(wǎng)絡(luò)分類主要就是網(wǎng)絡(luò)的訓(xùn)練迭代,要達(dá)到一定的精度,往往需要很多次的迭代,這是非常費時的,然而網(wǎng)絡(luò)訓(xùn)練一經(jīng)完成,則可較快地應(yīng)用于分類識別。
F.Amar等(1995)基于分類誤差百分比和用戶CPU時間比較了4種神經(jīng)元網(wǎng)絡(luò)的遙感應(yīng)用,他發(fā)現(xiàn)后向傳播神經(jīng)元網(wǎng)絡(luò)算法(back-propagationneuralnetworkalgorithm)需要最多的迭代次數(shù),是其中最慢獲得88%分類精度的算法。
動態(tài)學(xué)習(xí)神經(jīng)元網(wǎng)絡(luò)算法(dynamic-learningneuralnetworkalgorithm)只需迭代兩次,占用591s的CPU時間就可獲得85%的分類精度,達(dá)到86%的分類精度需要迭代5次,占用CPU時間1613.7s;功能連接神經(jīng)元網(wǎng)絡(luò)算(functionallinkneuralnetworkalgorithm)分類精度比快速學(xué)習(xí)神經(jīng)元網(wǎng)絡(luò)算(fast-learningneuralnetworkalgorithm)算法低,但占用了較少的CPU時間;快速學(xué)習(xí)神經(jīng)元網(wǎng)絡(luò)算法提供了最高的分類精度,但兩次迭代運算后比功能連接神經(jīng)元網(wǎng)絡(luò)算法和動態(tài)學(xué)習(xí)神經(jīng)元網(wǎng)絡(luò)算法需要更長的CPU時間。
另外,許多研究者利用神經(jīng)元網(wǎng)絡(luò)算法對遙感圖像數(shù)據(jù)進(jìn)行了分類(Mcclellanetal.,1989;Benediktssonetal.,1990;Kanellopoulosetal.,1991;HeermannandKhazenie,1992;Bischofetal.,1992),這些研究表明神經(jīng)元網(wǎng)絡(luò)分類能夠給出好的分類結(jié)果,該結(jié)果與常規(guī)最大似然分類算法取得的分類精度大致相當(dāng),如神經(jīng)元網(wǎng)絡(luò)分類算法應(yīng)用恰當(dāng),則分類精度更高。
K.Sanjo(1996)研究了神經(jīng)元網(wǎng)絡(luò)技術(shù)的遙感圖像分類,發(fā)現(xiàn)監(jiān)督分類中訓(xùn)練樣本數(shù)據(jù)的排列影響著分類的精度,因此必須注意由于簡單地神經(jīng)元網(wǎng)絡(luò)算法學(xué)習(xí)階段訓(xùn)練樣本數(shù)據(jù)的重新排列所造成的分類結(jié)果的改變。
另外,他還研究了混合象元問題,結(jié)果表明通過學(xué)習(xí)混合數(shù)據(jù),神經(jīng)元網(wǎng)絡(luò)算法能有效地減少分類的誤差。
6.N維概率密度函數(shù)(N-dimensionalprobabilitydensityfunctions)HalukCetin和DonaldW.Levandowski(1991)利用N維概率密度函數(shù)對多維遙感數(shù)據(jù)進(jìn)行了分類和填圖。
N維概率密度函數(shù)是一種用來顯示、分析和分類數(shù)據(jù)的算法,源于常稱的頻率透視圖,但又克服了早先方法的內(nèi)在限制。
利用N維概率密度函數(shù)算法進(jìn)行的交互式分類過程是一種新的多維數(shù)據(jù)的分類方法,它提供了遙感數(shù)據(jù)分布的清晰透視和監(jiān)督分類中被選擇的訓(xùn)練區(qū)分布的清晰透視。
經(jīng)過多維數(shù)據(jù)和訓(xùn)練區(qū)分布的N維概率密度函數(shù)的制圖后,N維概率密度函數(shù)空間根據(jù)訓(xùn)練區(qū)數(shù)據(jù)的分布被劃分,然后將N維概率密度函數(shù)的這種劃分當(dāng)作查詢表(look-uptable)分類遙感圖像數(shù)據(jù)。
對非監(jiān)督分類,N維概率密度函數(shù)圖可以提供數(shù)據(jù)分布的一種有價值的代表,數(shù)據(jù)分布可直接用來選擇類別數(shù)和數(shù)據(jù)初始聚類時類均值的位置。
與傳統(tǒng)的統(tǒng)計分類方法,例如最大似然分類和最小距離分類,需要大量計算機內(nèi)存、計算緩慢、對顯示重疊類能力有限相比,N維概率密度函數(shù)分類速度極快,可利用無限制的波段數(shù),圖形地顯示數(shù)據(jù)和類別的分布。
HalukCetin和TimothyA.Warner和DonaldW.Levandowski(1993)利用N維概率密度函數(shù)對TM等多種遙感數(shù)據(jù)源數(shù)據(jù)進(jìn)行了分類、可視化和增強,結(jié)果取得了良好的效果,取得了比傳統(tǒng)分類方法較高的分類精度。
7.其他分類方法N.B.Venkateswarlu和(1993)提出了一種新的遙感圖像快速分類器該分類器是一種非參數(shù)分類器,叫做整體平均分類(ensemble-averageclassifier),利用了最小距離的概念,算法步驟如下:①計算每一組的整體平均值(一般為均值)Mi,i=1,2,...,C②如果滿足下列兩式,那么任一隨機象元X將被劃歸wi組。
XT(Mi-Mj)<Tij,j≠I(2-5)中亞地區(qū)高光譜遙感地物蝕變信息識別與提取式中Tij=-Tij。③經(jīng)過①②步后,隨機象元X被劃歸為正確的類。
另外,通過對參與計算變量的排序和部分一總和邏輯的考慮,可大大降低該算法計算的時間。
與最小距離(歐氏距離)和最大似然分類器相比,整體平均分類器所用時間最少,分類精度與最小距離大致相同,對像農(nóng)田面積和森林這樣的名義類型的分類十分有效。
HalukCetin(1996)提出了一種分類方法:類間距離頻率分布法(interclassdistancefrequencydis-tribution),這是多光譜數(shù)據(jù)非參數(shù)分類方法的一種。
類間距離頻率分布過程簡單,是一種有力的可視化技術(shù),它圖形地顯示多光譜數(shù)據(jù)和類分布。首先選擇感興趣的類,這些類的統(tǒng)計信息從典型的訓(xùn)練樣區(qū)可獲得。
利用類的平均測量矢量計算多光譜數(shù)據(jù)中每個象元的距離,并存放在一個兩維數(shù)據(jù)分布數(shù)組中。選擇其他類的訓(xùn)練區(qū),訓(xùn)練區(qū)數(shù)據(jù)的分布通過距離計算可獲得。
通過可視化地檢查結(jié)果,建立分類查詢表(look-uptable),然后利用分類查詢表進(jìn)行多光譜圖像數(shù)據(jù)的分類,具體細(xì)節(jié)請參見原文。
H.N.SrikantaPrakash等(1996)改進(jìn)了遙感數(shù)據(jù)凝聚聚類分析,這是一種基于相互近鄰概念,用來進(jìn)行多光譜數(shù)據(jù)分類的非參數(shù)、層次、凝聚聚類分析算法。
該方法定義了圍繞象元的感興趣區(qū)域(areaofinterestaroundeachpixel),然后在它內(nèi)部尋找分類時初始合并操作需要的k最近鄰,將象元的特征值、波段值和象元的相對位置值一起考慮,提出了改進(jìn)的距離量度,這樣,大大減少了計算的時間和內(nèi)存的需求,降低了分類的誤差概率。
StevenE.Franklin和BradleyA.Wilson(1992)設(shè)計了3階段分類器進(jìn)行遙感圖像的分類,它由一個基于四叉樹的分割算子、一個高斯最小距離均值測試和一個包括輔助地理網(wǎng)數(shù)據(jù)和光譜曲線測量的最終測試構(gòu)成。
與最大似然分類技術(shù)相比,3階段分類器的總體分類精度得到了提高,減少計算時間,另外僅需最少的訓(xùn)練樣區(qū)數(shù)據(jù)(它們在復(fù)雜地形區(qū)很難獲得)。
谷歌人工智能寫作項目:神經(jīng)網(wǎng)絡(luò)偽原創(chuàng)
基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類的算法如何用ERDAS來實現(xiàn)?~~ 20
各種遙感數(shù)據(jù)分類方法比較
常用的遙感數(shù)據(jù)的專題分類方法有多種,從分類判別決策方法的角度可以分為統(tǒng)計分類器、神經(jīng)網(wǎng)絡(luò)分類器、專家系統(tǒng)分類器等;從是否需要訓(xùn)練數(shù)據(jù)方面,又可以分為監(jiān)督分類器和非監(jiān)督分類器。
一、統(tǒng)計分類方法統(tǒng)計分類方法分為非監(jiān)督分類方法和監(jiān)督分類方法。
非監(jiān)督分類方法不需要通過選取已知類別的像元進(jìn)行分類器訓(xùn)練,而監(jiān)督分類方法則需要選取一定數(shù)量的已知類別的像元對分類器進(jìn)行訓(xùn)練,以估計分類器中的參數(shù)。
非監(jiān)督分類方法不需要任何先驗知識,也不會因訓(xùn)練樣本選取而引入認(rèn)為誤差,但非監(jiān)督分類得到的自然類別常常和研究感興趣的類別不匹配。
相應(yīng)地,監(jiān)督分類一般需要預(yù)先定義分類類別,訓(xùn)練數(shù)據(jù)的選取可能會缺少代表性,但也可能在訓(xùn)練過程中發(fā)現(xiàn)嚴(yán)重的分類錯誤。1.非監(jiān)督分類器非監(jiān)督分類方法一般為聚類算法。
最常用的聚類非監(jiān)督分類方法是K-均值(K-MeansAlgorithm)聚類方法(DudaandHart,1973)和迭代自組織數(shù)據(jù)分析算法(ISODATA)。
其算法描述可見于一般的統(tǒng)計模式識別文獻(xiàn)中。一般通過簡單的聚類方法得到的分類結(jié)果精度較低,因此很少單獨使用聚類方法進(jìn)行遙感數(shù)據(jù)專題分類。
但是,通過對遙感數(shù)據(jù)進(jìn)行聚類分析,可以初步了解各類別的分布,獲取最大似然監(jiān)督分類中各類別的先驗概率。
聚類分析最終的類別的均值矢量和協(xié)方差矩陣可以用于最大似然分類過程(Schowengerdt,1997)。2.監(jiān)督分類器監(jiān)督分類器是遙感數(shù)據(jù)專題分類中最常用的一種分類器。
和非監(jiān)督分類器相比,監(jiān)督分類器需要選取一定數(shù)量的訓(xùn)練數(shù)據(jù)對分類器進(jìn)行訓(xùn)練,估計分類器中的關(guān)鍵參數(shù),然后用訓(xùn)練后的分類器將像元劃分到各類別。
監(jiān)督分類過程一般包括定義分類類別、選擇訓(xùn)練數(shù)據(jù)、訓(xùn)練分類器和最終像元分類四個步驟(Richards,1997)。每一步都對最終分類的不確定性有顯著影響。監(jiān)督分類器又分為參數(shù)分類器和非參數(shù)分類器兩種。
參數(shù)分類器要求待分類數(shù)據(jù)滿足一定的概率分布,而非參數(shù)分類器對數(shù)據(jù)的概率分布沒有要求。
遙感數(shù)據(jù)分類中常用的分類器有最大似然分類器、最小距離分類器、馬氏距離分類器、K-最近鄰分類器(K-Nearestneighborhoodclassifier,K-NN)以及平行六面體分類器(parallelepipedclassifier)。
最大似然、最小距離和馬氏距離分類器在第三章已經(jīng)詳細(xì)介紹。這里簡要介紹K-NN分類器和平行六面體分類器。K-NN分類器是一種非參數(shù)分類器。
該分類器的決策規(guī)則是:將像元劃分到在特征空間中與其特征矢量最近的訓(xùn)練數(shù)據(jù)特征矢量所代表的類別(Schowengerdt,1997)。
當(dāng)分類器中K=1時,稱為1-NN分類器,這時以離待分類像元最近的訓(xùn)練數(shù)據(jù)的類別作為該像元的類別;當(dāng)K>1時,以待分類像元的K個最近的訓(xùn)練數(shù)據(jù)中像元數(shù)量最多的類別作為該像元的類別,也可以計算待分類像元與其K個近鄰像元特征矢量的歐氏距離的倒數(shù)作為權(quán)重,以權(quán)重值最大的訓(xùn)練數(shù)據(jù)的類別作為待分類像元的類別。
Hardin,(1994)對K-NN分類器進(jìn)行了深入的討論。平行六面體分類方法是一個簡單的非參數(shù)分類算法。該方法通過計算訓(xùn)練數(shù)據(jù)各波段直方圖的上限和下限確定各類別像元亮度值的范圍。
對每一類別來說,其每個波段的上下限一起就形成了一個多維的盒子(box)或平行六面體(parallelepiped)。因此M個類別就有M個平行六面體。
當(dāng)待分類像元的亮度值落在某一類別的平行六面體內(nèi)時,該像元就被劃分為該平行六面體代表的類別。平行六面體分類器可以用圖5-1中兩波段的遙感數(shù)據(jù)分類問題來表示。
圖中的橢圓表示從訓(xùn)練數(shù)據(jù)估計的各類別亮度值分布,矩形表示各類別的亮度值范圍。像元的亮度落在哪個類別的亮度范圍內(nèi),就被劃分為哪個類別。
圖5-1平行六面體分類方法示意圖3.統(tǒng)計分類器的評價各種統(tǒng)計分類器在遙感數(shù)據(jù)分類中的表現(xiàn)各不相同,這既與分類算法有關(guān),又與數(shù)據(jù)的統(tǒng)計分布特征、訓(xùn)練樣本的選取等因素有關(guān)。
非監(jiān)督聚類算法對分類數(shù)據(jù)的統(tǒng)計特征沒有要求,但由于非監(jiān)督分類方法沒有考慮任何先驗知識,一般分類精度比較低。
更多情況下,聚類分析被作為非監(jiān)督分類前的一個探索性分析,用于了解分類數(shù)據(jù)中各類別的分布和統(tǒng)計特征,為監(jiān)督分類中類別定義、訓(xùn)練數(shù)據(jù)的選取以及最終的分類過程提供先驗知識。
在實際應(yīng)用中,一般用監(jiān)督分類方法進(jìn)行遙感數(shù)據(jù)分類。最大似然分類方法是遙感數(shù)據(jù)分類中最常用的分類方法。最大似然分類屬于參數(shù)分類方法。
在有足夠多的訓(xùn)練樣本、一定的類別先驗概率分布的知識,且數(shù)據(jù)接近正態(tài)分布的條件下,最大似然分類被認(rèn)為是分類精度最高的分類方法。但是當(dāng)訓(xùn)練數(shù)據(jù)較少時,均值和協(xié)方差參數(shù)估計的偏差會嚴(yán)重影響分類精度。
SwainandDavis(1978)認(rèn)為,在N維光譜空間的最大似然分類中,每一類別的訓(xùn)練數(shù)據(jù)樣本至少應(yīng)該達(dá)到10×N個,在可能的條件下,最好能達(dá)到100×N以上。
而且,在許多情況下,遙感數(shù)據(jù)的統(tǒng)計分布不滿足正態(tài)分布的假設(shè),也難以確定各類別的先驗概率。最小距離分類器可以認(rèn)為是在不考慮協(xié)方差矩陣時的最大似然分類方法。
當(dāng)訓(xùn)練樣本較少時,對均值的估計精度一般要高于對協(xié)方差矩陣的估計。因此,在有限的訓(xùn)練樣本條件下,可以只估計訓(xùn)練樣本的均值而不計算協(xié)方差矩陣。這樣最大似然算法就退化為最小距離算法。
由于沒有考慮數(shù)據(jù)的協(xié)方差,類別的概率分布是對稱的,而且各類別的光譜特征分布的方差被認(rèn)為是相等的。很顯然,當(dāng)有足夠訓(xùn)練樣本保證協(xié)方差矩陣的精確估計時,最大似然分類結(jié)果精度要高于最小距離精度。
然而,在訓(xùn)練數(shù)據(jù)較少時,最小距離分類精度可能比最大似然分類精度高(Richards,1993)。而且最小距離算法對數(shù)據(jù)概率分布特征沒有要求。
馬氏距離分類器可以認(rèn)為是在各類別的協(xié)方差矩陣相等時的最大似然分類。
由于假定各類別的協(xié)方差矩陣相等,和最大似然方法相比,它丟失了各類別之間協(xié)方差矩陣的差異的信息,但和最小距離法相比較,它通過協(xié)方差矩陣保持了一定的方向靈敏性(Richards,1993)。
因此,馬氏距離分類器可以認(rèn)為是介于最大似然和最小距離分類器之間的一種分類器。與最大似然分類一樣,馬氏距離分類器要求數(shù)據(jù)服從正態(tài)分布。
K-NN分類器的一個主要問題是需要很大的訓(xùn)練數(shù)據(jù)集以保證分類算法收斂(DevijverandKittler,1982)。
K-NN分類器的另一個問題是,訓(xùn)練樣本選取的誤差對分類結(jié)果有很大的影響(CortijoandBlanca,1997)。同時,K-NN分類器的計算復(fù)雜性隨著最近鄰范圍的擴大而增加。
但由于K-NN分類器考慮了像元鄰域上的空間關(guān)系,和其他光譜分類器相比,分類結(jié)果中“椒鹽現(xiàn)象”較少。平行六面體分類方法的優(yōu)點在于簡單,運算速度快,且不依賴于任何概率分布要求。
它的缺陷在于:首先,落在所有類別亮度值范圍之外的像元只能被分類為未知類別;其次,落在各類別亮度范圍重疊區(qū)域內(nèi)的像元難以區(qū)分其類別(如圖5-1所示)。各種統(tǒng)計分類方法的特點可以總結(jié)為表5-1。
二、神經(jīng)網(wǎng)絡(luò)分類器神經(jīng)網(wǎng)絡(luò)用于遙感數(shù)據(jù)分類的最大優(yōu)勢在于它平等地對待多源輸入數(shù)據(jù)的能力,即使這些輸入數(shù)據(jù)具有完全不同的統(tǒng)計分布,但是由于神經(jīng)網(wǎng)絡(luò)內(nèi)部各層大量的神經(jīng)元之間連接的權(quán)重是不透明的,因此用戶難以控制(Austin,HardingandKanellopoulosetal.,1997)。
神經(jīng)網(wǎng)絡(luò)遙感數(shù)據(jù)分類被認(rèn)為是遙感數(shù)據(jù)分類的熱點研究領(lǐng)域之一(Wilkinson,1996;Kimes,1998)。神經(jīng)網(wǎng)絡(luò)分類器也可分為監(jiān)督分類器和非監(jiān)督分類器兩種。
由于神經(jīng)網(wǎng)絡(luò)分類器對分類數(shù)據(jù)的統(tǒng)計分布沒有任何要求,因此神經(jīng)網(wǎng)絡(luò)分類器屬于非參數(shù)分類器。遙感數(shù)據(jù)分類中最常用的神經(jīng)網(wǎng)絡(luò)是多層感知器模型(multi-layerpercep-tron,MLP)。
該模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖5-2所示。該網(wǎng)絡(luò)包括三層:輸入層、隱層和輸出層。輸入層主要作為輸入數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)輸入界面,其本身沒有處理功能;隱層和輸出層的處理能力包含在各個結(jié)點中。
輸入的結(jié)構(gòu)一般為待分類數(shù)據(jù)的特征矢量,一般情況下,為訓(xùn)練像元的多光譜矢量,每個結(jié)點代表一個光譜波段。
當(dāng)然,輸入結(jié)點也可以為像元的空間上下文信息(如紋理)等,或多時段的光譜矢量(PaolaandSchowengerdt,1995)。
表5-1各種統(tǒng)計分類器比較圖5-2多層感知器神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對于隱層和輸出層的結(jié)點來說,其處理過程是一個激勵函數(shù)(activationfunction)。
假設(shè)激勵函數(shù)為f(S),對隱層結(jié)點來說,有:遙感信息的不確定性研究其中,pi為隱層結(jié)點的輸入;hj為隱層結(jié)點的輸出;w為聯(lián)接各層神經(jīng)之間的權(quán)重。
對輸出層來說,有如下關(guān)系:遙感信息的不確定性研究其中,hj為輸出層的輸入;ok為輸出層的輸出。
激勵函數(shù)一般表達(dá)為:遙感信息的不確定性研究確定了網(wǎng)絡(luò)結(jié)構(gòu)后,就要對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使網(wǎng)絡(luò)具有根據(jù)新的輸入數(shù)據(jù)預(yù)測輸出結(jié)果的能力。最常用的是后向傳播訓(xùn)練算法(Back-Propagation)。
這一算法將訓(xùn)練數(shù)據(jù)從輸入層進(jìn)入網(wǎng)絡(luò),隨機產(chǎn)生各結(jié)點連接權(quán)重,按式(5-1)(5-2)和(5-3)中的公式進(jìn)行計算,將網(wǎng)絡(luò)輸出與預(yù)期的結(jié)果(訓(xùn)練數(shù)據(jù)的類別)相比較并計算誤差。
這個誤差被后向傳播的網(wǎng)絡(luò)并用于調(diào)整結(jié)點間的連接權(quán)重。
調(diào)整連接權(quán)重的方法一般為delta規(guī)則(Rumelhart,etal.,1986):遙感信息的不確定性研究其中,η為學(xué)習(xí)率(learningrate);δk為誤差變化率;α為動量參數(shù)。
將這樣的數(shù)據(jù)的前向和誤差后向傳播過程不斷迭代,直到網(wǎng)絡(luò)誤差減小到預(yù)設(shè)的水平,網(wǎng)絡(luò)訓(xùn)練結(jié)束。這時就可以將待分類數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。
除了多層感知器神經(jīng)網(wǎng)絡(luò)模型,其他結(jié)構(gòu)的網(wǎng)絡(luò)模型也被用于遙感數(shù)據(jù)分類。
例如,Kohonen自組織網(wǎng)絡(luò)被廣泛用于遙感數(shù)據(jù)的非監(jiān)督聚類分析(Yoshidaetal.,1994;Schaaleetal.,1995);自適應(yīng)共振理論(AdaptiveResonanceTheory)網(wǎng)絡(luò)(Silva,SandCaetano,M.1997)、模糊ART圖(FuzzyARTMaps)(Fischer,M.MandGopal,S,1997)、徑向基函數(shù)(駱劍承,1999)等也被用于遙感數(shù)據(jù)分類。
許多因素影響神經(jīng)網(wǎng)絡(luò)的遙感數(shù)據(jù)分類精度。FoodyandArora(1997)認(rèn)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、遙感數(shù)據(jù)的維數(shù)以及訓(xùn)練數(shù)據(jù)的大小是影響神經(jīng)網(wǎng)絡(luò)分類的重要因素。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),特別是網(wǎng)絡(luò)的層數(shù)和各層神經(jīng)元的數(shù)量是神經(jīng)網(wǎng)絡(luò)設(shè)計最關(guān)鍵的問題。網(wǎng)絡(luò)結(jié)構(gòu)不但影響分類精度,而且對網(wǎng)絡(luò)訓(xùn)練時間有直接影響(KavzogluandMather,1999)。
對用于遙感數(shù)據(jù)分類的神經(jīng)網(wǎng)絡(luò)來說,由于輸入層和輸出層的神經(jīng)元數(shù)目分別由遙感數(shù)據(jù)的特征維數(shù)和總的類別數(shù)決定的,因此網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計主要解決隱層的數(shù)目和隱層的神經(jīng)元數(shù)目。
一般過于復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)在刻畫訓(xùn)練數(shù)據(jù)方面較好,但分類精度較低,即“過度擬合”現(xiàn)象(over-fit)。而過于簡單的網(wǎng)絡(luò)結(jié)構(gòu)由于不能很好的學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的模式,因此分類精度低。
網(wǎng)絡(luò)結(jié)構(gòu)一般是通過實驗的方法來確定。Hirose等(1991)提出了一種方法。該方法從一個小的網(wǎng)絡(luò)結(jié)構(gòu)開始訓(xùn)練,每次網(wǎng)絡(luò)訓(xùn)練陷入局部最優(yōu)時,增加一個隱層神經(jīng)元,然后再訓(xùn)練,如此反復(fù),直到網(wǎng)絡(luò)訓(xùn)練收斂。
這種方法可能導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜。一種解決辦法是每當(dāng)認(rèn)為網(wǎng)絡(luò)收斂時,減去最近一次加入的神經(jīng)元,直到網(wǎng)絡(luò)不再收斂,那么最后一次收斂的網(wǎng)絡(luò)被認(rèn)為是最優(yōu)結(jié)構(gòu)。這種方法的缺點是非常耗時。
“剪枝法”(pruning)是另一種確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的方法。
和Hirose等(1991)的方法不同,“剪枝法”從一個很大的網(wǎng)絡(luò)結(jié)構(gòu)開始,然后逐步去掉認(rèn)為多余的神經(jīng)元(SietsmaandDow,1988)。
從一個大的網(wǎng)絡(luò)開始的優(yōu)點是,網(wǎng)絡(luò)學(xué)習(xí)速度快,對初始條件和學(xué)習(xí)參數(shù)不敏感。
“剪枝”過程不斷重復(fù),直到網(wǎng)絡(luò)不再收斂時,最后一次收斂的網(wǎng)絡(luò)被認(rèn)為最優(yōu)(Castellano,FanelliandPelillo,1997)。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要訓(xùn)練數(shù)據(jù)樣本的多少隨不同的網(wǎng)絡(luò)結(jié)構(gòu)、類別的多少等因素變化。但是,基本要求是訓(xùn)練數(shù)據(jù)能夠充分描述代表性的類別。
Foody等(1995)認(rèn)為訓(xùn)練數(shù)據(jù)的大小對遙感分類精度有顯著影響,但和統(tǒng)計分類器相比,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)可以比較少。分類變量的數(shù)據(jù)維對分類精度的影響是遙感數(shù)據(jù)分類中的普遍問題。
許多研究表明,一般類別之間的可分性和最終的分類精度會隨著數(shù)據(jù)維數(shù)的增大而增高,達(dá)到某一點后,分類精度會隨數(shù)據(jù)維的繼續(xù)增大而降低(ShahshahaniandLandgrebe,1994)。
這就是有名的Hughes現(xiàn)象。一般需要通過特征選擇去掉信息相關(guān)性高的波段或通過主成分分析方法去掉冗余信息。
分類數(shù)據(jù)的維數(shù)對神經(jīng)網(wǎng)絡(luò)分類的精度同樣有明顯影響(Battiti,1994),但Hughes現(xiàn)象沒有傳統(tǒng)統(tǒng)計分類器中嚴(yán)重(FoodyandArora,1997)。
Kanellopoulos(1997)通過長期的實踐認(rèn)為一個有效的ANN模型應(yīng)考慮以下幾點:合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、優(yōu)化學(xué)習(xí)算法、輸入數(shù)據(jù)的預(yù)處理、避免振蕩、采用混合分類方法。
其中混合模型包括多種ANN模型的混合、ANN與傳統(tǒng)分類器的混合、ANN與知識處理器的混合等。三、其他分類器除了上述統(tǒng)計分類器和神經(jīng)網(wǎng)絡(luò)分類器,還有多種分類器被用于遙感圖像分類。
例如模糊分類器,它是針對地面類別變化連續(xù)而沒有明顯邊界情況下的一種分類器。它通過模糊推理機制確定像元屬于每一個類別的模糊隸屬度。
一般的模糊分類器有模糊C均值聚類法、監(jiān)督模糊分類方法(Wang,1990)、混合像元模型(FoodyandCox,1994;SettleandDrake,1993)以及各種人工神經(jīng)網(wǎng)絡(luò)方法等(Kanellopoulosetal.,1992;PaolaandSchowengerdt,1995)。
由于模糊分類的結(jié)果是像元屬于每個類別的模糊隸屬度,因此也稱其為“軟分類器”,而將傳統(tǒng)的分類方法稱為“硬分類器”。
另一類是上下文分類器(contextualclassifier),它是一種綜合考慮圖像光譜和空間特征的分類器。一般的光譜分類器只是考慮像元的光譜特征。
但是,在遙感圖像中,相鄰的像元之間一般具有空間自相關(guān)性。空間自相關(guān)程度強的像元一般更可能屬于同一個類別。同時考慮像元的光譜特征和空間特征可以提高圖像分類精度,并可以減少分類結(jié)果中的“椒鹽現(xiàn)象”。
當(dāng)類別之間的光譜空間具有重疊時,這種現(xiàn)象會更明顯(Cortijoetal.,1995)。這種“椒鹽現(xiàn)象”可以通過分類的后處理濾波消除,也可以通過在分類過程中加入代表像元鄰域關(guān)系的信息解決。
在分類過程中可以通過不同方式加入上下文信息。
一是在分類特征中加入圖像紋理信息;另一種是圖像分割技術(shù),包括區(qū)域增長/合并常用算法(KettingandLandgrebe,1976)、邊緣檢測方法、馬爾可夫隨機場方法。
RignotandChellappa(1992)用馬爾可夫隨機場方法進(jìn)行SAR圖像分類,取得了很好的效果,PaulSmits(1997)提出了保持邊緣細(xì)節(jié)的馬爾可夫隨機場方法,并用于SAR圖像的分類;Crawford(1998)將層次分類方法和馬爾可夫隨機場方法結(jié)合進(jìn)行SAR圖像分類,得到了更高的精度;Cortijo(1997)用非參數(shù)光譜分類對遙感圖像分類,然后用ICM算法對初始分類進(jìn)行上下文校正。
人工神經(jīng)網(wǎng)絡(luò)分類方法
從20世紀(jì)80年代末期,人工神經(jīng)網(wǎng)絡(luò)方法開始應(yīng)用于遙感圖像的自動分類。
目前,在遙感圖像的自動分類方面,應(yīng)用和研究比較多的人工神經(jīng)網(wǎng)絡(luò)方法主要有以下幾種:(1)BP(BackPropagation)神經(jīng)網(wǎng)絡(luò),這是一種應(yīng)用較廣泛的前饋式網(wǎng)絡(luò),屬于有監(jiān)督分類算法,它將先驗知識融于網(wǎng)絡(luò)學(xué)習(xí)之中,加以最大限度地利用,適應(yīng)性好,在類別數(shù)少的情況下能夠得到相當(dāng)高的精度,但是其網(wǎng)絡(luò)的學(xué)習(xí)主要采用誤差修正算法,識別對象種類多時,隨著網(wǎng)絡(luò)規(guī)模的擴大,需要的計算過程較長,收斂緩慢而不穩(wěn)定,且識別精度難以達(dá)到要求。
(2)Hopfield神經(jīng)網(wǎng)絡(luò)。屬于反饋式網(wǎng)絡(luò)。主要采用Hebb規(guī)則進(jìn)行學(xué)習(xí),一般情況下計算的收斂速度較快。
這種網(wǎng)絡(luò)是美國物理學(xué)家J.J.Hopfield于1982年首先提出的,它主要用于模擬生物神經(jīng)網(wǎng)絡(luò)的記憶機理。
Hopfield神經(jīng)網(wǎng)絡(luò)狀態(tài)的演變過程是一個非線性動力學(xué)系統(tǒng),可以用一組非線性差分方程來描述。
系統(tǒng)的穩(wěn)定性可用所謂的“能量函數(shù)”進(jìn)行分析,在滿足一定條件下,某種“能量函數(shù)”的能量在網(wǎng)絡(luò)運行過程中不斷地減少,最后趨于穩(wěn)定的平衡狀態(tài)。
Hopfield網(wǎng)絡(luò)的演變過程是一種計算聯(lián)想記憶或求解優(yōu)化問題的過程。(3)Kohonen網(wǎng)絡(luò)。
這是一種由芬蘭赫爾辛基大學(xué)神經(jīng)網(wǎng)絡(luò)專家Kohonen(1981)提出的自組織神經(jīng)網(wǎng)絡(luò),其采用了無導(dǎo)師信息的學(xué)習(xí)算法,這種學(xué)習(xí)算法僅根據(jù)輸入數(shù)據(jù)的屬性而調(diào)整權(quán)值,進(jìn)而完成向環(huán)境學(xué)習(xí)、自動分類和聚類等任務(wù)。
其最大的優(yōu)點是最終的各個相鄰聚類之間是有相似關(guān)系的,即使識別時把樣本映射到了一個錯誤的節(jié)點,它也傾向于被識別成同一個因素或者一個相近的因素,這就十分接近人的識別特性。
?
總結(jié)
以上是生活随笔為你收集整理的基于图神经网络的图像分类,遥感图像分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌地图 地点搜索(模糊搜索)
- 下一篇: Spark基本工作流程和作业调度