极化SAR数据超像素分割和密度峰值聚类
近日關(guān)于極化SAR數(shù)據(jù)超像素分割和密度峰值聚類CFSFDP的學(xué)習(xí)的記錄與總結(jié)
- 一、超像素分割
- kmeans分類:
- 超像素分類:
- 二、基于密度峰值的快速聚類算法(CFSFDP)
- 一、確定類中心
- 個(gè)人理解
- 結(jié)果:
- 二、將剩余數(shù)據(jù)分類
- 三、總結(jié)
一、超像素分割
??在計(jì)算機(jī)視覺領(lǐng)域,圖像分割(Segmentation)指的是將數(shù)字圖像細(xì)分為多個(gè)圖像子區(qū)域(像素的集合)(也被稱作超像素)的過程。超像素由一系列位置相鄰且顏色、亮度、紋理等特征相似的像素點(diǎn)組成的小區(qū)域。這些小區(qū)域大多保留了進(jìn)一步進(jìn)行圖像分割的有效信息,且一般不會(huì)破壞圖像中物體的邊界信息。
??圖像分割的結(jié)果是圖像上子區(qū)域的集合(這些子區(qū)域的全體覆蓋了整個(gè)圖像),或是從圖像中提取的輪廓線的集合(例如邊緣檢測(cè))。一個(gè)子區(qū)域中的每個(gè)像素在某種特性的度量下或是由計(jì)算得出的特性都是相似的,例如顏色、亮度、紋理。鄰接區(qū)域在某種特性的度量下有很大的不同。
??于我而言,主要學(xué)習(xí)simple linear iterative clustering (SLIC),簡(jiǎn)單的迭代聚類算法。這個(gè)算法和kmeans算法十分相似。對(duì)于給定樣本,執(zhí)行步驟如下:
kmeans分類:
??1、給定聚類簇?cái)?shù)k,初始化聚類中心。
??2、計(jì)算樣本和各聚類中心距離對(duì)樣本進(jìn)行分類。并記錄分類完成后的各個(gè)類簇的數(shù)據(jù)的均值。
??3、比較各個(gè)聚類新的均值和重新分類之前的均值,并將聚類的均值更新,重復(fù)迭代。直到新舊聚類均值差值小于某個(gè)閾值停止迭代。
超像素分類:
??1、給定超像素尺寸pixelsize,初始化超像素中心,初始化超像素中心,將m×n個(gè)超像素中心大致均勻設(shè)置在原圖上。例如對(duì)于M×N的影像數(shù)據(jù),超像素總個(gè)數(shù)為:m×n;m為超像素中心行數(shù):m=floor(M÷pixelsize);n為超像素中心列數(shù):n=floor(N÷pixelsize);(示意草圖():紫色點(diǎn)為超像素中心,當(dāng)然實(shí)際上肯定要密集的多)(目前我認(rèn)為一定要向下取整,向上取整的話會(huì)是計(jì)算變得復(fù)雜,容易出錯(cuò))
??2、移動(dòng)超像素中心到鄰域3×3梯度最小的位置,可以有效避免超像素中心出于噪聲點(diǎn)或者邊界位置。
??3、遍歷每個(gè)超像素中心,在超像素中心鄰域2pixelsize×2pixelsize的范圍內(nèi)進(jìn)行掃描,判斷鄰域內(nèi)各個(gè)數(shù)據(jù)點(diǎn)相對(duì)超像素中心的距離,全部掃描完畢后,對(duì)于每一個(gè)數(shù)據(jù)點(diǎn),將其相對(duì)周圍超像素中心的距離進(jìn)行比較,然后將數(shù)據(jù)點(diǎn)歸到最近的超像素中心。
??4、計(jì)算劃歸到各個(gè)超像素中心的數(shù)據(jù)點(diǎn)的均值,比較前后均值之差,小于某個(gè)閾值就停止迭代。
??在我看來,超像素分割的意義在于歸化相似的數(shù)據(jù),減小數(shù)據(jù)量,提高程序的效率,使得某些算法得以實(shí)現(xiàn)。就比如:
二、基于密度峰值的快速聚類算法(CFSFDP)
??CFSFDP算法進(jìn)行聚類時(shí)一般分為以下步驟。
一、確定類中心
??CFSFDP算法進(jìn)行聚類時(shí)首先需要確定類的中心點(diǎn),其假設(shè)簇的聚類中心的局部密度高于其周圍數(shù)據(jù)點(diǎn)的局部密度,并且聚類中心與那些局部密度更高的數(shù)據(jù)點(diǎn)之間的距離較大。對(duì)于一個(gè)給定的數(shù)據(jù)集,CFSFDP算法需要為每個(gè)數(shù)據(jù)點(diǎn)計(jì)算兩個(gè)量化值:數(shù)據(jù)點(diǎn)的局部密度ρi和它與局部密度比其高的數(shù)據(jù)點(diǎn)之間的距離δi。數(shù)據(jù)點(diǎn)xi的局部密度ρi有兩種計(jì)算方式:基于截?cái)嗪说挠?jì)算方式和基于高斯核的計(jì)算方式。使用截?cái)嗪擞?jì)算局部密度pl的公式為:
ρi=:∑χ(δij-dc)
其中,χ(x)={1,x<=00,x>0χ(x)=\left\{ \begin{array}{c} 1,x<=0 \\ 0 , x>0\end{array}\right. χ(x)={1,x<=00,x>0?,δij為數(shù)據(jù)點(diǎn)之間的距離,dc為截?cái)嗑嚯x即距離閾值。使用該計(jì)算方式得到的數(shù)據(jù)點(diǎn)的局部密度ρi通常等于該數(shù)據(jù)點(diǎn)周圍與之距離小于dc的數(shù)據(jù)點(diǎn)的個(gè)數(shù)。因此,可以得出這樣的結(jié)論:與數(shù)據(jù)點(diǎn)xi的距離小于dc的點(diǎn)越多,得到的局部密度ρi就越大。使用高斯核計(jì)算局部密度ρi的公式為:
ρi=:∑e-(δij/dc)2
其中,δij為數(shù)據(jù)點(diǎn)之間的距離,j為i的值域,dc為截?cái)嗑嚯x即距離閾值。使用該計(jì)算方式得到的局部密度ρi仍然滿足與數(shù)據(jù)點(diǎn)xi的距離小于dc的點(diǎn)越多,局部密度ρi就越大的結(jié)論。使用截?cái)嗪擞?jì)算局部密度和使用高斯核計(jì)算局部密度這兩種計(jì)算方式的區(qū)別在于使用截?cái)嗪擞?jì)算得到的結(jié)果為離散值,而使用高斯核計(jì)算得到的結(jié)果為連續(xù)值。因此,相對(duì)而言,使用高斯核計(jì)算得到的數(shù)據(jù)點(diǎn)具有相同的局部密度的概率比使用截?cái)嗪擞?jì)算得到的數(shù)據(jù)點(diǎn)具有相同的局部密度的概率要小,使用高斯核計(jì)算局部密度ρi更方便比較數(shù)據(jù)點(diǎn)局部密度之間的大小關(guān)系。(在數(shù)據(jù)計(jì)算起來很復(fù)雜時(shí)可以考慮第一種方法更為簡(jiǎn)單)。數(shù)據(jù)點(diǎn)之間的距離δi。是通過計(jì)算數(shù)據(jù)點(diǎn)zi與比該數(shù)據(jù)點(diǎn)局部密度高的其他數(shù)據(jù)點(diǎn)的距離得到的,數(shù)據(jù)點(diǎn)之間的距離院可以根據(jù)公式
δi={min(δij),存在ρj>ρimax(δij),任意ρj<=ρiδi=\left\{ \begin{array}{c} min(δij),存在ρj>ρi\\ max(δij) , 任意ρj<=ρi\end{array}\right. δi={min(δij),存在ρj>ρimax(δij),任意ρj<=ρi?
計(jì)算得到。一般而言,數(shù)據(jù)點(diǎn)之間的距離δi為數(shù)據(jù)點(diǎn)i與比該數(shù)據(jù)點(diǎn)局部密度ρi更高的其他數(shù)據(jù)點(diǎn)的所有距離中的最小值,但對(duì)于局部密度ρi最高的點(diǎn),數(shù)據(jù)點(diǎn)之間的距離δi為其他數(shù)據(jù)點(diǎn)與之距離的最大值。
個(gè)人理解
??在影像自動(dòng)聚類過程中,我們希望達(dá)到的目標(biāo)是圖像自動(dòng)分割成不同的類。判斷最后分類結(jié)果的好壞程度的兩個(gè)標(biāo)準(zhǔn):(1)對(duì)于劃分到同一個(gè)類的數(shù)據(jù),我們希望這個(gè)類內(nèi)有足夠多的數(shù)據(jù)和他相似度夠好(2)對(duì)于分到不同類的數(shù)據(jù),我們希望不同類之間數(shù)據(jù)的區(qū)分度夠大。
??兩個(gè)指標(biāo)作為選取類中心的標(biāo)準(zhǔn):局部密度ρi和表征距離δi,局部密度用來衡量類內(nèi)是否有足夠多的數(shù)據(jù)點(diǎn)和他相似,表征距離δi用來衡量?jī)蓚€(gè)類之間是否有足夠的區(qū)分度。作為類中心,他的局部密度一定足夠大,表征距離一定也足夠大。
??取聚類中心的方法可以人工選取,我采用的方法很簡(jiǎn)單,輸入想要分類的個(gè)數(shù)k,從局部密度最大的里面排序選取10k個(gè)數(shù)據(jù)點(diǎn),再?gòu)倪@10k個(gè)數(shù)據(jù)點(diǎn)里取k個(gè)表征距離最大的數(shù)據(jù)點(diǎn)作為聚類中心。以此來作為聚類中心
結(jié)果:
使用matlab進(jìn)行g(shù)ui設(shè)計(jì),實(shí)現(xiàn)交互等操作。
測(cè)試截圖:
分類個(gè)數(shù)和超像素大小會(huì)影響最終的分類結(jié)果
二、將剩余數(shù)據(jù)分類
??將剩余的數(shù)據(jù)分到局部密度比其高且距離最近的聚類里。只需一次,無需迭代。
三、總結(jié)
??CFSFDP聚類算法在執(zhí)行過程中最耗時(shí)的莫過于將各點(diǎn)相對(duì)于全部數(shù)據(jù)的距離計(jì)算出來來求局部密度的步驟,而超像素分類恰好解決了這一問題,在保證合理的情況下,適當(dāng)增加超像素的尺寸可以有效減少CFSFDP的運(yùn)算時(shí)間,就在計(jì)算各數(shù)據(jù)點(diǎn)相對(duì)各點(diǎn)距離一處就可縮短時(shí)間為1/pixelsize4也就是說,當(dāng)pixelsize取三可以縮減時(shí)間為大概1/81收益相當(dāng)可觀
總結(jié)
以上是生活随笔為你收集整理的极化SAR数据超像素分割和密度峰值聚类的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 不要随意设置随机数种子
- 下一篇: matlab画传输函数幅频曲线