图像检索:基于形状特征的算法
本文節選自《基于形狀特征的圖像檢索算法研究》
?
基于形狀特征的圖像檢索算法相對于顏色特征和紋理特征來說,使用的稍微少一些。摘錄了其中的幾種算法,不做深入剖析了。
?
形狀通常與圖像中的特定目標對象有關,是人們的視覺系統對目標的最初認識,有一定的語義信息,被認為是比顏色特征和紋理特征更高一層的特征。形狀描述的準確與否是決定圖像檢索算法優劣的重要因素,一個好的形狀描述符應具備獨特性、完備性、幾何不變性、靈活性以及抽象性。形狀的描述符大體可以分為兩大類:第一類是描述形狀目標區域邊界輪廓的像素集合,稱為基于輪廓的形狀描述符;第二類稱為基于區域的形狀描述符,是對形狀目標區域內所有像素集合的描述;具體分類如圖2-2所示。
2.3.1 基于輪廓的形狀描述符
1.鏈碼
Freeman于1961年將鏈碼的概念引入到圖像檢索中,并推廣其定義提出了廣義鏈碼。鏈碼已經成為形狀描述符中最常用的方法之一。Freeman通過鏈碼提取圖像的關鍵點產生了一種相對于平移、旋轉與尺度不變的表示方法,并總結了與鏈碼有關的各種算法,確定了鏈碼在第二代圖像編碼中的地位,使其得到了廣泛的應用。
鏈碼是通過一個給定的方向上的單位尺寸的直線片段的序列來描述一條曲線或一個二維形狀的邊界。根據連通定義的不同可分為4方向鏈碼(0到3)和8方向鏈碼(0到8),如圖2-3所示。
鏈碼可以有效的描述輪廓形狀而且可以大大減少邊界所需要的數據量,但是鏈碼對起始點要求很高,對噪聲和邊界線段的缺陷也很敏感,而且鏈碼本身不具有旋轉不變性。
2.傅里葉描述子
傅立葉描述子是物體形狀邊界的傅立葉變換系數,它是物體邊界信號頻域分析的結果。假設一個物體的輪廓是由一系列坐標的像素組成,通過邊界點的坐標可以獲得形狀的復坐標函數、曲率函數以及質心距離三種表達方式。應用傅里葉變換于這三種函數將得到一系列復數形式的系數,這些系數是直接與邊界曲線的形狀有關的,其中,高頻分量表示形狀的細節,而低頻分量則表示形狀的總體。
傅立葉描述子僅用一些低頻分量就可以近似的描述輪廓形狀,具有易于計算、容易歸一化、匹配簡單及易獲得全局和局部特征等許多優點;而它的主要缺點是對輪廓上感興趣的部分,如有無遮擋,由于映射到全部系數中而看不到了。對于輪廓有較銳的變化或被區分對象僅有微小差別的識別問題來說,這種方法就不理想了。
?
3.小波描述符
小波變換在時域和頻域上有突出信號局部特征和進行多分辨率分析的能力,因此被廣泛應用于形狀描述中。小波描述符定量描述邊界的基礎是將邊界坐標看作一個復數序列,并對該復數序列做小波變換。
小波描述子對輪廓的畸變具有較強的魯棒性,而且,可以在較少系數的情況下獲取較高的輪廓描述精度,并支持多層次的分析,通過多層次的分析,達到輪廓由粗糙到精細的多個層次的描述。但是小波變換的最大缺點是過于依賴目標輪廓的起始點,也就是說,同一目標的兩個輪廓的小波描述符可能因為起始點的不同而有很大的不同。
?
4.曲率尺度空間描述符
曲率尺度空間描述符是將經典CSS(Curvature scale space,曲率尺度空間)算法應用到形狀描述符中,由F.Mokhtarian和Mackworth首先提出。其具體方法是沿著形狀的輪廓,用不同帶寬的Gaussian核來平滑輪廓,然后計算采樣點的曲率并找出曲率過零點。重復上述平滑過程直到找不到曲率過零點,最后根據高斯函數標準差及其對應的曲率過零點建立一個CSS二值圖像作為描述該形狀的特征。
基于曲率/凹凸度的形狀描述法是目前比較新的研究方法,吸引了很多學者的注意,文獻[36]在經典CSS描述法的基礎上提出了一種使用所有采樣點曲率與形狀描述的方法。文獻[37]提出了使用形狀的凹凸度表示形狀特征的多尺度空間描述方法。這種以曲率或凸凹度為特征的形狀描述符,在多尺度空間逐層描述形狀輪廓的變化規律,與人類感知形狀的機理類似, 可以細致地區分形狀邊界的差異。曲率/凸凹度是作為幾何變化的描述,具有平移和縮放不變性,而且由于多尺度空間的構建同時也是逐次濾波的過程,因此,對噪聲也具有較好的魯棒性。總的來說,基于曲率/凸凹度的形狀描述符能夠很好的描述輪廓的形狀,但是作為一個局部特性,它不能反應形狀的內部結構及層次關系,不適用于多層次的復雜形狀描述。
?
5.多邊形逼近
多邊形逼近方法的基本思想是通過與對象區域近似的多邊形的頂點來表示該區域。這個近似的多邊形則是由頂點連接頂點的直線段序列組成。如果多邊形的線段數與邊界上的點數相等,即每對相鄰點定義多邊形的一個邊,則多邊形可以完全準確的表達邊界。
多邊形逼近最常用的方法是分裂和合并法,在這個方法中,曲線首先分裂成由幾個線段來表示,直到誤差達到可以接受。被分裂的線段在合并后的逼近誤差范圍內仍可以繼續合并。文獻[39]提出的用直線段的長度和相鄰直線段的夾角作為形狀描述的特征是在原始多邊形逼近的方法上做出的改進。Pavlidis使用平方和誤差函數的偏導數來引導牛頓法搜索最佳斷點。Bengtsson和Eklundh提出了一種層次化的多邊形逼近方法。Chung等開發了一種基于Hopfield神經網絡的形狀的多邊形逼近方法。
利用多邊形逼近進行形狀描述具有抗干擾性好以及表達形狀所需要的數據量小等優點,然而多邊形逼近對尺度變化不具有自適應性,而且逼近的精度沒有固定的標準,很容易造成精度過大或過小,會影響形狀描述(精度過小,會有很多的頂點,得到的多邊形過于復雜;精度過大,容易丟失邊界中的細節信息)。
?
2.3.2 基于區域的形狀描述符
?
1.幾何不變矩
Hu于1962年提出了圖像識別的不變矩理論,并且首次提出了基于代數不變量的矩不變量。所謂的不變矩是圖像的一種統計特征,主要是利用圖像灰度分布的各階矩來描述圖像灰度分布的特性。
?
2.正交矩
正交矩相對幾何矩有兩個優點:首先,正交矩具有最小的信息冗余,用很小的數據集合就可以描述圖像;其次正交矩是可逆的,可以用正交矩的運算重建圖像。
目前常用的正交矩有:Legendre Moments, Zernike Moments以及pseudo-ZernikeMoments等。在區域形狀的矩描述符中,Zernike Moments的性能是最優的。
?
3.通用傅里葉描述符
通用傅里葉描述符(Generic Fourier Descriptor)采用了修正的平面極坐標傅里葉變換,其基本思想是:首先對圖像進行采樣,將采樣的信息重新繪制在直角坐標系下,然后對改直角坐標系下的圖像做傅里葉變換。
?
4.角半徑變換(Angular RadialTransformation ART)
ART是另一個MPEG-7推薦的基于矩的圖像描述符,是定義在極坐標下的一個單位圓內的二維復變換,ART的主要思路是通過使用一組半徑變換系數,描述單個連通區域或者不連通區域,對旋轉和噪聲具有魯棒性。
?
示例:形狀描述符的構造
對基于輪廓的圖像檢索技術來說,目標的形狀可以通過輪廓的提取或圖像分割的方法獲得,如輪廓跟蹤。為了形成具有較強魯棒性的形狀描述符,本章首先對跟蹤后的輪廓進行平滑操作,得到一個光滑的曲線;然后詳細介紹了均勻采樣點和尖點以及特征向量集的定義;最后統計特征向量集的距離和方向得出極坐標直方圖,再根據這個直方圖來描述目標形狀。
?
3.2.1 曲線平滑
?
?
3.2.2 特征點提取
定義 1 把輪廓線上局部曲率極大值的點定義為尖點。
定義 2 把輪廓線作定數等分采樣得到的點定義為均勻采樣點。
定義 3 把尖點和均勻采樣點的集合稱為特征點。
尖點是形狀識別中的重要特征,它能夠很好地描述輪廓的形狀。但是其它輪廓點同樣也含有豐富的信息,對描述輪廓的形狀也具有很重要的作用,因此本文在提取尖點的同時又提取了均勻采樣點作為描述輪廓形狀的特征點。
?
3.2.2.1 均勻采樣點的提取
在提取均勻采樣前,首先要確定輪廓起始點(xq, yq)。本文將輪廓線上曲率最大的像素點確定為均勻采樣的起始點。如果輪廓有不止一個曲率最大的像素點,則比較曲率最大的像素點的相鄰像素點的曲率,然后取相鄰像素點的曲率也較大的像素點所對應的曲率最大點作為起輪廓始點,如果相鄰像素點的曲率也相同則再比較相鄰點的相鄰點曲率,直到找出較大的相鄰像素點為止。
?
3.2.2.2 尖點的提取
?
3.2.3 特征向量集
把由特征點向輪廓線質心所引向量定義為特征向量。所有特征向量集合稱為特征向量集。
?
出處:http://blog.csdn.net/leixiaohua1020/article/details/16885305
總結
以上是生活随笔為你收集整理的图像检索:基于形状特征的算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV提取图像颜色直方图
- 下一篇: 图像检索中相似度度量公式:各种距离