数字图像处理(冈萨雷斯)学习 第二章 数字图像基础
引言
2.1 人類視覺系統(tǒng)的機理,包括眼中圖像的形成及對亮度的適應(yīng)和鑒別能力。
2.2 討論光、電磁波譜的其他分量及它們的成像特點
2.3 討論成像傳感器及怎么使用它們產(chǎn)生數(shù)字圖像
2.4 介紹均勻圖像取樣及灰度量化的概念。還有數(shù)字圖像表示、圖像中取樣數(shù)和灰度級變化的影響、空間和灰度分辨率的概念,以及圖像內(nèi)插的原理
2.5 處理像素間的各種基本關(guān)系
2.6 介紹本書用到的主要數(shù)學(xué)工具。該節(jié)的第二個目的是幫助您開始積累一些在各種基本圖像處理任務(wù)中如何運用這些工具的感覺
2.1 視覺感知要素
僅涉及人類視覺的最基本方面
2.1.1 人眼的結(jié)構(gòu)
有三層薄膜包圍著眼睛:角膜與鞏膜外殼、脈絡(luò)膜和視網(wǎng)膜
角膜是一種硬而透明的組織,覆蓋著眼睛的前表面。
與角膜相連的鞏膜是一層包圍著眼球其余部分的不透明的膜
2.2 光與電磁波譜
電磁波譜可用波長、頻率獲能量來描述,波長×頻率=光速,電磁波譜各個分量的能量=普朗克常數(shù)×波長
2.3 圖像感知和獲取
我們感興趣的多數(shù)圖像都是由“照射”源和形成圖像的“場景”元素對光能的反射或吸收而產(chǎn)生的。比我們所熟悉的一個可見光源每天照射普通的三維場景情況更一般。
通過將輸入電能和對特殊類型檢測能源敏感的傳感器材料相結(jié)合,把輸入能源轉(zhuǎn)化為電壓。輸出電壓波形是傳感器的響應(yīng),通過把傳感器響應(yīng)數(shù)字化,從每一個傳感器得到的一個數(shù)字量。
2.3.1 使用單個傳感器獲取圖像
2.3.2 使用條帶傳感器獲取圖像
2.3.3 使用傳感器陣列獲取圖像
2.3.4 簡單的圖像形成模型
2.4 圖像取樣和量化
2.4.1 取樣和量化的基本概念
2.4.2 數(shù)字圖像表示
2.4.3 空間和灰度分辨率
2.4.4 圖像內(nèi)插
內(nèi)插并用它調(diào)整圖像的大小,這是基本的圖像取樣方法
從根本上看,內(nèi)插是用已知數(shù)據(jù)來估計未知位置的數(shù)值的處理
最鄰近內(nèi)插法,把原圖像中最近鄰的灰度賦給了每個新位置,但是有產(chǎn)生不希望的人為缺陷的傾向,如某些直邊緣的嚴(yán)重失真。
更實用的方法是雙線性內(nèi)插,我們用4個最鄰近去估計給定位置的灰度。令(x,y)為我們想要賦以灰度值的位置的坐標(biāo),v(x,y)=ax+by+cxy+d
雙線性內(nèi)插給出了比最近鄰近內(nèi)插好得多的結(jié)果,但隨之而來的是計算量的增加
更復(fù)雜的是雙三次內(nèi)插,他包括16個最近緊鄰點,是商業(yè)圖像編輯程序的標(biāo)準(zhǔn)內(nèi)插方法
2.5 像素間的一些基本關(guān)系
2.5.1 相鄰像素
位于坐標(biāo)(x,y)處的像素p有4個水平和垂直的相鄰像素,這組像素成為p的4鄰域,用N4(p)N_4(p)N4?(p)表示
也有4個對角相鄰像素,用ND(p)N_D(p)ND?(p)表示。這些點與4個鄰點一起成為p的8鄰域,用于N8(p)N_8(p)N8?(p)表示。
2.5.2 鄰接陣、連通性、區(qū)域和邊界
令V是用于定義鄰接性的灰度值集合。
在二值圖像中,如果把具有1值的像素歸諸于鄰接像素,則V = {1}。
在灰度圖像中,V一般包含有更多的元素。例如具有可能的灰度值范圍為0到255的鄰接像素中,集合V可能是這256個值的任何一個子集。
- 4鄰接。如果q在集合N4(p)N_4(p)N4?(p)中,則具有V中數(shù)值的兩個像素p和q是4鄰接的。
- 8鄰接。如果q在集合N8(p)N_8(p)N8?(p)中,則具有V中數(shù)值的兩個像素p和q是8鄰接的。
- m鄰接。如何(i)q在N4(p)N_4(p)N4?(p)中,或(ii)q在Nd(p)N_d(p)Nd?(p)中,且集合N4(p)∩N4(q)N_4(p) \cap N_4(q)N4?(p)∩N4?(q)中沒有來自V中數(shù)值的像素,則具有V中數(shù)值的兩個像素p和q是m鄰接的。
混合鄰接是8鄰接的改進。混合鄰接的引入是為了消除采用8鄰接時產(chǎn)生的二義性。
令S是圖像中的一個像素子集。如果S的全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的。對于S中的任何像素p,S中聯(lián)通到該像素的像素集稱為S的連通分量。如果S僅有一個連通分量,則集合S稱為連通集。
令R是圖像中的一個像素子集。如果R是連通集,則稱R為一個區(qū)域。兩個區(qū)域,如果它們聯(lián)合形成一個連通集,則區(qū)域RiR_iRi?和RjR_jRj?稱為鄰接區(qū)域。不鄰接的區(qū)域稱為不連接區(qū)域。在談到區(qū)域時,我們考慮的時4鄰接和8鄰接。為了使我們的定義有意義,必須指定鄰接的類型。
假設(shè)一幅圖像包含有KKK個不連接的區(qū)域,即Rk,k=1,2,...,KR_k, k = 1,2,...,KRk?,k=1,2,...,K,且它們都不接觸圖像邊界(這種假設(shè)的目的是在于避免處理特殊情形。這樣做不會喪失一般性,因為如果一個或多個區(qū)域接觸到圖像的邊界,我們可以簡單地使用1像素寬的背景值來填充圖像。) 令RuR_uRu?代表所有KKK個區(qū)域的并集,其所有點為圖像的前景,而其補集中的所有點為圖像的背景。
區(qū)域R的邊界是這樣的點的集合,這些點與R的補集中的點鄰近。換一種方式說,一個區(qū)域的邊界是該區(qū)域中至少有一個背景鄰點的像素集合。這里必須指定用于定義鄰接的連通性。
前述定義有時稱為區(qū)域的內(nèi)邊界,以便與其外邊界相區(qū)分,外邊界對應(yīng)于背景邊界。在開發(fā)追蹤邊界的算法時這個區(qū)別很重要。這種算法為了保證結(jié)果形成一個閉合通路,通常是沿外邊界確立的。
如果R恰巧是整幅圖像(我們假設(shè)這副圖像是像素的方形集合),則邊界由圖像第一行、第一列和最后一行、最后一列的像素集合來定義。這個附加定義是需要的,因為一副圖像超過邊界范圍之外沒有鄰點。正常情況下,當(dāng)我們提到一個區(qū)域時,指的是一副圖像的子集,并且區(qū)域邊界種任何與圖像邊緣吻合的像素都作為區(qū)域邊界的一部分全部包含在其中。
一個有限區(qū)域的邊界形成一條閉合通路,并且是“整體”概念。邊緣是由具有某些超過預(yù)先設(shè)定的閾值的導(dǎo)數(shù)值的像素形成的。這樣邊緣的概念就是基于在進行灰度級度量時不連續(xù)點的"局部“概念。把邊緣點連成邊緣線段是可能的,并且有時以與邊界對應(yīng)的方法連接線段。邊緣和邊界吻合的一個例外是二值圖像的情況,從二值區(qū)域提取邊緣與區(qū)域邊界是一樣的,這很直觀。
5.5.3 距離度量
距離度量滿足非負(fù)性,互換性,三角不等式
歐式距離 (圓形)
城市街區(qū)距離(菱形)
棋盤距離(正方形)
2.6 數(shù)字圖像處理所用數(shù)字工具的介紹
2.6.1 陣列與矩陣操作
2.6.2 線性操作與非線性操作
線性算子
非線性算子
2.6.3 算術(shù)操作
圖像間的算術(shù)操作是陣列操作,其意思是算術(shù)操作在相應(yīng)的像素對之間進行。
例2.5 針對降噪的帶噪圖像相加(平均)
例2.6 增強差別的圖像相減
例2.7 使用圖像相乘和相除來校正陰影
2.6.4 集合和邏輯操作
一個灰度圖像的補集是255-灰度圖像像素
兩個灰度集合的并集是一個由空間相應(yīng)元素的最大灰度形成的陣列
模糊集合
2.6.5 空間操作
空間操作直接在給定圖像的像素上執(zhí)行。
我們把空間操作分為三大類:單像素操作,鄰域操作,幾何空間變換
單像素操作
鄰域操作
幾何空間變換和圖像配準(zhǔn)
在數(shù)字圖像處理中,幾何變換由兩個基本操作組成:
(1)坐標(biāo)的空間變換 (2)灰度內(nèi)插,即對空間變換后的像素賦灰度值
例2.9 圖像旋轉(zhuǎn)與灰度內(nèi)插
用仿射變換說明圖像旋轉(zhuǎn)。
圖像配準(zhǔn)是數(shù)字圖像處理的一種重要應(yīng)用。
主要方法之一是使用約束點,這些點是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點.這些點是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點.
估計變換函數(shù)問題是建模問題之一
例2.10 圖像配準(zhǔn)
2.6.6 向量與矩陣操作
2.6.7 圖像變換
通過變換輸入圖像來表達圖像處理任務(wù),在變換域執(zhí)行指定的任務(wù),之后再用反變換返回到空間域會更好.該過程從空間域到變換域,然后返回到空間域.
例2.11 變換域圖像處理
2.6.8 概率方法
總結(jié)
以上是生活随笔為你收集整理的数字图像处理(冈萨雷斯)学习 第二章 数字图像基础的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java学习需要多长时间?
- 下一篇: python 微博自动点赞软件_pyth