當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数字图像处理(冈萨雷斯)学习第二章数字图像基础

發(fā)布時間：2024/8/1 编程问答 45 豆豆

生活随笔收集整理的這篇文章主要介紹了数字图像处理(冈萨雷斯)学习第二章数字图像基础小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

引言

2.1 人類視覺系統(tǒng)的機理，包括眼中圖像的形成及對亮度的適應(yīng)和鑒別能力。
2.2 討論光、電磁波譜的其他分量及它們的成像特點
2.3 討論成像傳感器及怎么使用它們產(chǎn)生數(shù)字圖像
2.4 介紹均勻圖像取樣及灰度量化的概念。還有數(shù)字圖像表示、圖像中取樣數(shù)和灰度級變化的影響、空間和灰度分辨率的概念，以及圖像內(nèi)插的原理
2.5 處理像素間的各種基本關(guān)系
2.6 介紹本書用到的主要數(shù)學(xué)工具。該節(jié)的第二個目的是幫助您開始積累一些在各種基本圖像處理任務(wù)中如何運用這些工具的感覺

2.1 視覺感知要素

僅涉及人類視覺的最基本方面

2.1.1 人眼的結(jié)構(gòu)

有三層薄膜包圍著眼睛:角膜與鞏膜外殼、脈絡(luò)膜和視網(wǎng)膜
角膜是一種硬而透明的組織，覆蓋著眼睛的前表面。
與角膜相連的鞏膜是一層包圍著眼球其余部分的不透明的膜

2.2 光與電磁波譜

電磁波譜可用波長、頻率獲能量來描述，波長×頻率=光速，電磁波譜各個分量的能量=普朗克常數(shù)×波長

2.3 圖像感知和獲取

我們感興趣的多數(shù)圖像都是由“照射”源和形成圖像的“場景”元素對光能的反射或吸收而產(chǎn)生的。比我們所熟悉的一個可見光源每天照射普通的三維場景情況更一般。
通過將輸入電能和對特殊類型檢測能源敏感的傳感器材料相結(jié)合，把輸入能源轉(zhuǎn)化為電壓。輸出電壓波形是傳感器的響應(yīng)，通過把傳感器響應(yīng)數(shù)字化，從每一個傳感器得到的一個數(shù)字量。

2.3.1 使用單個傳感器獲取圖像

2.3.2 使用條帶傳感器獲取圖像

2.3.3 使用傳感器陣列獲取圖像

2.3.4 簡單的圖像形成模型

2.4 圖像取樣和量化

2.4.1 取樣和量化的基本概念

2.4.2 數(shù)字圖像表示

2.4.3 空間和灰度分辨率

2.4.4 圖像內(nèi)插

內(nèi)插并用它調(diào)整圖像的大小，這是基本的圖像取樣方法
從根本上看，內(nèi)插是用已知數(shù)據(jù)來估計未知位置的數(shù)值的處理
最鄰近內(nèi)插法，把原圖像中最近鄰的灰度賦給了每個新位置，但是有產(chǎn)生不希望的人為缺陷的傾向，如某些直邊緣的嚴(yán)重失真。
更實用的方法是雙線性內(nèi)插，我們用4個最鄰近去估計給定位置的灰度。令(x,y)為我們想要賦以灰度值的位置的坐標(biāo)，v(x,y)=ax+by+cxy+d
雙線性內(nèi)插給出了比最近鄰近內(nèi)插好得多的結(jié)果，但隨之而來的是計算量的增加
更復(fù)雜的是雙三次內(nèi)插，他包括16個最近緊鄰點，是商業(yè)圖像編輯程序的標(biāo)準(zhǔn)內(nèi)插方法

2.5 像素間的一些基本關(guān)系

2.5.1 相鄰像素

位于坐標(biāo)(x,y)處的像素p有4個水平和垂直的相鄰像素，這組像素成為p的4鄰域，用 $N_4(p)$ 表示
也有4個對角相鄰像素，用 $N_D(p)$ 表示。這些點與4個鄰點一起成為p的8鄰域，用于 $N_8(p)$ 表示。

2.5.2 鄰接陣、連通性、區(qū)域和邊界

令V是用于定義鄰接性的灰度值集合。
在二值圖像中，如果把具有1值的像素歸諸于鄰接像素，則V = {1}。
在灰度圖像中，V一般包含有更多的元素。例如具有可能的灰度值范圍為0到255的鄰接像素中，集合V可能是這256個值的任何一個子集。

4鄰接。如果q在集合 $N_4(p)$ 中，則具有V中數(shù)值的兩個像素p和q是4鄰接的。
8鄰接。如果q在集合 $N_8(p)$ 中，則具有V中數(shù)值的兩個像素p和q是8鄰接的。
m鄰接。如何(i)q在 $N_4(p)$ 中，或(ii)q在 $N_d(p)$ 中，且集合 $N4(p)∩N4(q)N_4(p) \cap N_4(q)$ 中沒有來自V中數(shù)值的像素，則具有V中數(shù)值的兩個像素p和q是m鄰接的。

混合鄰接是8鄰接的改進。混合鄰接的引入是為了消除采用8鄰接時產(chǎn)生的二義性。
令S是圖像中的一個像素子集。如果S的全部像素之間存在一個通路，則可以說兩個像素p和q在S中是連通的。對于S中的任何像素p，S中聯(lián)通到該像素的像素集稱為S的連通分量。如果S僅有一個連通分量，則集合S稱為連通集。
令R是圖像中的一個像素子集。如果R是連通集，則稱R為一個區(qū)域。兩個區(qū)域，如果它們聯(lián)合形成一個連通集，則區(qū)域 $R_i$ 和 $R_j$ 稱為鄰接區(qū)域。不鄰接的區(qū)域稱為不連接區(qū)域。在談到區(qū)域時，我們考慮的時4鄰接和8鄰接。為了使我們的定義有意義，必須指定鄰接的類型。

假設(shè)一幅圖像包含有 $K$ 個不連接的區(qū)域，即 $R_k, k = 1,2,...,K$ ,且它們都不接觸圖像邊界(這種假設(shè)的目的是在于避免處理特殊情形。這樣做不會喪失一般性，因為如果一個或多個區(qū)域接觸到圖像的邊界，我們可以簡單地使用1像素寬的背景值來填充圖像。) 令 $R_u$ 代表所有 $K$ 個區(qū)域的并集，其所有點為圖像的前景，而其補集中的所有點為圖像的背景。

區(qū)域R的邊界是這樣的點的集合，這些點與R的補集中的點鄰近。換一種方式說，一個區(qū)域的邊界是該區(qū)域中至少有一個背景鄰點的像素集合。這里必須指定用于定義鄰接的連通性。

前述定義有時稱為區(qū)域的內(nèi)邊界，以便與其外邊界相區(qū)分，外邊界對應(yīng)于背景邊界。在開發(fā)追蹤邊界的算法時這個區(qū)別很重要。這種算法為了保證結(jié)果形成一個閉合通路，通常是沿外邊界確立的。
如果R恰巧是整幅圖像(我們假設(shè)這副圖像是像素的方形集合)，則邊界由圖像第一行、第一列和最后一行、最后一列的像素集合來定義。這個附加定義是需要的，因為一副圖像超過邊界范圍之外沒有鄰點。正常情況下，當(dāng)我們提到一個區(qū)域時，指的是一副圖像的子集，并且區(qū)域邊界種任何與圖像邊緣吻合的像素都作為區(qū)域邊界的一部分全部包含在其中。

一個有限區(qū)域的邊界形成一條閉合通路，并且是“整體”概念。邊緣是由具有某些超過預(yù)先設(shè)定的閾值的導(dǎo)數(shù)值的像素形成的。這樣邊緣的概念就是基于在進行灰度級度量時不連續(xù)點的"局部“概念。把邊緣點連成邊緣線段是可能的，并且有時以與邊界對應(yīng)的方法連接線段。邊緣和邊界吻合的一個例外是二值圖像的情況，從二值區(qū)域提取邊緣與區(qū)域邊界是一樣的，這很直觀。

5.5.3 距離度量

距離度量滿足非負(fù)性，互換性，三角不等式

歐式距離（圓形）
城市街區(qū)距離（菱形）
棋盤距離（正方形）

2.6 數(shù)字圖像處理所用數(shù)字工具的介紹

2.6.1 陣列與矩陣操作

2.6.2 線性操作與非線性操作

線性算子
非線性算子

2.6.3 算術(shù)操作

圖像間的算術(shù)操作是陣列操作，其意思是算術(shù)操作在相應(yīng)的像素對之間進行。
例2.5 針對降噪的帶噪圖像相加(平均)
例2.6 增強差別的圖像相減
例2.7 使用圖像相乘和相除來校正陰影

2.6.4 集合和邏輯操作

一個灰度圖像的補集是255-灰度圖像像素
兩個灰度集合的并集是一個由空間相應(yīng)元素的最大灰度形成的陣列

模糊集合

2.6.5 空間操作

空間操作直接在給定圖像的像素上執(zhí)行。
我們把空間操作分為三大類:單像素操作，鄰域操作，幾何空間變換
單像素操作
鄰域操作
幾何空間變換和圖像配準(zhǔn)
在數(shù)字圖像處理中，幾何變換由兩個基本操作組成:
(1)坐標(biāo)的空間變換（2)灰度內(nèi)插，即對空間變換后的像素賦灰度值
例2.9 圖像旋轉(zhuǎn)與灰度內(nèi)插
用仿射變換說明圖像旋轉(zhuǎn)。
圖像配準(zhǔn)是數(shù)字圖像處理的一種重要應(yīng)用。
主要方法之一是使用約束點,這些點是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點.這些點是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點.
估計變換函數(shù)問題是建模問題之一
例2.10 圖像配準(zhǔn)

2.6.6 向量與矩陣操作

2.6.7 圖像變換

通過變換輸入圖像來表達圖像處理任務(wù),在變換域執(zhí)行指定的任務(wù),之后再用反變換返回到空間域會更好.該過程從空間域到變換域,然后返回到空間域.
例2.11 變換域圖像處理

2.6.8 概率方法

總結(jié)

以上是生活随笔為你收集整理的数字图像处理(冈萨雷斯)学习第二章数字图像基础的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Java学习需要多长时间？
下一篇： python 微博自动点赞软件_pyth