数字图像处理:第一章 概述
第一章 概述
數字圖象處理是一門關于如何用計算機對圖象進行處理的學科,本課程主要講解基本原理和方法,針對計算機系的學生,強調編程實踐和建立圖象處理應用系統的方法。推薦的教材與圖象編程參考書包括:
?
最近出版的新書:
目錄
作業
1.?什么是數字圖象?
數字圖象是指由被稱作象素的小塊區域組成的二維矩陣。對于單色即灰度圖象而言,每個象素的亮度用一個數值來表示,通常數值范圍在0到255之間,即可用一個字節來表示,0表示黑、255表示白,而其它表示灰度。如下圖所示:
? ?
圖1.1?灰度圖象(128x128)及其對應的數值矩陣(僅列出一部分(26x31))
彩色圖象可以用紅、綠、藍三元組的二維矩陣來表示。通常,三元組的每個數值也是在0到255之間,0表示相應的基色在該象素中沒有,而255則代表相應的基色在該象素中取得最大值,這種情況下每個象素可用三個字節來表示。
? ?
圖1.2?彩色圖象(128x128)及其對應的數值矩陣(僅列出一部分(25x31))
????數字圖象是對二維連續光函數進行等距離矩形網格采樣,再對幅度進行等間隔量化得到的二維數據矩陣。采樣是測量每個象素值而量化是將該值數字化的過程。
數字圖象在本質上是二維信號,因此信號處理(以一維信號為對象展開的課程)中的基本技術(如FFT)可以用在數字圖象處理中。但是,由于數字圖象只是一種非常特殊的二維信號,反映場景的視覺屬性,只是二維連續信號的非常稀疏的采樣,希望從單個或少量采樣中獲得有意義的描述或特征,無法照搬一維信號處理的方法,需要專門的技術。實際上數字圖象處理更多地依賴于具體應用問題,是一系列的特殊技術的匯集,缺乏貫穿始終的嚴格的理論體系。
數字圖象處理是一個多學科交叉的領域,涉及光學、電子學、數學、攝影技術、計算機技術等眾多學科,是一個高度綜合的技術學科。
解釋:
數字圖象處理是一門計算機的技術課程,而且是一種非常特殊的專業課程,而非有系統理論體系的基礎課程。
本課程只講述基本原理和一般方法,不涉及具體領域中的特殊方法,如醫學圖象處理已經成為一個專門的研究領域,有許多特殊的處理方法。
學生在學習時的感覺是內容的系統性不強,涉及的知識面寬但不很深(高級部分除外,如小波變換等),需要出色的綜合能力。而在技術上需要很強的程序設計能力,可以說圖象處理是門對學生的技術能力即動手能力要求很高的課程。
圖象在計算機中表現為二維數據矩陣,難點是矩陣所涉及的各種變換與其在信號原理中的對應關系。圖象處理涉及很多變化參數,為了達到好的圖象處理效果,參數的選擇是關鍵。為了實現好的圖象處理功能,方便的交互手段包括調整參數、圖象的顯示、存儲等是很重要的。
相關資料:數字圖象(圖象處理基礎在線講義:http://www.ph.tn.tudelft.nl/Courses/FIP)
2.數字圖象處理系統的基本組成結構
數字圖象處理系統由圖象數字化設備、圖象處理計算機和圖象輸出設備組成,如下圖所示:
圖1.3?數字圖象處理系統
圖象數字化設備:掃描儀、數碼相機、攝象機與圖象采集卡等
圖象處理計算機:PC、工作站等
圖象輸出設備:打印機等
3.?數字圖象處理的應用
隨著微電子與計算機技術的高速發展,圖象數字化設備如CCD攝象機、掃描儀、數碼相機、圖象采集卡的成本大大降低,普通的微機已經可以勝任部分圖象處理任務,使得圖象處理的應用越來越廣泛,可以預見在不久的將來,圖象及視頻處理的應用將與目前語音處理的應用一樣變得日益普及和重要。
圖象處理的重要應用包括:
遙感
視覺監視、保安
工業檢測與測量
宇宙探險、軍事偵察、高精度制導
醫療診斷
通訊
影視業、娛樂、公眾服務
解釋:
????數字圖象處理是與模式識別與計算機視覺等學科緊密相關的學科方向。數字圖象處理通常作為模式識別或計算機視覺系統的預處理部分,用于圖象采集、變換、特征提取等前期工作,如圖象增強、幾何矯正、邊緣提取、輪廓跟蹤等;而模式識別則重點在于抽取有效特征,分類和識別物體,如指紋識別、簽字驗證等;計算機視覺的核心任務是景物理解,追求人工的視覺功能,如立體信息的獲取,運動分析等。
4.數字圖象處理中的數據結構
數字圖象處理中常用的數據結構包括矩陣、鏈碼、屬性圖等;此外還常用分層表示的數據結構,如金字塔和四叉樹(pyramids and?quadtrees)結構。
數據結構是指數據的組織方式,對算法的選擇和其實現的容易程度有明顯的影響。數據結構的選擇在程序設計中是關鍵性的步驟。
算法?+?數據結構?=?程序 (Algorithm + Data Structure = Program)
邏輯?+?控制?=?算法??(Logic + Control = Algorithm)
本節是如下資料的摘譯:Milan Sonka, Chapter 3, Data Structures in Image Analysis?(..\..\download_IPCVPR\DIP of Milan Sonka\datastructureinimageprocessing.htm)。建議讀者閱讀原文。
4.1?圖象數據的表示層次
??????圖象數據的表示層次反映圖象處理的不同階段,表達圖象數據的不同抽象程度??偟膩碚f有如下幾個逐級升高的表示層次。
???象素層圖象:由原始數據組成,是象素亮度的整數矩陣;
???分割圖象:圖象被分割為可能屬于同一物體的區域;
???幾何表示:2D和3D?形狀信息;
???關系模型: 數據更高層次的抽象,使使用數據更為有效。
4.2?規范的圖象數據結構
規范的圖象數據結構有矩陣、鏈碼、圖、物體屬性表、關系數據庫 等(matrices,chains, graphs, lists of object properties, relational databases, etc.)。它們不僅用于圖象信息的直接表示,而且還是更復雜的圖象分層表示方法的基礎,如金字塔和四叉樹(pyramids and?quadtrees)結構。
???矩陣:低層圖象表示的最普通的數據結構,矩陣元素是整型數值;這類圖象數據通常是圖象獲取設備(攝象機、掃描儀等)的直接輸出。
???鏈碼:描述物體的邊界,鏈碼中的符號一般對應于圖象基元的鄰接關系。如下圖所示。鏈碼可以用靜態數據結構來表示,如1維數組,取其大小為鏈碼的最大可能長度;也可以用動態數據結構來表示,且這樣在節省存儲空間方面更合適。
???行程編碼:通常用于圖象矩陣中符號串的表示。例如?,傳真機就使用這種方式。在二值圖象中,行程編碼僅記錄圖象中屬于物體的區域,該區域表示成以表為元素的表。圖象的每行表示成一個子表,它的第一個元素為行號,然后是兩個縱坐標構成的項,第一個為行程的開始的縱坐標(列號),第二個為行程的結束的縱坐標。一行中可以有若干個這樣的序列項。如下圖所示:
行程編碼也可用于含有多個亮度層次圖象的表示,這時子表中必須記錄序列的亮度值。
???拓撲數據結構:圖象描述成一組元素及其相互關系的圖結構。例如,賦值的屬性圖,區域鄰接圖。區域鄰接圖例子如下:
???關系結構:信息集中在語義上重要的圖象組成部分(它們是圖象分割的結果)即物體之間的關系上,適合用于高層次的圖象理解工作。例如,使用關系結構描述自然場景的示意圖(物體及其關系屬性表)如下:
4.3分層數據結構
分層數據結構將圖象描述成若干不同粒度的層次,使算法可以根據需要將處理控制在較小的數據量上;只有必要時,處理才會在最細的數據分辨率上進行。兩種典型的分層表示數據結構是金字塔和四叉樹(pyramids and?quadtrees)結構。
??金字塔(pyramids)
?????圖象的M-pyramid金字塔結構是一個圖象序列{ML, ML-1, ..., M0}?,其中ML?是具有原圖象分辨率的圖象,即原圖象本身,然后依次降低一倍分辨率得到該圖象序列。當原圖象的分辨率是2的整數冪時,M0?則僅對應于一個象素。當需要對圖象的不同分辨率同時進行處理時,可以采用這種數據結構。分辨率每降低一層,數據量則減少4倍,因而處理速度差不多提高4倍。
M-pyramid金字塔結構存儲所有圖象矩陣需要的象素個數為:
???一般而言,同時使用幾個分辨率層次比僅使用單個層次優越。這些圖象可以表示成樹狀金字塔結構:?T-pyramid.?T-pyramid是樹結構,每個結點有4個子結點,如下圖所示:
????T-pyramid金字塔結構的存儲表示與T-pyramid相似,樹的弧不必存儲,這是因為由于其結構的規范性樹的子結點和父結點的地址都很容易計算出來。
??四叉樹(Quadtrees)
????四叉樹是對T-pyramids的改進,除葉子結點外每個結點有4個子結點(西北NW: north-western,?東北NE: north-eastern,?西南SW: south-western,?西南SE: south-eastern).與T-pyramids一樣,在每個層次圖象被分解4個象限,但無須保留所有的葉結點。如果父結點有4個與它的值(如,亮度)一樣的子結點,則無須保留這些子結點。如下圖所示。
分層圖象表示的缺欠是:
??依賴于物體的位置、方向和相對大小;
?兩個僅有微小差別的相似圖象可能會具有非常不同的金字塔結構或四叉樹結構;
?甚至當兩個圖象描述的是完全相同而只是略微移動了的景物時,可能會產生完全不同的表示。
說明:有關鏈接參考資料的自學問題
課件中涉及相當多的通過鏈接方式訪問的參考資料(如htm/html網頁、pdf或word文檔,等等。),主要的目的是提供豐富的素材,便于不同程度的讀者自由學習,不是基本要求,感興趣的讀者可以參考。這種內容是傳統教材無法實現的,是電子課件的主要特點之一。學生如果能夠充分發揮主觀能動性,將會突破課件自身內容局限性,對課程的學習十分有益。??
參考文獻
Milan Sonka, Chapter 3, Data Structures in Image Analysis?(..\..\download_IPCVPR\DIP of Milan Sonka\datastructureinimageprocessing.htm)。
--------------------------------------------------------------------------------
作業
1.????編制讀入并顯示bmp格式的程序,用鼠標選擇區域,將其象素數據寫入數組,并以文本文件txt輸出。
(有關位圖(bmp)的格式請參考:第一章,Windows位圖和調色板,“數字圖象處理編程入門”,呂風軍,清華大學出版社,1999.9:位圖格式說明..\Readings\chapter01\bitmapformat.doc
返回主目錄?返回本章目錄
清華大學計算機系?艾海舟
最近修改時間:2000年1月10日
出處:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/chapter01/chapt01_ahz.htm
總結
以上是生活随笔為你收集整理的数字图像处理:第一章 概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python基础教程(十三):JSON、
- 下一篇: 数字图像处理:第二章 图象获取、显示、表