数字图像处理第三版(冈萨雷斯)笔记,2020
第一章 緒論:
數字圖像處理:數字圖像處理(Digital Image Processing)是通過計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等處理的方法和技術。
圖像處理應用領域:航空航天、生物醫學工程方面、工業和工程方面、視頻和多媒體系統、計算機視覺等。
圖像處理的基本步驟:圖像獲取、濾波與增強、圖像復原、彩色圖像處理、小波與分辨率處理、壓縮、形態學處理、分割、表示與描述、目標識別。
其中數字圖像獲取到形態學處理(低級圖像處理):輸入圖像->輸出圖像
形態學處理到目標識別(高級圖像處理):輸入圖像->輸出的為圖像屬性或描述 。
note:圖像處理的基本步驟如上,但不一定按順序,也不一定全都有,要安實際處理的任務是什么。
通用圖像處理系統的組成:
第二章 數字圖像處理基礎
2.1視覺感知要素:
人眼結構:最里層是視網膜,上面兩類感受器:錐狀體(視網膜中央,明視覺)和桿狀體(數量更多,暗視覺)。
數字圖像作為離散的灰度值顯示,所以眼睛對于不同亮度級別的辨別能力在顯示圖像處理結果中是重要考慮因素。
2.2 光和電磁波譜
電磁波譜可用波長(λ)、頻率(v)或能量(E)描述。
電磁波種關系式:
電磁波長與能量之間的關系式是
E=hv,h是常數(普朗克常數)。
式中E代表能量,h為普朗克常數;
電磁波長與頻率的關系式是
λ=c/v,c是光速(2.998×10^8 m/s)
式中c為光速,是波長,是電磁波的頻率。
可見:
- 波長與頻率成反比。
- 能量與頻率成正比。所以,無線電波能量最小,伽馬射線能量最強(危險!)。
人感受一個物體的顏色由物體反射光的性質決定。沒有顏色的光稱為單色光或無色光。單色光唯一屬性為它的強度或大小。
灰度級一詞用來表示單色光強度,即從黑到白的單色光的度量值范圍。
單色圖像常稱灰度圖像。
描述彩色光源質量的三個基本量:發光強度、光通量和亮度。
飽和度與對比度:
飽和對是對色彩的bai濃度(純du度)的定義;對比度是對畫面明暗程度的定義。
飽和度是指色彩的鮮艷程度,也稱色彩的純度。飽和度取決于該色中含色成分和消色成分(灰色)的比例。含色成分越大,飽和度越大;消色成分越大,飽和度越小。純的顏色都是高度飽和的,如鮮紅,鮮綠。混雜上白色,灰色或其他色調的顏色,是不飽和的顏色,如絳紫,粉紅,黃褐等。完全不飽和的顏色根本沒有色調,如黑白之間的各種灰色
對比度指的是一幅圖像中明暗區域最亮的白和最暗的黑之間不同亮度層級的測量,差異范圍越大代表對比越大,差異范圍越小代表對比越小,好的對比率120:1就可容易地顯示生動、豐富的色彩,當對比率高達300:1時,便可支持各階的顏色。但對比率遭受和亮度相同的困境,現今尚無一套有效又公正的標準來衡量對比率,所以最好的辨識方式還是依靠使用者眼睛。
原理上,如果可以開發出一種傳感器來檢測出一種電磁波譜發射的能量,那么我們就可以在該波段上對感興趣的事件成像。
注意:要”看到“一個物體的電磁波的波長必須小于等于物體的尺寸。例如水分子直徑量級是10^-10m,要觀察該分子就要在遠紫外或者軟x射線范圍發射的光源。該限制與傳感材料的物理特性一起確定了成像傳感器功能的基本限制。
(軟指的是能量低,靠近右邊的波段,硬則相反,同樣,”遠“是指的靠近該波段左邊的電磁波)
2.3圖像感知與獲取
可通過傳感器配置將能量轉換成傳感器配置,主要有三種傳感器配置:
單個成像傳感器:需要有二維的運動,用于高精密掃描。速度慢。
條帶傳感器:需要一維運動,應用有航空成像。以圓環形方式安裝的傳感器帶常用于醫學和工業成像,如計算機軸向斷層成像(CAT)。
陣列傳感器:不需要運動,常見應用有數字攝像機。
原理,將輸入的電能和對特定類型能源敏感的材料組合,把輸入能源轉變為電壓。傳感器的響應即輸出的電壓波形,將傳感器響應數字化后得到一個數字量。
傳感器的輸出必須由重建算法處理,重建算法的目的是把感知數據轉化成為有意義的剖面圖象。
每個傳感器的響應正比于投射到傳感器表面的光能總量。
數字圖像獲取例子:
成像系統首先收集入射能量,然后匯集到一個圖像平面,再由與該圖像平面重合的傳感器陣列產生和每個傳感器接收到的光的總量成正比的輸出。之后數字或模擬電路掃描這些輸出,并把他們傳換成模擬信號,然后又成像系統的其他部分數字化,輸出的是一幅數字圖像,如上圖的最后像素格子組成的圖像那樣。
- 用f(x,y)的二維函數表示圖像,在空間坐標(x,y)處,f的值或幅度是一個正標量,其物理意義由圖像源決定。
- 當一幅圖像由物理過程產生時,其亮度值正比于物理源所輻射的能量。因此,f(x,y)一定是非零和有限的,即
0<f(x,y)<∞
函數f(x,y)由兩個分量表征:
(1)入射到被觀察場景的光源照射總量(入射分量)——i(x,y)
(2)場景種物體反射的光照總量(反射分量)——r(x,y)
f(x,y)=i(x,y)*r(x,y),其中,0<i(x,y)<∞,0<r(x,y)<1
2.4圖象取樣和量化
對坐標值數字化稱為取樣,對幅值數字化稱為量化
數字圖像一般默認左上角是原點,x軸向下延伸,y軸向右延伸。因為矩陣第一個元素按慣例在左上角,而且許多圖像顯示的掃描都是左上角開始的。
數字化過程M,N必須是整數,出于存儲和量化硬件的考慮,灰度級數典型的取為2的整數次冪,即L=2^k。
2^k個灰度級的圖像為k比特圖像,即擁有k比特的灰度分辨率。
存儲圖像所需比特數b=M×N×k。
灰度值跨越的值域非正式地稱為動態范圍。動態范圍定義為最大可度量灰度和最小可檢測灰度之比。上限取決于飽和度,下限取決于噪聲。
圖像中最高和最低灰度級間的灰度差為對比度。
空間分辨率是圖像中可辨別的最小細節的度量。廣泛使用的定義是每單位距離可分辨的最大線對數量。每英寸距離點數(dpi)則是印刷和出版行業中的常用度量。
等偏愛曲線是隨著k和N值的變化,人為主觀感受到的圖像的質量用一條曲線匯總的結果。等偏愛曲線趨向于向右上方移動(越靠右上方意味著越大的N值和k值,圖像質量越好,人們越喜歡)
圖像內插:用于放大、縮小、旋轉和幾何校正等任務。
最近鄰近內插法<雙線性內插法<雙三次內插
2.5像素間基本關系
N4§ 4領域,上下左右四個,
ND§ 對角領域,四個對角。
N8§ 8領域,N4§+ND§
鄰接:
分割線----------------
如果是做計算機視覺方向跑來看這本書的話,我覺得初始階段,大概對一些重點章節留個印象就行了,比如知道什么是圖像增強,什么是高通濾波,低通濾波,什么是頻域,什么直方圖均衡化,然后就差不多了,其他的東西需要用到的時候再回來看看,把這本書當工具書就行。這是我三個月后發現的,所以也就沒有再做筆記了,主要還說我沒有個好的習慣吧/狗頭,生而吃人,我很抱歉。
總結
以上是生活随笔為你收集整理的数字图像处理第三版(冈萨雷斯)笔记,2020的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue-cli3中的vue.config
- 下一篇: faster rcnn训练过程讲解