数字图像与编码
數字圖像與編碼
1. 數字圖像
人類通過感覺器官從外部世界獲取各種形式的信息,并傳遞給大腦,進行思維,做出反應。其中通過視覺獲取的信息占大部分。圖像信息具有直觀,形象,易懂和信息量大的特點,是人類最豐厚的視覺信息來源。照片,圖畫,電影,電視等都屬于圖像的范疇。
圖像按其內容的運動狀態可分為靜止圖像和運動圖像兩大類。運動圖像,沿用電視技術的術語,一般稱其為視頻。電視是最普遍的視頻通信方式,以清晰度可分為可視電話,會議電視,標清電視(SDTV),高清電視(HDTV),超高清電視(4K,8K)等。視頻信號中的每一幅圖像稱為一幀。我國所采用的PAL制電視的分辨率為25幀每秒。
圖像和視頻信號數字化具有許多模擬信號所不具備的優點。數字信號傳輸質量高于模擬信號傳輸質量,可經過多次積累而不引起噪聲嚴重積累;易于采用信道編碼技術提高傳輸的可靠性;便于利用時分復用技術與其它通信業務相結合;數字信號易于加密,提高信號的安全性;數字信號易于借助計算機技術進行處理,存儲。但是信號數字化后的數據量太大,數碼率太高,需要巨大的傳輸帶寬和存儲容量。圖像的壓縮與編碼就是在保證圖像質量的前提下,用最少量的數碼實現數字圖像的傳輸與存儲。
2. 圖像數據壓縮
以高清電視信號為例,其分辨率為1920x1080,每秒鐘25幀,那么所需帶寬為414.72 Mbps。數字HDTV傳輸系統要求將1路HDTV圖像信號的碼率要是到20Mbps,也就是說要求壓縮到原來的1/50。
圖像信號可以壓縮的根據有兩方面,一方面是圖像信號中存在大量冗余度可供壓縮,并且這種冗余度在解碼后還可無失真地恢復;另一方面是可以利用人的視覺特性,在不被主觀視覺察覺的容限內,通過減少表示信號的精度,以一定的客觀失真換取數據壓縮。
圖像信號的冗余度存在于結構和統計兩方面。圖像信號結構上的冗余度變現為很強的空間(幀內)和時間(幀間)相關性。電視信號在相鄰像素間,相鄰行間,相鄰幀間存在著這種強相關性。隱藏,采取適當的信號處理技術,解出圖像和視頻中由于高度相關性帶來的冗余,頻帶是可以壓縮的。
信號統計上的冗余度來源于被編碼信號概率密度的分布不均勻。例如在預測編碼系統中,需要編碼傳輸的是預測誤差信號,它是當前待傳像素值與預測值間的差分信號。由于電視信號在相鄰像素間的強相關性,預測誤差很小,預測誤差集中分布在0附近。這種即不均勻的概率分布對采用變字長編碼壓縮碼率極為有利,因為在編碼時可以對出現概率高的預測誤差用短碼,對出現概率低的預測誤差用長碼,則總的平均碼長比用固定碼長編碼短很多。這種編碼叫統計編碼,熵編碼。
充分利用人的視覺特點,是實現碼率壓縮的又一重要途徑。人眼對圖像的細節(空間)分辨率,運動(時間)分辨率和灰度(對比度)分辨率的要求都有一定的限度。對于圖像信號在空間,時間以及幅度方面進行數字化的精細程度只要達到這個限度即可,超過是沒有意義的。
人眼對圖像細節,運動和灰度三個方面的分辨率是互相制約的。當人眼對圖像的某種分辨率要求很高時,對其它方面的分辨率則降低要求。對于靜止畫面需要40萬個以上像素的分辨率,對于運動畫面,所需要的像素分辨率顯著降低。對于快速運動的物體需要30Hz的幀率保持活動畫面的連貫性,對于緩慢運動的場景和靜止的場景幀率可以適當降低。
僅在觀察圖像中的大塊面積時,人眼才能分辨出全部256個灰度等級。而當觀察圖像局部的小塊面積或精致細節時,并不需要那么多的灰度等級。在灰度突變處,由于視覺的掩蓋效應,人眼不能察覺到很細致的灰度差別。
當傳送一個快速運動圖像時,只需要采用較少的灰度等級,因為人眼注意觀察運動物體時,對灰度的分辨能力下降。
利用上述視覺特性,在進行圖像數字化時可以采用自適應技術,即根據圖像的每一局部的特點來決定對它的取樣頻率和量化的精度,盡量做到與人眼觀看這種圖像局部時相關的視覺特點相適配。
3. 圖像壓縮信源編碼過程
圖像和視頻信源編碼的整個過程一般由以下三個步驟完成。
其中信號映射和統計編碼這兩個環節是可逆的過程,而量化是不可逆的,即量化會產生失真。
PCM是由模擬信號轉變為數字信號所必需經過的取樣,量化過程。PCM對模擬信號在時間,空間和幅值上的離散處理會不可避免地引入誤差。為了保證圖像和視頻信號從模擬形式變成PCM信號不產生主觀上可以察覺的誤差,必需保證對信號有足夠高的取樣頻率和量化精度。除過模擬到數字信號的PCM量化外,信源編碼過程中的量化實際上是對信號的2次量化。
數字信號在信道中傳輸時,由于干擾會產生傳輸誤碼,特別是當通過信源編碼使冗余度壓縮越多時,誤碼影響越嚴重。所以一般在經過信源編碼之后,都要在編碼后的碼流中有目的地按一定規則加入差錯校正碼,進行誤碼防護,這就是信道編碼。顯然對整個通信系統而言,信道編碼增加的冗余度比信源編碼去除的冗余度要小的多,從而在通信的有效性和可靠性間實現合理的平衡。
4. 圖像編碼算法分類
圖像編碼技術有多種分類方法。根據編碼對象的不同,可分為靜止圖像編碼,活動圖像編碼,黑白圖像編碼,彩色圖像編碼等。根據壓縮過程中有無信息損失可分為有損編碼,無損編碼。根據算法中是否采用自適應技術,可分為自適應編碼和非自適應編碼。最常見的是按算法原來進行分類。常見的圖像編碼算法主要有如下幾類:
4.1 預測編碼
預測編碼使利用圖像信號在局部空間和時間范圍內的高度相關性,以已經傳出的近鄰像素為參考,預測當前像素值,然后量化,編碼預測誤差。最常用的是差分脈沖編碼調制(DPCM)。
與運動估值技術相結合的運動補償幀間預測是目前視頻壓縮編碼系統中去除信號時間域冗余信息最常用的方法。
4.2 編換編碼
變換編碼使將一組像素值經過某種形式的正交變換轉換成一組變換系數,然后根據人的主觀視覺特性對各變換系數進行不同精度的量化后編碼的技術。正交變換的作用是解出像素間的空間相關性,降低冗余度。用于圖像編碼的正交變換如離散傅里葉變換(DFT),沃爾什-哈達嗎變換(WHT),哈爾變換(Harr),離散余弦變換(DCT)等。這些變換一般都有快速算法。
DCT已被目前的多種靜止和活動圖像編碼的國際標準所采用。
4.3 統計編碼
這是一類根據信息熵原理進行的信息保持型邊字長編碼,也稱熵編碼。編碼時對出現概率高的時間用短碼表示,對出現概率低的事件用長碼表示。在目前圖像編碼國際標準中,常見的熵編碼有霍夫曼(Huffman)編碼和算術編碼。
4.4 子帶編碼
子帶編碼屬于分析-綜合類的編碼技術。子帶編碼的基本思想是,在編碼端將圖像信號在頻率域分裂成若干子帶(subband),而后對各個子帶用與其統計特性相適合的編碼器及比特分配方案進行數據壓縮。
除了通過專門設計的正交鏡像濾波器實現的經典子帶編碼方法之外,小波變換是目前使用最多的子帶編碼方法。
4.5 基于模型的編碼
模型基圖像編碼是一種基于景物三維模型的參數編碼方法。相對于基于波形的編碼方法而言,對參數編碼所需的比特數要少得多。依據對圖像內容先驗知識的了解,在編解碼雙方建立一個相同景物的三維模型,基于這個模型,在編碼器中對圖像內容進行分析,提取景物參數,然后將這些參數編碼傳送給解碼端,解碼端根據接收到的參數和建立起的景物模型,采用圖像合成技術再重建圖像。
模型編碼也屬于分析-綜合編碼技術。模型基圖像編碼目前主要用于以頭肩像為對象的低碼率可視電話編碼。
4.6 其它編碼算法
除過上述幾大類編碼算法外,還有很多其它壓縮算法,例如比特平面編碼,矢量量化編碼,塊截斷編碼,神經網絡編碼,輪廓編碼等。
5. 圖像編碼的標準
ITU(國際電信聯盟)和ISO/IEC(國際標準化組織)等幾大標準化組織自20世紀80年代后期以來在全世界范圍內積極推動,聯合各國在相關領域的專家進行共同研究,先后制定了一系列靜止和活動圖像編碼的國際標準,并致力于面向未來的多媒體編碼標準的研究。
關于靜止圖像壓縮編碼,1991年通過了JPEG標準。2000年,JPEG委員會公布的國際標準JPEG 2000以小波變換作為基本算法,采用了嵌入式編碼技術,在達到更高的圖像質量和更高的壓縮效率的同時,還能滿足在移動和網絡環境下對互操作性和可分級性的要求。
1990年頒布了用于視聽業務的視頻編碼標準即H.261。隨后ITU-T針對不同的電信通信網絡中對實時視頻通信系統的需要,先后完成了H.26X系列中多個視頻編碼標準,其中包括H.261,H.262,H.263,H.264,H.265。
在H.261制定的同時,ISO/IES聯合技術委員會下屬的分委員會于1988年成立了運動圖像專家組MPEG。該委員會先后通過了MPEG系列的多個音視頻壓縮編碼標準,包括MPEG-1,MPEG-2,MPEG4等。
ITU-T和ISO/IES這兩個標準化組織除了獨立制定相關標準外,還進行合作。于2001年成立了視頻聯合工作組JVT。2003年該工作組正式公布了H.264/MPEG-4 AVC。H.264/MPEG-4 AVC的壓縮性能明顯超出了以前的視頻壓縮標準。
HEVC是High Efficiency Video Coding的縮寫,是一種新的視頻壓縮標準,用來以替代H.264/AVC編碼標準,2013年1月26號,HEVC正式成為國際標準。
總結
- 上一篇: C语言题目:输入顾客在超市消费金额和顾客
- 下一篇: 【学习】人工智能:一种现代的方法