【转】DCT变换的透彻解析
3、離散余弦變換 DCT
將圖像從色彩域轉(zhuǎn)換到頻率域,常用的變換方法有:
DCT變換的公式為:
f(i,j) 經(jīng) DCT 變換之后,F(0,0) 是直流系數(shù),其他為交流系數(shù)。
還是舉例來(lái)說(shuō)明一下。
8x8的原始圖像:
推移128后,使其范圍變?yōu)?-128~127:
使用離散余弦變換,并四舍五入取最接近的整數(shù):
上圖就是將取樣塊由時(shí)間域轉(zhuǎn)換為頻率域的 DCT 系數(shù)塊。
DCT 將原始圖像信息塊轉(zhuǎn)換成代表不同頻率分量的系數(shù)集,這有兩個(gè)優(yōu)點(diǎn):其一,信號(hào)常將其能量的大部分集中于頻率域的一個(gè)小范圍內(nèi),這樣一來(lái),描述不重要的分量 只需要很少的比特?cái)?shù);其二,頻率域分解映射了人類視覺(jué)系統(tǒng)的處理過(guò)程,并允許后繼的量化過(guò)程滿足其靈敏度的要求。
當(dāng)u,v = 0 時(shí),離散余弦正變換(DCT)后的系數(shù)若為F(0,0)=1,則離散余弦反變換(IDCT)后的重現(xiàn)函數(shù) f(x,y)=1/8,是個(gè)常 數(shù)值,所以將 F(0,0) 稱為直流(DC)系數(shù);當(dāng) u,v≠0 時(shí),正變換后的系數(shù)為 F(u,v)=0,則反變換后的重現(xiàn)函數(shù) f(x,y) 不是常數(shù),此時(shí) 正變換后的系數(shù) F(u,v) 為交流(AC)系數(shù)。
DCT 后的64個(gè) DCT 頻率系數(shù)與 DCT 前的64個(gè)像素塊相對(duì)應(yīng),DCT 過(guò)程的前后都是64個(gè)點(diǎn),說(shuō)明這個(gè)過(guò)程只是一個(gè)沒(méi)有壓縮作用的無(wú)損變換過(guò)程。
單獨(dú)一個(gè)圖像的全部 DCT 系數(shù)塊的頻譜幾乎都集中在最左上角的系數(shù)塊中。
DCT 輸出的頻率系數(shù)矩陣最左上角的直流 (DC)系數(shù)幅度最大,圖中為-415;以 DC 系數(shù)為出發(fā)點(diǎn)向下、向右的其它 DCT 系數(shù),離 DC 分量越遠(yuǎn),頻率越高,幅度值越小,圖中最右下角為2,即圖像信息的大部分集中于直流系數(shù)及其附近的低頻頻譜上,離 DC 系數(shù)越來(lái)越遠(yuǎn)的高頻頻譜幾乎不含圖像信息,甚至于只含雜波。
DCT 本身雖然沒(méi)有壓縮作用,卻為以后壓縮時(shí)的"取"、"舍" 奠定了必不可少的基礎(chǔ)。
4、量化
量化過(guò)程實(shí)際上就是對(duì) DCT 系數(shù)的一個(gè)優(yōu)化過(guò)程。它是利用了人眼對(duì)高頻部分不敏感的特性來(lái)實(shí)現(xiàn)數(shù)據(jù)的大幅簡(jiǎn)化。
量化過(guò)程實(shí)際上是簡(jiǎn)單地把頻率領(lǐng)域上每個(gè)成份,除以一個(gè)對(duì)于該成份的常數(shù),且接著四舍五入取最接近的整數(shù)。
這是整個(gè)過(guò)程中的主要有損運(yùn)算。
以這個(gè)結(jié)果來(lái)說(shuō),經(jīng)常會(huì)把很多高頻率的成份四舍五入而接近0,且剩下很多會(huì)變成小的正或負(fù)數(shù)。
整個(gè)量化的目的是減小非“0”系數(shù)的幅度以及增加“0”值系數(shù)的數(shù)目。
量化是圖像質(zhì)量下降的最主要原因。
因?yàn)槿搜蹖?duì)亮度信號(hào)比對(duì)色差信號(hào)更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。
使用這個(gè)量化矩陣與前面所得到的 DCT 系數(shù)矩陣:
如,使用?415(DC系數(shù))且四舍五入得到最接近的整數(shù)
總體上來(lái)說(shuō),DCT 變換實(shí)際是空間域的低通濾波器。對(duì) Y 分量采用細(xì)量化,對(duì) UV 采用粗量化。
量化表是控制 JPEG 壓縮比的關(guān)鍵,這個(gè)步驟除掉了一些高頻量;另一個(gè)重要原因是所有圖片的點(diǎn)與點(diǎn)之間會(huì)有一個(gè)色彩過(guò)渡的過(guò)程,大量的圖像信息被包含在低頻率中,經(jīng)過(guò)量化處理后,在高頻率段,將出現(xiàn)大量連續(xù)的零。
5、“Z”字形編排
量化后的數(shù)據(jù),有一個(gè)很大的特點(diǎn),就是直流分量相對(duì)于交流分量來(lái)說(shuō)要大,而且交流分量中含有大量的0。這樣,對(duì)這個(gè)量化后的數(shù)據(jù)如何來(lái)進(jìn)行簡(jiǎn)化,從而再更大程度地進(jìn)行壓縮呢。
這就出現(xiàn)了“Z”字形編排,如圖:
對(duì)于前面量化的系數(shù)所作的 “Z”字形編排結(jié)果就是:
底部 ?26,?3,0,?3,?3,?6,2,?4,1 ?4,1,1,5,1,2,?1,1,?1,2,0,0,0,0,0,?1,?1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 頂部
這樣做的特點(diǎn)就是會(huì)連續(xù)出現(xiàn)多個(gè)0,這樣很有利于使用簡(jiǎn)單而直觀的行程編碼(RLE:Run Length Coding)對(duì)它們進(jìn)行編碼。
8×8圖像塊經(jīng)過(guò) DCT 變換之后得到的 DC 直流系數(shù)有兩個(gè)特點(diǎn),一是系數(shù)的數(shù)值比較大,二是相鄰8×8圖像塊的 DC 系數(shù)值變化不大。根據(jù)這個(gè)特點(diǎn),JPEG 算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),對(duì)相鄰圖像塊之間量化 DC 系數(shù)的差值(Delta)進(jìn)行編碼。即充分利用相鄰兩圖像塊的特性,來(lái)再次簡(jiǎn)化數(shù)據(jù)。
即上面的 DC 分量-26,需要單獨(dú)處理。
而對(duì)于其他63個(gè)元素采用zig-zag(“Z”字形)行程編碼,以增加行程中連續(xù)0的個(gè)數(shù)。
轉(zhuǎn)載于:https://www.cnblogs.com/wengzilin/archive/2013/05/26/3100027.html
總結(jié)
以上是生活随笔為你收集整理的【转】DCT变换的透彻解析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 卢伟冰透露Redmi K40至尊版也做了
- 下一篇: 男子被滑翔伞缠住 坠地前最后1秒撕开备用