走进音视频的世界——杜比音效之AC3与AC4
杜比音效是由杜比實驗室開發的,涉及多聲道音頻壓縮技術。這種數字壓縮技術目標是生成數字音頻信號,當解碼重現時,聲音與原始信號相同。同時使用最低碼率進行壓縮,提供真實的立體環繞聲。因此,杜比音效廣泛應用于電影院、家庭影音、DVD、藍光光盤。杜比音效系列主要包括:Dolby AC3、Dolby AC3 Plus、Dolby AC4和Dolby TrueHD。杜比實驗室發布的環繞聲系統歷史演進如下表所示:
| 杜比MP矩陣 | 1975年 | 電影院采用光學技術。使用杜比A降低噪音。杜比立體聲處理器將4:2編碼為35mm膠片,并將2:4解碼回4.0。 | 帶C和MonoSurround矩陣的FL FR |
| / | 1982年 | 杜比立體聲的消費者變體。原始解碼器利用帶有延遲和幻像中心的簡單無源LR電路進行3通道解碼。 | FL FR和MonoSurround矩陣 |
| 杜比MP矩陣 | 1986年 | 杜比立體聲(Dolby SR)減少了杜比SR降噪,以增強保真度和動態范圍。 | 帶C和MonoSurround矩陣的FL FR |
| / | 1987年 | 杜比立體聲和杜比環繞聲的參考有源矩陣2:4解碼器(Cat No. 150)。準確解碼Lt ??/ Rt以恢復LCRS 4.0環繞聲。 | 帶C和MonoSurround矩陣的FL FR |
| AC-3 | 1992年電影 | 離散通道編碼器/解碼器。Pro Logic解碼器可用于縮混立體聲輸入。 | FL FR C SL SR SUB |
| AC-3 | 1999年 | 通過5.1中Ls / Rs通道的矩陣編碼進行6.1或7.1環繞聲。向后兼容標準5.1數字。 | FL FR C SL SR(具有矩陣式RearMono)SUB [非離散7.1:BackLeft和BackRight] |
| 不適用 | 2000 | 將非編碼立體聲上混到Surround 5.1。也可用于解碼5.1播放的杜比環繞聲。消費者解碼器通常包括特定的電影,音樂或游戲模式。 | FL FR C SL SR SUB |
| 不適用 | 2002年 | 擴展至PLII。將立體聲,杜比環繞聲,杜比數字5.1增強到6.1或7.1。將杜比數字EX解碼為6.1或7.1。在消費產品中保留電影,音樂或游戲模式。 | FL FR C SL SR SUB左后和右后 |
| 增強型AC-3 | 2005年 | 有損壓縮編解碼器;48 kHz采樣頻率,20位字長;支持32 kbit / s – 6 Mbit / s的數據速率,可擴展,包括高清光盤上的768 kbit / s – 1.5 Mbit / s(通常),以及廣播和在線的256 kbit / s。當前媒體應用程序的1.0到7.1通道支持;可擴展至16個通道;離散的。通過高達640 kbit / s的S / PDIF連接與杜比數字技術向后兼容。支持杜比元數據。 | FL FR C SL SR SUB左后和右后 |
| MLP | 2005年 | 無損壓縮編解碼器;支持高達4位字長的44.1 kHz至192 kHz采樣頻率;支持高達18 Mbit / s的可變數據速率。比Dolby Digital Plus更高的比特率。藍光光盤通道最多支持八個通道的96 kHz / 24位音頻;最高192 kHz / 24位的六個通道(5.1);?2至6通道支持最高192 kHz / 24位最大比特率,最高18 Mbit / s。 | / |
| 不適用 | 2009年 | 擴展到PLIIx。加上前置高度通道,可將立體聲,杜比環繞聲或離散5.1 / 6.1 / 7.1解碼為7.1高度或完整9.1。 | L,C,R,Ls,Rs,Lrs(左后),Rrs(右后),LFE,Lvh和Rvh |
一、Dolby AC3
1、什么是AC3
AC3(Audio Code number 3),支持從單聲道到5.1聲道。它提供5個全帶寬聲道(3Hz~20000Hz),又稱為3/2配置,3個前置聲道(左、中、右),外加2個環繞聲道。除此之外,還有第六個重低音聲道(3Hz~120Hz),也稱為"低音增強聲道"(LFE)。因此,我們習慣把它稱為5.1聲道,其聲道分布如下圖所示:
2、AC3編碼原理
像MP3、AAC一樣,AC3利用聲音的掩蔽特性,使用改進的離散余弦變換(MDCT)進行壓縮。輸入的PCM采樣數據必須是32kHz、44.1kHz或者48kHz,而且是20bits。
AC3編碼如上圖所示包括采樣、量化、編碼,具體分為以下6個步驟:
? ? 1) 將音頻的表示從PCM時間樣本序列(時域)轉換為頻率系數塊序列(頻域),屬于有損壓縮。把512個時間樣本重疊塊乘以時間窗口,并且變換為頻域。由于塊重疊,每個PCM輸入樣本用兩個連續塊表示。然后頻域除以2,使得每個塊包含256個頻率系數。
? ? 2) 這組指數被編碼成信號頻譜,稱為頻譜包絡。
? ? 3) 核心位分配例程使用該頻譜包絡,該例程決定使用多少位編碼每個尾數。
? ? 4) 尾數根據位分配信息來量化。
? ? 5) 將6個音頻塊(1536個音頻樣本)的頻譜包絡和量化尾數轉換為AC3幀。
? ? 6) AC3比特流(從32到640kbps)是AC3幀的序列。
3、AC3幀結構
AC3幀包含:同步字、循環冗余校驗、采樣率、框碼、比特流識別、比特流模式、編碼方式、中心混合水平、環繞聲混合水平、環繞模式等字段,如下表所示:
| ? ? ? ? ? ?16 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?0x0B77,數據傳輸采用大端 |
| ? ? ? ? ? ?16 | |
| ? ? ? ? ? ? 2 | ? ? ? ? ? ? ? ? ? ? ? ?'11'=保留'10'= 32 kHz'01'= 44.1'00'= 48 |
| ? ? ? ? ? ? 6 | |
| ? ? ? ? ? ? 5 | |
| ? ? ? ? ? ? 3 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '000'=主音頻服務 |
| ? ? ? ? ? ? 3 | ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? '010'=左右聲道排序 |
| ? ? ? ? ? ? 2 | |
| ? ? ? ? ? ? 2 | |
| ? ? ? ? ? ? 2 | ? ? ? ? ? ? ? ? ? '00'=未表示'01'=未環繞編碼'10'=是,環繞編碼 |
4、AC3解碼過程
AC3解碼過程是編碼的逆過程,如下圖所示:
解碼流程如下圖所示:
二、Dolby AC3 Plus
AC3 Plus又稱為E-AC3,在AC3基礎上進行改進增強。支持更大范圍的碼率(32kb/s~6144kb/s),支持更多聲道。杜比數字(AC-3)支持多達五個全帶寬音頻聲道的最大比特率為640 kbit / s,E-AC-3支持多達15個全帶寬音頻通道,最大比特率為6.144Mb/s。
1、技術參數
E-AC3技術參數如下:
- 編碼比特率:0.032至6.144 Mbit / s
- 音頻聲道:1.0到15.1(即從單聲道到15個全音域通道和一個低頻聲道)
- 每個位流的音頻節目數:8
- 采樣率:32、44.1或48 kHz
- 三、Dolby AC4
2、結構
E-AC3由一個或多個子流組成,子流有三種類型:
- 獨立的子流,可包含多達5.1個頻道的單個節目。杜比數字+(Dolby Digital Plus)流中最多可以存在八個從屬子流。獨立子流中的聲道僅限于傳統的5.1聲道:左(L),右(R),中(C),左環繞(Ls)和右環繞(Rs)聲道,以及低頻效果(Lfe)聲道。
- 傳統子流包含單個5.1程序,直接對應于杜比數字內容。DD +流中最多只能有一個舊式子流。
- 從屬子流,其中包含傳統5.1通道以外的其他聲道。由于從屬子流具有與獨立子流相同的結構,因此每個從屬子流最多可包含五個全帶寬信道和一個低頻信道;但是,這些聲道可以分配給不同的揚聲器位置。子流中的元數據描述了每個包含的聲道的用途。
3、語法
E-AC3是16位對齊的協議,其音頻流是固定長度同步幀數據包的集合,每個數據包都對應于256、512、768或1536個連續的時域音頻樣本。(1536個樣本的情況是最常見的情況,對應于杜比數字(Dolby Digital);較短的子幀長度旨在用于交互式應用(如視頻游戲),其中減少編碼器延遲是一個重要問題。每個同步幀都是可獨立解碼的,并且屬于服務內的特定子流。同步幀由以下語法元素組成:
- 一個16位同步字,其值為0x0b77。
- 比特流信息(BSI)部分,其中包括關鍵元數據,例如幀大小,比特流標識符(指定使用的語法的版本),通道模式,子流標識符,編碼的對話級別(dialnorm)以及用于指導的元數據解碼器產生縮混。
- 音頻幀部分,包含同步幀中所有音頻塊共有的解碼信息,包括確定如何打包指數和尾數的必要信息。
- 一,二,三或六個音頻塊部分。這些部分包含其他解碼元數據,以及編碼和量化的頻率系數。每個音頻塊對應于每個通道中的256個PCM樣本。
- 最后一部分包含用戶定義的輔助數據,產生統一同步幀長度的任何必要填充以及用于錯誤檢測的16位循環冗余校驗碼。
三、Dolby AC4
AC4可以包含音頻聲道和音頻對象,已經被DVB(數字電視廣播)采用,并被ETSI標準化。AC4最多可具有5.1個核心音頻聲道,所有杜比AC4都需要對這些音頻聲道進行解碼。其他音頻聲道可以被編碼為輔助信號,解碼器可以選擇支持這些附加信號,從而變成7.1聲道。其中低比特率使用高級聯合信號信道編碼(A-JCC),高比特率使用高級耦合(A-CPL)。A-JCC不支持輔助信號,并且僅限于5.1聲道音頻,而A-CPL支持輔助信號。與E-AC3相比,AC4的比特率降低了50%。
四、Dolby TrueHD
與AC3、E-AC3、AC4不同的是,Dolby TrueHD是無損壓縮,主要用于藍光光盤。杜比TrueHD提供多達16個離散音頻聲道,每個聲道的采樣率高達192kHz,采樣深度高達24位。TrueHD攜帶元數據用來修改其對音頻數據解析的非音頻信息,可以包括音頻規范化或動態范圍壓縮。
五、Dolby Atmos
Dolby Atmos杜比全景聲,通過增加高度聲道擴展現有的環繞聲系統,從而可以將聲音解析為三維對象。杜比全景聲允許將多達128個聲道分配給影院,以便根據影院的功能揚聲器提供最佳的動態渲染。它可以在傳統的5.1和7.1布局上構建。對于杜比全景聲,其命名稍有不同:7.1.4杜比全景聲,帶有四個頭頂式或啟用杜比全景聲的揚聲器。
參考鏈接:
Dolby Digital:?https://en.wikipedia.org/wiki/Dolby_Digital
Dolby DIgital Plus:?https://en.wikipedia.org/wiki/Dolby_Digital_Plus
Dolby AC-4:?https://en.wikipedia.org/wiki/Dolby_AC-4
Dolby TrueHD:?https://en.wikipedia.org/wiki/Dolby_TrueHD
AC3協議:http://www.atsc.org/wp-content/uploads/2015/03/A52-201212-17.pdf
可以到GitHub一起學習音視頻:https://github.com/xufuji456/FFmpegAndroid???????
總結
以上是生活随笔為你收集整理的走进音视频的世界——杜比音效之AC3与AC4的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 电阻(电阻器)总结
- 下一篇: electron build报错,nsi