MPEG-4 AVC/H.264 信息
本FAQ由(haibara)翻譯,期間受到kaito_mkid(pcicp)幫助,在此感謝,由于Newbie的關(guān)系,如有翻譯錯誤,還請各位指出,由Doom9的bond編撰的原文。
譯者注:基本專業(yè)名稱我都以小括號形式加以解釋,詳細(xì)信息請自行查閱資料。
什么是MPEG-4?
MPEG-4(ISO 14496)是由制定了我們熟知的MPEG-1(MP3, VCD)和MPEG-2(DVD, SVCD)標(biāo)準(zhǔn),并力于使各種音頻/視頻壓縮格式和更多內(nèi)容標(biāo)準(zhǔn)化的國際標(biāo)準(zhǔn)化組織(International Organization for Standardization/ISO)的工作組,即運動圖像專家組(Moving Picture Experts Group/MPEG)發(fā)展的廣泛的開放標(biāo)準(zhǔn)。
本質(zhì)上MPEG-4標(biāo)準(zhǔn)不僅把目標(biāo)定為標(biāo)準(zhǔn)化某些有發(fā)展前途的產(chǎn)品(例如達(dá)到DVD性能),而且含蓋了一個能讓產(chǎn)品供應(yīng)商根據(jù)需要選擇適當(dāng)標(biāo)準(zhǔn)去執(zhí)行的廣泛的次級標(biāo)準(zhǔn)。
MPEG-4標(biāo)準(zhǔn),如上所說,被分成許多不同的次級標(biāo)準(zhǔn),在Doom9里我們使用者可能最感興趣的部分如下:
- ISO 14496-1(Systems/系統(tǒng)),動畫/交互性(類DVD菜單)
- ISO 14496-2(Video/視頻),如Advanced Simple Profile(ASP/高級簡單類),由XviD, DivX5, 3ivx...執(zhí)行
- ISO 14496-3(Audio/音頻),Advanced Audio Coding(AAC/先進(jìn)音頻編碼)
- ISO 14496-10(Video/視頻),Advanced Video Coding(AVC/進(jìn)階視頻編碼),著名有H.264
- ISO 14496-14(Container/容器),MP4容器格式(使用.mp4作擴(kuò)展名)
- ISO 14496-17(Subtitles/字幕),MPEG-4時標(biāo)文本字幕格式
這些信息頁面正力于提供這些標(biāo)準(zhǔn)的大部分有用的信息,尤其是作為焦點的MPEG-4 ASP和AVC/H.264。
與封閉格式如Micro$oft的Windows Media相比,象MPEG-4一樣的開放標(biāo)準(zhǔn)有什么可能的優(yōu)勢?
開放標(biāo)準(zhǔn)的一個好處是當(dāng)創(chuàng)建產(chǎn)品時允許向所有人開放并遵循它。因此我們已經(jīng)有許多不同的符合MPEG-4標(biāo)準(zhǔn)并可互相兼容的產(chǎn)品。
其次是互通性和大范圍的產(chǎn)品選擇性,一個開放標(biāo)準(zhǔn)導(dǎo)致競爭,對顧客而言這意味著產(chǎn)品在競爭市場中能更好地提高品質(zhì),更少的價格和更關(guān)注顧客需求。
但不要忘記這也許對我們來說最重要的一點:
一個開放標(biāo)準(zhǔn)允許開源發(fā)展,例如我們熟知的XviD。
ISO 14496-10 (Video) - 進(jìn)階視頻編碼(Advanced Video Coding/AVC)
有著AVC/H.264的MPEG-4標(biāo)準(zhǔn)定義了一個擁有最新,最高技術(shù)的實用的,充滿尖端科技的視頻編碼格式。2003年,ISO的MPEG(Moving Pictures Experts Group/運動圖像專家組)與聯(lián)合國(United Nations/UNO)下設(shè)的ITU(International Telecommunication Union/國際電信聯(lián)盟)的VCEG(Video Coding Experts Group/視頻編碼專家組)這2大組織最終完成并共同規(guī)定了AVC/H.264視頻編碼標(biāo)準(zhǔn),其中后者曾標(biāo)準(zhǔn)化H.263格式(現(xiàn)主用于視頻會議)。
AVC/H.264標(biāo)準(zhǔn)它自身是由MPEG和VCEG的專家構(gòu)成的Joint Video Team(JVT/聯(lián)合視頻組)發(fā)展的。
由MPEG來看,該標(biāo)準(zhǔn)被叫做MPEG-4 Part 10(ISO 14496-10);由ITU來看,它叫做H.264(ITU的公文號) 其中作為后者已廣泛流傳開來。
新標(biāo)準(zhǔn)選擇Advanced Video Coding(AVC/進(jìn)階視頻編碼)作為“官方”名 - 因為對應(yīng)視頻的音頻格式是Advanced Audio Coding(AAC/先進(jìn)音頻編碼)。
AVC/H.264 Profile
AVC/H.264定義了4種不同的Profile(類):Baseline(基線類), Main(主要類), Extended(擴(kuò)展類)和High Profile(高端類)(它們各自下分成許多個層):
- Baseline Profile 提供I/P幀,僅支持progressive(逐行掃描)和CAVLC
- Extended Profile 提供I/P/B/SP/SI幀,僅支持progressive(逐行掃描)和CAVLC
- Main Profile 提供I/P/B幀,支持progressive(逐行掃描)和interlaced(隔行掃描),提供CAVLC或CABAC
- High Profile (也就是FRExt)在Main Profile基礎(chǔ)上新增:8x8 intra prediction(8x8 幀內(nèi)預(yù)測), custom quant(自定義量化), lossless video coding(無損視頻編碼), 更多的yuv格式(4:4:4...)
只有未來會告訴我們哪一種框架和工具最可能被用于DVD備份,但是我猜想會是有著以下的工具大力幫助的Main和/或High Profile(同樣請核實MPEG-4 ASP的工具描述,除了GMC,所有的工具在AVC下都是可用的):
CAVLC/CABAC:
AVC/H.264定義了2種先進(jìn)的重構(gòu)數(shù)據(jù)流(包括macroblock-type(宏塊), motionvectors(運動矢量) + reference-index(參考索引)...)的熵編碼工具,一舉超越MPEG-4 ASP:
Context-Adaptive Variable Length Coding(CAVLC/上下文自適應(yīng)變長編碼)和 Context-Adaptive Binary Arithmetic Coding(CABAC/上下文自適應(yīng)二進(jìn)制算術(shù)編碼)
CABAC,與AVC/H.264中只是默認(rèn)算法的CAVLC(也叫UVLC)相比,是個壓縮率更強大的算法,據(jù)說能額外降低10-15%的比特率(特別在高碼率)。CABAC(同CAVLC一樣)是一種無損算法,因此不會降低質(zhì)量,但會減緩編碼和解碼速度。
Loop/Deblocking Filter(循環(huán)/去塊濾波器):
與預(yù)處理濾波器(例如通過avisynth作用于輸入端),或后處理濾波器(通過解碼器作用于最終輸出端)相反,循環(huán)濾波器在編碼過程中對每楨進(jìn)行濾波,編碼完成后被用于下一楨的參考。它能消除塊效應(yīng),尤其在低碼率時,但同樣會減緩編碼和解碼速度。
Variable Block Sizes/Macroblock Partitions(塊大小可變/宏塊劃分):
與MPEG-4 ASP(僅Inter4V/4MV能作16x16和8x8塊變換)相比,AVC/H.264把動態(tài)搜尋精度(Motion Search Precision)提高到4x4(包含的步驟有8x4...)。子塊大小是自適應(yīng)/可變的,一個優(yōu)秀的編碼器應(yīng)能對每個宏塊明智地作出最恰當(dāng)?shù)膭澐执笮?決定。
Multiple Reference Frames(多重參考楨):
與MPEG-4 ASP(僅允許當(dāng)前楨的前一楨作為參考楨)相比,AVC/H.264使用幀間搜索方式并提供成倍的參考楨選擇,它意味著AVC/H.264編碼能決定是否 只是簡單地參考前一楨或甚至參考比前楨更過去的楨。因此(例如某個P楨能參考最近I楨前的某楨)不得不提出一種新型楨型:IDR楨,是種其后的楨不允許參 考其前的楨的I楨。使用多重參考楨會減慢編碼和解碼速度并且可能導(dǎo)致只能在IDR楨剪切。
Weighted Prediction(加權(quán)預(yù)測):
有了加權(quán)預(yù)測就能對參考楨進(jìn)行加權(quán)(例如你能測量前一幅圖象的亮度程度)。它特別有助于在那些隨時可能淡入或淡出的場景中前后圖象極為相似,只是畫面變暗 的圖象的處理。WP對于同時出現(xiàn)淡入及淡出的圖象沒有效果(例如當(dāng)圖象從一個場景轉(zhuǎn)到另一個場景就會同時出現(xiàn)淡入及淡出)。
Rate Distortion Optimisation(RDO/碼率-失真/損耗最佳化):
只要編碼器不得不在眾多選擇中作出絕擇時,RDO允許選擇最有效的編碼方式(例如面臨采用楨間/楨內(nèi)的動態(tài)搜尋的決定...)
RDO不是AVC/H.264本身定義的工具,它是第一個由H.264參考軟件引入的工具,可謂一種新的途徑。其他的編碼也能利用RDO,如XviD'的VHQ模式能使用RDO
AVC/H.264與其他流行的視頻編碼格式的比較測評:
?
現(xiàn)有的AVC/H.264編碼
可用于終端用戶的AVC/H.264執(zhí)行者有x264, Nero, Apple, Sorenson, Elecard, Moonlight, VSS, mpegable, Envivio, Hdot264 (binary), DSPR, JM (參考軟件) (binary), ffmpeg, Philips, FastVDO, Skal, Sony和更多
編碼器
- x264:第一個公開的可使用High Profile的編碼器,開源(GPL)(源碼),使用VFW的有:x264vfw, ffdshow(輸出.avi),命令行的:x264cli(輸出raw的.mp4), mencoder(輸出raw的.avi)(Doom9的MeGUI)或ffmpeg
x264支持2pass, CABAC, 循環(huán)濾波, 多重B幀, 雙向參考(B-Reference), 多重參考楨, 4x4 P幀塊變換, 8x8 B幀塊劃分, 失真信號化(anamorphic signalling)和High Profile:8x8 dtc(離散余弦變換)與幀內(nèi)預(yù)測, 無損視頻編碼和自定義無損量化矩陣(custom quant matrix)
- NeroDigital AVC:Nero Recode2內(nèi)含,輸出為.mp4
ND AVC支持2pass, CABAC, 自適應(yīng)循環(huán)濾波, 多重B幀, 多重參考楨, 加權(quán)預(yù)測, 8x8 B幀塊劃分, 16x16 B幀塊劃分, 自適應(yīng)量化(高度Psy)
- Sorenson:Sorenson Squeeze 4內(nèi)含,輸出.mp4,
Sorenson支持2pass, 最大2連續(xù)B幀, 雙向參考, 循環(huán)濾波和多重Slice
- Apple:Quicktime 7內(nèi)含,輸出.mp4, .3gp和.mov,編碼速度很慢
支持2pass, 最大1連續(xù)B幀, 循環(huán)濾波(0,0), 8x8 P幀塊變換, 8x8 B幀塊變換, 4x4 I幀塊變換, 自適應(yīng)量化, 5級Slice, 沒有CABAC, 沒有加權(quán)預(yù)測, 沒有多重參考楨
- JM: 此AVC參考軟件v9.3版提供Main和High Profile:B/SP幀, CABAC, 循環(huán)濾波器, 4x4 塊劃分, 多重參考楨, 自適應(yīng)量化, 差錯修復(fù)(Error Resilience), RDO, 無損視頻編碼, 自定義量化), 比率控制(Rate Control)等...
- Hdot264:由doom9會員charact3r發(fā)展的開源(GPL)的VFW版參考軟件,仍然以很老的參考軟件(JM 4.0c)為基礎(chǔ)
- VSS:免費的VFW編碼器(可預(yù)覽5天),以參考編碼器為基礎(chǔ)
- Elecard: Elecard Mobile Converter內(nèi)含,輸出.mp4, MainConcept's v2 encoder也內(nèi)含,輸出.264和.mpg PS/TS
不再公開的:
- Moonlight:Moonlight的OneClick Compressor v1.1和CyberLink的PowerEncoder內(nèi)含,輸出.mpg
Moonlight支持1pass(VBR/CBR/預(yù)設(shè) 量化), CABAC, 循環(huán)濾波, 最大2連續(xù)B幀, 8x8 B幀塊劃分, 自適應(yīng)量化, 自動調(diào)整PAR(Pixel Aspect Ratio/象素縱橫比), 隔行掃描
- MainConcept:免費的編碼器(有水印),輸出.264和.mpg PS/TS
1pass(CBR/VBR/預(yù)設(shè) 量化), P幀重排(P-Frame Reorder), CABAC, 循環(huán)濾波, 多重B-Vops(Bidirectional Video Object Planes/雙向視頻對象平面), 多重參考楨, 4x4 P幀塊劃分), PAR, RDO
- mpegable:提供試用有限的免費VFW編碼器(不以參考軟件為基礎(chǔ)),不支持YV12
mpegable支持僅限P幀的1pass(預(yù)設(shè)量化), 8x8 P幀塊劃分, 只支持CAVLC, 循環(huán)濾波
- Envivio:4Coder內(nèi)含,輸出.mp4
解碼器 (比較測評)
- ffmpeg:開源(LGPL),包含在ffdshow(VFW和DShow編碼器), mplayer和VideoLAN等
支持B幀, 雙向參考, CABAC, 循環(huán)濾波, 加權(quán)預(yù)測和High Profile (8x8 dct與幀內(nèi)預(yù)測, 無損視頻編碼)
- Apple:Quicktime 7支持AVC解碼,支持.mp4/.mov,解碼速度很慢
僅支持最大1連續(xù)B幀, CABAC, 不作后幀參考的循環(huán)濾波, 多重B幀和隔行掃描
- NeroDigital AVC:Recode2附帶DShow解碼器和.mp4 Parser
支持Main和High Profile
- VSS:VFW解碼器 (預(yù)覽5天) 和DShow解碼器 (限制30天)
VSS DShow支持.avi (支持VSSH和H264 fourcc), CABAC, 循環(huán)濾波, B幀
- Elecard:Elecard's MPEG Player v4.0和MainConcept's v2 encoder內(nèi)含
- Envivio:有個名叫EnvivioTV的非免費AVC DShow解碼器,(從2.0版開始,當(dāng)前版本為2-1-181)支持混合AVC的.mp4
- Philips:AVC Alliance播放器內(nèi)含免費的DShow AVC解碼器(只支持raw AVC)
- FastVDO:有時間限制(每個視頻文件5分鐘)的High Profile DShow解碼器
- Pegasus:這里有發(fā)展不成熟的DShow AVC解碼器
- Basic AVC Decoder用C編寫,是一所大學(xué)的工程,見這里
不再公開的:
- Moonlight:DShow解碼器/Parser支持混合AVC的.mpg, .mp4和.264 Moonlight's MPEG Player v3.0內(nèi)含
支持Main和High Profile
- MainConcept:v1預(yù)覽版提供免費DShow AVC解碼器(有水印) 并且Parser支持AVC和.mpg PS/TS
- mpegable:提供試用有限的VFW解碼器 (可用于DShow),支持.avi (支持 DAVC fourcc)
預(yù)覽樣本
NeroDigital:mp4, mp4
Sorenson:mp4
AVC Alliance:raw
Moonlight:raw/中碼率, raw/低碼率, raw, mpg
FastVDO:raw/high profile
Apple:mov
Videosoft: avi, avi/新, avi/老
Lead:ogm
當(dāng)前AVC/H.264的爭論
- 互通性:大多數(shù)執(zhí)行者支持多種容器格式:
.mp4:由MPEG-4標(biāo)準(zhǔn)(ISO 14496-15)定義的AVC容器,Apple, Nero, Sorenson, Envivio, Elecard/Moonlight和x264都支持
.mpg PS/TS:由MPEG-2標(biāo)準(zhǔn)(ISO 13818-1, AMD3)定義的AVC容器,Mainconcept和Elecard/Moonlight支持
.avi:采取AVC-in-AVI的方式非標(biāo)準(zhǔn),因此會造成不兼容問題。AVI和VFW的局限(如關(guān)于B幀或任意幀的編碼順序),混合這兩種格式混合會完全阻礙AVC提供的所有可能特性的執(zhí)行,因此可能降低質(zhì)量,或至少降低處理速度和互通性,其競爭性也因此下降。當(dāng)前VSS和x264(mencoder 和vfw)支持使用AVI
.264/.h264:未混合入容器的原始數(shù)據(jù)流。JM參考軟件, x264cli, mencoder和mainconcept都可輸出
- 速度:當(dāng)前一些執(zhí)行者編碼器速度不敢恭維,依然只有x264和NeroDigital's AVC的編碼器看上去能提供不俗的速度與品質(zhì)。但這不會改變AVC是種先進(jìn)的視頻編碼方式的事實。所以老的CPU編解碼AVC會非常耗時
MPEG-4 AVC/H.264的硬件應(yīng)用化 - HD-DVD/藍(lán)光(Blu-ray)
DVD論壇(DVD Forum)和藍(lán)光光盤協(xié)會(Blu-ray Disc Association)正在討論能支持高清晰(High Definition)內(nèi)容(存儲容量完全超過當(dāng)前的DVD)下一代DVD格式的繼承人選:HD-DVD和BD-ROM
據(jù)這里報道HD-DVD會強制采用MPEG-4 AVC/H.264,而藍(lán)光支持老早被MPEG-4 AVC/H.264 High Profile納入-這里
因此AVC/H.264極有可能成為下一代視頻格式,會被廣泛地使用和支持,就象今天MPEG-2(用于DVD)的情形一樣
更多的文檔
關(guān)于MPEG-4 AVC/H.264的文檔:詳細(xì)說明-這里,摘要信息-這里或這里,
執(zhí)行者清單
AVC的測試結(jié)論參看這里
下載完整的AVC/H.264標(biāo)準(zhǔn)詳述這里(Draft from the 7-14 March 2003)
藍(lán)光的技術(shù)信息參看這里
總結(jié)
以上是生活随笔為你收集整理的MPEG-4 AVC/H.264 信息的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android—Binder+AIDL
- 下一篇: Android—Window、Windo