視頻編碼標準的發(fā)展:從H.261到H.264
2004/11/30
數字視頻技術(shù)廣泛應用于通信、計算機、廣播電視等領(lǐng)域,帶來(lái)了會(huì )議電視、可視電話(huà)及數字電視、媒體存儲等一系列應用,促使了許多視頻編碼標準的產(chǎn)生。ITU-T與ISO/IEC是制定視頻編碼標準的兩大組織,ITU-T的標準包括H.261、H.263、H.264,主要應用于實(shí)時(shí)視頻通信領(lǐng)域,如會(huì )議電視;MPEG系列標準是由ISO/IEC制定的,主要應用于視頻存儲(DVD)、廣播電視、因特網(wǎng)或無(wú)線(xiàn)網(wǎng)上的流媒體等。兩個(gè)組織也共同制定了一些標準,H.262標準等同于MPEG-2的視頻編碼標準,而最新的H.264標準則被納入MPEG-4的第10部分。
本文按照ITU-T視頻編碼標準的發(fā)展過(guò)程,介紹H.261、H.263及H.264。
H.261視頻編碼標準
H.261是ITU-T為在綜合業(yè)務(wù)數字網(wǎng)(ISDN)上開(kāi)展雙向聲像業(yè)務(wù)(可視電話(huà)、視頻會(huì )議)而制定的,速率為64kb/s的整數倍。H.261只對CIF和QCIF兩種圖像格式進(jìn)行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來(lái)處理。
H.261是最早的運動(dòng)圖像壓縮標準,它詳細制定了視頻編碼的各個(gè)部分,包括運動(dòng)補償的幀間預測、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。
H.263視頻編碼標準
H.263是最早用于低碼率視頻編碼的ITU-T標準,隨后出現的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。
H.263視頻壓縮標準
H.263是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標準。它是在H.261基礎上發(fā)展起來(lái)的,其標準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運動(dòng)補償,并增加了4種有效的壓縮編碼模式。
無(wú)限制的運動(dòng)矢量模式允許運動(dòng)矢量指向圖像以外的區域。當某一運動(dòng)矢量所指的參考宏塊位于編碼圖像之外時(shí),就用其邊緣的圖像象素值來(lái)代替。當存在跨邊界的運動(dòng)時(shí),這種模式能取得很大的編碼增益,特別是對小圖像而言。另外,這種模式包括了運動(dòng)矢量范圍的擴展,允許使用更大的運動(dòng)矢量,這對攝像機運動(dòng)特別有利。
基于句法的算術(shù)編碼模式使用算術(shù)編碼代替霍夫曼編碼,可在信噪比和重建圖像質(zhì)量相同的情況下降低碼率。
先進(jìn)的預測模式允許一個(gè)宏塊中4個(gè)8×8亮度塊各對應一個(gè)運動(dòng)矢量,從而提高了預測精度;兩個(gè)色度塊的運動(dòng)矢量則取這4個(gè)亮度塊運動(dòng)矢量的平均值。補償時(shí),使用重疊的塊運動(dòng)補償,8×8亮度塊的每個(gè)象素的補償值由3個(gè)預測值加權平均得到。使用該模式可以產(chǎn)生顯著(zhù)的編碼增益,特別是采用重疊的塊運動(dòng)補償,會(huì )減少塊效應,提高主觀(guān)質(zhì)量。
PB-幀模式規定一個(gè)PB-幀包含作為一個(gè)單元進(jìn)行編碼的兩幀圖像。PB-幀模式可在碼率增加不多的情況下,使幀率加倍。
H.263視頻壓縮標準版本2
ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標準的版本2,非正式地命名為H.263+標準。它在保證原H.263標準核心句法和語(yǔ)義不變的基礎上,增加了若干選項以提高壓縮效率或改善某方面的功能。原H.263標準限制了其應用的圖像輸入格式,僅允許5種視頻源格式。H.263+標準允許更大范圍的圖像輸入格式,自定義圖像的尺寸,從而拓寬了標準使用的范圍,使之可以處理基于視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。
為提高壓縮效率,H.263+采用先進(jìn)的幀內編碼模式;增強的PB-幀模式改進(jìn)了H.263的不足,增強了幀間預測的效果;去塊效應濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀(guān)質(zhì)量。
為適應網(wǎng)絡(luò )傳輸,H.263+增加了時(shí)間分級、信噪比和空間分級,對在噪聲信道和存在大量包丟失的網(wǎng)絡(luò )中傳送視頻信號很有意義;另外,片結構模式、參考幀選擇模式增強了視頻傳輸的抗誤碼能力。
H.263++視頻壓縮標準
H263++在H263+基礎上增加了3個(gè)選項,主要是為了增強碼流在惡劣信道上的抗誤碼性能,同時(shí)為了提高增強編碼效率。這3個(gè)選項為:
選項U——稱(chēng)為增強型參考幀選擇,它能夠提供增強的編碼效率和信道錯誤再生能力(特別是在包丟失的情形下),需要設計多緩沖區用于存貯多參考幀圖像。
選項V——稱(chēng)為數據分片,它能夠提供增強型的抗誤碼能力(特別是在傳輸過(guò)程中本地數據被破壞的情況下),通過(guò)分離視頻碼流中DCT的系數頭和運動(dòng)矢量數據,采用可逆編碼方式保護運動(dòng)矢量。
選項W——在H263+的碼流中增加補充信息,保證增強型的反向兼容性,附加信息包括:指示采用的定點(diǎn)IDCT、圖像信息和信息類(lèi)型、任意的二進(jìn)制數據、文本、重復的圖像頭、交替的場(chǎng)指示、稀疏的參考幀識別。
H.264視頻編碼標準
H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標準。事實(shí)上,H.264標準的開(kāi)展可以追溯到8年前。1996年制定H.263標準后,ITU-T的視頻編碼專(zhuān)家組(VCEG)開(kāi)始了兩個(gè)方面的研究:一個(gè)是短期研究計劃,在H.263基礎上增加選項(之后產(chǎn)生了H.263+與H.263++);另一個(gè)是長(cháng)期研究計劃,制定一種新標準以支持低碼率的視頻通信。長(cháng)期研究計劃產(chǎn)生了H.26L標準草案,在壓縮效率方面與先期的ITU-T視頻壓縮標準相比,具有明顯的優(yōu)越性。2001年,ISO的MPEG組織認識到H.26L潛在的優(yōu)勢,隨后ISO與ITU開(kāi)始組建包括來(lái)自ISO/IEC
MPEG與ITU-T VCEG的聯(lián)合視頻組(JVT),JVT的主要任務(wù)就是將H.26L草案發(fā)展為一個(gè)國際性標準。于是,在ISO/IEC中該標準命名為AVC(Advanced
Video Coding),作為MPEG-4標準的第10個(gè)選項;在ITU-T中正式命名為H.264標準。H.264的主要優(yōu)點(diǎn)如下:
在相同的重建圖像質(zhì)量下,H.264比H.263+和MPEG-4(SP)減小50%碼率。
對信道時(shí)延的適應性較強,既可工作于低時(shí)延模式以滿(mǎn)足實(shí)時(shí)業(yè)務(wù),如會(huì )議電視等;又可工作于無(wú)時(shí)延限制的場(chǎng)合,如視頻存儲等。
提高網(wǎng)絡(luò )適應性,采用“網(wǎng)絡(luò )友好”的結構和語(yǔ)法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復能力。
在編/解碼器中采用復雜度可分級設計,在圖像質(zhì)量和編碼處理之間可分級,以適應不同復雜度的應用。
相對于先期的視頻壓縮標準,H.264引入了很多先進(jìn)的技術(shù),包括4×4整數變換、空域內的幀內預測、1/4象素精度的運動(dòng)估計、多參考幀與多種大小塊的幀間預測技術(shù)等。新技術(shù)帶來(lái)了較高的壓縮比,同時(shí)大大提高了算法的復雜度。
4×4整數變換
以前的標準,如H.263或MPEG-4,都是采用8x8的DCT變換。H.26L中建議的整數變換實(shí)際上接近于4×4的DCT變換,整數的引入降低了算法的復雜度,也避免了反變換的失配問(wèn)題,4×4的塊可以減小塊效應。而H.264的4×4整數變換進(jìn)一步降低了算法的復雜度,相比H.26L中建議的整數變換,對于9b輸入殘差數據,由以前的32b降為現在的16b運算,而且整個(gè)變換無(wú)乘法,只需加法和一些移位運算。新的變換對編碼的性能幾乎沒(méi)有影響,而且實(shí)際編碼略好一些。
基于空域的幀內預測技術(shù)
視頻編碼是通過(guò)去除圖像的空間與時(shí)間相關(guān)性來(lái)達到壓縮的目的。空間相關(guān)性通過(guò)有效的變換來(lái)去除,如DCT變換、H.264的整數變換;時(shí)間相關(guān)性則通過(guò)幀間預測來(lái)去除。這里所說(shuō)的變換去除空間相關(guān)性,僅僅局限在所變換的塊內,如8×8或者4×4,并沒(méi)有塊與塊之間的處理。H.263+與MPEG-4引入了幀內預測技術(shù),在變換域中根據相臨塊對當前塊的某些系數做預測。H.264則是在空域中,利用當前塊的相臨象素直接對每個(gè)系數做預測,更有效地去除相臨塊之間的相關(guān)性,極大地提高了幀內編碼的效率。
H.264基本部分的幀內預測包括9種4×4亮度塊的預測、4種16×16亮度塊的預測和4種色度塊的預測。
運動(dòng)估計
H.264的運動(dòng)估計具有3個(gè)新的特點(diǎn):1/4象素精度的運動(dòng)估計;7種大小不同的塊進(jìn)行匹配;前向與后向多參考幀。
H.264在幀間編碼中,一個(gè)宏塊(16×16)可以被分為16×8、8×16、8×8的塊,而8×8的塊被稱(chēng)為子宏塊,又可以分為8×4、4×8、4×4的塊。總體而言,共有7種大小不同的塊做運動(dòng)估計,以找出最匹配的類(lèi)型。與以往標準的P幀、B幀不同,H.264采用了前向與后向多個(gè)參考幀的預測。半象素精度的運動(dòng)估計比整象素運動(dòng)估計有效地提高了壓縮比,而1/4象素精度的運動(dòng)估計可帶來(lái)更好的壓縮效果。
編碼器中運用多種大小不同的塊進(jìn)行運動(dòng)估計,可節省15%以上的比特率(相對于16×16的塊)。運用1/4象素精度的運動(dòng)估計,可以節省20%的碼率(相對于整象素預測)。多參考幀預測方面,假設為5個(gè)參考幀預測,相對于一個(gè)參考幀,可降低5%~10%的碼率。以上百分比都是統計數據,不同視頻因其細節特征與運動(dòng)情況而有所差異。
熵編碼
H.264標準采用的熵編碼有兩種:一種是基于內容的自適應變長(cháng)編碼(CAVLC)與統一的變長(cháng)編碼(UVLC)結合;另一種是基于內容的自適應二進(jìn)制算術(shù)編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進(jìn)行當前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要復雜一些。
去塊效應濾波器
H.264標準引入了去塊效應濾波器,對塊的邊界進(jìn)行濾波,濾波強度與塊的編碼模式、運動(dòng)矢量及塊的系數有關(guān)。去塊效應濾波器在提高壓縮效率的同時(shí),改善了圖像的主觀(guān)效果。
其他視頻編碼標準
除上述ITU-T的視頻壓縮標準外,還有一些標準也比較流行,如MPEG-4、AVS、WM9。
H.264也稱(chēng)為MPEG-4 AVC,而目前業(yè)內所說(shuō)的MPEG-4一般是指SP(簡(jiǎn)級)或ASP(先進(jìn)的簡(jiǎn)級),主要針對低碼率應用,如因特網(wǎng)上的流媒體、無(wú)線(xiàn)網(wǎng)的視頻傳輸及視頻存儲等,其核心類(lèi)似于H.263。
M PEG-4 SP和H.263有很多相似的地方,如附表所示。然而,這兩個(gè)標準之間也有顯著(zhù)的不同,主要表現在:碼流結構和頭信息、熵編碼的部分碼表、編碼技術(shù)的一些細節。MPEG-4
ASP較SP增加了一些技術(shù),主要有:1/4象素精度的運動(dòng)估計、B幀、全局運動(dòng)矢量(GMV),因而壓縮效率得以提高。
AVS是由我國自主制定的音/視頻編碼技術(shù)標準,主要面向高清晰度電視、高密度光存儲媒體等應用。AVS標準以當前國際上最先進(jìn)的MPEG-4 AVC/H.264框架為基礎,強調自主知識產(chǎn)權,同時(shí)充分考慮了實(shí)現的復雜度。相對于H.264,AVS的主要特點(diǎn)有:(1)8×8的整數變換與64級量化;(2)亮度和色度幀內預測都是以8×8塊為單位,亮度塊采用5種預測模式,色度塊采用4種預測模式;(3)采用16×16、16×8、8×16和8×8
4種塊模式進(jìn)行運動(dòng)補償;(4)在1/4象素運動(dòng)估計方面,采用不同的四抽頭濾波器進(jìn)行半象素插值和1/4象素插值;(5)P幀可以利用最多2幀的前向參考幀,而B(niǎo)幀采用前后各一個(gè)參考幀。
Window Meida 9(WM9)是微軟公司開(kāi)發(fā)的新一代數字媒體技術(shù)。一些測試表明,WM9的視頻壓縮效率比MPEG-2、MPEG-4 SP及H.263高很多,而與H.264的壓縮效率相當。
結束語(yǔ)
目前,H.261與H.263在視頻通信中廣泛應用,成熟的產(chǎn)品已經(jīng)很多。H.263與H.261相比,增加了若干選項,提供了更靈活的編碼方式,壓縮效率大大提高,更適應網(wǎng)絡(luò )傳輸。H.264標準的推出,是視頻編碼標準的一次重要進(jìn)步,它與現有的MPEG-2、MPEG-4
SP及H.263相比,具有明顯的優(yōu)越性,特別是在編碼效率上的提高,使之能用于許多新的領(lǐng)域。盡管H.264的算法復雜度是現有編碼壓縮標準的4倍以上,隨著(zhù)集成電路技術(shù)的快速發(fā)展,H.264的應用將成為現實(shí)。
中寬網(wǎng)
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
建德市|
襄垣县|
礼泉县|
集安市|
山阳县|
泗洪县|
昌图县|
讷河市|
杨浦区|
正宁县|
西城区|
绥滨县|
莆田市|
凤山县|
巴南区|
荣昌县|
云和县|
北安市|
孟连|
永德县|
秭归县|
南投县|
天柱县|
定陶县|
潞城市|
拉萨市|
宁波市|
江津市|
清原|
广丰县|
绿春县|
昌吉市|
北宁市|
临海市|
临沭县|
安宁市|
镇坪县|
枣强县|
永嘉县|
灵璧县|
玉田县|
http://444
http://444
http://444
http://444
http://444
http://444