首頁(yè)>>>技術(shù)>>>視像通信  視像通信產(chǎn)品

基于IP的H.264關(guān)鍵技術(shù)

2004/08/13

  一、 引言

  H.264是ITU-T最新的視頻編碼標準,被稱(chēng)作ISO/IEC14496-10或MPEG-4 AVC,是由運動(dòng)圖像專(zhuān)家組(MPEG)和ITU的視頻編碼專(zhuān)家組共同開(kāi)發(fā)的新產(chǎn)品。H.264分兩層結構,包括視頻編碼層和網(wǎng)絡(luò )適配層。視頻編碼層處理的是塊、宏塊和片的數據,并盡量做到與網(wǎng)絡(luò )層獨立,這是視頻編碼的核心,其中包含許多實(shí)現錯誤恢復的工具;網(wǎng)絡(luò )適配層處理的是片結構以上的數據,使H.264能夠在基于RTP/UDP/IP、H.323/M、MPEG-2傳輸和H.320協(xié)議的網(wǎng)絡(luò )中使用。

  二、 IP網(wǎng)絡(luò )對視頻壓縮的限制

  1. H.264的應用場(chǎng)合

  在討論基于IP的H.264之前,有必要先闡述一下H.264與IP網(wǎng)絡(luò )有關(guān)的應用場(chǎng)合及其對傳輸和編解碼器的要求。下面介紹對話(huà)應用、下載服務(wù)和流媒體應用三種場(chǎng)合。

  對話(huà)應用,比如像視頻電話(huà)和視頻會(huì )議,有嚴格的時(shí)延限制,要求端到端時(shí)延小于1s,最好小于100ms。編解碼器的參數能實(shí)時(shí)調整,錯誤恢復機制要根據實(shí)際網(wǎng)絡(luò )變化而改變。編解碼的復雜度不能很高,比如雙向預測的模式就不能被采用。

  下載服務(wù),可使用可靠的傳輸協(xié)議如FTP和HTTP將數據全部傳輸。由于這種應用的非實(shí)時(shí)性,編碼器可以通過(guò)優(yōu)化進(jìn)行高效編碼,而且對時(shí)延和錯誤恢復機制沒(méi)有要求。

  流媒體服務(wù)應用,對時(shí)延要求介于上面兩者之間,初始化時(shí)延是10s以?xún)取Ec實(shí)時(shí)編碼相比對時(shí)延要求降低,編碼器可以進(jìn)行優(yōu)化實(shí)現高效編碼(比如雙向預測)。然而通常流媒體服務(wù)使用不可靠的傳輸協(xié)議,所以編碼時(shí)要進(jìn)行差錯控制并進(jìn)行信道糾錯編碼。

  本文主要討論對話(huà)應用和流媒體應用,這兩種應用基于IP網(wǎng)絡(luò )。IP網(wǎng)絡(luò )又可分為三種類(lèi)型:不可控IP網(wǎng)絡(luò )(如Internet)、可控IP網(wǎng)絡(luò )(廣域網(wǎng))和無(wú)線(xiàn)IP網(wǎng)絡(luò )(如3G網(wǎng)絡(luò ))。這三種IP網(wǎng)絡(luò )有不同的最大傳輸單元尺寸(MTUsize)、比特出錯概率和TCP使用標記。最大傳輸單元尺寸是網(wǎng)絡(luò )層最大的分組長(cháng)度,H.264編碼時(shí)要使片的長(cháng)度小于MTU尺寸,這樣可避免在網(wǎng)絡(luò )層再進(jìn)行一次數據的分割。兩個(gè)IP節點(diǎn)之間的MTU尺寸是動(dòng)態(tài)變化的,通常假定有線(xiàn)IP網(wǎng)絡(luò )的MTU尺寸是1.5千字節,無(wú)線(xiàn)網(wǎng)絡(luò )的MTU尺寸是100字節。可見(jiàn)要適用于無(wú)線(xiàn)網(wǎng)絡(luò )的H.264必須采用數據分割技術(shù)使得片的長(cháng)度小于MTU尺寸。TCP傳輸控制協(xié)議能夠解決網(wǎng)絡(luò )擁塞引起的分組丟失問(wèn)題,而在無(wú)線(xiàn)網(wǎng)絡(luò )中,分組丟失是由于鏈路層錯誤引起的,TCP并非很好的解決辦法,要采用差錯控制協(xié)議。

  2. H.264使用的協(xié)議環(huán)境

  對話(huà)應用和流媒體應用使用同一協(xié)議組,下面進(jìn)行討論。

  網(wǎng)絡(luò )層協(xié)議:使用IP(網(wǎng)際協(xié)議)。每個(gè)IP分組單獨從發(fā)方出發(fā),經(jīng)過(guò)一系列的路由器到達收方。IP將大于MTU尺寸的分組進(jìn)行數據分割、重組。每個(gè)分組的傳輸時(shí)間都有所不同。IP頭20個(gè)字節由校驗碼來(lái)保證,但數據沒(méi)有保護。IP分組最大值為64千字節,但由于MTU尺寸的限制,一般沒(méi)有這么大。

  傳輸層協(xié)議:主要有兩個(gè)協(xié)議,TCP和UDP。TCP提供面向字節的可靠傳輸服務(wù),以重傳和超時(shí)等機制作為差錯控制的基礎。由于對時(shí)延的不可預測,并不適用于實(shí)時(shí)通信傳輸。UDP提供不可靠的數據報傳輸業(yè)務(wù)。UDP頭包含的校驗數(8字節)可以發(fā)現和去掉含有比特錯誤的分組。UDP允許分組傳輸過(guò)程中出現丟失、復制、改序等。使用UDP協(xié)議時(shí),高層必須使用錯誤恢復協(xié)議。

  應用層傳輸協(xié)議:使用RTP(實(shí)時(shí)傳輸協(xié)議)。該協(xié)議和IP/UDP結合使用,是面向會(huì )話(huà)的協(xié)議。每個(gè)RTP分組包含RTP頭標,載荷頭標(可選)和載荷本身。RTP頭標的內容見(jiàn)圖1,基本選項占用12字節,標記位標記有同一時(shí)間戳的一組分組的結束。RTP協(xié)議使發(fā)送方將數據分為大小合理的分組,并將解碼方觀(guān)察到的網(wǎng)絡(luò )特征反饋給發(fā)送方,使發(fā)送方可以動(dòng)態(tài)調整比特率和抗誤碼機制。RTP分組和RTP載荷規范在第四部分討論。

  應用層控制協(xié)議:有H.245協(xié)議、SIP和SDP,或RTSP。這些協(xié)議可以實(shí)現流媒體的控制,收發(fā)方的協(xié)商和控制動(dòng)態(tài)會(huì )話(huà)層。

  三、H.264的錯誤恢復工具

  錯誤恢復的工具隨著(zhù)視頻壓縮編碼技術(shù)的提高在不斷改進(jìn)。舊的標準(H.261、H263、MPEG-2的第二部分)中,使用片和宏塊組的劃分、幀內編碼宏塊、幀內編碼片和幀內編碼圖像來(lái)防止錯誤的擴散。之后改進(jìn)的標準(H.263+、MPEG-4)中,使用多幀參考和數據分割技術(shù)來(lái)恢復錯誤。H.264標準在以前的基礎上提出了三種關(guān)鍵技術(shù):(1)參數集合,(2) 靈活的宏塊次序(FMO),(3)冗余片(RS)來(lái)進(jìn)行錯誤的恢復。

  1. 幀內編碼

  H.264中幀內編碼的技術(shù)和以前標準一樣,值得注意的是:

  (1)H.264中的幀內預測編碼宏塊的參考宏塊可以是幀間編碼宏塊,幀內預測宏塊并不像H.263中的幀內編碼一樣,而采用預測的幀內編碼比非預測的幀內編碼有更好的編碼效率,但減少了幀內編碼的重同步性能,可以通過(guò)設置限制幀內預測標記來(lái)恢復這一性能。

  (2)只包含幀內宏塊的片有兩種,一種是幀內片(Islice),一種是立即刷新片(IDRslice),立即刷新片必存在于立即刷新圖像(IDRpicture)中。與短期參考圖像相比,立即刷新圖像有更強壯的重同步性能。

  在無(wú)線(xiàn)IP網(wǎng)絡(luò )環(huán)境下,為了提高幀內圖像的重同步性能,要采用率失真優(yōu)化編碼和設置限制幀內預測標記。

  2. 圖像的分割

  H.264支持一幅圖像劃分成片,片中宏塊的數目是任意的。在非FMO模式下,片中的宏塊次序是同光柵掃描順序,FMO模式下比較特殊。片的劃分可以適配不同的MTU尺寸,也可以用來(lái)交織分組打包。

  3. 參考圖像選擇

  參考圖像數據選擇,不論是基于宏塊、基于片,還是基于幀,都是錯誤恢復的有效工具。對于有反饋的系統,編碼器獲得傳輸中丟失圖像區域的信息后,參考圖像可以選擇解碼已經(jīng)正確接收的圖像對應的原圖像區域作參考。在沒(méi)有反饋的系統中,將會(huì )使用冗余的編碼來(lái)增加錯誤恢復性能。

  4. 數據的劃分

  通常情況下,一個(gè)宏塊的數據是存放在一起而組成片的,數據劃分使得一個(gè)片中的宏塊數據重新組合,把宏塊語(yǔ)義相關(guān)的數據組成一個(gè)劃分,由劃分來(lái)組裝片。在H.264中有三種不同的數據劃分。 (1)頭信息劃分:包含片中宏塊的類(lèi)型,量化參數和運動(dòng)矢量,是片中最重要的信息。 (2)幀內信息劃分:包含幀內CBPs和幀內系數,幀內信息可以阻止錯誤的蔓延。 (3)幀間信息劃分:包含幀間CBPs和幀間系數,通常比前兩個(gè)劃分要大得多。

  幀內信息劃分結合頭信息解出幀內宏塊,幀間信息劃分結合頭信息解出幀間宏塊。幀間信息劃分的重要性最低,對重同步?jīng)]有貢獻。當使用數據劃分時(shí),片中的數據根據其類(lèi)型被保存到不同的緩存,同時(shí)片的大小也要調整,使得片中最大的劃分小于MTU尺寸。

  解碼端若獲得所有的劃分,就可以完整重構片;解碼端若發(fā)現幀內信息或幀間信息劃分丟失,可用的頭信息仍然有很好的錯誤恢復性能。這是因為宏塊類(lèi)型和宏塊的運動(dòng)矢量含有宏塊的基本特征。

  5. 參數集的使用

  序列的參數集(SPS)包括了一個(gè)圖像序列的所有信息,圖像的參數集(PPS)包括了一個(gè)圖像所有片的信息。多個(gè)不同的序列和圖像參數集經(jīng)排序存放在解碼器。編碼器參考序列參數集設置圖像參數集,依據每一個(gè)已編碼片的片頭的存儲地址選擇合適的圖像參數集來(lái)使用。對序列的參數和圖像的參數進(jìn)行重點(diǎn)保護才能很好地增強H.264錯誤恢復性能。

  在差錯信道中使用參數集的關(guān)鍵是保證參數集及時(shí)、可靠地到達解碼端。例如,在實(shí)時(shí)信道中,編碼器用可靠控制協(xié)議及早將他們以帶外傳輸的方式發(fā)送,使控制協(xié)議能夠在引用新參數的第一個(gè)片到達之前把它們發(fā)給解碼器;另外一個(gè)辦法就是使用應用層保護,重發(fā)多個(gè)備份文件,確保至少有一個(gè)備份數據到達解碼端;第三個(gè)辦法就是在編解碼器的硬件中固化參數集設置。

  6. 靈活的宏塊次序(FMO)

  靈活的宏塊次序是H.264的一大特色,通過(guò)設置宏塊次序映射表(MBAmap)來(lái)任意地指配宏塊到不同的片組,FMO模式打亂了原宏塊順序,降低了編碼效率,增加了時(shí)延,但增強了抗誤碼性能。FMO模式劃分圖像的模式各種各樣,重要的有棋盤(pán)模式、矩形模式等。當然FMO模式也可以使一幀中的宏塊順序分割,使得分割后的片的大小小于無(wú)線(xiàn)網(wǎng)絡(luò )的MTU尺寸。經(jīng)過(guò)FMO模式分割后的圖像數據分開(kāi)進(jìn)行傳輸,以棋盤(pán)模式為例,當一個(gè)片組的數據丟失時(shí)可用另一個(gè)片組的數據(包含丟失宏塊的相鄰宏塊信息)進(jìn)行錯誤掩蓋。實(shí)驗數據顯示,當丟失率為(視頻會(huì )議應用時(shí))10%時(shí),經(jīng)錯誤掩蓋后的圖像仍然有很高的質(zhì)量。

  7. 冗余片方法

  前邊提到了當使用無(wú)反饋的系統時(shí),就不能使用參考幀選擇的方法來(lái)進(jìn)行錯誤恢復,應該在編碼時(shí)增加冗余的片來(lái)增強抗誤碼性能。要注意的是這些冗余片的編碼參數與非冗余片的編碼參數不同,也就是用一個(gè)模糊的冗余片附加在一個(gè)清晰的片之后。在解碼時(shí)先解清晰的片,如果其可用就丟棄冗余片;否則使用冗余模糊片來(lái)重構圖像。


  四、H.264中實(shí)時(shí)傳輸協(xié)議(RTP)

  1. RTP載荷規范

  在第二部分已經(jīng)對H.264的網(wǎng)絡(luò )協(xié)議環(huán)境作了闡述,這里要詳細討論RTP的載荷規范和抗誤碼性能。RTP通過(guò)發(fā)送冗余信息來(lái)減少接收端的丟包率,會(huì )增加時(shí)延,與冗余片不同的是它增加的冗余信息是個(gè)別重點(diǎn)信息的備份,適合于應用層的非等重保護。下邊闡述與多媒體傳輸有關(guān)的3個(gè)規范。

  (1)分組復制多次重發(fā),發(fā)送端對最重要的比特信息分組進(jìn)行復制重發(fā),使得保證接收端能至少正確接收到一次,同時(shí)接收端要丟棄已經(jīng)正確接收的分組的多余備份。

  (2)基于分組的前向糾錯,對被保護的分組進(jìn)行異或運算,將運算結果作為冗余信息發(fā)送到接收方。由于時(shí)延,不用于對話(huà)型應用,可用于流媒體。

  (3)音頻冗余編碼,可保護包括視頻在內的任何數據流。每個(gè)分組由頭標、載荷以及前一分組的載荷組成,H.264中可與數據分割一起使用。

  2. H.264 NAL單元的概念

  H.264 NAL單元對編碼數據進(jìn)行打包,NAL單元由1字節的頭,3個(gè)定長(cháng)的字段和一個(gè)字節數不定的編碼段組成。

  頭標的語(yǔ)法:NALU類(lèi)型(5bit)、重要性指示位(2bit)、禁止位(1bit)。

  NALU類(lèi)型:1~12由H.264使用,24~31由H.264以外的應用使用。

  重要性指示:標志該NAL單元用于重建時(shí)的重要性,值越大,越重要。

  禁止位:網(wǎng)絡(luò )發(fā)現NAL單元有比特錯誤時(shí)可設置該比特為1,以便接收方丟掉該單元。

  3. 分組打包的規則

  (1)額外開(kāi)銷(xiāo)要少,使MTU尺寸在100~64k字節范圍都可以;

  (2)不用對分組內的數據解碼就可以判別該分組的重要性;

  (3)載荷規范應當保證不用解碼就可識別由于其他的比特丟失而造成的分組不可解碼;

  (4)支持將NALU分割成多個(gè)RTP分組;

  (5)支持將多個(gè)NALU匯集在一個(gè)RTP分組中。

  RTP的頭標可以是NALU的頭標,并可以實(shí)現以上的打包規則。

  4. 簡(jiǎn)單打包

  一個(gè)RTP分組里放入一個(gè)NALU,將NALU(包括同時(shí)作為載荷頭標的NALU頭)放入RTP的載荷中,設置RTP頭標值。為了避免IP層對大分組的再一次分割,片分組的大小一般都要小于MTU尺寸。由于包傳送的路徑不同,解碼端要重新對片分組排序,RTP包含的次序信息可以用來(lái)解決這一問(wèn)題。

  5. NALU分割

  對于預先已經(jīng)編碼的內容,NALU可能大于MTU尺寸的限制。雖然IP層的分割可以使數據塊小于64千字節,但無(wú)法在應用層實(shí)現保護,從而降低了非等重保護方案的效果。由于UDP數據包小于64千字節,而且一個(gè)片的長(cháng)度對某些應用場(chǎng)合來(lái)說(shuō)太小,所以應用層打包是RTP打包方案的一部分。

  新的討論方案(IETF)應當符合以下特征:

  (1)NALU的分塊以按RTP次序號升序傳輸;

  (2)能夠標記第一個(gè)和最后一個(gè)NALU分塊;

  (3)可以檢測丟失的分塊。

  6. NALU合并

  一些NALU如SEI、參數集等非常小,將它們合并在一起有利于減少頭標開(kāi)銷(xiāo)。已有兩種集合分組:

  (1)單一時(shí)間集合分組(STAP),按時(shí)間戳進(jìn)行組合;

  (2)多時(shí)間集合分組(MTAP),不同時(shí)間戳也可以組合。

  五、結束語(yǔ)

  本文重點(diǎn)講述了在IP網(wǎng)絡(luò )的限制條件下H.264進(jìn)行錯誤恢復的幾種有力工具,但在不同的IP網(wǎng)絡(luò )中要組合使用各種工具才能實(shí)現高效率編碼和傳輸。因為目前無(wú)線(xiàn)網(wǎng)絡(luò )對MTU尺寸和時(shí)延的限制,所以錯誤恢復工具可以結合使用圖像的分割、數據的劃分和RTP分組技術(shù),避免使用冗余信息和反饋來(lái)提高錯誤恢復性能;另外高效率的FMO編碼模式可以大大提高編碼的抗分組丟失性能。

ChinaByte(e.chinabyte.com)—中國多媒體視訊


相關(guān)鏈接:
新一代視頻會(huì )議系統全面超越傳統視頻技術(shù) 2004-08-06
視頻會(huì )議系統全景掃描 2004-08-06
會(huì )議電視組網(wǎng)技術(shù)比較與分析 2004-08-06
ADSL如何承載視頻業(yè)務(wù) 2004-08-06
H.323電視會(huì )議系統終端的實(shí)現 2004-08-05

分類(lèi)信息:     文摘   技術(shù)_視像通訊_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 双牌县| 延长县| 茌平县| 湖州市| 连州市| 民勤县| 乐亭县| 行唐县| 会宁县| 手游| 渝中区| 柳江县| 广灵县| 中超| 新兴县| 皋兰县| 芮城县| 浦北县| 天镇县| 江源县| 承德县| 漠河县| 勐海县| 平罗县| 天等县| 韶关市| 安顺市| 巴青县| 金塔县| 加查县| 广水市| 泰顺县| 鸡东县| 宜君县| 海安县| 土默特右旗| 靖江市| 台东县| 宕昌县| 丽水市| 高淳县| http://444 http://444 http://444 http://444 http://444 http://444