音頻、視頻常用的幾種壓縮技術(shù)標準
2008/02/20
MPEG-4視頻編碼技術(shù)介紹
MPEG是“Moving Picture Experts Group”的簡(jiǎn)稱(chēng),在它之前的標準叫做JPEG,即“Joint
Photographic Experts Group”。當人們用到常見(jiàn)的“.jpg”格式時(shí),實(shí)際上正在使用JPEG的標準。JPEG規范了現代視頻壓縮的基礎,而MPEG把JPEG標準擴展到了運動(dòng)圖象。
MPEG-4視頻編碼標準支持MPEG-1、MPEG-2中的大多數功能,它包含了H.263的核心設計,并增加了優(yōu)先特性和各種各樣創(chuàng )造性的新特性。它提供不同的視頻標準源格式、碼率、幀頻下矩形圖像的有效編碼,同時(shí)也支持基于內容的圖像編碼。采納了基于對象(Object-Based)的編碼、基于模型(Model-based)的編碼等第二代編碼技術(shù)是MPEG-4標準的主要特征。
MPEG4與MPEG1、MPEG2的比較
標準 |
幅面 |
幀率 |
帶寬 |
應用領(lǐng)域 |
MPEG-1 |
352x24 或 320x240 |
24-30 fps |
1.5 Mbps |
Video CD, CD-ROM |
MPEG-2 |
720x24 或 640x480 |
24-30 fps |
4-8 Mbps |
DTV,HDTV,DVD-Video |
MPEG-4 |
34x48 ~ 4096x4096 |
1-30+fps |
10Kbps~10Mbps |
互聯(lián)網(wǎng)及無(wú)線(xiàn)傳輸,交互式電視 |
從上表可以看出,MPEG1和MPEG2主要應用于固定媒體,比如 VCD 和 DVD ,而對于網(wǎng)絡(luò )傳輸,MPEG4具有無(wú)可比擬的優(yōu)勢。
H.263/H.263+/H.264視頻編碼技術(shù)介紹
H.263視頻編碼標準
H.263 是最早用于低碼率視頻編碼的ITU-T標準,隨后出現的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。H.263是
ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標準。它是在H.261基礎上發(fā)展起來(lái)的,其標準輸入圖像格式可以是S-QCIF、QCIF、
CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。H.263與H.261相比采用了半象素的運動(dòng)補償,并增加了4種有效的壓縮編碼模式。
H.263+視頻壓縮標準
ITU-T在H.263發(fā)布后又修訂發(fā)布了H.263標準的版本2,非正式地命名為H.263+標準。它在保證原H.263標準核心句法和語(yǔ)義不變的基礎上,增加了若干選項以提高壓縮效率或改善某方面的功能。原H.263標準限制了其應用的圖像輸入格式,僅允許5種視頻源格式。H.263+標準允許更大范圍的圖像輸入格式,自定義圖像的尺寸,從而拓寬了標準使用的范圍,使之可以處理基于視窗的計算機圖像、更高幀頻的圖像序列及寬屏圖像。為提高壓縮效率,
H.263+采用先進(jìn)的幀內編碼模式;增強的PB-幀模式改進(jìn)了H.263的不足,增強了幀間預測的效果;去塊效應濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀(guān)質(zhì)量。為適應網(wǎng)絡(luò )傳輸,H.263+增加了時(shí)間分級、信噪比和空間分級,對在噪聲信道和存在大量包丟失的網(wǎng)絡(luò )中傳送視頻信號很有意義;另外,片結構模式、參考幀選擇模式增強了視頻傳輸的抗誤碼能力。
H.264視頻壓縮標準
H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標準。對信道時(shí)延的適應性較強,既可工作于低時(shí)延模式以滿(mǎn)足實(shí)時(shí)業(yè)務(wù),如會(huì )議電視等;又可工作于無(wú)時(shí)延限制的場(chǎng)合,如視頻存儲等。
提高網(wǎng)絡(luò )適應性,采用“網(wǎng)絡(luò )友好”的結構和語(yǔ)法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復能力。
在編/解碼器中采用復雜度可分級設計,在圖像質(zhì)量和編碼處理之間可分級,以適應不同復雜度的應用。
相對于先期的視頻壓縮標準,H.264引入了很多先進(jìn)的技術(shù),包括4×4整數變換、空域內的幀內預測、1/4象素精度的運動(dòng)估計、多參考幀與多種大小塊的幀間預測技術(shù)等。新技術(shù)帶來(lái)了較高的壓縮比,同時(shí)大大提高了算法的復雜度。
G.7xx系列典型語(yǔ)音壓縮標準介紹
G.7xx 是一組 ITU-T 標準,用于視頻壓縮和解壓過(guò)程。它主要用于電話(huà)方面。在電話(huà)學(xué)中,有兩個(gè)主要的算法,分別定義在
mu-law 算法(美國使用)和 a-law 算法(歐洲及世界其他國家使用),兩者都是對數關(guān)系,但對于計算機的處理來(lái)說(shuō),后者的設計更為簡(jiǎn)單。
國際電信聯(lián)盟G系列典型語(yǔ)音壓縮標準的參數比較:
算法 | 類(lèi)型 | 碼率(kbit/s) | 算法延時(shí)(ms) |
G.711 | A-Law / μ -Law | 64 | 0 |
G.722 | SB-ADPCM | 64/56/48 | 0 |
G.723.1 | MP-MLQ/ACELP | 6.3/5.3 | 37.5 |
G.726 | ADPCM | 16/24/32/40 | 0 |
G.727 | Embedded ADPCM | 16/24/32/40 | 0 |
G.728 | LD-CELP | 16 | < 2 |
G.729 | CS-ACELP | 8 | 15 |
在國際標準中,統一使用 MOS(Mean Opinion Score)方法評價(jià)語(yǔ)音壓縮后的質(zhì)量。在MOS方法中,電話(huà)語(yǔ)音質(zhì)量的標準定為4分。也就是說(shuō),如果一種算法將語(yǔ)音壓縮后,MOS
值能達到4分,即說(shuō)明其語(yǔ)音質(zhì)量和電話(huà)質(zhì)量等同,用戶(hù)無(wú)法分辨出其中的區別。
Global IP Sound(簡(jiǎn)稱(chēng)GIPS)
Global IP Sound(簡(jiǎn)稱(chēng)GIPS),是瑞典一家全球頂級的專(zhuān)業(yè)從事語(yǔ)音編解碼引擎的技術(shù)公司。是一家位于瑞典斯德戈爾摩的高技術(shù)上市公司,成立于1999年,目前只有25位員工,但卻擁有世界上最頂尖的語(yǔ)音處理和IP電話(huà)技術(shù)專(zhuān)家:其公司CTO,Roar
Hagen博士,1989年即進(jìn)入語(yǔ)音處理行業(yè)從事開(kāi)發(fā)工作,在世界知名的AT&T貝爾實(shí)驗室、愛(ài)立信研究院工作。他本人發(fā)明了超過(guò)10項技術(shù)專(zhuān)利。
Jan Linden博士,在語(yǔ)音處理和通訊領(lǐng)域從業(yè)12年。在加入Global IP Sound之前,Jan Linden博士在加州大學(xué)和SingnalCom公司供職。Patrik
Srqvist,自1995年開(kāi)始從事語(yǔ)音處理和VoIP研究開(kāi)發(fā)工作,之前在愛(ài)立信研究院工作。
就是這樣一家規模小同時(shí)卻擁有來(lái)自愛(ài)立信、 AT&T等電信行業(yè)巨頭的技術(shù)專(zhuān)家的公司,卻在VoIP引擎市場(chǎng)上取得了令人矚目的成就。GIPS
SoundWare能為端對端 IP 通信提供較 PSTN 質(zhì)量更佳的語(yǔ)音體驗及保真度,完全不會(huì )受數據包丟失的影響。
投影時(shí)代
我國手機電視標準亟需敲定 2007-10-09 |
《商業(yè)周刊》:移動(dòng)電視標準競爭愈演愈烈 2007-08-02 |
國際電信聯(lián)盟五大標準組織各有分工 2007-07-30 |
In-Stat:手機電視標準有可能融合 2007-07-24 |
手機電視困惑標準之爭 2007-06-13 |