定量評估IP電話(huà) 語(yǔ)音質(zhì)量
美國Ameritec公司北京辦事處首席代表 崔建平
2001/03/29
據一些主要IP設備制造廠(chǎng)家的預測,到2005年,全球將有接近50%的用戶(hù)通過(guò)互聯(lián)網(wǎng)打電話(huà)。而IP電話(huà)技術(shù)將語(yǔ)音的傳輸與Internet
結合起來(lái)(即VoIP),使Internet 與現有的PSTN綜合形成語(yǔ)音/數據/視頻的多媒體信息網(wǎng)絡(luò )。
本文的目的在于從語(yǔ)音質(zhì)量這一根本性的指標分析入手,對IP電話(huà)網(wǎng)絡(luò )中影響語(yǔ)音質(zhì)量的主要因素作定量分析,并介紹其測量方法,以便對全面評估IP電話(huà)網(wǎng)絡(luò )的性能提供一些參考建議。
IP電話(huà)網(wǎng)絡(luò )的結構
所謂IP電話(huà),即將模擬語(yǔ)音信號通過(guò)特定的處理方式轉換成數據包信號,然后再將這些數據包通過(guò)分組交換網(wǎng)(如Internet、幀中繼或ATM)傳輸,在接收端還原為模擬信號,從而完成整個(gè)通話(huà)過(guò)程。

圖1 VoIP網(wǎng)絡(luò )的典型結構
圖1所示為一典型的IP電話(huà)網(wǎng)絡(luò )。
圖中,A、B、C、D均為普通電話(huà)用戶(hù),其中“A”為主叫,“A”呼叫“B”。電話(huà)用戶(hù)的語(yǔ)音信號傳遞的路徑為:主叫用戶(hù)語(yǔ)音信號→PSTN→
網(wǎng)關(guān)(Gate Way) / 路由器 (Router)→分組交換網(wǎng)→網(wǎng)關(guān)→PSTN→被叫用戶(hù)。
網(wǎng)關(guān)(Gate Way) 網(wǎng)關(guān)是在PSTN和分組交換網(wǎng)之間傳輸呼叫的器件,包括語(yǔ)音編碼器、回音抑制器、靜音抑制、收/發(fā)緩存器和分組交換網(wǎng)的排序管理等部分,如圖2所示。

圖2 網(wǎng)關(guān)結構圖
網(wǎng)關(guān)主要有二項功能:一是呼叫的管理,即根據需要完成PSTN和分組交換網(wǎng)之間雙向的信令轉換;二是呼叫的處理,即要將PSTN的語(yǔ)音信號按照在分組交換網(wǎng)中傳輸所需要的格式打包,以便完成雙向的信息傳輸。
路由器 路由器實(shí)際上是一臺工作在第3層的特殊用途的計算機,是分組交換網(wǎng)中用于將呼叫信號送達到指定地址的器件。路由器從網(wǎng)關(guān)接收地址信息,確認其有效性(如空閑、忙、已注銷(xiāo)、未開(kāi)通等)后,選擇合適的路由。一旦呼叫建立,路由器將打包后的語(yǔ)音信號傳遞至指定地址。
IP電話(huà)語(yǔ)音質(zhì)量的測試
IP電話(huà)中存在的語(yǔ)音質(zhì)量問(wèn)題,是普通電話(huà)網(wǎng)中不存在的特殊問(wèn)題。能否對IP電話(huà)語(yǔ)言質(zhì)量進(jìn)行定量的分析測量,并依據測量結果,對VoIP網(wǎng)絡(luò )中各器件進(jìn)行調整,使其達到最佳的語(yǔ)音質(zhì)量,已成為決定VoIP生存發(fā)展的必要條件。
衡量語(yǔ)音質(zhì)量的四個(gè)重要因素是延時(shí)(Delays)、丟包 (Dropout)、抖動(dòng) (Jitter)和沿切割 (Clipping)。
根據測試經(jīng)驗和人體工程學(xué)的理論分析,若使VoIP的語(yǔ)音質(zhì)量接近普通電話(huà),單向延時(shí)的指標最好小于100ms,最大不能超過(guò)250ms,丟包率不能超過(guò)5%,而抖動(dòng)和前后沿切割則越小越好,通常小于20ms。
隨著(zhù)VoIP技術(shù)的發(fā)展,人們不斷尋求測試IP電話(huà)語(yǔ)言質(zhì)量的方法,以便能規范VoIP設備的技術(shù)標準。最初ITU-T P.800提出了MOS
(Mean Objection Score)的方法,即請40至60個(gè)有代表性的人士來(lái)聽(tīng)一段相同的語(yǔ)音樣本,然后對該樣本經(jīng)過(guò)VoIP傳輸后的語(yǔ)音質(zhì)量進(jìn)行投票評價(jià),這是一種純粹主觀(guān)的定性評估。ITU-T選取在非常寬的聽(tīng)覺(jué)范圍內,根據不同年齡、性別和語(yǔ)言組別的得分,做出語(yǔ)音質(zhì)量的判別。判別標準有5級:
5 = 最佳
4 = 好 (4.5~4.0 =可收費電信級)
3 = 中級(4.0~3.5 =可通話(huà)通信級)
2 = 較差(3.5~2.5 =可建立連接級)
1 = 差
很顯然,MOS方法是一種模糊的評估方法,其測試結果很難對VoIP系統的改進(jìn)和不同VoIP設備之間性能的比較,作出有實(shí)際意義的判別。因此,有人提出借用ITU-T
在P.861 中建議的 PSQM (Perceptual Speech Quality Measurement)方法。
PSQM仍以MOS的5個(gè)級別作為標準,所不同的是其對每一個(gè)級別都以百分比的方式做出了差對最差(%PoW =Percent Poor
or Worse)和好對最好(%GoB = Percent Good or Better)的進(jìn)一步描述。PSQM方法并未擺脫原始的人類(lèi)主觀(guān)評估,只是作了進(jìn)一步的說(shuō)明。目前,有人使用計算機產(chǎn)生波形文件(Wave
File),通過(guò)比較其通過(guò)網(wǎng)絡(luò )傳輸前后的變化,計算出與PSQM中相對應的級別及好壞程度,以此作為評估語(yǔ)音質(zhì)量的方法。
PSQM不能準確給出影響VoIP網(wǎng)絡(luò )語(yǔ)音質(zhì)量的各因素的量值,因為波形文件不能代表各種不同年齡、性別、語(yǔ)言的人類(lèi)語(yǔ)音通過(guò)Vo2P網(wǎng)絡(luò )時(shí)的真實(shí)情況,而單音頻信號在通過(guò)語(yǔ)音編碼器后本身就會(huì )產(chǎn)生畸變。同時(shí),在具體測試中必須在波形文件信號返回后,才可進(jìn)行比較,這樣就根本無(wú)法測量網(wǎng)絡(luò )端到端的單向延時(shí)。無(wú)論電路交換還是分組交換網(wǎng)絡(luò ),其傳輸特性都與業(yè)務(wù)量密切相關(guān)的。在一定話(huà)務(wù)負載下的語(yǔ)言質(zhì)量數據才有實(shí)際意義。而使用PSQM方法,通常只能在一個(gè)E1里做1~2個(gè)話(huà)路的測試,以此來(lái)代表該E1中的語(yǔ)音質(zhì)量,其結果顯然并不符合實(shí)際的用戶(hù)通話(huà)情況,因此,亦不能做為評價(jià)網(wǎng)絡(luò )QoS的指標數據。
VoIP技術(shù)的發(fā)展迫切需要一種能定量分析測量其影響語(yǔ)音質(zhì)量的4個(gè)指標的方法和相應的儀器設備。
IP電話(huà)網(wǎng)絡(luò )存在的問(wèn)題
與普通電話(huà)網(wǎng)比較,VoIP網(wǎng)絡(luò )采用語(yǔ)音壓縮編碼,用數據包的形式在分組交換網(wǎng)上傳遞,因此傳輸線(xiàn)路的時(shí)空利用率得到大幅度的提高,這就是IP電話(huà)較普通電話(huà)話(huà)費便宜的主要原因。與此同時(shí),VoIP遇到的通話(huà)性能(特別是語(yǔ)音質(zhì)量)問(wèn)題也是傳統電話(huà)不曾涉及的。
網(wǎng)關(guān)或路由器內部的語(yǔ)音編碼器對帶內音頻信號進(jìn)行打包和重組。這些器件對確認接收和有效數據包接收的順序進(jìn)行糾錯檢查。一旦發(fā)現錯誤,將命令重發(fā),而重發(fā)相關(guān)數據包則不可避免地造成傳輸上的延時(shí)。網(wǎng)關(guān)或路由器上的緩存器
(Buffer) 就是為容納這些延時(shí)的數據包而設置的。一般地講,緩存器的容量越大,數據包被損壞的幾率就越小,但同時(shí)延時(shí)就會(huì )增大,這是一對矛盾,需要系統設計者和管理者來(lái)綜合平衡,選擇最佳的配置。圖3顯示出了VoIP網(wǎng)絡(luò )中延時(shí)的分布情況。

圖3 VoIP網(wǎng)絡(luò )中時(shí)延的分布
在激烈的市場(chǎng)競爭中,QoS (Quality of Service) 是每一個(gè)電信運營(yíng)商刻意追求的指標。事實(shí)上,目前利用IP電話(huà)的用戶(hù)都會(huì )遇到通話(huà)過(guò)程中隨時(shí)出現令人難以忍受的語(yǔ)音畸變和頻繁的斷話(huà)現象。而產(chǎn)生語(yǔ)音質(zhì)量惡化的原因主要在網(wǎng)絡(luò )延時(shí)、丟包、沿切割和抖動(dòng)。
非常明顯,在VoIP網(wǎng)絡(luò )中影響語(yǔ)音質(zhì)量的因素是由其結構決定的特殊問(wèn)題,而且各因素之間存在著(zhù)此消彼長(cháng)的制約關(guān)系。因此,根據電信網(wǎng)絡(luò )服務(wù)質(zhì)量(QoS)
的要求,建立一套客觀(guān)評估標準,并對VoIP網(wǎng)絡(luò )的語(yǔ)音服務(wù)質(zhì)量進(jìn)行定量分析和測量,就成為當務(wù)之急。
測試典型方案
針對VoIP網(wǎng)絡(luò )的特點(diǎn)和對其語(yǔ)音質(zhì)量測試的要求,國際許多測試儀器設備制造廠(chǎng)家都投入了大量資源進(jìn)行研究開(kāi)發(fā),并取得了階段性成果。美國Ameritec公司在長(cháng)期從事電路交換語(yǔ)音測試和模擬語(yǔ)音傳輸損耗測試
(TIMS) 研究的理論基礎上,開(kāi)發(fā)了用于分組交換系統測試的專(zhuān)利技術(shù)——“ Golden Voice ”。
“Golden Voice”是一個(gè)寬帶復合音調發(fā)生器,它由24種不同頻率、幅度、占空比的單音信號混合調制產(chǎn)生,以確保可靠地通過(guò)所有現代的語(yǔ)音編碼器和譯碼器(如G.711、G.728、G.729、GSM、CDMA等)。
“Golden Voice”可以作為測試音源,配置在模擬呼叫發(fā)生器上,當語(yǔ)音路由建立以后,由呼叫發(fā)生器將“Golden Voice”送出,同時(shí)對其所帶的間隔為1.25ms時(shí)標進(jìn)行計數,從而精確地測量出VoIP網(wǎng)絡(luò )的單向時(shí)延、回路時(shí)延、丟包、抖動(dòng)、沿切割等指標,如圖4所示。目前可以提供的VoIP測試功能及指標如下:
1.丟包測量 (Dropout Measurement)
語(yǔ)音丟包檢測器可以連續地測量每一個(gè)語(yǔ)音通道的音頻能量,對檢測出的由于打包或幀丟失引起的超過(guò)5ms的丟包進(jìn)行計數,并可對不同長(cháng)度的丟包進(jìn)行統計。
2.前后沿切割測量(Leading and Trailing Edge Clipping Measurement)

圖4 測試解決方案
檢測網(wǎng)關(guān)中相應部件對從靜音到講話(huà)和從講話(huà)到靜音之間的過(guò)渡狀態(tài)的響應。
3.抖動(dòng)測量 (Jitter Measurement)
檢測瞬間的時(shí)序變化,±5ms分辨力。
4.單向和回路延時(shí)測量(One-way and Round-trip Delay Measurement)
各音頻通道獨立檢測,單向±5ms分辨力,回路±10ms分辨力。
不難看出,以上指標測試的精確度和分辨力與“Golden Voice”信號源中的時(shí)標精度直接相關(guān),但如與VoIP最好語(yǔ)音質(zhì)量效果指標比較,目前的量值已經(jīng)足夠了。
測試過(guò)程分析
1. 丟包測試
圖5所示的是丟包測試的時(shí)序圖, 圖中的語(yǔ)音路由測試信號即為“Golden Voice”產(chǎn)生的復合語(yǔ)音信號。在測試中,用戶(hù)可以自行設定分別為5ms、10ms、15ms、25ms、50ms或100ms檢測門(mén)限值。
一旦呼叫建立后,被叫即將測試音信號送至主叫,而主叫將檢測該信號通過(guò)VoIP后的狀態(tài)變化。
圖5 中“ a”處,雖然出現丟包現象,但由于其時(shí)間間隔小于設定門(mén)限20ms,故在測試中忽略不計。“ b”處出現一個(gè)為20ms的丟包,則計數一次。“c”處出現總長(cháng)200ms的丟包,則計數器按20ms
值的整數倍統計為10次。在圖5中,我們檢測出在這次呼叫中共出現了11次丟包。
2. 沿切割、抖動(dòng)和丟包測試
在分組交換網(wǎng)中,沿切割、抖動(dòng)和丟包通常是相伴而出的,其產(chǎn)生的根源都在語(yǔ)音編碼器,因此,該三項指標可以在一次測量中完成。可以在不少于12個(gè)測試信號周期內選擇不同的脈沖占空比(如25%、50%、75%或100%)以補償在“靜音”時(shí)有可能產(chǎn)生的丟包。測試如下:
·建立呼叫
·被叫應答

圖5 丟包時(shí)序圖
·被叫送測試信號到主叫
·主叫調整脈沖電平
·主叫與測試信號同步
·一旦電平調整與同步完成,開(kāi)始檢測抖動(dòng)、前沿切割、后沿切割及丟包
3.延時(shí)測量
單向延時(shí)測量過(guò)程如下:
·主叫發(fā)起呼叫
·被叫應答

圖6 抖動(dòng)及沿切割的影響
·被叫送出長(cháng)度為100ms的帶有時(shí)標標記的測試音信號到主叫
·主叫檢測收到的信號,并對時(shí)標進(jìn)行測量,分辨力±5ms
·呼叫完成后,儀器中DSP將測量數據輸出到LGC存儲
·回路延時(shí)測量依此類(lèi)推,分辨力變?yōu)椤?0ms
這套測試方案是建立在給VoIP網(wǎng)絡(luò )施加大話(huà)務(wù)量負載的背景下實(shí)現的。首先,被測系統必須達到預定的接通率指標;在指定的話(huà)路數和指定的話(huà)務(wù)量下,得出被測設備的延時(shí)、丟包、抖動(dòng)、沿切割指標的平均值、最大值、最小值等綜合統計報告。
《賽迪市場(chǎng)專(zhuān)家》
2001/03/29
|