基于E-Model的VoIP語(yǔ)音質(zhì)量測量方法
2007/04/20
摘要 基于E-Model的語(yǔ)音質(zhì)量測量方法是一種客觀(guān)測試方法,它克服了傳統語(yǔ)音質(zhì)量測試在數據網(wǎng)絡(luò )測量中的不足。為了能夠準確評估VoIP語(yǔ)音質(zhì)量,在E-Model算法的基礎之上,探討了延時(shí)、噪聲、回音、語(yǔ)音壓縮等損傷因素對VoIP語(yǔ)音質(zhì)量的影響。
1、引言
VoIP(Voice over IP),以IP分組交換網(wǎng)絡(luò )為傳輸平臺,對模擬的語(yǔ)音信號進(jìn)行壓縮、打包等一系列的特殊處理,使之可以采用無(wú)連接的UDP(User
Datagram Protocol)協(xié)議進(jìn)行傳輸[1]。近年來(lái),隨著(zhù)IP網(wǎng)絡(luò )技術(shù)的廣泛應用,VoIP成為一種新興的電話(huà)通信方式,IP網(wǎng)絡(luò )所提供的語(yǔ)音質(zhì)量問(wèn)題受到人們的普遍關(guān)注,如何對語(yǔ)音質(zhì)量進(jìn)行科學(xué)可靠的測量和評價(jià)是網(wǎng)絡(luò )測量和網(wǎng)絡(luò )規劃設計中十分關(guān)鍵的問(wèn)題。E-Model作為語(yǔ)音質(zhì)量測量的一種新方法,它適合數據網(wǎng)絡(luò )的語(yǔ)音質(zhì)量測量,必將有廣泛的應用。本文將在E模型下分析延時(shí)、噪聲、回音和語(yǔ)音壓縮等對VoIP語(yǔ)音質(zhì)量的影響。
2、基于E-Model的語(yǔ)音質(zhì)量評價(jià)
目前對IP電話(huà)業(yè)務(wù)語(yǔ)音質(zhì)量評分的評價(jià)分為主觀(guān)評價(jià)和客觀(guān)評價(jià)。主觀(guān)評價(jià)方法主要是MOS模型(平均評定得分法),還包括判斷滿(mǎn)意度測量等方法;客觀(guān)評價(jià)方法主要有PSQM模型(感知話(huà)音質(zhì)量測量法)、PAMS模型(感知分析測量法)、PESQ模型(感知話(huà)音評估法)和E-Model[2,3]。傳統的測量方式不是基于數據網(wǎng)絡(luò )的,不能反映延時(shí)、抖動(dòng)和丟包等數據網(wǎng)絡(luò )特有的問(wèn)題。
在ITU-T P.800中規定的平均主觀(guān)值MOS,基于該主觀(guān)評測把人接聽(tīng)和感知語(yǔ)音質(zhì)量的行為被調研和量化,接聽(tīng)到何種級別質(zhì)量的語(yǔ)音,就得到多少平均主觀(guān)值MOS。一般情況下MOS值是4或更高被認為是比較好的語(yǔ)音質(zhì)量,而若平均主觀(guān)值MOS低于3.6,則大部分接聽(tīng)者不能滿(mǎn)意語(yǔ)音質(zhì)量。平均主觀(guān)測試雖然準確有效,但是這種方法存在的最大問(wèn)題就是實(shí)現起來(lái)非常麻煩和昂貴,因此人們在不斷地探索能進(jìn)行客觀(guān)測量的方法。ITU-T的G.107標準提出的E模型考慮了延時(shí)、噪聲、回音、編碼器性能、丟包、抖動(dòng)等網(wǎng)絡(luò )損傷因素對語(yǔ)音質(zhì)量的影響。它的評價(jià)標準如圖1所示。
圖1 用戶(hù)滿(mǎn)意度等級與R值和MOS值的范圍對應表
根據ITU-T G.107的定義和實(shí)際測試所需的參數可以求出R的值。傳輸參數R的表達式為:
其中
(1)Ro表示基本的信噪比,Ro的表達式為:
其中,SLR表示發(fā)送端響度評測值,No表示不同噪聲源功率之和。
No的表達式為:
其中,Nc表示電路引起的所有哚聲功率之和,Nos表示發(fā)送端背景噪聲引起的電路噪聲,Nor表示接收端背景噪聲引起的電路噪聲,Nfo表示接收端的噪聲。影響Ro的主要因素包括:響度評測值(SLR,RLR),背景噪聲(Ps,Pr),電話(huà)延遲值(Ds,Dr),說(shuō)話(huà)者回音響度額定值(TELR)。
(2)Is表示語(yǔ)音實(shí)時(shí)傳輸所產(chǎn)生的同步損傷,Is的表達式為:
其中,Iolr表示是由太低的響度評測值所引起的質(zhì)量的下降,Ist表示是由非適宜的電話(huà)噪聲引起的損傷,Iq表示量化失真所造成的損傷。影響Is的主要因素有:響度評測值,背景噪聲,電話(huà)延遲值,說(shuō)話(huà)者回音響度額定值,單向延遲時(shí)間(T),量化失真度(qdu)。
(3)Id表示語(yǔ)音信號的延遲損傷,Id的表達式為:
其中,Idte表示發(fā)送端回音所造成的損傷,Idle表示接收端回音所造成的損傷,Idd表示太長(cháng)的絕對延遲所引起的損傷。影響Id的主要因素有:延遲,說(shuō)話(huà)者回音響度,背景噪聲,響度評測值等。
(4)Ie-eff表示低比特率編碼及丟包所造成的損傷,Ie-eff的表達式為:
其中Ie表示設備損傷因素,Bbl表示丟包主要因素,Ppl表示丟包率。
(5)A表示優(yōu)勢損傷因素,它是當有其它優(yōu)勢傳遞到用戶(hù)的一種補償,通常情況下設置為零[4]。
在E-Model測量中包含了影響窄帶電話(huà)通話(huà)質(zhì)量的多種傳輸參數,在ITU-T G.107中提供了一組默認值,當終端和應用環(huán)境是正常的,可以直接使用這些默認值。根據這些默認值和一些可求的參數比如延時(shí)、丟包率等可以得到E-Model輸出的傳輸參數R。R直越大,說(shuō)明語(yǔ)音質(zhì)量越好,R值的范圍是0-100,0是最差的,100是最好的。
平均主觀(guān)值MOS是1-5之間的數,1是語(yǔ)音質(zhì)量最差的,5是語(yǔ)音質(zhì)量最好的。R值可以通過(guò)下面的公式轉化成MOS分:
IP電話(huà)網(wǎng)絡(luò )損傷的主要因素包括延時(shí)、噪聲、回音、語(yǔ)音編碼和丟包[5,6]:
(1)延時(shí)(delay),指IP包從網(wǎng)絡(luò )入口點(diǎn)到達網(wǎng)絡(luò )出口點(diǎn)所需要的傳輸時(shí)間。如果在一個(gè)呼叫中包含不同的通路時(shí)間,則存在抖動(dòng),抖動(dòng)越大則語(yǔ)音質(zhì)量下降的越明顯。在E模型中采用固定緩沖區的方法,可以使抖動(dòng)的影響轉化為延時(shí)[7]。
(2)回音(echo),是由語(yǔ)音網(wǎng)絡(luò )中的電氣反射引起的,延時(shí)超過(guò)16 ms的回聲對說(shuō)話(huà)人會(huì )有影響。下文通過(guò)說(shuō)話(huà)者回音響度額定值(TELR),來(lái)檢測回音對語(yǔ)音質(zhì)量的影響。
(3)噪聲(noise),是影響語(yǔ)音質(zhì)量的一個(gè)關(guān)鍵因素,下文分別通過(guò)發(fā)送端背景噪聲Ps和接收端背景噪聲Pr來(lái)分析噪聲對語(yǔ)音質(zhì)量的影響。
(4)語(yǔ)音壓縮(Speech compression),在語(yǔ)音處理中語(yǔ)音編碼有很多種方式,每一種都有不同的特點(diǎn)。低速的編碼方式占用較少的帶寬,但是低速編碼使用有損的壓縮算法,削弱了語(yǔ)音質(zhì)量。仿真將采用標準為G.711、G.729
A、G.723.1的編碼方式,演示編碼對語(yǔ)音質(zhì)量的影響,其主要參數如表1所示。
表1 標準編碼器的主要參數
(5)丟包(Packet loss),是影響語(yǔ)音質(zhì)量的又一個(gè)關(guān)鍵因素。數據包發(fā)送端和接收端之間的數據包數目的差值即為網(wǎng)絡(luò )傳輸丟失包數目。當少量的丟包且是隨機地分布時(shí),人耳并不容易感覺(jué)到較差的語(yǔ)音質(zhì)量。當丟包數量變大時(shí),語(yǔ)音質(zhì)量也就相應的變差。
3、仿真結果
(1)圖2演示了延時(shí)和說(shuō)話(huà)者回音響度額定值(TELR)對R值的影響:時(shí)延在0~500 ms變化時(shí),相應的R值隨時(shí)延的增長(cháng)而降低,另外,從仿真結果也可以看出,TELR對R值的影響也是很大的,TELT=65
dB時(shí),R值隨延時(shí)變化的相對緩慢,隨著(zhù)TELR值的減小,R值隨延時(shí)的增加而迅速降低,且在相同的時(shí)延條件下,TELR越大,得到的R值也越大。
圖2 延時(shí)、回音額定值對R值的影響
(2)從圖3仿真結果可以看出語(yǔ)音編碼對R值的影響:選擇越低速率的編碼方式,得到的R值就越小。在實(shí)際情況中,選擇低速的編碼方式能夠在相同的連接上建立更多的呼叫,但是引入了更大的延時(shí),使語(yǔ)音質(zhì)量對丟包也更加敏感。如果需要很高的語(yǔ)音質(zhì)量,則意味著(zhù)只能使用64
kbit/s的G.711編碼方式。
圖3 語(yǔ)音編碼對R值的影響
(3)從圖4仿真結果可以看出,發(fā)送端背景噪聲Ps和接收端背景噪聲Pr對MOS值的影響:背景噪聲小于40 dB時(shí),對語(yǔ)音質(zhì)量沒(méi)有太大的影響,當背景噪聲大于40
dB,語(yǔ)音質(zhì)量會(huì )迅速下降。
圖4 噪聲對MOS值的影響
4、結束語(yǔ)
E-Model是一種語(yǔ)音質(zhì)量測量的新方法,在網(wǎng)絡(luò )規劃和語(yǔ)音監測方面有著(zhù)廣泛的應用。隨著(zhù)IP網(wǎng)絡(luò )和應用的迅猛發(fā)展,特別是隨著(zhù)NGN網(wǎng)絡(luò )的逐步應用,該網(wǎng)絡(luò )可以提供包括話(huà)音、數據和多媒體等各種業(yè)務(wù)。語(yǔ)音質(zhì)量測量是NGN網(wǎng)絡(luò )測試的一個(gè)重要方面,基于E-Model的語(yǔ)音質(zhì)量測量是對NGN網(wǎng)絡(luò )語(yǔ)音質(zhì)量測量的一種有效的方法,必定會(huì )有很好的應用前景。
廣東通信技術(shù)
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
清河县|
泾阳县|
弥勒县|
玉溪市|
伊川县|
依兰县|
隆昌县|
芦溪县|
商城县|
报价|
米林县|
郴州市|
山东|
临潭县|
仁怀市|
晋州市|
大宁县|
铁岭县|
汪清县|
新源县|
霍城县|
红河县|
邵阳县|
南阳市|
洞头县|
白朗县|
枝江市|
平顺县|
布拖县|
武夷山市|
酉阳|
临泽县|
龙门县|
应用必备|
长沙县|
集贤县|
衡山县|
澜沧|
庆安县|
淮滨县|
万州区|
http://444
http://444
http://444
http://444
http://444
http://444