mSwitch系統VoIP語(yǔ)音質(zhì)量測量方法研究
2007/07/19
首先介紹了mSwitch系統當前對VoIP語(yǔ)音質(zhì)量的監控情況;然后就語(yǔ)音質(zhì)量的衡量標準MOS進(jìn)行了簡(jiǎn)要描述;同時(shí)對現有的語(yǔ)音質(zhì)量測量方法PSQM/PSQM+,PESQ,PAMS,E-Model的發(fā)展作了相關(guān)闡述;其中對E-Model方法進(jìn)行了較為詳細的介紹;最后對mSwitch系統對VoIP語(yǔ)音質(zhì)量的監控提出了幾點(diǎn)展望。
1、mSwitch對VoIP語(yǔ)音質(zhì)量的監控現狀
在當前mSwitch系統中,對整個(gè)軟交換架構中的VoIP的語(yǔ)音質(zhì)量的監控,沒(méi)有采取任何的監控手段和措施,僅僅做的就是在釋放每個(gè)同VoIP相關(guān)的呼叫后,要求媒體網(wǎng)關(guān)(MG)或者綜合接入設備(IAD)上報本次呼叫中如下統計信息:終結點(diǎn)呼叫連接的時(shí)長(cháng)統計(nt/dur)、終結點(diǎn)呼叫連接發(fā)送的字節數統計(nt/os)、終結點(diǎn)呼叫連接接受的字節數統計(nt/or)、終結點(diǎn)呼叫連接發(fā)送的數據包統計(rtp/ps)、終結點(diǎn)呼叫連接中接受的數據包統計(rtp/pr)、終結點(diǎn)呼叫連接中的所丟失的數據包的統計(rtp/pl)、終結點(diǎn)呼叫連接中的抖動(dòng)統計(rtp/jit)以及終結點(diǎn)呼叫連接中時(shí)延的統計(rtp/delay)。但是這些統計信息上報到CS-P之后,沒(méi)有作任何的分析和處理,也沒(méi)有保存。
因此,當前的整個(gè)軟交換的VoIP的語(yǔ)音質(zhì)量對我們來(lái)說(shuō)就是一個(gè)未知數;雖然在部署NGN網(wǎng)絡(luò )時(shí),可以通過(guò)一些第三方公司的專(zhuān)業(yè)VoIP工具對整個(gè)軟交換的VoIP的語(yǔ)音質(zhì)量進(jìn)行評測,但是無(wú)法彌補mSwitch系統在對VoIP語(yǔ)音質(zhì)量控制方面的缺陷,那就是當mSwitch系統監測到整個(gè)系統的VoIP語(yǔ)音質(zhì)量在明顯下降,并且下降到某個(gè)程度時(shí),有必要采取適當地控制措施來(lái)盡力改善VoIP的通話(huà)語(yǔ)音質(zhì)量。
下面就VoIP的語(yǔ)音質(zhì)量的測量方法和實(shí)施進(jìn)行介紹。
2、語(yǔ)音質(zhì)量的度量標準——MOS
在介紹語(yǔ)音質(zhì)量的測量方法之前,首先將對語(yǔ)音質(zhì)量的度量標準MOS進(jìn)行簡(jiǎn)要介紹;VoIP呼叫質(zhì)量會(huì )受噪聲、畸變、信號幅度過(guò)高或過(guò)低、回聲、通話(huà)間隙和許多其他問(wèn)題的影響。在測量呼叫質(zhì)量時(shí),需要研究三類(lèi)基本的服務(wù)質(zhì)量:
(1)收聽(tīng)質(zhì)量——指用戶(hù)對呼叫過(guò)程中所聽(tīng)到的聲音質(zhì)量的評價(jià)。
(2)會(huì )話(huà)質(zhì)量——指用戶(hù)在整個(gè)通話(huà)過(guò)程中基于收聽(tīng)質(zhì)量和會(huì )話(huà)能力而對呼叫作出的評價(jià),包括回音和延遲等可能影響通話(huà)的相關(guān)問(wèn)題。
(3)傳輸質(zhì)量——指用于承載話(huà)音信號的網(wǎng)絡(luò )連接的質(zhì)量。傳輸質(zhì)量測量是與細節呼叫質(zhì)量測量相對的一種網(wǎng)絡(luò )服務(wù)質(zhì)量測量。
呼叫質(zhì)量測量的目的是通過(guò)主觀(guān)或客觀(guān)的測量方法,即通過(guò)人為的測量項目或基于計算機的測量工具,對一種或多種以上的呼叫質(zhì)量類(lèi)別給出一個(gè)可信的估計。
主觀(guān)測量是一種久經(jīng)考驗的話(huà)音質(zhì)量測量方法,但這種方法成本太高,費時(shí)也太長(cháng)。有一種更廣為人知的主觀(guān)類(lèi)測量方法,叫做絕對種類(lèi)定級(Absolute
Category Rating,ACR)測量。
在A(yíng)CR測量中,收聽(tīng)者按照從1~5的5級損傷指標對一系列音頻文件進(jìn)行分級(見(jiàn)表1)。
在取得了每個(gè)收聽(tīng)者給出的得分之后,計算所有音頻文件的一般或平均意見(jiàn)得分(Mean Opinion Score, MOS)。為了使ACR測量得到可信的測量結果,接受測量的人數至少應在16個(gè)以上,而且測量應該在一個(gè)安靜的環(huán)境下,在可控的條件下完成。這種測量方法定義在ITU-T
P.800當中,該MOS值就是語(yǔ)音質(zhì)量的度量尺寸,顯然是MOS越大,語(yǔ)音質(zhì)量越好。
3、語(yǔ)音質(zhì)量測量方法的發(fā)展
上述IUT-T P.800中所定義的方法得到的MOS值是一種主觀(guān)的測量方法,并且該方法成本太高,費時(shí)太長(cháng);因此,在后來(lái)的研究和探索中,先后出現了如下幾種客觀(guān)測量方法:
- PSQM /PSQM+:Perceptual Speed Quality Measure,感知通話(huà)質(zhì)量測量[2],定義在ITU-T
P.861當中;
- PESQ:Perceptual Evaluation of Speed Quality,感知評估通話(huà)質(zhì)量測量[3],定義在ITU-T
P.862當中;
- PAMS:Perceptual Analysis Measurement System,感知分析測量,英國電信定義;
- E-Model:本文將重點(diǎn)介紹的測量方法,該方法定義在ITU-T G.107當中。
PSQM和PAMS測量方法都需要發(fā)送一個(gè)語(yǔ)音參考信號通過(guò)電話(huà)網(wǎng)絡(luò ),在網(wǎng)絡(luò )的另一端采用數字信號處理的方式比較樣本信號和接收到的信號,進(jìn)而估算出網(wǎng)絡(luò )的語(yǔ)音質(zhì)量。PESQ結合了PSQM和PAMS的優(yōu)勢,并針對MOS和MOS-LQ(Listening
Quality)計算方法做了修改。最開(kāi)始這些方法被用于測量編碼算法和在實(shí)驗室分析設備問(wèn)題,如分析電話(huà)機的語(yǔ)音質(zhì)量;并且都是基于PSTN網(wǎng)絡(luò ),因此并不適合應用到VoIP網(wǎng)絡(luò )系統的語(yǔ)音測量。這些方法主要缺點(diǎn)體現在:
- 不是基于IP網(wǎng)絡(luò )的方法,不能反應IP網(wǎng)絡(luò )的衰減問(wèn)題,如網(wǎng)絡(luò )傳輸中的Delay和Jitter和Packet Loss等問(wèn)題;
- 不能說(shuō)明End-to-End的網(wǎng)絡(luò )延遲,而其他過(guò)多的延遲因素影響到了MOS值;
- 只能輸出在任何時(shí)間內的某一方向的語(yǔ)音質(zhì)量,不是真實(shí)通話(huà)中的雙向結果;
- 無(wú)法模擬多個(gè)或成百上千個(gè)重復同步的通話(huà)。
而在ITU-T G.107中定義的E-Model方法則很好地克服了上述問(wèn)題,因此非常適合VoIP語(yǔ)音質(zhì)量的測量。E-Model模型是歐洲電信標準協(xié)會(huì )(ETSI)開(kāi)發(fā)的,本來(lái)用作電信網(wǎng)絡(luò )的傳輸規劃工具,但該模型也在VoIP服務(wù)質(zhì)量測量中廣泛使用,在下面的章節中將對該模型進(jìn)行詳細的介紹。
此外,有必要指出,平均主觀(guān)值MOS是廣泛認同的語(yǔ)音質(zhì)量標準。因此,無(wú)論采用何種方法,所有測量方法所得到的結果都必須對應到最終的平均主觀(guān)值MOS。
4、VoIP語(yǔ)音質(zhì)量測量方法——E-Model
E-Model是基于如下通話(huà)連接模型進(jìn)行測量的(見(jiàn)圖1),其最終的測量結果就是得到R值(R Factor),被稱(chēng)為全面的網(wǎng)絡(luò )傳輸等級要素,也就是說(shuō),確定包含話(huà)音通道的“由口至耳”特性的“R”因素。R因素的取值范圍為0~120,窄帶電話(huà)上R因素通常取50~94,而寬帶電話(huà)上R取值在50~110。R因素的值可以轉換為會(huì )話(huà)和收聽(tīng)質(zhì)量MOS得分(MOSCQ
and MOSLQ)的估計值。R值的計算從沒(méi)有網(wǎng)絡(luò )和設備的損傷影響開(kāi)始,此時(shí)語(yǔ)音質(zhì)量是最好的,R=R0。R0是無(wú)網(wǎng)絡(luò )延時(shí)和設備損傷因素的基本信號與收發(fā)噪聲以及電流、背景噪聲之比,即基本信噪比。但是因為網(wǎng)絡(luò )和設備損傷因素的存在,減少了通過(guò)網(wǎng)絡(luò )的語(yǔ)音質(zhì)量,R值的基本計算公式如下:R=R0-Is-Id-Ie-eff+A。
其中,Is:與語(yǔ)音信號傳輸同步的損傷;Id:語(yǔ)音信號傳輸延時(shí)后的損傷;Ie-eff:由設備引入的損傷,例如編碼器損傷;A:優(yōu)勢因素,致力于考慮呼叫者的期望因素,在大部分情況下,一般設置為0,但是對于移動(dòng)用戶(hù),因為移動(dòng)的便利而能容忍低質(zhì)量的語(yǔ)音質(zhì)量,所以該值可以大于0。在G.107中,就基本公式中的各個(gè)值的計算(A除外)都提供了復雜的計算公式,并且涉及到20個(gè)參數值,具體的計算公式這里就不一一介紹了,具體可以參考ITU-T
G.107。
通過(guò)對涉及參數和通話(huà)連接模型的對照,可以發(fā)現大部分參數都是對通話(huà)設備(話(huà)機)和通話(huà)環(huán)境的要求,如參數Ds、Dr是對發(fā)話(huà)端和收話(huà)端的話(huà)機噪音值的評估因子;SLR,RLR,STMR,LSTR是對發(fā)話(huà)端和收話(huà)端聲音響度相關(guān)的評估;TELR,WEPL是對通話(huà)中的回聲相關(guān)進(jìn)行評估的因子;Nc是對通話(huà)中的電路噪音進(jìn)行評估的因子;Nfor是對收話(huà)端的噪音背景的評估;Ps和Pr是對發(fā)話(huà)端和收話(huà)端的空間噪音的考慮因素;而這些因素對于評估測量VoIP的語(yǔ)音質(zhì)量是沒(méi)有太大的意義,因為這些因素同IP連接和傳輸沒(méi)有直接的聯(lián)系,并且這些參數在每次的VoIP通話(huà)當中也無(wú)法直接獲取,而同VoIP相關(guān)的幾個(gè)參數(T,Tr,Ta,qdu,Ie,Bpl,Ppl)是同如下幾個(gè)因素有著(zhù)直接的聯(lián)系,下面就這幾個(gè)因素進(jìn)行介紹。
(1)Codec:通話(huà)中采用的編解碼方式,這是以硬件或者軟件的方式采樣模擬語(yǔ)音,決定了語(yǔ)音數據包的傳輸速率。在ITU的標準中,G.711u/G.711a是一種高質(zhì)量的無(wú)壓縮的編解碼方式,但是占用相當大的帶寬;而其他的低速率的編解碼方式,如G.726/G.729等系統,占用的帶寬比較小,但是使用了容易損失的壓縮算法,削弱了語(yǔ)音的傳輸質(zhì)量;而在實(shí)際的應用中,低速率的Codec能夠在相同的帶寬下接入更多的呼叫連接,但是又導致了更大的網(wǎng)絡(luò )延遲(對參數T,Ta,qdu存在著(zhù)間接的影響),并且對網(wǎng)絡(luò )丟包更加敏感。Codec的選擇對E-Model中的R值有著(zhù)明顯的影響,直接反應是對在Ie參數上,在ITU-T的標準中,有G.113的Appendix
I就Codec和Ie的關(guān)系作了推薦,可以作為計算R值的參考。
(2)網(wǎng)絡(luò )延遲:網(wǎng)絡(luò )延遲將引起語(yǔ)音會(huì )話(huà)過(guò)程的空白,帶來(lái)語(yǔ)音的變形和會(huì )話(huà)的中斷。E-Model關(guān)注的是End-to-End的網(wǎng)絡(luò )延遲。在實(shí)際應用中,一般是如下幾個(gè)方面而導致了網(wǎng)絡(luò )延遲:傳播延時(shí):取決于傳播的介質(zhì)和距離;傳輸延時(shí):傳輸過(guò)程中在網(wǎng)絡(luò )設備上所用時(shí)間;打包解包延時(shí):用采用的Codec進(jìn)行數模轉換的時(shí)間,不同的Codec所導致的延時(shí)是不一樣的,但是對于同一種Codec,其延時(shí)基本是固定的;抖動(dòng)緩沖延時(shí):在作用在接受端,為保持住一個(gè)或多個(gè)接收的數據包,克服網(wǎng)絡(luò )抖動(dòng)的影響。網(wǎng)絡(luò )延遲將直接反應在參數T,Tr,Ta上面。
(3)網(wǎng)絡(luò )抖動(dòng):網(wǎng)絡(luò )抖動(dòng)就是網(wǎng)絡(luò )延時(shí)的變化,當網(wǎng)絡(luò )抖動(dòng)值大于50ms時(shí),MOS值將急劇下降;但是在ITU-T G.107中,是這樣說(shuō)的:“抖動(dòng)對語(yǔ)音傳輸質(zhì)量的影響還在作進(jìn)一步的研究,目前沒(méi)有包含在E-Model的算法中”。但是通過(guò)在接收端增加抖動(dòng)緩沖的量,則可以有效地降低抖動(dòng)的影響,但是卻增加了網(wǎng)絡(luò )延時(shí)。
(4)網(wǎng)絡(luò )丟包:網(wǎng)絡(luò )丟包是影響語(yǔ)音質(zhì)量和MOS值的關(guān)鍵因素,存在兩種類(lèi)型的丟包:隨機丟包(Random Loss):這是隨機產(chǎn)生的丟包,如果量小,對語(yǔ)音質(zhì)量影響小;連續丟包(Burst
Loss):這是指連續一個(gè)以上的數據包的丟失,這對語(yǔ)音質(zhì)量的影響是明顯的。因此對丟包作有效的監測是非常有必要的,并且在ITU-T的標準中,其G.113的Appendix
I中就Codec的選擇所導致的Bpl作了映射,可以作為計算R值的參考。當某種Codec采用適當的丟包補償技術(shù)也能夠降低丟包對VoIP語(yǔ)音質(zhì)量的影響,并優(yōu)化了語(yǔ)音質(zhì)量。
最終通過(guò)E-Model得到的R值,通過(guò)ITU-T G.107中的Appendix B的計算公式,可以得到如下的一種關(guān)系表(見(jiàn)圖2)。其中:GoB(Good
or Bad),PoW(Poor or Worse)。
如果平均主觀(guān)值MOS為4或更高,被認為是比較好的語(yǔ)音質(zhì)量,而若平均主觀(guān)值MOS低于3.6,則大部分接聽(tīng)者不能滿(mǎn)意這個(gè)語(yǔ)音質(zhì)量了。因此,當軟交換系統系統監測到VoIP的通話(huà)語(yǔ)音質(zhì)量的R值處于70以下的時(shí)候,則需要采取一些適當的措施來(lái)改善語(yǔ)音質(zhì)量了。
5、運用E-Model在mSwitch系統中對VoIP語(yǔ)音質(zhì)量測量的研究
在當前的軟交換架構mSwitch系統中,可以稱(chēng)之為VoIP的呼叫可以劃分為如下兩類(lèi):
(1)第一類(lèi)是需要向軟交換系統的媒體網(wǎng)關(guān)(MG)申請IP資源的呼叫。這類(lèi)呼叫有如下幾種情況:終端都是IP,但是需要媒體網(wǎng)關(guān)作IP Relay,SIP到SIP,MGCP到MGCP,H323到H323,中間需要媒體網(wǎng)關(guān)作IP中繼;一側終端是IP,一側是非IP終端,如SIP到V5電話(huà)、MGCP到PHS等;通話(huà)雙方都是非IP終端,但是通話(huà)連接跨媒體網(wǎng)關(guān)了,如MG1上的PHS用戶(hù)同MG2上的PHS用戶(hù)通話(huà)等。
(2)第二類(lèi)就是不需要向軟交換系統的媒體網(wǎng)關(guān)申請IP資源的呼叫。這類(lèi)情況如IP終端到IP終端的End-to-End連接模式。
對于第二類(lèi)情況,語(yǔ)音質(zhì)量需要的相關(guān)參數有各種協(xié)議處理方式不一樣,如MGCP協(xié)議可以獲取,SIP和H323則沒(méi)有獲取,這里就不作討論。
針對第一類(lèi)的連接通話(huà)情況,可以用建立如下的通話(huà)連接模型,如圖3所示。該圖是整個(gè)軟交換系統的簡(jiǎn)化圖,具體的細節沒(méi)有描述。
基于該連接模型,對于每次的VoIP通話(huà),CS-P可以從MG獲取如下的相關(guān)信息:終結點(diǎn)呼叫連接采用的Codec(忽略了Codec動(dòng)態(tài)改變的情況),呼叫連接的時(shí)長(cháng)統計(nt/dur)、呼叫連接發(fā)送的字節數統計(nt/os)、呼叫連接接受的字節數統計(nt/or)、呼叫連接發(fā)送的數據包統計(rtp/ps)、呼叫連接中接受的數據包統計(rtp/pr)、呼叫連接中的所丟失的數據包的統計(rtp/pl)、呼叫連接中的抖動(dòng)統計(rtp/jit)以及呼叫連接中時(shí)延的統計(rtp/delay)。從這些信息中,可以獲取到計算R值所需要的參數(見(jiàn)表2)。
而對于其他的參數,由于CS-P系統來(lái)計算每次VoIP的通話(huà)質(zhì)量時(shí),要獲取各種真正的通話(huà)現場(chǎng)環(huán)境參數和話(huà)機相關(guān)的參數是不現實(shí)的,因此,這些參數值可以采用參考ITU-T
G.107中Table 2中的參考值。
因此,在mSwitch系統中,可以使用E-Model通過(guò)如下的步驟來(lái)獲取每次VoIP通話(huà)的語(yǔ)音質(zhì)量的R值和MOS值,具體計算公式參考ITU-T
G.107。
第一步:確定相關(guān)參數,計算基本信噪比R0(使用的都是ITU-T G.107中Table 2中的參考值);第二步:確定相關(guān)參數,計算語(yǔ)音同步損傷因子Is(使用的都是ITU-T
G.107中Table 2中的參考值);第三步:確定相關(guān)參數,計算語(yǔ)音延時(shí)損傷因子Id(qdu使用的都是ITU-T G.107中Table 2中的參考值);第四步:確定相關(guān)參數,算計語(yǔ)音設備損傷因子Ie-eff(根據Codec對照ITU-T
G.113 Appendix I,找到合適的Ie和Bpl值);第五步:根據終端類(lèi)型,確定A值;第六步:計算R值,根據R和MOS的對照關(guān)系表,得到MOS值。
使用E-Model測量VoIP的語(yǔ)音質(zhì)量,可以準確地建立包丟失分布和最終用戶(hù)感覺(jué)模型,將包丟失分布與編碼器和時(shí)延等建立關(guān)系,以便給出一個(gè)單一的得分,該方法在數據網(wǎng)絡(luò )中進(jìn)行語(yǔ)音質(zhì)量評估具有相當的準確度。
6、結束語(yǔ)
但是,需要看到的是:正如ITU-T G.107規范開(kāi)頭所述“這樣的評估僅用于傳輸設計的目的,并非為了實(shí)際用戶(hù)評價(jià)預測(因為還沒(méi)有ITU-T建議的統一的模型)。”E-Model相當大數量的可能輸入參數的組合情況還未經(jīng)過(guò)足夠的界內驗證和充分的實(shí)驗室測量。許多對于傳輸設計具有高重要度的參數組合情況,E-Model已經(jīng)可以被確信應用,但是對于其它的一些研究未涉及或不成熟的參數組合情況,E-Model的估測仍處在置疑和研究的階段。
對于軟交換設備mSwitch系在VoIP方面的理想情況,應該做到如下幾種情況:
- CS-P能收集每個(gè)同IP相關(guān)的呼叫的相關(guān)統計值,如抖動(dòng)時(shí)間、延遲時(shí)間、丟報率等,并進(jìn)行統計和計算,得出相關(guān)的R值和MOS值,作為整個(gè)CS-P的VoIP的語(yǔ)音質(zhì)量參考依據;
- CS-P能提供丟報率的告警提示以及語(yǔ)音質(zhì)量下降的告警提示;
- CS-P能根據計算出來(lái)的MOS值,對相應的VoIP呼叫進(jìn)行相關(guān)的調整和控制,如控制媒體網(wǎng)關(guān)選擇合適的語(yǔ)音壓縮算法,或者提供語(yǔ)音包緩存區的大小以減少抖動(dòng)對語(yǔ)音質(zhì)量帶來(lái)的影響。
電信網(wǎng)技術(shù)
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
安陆市|
沅江市|
开封县|
桂东县|
福贡县|
淮滨县|
浦江县|
北碚区|
宣武区|
长宁区|
青海省|
莫力|
贡山|
离岛区|
酒泉市|
奎屯市|
剑河县|
梅州市|
井冈山市|
阳朔县|
休宁县|
桂平市|
勐海县|
辰溪县|
丰原市|
海兴县|
太湖县|
婺源县|
广南县|
德昌县|
同心县|
西和县|
苍溪县|
赞皇县|
壶关县|
开远市|
紫金县|
新泰市|
怀宁县|
临汾市|
滕州市|
http://444
http://444
http://444
http://444
http://444
http://444