首頁(yè) >> 新聞

IP電話(huà)語(yǔ)音質(zhì)量的評價(jià)與分析

袁琦 2002/12/31

一、 引言

  IP電話(huà)是近幾年內發(fā)展起來(lái)的一種新的IP網(wǎng)絡(luò )業(yè)務(wù),它是在基于IP協(xié)議的包(分組)傳輸網(wǎng)絡(luò )上所進(jìn)行的電話(huà)通信業(yè)務(wù)。IP電話(huà)作為信息技術(shù)進(jìn)步帶來(lái)的一項新型電話(huà)業(yè)務(wù),已在全世界范圍內得到廣泛使用,并對傳統電話(huà)業(yè)務(wù)形成越來(lái)越大的威脅。

  目前IP電話(huà)的語(yǔ)音質(zhì)量已成為IP電話(huà)業(yè)務(wù)進(jìn)一步發(fā)展的主要障礙,也是IP電話(huà)技術(shù)需要解決的重大難題之一。本文主要對IP電話(huà)的語(yǔ)音質(zhì)量進(jìn)行評價(jià)和分析,并簡(jiǎn)單介紹IP電話(huà)語(yǔ)音質(zhì)量的測試方法。  

二、IP電話(huà)語(yǔ)音質(zhì)量的評價(jià)

  目前對IP電話(huà)業(yè)務(wù)語(yǔ)音質(zhì)量評分的評價(jià)主要有三種模型:MOS模型、PSQM模型和E模型。

1. MOS模型

  ITU-T建議P.830描述了一種對語(yǔ)音的主觀(guān)評定方法-MOS(Mean Opinion Score)方法。根據P.830建議的要求,特定的發(fā)話(huà)者與聽(tīng)話(huà)者在特定的環(huán)境下,通過(guò)收集測試者在各種不同情景下的主觀(guān)感受,根據P.830的分析法則得出該語(yǔ)音的品質(zhì)。P.830對測試的要求非常嚴格,所有的操作都要嚴格地服從操作流程,對錄音系統、語(yǔ)音采樣、語(yǔ)音輸入級別、聽(tīng)者級別、不同發(fā)話(huà)者(8男、8女、8兒童)、多發(fā)話(huà)者(多人同時(shí)講話(huà))、差錯處理、不同語(yǔ)音編碼方式的兼容性、過(guò)失、環(huán)境噪音、音樂(lè )等等,都作出了詳細嚴格的規定。測試者的主觀(guān)感受結果也被分為很多不同的范疇,如聽(tīng)者感受的網(wǎng)絡(luò )質(zhì)量結果、質(zhì)量降級結果、比較結果等。

2. PSQM模型

  MOS方法是一種模糊的評估方法,其測試結果很難對VoIP系統的改進(jìn)和不同VoIP設備之間性能的比較作出有實(shí)際意義的判別。因此,有人提出借用ITU-T 在P.861 中建議的 PSQM (Perceptual Speech Quality Measurement)方法,用來(lái)作為客觀(guān)質(zhì)量度量的評估。

  PSQM的客觀(guān)性是指模仿現實(shí)生活中主觀(guān)聲音的感知。PSQM仿真實(shí)驗中主觀(guān)判斷話(huà)音編碼器的質(zhì)量,通過(guò)把編碼后的信號和源信號進(jìn)行比較,PSQM仍以MOS的5個(gè)級別作為評估結果。PSQM方法并未擺脫原始的人類(lèi)主觀(guān)評估,只是作了進(jìn)一步的說(shuō)明。

  圖1為ITU-T P.861定義的PSQM算法的評價(jià)模型。首先選取符合條件的基準信號源,可以是真實(shí)的聲音,也可以是規定的人工語(yǔ)音。把基準信號源和經(jīng)過(guò)網(wǎng)絡(luò )的干擾后信號輸入到知覺(jué)模型,這個(gè)知覺(jué)模型實(shí)際上是對信號進(jìn)行時(shí)間-頻率映射,以及頻率和強度偏差處理。從知覺(jué)模型輸出得到的信號內部表現通過(guò)差別模型進(jìn)行處理,為了獲得主觀(guān)和客觀(guān)之間的較高關(guān)聯(lián)性,再輸入到認識模型,最后得到質(zhì)量評分。從這個(gè)評價(jià)模型可以看出使用者對語(yǔ)音清晰度的評價(jià)主要取決于使用者的認識模型,而使用者的認識模型又是受其知覺(jué)模型影響。

3. E模型

  E模型最早是由歐洲的ETSI標準組織提出,后來(lái)又由ITU-T標準化形成G.107建議。E模型的思想是將話(huà)音信號傳輸過(guò)程中若干因素對話(huà)質(zhì)的負面影響綜合為參數R,用以評估該話(huà)音呼叫的主觀(guān)質(zhì)量。R的值越大,表明話(huà)音質(zhì)量越好。E模型的R參數由下式確定:

  R = Ro-Is-Id-Ie+A

  其中參數Ro表示噪音帶來(lái)的影響,如背景噪音和電流噪音的干擾。參數Is表示與語(yǔ)音信號同時(shí)產(chǎn)生的質(zhì)量影響因素,如由量化、連接噪聲和側音過(guò)強帶來(lái)的干擾。參數Id表示由于時(shí)延造成的質(zhì)量影響,包括由于通話(huà)回聲和交互性喪失帶來(lái)的干擾。Ie包括由于使用特殊設備引入的質(zhì)量損失,如低比特率編解碼器的影響和分組丟失的影響。G.729A的Ie為10,G.723.1在5.3kbit/s和6.3kbit/s碼流速率下的Ie分別為19和15。參數A為預期值,用以補償由于用戶(hù)采用某些帶來(lái)便捷接入的設備而導致的話(huà)音質(zhì)量的影響。對于傳統電話(huà),A取值為0;而GSM移動(dòng)電話(huà)的A值為10。

  根據E模型確定可接受話(huà)音質(zhì)量對應的R值。編解碼器類(lèi)型、通信模式和傳輸協(xié)議的不同,會(huì )使上式中的各個(gè)分量有不同的取值,從而得到不同的R值。

三、 影響IP電話(huà)語(yǔ)音質(zhì)量的關(guān)鍵因素分析

影響VoIP業(yè)務(wù)語(yǔ)音質(zhì)量評分的主要因素有:

- 同時(shí)通過(guò)網(wǎng)關(guān)的數據流量

- 采樣和糾錯技術(shù)

- 語(yǔ)音的延時(shí)

- IP包在網(wǎng)絡(luò )上的丟失

- 語(yǔ)音數據包抖動(dòng)

- 傳統問(wèn)題:話(huà)音輸入輸出設備質(zhì)量、電平、噪聲、回損和ECHO PATH 延遲(產(chǎn)生于GSM/PSTN段);

1、 網(wǎng)關(guān)的語(yǔ)音處理技術(shù)

(1)語(yǔ)音的編碼與壓縮

  VoIP業(yè)務(wù)的關(guān)鍵技術(shù)之一就是語(yǔ)音的編碼及壓縮技術(shù),采取的編解碼算法和壓縮技術(shù)直接影響到VoIP業(yè)務(wù)的語(yǔ)音質(zhì)量。語(yǔ)音的編碼及壓縮過(guò)程在網(wǎng)關(guān)中完成,這個(gè)過(guò)程需要先進(jìn)行數字編碼,轉換為PCM碼,然后經(jīng)過(guò)專(zhuān)門(mén)的DSP芯片進(jìn)行數據壓縮,最后再形成IP包數據的形式,以適合IP網(wǎng)絡(luò )上的傳輸帶寬。

  根據語(yǔ)音信號的不同特征,語(yǔ)音編碼通常可以分為兩大類(lèi):波形基編碼和參數基編碼。話(huà)音編碼按比特速率的劃分為:高速編碼,中速編碼和低速編碼。

  波形基編碼是通過(guò)抽樣和量化過(guò)程,并利用統計特性和聽(tīng)覺(jué)特性對語(yǔ)音信息進(jìn)行壓縮編碼,最早也是最著(zhù)名的波形基編碼就是PCM,波形基編碼包含三個(gè)過(guò)程:抽樣、量化和編碼;波形基編碼不適應于低速話(huà)音編碼,一般屬于中高速編碼。

  參數基編碼是將語(yǔ)音信號用某種模型表示,僅僅對表示語(yǔ)音特征的參數進(jìn)行編碼。參數基編碼一般屬于中低速編碼。

  ITU-T在G系列建議中對語(yǔ)音編碼技術(shù)進(jìn)行了標準化,已經(jīng)公布了一系列語(yǔ)音編碼協(xié)議,采用波形基編碼的方式主要有G.711、G.721、G.722、G.723、G.726、G.727,采用參數基編碼方式的主要有G.728、G.729、G.729A、G.723.1。這些協(xié)議采用不同的算法,具有不同的速率。較高速率的編碼協(xié)議對話(huà)音質(zhì)量較易保證,但占用網(wǎng)絡(luò )資源較大;較低速率的編碼協(xié)議對話(huà)音質(zhì)量較難保證,但占用網(wǎng)絡(luò )資源小。這些語(yǔ)音壓縮方式的比較如表3所示。

  編碼壓縮方法由ITU-T統一制定并標準化,它的壓縮能力由DSP的處理能力決定,即復雜度。復雜度決定了編解碼器硬件的成本和功耗,也影響到編解碼器的實(shí)時(shí)性。復雜度的衡量指標是定點(diǎn)DSP實(shí)現編解碼所需的處理器能力,以百萬(wàn)指令/秒(MIPS)為單位。

  編碼壓縮僅負責對實(shí)際傳輸的IP包數據進(jìn)行壓縮,它不負責對IP頭壓縮。一般,IP/UDP頭(包括地址信息和控制信息)要耗去7kbit/s左右的帶寬。

  在實(shí)際選擇壓縮算法時(shí),要綜合考慮各種因素。例如,高比特率可以保證良好的話(huà)音品質(zhì),但要占用大量的存儲空間,耗費更多的系統資源;而過(guò)低的比特率又會(huì )影響話(huà)音的品質(zhì)和增加延遲。所以,在較低比特率的前提下,保持較好的話(huà)音質(zhì)量,是選擇壓縮算法的原則。

  從互通性角度考慮,IP電話(huà)網(wǎng)關(guān)對其它編碼協(xié)議亦應全部支持或部分支持。特別是對于G.729/ G.729A,由于其編碼速率亦較低。而且其編碼時(shí)延較G.723.1小,因此建議IP電話(huà)網(wǎng)中給予支持。

  為保證一定的通話(huà)質(zhì)量,網(wǎng)關(guān)必須設有輸入緩沖,以盡可能地消除時(shí)延抖動(dòng)對通話(huà)質(zhì)量的影響。另外,網(wǎng)關(guān)應該具有語(yǔ)音編碼的動(dòng)態(tài)轉換功能,即網(wǎng)關(guān)設備能夠自動(dòng)地在較高速率的語(yǔ)音編碼和較低速率的語(yǔ)音編碼之間的轉換。當網(wǎng)絡(luò )擁塞時(shí)可以由高碼速轉換到低碼速,當網(wǎng)絡(luò )條件較好時(shí),可以由低碼速轉換到高碼速以提高語(yǔ)音質(zhì)量。語(yǔ)音編碼的動(dòng)態(tài)轉換是網(wǎng)關(guān)設備在IP電話(huà)QoS管理方面的一個(gè)重要功能。

(2)DTMF檢測

  DTMF信號傳輸在語(yǔ)音網(wǎng)絡(luò )中極為重要,因為網(wǎng)絡(luò )不僅傳輸被叫方的撥叫號碼,而且用來(lái)激活基本電路特性。信號質(zhì)量的衰減會(huì )影響到DTMF信號的識別。DTMF信號的失真又會(huì )影響話(huà)音服務(wù)的質(zhì)量。

  DTMF信號由電話(huà)鍵盤(pán)使用相同幅度的兩個(gè)不同的高頻和低頻來(lái)產(chǎn)生。網(wǎng)關(guān)需轉換電話(huà)中常用的DTMF信號,應能檢測DTMF信號,并將其轉換為H.245消息中的"用戶(hù)輸入指示"信息單元予以傳送,可取值0~9、*和#,反之,應能生成DTMF信號。

  網(wǎng)關(guān)中的低比特率編解碼器適用于語(yǔ)音信號而不是正弦信號,它們會(huì )改變信號的頻率和幅度,所以難以傳輸DTMF信號,并很難高保真地恢復它們。

(3) 靜音抑制

  靜音抑制,又稱(chēng)語(yǔ)音活動(dòng)偵測(VAD)。靜音抑制的目的是從聲音信號流里識別和消除長(cháng)時(shí)間的靜音期,以達到在不降低業(yè)務(wù)質(zhì)量的情況下節省話(huà)路資源的作用,它是IP電話(huà)應用的重要組成部分。靜音抑制可以節省寶貴的帶寬資源,可以有利于減少用戶(hù)感覺(jué)到的端到端的時(shí)延。

  用戶(hù)打電話(huà)時(shí),并不是總在占用通話(huà)信道。根據傳統電話(huà)業(yè)務(wù)的統計,一方用戶(hù)實(shí)際占用通話(huà)信道的時(shí)間不會(huì )超過(guò)整個(gè)通話(huà)時(shí)間的40%。這主要包括以下幾個(gè)方面的原因:一是正在聽(tīng)對方說(shuō)話(huà);二是由于思考,稍事休息等原因引起的一段話(huà)之間的停頓;三是說(shuō)話(huà)中間的停頓,如猶豫,呼吸,口吃等。第一種情況下停頓間隙長(cháng)而出現頻率低;第三種情況停頓間隙短而出現頻率高;第二種情況界于一、三種情況之間。語(yǔ)音源的這種特性叫做開(kāi)關(guān)特性,有時(shí)也叫話(huà)音/靜默特性。

  在用戶(hù)沒(méi)有講話(huà)時(shí),就沒(méi)有語(yǔ)音分組的發(fā)送,從而可以進(jìn)一步降低語(yǔ)音比特率。當用戶(hù)的語(yǔ)音信號能量低于一定門(mén)限值時(shí)就認為是靜默狀態(tài),也不發(fā)送語(yǔ)音分組。當檢測到突發(fā)的活動(dòng)聲音時(shí)才生成語(yǔ)音信號,并加以傳輸。運用這種技術(shù)能夠獲得大于50%的帶寬。

  在進(jìn)行靜音檢測時(shí)有兩個(gè)問(wèn)題需要注意:一是背景噪聲問(wèn)題,即如何在較大的背景噪聲中檢測靜音;二是前后沿剪切問(wèn)題。所謂前后沿剪切就是還原語(yǔ)音時(shí),由于從實(shí)際講話(huà)開(kāi)始到檢測到語(yǔ)音之間有一定的判斷門(mén)限和時(shí)延,有時(shí)語(yǔ)音波形的開(kāi)始和結束部分會(huì )作為靜音被丟掉,還原的語(yǔ)音會(huì )出現變化,因此需要在突發(fā)語(yǔ)音分組前面或后面增加一個(gè)語(yǔ)音分組進(jìn)行平滑以解決這一問(wèn)題。

  在實(shí)際使用中,如果出現長(cháng)時(shí)間的靜默,會(huì )使用戶(hù)感到很不自然。因此實(shí)際上接收端常常會(huì )在靜音期間發(fā)送一些分組,從而生成使用戶(hù)感覺(jué)舒服一些的背景噪聲,即所謂的舒適噪聲。

(4) 回聲處理

  回聲是信號通過(guò)網(wǎng)絡(luò )時(shí)的反射。本地揚聲器輸出的模擬語(yǔ)音信號可能又被話(huà)筒接收,當信號被傳回到源端時(shí),就會(huì )產(chǎn)生不必要的回聲。在傳統固話(huà)網(wǎng)中,從4線(xiàn)交換到2線(xiàn)本地環(huán)路時(shí)的阻抗會(huì )導致回聲,或者是由麥克風(fēng)和揚聲器或耳機之間的耦合效果不好也會(huì )導致回聲。在IP網(wǎng)中,呼叫必須經(jīng)過(guò)多個(gè)路由器和網(wǎng)關(guān),其相當長(cháng)的延遲又會(huì )造成回聲問(wèn)題的進(jìn)一步惡化。典型的延遲是16ms-20ms的回聲叫做側音,它有利于談話(huà)者聽(tīng)到自己的聲音。但是延遲超過(guò)了25ms,聽(tīng)到的聲音就會(huì )被扭曲,甚至中斷談話(huà)。回聲可以用回聲消除器加以控制。在VoIP網(wǎng)絡(luò )中,把回聲消除器放在了低比特編碼器中,并且運行于每個(gè)DSP之上。回聲消除器的設計受到等待接收反射回來(lái)的話(huà)音的整個(gè)時(shí)間大小的限制。

2、 承載的IP網(wǎng)絡(luò )

  承載的IP網(wǎng)絡(luò )基于TCP/IP協(xié)議進(jìn)行數據包的分組交換,是面向無(wú)連接網(wǎng)絡(luò ),其傳輸特性無(wú)法得到保證。每個(gè)分組包含源和目的IP地址,分組包既沒(méi)有標記為屬于某一個(gè)特定的流或者一個(gè)連接,也沒(méi)有以任何方式進(jìn)行編號。每個(gè)IPv4節點(diǎn)盡其最大的努力,對每個(gè)分組獨立進(jìn)行路由轉發(fā),并在網(wǎng)絡(luò )中獨立傳遞,達到同一目的地分組的路由不一定相同,到達時(shí)間也是不固定且非實(shí)時(shí)的,最后在目的節點(diǎn)緩沖區重新組成數據。因此數據包傳送所需時(shí)延無(wú)法保證,途中的丟包更無(wú)法控制,并造成IP包傳輸的時(shí)延抖動(dòng)。

  承載的IP網(wǎng)絡(luò )的上述機制能夠較好地支持非實(shí)時(shí)的數據業(yè)務(wù),但對實(shí)時(shí)業(yè)務(wù)支持不夠。盡管IP協(xié)議中有業(yè)務(wù)類(lèi)別的區別,用戶(hù)依此表示為網(wǎng)絡(luò )的時(shí)延,帶寬以及安全性等特征參數,從而來(lái)獲取希望的QoS,但在實(shí)際的IP網(wǎng)絡(luò )中,并沒(méi)有真正完全參照這些參數(業(yè)務(wù)類(lèi)別的劃分及對應的QoS參數)來(lái)使用。因此傳統的IP網(wǎng)傳送實(shí)時(shí)的VoIP業(yè)務(wù)能力較差。

  在IP電話(huà)業(yè)務(wù)中,網(wǎng)絡(luò )和網(wǎng)關(guān)帶來(lái)的時(shí)延都可能會(huì )嚴重地影響語(yǔ)音質(zhì)量,這就要求運營(yíng)商必須提供高質(zhì)量的IP網(wǎng)絡(luò )。這可以通過(guò)兩種途徑來(lái)解決,一是增加網(wǎng)絡(luò )帶寬,二是通過(guò)在網(wǎng)絡(luò )中實(shí)現QoS服務(wù)來(lái)實(shí)現帶寬的合理利用,從而滿(mǎn)足IP電話(huà)業(yè)務(wù)對實(shí)時(shí)性的要求。

  足夠的帶寬是確保語(yǔ)音數據包無(wú)延時(shí)地到達目的地所必須的。如果網(wǎng)絡(luò )正面臨阻塞問(wèn)題時(shí),就需要更大的網(wǎng)絡(luò )帶寬來(lái)解決這個(gè)問(wèn)題,僅僅采用優(yōu)先機制只能部分消除分組包的丟失問(wèn)題。假如不希望丟棄任何數據包的話(huà),就必須增加帶寬了。

  實(shí)現業(yè)務(wù)傳輸優(yōu)先級保證的關(guān)鍵在于引入一種服務(wù)質(zhì)量機制(QoS),允許網(wǎng)絡(luò )將不同類(lèi)型的業(yè)務(wù)置于特定的QoS隊列中,使得語(yǔ)音業(yè)務(wù)的傳輸優(yōu)先級高于數據業(yè)務(wù),從而降低隊列延時(shí),實(shí)時(shí)性得到保障。 四、 IP電話(huà)語(yǔ)音質(zhì)量的測試 IP電話(huà)業(yè)務(wù)的主觀(guān)評定MOS評分由測試人員通過(guò)通話(huà)根據評分標準主觀(guān)評定的,可簡(jiǎn)單地由20-60個(gè)非專(zhuān)職測試者對所聽(tīng)的話(huà)音進(jìn)行綜合打分,然后進(jìn)行統計分析。

  IP電話(huà)業(yè)務(wù)的客觀(guān)評定PSQM評分指標可利用測試儀表進(jìn)行測試,目前國內外眾多的測試儀表廠(chǎng)商已經(jīng)開(kāi)發(fā)出許多用于PSQM評分值的測試儀表。Agilent公司的Telegra VQT語(yǔ)音質(zhì)量測試儀,能夠測試端到端語(yǔ)音時(shí)延、清晰度、靜音抑制和DTMF音調分析等參數,能夠提供專(zhuān)業(yè)的端到端的語(yǔ)音質(zhì)量(PSQM)測試,并對話(huà)音質(zhì)量進(jìn)行客觀(guān)分析。美國Ameritec的解決方案為利用各種型號的大話(huà)務(wù)量呼叫器發(fā)起呼叫,并在其上配置"Golden Voice"復合音調發(fā)生器,利用呼叫產(chǎn)生的標準測試音信號,在被叫端或呼叫經(jīng)過(guò)的網(wǎng)絡(luò )進(jìn)行話(huà)音質(zhì)量的分析和丟包、抖動(dòng)、沿切割、延時(shí)等測試。Spirent公司的Abcus測試儀也能完成PSQM評分指標的測試。國內的中創(chuàng )信測公司研制開(kāi)發(fā)出了IP電話(huà)測試儀,中創(chuàng )的IP電話(huà)測試儀采用捕捉協(xié)議包的方式實(shí)時(shí)對H.323呼叫過(guò)程跟蹤分析,可進(jìn)行IP語(yǔ)音包的提取及語(yǔ)音質(zhì)量分析。

  關(guān)于IP電話(huà)業(yè)務(wù)的R值評分,目前國內外還沒(méi)有這方面的測試儀表,相關(guān)研究機構和測試儀表廠(chǎng)家正在積極地進(jìn)行E模型的研究與開(kāi)發(fā)。

中國通信網(wǎng)(www.c114.net)
分類(lèi)信息:     文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 泰来县| 磐安县| 皋兰县| 鞍山市| 高雄市| 余干县| 赞皇县| 临邑县| 哈密市| 监利县| 洪江市| 正阳县| 贺州市| 嘉祥县| 都匀市| 原阳县| 绥棱县| 津南区| 中卫市| 蒲江县| 仙桃市| 明溪县| 乐至县| 阳谷县| 托里县| 汝州市| 拉萨市| 莆田市| 青河县| 榆社县| 靖西县| 丘北县| 页游| 山东省| 太白县| 海门市| 平乐县| 济南市| 洪雅县| 斗六市| 巴马| http://444 http://444 http://444 http://444 http://444 http://444