首頁(yè)>>廠(chǎng)商>>語(yǔ)音板卡開(kāi)發(fā)商>>東進(jìn)技術(shù)

用板卡搭建語(yǔ)音門(mén)戶(hù)

劉建全 2001/06/21


  語(yǔ)音門(mén)戶(hù)展現在我們面前的巨大的市場(chǎng)潛力。但是,語(yǔ)音門(mén)戶(hù)在也對語(yǔ)音技術(shù)提出要求的同時(shí),也對語(yǔ)音板卡提出了更多的需求,要求“語(yǔ)音打斷”功能,要能有效“消除回聲”等。只有這樣,才能用語(yǔ)音板卡成功搭建技術(shù)上成熟的語(yǔ)音門(mén)戶(hù)。

  語(yǔ)音門(mén)戶(hù)的本質(zhì)是應用了語(yǔ)音識別技術(shù)的IVR(語(yǔ)音自動(dòng)應答)系統。那么,當前存在的問(wèn)題主要有哪些呢?


  IVR系統使用不方便


  在IVR系統中引入ASR技術(shù)的初衷是什么?

  拋開(kāi)冠冕堂皇的商業(yè)目的,我們需要承認,在IVR系統中引入ASR技術(shù)的初衷在于解治IVR中存在的痼疾。

  語(yǔ)音選單界面有太多的選項。語(yǔ)音提示+按鍵選擇的方法已經(jīng)無(wú)法滿(mǎn)足需求。比如,在航班查詢(xún)系統中,如此多的目的城市不可能全部通過(guò)語(yǔ)音播報出來(lái)。

  效率低下。通過(guò)語(yǔ)音識別技術(shù)提升了接入手段,用戶(hù)可以直接用語(yǔ)音進(jìn)行有關(guān)的交互工作,這樣,工作效率大為提高。例如,目前在聽(tīng)完了大段的語(yǔ)音提示選單后,用戶(hù)還要不斷地停下來(lái),按動(dòng)電話(huà)上有限的數字按鍵,進(jìn)行相應的選擇,然后繼續聽(tīng)下一段的語(yǔ)音提示。在使用了語(yǔ)音識別技術(shù)后,用戶(hù)可以像與服務(wù)員一樣,采用語(yǔ)音的方式,在一句話(huà)里面發(fā)出全部指令,避免了連續按鍵的過(guò)程。

  IVR流程跳轉困難。現有的IVR流程都是樹(shù)形結構,從一個(gè)分支跳到另外一個(gè)分支必須通過(guò)根(最上級菜單)進(jìn)行。比如:用戶(hù)在進(jìn)入1860移動(dòng)通信公司的客戶(hù)服務(wù)系統后,進(jìn)入“辦理業(yè)務(wù)”選單下面的“開(kāi)通業(yè)務(wù)”,如果想進(jìn)入查詢(xún)手機的話(huà)費,需要首先退出到最頂層選單,然后進(jìn)入“話(huà)費查詢(xún)”的“查詢(xún)本機話(huà)費”一項。

  須通過(guò)DTMF按鍵操作。特別在雙手都被占用的情況下,嚴重影響工作效率。


  現有ASR系統存在問(wèn)題


  ASR技術(shù)被引入后,其優(yōu)勢得到發(fā)揮,同時(shí)也在IVR系統中引入了一些問(wèn)題。

  無(wú)法打斷語(yǔ)音提示。在很多IVR系統中,通過(guò)DTMF打斷語(yǔ)音提示進(jìn)行操作。引入ASR技術(shù)后,無(wú)法通過(guò)語(yǔ)音來(lái)打斷語(yǔ)音提示,只能在語(yǔ)音提示結束后才可以進(jìn)行操作。



  圖1 傳統的ASR示意圖

  沒(méi)有處理語(yǔ)音插入的能力。語(yǔ)音插入的能力允許用戶(hù)在系統播放聲音時(shí)仍然對系統具有控制權。可以想像,當用戶(hù)對IVR播放的一段漫長(cháng)的新聞失去興趣的時(shí)候,如果無(wú)法跳過(guò)它,唯一的選擇就是掛機。一個(gè)成熟的IVR系統應該賦予用戶(hù)在任何時(shí)候都可以具有控制流程的權力。換而言之,在放音時(shí)仍然能夠識別語(yǔ)音命令。

  電話(huà)線(xiàn)路質(zhì)量差,回聲嚴重,識別率不高。在針對IVR系統開(kāi)發(fā)商的一項調查中,研究機構發(fā)現影響ASR技術(shù)推廣的首要問(wèn)題在于A(yíng)SR的識別率。在家用電腦中使用的ASR效果明顯好于CTI中的應用,究其原因,與電話(huà)線(xiàn)路質(zhì)量和嚴重的回聲干擾有關(guān)系。

  如果不能充分發(fā)揮語(yǔ)音識別在減少系統延遲、提高效率、降低整體響應時(shí)間方面的優(yōu)勢,而僅僅將語(yǔ)音輸入作為DTMF按鍵輸入的替代品,那么語(yǔ)音門(mén)戶(hù)存在的意義將大打折扣。


  D系列支持語(yǔ)音門(mén)戶(hù)


  D系列PCI語(yǔ)音卡

  DSP是通信設備的重要基石。它以先進(jìn)的數字計算方法對信號進(jìn)行處理,具有處理速度快、靈活、抗干擾能力強等優(yōu)點(diǎn),尤其適合進(jìn)行語(yǔ)音處理。

  D系列PCI語(yǔ)音卡是采用DSP數字信號處理技術(shù)實(shí)現對語(yǔ)音、交換、信令進(jìn)行處理的新一代語(yǔ)音板卡,支持環(huán)路中繼、1號信令、7號信令、數字1號信令(ISDN-PRI)等線(xiàn)路接口,提供會(huì )議、TTS、語(yǔ)音壓縮等功能。

  D系列PCI語(yǔ)音卡具有400-1000 MIPS的運算能力,為語(yǔ)音識別這樣需要占用大量資源的應用提供了廣闊的天地;與傳統的ASR不同的是,D系列PCI語(yǔ)音卡通過(guò)語(yǔ)音打斷、回聲消除、內存錄音等技術(shù)的應用,減輕了ASR的沉重負擔,為打破ASR應用瓶頸發(fā)揮了關(guān)鍵的作用。

  回聲消除技術(shù)處理語(yǔ)音命令

  回聲消除ECR,是基于DSP技術(shù)對語(yǔ)音通道的聲音進(jìn)行的實(shí)時(shí)控制。其實(shí)現方法在于:在電話(huà)線(xiàn)路上收到的聲音里,去掉IVR系統播放的聲音,從而保證收到的聲音是純凈的。

  東進(jìn)的ECR算法是與美國某DSP專(zhuān)業(yè)算法研究機構合作,基于G.168國際標準,并做了大量算法優(yōu)化工作。

  圖2 達到商用要求的ASR系統

  語(yǔ)音識別的過(guò)程實(shí)際是一個(gè)話(huà)音樣本錄音和聲音比較的過(guò)程。當錄下來(lái)的聲音樣本(收到的聲音)是純凈或者比較純凈的時(shí)候,識別率將大大提高。試驗表明,采用回聲消除技術(shù)后,語(yǔ)音識別率得到顯著(zhù)提高,從原有的70-80%提高到95%以上,滿(mǎn)足了商用要求,如圖2所示。

  采用語(yǔ)音檢測實(shí)現語(yǔ)音打斷

  語(yǔ)音打斷(barge-in)可以減輕系統資源占用,提高語(yǔ)音識別系統的利用率,而且減少用戶(hù)等待的時(shí)間,節省話(huà)費開(kāi)支,為構建高精度和高密度的系統創(chuàng )造了條件。

  語(yǔ)音檢測 (VAD-Voice Activity Detection)技術(shù)的應用是實(shí)現語(yǔ)音打斷的前提。其原理是檢測線(xiàn)路上的聲音能量(Voice Energy Detection),只有在檢測到語(yǔ)音后才啟動(dòng)錄音和語(yǔ)音識別進(jìn)程。

  圖3 語(yǔ)音門(mén)戶(hù)系統結構圖

  一個(gè)貼近現實(shí)應用的語(yǔ)音門(mén)戶(hù)應該同時(shí)基于D系列PCI語(yǔ)音卡的VAD和ECR技術(shù)。在應用了上述技術(shù)后,語(yǔ)音門(mén)戶(hù)的系統結構圖如圖3 所示。

《中國計算機報》2001/06/21

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 桦甸市| 铁岭县| 澎湖县| 扎兰屯市| 平山县| 巴楚县| 滁州市| 鸡东县| 丹阳市| 灵寿县| 石家庄市| 嘉鱼县| 武穴市| 湖口县| 福建省| 庆元县| 萝北县| 吴堡县| 汝城县| 闵行区| 中江县| 宾阳县| 万荣县| 乌什县| 毕节市| 沅江市| 华安县| 古交市| 伊宁市| 西充县| 老河口市| 曲阜市| 蒙阴县| 论坛| 冀州市| 广州市| 西华县| 九龙城区| 铁力市| 比如县| 怀远县| http://444 http://444 http://444 http://444 http://444 http://444