開(kāi)發(fā)ASR應用系統的相關(guān)技術(shù)和發(fā)展趨勢展望
NMS大中華區總經(jīng)理 何育麟 2003/05/21
當前,許多公司紛紛在他們的呼叫中心和交互語(yǔ)音應答應用系統(IVR)中采納語(yǔ)音識別技術(shù),用來(lái)降低運營(yíng)成本和提高客戶(hù)服務(wù)水平。計算機處理性能的突飛猛進(jìn)和不斷改進(jìn)的運算方法為語(yǔ)音識別技術(shù)的應用創(chuàng )造了良好的基礎。目前的語(yǔ)音識別技術(shù)可以識別多種語(yǔ)言的上百萬(wàn)單詞,并可以達到90%以上的準確識別率。用語(yǔ)音技術(shù)完全替代鍵盤(pán)來(lái)操作計算機可能還需要相當一段時(shí)間,但這項技術(shù)已經(jīng)快速的應用到了許多垂直市場(chǎng)的呼叫中心自動(dòng)化方面,如:金融服務(wù)、目錄服務(wù)等行業(yè)。
Kelsey集團在它的《2002語(yǔ)音生態(tài)系統》報告中預測,ASR商業(yè)應用在未來(lái)5年的年增長(cháng)率將達到34%。盡管這項報告的研究數據與當前市場(chǎng)的發(fā)展現狀相比略顯滯后,但是它指出了當前市場(chǎng)的發(fā)展趨勢。報告指出,供應商們必須清醒地意識到,當前的市場(chǎng)需要的是能夠切實(shí)滿(mǎn)足業(yè)務(wù)需要的解決方案,因而供應商們必須為他們的語(yǔ)音應用方案提供可信的投資回報分析。該報告預測,2005年語(yǔ)音應用市場(chǎng)的規模為410億美元。
語(yǔ)音識別技術(shù)在網(wǎng)絡(luò )和企業(yè)中的應用
在企業(yè),目前至少有70%的業(yè)務(wù)處理是通過(guò)電話(huà)進(jìn)行的,而移動(dòng)通訊所占的比例正在不斷上升。企業(yè)需要滿(mǎn)足客戶(hù)對高質(zhì)量服務(wù)的要求,同時(shí)也需要通過(guò)提供可增強CAPEX的服務(wù)來(lái)獲取競爭優(yōu)勢,在向客戶(hù)提供更好服務(wù)的同時(shí),提高投資回報率。
在網(wǎng)絡(luò )應用方面,電信運營(yíng)商們可以提供各種語(yǔ)音增強服務(wù),如:語(yǔ)音驅動(dòng)撥號、可通過(guò)語(yǔ)音控制的語(yǔ)音郵件和日程表、支持語(yǔ)音的統一消息服務(wù)、目錄助理、電話(huà)會(huì )議管理等等。語(yǔ)音門(mén)戶(hù)應用采納了大量的語(yǔ)音識別技術(shù),可以提供非常廣泛的服務(wù),尤其是針對移動(dòng)用戶(hù)。
發(fā)展新趨勢
在幾年前,語(yǔ)音識別技術(shù)還僅僅局限應用于IVR系統升級上。最近,開(kāi)發(fā)商SpeechWorks、Nuance和IBM紛紛推出了更進(jìn)一步的應用。由SpeechWorks和Convergys公司于2002年上半年組織的一次調研結果顯示,大多數呼叫中心機構有采用新型ASR應用系統的計劃,而不再愿意升級現有的IVR應用系統。這意味著(zhù)相關(guān)應用不僅橫向可以擴大新的顧客群,縱向也可以向老客戶(hù)推出新的應用系統。許多公司都希望采用簡(jiǎn)潔的語(yǔ)音識別技術(shù)來(lái)改進(jìn)細分市場(chǎng)的服務(wù),并降低經(jīng)營(yíng)成本,相關(guān)的細分市場(chǎng)包括移動(dòng)數據接入和呼叫中心自動(dòng)化等。其它語(yǔ)音應用包括:語(yǔ)音驅動(dòng)撥號、語(yǔ)音郵件、電子郵件閱讀器、日程管理和聊天室。上述應用的實(shí)現得益于當今相關(guān)技術(shù)的進(jìn)步,包括:更快的芯片處理速度、改進(jìn)的算法、多語(yǔ)言和語(yǔ)調研究、以及大容量的詞匯庫。
ASR應用系統基礎
下圖顯示了采用NMS平臺產(chǎn)品的ASR應用平臺總體結構。

構筑ASR平臺的基礎通信硬件包括NMS公司的AG 2000、AG 4000和CG 6000系列板卡。
NMS公司的Natural AccessTM API 應用接口為電信硬件提供了非并行編程的靈活性。
特定供應商提供的ASR/TTS客戶(hù)端軟件組件。
特定供應商提供的ASR/TTS服務(wù)端軟件組件,可提供語(yǔ)音識別或文本朗讀引擎。
系統集成商和OEM廠(chǎng)商提供的應用管理軟件。
注:本圖只是應用系統的邏輯顯示。整套系統可以安裝上單臺計算機上,也可以分布在多臺服務(wù)器上。
NMS公司提供的集成解決方案
ASR和TTS是NMS公司CG系列(Convergence Generation )和AG系列(Alliance Generation®)板卡的可選功能。采用Natural Access API應用接口,語(yǔ)音功能可以與同一塊板卡上的傳真、會(huì )議應用、IP功能、呼叫處理、轉移等其它NMS處理功能相集成,這樣就可以采用CG系列和AG系列板卡開(kāi)發(fā)功能強大、經(jīng)濟和靈活的電信和增強服務(wù)解決方案。
采用單插槽的CG系列和AG系列DSP及接口板卡,NMS公司可提供配置有一系列高端語(yǔ)音處理技術(shù)的系統平臺,并擁有無(wú)與倫比的尺寸、多樣性和產(chǎn)品質(zhì)量。
開(kāi)發(fā)商開(kāi)發(fā)具有語(yǔ)音功能的應用系統,可以選擇不同的供應商、不同復雜程度的技術(shù)、不同操作系統、以及現有各種算法均支持的語(yǔ)言。NMS的體系結構可以幫助開(kāi)發(fā)者在眾多的語(yǔ)音技術(shù)領(lǐng)先開(kāi)發(fā)商中選擇最佳的語(yǔ)音應用解決方案。這些語(yǔ)音技術(shù)供應商與NMS公司合作,提供了完整的、高性能的語(yǔ)音集成方案,為語(yǔ)音應用系統提供統一的開(kāi)發(fā)環(huán)境和與其它語(yǔ)音應用系統應用的底層集成。
該開(kāi)發(fā)平臺不僅提供集成的電話(huà)和語(yǔ)音API應用接口,還提供應用于IVR和呼叫中心的關(guān)鍵功能,包括:
·IP和PSTN之間的連接
·可擴展性
·板卡內置的增強回音消除處理功能,用于增強語(yǔ)音識別、雙音多頻和音調偵聽(tīng)
·語(yǔ)音重放時(shí)干涉信號的監測
·同步進(jìn)行播放和錄音的全雙工功能
·基于DSP的語(yǔ)音活動(dòng)偵聽(tīng)(VAD,Voice Activity Detection)算法,可以顯著(zhù)提高語(yǔ)音應用系統的整體性能。(Natural
Access 2003-1版提供)
NMS技術(shù)的適用范圍
|
AG 2000 |
AG 4000 |
CG 6000系列 |
小型、語(yǔ)音驅動(dòng)的自動(dòng)服務(wù)臺 |
|
|
|
中規模公司的消息應用服務(wù)器 |
|
|
|
混合網(wǎng)絡(luò ) and/or 大型電信級應用 |
|
|
|
NMS技術(shù)為研制ASR應用系統的開(kāi)發(fā)商們提供了各種需要的功能,包括:各種領(lǐng)先的語(yǔ)音識別技術(shù)、解決實(shí)際應用問(wèn)題的回音消除處理和barge-in優(yōu)秀功能、可支持傳真、會(huì )議應用和語(yǔ)音的通用接口,這些功能完全集成在一塊板卡上,可擴充應用系統到上千個(gè)接口,并可以低成本的、快速把應用方案推向市場(chǎng)。
NMS公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
麻阳|
女性|
宕昌县|
奎屯市|
株洲县|
赣州市|
安泽县|
南雄市|
塔城市|
衡水市|
泰宁县|
青岛市|
大竹县|
精河县|
浏阳市|
平武县|
理塘县|
临潭县|
枣庄市|
青岛市|
宽城|
汽车|
九寨沟县|
柘城县|
镇赉县|
红原县|
濉溪县|
华蓥市|
鄂伦春自治旗|
烟台市|
贡嘎县|
高清|
丰镇市|
怀远县|
青冈县|
利川市|
襄樊市|
新余市|
东明县|
广德县|
抚顺市|
http://444
http://444
http://444
http://444
http://444
http://444