語(yǔ)音合成基于DSP
——東進(jìn)基于DSP的TTS語(yǔ)音卡
2001/08/30
在各種 CTI應用系統中,電腦語(yǔ)音板卡是一塊基石,板卡性能是否穩定、單機板功能集成高低且采用微處理器與否,直接影響到整個(gè)應用系統的穩定性。DSP是近年來(lái)廣泛應用于通信行業(yè)的新技術(shù),自DSP技術(shù)應用到電腦語(yǔ)音板卡后,大大增強了板卡的功能,也為集成新技術(shù)和新功能奠定了基礎。
TTS作為CTI的一項核心技術(shù),就是利用DSP技術(shù)集成到語(yǔ)音卡上的。
在目前的CTI應用中,自動(dòng)語(yǔ)音應答系統的放音大多采用錄音——簡(jiǎn)單拼接——重放的方法。
而中文語(yǔ)音合成技術(shù)(TTS),是基于語(yǔ)音數據庫技術(shù),采用語(yǔ)音基元拼接的方法進(jìn)行語(yǔ)音合成。采用這種技術(shù)的漢語(yǔ)文語(yǔ)轉換系統,通過(guò)隱馬可夫模型法等算法進(jìn)行文本分析,依據漢語(yǔ)韻律的變化建立多樣本的語(yǔ)音基元數據庫,并采用恰當技術(shù)挑選所需語(yǔ)音單元拼接起來(lái),生成高自然度的語(yǔ)句。由于語(yǔ)音基元樣本截取于自然語(yǔ)音波形,所以合成的語(yǔ)音具有高清晰度和高自然度。而且只要語(yǔ)音數據庫足夠完備,就可以拼接出任何語(yǔ)句。
TTS技術(shù)的應用在CTI環(huán)境下的特殊技術(shù)要求包括:
◆并發(fā)處理能力要求高。CTI是并發(fā)、隨機的業(yè)務(wù),要求能夠同時(shí)處理多個(gè)呼叫請求,因此要求同時(shí)多通道TTS放音,支持高密度應用。
◆實(shí)時(shí)通信處理。電話(huà)通信是實(shí)時(shí)通信,要求TTS的時(shí)延控制在很小的范圍內(低于0.1秒),否則可能造成接續不夠連貫。
◆開(kāi)放性環(huán)境是大勢所趨。通信業(yè)務(wù)在逐步開(kāi)放,TTS需要具備二次開(kāi)發(fā)接口性能才可以集成在CTI、智能網(wǎng)等業(yè)務(wù)中。
◆靈活擴展性。隨著(zhù)業(yè)務(wù)規模擴展,TTS 能夠隨著(zhù)CTI系統擴容而靈活擴展,最大限度保護既有投資。
◆版本方便升級。當TTS產(chǎn)品的技術(shù)性能得到進(jìn)一步提升時(shí),在不增加任何硬件的情況下可以通過(guò)軟件更新實(shí)現版本的升級。
為滿(mǎn)足這些要求,很多供應商提出了技術(shù)方案,語(yǔ)音卡供應商Dialogic和深圳東進(jìn)分別提出了自己的解決方案——基于DSP技術(shù)的TTS語(yǔ)音卡。
基于DSP的TTS語(yǔ)音卡解決方案充分考慮通信網(wǎng)環(huán)境,特別是電話(huà)通信的環(huán)境,很好滿(mǎn)足了CTI系統的技術(shù)需求。
東進(jìn)(http://www.dj.com.cn)的解決方案是在一塊語(yǔ)音板卡同時(shí)集成32線(xiàn)TTS合成和16線(xiàn)電話(huà)呼叫處理能力。其D160A-TTS語(yǔ)音卡,采用DSP芯片、內置TTS技術(shù)、內置32方會(huì )議、單卡提供16通道的電話(huà)語(yǔ)音處理功能的模擬語(yǔ)音卡,在卡內程序中嵌入了TTS 系統的接口,支持中文WindowsNT平臺和中文語(yǔ)音合成。
下面以深圳東進(jìn)的D160A-TTS產(chǎn)品為例簡(jiǎn)單介紹TTS語(yǔ)音卡的應用。在數字中繼線(xiàn)路上(ISDN-PRI信令,1號信令,7號信令)的硬件構成如右圖。
TTS方面的操作是在D160A-TTS的DSP基礎上實(shí)現的,而通過(guò)E1線(xiàn)路和電信網(wǎng)絡(luò )接口的處理、信令處理、交換、接續控制等,都是由D320/640 E1實(shí)現的,調用的是數字中繼卡的API函數。
單獨的一塊D160A-TTS卡上面除了支持TTS的功能之外,還可以處理呼叫控制、信號產(chǎn)生、DTMF收發(fā)、電話(huà)會(huì )議、A/D轉換、D/A轉換等。
D160A-TTS數字中繼線(xiàn)路上的硬件構成圖
從軟件結構上面來(lái)看,基于DSP的TTS技術(shù)具有模塊化、開(kāi)放性、可升級性等特點(diǎn)。軟件模塊的組成如下:
TTS API(TTS編程接口)是面向開(kāi)發(fā)商提供的接口,對于沒(méi)有TTS技術(shù)背景的開(kāi)發(fā)人員來(lái)說(shuō),使用TTS API也可以開(kāi)發(fā)出完整的TTS程序。
D160A-TTS軟件模塊組成圖
TTS語(yǔ)音卡在CTI系統中應用非常廣泛,在銀行、政府機關(guān)、氣象服務(wù)中心、考試中心、公用事業(yè)、114查詢(xún)臺、160/168信息臺等的IVR交互式語(yǔ)音應答系統中都可采用,甚至用在網(wǎng)絡(luò )中,用戶(hù)可以通過(guò)普通電話(huà)撥入Internet,利用TTS技術(shù)收聽(tīng)網(wǎng)頁(yè)和E-Mail。
中國計算機報 2001/08/30
東進(jìn)技術(shù)總裁賀建楠談3G應用落地:進(jìn)展超出預期 2009-09-25 |
東進(jìn)技術(shù)喜獲“2009年度優(yōu)秀通信企業(yè)” 2009-09-23 |
東進(jìn)技術(shù)推出新一代數字交叉鏈接設備 2009-09-15 |
東進(jìn)技術(shù)助力江蘇昆山城管實(shí)現數字化 2009-09-02 |
當呼叫中心遇到ERP 東進(jìn)技術(shù)助力河北百度 2009-08-26 |