聲訊TTS應用解決方案
2001/08/29
一、語(yǔ)音合成技術(shù)及其在聲訊臺中的應用
1 語(yǔ)音合成簡(jiǎn)介
語(yǔ)音合成(Text To Speech),簡(jiǎn)稱(chēng)TTS技術(shù),它涉及聲學(xué)、語(yǔ)言學(xué)、數字信號處理技術(shù)、多媒體技術(shù)等多個(gè)學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項前沿技術(shù)。解決的主要問(wèn)題就是如何將文本狀態(tài)的文字信息轉化為可聽(tīng)的聲音信息。使以往只能用眼睛看的文字信息,也可以用耳朵來(lái)聽(tīng)。通俗地說(shuō),就是讓電腦開(kāi)口說(shuō)話(huà)的技術(shù)。這項技術(shù)在以語(yǔ)音信息服務(wù)為主要方式的聲訊業(yè)務(wù)中尤其有應用意義。
2 語(yǔ)音合成技術(shù)的優(yōu)點(diǎn)
語(yǔ)音是信息傳播的一大媒介,隨著(zhù)多媒體信息需求的增大,語(yǔ)音服務(wù)系統近年來(lái)發(fā)展較為迅速。下表是語(yǔ)音合成技術(shù)和傳統錄音回放技術(shù)在語(yǔ)音服務(wù)中相比較的情況。
TTS |
錄音制作 |
|
存儲空間的要求 |
較低 |
較高 |
節目開(kāi)發(fā)周期 |
短 |
長(cháng) |
出錯可能 |
低 |
高 |
信息的更新速度 |
即時(shí) |
慢 |
信息庫建立和維護的工作量 |
低 |
高 |
二、全省節目文本內容聯(lián)網(wǎng)方案
在聲訊臺使用TTS技術(shù)能實(shí)現一種全新的節目聯(lián)網(wǎng)方式。在實(shí)現數據聯(lián)網(wǎng)情況下,節點(diǎn)聲訊臺中的一個(gè)或者多個(gè)制作的節目?jì)热菽芡ㄟ^(guò)文本的方式在網(wǎng)絡(luò )上共享;其他的節點(diǎn)聲訊臺取得這些文本內容,在本地進(jìn)行語(yǔ)音合成,進(jìn)而開(kāi)通相應的節目。從而可以使用少量的帶寬來(lái)輕松實(shí)現信息共享,為各地的用戶(hù)提供全面的語(yǔ)音服務(wù)。
1 集中制作、聯(lián)網(wǎng)下傳方式
單一的節目制作中心一般放置在省中心。在節目制作中心,節目數據以數據庫或者文本文件的方式存放于節目數據倉庫中。在節目制作中心運行文本訪(fǎng)問(wèn)服務(wù)代理,接受各地市臺的數據請求并發(fā)送相應的數據。各個(gè)地市臺通過(guò)文本請求、接收代理向中心請求或者接收文本數據,存放于本地數據倉庫,等待語(yǔ)音合成服務(wù)器合成成語(yǔ)音文件,地市臺使用合成后的語(yǔ)音文件迅速開(kāi)通相應的節目。
節目文本數據的共享和消息通知,可以通過(guò)兩種方式實(shí)現,即地市臺定時(shí)(或人為)向中心請求數據,或者中心數據服務(wù)代理向地市臺廣播數據增加消息,并發(fā)送增加的數據。
三、TTS技術(shù)應用方案通過(guò)節目文本內容聯(lián)網(wǎng),實(shí)現節目文本內容的共享,從文本到語(yǔ)音的轉換,開(kāi)通相應的節目則需要語(yǔ)音合成來(lái)完成。
科大訊飛針對各地聲訊平臺不同的建設狀況,提出實(shí)時(shí)合成和離線(xiàn)合成兩種解決方案,實(shí)現在現有平臺上嵌入語(yǔ)音合成功能。
1.離線(xiàn)合成
在用戶(hù)電話(huà)呼入之前生成相應語(yǔ)音文件,每個(gè)語(yǔ)音文件可供多個(gè)用戶(hù)重復聽(tīng)取。特點(diǎn)是資源消耗少(普通PC即可實(shí)現),硬件要求低,能較好的替代人工錄音的語(yǔ)音制作方式。
離線(xiàn)合成可以與省級甚至全國聲訊網(wǎng)絡(luò )結合,開(kāi)發(fā)出靈活的聯(lián)網(wǎng)業(yè)務(wù)。即文本訪(fǎng)問(wèn)代理從廣域網(wǎng)上取得節目文本數據存放于本地的文本數據共享目錄,語(yǔ)音合成服務(wù)器通過(guò)訪(fǎng)問(wèn)該目錄獲取節目文本合成為語(yǔ)音文件存放與服務(wù)器的語(yǔ)音文件共享目錄中。局域網(wǎng)內其他設備(IVR、MSI等等)訪(fǎng)問(wèn)語(yǔ)音文件共享目錄,向用戶(hù)播放最新生成的語(yǔ)音信息。
2.在線(xiàn)合成嵌入方案
在線(xiàn)合成是在用戶(hù)電話(huà)呼入的同時(shí)實(shí)時(shí)生成語(yǔ)音文件,并在該用戶(hù)呼入的通道播放,每個(gè)語(yǔ)音文件僅供該用戶(hù)聽(tīng)取。
在線(xiàn)合成包含離線(xiàn)合成的一切功能,且實(shí)時(shí)性好,業(yè)務(wù)靈活,可以開(kāi)展出各種個(gè)性化信息服務(wù),主要適用于對語(yǔ)音合成的實(shí)時(shí)性要求高的場(chǎng)合。
聲訊平臺的TTS升級是在現有平臺上增加TTS語(yǔ)音合成服務(wù)器,語(yǔ)音節點(diǎn)通過(guò)語(yǔ)音合成網(wǎng)關(guān)調用TTS資源。語(yǔ)音合成服務(wù)器支持多路的實(shí)時(shí)語(yǔ)音合成,根據系統業(yè)務(wù)量可以方便地擴容。
由于不涉及到話(huà)務(wù)接入處理層的內容,聲訊臺采用前置交換方式還是后置交換方式不對嵌入改造工作的造成影響。
如圖所示,一個(gè)包含TTS服務(wù)的電話(huà)訪(fǎng)問(wèn)流程大致可分為七步:
(1)用戶(hù)電話(huà)撥入,系統IVR響應,獲得用戶(hù)按鍵等信息。
(2)IVR根據用戶(hù)輸入,向數據庫或文件等信息源申請數據。
(3)信息源返回文本數據給IVR。
(4)IVR通過(guò)其TCP通訊接口將需要合成的文本信息發(fā)送給TTS Server。
(5)TTS Server將用戶(hù)文本合成為語(yǔ)音文件放置在一個(gè)共享目錄中。
(6)TTS Server通過(guò)其TCP通訊接口通知IVR合成完畢,并返回文件名。
(7)IVR播放相應的語(yǔ)音文件給電話(huà)用戶(hù)。
四、TTS技術(shù)在聲訊臺的應用意義
新業(yè)務(wù)的開(kāi)發(fā)對現有聲訊平臺提出了更高的技術(shù)要求,目前全省聲訊平臺基本上沒(méi)有文字語(yǔ)音合成能力,數字合成也停留在單音報讀階段,播放出來(lái)的聲音生硬、不連續、不自然;而使用語(yǔ)音合成技術(shù)合成的語(yǔ)音自然、連續,接近人的發(fā)音,用戶(hù)感覺(jué)較親切,易聽(tīng)懂,可以大幅度提高服務(wù)質(zhì)量和用戶(hù)滿(mǎn)意度。可以說(shuō),TTS技術(shù)的應用是聲訊平臺技術(shù)升級的當務(wù)之急。
TTS技術(shù)在聲訊臺應用后可以直接開(kāi)發(fā)許多新業(yè)務(wù),如:
1.海量信息查詢(xún)類(lèi)業(yè)務(wù)
大部分海量信息如考試查分、征婚啟事、人才信息、電話(huà)廣告等,由于其內容龐大,往往無(wú)法在短期內完成錄音,即使可以事先錄音,也需要很長(cháng)的制作周期,而且在量大的時(shí)候肯定會(huì )出現人為錯誤;采用語(yǔ)音合成技術(shù)可以節約大量人力,縮短開(kāi)發(fā)周期,而且能夠完全保證了所有信息100%正確。
2.動(dòng)態(tài)信息查詢(xún)類(lèi)業(yè)務(wù)
聲訊節目逐漸地由現在娛樂(lè )型節目為主的節目構成轉向以應用型的節目為主,而多數的應用類(lèi)節目對實(shí)時(shí)性要求比較高,如證券行情、訂票、訂房等,上述應用中動(dòng)態(tài)信息不可能事先錄音,需要實(shí)時(shí)地從數據庫中讀取,動(dòng)態(tài)進(jìn)行語(yǔ)音合成,保證信息的實(shí)時(shí)性。
此外,在聲訊服務(wù)領(lǐng)域內,使用TTS技術(shù)不但對技術(shù)開(kāi)發(fā)工作來(lái)說(shuō)很重要,而且對于業(yè)務(wù)運營(yíng)方面也同樣如此。傳統的聲訊服務(wù)領(lǐng)域,信息的組織和維護都是由人工來(lái)完成的,需要人工錄音、文件拷貝等一系列步驟,工作煩瑣,維護不便,很難做到信息的實(shí)時(shí)更新,影響了服務(wù)質(zhì)量,而且占用存儲資源多。
由此可見(jiàn),TTS技術(shù)作為一個(gè)新興技術(shù),可以解決動(dòng)態(tài)信息和海量信息的查詢(xún)問(wèn)題,把它應用于聲訊領(lǐng)域,對于開(kāi)展增值業(yè)務(wù),改變傳統業(yè)務(wù)的實(shí)現方式,提高服務(wù)質(zhì)量都是很必要的。
科大訊飛供稿 CTI論壇編輯
訊飛暢言語(yǔ)音教具系統榮獲“創(chuàng )新軟件產(chǎn)品” 2009-09-08 |
科大訊飛嵌入式語(yǔ)音新產(chǎn)品發(fā)布會(huì )在深圳舉行 2009-09-07 |
“會(huì )說(shuō)話(huà)”的顯示屏提升居民小區信息服務(wù)水平 2009-09-07 |
訊飛語(yǔ)音助力太平人壽客服中心 2009-08-28 |
訊飛語(yǔ)音助力CDMA手機競爭終端市場(chǎng) 2009-08-14 |