Aculab的TTS(文語(yǔ)轉換)技術(shù)
2004/04/28
Aculab的V3.0版TTS性能明顯提升,包括對W3C標準語(yǔ)音合成標記語(yǔ)言(SSML)的支持、對新增的巴西葡萄牙語(yǔ)和意大利語(yǔ)的支持以及更新的英國英語(yǔ)男聲和西班牙語(yǔ)的女聲、對所有支持語(yǔ)言發(fā)音和韻律的改善處理,以及發(fā)聲字典工具的提供。Aculab的基于主機TTS,采用的是完全可伸縮的、運行快速且準確的波形拼接語(yǔ)音合成算法,具有占用內存小、通道容量大和采用客戶(hù)機/服務(wù)器結構等特點(diǎn)。
Aculab的TTS和Prosody DSP資源卡一起工作。Prosody板卡除了擔當合成的音頻信號放音功能外,還能同時(shí)啟動(dòng)其他DSP資源的運行。據此,開(kāi)發(fā)商可以采用Aculab的統一API,把TTS`、語(yǔ)音識別及其他不同的語(yǔ)音處理算法結合起來(lái),從而提高語(yǔ)音增值業(yè)務(wù)的性能。當和Prosody板卡一起使用時(shí),TTS可以在A(yíng)culab的網(wǎng)站上免費下載。
語(yǔ)音技術(shù)
隨著(zhù)近來(lái)語(yǔ)音和語(yǔ)言處理技術(shù)的快速發(fā)展,采用Aculab TTS和Prosody板卡可以創(chuàng )建更為復雜的、具有創(chuàng )新意義的應用解決方案,來(lái)滿(mǎn)足多元化市場(chǎng)的需求。例如,用戶(hù)接通統一消息應用后,就可以用電話(huà)訪(fǎng)問(wèn)并聽(tīng)取具有電子格式的文本消息。這類(lèi)應用對于那些不在辦公室、卻又需要及時(shí)收取電子郵件的人來(lái)講意義非凡。在呼叫中心環(huán)境里,采用TTS可以把文字信息念給呼叫用戶(hù)聽(tīng),企業(yè)或其他機構可以在不增加業(yè)務(wù)人員的前提下,改善客服的質(zhì)量。
這類(lèi)語(yǔ)音應用都需要把文字信息念出來(lái),在文字信息頻繁更新或預先錄制語(yǔ)音成本過(guò)于昂貴的情況下,TTS的價(jià)值尤其顯著(zhù)。
Acualb TTS技術(shù)是因此類(lèi)應用應運而生的。他的獨特之處是在技術(shù)開(kāi)發(fā)過(guò)程中已充分考慮到了電話(huà)網(wǎng)絡(luò )帶來(lái)的局限,如有限的帶寬、嘈雜的電話(huà)接聽(tīng)環(huán)境以及應用對高通道密度的需求。Aculab的TTS即使在處理很長(cháng)的文本段落時(shí),也能合成出一致性強和智能化的電話(huà)語(yǔ)音。
TTS系統結構
Aculab的TTS和Prosody板卡配合使用,無(wú)論是PCI還是cPCI格式的Prosody板卡都能通過(guò)E1或T1網(wǎng)絡(luò )接口輸出合成的語(yǔ)音信號。這個(gè)TTS軟件和任何一種Aculab的、支持64Kbit/s速率放音的語(yǔ)音算法固件都兼容。Aculab的TTS也可以在一個(gè)DSP處理器內,同時(shí)運行其他語(yǔ)音處理算法,如錄音、回波抵消,以支持語(yǔ)音識別所需的"barge-in"。
所有這一切意味著(zhù):開(kāi)發(fā)商可以受益于多種Prosody語(yǔ)音技術(shù)的靈活組合,來(lái)構建可靠性強的、高性能的和可擴展的應用系統。
SSML支持
Aculab現在支持W3C的SSML標準,更進(jìn)一步地提高了應用中的靈活性。
允許在給定的文本內進(jìn)行語(yǔ)音學(xué)標注,可以為易于混淆的詞提供正確的發(fā)音,如:把"Smyth"讀成"Smith"而不是"Smythe"。
SSML標準提供的標記能改善文本預處理的性能。加上簡(jiǎn)單的標記,就可以很容易地判定數字1956是讀成年份、整型數還是一個(gè)數字串。
有了對SSML的支持,Aculab的TTS可以在文本內改變聲音或語(yǔ)言特性,并能控制基頻、語(yǔ)音速率、停頓和重音等。當合成的和預錄的語(yǔ)音混合使用,或需要為特定的聽(tīng)眾定制聲音播放時(shí),這些特性更有用。
通道容量
TTS應用里,文本需要通過(guò)電話(huà)線(xiàn)路傳輸然后讀出來(lái),所以應用中要考慮一些特殊的因素:包括中繼線(xiàn)的數量、DSP的處理能力以及主機負載和處理能力等。采用基本的Intel Pentium III / 700MHz的客戶(hù)機,配合具有兩個(gè)DSP處理器和PM4模塊的Prosody板卡,就可以利用Aculab的TTS輕松地同時(shí)向120個(gè)呼叫用戶(hù)播放根據文本轉換來(lái)的語(yǔ)音。所以,開(kāi)發(fā)商可以放心地實(shí)施高密度的語(yǔ)音解決方案,來(lái)提高競爭能力。
特性總結
·支持的語(yǔ)言
可以動(dòng)態(tài)改變。支持的語(yǔ)言包括:英國英語(yǔ)、美國英語(yǔ)、法語(yǔ)、德語(yǔ)、歐洲西班牙語(yǔ)、巴西葡萄牙語(yǔ)、意大利語(yǔ)和拉丁美洲西班牙語(yǔ)等。
·聲音變化
每種語(yǔ)言都有預配置的聲音類(lèi)型。Aculab的新版TTS允許開(kāi)發(fā)商選擇多達十種的語(yǔ)音變種。
·操作系統
支持Windows NT 4.0,Windows XP/2000,Linux和Sun SPARC Solaris等。
·免費的許可證
不收取按通道計算的使用許可證費用,可以隨時(shí)隨地在A(yíng)culab網(wǎng)站上下載。
·文本輸入格式
Unicode和XML / SSML。
·E-mail預處理
這是一個(gè)可選的模塊,用來(lái)處理e-mail里特定的文本,如郵件地址、消息頭和URL等。V3.0 TTS擴充了這部分功能,使得e-mail消息的處理更加自然和準確。
·文本的歸一化
鑒別和適當擴充某些特殊文本域,包括日期、時(shí)間、貨幣、銀行賬號、電話(huà)號碼、縮略語(yǔ)以及一些標點(diǎn)符號(如引號、括號、星號等)。
·語(yǔ)調、重音和間隔
由于A(yíng)culab的TTS采用了更為復雜的語(yǔ)言模型來(lái)提高合成聲音的自然度和韻律特征,所以這些指標都有顯著(zhù)改善。合成的語(yǔ)音能準確地依參數而改變,確保了合成語(yǔ)音的可懂度。
·詞典管理
為了滿(mǎn)足開(kāi)發(fā)商調整發(fā)音或增加新詞的需要,Aculab開(kāi)發(fā)了具有圖形用戶(hù)界面、和平臺無(wú)關(guān)(Java)的詞典管理器。新版的此工具能用TTS把輸入字典的詞語(yǔ)讀出來(lái)。
·采樣率
和電話(huà)帶寬相應,TTS合成系統采用8KHz的采樣率。
·向兼容
采用TTS API,可以方便地控制音量、基頻和語(yǔ)音速率等。新增的SSML特性能更有力地控制這些TTS輸出涉及的語(yǔ)音特性。
Aculab公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
汕尾市|
偏关县|
阜城县|
泰顺县|
武冈市|
章丘市|
睢宁县|
自治县|
垦利县|
泗阳县|
阿勒泰市|
肇庆市|
广平县|
璧山县|
岗巴县|
乾安县|
深圳市|
泸州市|
景谷|
榆树市|
龙川县|
金乡县|
桃源县|
湖北省|
淄博市|
金湖县|
任丘市|
耿马|
景德镇市|
肇东市|
平谷区|
西充县|
旌德县|
河间市|
巴东县|
汽车|
太白县|
青州市|
纳雍县|
南丰县|
石河子市|
http://444
http://444
http://444
http://444
http://444
http://444