2001/08/10
一、 捷通TTS(jTTS)介紹
1.1. 捷通TTS技術(shù)文語(yǔ)轉換的基本原理
捷通TTS技術(shù)文語(yǔ)轉換的基本結構:
1.1.1. 語(yǔ)言學(xué)處理
----語(yǔ)言學(xué)處理在文語(yǔ)轉換系統中起著(zhù)重要的作用,他主要是模擬人對自然語(yǔ)言的理解過(guò)程--文本規整、詞的切分、語(yǔ)法分析和語(yǔ)義分析,使計算機對輸入的文本能完全理解,并給出后兩部分所需要的各種發(fā)音提示。
1.1.2. 韻律處理
----韻律處理的目的是為合成語(yǔ)音規劃出音段特征,如音高、音長(cháng)和音強等,使合成語(yǔ)音能正確表達語(yǔ)意,聽(tīng)起來(lái)更加自然悅耳。
1.1.3. 聲學(xué)處理
----聲學(xué)處理的主要功能是根據前兩部分處理結果的要求輸出語(yǔ)音,即合成語(yǔ)音。
1.2. 捷通TTS的特點(diǎn)
捷通公司的TTS技術(shù)(jTTS),是具有自我版權的TTS技術(shù),以大規模真實(shí)錄音的語(yǔ)音庫為基礎,采用多樣本、不等長(cháng)言語(yǔ)段波形拼接技術(shù),增加音庫壓縮算法和音色變換算法形成核心技術(shù),發(fā)音清晰流利、自然度高。
捷通TTS在文本到語(yǔ)音的轉換過(guò)程中不是對文字到語(yǔ)音的簡(jiǎn)單映射,還包括了對文字的理解,以及對語(yǔ)音的韻律處理。
捷通通過(guò)研究漢語(yǔ)的聲調、重音、語(yǔ)調的聲學(xué)特點(diǎn),設計了重音和語(yǔ)調的模擬。
捷通TTS在韻律規則方面,采用統計和規則相結合的方法,研究了漢語(yǔ)韻律規則并進(jìn)行了一定的韻律模擬工作,以韻律層級的匹配作為選音段的基本原則。
捷通TTS提供中英文混讀功能,嵌入中文內部的常用單詞的音色與中文保持一致,更加自然流暢。
捷通TTS的音庫大小可調節,能提供從PC、語(yǔ)音卡到掌上電腦TTS技術(shù)的全面解決方案。可以將音庫和程序壓縮到共1.5M的水平,實(shí)現了在嵌入式系統上的應用。
提供捷通TTS開(kāi)發(fā)工具包(jTTS SDK),可以合成到聲卡,合成到文件,直接獲取語(yǔ)音流,支持多線(xiàn)程操作,支持GBK、BIG5字符集的文本閱讀。
其中音庫大小可調節的特點(diǎn)是捷通TTS能夠移植到掌上電腦等嵌入式設備的關(guān)鍵特點(diǎn),也是捷通TTS獨具的優(yōu)點(diǎn)。
----捷通公司在2001年7月完成了最新版本的捷通TTS技術(shù)。新版本基于大規模真實(shí)錄音的語(yǔ)音庫,音庫提供的樣本多,選音范圍大,可選擇到更匹配的發(fā)音,另外,在選音和拼接時(shí)將超越了音節的層次,能夠進(jìn)行詞甚至短句層次的拼接。因此,在自然度、可懂度方面捷通新TTS具有較大的提高。再加上英文單詞的音色與中文保持一致,可支持GBK字庫中的所有字符的發(fā)音,新的捷通TTS技術(shù)的合成的語(yǔ)音幾乎達到自然說(shuō)話(huà)的效果。
......
網(wǎng)上全文:http://m.yshhuang.com/factory/tts/www.infoquick.com.cn/infoquick01_0803.htm
|