InterPhonic 中英文混讀語(yǔ)音合成(2.2版本)新增特性介紹
2003/09/30
InterPhonic語(yǔ)音合成系統是面向中、高端應用的語(yǔ)音合成系統,以先進(jìn)的大語(yǔ)料語(yǔ)音合成技術(shù)和語(yǔ)音韻律描述體系為基礎,提供面向任意文本、任意篇章的連續語(yǔ)音合成功能,合成音質(zhì)可媲美真人發(fā)音。目前,InterPhonic系列產(chǎn)品已經(jīng)成為市場(chǎng)上的主流語(yǔ)音合成系統,在電信客服、語(yǔ)音門(mén)戶(hù)、證券客服等領(lǐng)域都有了廣泛的應用,不論是效果還是系統穩定性都得到用戶(hù)的肯定。
科大訊飛以人為本,致力于創(chuàng )造人類(lèi)信息時(shí)代信息獲取和溝通的最佳方式。InterPhonic CE 2.2作為其InterPhonic系列的最新產(chǎn)品,在合成效果方面,除了繼續提高中文與英文的合成效果之外,還在兩者之間如何更加流暢的銜接,以及如何更加方便快捷的實(shí)現效果定制方面取得了顯著(zhù)的改進(jìn)。除此之外,在系統的實(shí)用性、易用性等方面又有了進(jìn)一步的提高,在此基礎上,InterPhonic C&E2.2還新增了很多新的特性,如推出功能更加強大和完善的TTS Server Express語(yǔ)音合成服務(wù)器軟件,并且首次加入了CSSML編輯器和TTS Doctor技術(shù)支持工具。
一、 技術(shù)改進(jìn)
1. 產(chǎn)品效果方面
為了體現訊飛以人為本的宗旨,為了使用戶(hù)感受到專(zhuān)業(yè)語(yǔ)音科技給他們帶來(lái)的便利。InterPhonic CE v2.2在合成效果方面,主要增加了CE2.1系統中缺少的語(yǔ)氣詞合成、改進(jìn)了短語(yǔ)、短句效果,同時(shí)改進(jìn)了前端文本處理過(guò)程:
·語(yǔ)氣詞處理
語(yǔ)氣的應用,例如“是嗎?”“為什么呢?”“啊!”等。
在InterPhonic CE2.2以前的合成系統中不包含語(yǔ)氣詞的合成,對這些語(yǔ)氣的處理都按照陳述語(yǔ)在一些語(yǔ)音應用中存在者一些非陳述氣進(jìn)行,這種處理影響了語(yǔ)音應用的效果。InterPhonic CE 2.2引進(jìn)了語(yǔ)氣詞合成的處理,能夠處理疑問(wèn)、感嘆等語(yǔ)氣效果。這樣使得這些生活中常用的語(yǔ)句真正做到人性化,讓用戶(hù)體驗到親切感。
·短語(yǔ)合成效果改進(jìn)
InterPhonic CE 2.2在音庫中補充了一定的短句語(yǔ)料,擴大短句語(yǔ)料的覆蓋面,同時(shí)在前端文本分析中加入了短語(yǔ)語(yǔ)境的判斷和處理。改進(jìn)之后的系統在合成一些包含大量短句、短語(yǔ)的文本時(shí)效果上有比較明顯的提升,例如人名、地名、短語(yǔ)合成。這種特性讓系統的使用范圍得到進(jìn)一步加強。
·前端韻律算法改進(jìn)
InterPhonic CE v2.2中通過(guò)對詞類(lèi)調整和未登錄詞算法的改進(jìn),提高了韻律樹(shù)生成準確率,改進(jìn)了合成自然度。可以使合成的聲音更加和諧,愉悅聽(tīng)眾的耳朵。
·多音字處理改進(jìn)
新的多音字處理算法提高了多音字識別的準確率。減少了系統的誤讀率,更容易讓用戶(hù)接受。
2. 產(chǎn)品架構方面
·桌面版
InterPhonic CE 2.2系統提供了全新意義的桌面版,這種桌面版系統在保證與企業(yè)版相同的合成效果以外,有以下特點(diǎn):
1. 系統尺寸小
系統占用硬盤(pán)空間小,減少資源消耗,用戶(hù)可以靈活安裝,安裝后占用硬盤(pán)空間比以往版本更小;
2. 系統響應時(shí)間
桌面版合成系統能夠快速啟動(dòng),而且合成時(shí)也不會(huì )出現停頓,可以達到桌面軟件應用要求;
3. 提供所有的開(kāi)發(fā)接口
提供與企業(yè)版相同的開(kāi)發(fā)接口,改進(jìn)后的TTS COM控件可以提供多個(gè)應用的并發(fā)使用。
· TTS COM v1.1
TTS COM組件是TTS SDK中一個(gè)重要的組成部分,提供該組件的目的是適應多種開(kāi)發(fā)環(huán)境、簡(jiǎn)化開(kāi)發(fā)過(guò)程。不少用戶(hù)傾向于使用TTS COM組件開(kāi)發(fā)TTS應用程序,支持的開(kāi)發(fā)工具非常廣泛、語(yǔ)言類(lèi)型多種多樣。改進(jìn)的TTS COM組件已經(jīng)能夠實(shí)現幾乎所有的TTS功能,滿(mǎn)足一般的開(kāi)發(fā)需要,并在可用性、易用性方面得到進(jìn)一步完善。
·TTS Server Express v1.2
TTS Server Express提供了對基于網(wǎng)絡(luò )的TTS服務(wù)支持,是企業(yè)版合成系統的重要組成部分,TTS網(wǎng)絡(luò )應用的核心。TTS Server Express v1.2在功能、易用性等各方面進(jìn)行了一次全面的提升。
·CSSML Editor v1.0
通常情況下,TTS系統會(huì )根據上下文語(yǔ)法、語(yǔ)義來(lái)自動(dòng)確定文本的合成方式,但由于文本的復雜性和多樣性,這種自動(dòng)處理難以避免會(huì )出現錯誤,造成合成錯誤,效果不理想的情況。CSSML(中文語(yǔ)音合成標記語(yǔ)言)集成了XML的優(yōu)秀特性,與VoiceXML中包含的SSML兼容,可以用來(lái)指定文本合成方式,是通過(guò)標記方式改進(jìn)合成效果的最佳途徑。
從InterPhonic CE v2.1版本以后,CSSML規范已經(jīng)成為科大訊飛合成系統的一個(gè)重要部分,后期系統還將不斷擴大CSSML規范的支持范圍。CSSM具有兼容VoiceXML的嚴謹語(yǔ)法格式,并提供了功能豐富的標記。CSSML Editor提供了簡(jiǎn)單易用的CSSML可視化編輯環(huán)境,使得用戶(hù)可以快速高效地生成CSSML標記文本。
·數字規則
CE22系統在數字策略定制方面將進(jìn)一步改進(jìn),允許用戶(hù)設置數字策略匹配規則,設置對數字串如何處理的規則。這些設置都將提供在資源管理中心界面中,增加一種全新的資源類(lèi)型,這種資源從屬于資源包,在資源管理中心新建“數字規則”頁(yè)集中對該資源包的數字規則進(jìn)行設置。使得用戶(hù)可以按照自己的要求設置,進(jìn)一步滿(mǎn)足個(gè)性化的需求。
例如,可以設置這樣的一條手機號碼處理規則。
規則描述:手機號碼的處理規則
匹配條件:數字串長(cháng)度為11,前三位數字為130/133/135/136/137/138/139;
處理策略:“1”讀“幺”,韻律為335。
·CSSML支持的改進(jìn)
CE22繼續增強合成系統對CSSML規范的支持:
1. 支持UTF-8、UTF16格式的CSSML文本,自動(dòng)識別具有文件頭簽名的Unicode(UTF-16 LE)文本和Utf-8文本;
2. mark標記,支持命名事件和未命名事件,這個(gè)特性同時(shí)體現在TTS SDK中;
3. audio標記支持所有合成系統能夠識別的音頻格式;
4.
5. sayas標記增加對人名地名的支持;
6. meta標記的支持;
·字符集轉化的增強
InterPhonic CE2.2系統在字符集轉化方面進(jìn)行了增強:
1. 增加了對目前比較流行的編碼方式UTF-8的支持;
2. 改進(jìn)后的合成系統可以自動(dòng)識別UNICODE文本,并且自動(dòng)轉化合成。支持 UTF-8、UTF16格式的文本,自動(dòng)識別具有文件頭簽名的Unicode(UTF-16 LE) 文本和Utf-8文本;
·提供技術(shù)支持工具
合成系統的技術(shù)支持工作存在著(zhù)非常雷同而繁雜的步驟——確定用戶(hù)的應用環(huán)境:合成系統名稱(chēng)版本、操作系統名稱(chēng)版本、加密鎖路數、資源狀況等等。借助產(chǎn)品中提供的TTS Doctor技術(shù)支持工具,可以在便于進(jìn)行遠程的信息搜集和支持,更加快速的定位問(wèn)題發(fā)生的可能原因,提供專(zhuān)業(yè)的技術(shù)支持和服務(wù)。
二、 接口改進(jìn)
·增強對CSSML文本的支持
XML因其優(yōu)秀的的可擴展性和強大的數據表達能力已經(jīng)成為未來(lái)Internet上數據表達和傳輸的標準技術(shù),基于XML和VXML技術(shù)的CSMML規范也將成為中文語(yǔ)音合成的標準。CSSML規范是一套完備的中文語(yǔ)音合成標記規范,用戶(hù)可以通過(guò)CSSML標記文本來(lái)指定文本的合成方式,這種方法能夠解決一些語(yǔ)音合成系統難以處理的問(wèn)題。
InterPhonic CE 2.2系統保持處理CSSML格式的文本的特性。在后續的版本,訊飛依然會(huì )加強對CSMML規范的支持力度。用戶(hù)可以對需要合成的文本進(jìn)行編輯,將其編輯為CSSML格式的文本,對一些特殊用法、發(fā)音習慣進(jìn)行單獨標記,用以指導合成系統的合成,就可以提高合成效果、解決合成系統無(wú)法正確合成的多種問(wèn)題。
·網(wǎng)絡(luò )接口的改進(jìn)
相應于TTS Server的升級,CE2.2對TTS SDK中的網(wǎng)絡(luò )版標準接口進(jìn)行了改進(jìn),改進(jìn)之后的網(wǎng)絡(luò )接口:
1. 支持目前本地運行庫的所有參數;
2. 在連接的時(shí)侯可以指定超時(shí)時(shí)間、指定使用的網(wǎng)絡(luò )端口;
3. 支持運行日志,便于問(wèn)題解決和調試;
·TTS SDK改進(jìn)
除了TTS COM v1.1、網(wǎng)絡(luò )接口,CE2.2還對TTS SDK做了以下改進(jìn):
1.新的接口支持進(jìn)程內的多次初始化;
2.SAPI接口增加了日志功能;
3.增加了多個(gè)示例程序;
4.增加了對其他開(kāi)發(fā)語(yǔ)言的支持,如C#、ASP.NET。
以上無(wú)論是對合成效果的提升還是對系統架構和產(chǎn)品性能的優(yōu)化,乃至對接口的改進(jìn),文檔的修正,訊飛始終以專(zhuān)業(yè)的態(tài)度和高度的責任感去面對每一個(gè)問(wèn)題,盡可能的考慮到實(shí)際應用的每一個(gè)細節。想得更多,做得更多,我們將繼續盡心盡力,提供最優(yōu)秀的產(chǎn)品和最完善的服務(wù)。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
定兴县|
满洲里市|
新沂市|
昌宁县|
城口县|
仁寿县|
贵溪市|
东港市|
宾川县|
霍州市|
嵊泗县|
会东县|
灵丘县|
岳西县|
姜堰市|
宝兴县|
波密县|
凤庆县|
赫章县|
岳阳县|
威宁|
万全县|
建湖县|
叶城县|
揭东县|
浠水县|
正定县|
米林县|
霍邱县|
东乡族自治县|
新和县|
广丰县|
讷河市|
上饶县|
永川市|
通州市|
专栏|
乐昌市|
德令哈市|
桃园市|
武清区|
http://444
http://444
http://444
http://444
http://444
http://444