CSSML(中文語(yǔ)音合成標記語(yǔ)言)的發(fā)展與應用
2003/12/17
近年來(lái),隨著(zhù)中文語(yǔ)音技術(shù)的迅速發(fā)展和應用的逐步深入,語(yǔ)音產(chǎn)業(yè)的廣闊市場(chǎng)及其所凸現的強大的產(chǎn)業(yè)帶動(dòng)效應已經(jīng)初步顯示出來(lái)。為促進(jìn)中文語(yǔ)音產(chǎn)業(yè)的蓬勃發(fā)展,國家863專(zhuān)家組、國家信標委和技術(shù)監督局聯(lián)合決定由科大訊飛作為唯一的企業(yè)代表牽頭制訂中文語(yǔ)音技術(shù)接口標準與規范。2003年10月15日,由國家信息產(chǎn)業(yè)部主辦、安徽中科大訊飛信息科技有限公司承辦的"語(yǔ)音標準研討會(huì )"在合肥順利召開(kāi)。來(lái)自國家信標委、863專(zhuān)家組、相關(guān)科研院校的語(yǔ)音技術(shù)專(zhuān)家、學(xué)者和語(yǔ)音技術(shù)的關(guān)鍵應用廠(chǎng)商共40余人參加了此次會(huì )議。會(huì )上確定了由科大訊飛牽頭制定語(yǔ)音標準。
CSSML(Chinese Speech Synthesis Markup Language),即中文語(yǔ)音合成標記語(yǔ)言,正是在上述背景下由科大訊飛起草,經(jīng)歷數次中文語(yǔ)音技術(shù)標準研討會(huì )討論后形成的。
CSSML標記語(yǔ)言針對中文合成領(lǐng)域內的特殊要求,對W3C定義的SSML規范中的標記進(jìn)行擴展,并與SSML完全兼容。SSML(語(yǔ)音合成標記語(yǔ)言)是由W3C制定并在VoiceXML中使用,作為電話(huà)語(yǔ)音流程中語(yǔ)音合成控制的標準。SSML的基本任務(wù)就是在不同的應用平臺上為合成文本提供一個(gè)標準的控制語(yǔ)音輸出的方法,例如發(fā)音、音量、音調、語(yǔ)速等參數。而VoiceXML作為人與電話(huà)應用交互的流程描述語(yǔ)言,在當今的語(yǔ)音門(mén)戶(hù)、統一消息平臺等以語(yǔ)音驅動(dòng)的應用中正發(fā)揮著(zhù)越來(lái)越重要的作用。
CSSML在交互式語(yǔ)音應用中前景廣闊。通常,語(yǔ)音合成(Text-To-Speech)系統會(huì )根據當前的語(yǔ)流環(huán)境確定文本的具體合成方式,例如,數字按數值發(fā)音還是按數字串發(fā)音、人名地名的識別、分句、英文按單詞發(fā)音或者按字母發(fā)音等等。
隨著(zhù)語(yǔ)音技術(shù)的迅速進(jìn)步,目前這種自動(dòng)處理在一般的語(yǔ)料中已經(jīng)可以達到很好的效果,但用戶(hù)可能使用到一些專(zhuān)業(yè)性較強的、不符合常規的文本,特定文本集合的發(fā)音本身固有的不確定性往往是現有語(yǔ)音合成系統需要面對的一個(gè)難題,合成系統在處理這些文本時(shí)可能會(huì )出現一些錯誤,而使用加詞、特殊規則等手段難以解決,這時(shí)用戶(hù)可以通過(guò)CSSML標記文本來(lái)指定文本的合成方式,靈活解決一些語(yǔ)音合成系統難以自動(dòng)處理的問(wèn)題。再如,隨著(zhù)信息服務(wù)的不斷豐富與深入,運營(yíng)服務(wù)商常常需要面臨在同一語(yǔ)音平臺上需要提供不同的應用的情況。通過(guò)CSSML可以為同一平臺上的不同應用指定相應的合成風(fēng)格與方式,從而滿(mǎn)足不同客戶(hù)的個(gè)性化要求。
CSSML中使用基礎元素指定文本的格式。例如CSSML語(yǔ)言提供了一個(gè)段落元素、句子元素和詞語(yǔ)元素。通過(guò)像指定段落一樣指定句子、詞語(yǔ)的地址,包括起始地址和終止地址,根據制定的格式,語(yǔ)音合成系統就能更準確的生成語(yǔ)音。
CSSML語(yǔ)言提供的Break元素,可以讓用戶(hù)調整詞語(yǔ)間停頓的時(shí)長(cháng),以逼近最真實(shí)的發(fā)音風(fēng)格。用戶(hù)也可以通過(guò)文本替換"sub"元素,將合成文本中的特定文字替換為指定的文字,這在面向一些縮寫(xiě)詞或者特殊用語(yǔ)的語(yǔ)音合成中非常實(shí)用。
CSSML還提供指定某個(gè)預定的詞語(yǔ)或者詞語(yǔ)集合發(fā)音的標記。這個(gè)功能由"say-as"元素來(lái)實(shí)現。它是SSML中一個(gè)非常有用的組件。它能讓你指定一個(gè)模板,這個(gè)模板描述如何發(fā)音某個(gè)單詞或者單詞集合。通過(guò)"say-as",我們可以為縮寫(xiě)的單詞指定如何發(fā)音,也可以為拼寫(xiě)與發(fā)音不同的單詞指定發(fā)音。我們還可以列出數字和日期之間的區別。"say-as"元素包含了對email地址、貨幣和電話(huà)號碼等的支持。
CSSML語(yǔ)言高級特性之一還體現在它的"prosody"元素上。通過(guò)它我們可以以某種指定地方式生成某個(gè)確定的文本集合的語(yǔ)音。我們可以指定聲音的語(yǔ)調、范圍、語(yǔ)速(單詞每分鐘)。通過(guò)指定一個(gè)文本集合的"prosody"元素值,我們可以更精確的定義如何生成語(yǔ)音。
隨著(zhù)中文語(yǔ)音技術(shù)的迅速發(fā)展以及市場(chǎng)應用的不斷深入,其前景日益受到來(lái)自社會(huì )各方面的重視,國家相關(guān)管理部門(mén)為了規范中文語(yǔ)音合成的良性發(fā)展而委托科大訊飛制定的CSSML,必然在今后的中文語(yǔ)音合成領(lǐng)域中發(fā)揮著(zhù)至為重要的規范作用。作為中文語(yǔ)音技術(shù)與市場(chǎng)領(lǐng)導者的科大訊飛公司,從其InterPhonic CE 2.1產(chǎn)品開(kāi)始已全面支持CSSML。為了便于用戶(hù)實(shí)際應用,在InterPhonic CE 2.2產(chǎn)品中,科大訊飛提供了CSSML Editor-一個(gè)可視化的CSSML編輯工具,幫助用戶(hù)直觀(guān)快速的生成、試聽(tīng)和發(fā)布CSSML文本。
我們有理由相信,隨著(zhù)CSSML的發(fā)展和應用,將有助于中文語(yǔ)音合成技術(shù)邁向更加成熟和規范的明天。
科大訊飛公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
夏津县|
泸西县|
高雄县|
阳谷县|
西昌市|
三门县|
鄯善县|
大余县|
张家川|
大田县|
尉犁县|
沭阳县|
璧山县|
黎城县|
漳州市|
宁海县|
丽江市|
甘德县|
峡江县|
深圳市|
阿城市|
任丘市|
富阳市|
抚州市|
南靖县|
屏南县|
新竹市|
重庆市|
津市市|
东辽县|
新源县|
海南省|
隆化县|
徐汇区|
石林|
新田县|
定边县|
新巴尔虎左旗|
白水县|
敖汉旗|
庄河市|
http://444
http://444
http://444
http://444
http://444
http://444