簡(jiǎn)化語(yǔ)音應用開(kāi)發(fā)
——VoiceXML2.0新標準即將確定
陳聰 2002/03/18
VoiceXML1.0面向互聯(lián)網(wǎng)的語(yǔ)音支持功能為進(jìn)一步開(kāi)掘互聯(lián)網(wǎng)資源的價(jià)值鋪平了道路。VoiceXML2.0的出現,又為互聯(lián)網(wǎng)語(yǔ)音應用的開(kāi)發(fā)者提供了更強大的詞匯和語(yǔ)法生成及擴充工具。
VoiceXML促進(jìn)語(yǔ)音上網(wǎng)
圍繞VoiceXML標記語(yǔ)言,業(yè)界差不多已經(jīng)討論了三年。通過(guò)VoiceXML,互聯(lián)網(wǎng)語(yǔ)音應用運營(yíng)商能向電話(huà)用戶(hù)發(fā)布他們感興趣的信息,就像管理Web頁(yè)的網(wǎng)管人員向Web服務(wù)器發(fā)布網(wǎng)頁(yè)內容那樣,而且發(fā)布的信息內容也與一般的垂直服務(wù)網(wǎng)站所提供的內容差不多,如訂貨信息、股票查詢(xún)、航班時(shí)刻等等,不一而足。
在VoiceXML應用環(huán)境中,VoiceXML “頁(yè)”與HTML頁(yè)一樣,無(wú)論發(fā)出頁(yè)面請求的瀏覽器與提供指定頁(yè)面的服務(wù)器相距多么遙遠,都能通過(guò)HTTP協(xié)議在服務(wù)器間鏈接或返回。與IVR(交互式語(yǔ)音應答系統)“一個(gè)號碼一根線(xiàn)”這種簡(jiǎn)單的服務(wù)平臺相比,VoiceXML瀏覽的是一種真正意義上自由漫游的語(yǔ)音Web頁(yè)。與HTML不同的是,VoiceXML中的瀏覽器不在用戶(hù)端,它實(shí)際上是由一組由用戶(hù)導航命令、用戶(hù)定制命令、語(yǔ)音識別以及TTS算法(文本轉換成語(yǔ)音)等組件構成的VoiceXML解釋軟件。由于電話(huà)主叫用戶(hù)在訪(fǎng)問(wèn)VoiceXML頁(yè)時(shí)只有語(yǔ)音和電話(huà)按鍵這兩種交互方式,因此對用戶(hù)來(lái)說(shuō),只相當于有了鍵盤(pán)、鼠標和瀏覽器顯示屏幕,而不具有瀏覽器本身。
新版更易用
隨著(zhù)VoiceXML的問(wèn)世,眾多服務(wù)器平臺和瀏覽器產(chǎn)品紛紛涌現。截至目前,VoiceXML已身歷兩代。2000年5月,由AT&T、Lucent、Motorola和IBM幾大公司組成的VoiceXML論壇向W3C提交了VoiceXML1.0。此后,由60多家公司組成的W3C語(yǔ)音瀏覽器工作組醞釀產(chǎn)生了VoiceXML2.0,并于去年10月公開(kāi)發(fā)布,旨在征求各方意見(jiàn)。最終的“推薦標準”預計將于今年年底公布。
不斷成熟的VoiceXML一直在追求更強的功能、更簡(jiǎn)潔的表達方式,并盡量少地讓開(kāi)發(fā)者自己去做類(lèi)似于編寫(xiě)動(dòng)態(tài)語(yǔ)法代碼這樣的工作。VoiceXML2.0進(jìn)一步對TTS控制和語(yǔ)音識別語(yǔ)法格式進(jìn)行了標準化,對全局會(huì )話(huà)描述的結構增加了更嚴密的定義。
業(yè)內專(zhuān)家對VoiceXML2.0的修改意見(jiàn)主要集中在三個(gè)方面。一、對應用平臺間和文檔間的互操作特性進(jìn)行規范。要做的工作主要有:進(jìn)一步明晰VoiceXML1.0中某些表述含混的地方;確定VoiceXML解釋平臺的最低配置要求;對語(yǔ)法和用戶(hù)提示進(jìn)行標準化;為驗證一致性,開(kāi)發(fā)一個(gè)測試協(xié)議。二、在VoiceXML不依靠低級代碼所完成的最基本功能之外,再增添一些增強型組件。三、增強可讀性。
W3C語(yǔ)音瀏覽器的另一個(gè)工作小組目前正在制訂呼叫控制規范,內容包括呼叫初始化和第三方會(huì )議等,當前的研究目標是使呼叫控制實(shí)現協(xié)議的獨立。如果要實(shí)現更復雜的呼叫控制功能,就可能需要一種單獨的呼叫控制語(yǔ)言對現行各種電話(huà)標準進(jìn)行重組。目前,已經(jīng)有中間件提供商在VoiceXML上增加了自定義的呼叫控制標記,還有像Voxeo這樣的廠(chǎng)商甚至還開(kāi)發(fā)了自己的呼叫控制標記語(yǔ)言。
這樣,VoiceXML2.0標準增強了實(shí)用性和易用性,更方便實(shí)現語(yǔ)音在互聯(lián)網(wǎng)之上的交互,使簡(jiǎn)易終端設備訪(fǎng)問(wèn)互聯(lián)網(wǎng)成為現實(shí),可以與數據庫、HTML、WML以及其它文檔處理和發(fā)布系統進(jìn)行無(wú)縫資料交換。
國內語(yǔ)音應用標準在形成
結合語(yǔ)音上網(wǎng)的趨勢,國內的語(yǔ)音廠(chǎng)商們,包括無(wú)限商機、言豐等也積極推進(jìn)VoiceXML瀏覽器、解釋器的研發(fā)。目前,自主產(chǎn)權的中文VoiceXML解釋器已經(jīng)發(fā)布,CMIS正基于VoiceXML起草中國語(yǔ)音互聯(lián)的技術(shù)標準及產(chǎn)品規范,可望成為中國語(yǔ)音應用的規范性標準(VAP)。
中國計算機報
Voxeo攜Prophecy10高度亮相SpeechTEK2009 2009-09-03 |
Voxeo被評為世界領(lǐng)先的IVR平臺供應廠(chǎng)商之一 2009-06-11 |
北電推出Meridian Option 11C最新升級計劃 2009-06-01 |
康維可視語(yǔ)音郵件使手機消息“即點(diǎn)即聽(tīng)” 2009-04-10 |
谷歌推網(wǎng)絡(luò )電話(huà)服務(wù) 比Skype便宜三分之一 2009-03-12 |