基于Web的語(yǔ)音平臺
——下一代語(yǔ)音平臺Speech Server 2004
陳銳
2004/08/27
在過(guò)去很長(cháng)一段時(shí)間內,語(yǔ)音應用在很大程度上都只是實(shí)驗室中純技術(shù)性的東西。而現在語(yǔ)音技術(shù)正逐漸成為企業(yè)應用中的重要一環(huán),在銀行、證券、教學(xué)、電信增值應用、企業(yè)客戶(hù)服務(wù)、企業(yè)內部應用等領(lǐng)域都擁有廣泛的應用前景。在當今的語(yǔ)音應用技術(shù)中,基于Web的語(yǔ)音應用是一個(gè)新的發(fā)展前端。IBM、微軟等公司都提供了自己的基于Web的語(yǔ)音平臺。那么什么是基于Web的語(yǔ)音平臺?它的核心技術(shù)是什么?應用前景如何?本文作者將結合微軟Speech Server 2004為大家做簡(jiǎn)要剖析。
什么是基于Web的語(yǔ)音平臺?
簡(jiǎn)而言之,它就是互聯(lián)網(wǎng)絡(luò )的一個(gè)語(yǔ)音接口。用戶(hù)可以通過(guò)固定電話(huà)或者移動(dòng)電話(huà)通過(guò)語(yǔ)音交互的方式訪(fǎng)問(wèn)互聯(lián)網(wǎng)。我們可以通過(guò)下面的圖來(lái)看看Web語(yǔ)音平臺的位置:

上圖中的Speech Server就是微軟的Web語(yǔ)音平臺,可以看到它連接起了電話(huà)網(wǎng)絡(luò )(PSTN)以及Web Server。
為什么要使用基于Web的語(yǔ)音平臺
滿(mǎn)足客戶(hù)端復雜性的要求 現在的互聯(lián)網(wǎng)絡(luò )接入設備不再像5、6年以前只有PC,智能手機、Pocket PC、Tablet PC以及其他各種智能終端都是訪(fǎng)問(wèn)互聯(lián)網(wǎng)的客戶(hù)端,而這些設備受使用場(chǎng)所、自身尺寸等方面的限制,不可能像PC那樣使用傳統的鼠標、鍵盤(pán)和相對較大的顯示界面進(jìn)行交互。在這個(gè)時(shí)候,語(yǔ)音交互就可以大顯身手了。
整合的要求 很多企業(yè)都有自己的語(yǔ)音平臺和Web平臺。在很多企業(yè)中,它們是獨立的系統。通過(guò)基于Web的語(yǔ)音平臺,可以將兩者有機地結合在一起。例如微軟的Speech Server 2004就支持與Intel 以及 Intervoice語(yǔ)音平臺的集成。
Speech Server 2004:語(yǔ)音先行者
在語(yǔ)音應用方面微軟是一個(gè)先行者,在語(yǔ)音應用還沒(méi)有被人們所認識的時(shí)候微軟已經(jīng)推出了自己的桌面語(yǔ)音產(chǎn)品(大家應該都知道金山詞霸中的單詞發(fā)音,它使用的就是微軟TTS引擎)。而Speech Server 2004是微軟今年新推出的基于Web的語(yǔ)音服務(wù)器端產(chǎn)品,它主要分為兩個(gè)部分:SES(Speech Engine Services)和TAS(Telephony Application Services)。其中SES是語(yǔ)音引擎服務(wù),包括SAPI、語(yǔ)音輸入以及語(yǔ)音識別,支持話(huà)音、PPC以及桌面語(yǔ)音;TAS是電話(huà)應用服務(wù),集成了SALT以及媒體與語(yǔ)音管理,是第三方話(huà)音界面與Speech Server的接口。
Speech Server 2004相比其他的語(yǔ)音系統有以下的主要特點(diǎn):
降低了開(kāi)發(fā)成本
開(kāi)發(fā)語(yǔ)音應用曾經(jīng)是一個(gè)開(kāi)銷(xiāo)很大的工程,它需要對電話(huà)語(yǔ)音底層有深入的了解。而Speech Server是建立在 .NET平臺基礎之上,提供了基于.NET的SDK,通過(guò)Speech Server SDK中集成的眾多組件以及輔助工具,開(kāi)發(fā)人員可以像開(kāi)發(fā)普通ASP.NET Application一樣來(lái)開(kāi)發(fā)、測試、部署語(yǔ)音應用程序。
集成了更多協(xié)議
它支持通過(guò)PBX進(jìn)入的語(yǔ)音以及從ACD/CTI進(jìn)入的數據。
提供更多分析工具/組件
微軟在Speech Server中集成了數據分析工具,Call Viewer以及Speech Application Reports。Call Viewer可以讓開(kāi)發(fā)人員和系統管理人員直觀(guān)地查看電話(huà)撥入情況,而Speech Application Reports是一個(gè)基于Microsoft Reporting Services的報表工具。可以通過(guò)這個(gè)工具生成詳細的報表。
應用前景
想象一下,當你開(kāi)車(chē)進(jìn)入一個(gè)陌生的城市尋找餐廳時(shí),只要對著(zhù)車(chē)載話(huà)筒說(shuō)出你想要吃的口味,你的車(chē)載導航系統中就會(huì )自動(dòng)列出符合你口味的餐廳并顯示出路線(xiàn)圖。你可以選擇餐廳、收聽(tīng)餐廳介紹、查看餐廳用餐情況并可直接與餐廳員工通話(huà)訂座位。再想象一下如果你需要在明天下午3點(diǎn)組織一個(gè)重要會(huì )議,只需在企業(yè)內部網(wǎng)中登記會(huì )議以及參與會(huì )議的公司人員,那么在開(kāi)會(huì )之前,所有的參會(huì )人員都能夠接到通知開(kāi)會(huì )的電話(huà)。
由于語(yǔ)音技術(shù)的改進(jìn)(包括發(fā)音引擎、語(yǔ)音識別),語(yǔ)音應用開(kāi)發(fā)標準的制定,相關(guān)市場(chǎng)的成熟,加上用戶(hù)對通過(guò)智能設備訪(fǎng)問(wèn)互聯(lián)網(wǎng)/內部網(wǎng)的需求越來(lái)越多,基于Web的語(yǔ)音平臺必定有廣闊的發(fā)展空間。
計算機世界網(wǎng)(www.ccw.com.cn)
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
涡阳县|
蓬莱市|
泾源县|
新干县|
东台市|
佛坪县|
瑞安市|
宾阳县|
靖远县|
苍南县|
偏关县|
安阳县|
河南省|
民县|
陆丰市|
灌阳县|
陇川县|
南雄市|
樟树市|
特克斯县|
黎平县|
东山县|
密云县|
张家界市|
页游|
广州市|
湟中县|
兰西县|
荣昌县|
多伦县|
临沭县|
浦北县|
双峰县|
扶风县|
隆林|
建德市|
屏南县|
龙海市|
界首市|
永康市|
本溪市|
http://444
http://444
http://444
http://444
http://444
http://444