基于Web的語(yǔ)音平臺
——下一代語(yǔ)音平臺Speech Server 2004

陳銳 2004/08/27

  在過(guò)去很長(cháng)一段時(shí)間內,語(yǔ)音應用在很大程度上都只是實(shí)驗室中純技術(shù)性的東西。而現在語(yǔ)音技術(shù)正逐漸成為企業(yè)應用中的重要一環(huán),在銀行、證券、教學(xué)、電信增值應用、企業(yè)客戶(hù)服務(wù)、企業(yè)內部應用等領(lǐng)域都擁有廣泛的應用前景。在當今的語(yǔ)音應用技術(shù)中,基于Web的語(yǔ)音應用是一個(gè)新的發(fā)展前端。IBM、微軟等公司都提供了自己的基于Web的語(yǔ)音平臺。那么什么是基于Web的語(yǔ)音平臺?它的核心技術(shù)是什么?應用前景如何?本文作者將結合微軟Speech Server 2004為大家做簡(jiǎn)要剖析。

什么是基于Web的語(yǔ)音平臺?

  簡(jiǎn)而言之,它就是互聯(lián)網(wǎng)絡(luò )的一個(gè)語(yǔ)音接口。用戶(hù)可以通過(guò)固定電話(huà)或者移動(dòng)電話(huà)通過(guò)語(yǔ)音交互的方式訪(fǎng)問(wèn)互聯(lián)網(wǎng)。我們可以通過(guò)下面的圖來(lái)看看Web語(yǔ)音平臺的位置:


  上圖中的Speech Server就是微軟的Web語(yǔ)音平臺,可以看到它連接起了電話(huà)網(wǎng)絡(luò )(PSTN)以及Web Server。

為什么要使用基于Web的語(yǔ)音平臺


  滿(mǎn)足客戶(hù)端復雜性的要求 現在的互聯(lián)網(wǎng)絡(luò )接入設備不再像5、6年以前只有PC,智能手機、Pocket PC、Tablet PC以及其他各種智能終端都是訪(fǎng)問(wèn)互聯(lián)網(wǎng)的客戶(hù)端,而這些設備受使用場(chǎng)所、自身尺寸等方面的限制,不可能像PC那樣使用傳統的鼠標、鍵盤(pán)和相對較大的顯示界面進(jìn)行交互。在這個(gè)時(shí)候,語(yǔ)音交互就可以大顯身手了。

  整合的要求 很多企業(yè)都有自己的語(yǔ)音平臺和Web平臺。在很多企業(yè)中,它們是獨立的系統。通過(guò)基于Web的語(yǔ)音平臺,可以將兩者有機地結合在一起。例如微軟的Speech Server 2004就支持與Intel 以及 Intervoice語(yǔ)音平臺的集成。

Speech Server 2004:語(yǔ)音先行者

  在語(yǔ)音應用方面微軟是一個(gè)先行者,在語(yǔ)音應用還沒(méi)有被人們所認識的時(shí)候微軟已經(jīng)推出了自己的桌面語(yǔ)音產(chǎn)品(大家應該都知道金山詞霸中的單詞發(fā)音,它使用的就是微軟TTS引擎)。而Speech Server 2004是微軟今年新推出的基于Web的語(yǔ)音服務(wù)器端產(chǎn)品,它主要分為兩個(gè)部分:SES(Speech Engine Services)和TAS(Telephony Application Services)。其中SES是語(yǔ)音引擎服務(wù),包括SAPI、語(yǔ)音輸入以及語(yǔ)音識別,支持話(huà)音、PPC以及桌面語(yǔ)音;TAS是電話(huà)應用服務(wù),集成了SALT以及媒體與語(yǔ)音管理,是第三方話(huà)音界面與Speech Server的接口。

  Speech Server 2004相比其他的語(yǔ)音系統有以下的主要特點(diǎn):

  • 降低了開(kāi)發(fā)成本


  •   開(kāi)發(fā)語(yǔ)音應用曾經(jīng)是一個(gè)開(kāi)銷(xiāo)很大的工程,它需要對電話(huà)語(yǔ)音底層有深入的了解。而Speech Server是建立在 .NET平臺基礎之上,提供了基于.NET的SDK,通過(guò)Speech Server SDK中集成的眾多組件以及輔助工具,開(kāi)發(fā)人員可以像開(kāi)發(fā)普通ASP.NET Application一樣來(lái)開(kāi)發(fā)、測試、部署語(yǔ)音應用程序。

  • 集成了更多協(xié)議


  •   它支持通過(guò)PBX進(jìn)入的語(yǔ)音以及從ACD/CTI進(jìn)入的數據。

  • 提供更多分析工具/組件


  •   微軟在Speech Server中集成了數據分析工具,Call Viewer以及Speech Application Reports。Call Viewer可以讓開(kāi)發(fā)人員和系統管理人員直觀(guān)地查看電話(huà)撥入情況,而Speech Application Reports是一個(gè)基于Microsoft Reporting Services的報表工具。可以通過(guò)這個(gè)工具生成詳細的報表。

    應用前景

      想象一下,當你開(kāi)車(chē)進(jìn)入一個(gè)陌生的城市尋找餐廳時(shí),只要對著(zhù)車(chē)載話(huà)筒說(shuō)出你想要吃的口味,你的車(chē)載導航系統中就會(huì )自動(dòng)列出符合你口味的餐廳并顯示出路線(xiàn)圖。你可以選擇餐廳、收聽(tīng)餐廳介紹、查看餐廳用餐情況并可直接與餐廳員工通話(huà)訂座位。再想象一下如果你需要在明天下午3點(diǎn)組織一個(gè)重要會(huì )議,只需在企業(yè)內部網(wǎng)中登記會(huì )議以及參與會(huì )議的公司人員,那么在開(kāi)會(huì )之前,所有的參會(huì )人員都能夠接到通知開(kāi)會(huì )的電話(huà)。

      由于語(yǔ)音技術(shù)的改進(jìn)(包括發(fā)音引擎、語(yǔ)音識別),語(yǔ)音應用開(kāi)發(fā)標準的制定,相關(guān)市場(chǎng)的成熟,加上用戶(hù)對通過(guò)智能設備訪(fǎng)問(wèn)互聯(lián)網(wǎng)/內部網(wǎng)的需求越來(lái)越多,基于Web的語(yǔ)音平臺必定有廣闊的發(fā)展空間。

    計算機世界網(wǎng)(www.ccw.com.cn)


    相關(guān)鏈接:
    Dynamics的“靈活”戰略 2009-09-28
    微軟國內首推Push mail 酷派3G產(chǎn)品率先支持 2009-09-28
    鮑爾默:我們搞砸了Windows Mobile 7 2009-09-25
    微軟全球基礎服務(wù)部門(mén)副總裁離職加盟思科 2009-09-24
    微軟推最新手機操作系統WindowsMobile6.5 2009-09-04

    分類(lèi)信息:     文摘   技術(shù)_語(yǔ)音識別_文摘
    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 涡阳县| 蓬莱市| 泾源县| 新干县| 东台市| 佛坪县| 瑞安市| 宾阳县| 靖远县| 苍南县| 偏关县| 安阳县| 河南省| 民县| 陆丰市| 灌阳县| 陇川县| 南雄市| 樟树市| 特克斯县| 黎平县| 东山县| 密云县| 张家界市| 页游| 广州市| 湟中县| 兰西县| 荣昌县| 多伦县| 临沭县| 浦北县| 双峰县| 扶风县| 隆林| 建德市| 屏南县| 龙海市| 界首市| 永康市| 本溪市| http://444 http://444 http://444 http://444 http://444 http://444