天朗分布式語(yǔ)音識別系統在語(yǔ)音門(mén)戶(hù)中的使用
2003/10/13
1.語(yǔ)音門(mén)戶(hù)發(fā)展的背景
語(yǔ)音門(mén)戶(hù)是指基于互聯(lián)網(wǎng)平臺,應用語(yǔ)音識別、語(yǔ)音合成和其他技術(shù),為固定電話(huà)、移動(dòng)電話(huà)以及使用手持設備(如:PDA)的用戶(hù)提供語(yǔ)音訪(fǎng)問(wèn)互聯(lián)網(wǎng)并獲取網(wǎng)上資訊的門(mén)戶(hù),這是全球互聯(lián)網(wǎng)發(fā)展的最新動(dòng)態(tài)。
由于傳統的上網(wǎng)方式限制了互聯(lián)網(wǎng)的上網(wǎng)人數,互聯(lián)網(wǎng)的訪(fǎng)問(wèn)模式逐漸從單一的訪(fǎng)問(wèn)方式向多種用戶(hù)終端發(fā)展 ,如:電話(huà)、移動(dòng)電話(huà)、PDA、機頂盒等。在當今科技飛速發(fā)展的地區,語(yǔ)音上網(wǎng)成為繼無(wú)線(xiàn)WAP上網(wǎng)之后的又一個(gè)發(fā)展熱點(diǎn)。人們喜歡用人類(lèi)自然的語(yǔ)音,通過(guò)友好的語(yǔ)音交互方式直接來(lái)獲取信息和服務(wù)。1999年 ,Evans Group Research分析了對250個(gè)使用不同語(yǔ)音系統的用戶(hù)進(jìn)行調查,調查的結果反饋和定量分析表明:對語(yǔ)音系統和按鍵式系統的使用受歡迎程度,83%的用戶(hù)更喜歡使用語(yǔ)音系統而不是使用按鍵式系統;而對于語(yǔ)音驅動(dòng)系統和與坐席進(jìn)行通話(huà),74%的用戶(hù)更傾向于前者。
語(yǔ)音訪(fǎng)問(wèn),作為人類(lèi)最原始、最自然、最人性化,也是最有效的交流方式,正以其不可阻擋的強勁勢頭融入到互聯(lián)網(wǎng)中。在美國市場(chǎng),以Tellme.com和Nuance 、SpeechWorks為代表的企業(yè)異軍突起 ,倡導人性化的語(yǔ)音上網(wǎng)服務(wù)。隨后Yahoo、Lycos等著(zhù)名互聯(lián)網(wǎng)公司紛紛進(jìn)入相應的服務(wù)領(lǐng)域,建立大規模的語(yǔ)音門(mén)戶(hù)網(wǎng)站,而AOL則提供所謂AOL-By-Phone服務(wù)。
從技術(shù)角度看,過(guò)去數十年來(lái),語(yǔ)音識別(ASR)技術(shù)、文語(yǔ)轉換(TTS)技術(shù)已經(jīng)從實(shí)驗室中逐步走向成熟,其算法的復雜性也逐年下降,從而使這些技術(shù)逐步在市場(chǎng)中得以應用;另一方面,計算機的運算能力每?jì)赡昃头环矠檫@些技術(shù)的商業(yè)應用奠定了堅實(shí)的基礎;再加上移動(dòng)用戶(hù)終端的種類(lèi)與功能也在以前所未有的速度增長(cháng);所有這些技術(shù)的發(fā)展都為基于語(yǔ)音的互聯(lián)網(wǎng)門(mén)戶(hù)的發(fā)展提供的可靠的保證。
2.語(yǔ)音門(mén)戶(hù)
豐富的網(wǎng)絡(luò )內容,電話(huà)的普及。所謂的語(yǔ)音門(mén)戶(hù)是集合了所有那些已經(jīng)成熟的網(wǎng)絡(luò )資源的一種新型網(wǎng)站。那么語(yǔ)音門(mén)戶(hù)到底是什么呢?語(yǔ)音門(mén)戶(hù)就是通過(guò)任何一部電話(huà)使用人類(lèi)自然的語(yǔ)音來(lái)訪(fǎng)問(wèn)互聯(lián)網(wǎng)上的一些基本信息、電子商務(wù)以及個(gè)人通訊服務(wù)。語(yǔ)音門(mén)戶(hù)闡明的是使用電話(huà)來(lái)訪(fǎng)問(wèn)互聯(lián)網(wǎng)上的相關(guān)內容和信息。
對于用戶(hù)而言,通過(guò)使用電話(huà)的會(huì )話(huà)方式來(lái)瀏覽信息和管理事務(wù)仍然是目前最自然和最有效的方法之一。隨著(zhù)計算機運算能力的提高和識別技術(shù)算法的快速發(fā)展,促使基于各種平臺的語(yǔ)音識別系統能識別人類(lèi)的自然會(huì )話(huà)。在20世紀90年代中期以來(lái),許多主要的有自己獨特技術(shù)的公司開(kāi)始運轉語(yǔ)音商務(wù)(基于語(yǔ)音的電子商務(wù))系統。他們這樣做的目的是為了給那些希望通過(guò)使用語(yǔ)音技術(shù)無(wú)論在何時(shí)、何地都能獲得大量的信息和查詢(xún)一些實(shí)時(shí)股票交易信息的人提供服務(wù)。正如個(gè)人通過(guò)使用計算機來(lái)解決訪(fǎng)問(wèn)因特網(wǎng)的方法一樣,這些圍繞著(zhù)基于語(yǔ)音技術(shù)應用來(lái)展開(kāi)的一種新型的網(wǎng)絡(luò )叫做語(yǔ)音門(mén)戶(hù)。
語(yǔ)音門(mén)戶(hù)發(fā)展到現在,越來(lái)越多的公司正迅速朝著(zhù)包含有各種服務(wù)(如:統一消息、網(wǎng)上購物)和基于互連網(wǎng)的各種內容(如:電影,黃頁(yè))的網(wǎng)站發(fā)展,從而讓用戶(hù)只要通過(guò)任何一部電話(huà)就能使所有的這些都成為有用信息。企業(yè)和電子商務(wù)公司也明白通過(guò)語(yǔ)音技術(shù)和全球所擁有的電話(huà)用戶(hù)人群來(lái)發(fā)展他們的用戶(hù)是一個(gè)非常好的機會(huì )。基于行業(yè)技術(shù)標準的出現和產(chǎn)品實(shí)用性的加強將加快語(yǔ)音門(mén)戶(hù)的發(fā)展,同樣對于語(yǔ)音行業(yè)標準的產(chǎn)生也將有助于互聯(lián)網(wǎng)的快速成長(cháng)。
3.市場(chǎng)的影響產(chǎn)生對語(yǔ)音門(mén)戶(hù)的需求
市場(chǎng)的多方面影響以及結合一些實(shí)際的需求即某一用戶(hù)無(wú)論在何時(shí),何地都能直接通過(guò)語(yǔ)音來(lái)提供給個(gè)人在某方面的內容以及服務(wù)。
3.1隨著(zhù)個(gè)人電話(huà)的普及,尤其是手機的普及。
隨著(zhù)手機服務(wù)商的快速增加,手機的用戶(hù)數也將隨之增加。預計到2003年全球將會(huì )有十億個(gè)手機用戶(hù)。這些數字表明未來(lái)通過(guò)電話(huà)來(lái)訪(fǎng)問(wèn)互聯(lián)網(wǎng)無(wú)疑是最普遍的一種工具,既然人類(lèi)的自然語(yǔ)音通過(guò)電話(huà)能夠被識別何理解的話(huà),那么電話(huà)將無(wú)疑是最適合的一種工具用來(lái)提供關(guān)于大多數用戶(hù)所需求的市場(chǎng)和服務(wù)。
3.2互聯(lián)網(wǎng)的快速發(fā)展
在最近5年以來(lái),互聯(lián)網(wǎng)作為信息傳輸的一種新興的媒體而使整個(gè)世界發(fā)生了根本性的改變,現在全球大約有2億個(gè)用戶(hù)使用互聯(lián)網(wǎng)作為他們在日常生活中必不可少的一部份,用戶(hù)通過(guò)互聯(lián)網(wǎng)能得到他們所想要的便利、娛樂(lè )以及提高他們的工作效率。
互聯(lián)網(wǎng)提供了大量的各種各樣的實(shí)用信息,但是要獲得這些信息并不是隨處可得,用戶(hù)必須在家里或辦公室通過(guò)電腦聯(lián)網(wǎng)來(lái)獲得這些信息。這對于在一個(gè)信息快速更新的社會(huì )并不是一件令人愉快的事情。所以消費者對于互聯(lián)網(wǎng)內容和信息的大量需求促使各種生產(chǎn)廠(chǎng)商設計出各種各樣的產(chǎn)品,如PDA、手機等這些可隨身攜帶又能直接與網(wǎng)絡(luò )互聯(lián)的產(chǎn)品。
這些設備的快速發(fā)展促使通過(guò)手持設備和手機來(lái)訪(fǎng)問(wèn)互聯(lián)網(wǎng)的內容是可實(shí)現的,而基于文本的互聯(lián)網(wǎng)的內容也是非常有用的,但緩慢的傳輸速度與互聯(lián)網(wǎng)連接的困難以及這些設備的小屏幕都限制了這些設備的使用價(jià)值。
電信的增值服務(wù)改變用戶(hù)無(wú)論在何地、何時(shí)的要求都能直接訪(fǎng)問(wèn)互聯(lián)網(wǎng)的內容是激動(dòng)人心的。但個(gè)性化的服務(wù)可使個(gè)人和商務(wù)快速獲得和容易訪(fǎng)問(wèn)他們所關(guān)心的內容和信息。因而語(yǔ)音門(mén)戶(hù)的出現及時(shí)改變了電話(huà)的應用范圍,從而使電話(huà)成為從網(wǎng)絡(luò )媒體上得到語(yǔ)音和數據信息的一種最便利的設備。
4.語(yǔ)音門(mén)戶(hù)的優(yōu)勢
語(yǔ)音門(mén)戶(hù)簡(jiǎn)單易用,讓用戶(hù)可隨時(shí)隨地輕松獲取各種信息--無(wú)論是通過(guò)PC、手機或者固定電話(huà),也無(wú)論是在辦公室、家中還是在路上、車(chē)上,"瀏覽"網(wǎng)絡(luò )的過(guò)程變得輕松無(wú)比!
根據語(yǔ)音門(mén)戶(hù)平臺面向的對象來(lái)說(shuō),我們可以從個(gè)人,也就是最終消費用戶(hù),以及企業(yè),也就是服務(wù)提供方,兩個(gè)角度來(lái)考察語(yǔ)音門(mén)戶(hù)平臺的優(yōu)勢。首先,對廣大最終用戶(hù)來(lái)講,語(yǔ)音門(mén)戶(hù)平臺方便、快捷、自然,而且不需要額外成本來(lái)添加設備。用戶(hù)只要對著(zhù)普通電話(huà)說(shuō)話(huà)就行了,不再受制于按鍵音頻,不再受制于電腦和一大堆連線(xiàn),也不再受制于網(wǎng)絡(luò )專(zhuān)業(yè)知識的貧乏。同時(shí),用戶(hù)還可以根據自己的喜好定制個(gè)性化服務(wù),集中關(guān)注個(gè)人業(yè)務(wù);并且可以從各種各樣的信息源、信息終端中解放出來(lái),獲得統一消息服務(wù)帶來(lái)的自由和方便。
其次,企業(yè)本身也必然會(huì )得益于語(yǔ)音門(mén)戶(hù)平臺。企業(yè)利用語(yǔ)音門(mén)戶(hù),不僅可以通過(guò)節省人工坐席成本來(lái)低成本地發(fā)布信息,提供客戶(hù)服務(wù),而且可以實(shí)現其他一些有價(jià)值的業(yè)務(wù),開(kāi)創(chuàng )新的市場(chǎng)空間和利潤。
總之,語(yǔ)音門(mén)戶(hù)將電話(huà)交互過(guò)程從以廠(chǎng)商為中心轉向以用戶(hù)為中心。這一轉變在為用戶(hù)提高效率和降低業(yè)務(wù)成本的同時(shí),還將提高用戶(hù)的滿(mǎn)意度。未來(lái)數年,語(yǔ)音門(mén)戶(hù)將大大改變人們使用電話(huà)的方式以及廠(chǎng)商與主叫用戶(hù)溝通的方式。在當今以廠(chǎng)商為中心的模式中,主叫用戶(hù)只能以?huà)鞌嚯娫?huà)的方式來(lái)"擺脫"某一企業(yè)的按鍵式交互語(yǔ)音應答(IVR)系統 。而在未來(lái)以用戶(hù)為中心的模式中 ,主叫用戶(hù)可與語(yǔ)音門(mén)戶(hù)展開(kāi)交互式對話(huà),可以象"網(wǎng)上沖浪"般快捷、方便地從一家企業(yè)自由地 "跳" 到另外一家企業(yè)。
5.語(yǔ)音識別技術(shù)
電話(huà)的出現已經(jīng)有120多年的歷史,而使用在商業(yè)應用上相關(guān)的語(yǔ)音識別最近幾十年才開(kāi)始進(jìn)行研究。事實(shí)上,一直到90年代中期基于電話(huà)并且提供大量的詞匯、使用者不需要經(jīng)過(guò)任何的培訓并且支持各種類(lèi)型電話(huà)的語(yǔ)音識別軟件才出現,目前語(yǔ)音識別系統能支持自然的習慣用語(yǔ),例如"我想查詢(xún)四川長(cháng)虹的最新價(jià)格"。
語(yǔ)音識別的處理是在網(wǎng)絡(luò )服務(wù)器中進(jìn)行處理而不是在電話(huà)中進(jìn)行處理,可升級的系統配置可支持幾百萬(wàn)訪(fǎng)問(wèn)者同時(shí)也支持通過(guò)不同的線(xiàn)路來(lái)發(fā)出相同的信息請求來(lái)進(jìn)行識別,訪(fǎng)問(wèn)者也可以在他們得到他們想要的信息后自動(dòng)返回。
對于目前所采用的任何一種新建的主流服務(wù)它們必須要有一定靈活性和易使用性。使用基于語(yǔ)音服務(wù)來(lái)構建的所有商業(yè)信息是因為語(yǔ)音識別提供了對不同年齡和不同生活方式的用戶(hù)可以通過(guò)他們手中的任何一部電話(huà)來(lái)得到他們所需要的信息。
6.語(yǔ)音門(mén)戶(hù)的核心技術(shù)
語(yǔ)音門(mén)戶(hù)的核心技術(shù)是Voice-XML(簡(jiǎn)稱(chēng)為V-XML)。
V-XML是W3C組織制定的主要用于電話(huà)語(yǔ)音識別的一個(gè)腳本描述語(yǔ)言,它和現在的IVR系統常用的腳本的功能和目的類(lèi)似,但是不同的是,V-XML是一個(gè)標準,它是在眾多IVR應用的經(jīng)驗基礎上加以規整、合并而制定出來(lái)的,繼承了眾家之長(cháng)。目前,有許多廠(chǎng)商都采用該描述語(yǔ)言作為他們建立IVR系統的描述語(yǔ)言。
V-XML本身就定義了語(yǔ)音識別有關(guān)的tag,因此,集成天朗分布式語(yǔ)音識別系統到VXML引擎中變得更加簡(jiǎn)單。只要參照VXML本身的定義來(lái)做就行。另外,VXML腳本也不過(guò)是一種IVR常用的腳本語(yǔ)言,因此,集成工作和IVR系統集成天朗分布式語(yǔ)音識別系統基本類(lèi)似。
天朗語(yǔ)音公司供稿 CTI論壇編輯
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
南漳县|
海林市|
吕梁市|
延长县|
林西县|
秭归县|
甘谷县|
仲巴县|
丹寨县|
遂平县|
双峰县|
怀集县|
长丰县|
巴楚县|
吉林市|
内江市|
开鲁县|
姜堰市|
始兴县|
巩留县|
额敏县|
秀山|
西乌珠穆沁旗|
天峨县|
比如县|
三江|
潞城市|
龙泉市|
铜山县|
浮梁县|
上犹县|
衡山县|
禹城市|
天长市|
南汇区|
民勤县|
华安县|
宁蒗|
威海市|
鄂托克前旗|
彭阳县|
http://444
http://444
http://444
http://444
http://444
http://444