首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音識別(ASR)  語(yǔ)音識別產(chǎn)品


語(yǔ)音識別新天地

雅文

  語(yǔ)音識別技術(shù)一直是計算機領(lǐng)域研究的重點(diǎn)。IBM ViaVoice Telephony技術(shù)是IBM公司的中文ViaVoice語(yǔ)音識別技術(shù)在電話(huà)通信領(lǐng)域中的延伸和發(fā)展,它提供了一個(gè)開(kāi)放式的語(yǔ)音識別引擎和一系列應用工具,使得語(yǔ)音識別功能可以被方便快速地集成到電話(huà)系統中。

  具體說(shuō)來(lái),普通話(huà)ViaVoice Telephony技術(shù)的特點(diǎn)包括:1、與說(shuō)話(huà)人無(wú)關(guān),任何人都可以使用;2、高識別率,內部的語(yǔ)音識別引擎是使用真實(shí)的電話(huà)信道語(yǔ)音數據訓練得到的,在正常的電話(huà)信道(包括普通電話(huà)和手機)的噪音下具有很高的識別率;3、無(wú)限詞匯量,由于語(yǔ)音識別內核是比音節還要小的單元,所以對于開(kāi)發(fā)人員定義的任何詞表,它都可以很好地辨識;4、連續發(fā)音,使用者不需要在詞匯間有任何停頓,可以同系統連續交談;5、多語(yǔ)種支持,除了支持中文普通話(huà)和粵語(yǔ)之外,系統同時(shí)支持美國英語(yǔ)、英國英語(yǔ)、法語(yǔ)和德語(yǔ);6、多候選集的輸出,可以輸出不同候選結果的相似度得分;7、支持聲學(xué)加詞,說(shuō)話(huà)人只需輸入語(yǔ)音信號即可完成加詞;8、支持動(dòng)態(tài)加詞,系統在運行狀態(tài)下也可以動(dòng)態(tài)地擴大可識別的詞匯集;9、支持語(yǔ)音合成,高自然度、高清晰度、高可懂度的文語(yǔ)轉換系統是普通話(huà)ViaVoice Telephony技術(shù)的重要構件;10、信道自適應,系統可以自動(dòng)適應不同信噪比的電話(huà)信道;11、與硬件無(wú)關(guān)的標準C/C++接口,可讓系統方便地掛接語(yǔ)音識別和語(yǔ)音合成引擎;12、自然語(yǔ)言理解模塊,提供更加人性化的人機對話(huà)接口;13、出色的可伸縮性,提供從小型辦公室到企業(yè)級電話(huà)語(yǔ)音系統解決方案,并提供全自動(dòng)的動(dòng)態(tài)負載平衡。此外,IBM中國研究中心在IBM美國Watson研究中心的支持下,已經(jīng)在語(yǔ)音識別的電話(huà)應用領(lǐng)域積累了多年的經(jīng)驗和技術(shù)。該項技術(shù)提供的語(yǔ)音識別引擎和語(yǔ)音合成引擎可以客戶(hù)機/服務(wù)器的方式同IVR(Interactive Voice Responding)系統對話(huà),共同組成一個(gè)先進(jìn)的和智能化的分布式電話(huà)語(yǔ)音系統,支持單機和多機模式。

  同時(shí),IBM ViaVoice電話(huà)語(yǔ)音內核和工具庫還為開(kāi)發(fā)人員提供了開(kāi)發(fā)電話(huà)語(yǔ)音識別應用程序的工具。其中,前者為應用程序提供了運行平臺;后者則為開(kāi)發(fā)和測試應用程序提供了一套實(shí)用程序。該工具庫對Tcl/Tk腳本語(yǔ)言進(jìn)行了擴展,簡(jiǎn)化了應用程序的開(kāi)發(fā)和定制過(guò)程,并提供了與硬件無(wú)關(guān)的語(yǔ)音識別和語(yǔ)音合成引擎的C/C++接口,使得開(kāi)發(fā)人員可以開(kāi)發(fā)面向對象的解決方案。工具庫中還包括了兩個(gè)示例程序,可以幫助用戶(hù)理解如何將語(yǔ)音識別集成到電話(huà)語(yǔ)音應用程序中。另外,軟件中還附帶了幾個(gè)實(shí)用程序,來(lái)協(xié)助開(kāi)發(fā)人員開(kāi)發(fā)、測試和管理電話(huà)語(yǔ)音識別應用程序。

  普通話(huà)ViaVoice Telephony技術(shù)具有廣泛的應用前景,任何VRU(Voice Responding Unit)應用都可以同語(yǔ)音識別功能相結合,提供人性化的交互界面。不久前,我們杭州三匯數字信息技術(shù)有限公司和IBM公司就關(guān)于ViaVoice Telephony的應用簽訂了合作協(xié)議,從而使得我公司成為率先應用這一新技術(shù)的國內語(yǔ)音卡生產(chǎn)商及ISV。在與ViaVoice Telephony技術(shù)結合之后,我公司開(kāi)發(fā)生產(chǎn)的語(yǔ)音卡可以徹底解決以前按鍵無(wú)法解決的地名、人名、股票名稱(chēng)等漢字詞語(yǔ)輸入問(wèn)題,且具備高識別率、無(wú)限詞匯量、連續發(fā)音、與說(shuō)話(huà)人無(wú)關(guān)等特點(diǎn)。目前,我公司已成功地完成了股票語(yǔ)音查詢(xún)系統、機器人接線(xiàn)員、鐵路自動(dòng)票務(wù)中心、民航語(yǔ)音呼叫中心、郵政184自動(dòng)查詢(xún)系統等項目。其中,江蘇省諫壁電廠(chǎng)經(jīng)過(guò)嚴格測試,已決定使用機器人總機接線(xiàn)員,任何人都可以通過(guò)有線(xiàn)或無(wú)線(xiàn)電話(huà)用自然語(yǔ)言直接叫機器人接線(xiàn)員接通某人的手機、辦公室或家庭電話(huà)。

  相信,隨著(zhù)ViaVoice Telephony技術(shù)在通信、金融、旅游以及醫療等領(lǐng)域的進(jìn)一步推廣和應用,人們的生活必將更加多姿多彩。

摘自《中國計算機用戶(hù)》2000年1月31日

 



相關(guān)鏈接:
IBM推出Linux版本的ViaVoice 2002-01-30
Intel推出語(yǔ)音軟件項目 2002-01-30
國內電腦語(yǔ)音識別技術(shù)屢獲突破 2002-01-30
IBM公司舉行ViaVoice電話(huà)語(yǔ)音識別新技術(shù)發(fā)布會(huì ) 2002-01-30
語(yǔ)音識別用于國內呼叫中心 2002-01-30

分類(lèi)信息:  語(yǔ)音合成TTS_與_語(yǔ)音識別ASR     技術(shù)_語(yǔ)音合成_新聞   技術(shù)_語(yǔ)音識別_新聞
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 榆树市| 哈密市| 炎陵县| 尼木县| 开远市| 嘉定区| 康乐县| 卢湾区| 理塘县| 南华县| 乌兰浩特市| 连江县| 晋宁县| 汽车| 永清县| 营口市| 鄂伦春自治旗| 崇义县| 临安市| 太仆寺旗| 霍林郭勒市| 玛曲县| 云梦县| 九台市| 墨竹工卡县| 忻城县| 新安县| 甘孜| 永福县| 长海县| 沅江市| 通州区| 太仆寺旗| 虞城县| 岑巩县| 通榆县| 建德市| 永定县| 溆浦县| 文昌市| 濮阳县| http://444 http://444 http://444 http://444 http://444 http://444