IBM ViaVoice:軟件革命“說(shuō)出來(lái)”
2001/10/10
科技的使命之一是便利人們的工作、生活。自然語(yǔ)音的機器識別技術(shù)正體現了這一點(diǎn)。通俗地說(shuō),語(yǔ)音識別就是讓計算機能聽(tīng)懂人類(lèi)說(shuō)話(huà)。近年來(lái),語(yǔ)音技術(shù)的飛速發(fā)展。人類(lèi)利用自然語(yǔ)言直接與電腦交流,已經(jīng)成為現實(shí)。有了語(yǔ)音識別技術(shù),鍵盤(pán)、鼠標離“下崗”的日子也就不遠了。
IBM公司作為語(yǔ)音識別技術(shù)的先驅?zhuān)瑥氖逻@個(gè)領(lǐng)域的研究已經(jīng)有30多年歷史,并獲得了近百項專(zhuān)利,在全球建立了完整的專(zhuān)家隊伍。IBM ViaVoice語(yǔ)音識別軟件是IBM語(yǔ)音識別的旗艦產(chǎn)品之一,它的主要功能有兩個(gè):一是基于句子的文字錄入,二是基于詞匯的命令驅動(dòng)。利用這兩個(gè)基本功能,人們已經(jīng)構造出許多應用。目前我們能夠看到的應用包括:聲控游戲、聲控文字編輯、自動(dòng)語(yǔ)音查詢(xún)、語(yǔ)音輸入網(wǎng)上聊天、語(yǔ)音輔助教學(xué)等等。
IBM ViaVoice語(yǔ)音識別軟件最基本的應用,就是讓計算機使用者不必動(dòng)手就能完成文字輸入和格式編排等工作,輸入速度快,操作簡(jiǎn)單,可以直接在Word97中聽(tīng)寫(xiě)。并且能用語(yǔ)音控制計算機,無(wú)論何種程序動(dòng)動(dòng)口,就能關(guān)閉程序,改變桌面布局。
在中文語(yǔ)音識別方面,1997年IBM推出了世界上第一個(gè)中文連續語(yǔ)音識別產(chǎn)品——ViaVoice 4.0。該軟件成功突破連續語(yǔ)音、大詞匯量、非特定識別人的難關(guān),成功解決了漢語(yǔ)同音字多、有聲調、口音復雜等問(wèn)題,幫助人們從繁雜的鍵盤(pán)輸入中解脫出來(lái),被認為是漢字輸入的重要里程碑。2000年,IBM推出新一代語(yǔ)音識別產(chǎn)品IBMViaVoice7.0(世紀)版,進(jìn)一步提高了識別的準確性并增強了編輯及語(yǔ)音上網(wǎng)瀏覽的功能,使人們可以用語(yǔ)音命令自然、輕松地控制和操作臺式電腦。
現在,對于日常的句子,IBM ViaVoice的識別率很高,在90%以上,而對于有限個(gè)詞匯的識別,甚至可以達到99.9%以上。另外,IBM ViaVoice還有能聽(tīng)懂多種方言的版本。
隨著(zhù)Internet與移動(dòng)計算技術(shù)的發(fā)展,語(yǔ)音技術(shù)正在被越來(lái)越多地應用到Internet和手持設備中。未來(lái)的應用設備將越來(lái)越小,移動(dòng)電話(huà)、掌上電腦、PDA的發(fā)展更需要語(yǔ)音識別技術(shù)的支持。對于機頂盒、車(chē)內Web應用設備的潛在市場(chǎng),也將需要大量的語(yǔ)音識別服務(wù)軟件。另外,隨著(zhù)Internet發(fā)展所帶來(lái)的多樣化需求,通過(guò)語(yǔ)音獲得信息和服務(wù)也促進(jìn)了電子商務(wù)未來(lái)的發(fā)展。有人預言,語(yǔ)音識別技術(shù)將帶來(lái)網(wǎng)上業(yè)務(wù)方式的革命,并最終產(chǎn)生世界級的電子商務(wù)企業(yè)。
IBM供稿 CTI論壇編輯
ViaVoice語(yǔ)音上網(wǎng)新概念 2001-11-14 |
IBM ViaVoice更方便更健康 2001-11-14 |
語(yǔ)音識別重在應用 2001-11-14 |
IBM ViaVoice Telephony——完善的中文電話(huà)語(yǔ)音技術(shù) 2001-11-14 |
CRM中的IBM語(yǔ)音技術(shù) 2001-10-10 |