語(yǔ)音識別技術(shù)是實(shí)現人機對話(huà)的一項重大突破,在國外近年來(lái)發(fā)展得十分迅速,其應用也逐步得到了推廣。語(yǔ)音識別系統利用計算機技術(shù)和網(wǎng)絡(luò )技術(shù)優(yōu)勢,采用人機對話(huà)方式,人們只要像平常一樣對著(zhù)話(huà)筒說(shuō)出所需服務(wù)項目,即可輕松獲取自動(dòng)系統提供的信息和服務(wù)。

說(shuō)起語(yǔ)音識別技術(shù),大家比較熟悉的是蘋(píng)果語(yǔ)音助手Siri、谷歌公司的Googlenow,以及百度語(yǔ)音搜索等個(gè)人終端應用產(chǎn)品,但這些公司只能說(shuō)是語(yǔ)音識別技術(shù)領(lǐng)域的新貴,Nuance公司才是語(yǔ)音識別技術(shù)的始祖。Naunce公司曾經(jīng)是語(yǔ)音識別領(lǐng)域的老大,全球超過(guò)80%的語(yǔ)音識別系統都應用過(guò)Nuance識別引擎技術(shù),其語(yǔ)音產(chǎn)品可以支持超過(guò)50種語(yǔ)言,在全球擁有超過(guò)20億用戶(hù),幾乎壟斷了金融和電信行業(yè),就連蘋(píng)果Siri、三星語(yǔ)音助手S-Voice剛開(kāi)始都是應用他們的語(yǔ)音識別引擎技術(shù)。目前,每天仍有許多人通過(guò)撥打基于Nuance公司語(yǔ)音識別、語(yǔ)言理解和聲紋鑒別技術(shù)的電話(huà),進(jìn)行旅行產(chǎn)品預訂、股票交易,或與互聯(lián)網(wǎng)系統進(jìn)行交互等。美國航空、聯(lián)邦快遞等公司的呼叫中心也采用了Naunce公司的語(yǔ)音識別技術(shù)。
但是,隨著(zhù)技術(shù)的發(fā)展,Naunce公司在專(zhuān)利和算法方面的優(yōu)勢越來(lái)越不明顯。語(yǔ)音識別是機器智能的重要技術(shù)基礎,但一款用戶(hù)體驗較好的語(yǔ)音識別系統,在很大程度上依靠數據和經(jīng)驗,特別是神經(jīng)網(wǎng)絡(luò )等機器學(xué)習技術(shù)的發(fā)展使得數據和經(jīng)驗方面的積累更為重要。因此,自進(jìn)入21世紀以來(lái),蘋(píng)果、谷歌、三星等IT巨頭越發(fā)重視人工智能領(lǐng)域的發(fā)展,Naunce公司在語(yǔ)音識別技術(shù)方面的領(lǐng)先優(yōu)勢逐步縮小。谷歌等公司不僅收購了在語(yǔ)音識別技術(shù)領(lǐng)域有領(lǐng)先優(yōu)勢的中小公司,在技術(shù)研發(fā)上投入了巨額資金,而且花費重金從Naunce公司挖走了大量技術(shù)人才,其中包括在2004年挖走Nuance聯(lián)合創(chuàng )始人邁克·科恩,讓他出任谷歌公司的語(yǔ)音技術(shù)總監。蘋(píng)果Siri也不是蘋(píng)果公司自己研發(fā)的技術(shù),而是2010年收購的Siri Inc。公司的產(chǎn)品。2011年,蘋(píng)果公司便將該技術(shù)融入iPhone 4S并推出了Siri語(yǔ)音助理應用程序。其在此后的多個(gè)版本中逐步升級優(yōu)化,利用超過(guò)2.45億個(gè)短語(yǔ)的識別輔助理解上下文,以增強語(yǔ)境識別能力。
當然,語(yǔ)音識別技術(shù)領(lǐng)域不能不提的是軟件巨頭微軟公司。目前,微軟公司有兩款機器智能的終端產(chǎn)品,分別是微軟小娜Cortana和微軟小冰。Cortana是微軟推出的第一款個(gè)人應用輔助智能程序,是微軟公司在機器學(xué)習和人工智能領(lǐng)域的首次嘗試。它可以記錄用戶(hù)的日常使用行為和使用習慣,利用云計算、搜索引擎和非結構化數據分析,讀取和學(xué)習文本文件、電子郵件、圖片、視頻等數據,理解用戶(hù)的語(yǔ)義和語(yǔ)境,從而更好地實(shí)現人機交互。微軟小冰是由微軟Bing搜索中國團隊開(kāi)發(fā)的一款跨平臺人工智能聊天機器人,用戶(hù)可在新浪微博、微信、米聊等平臺上與其進(jìn)行智能對話(huà)。此外,微軟小冰還兼具群提醒、百科、天氣、星座、笑話(huà)、交通指南、餐飲點(diǎn)評等實(shí)用技能。