淺析語(yǔ)音識別的移動(dòng)互聯(lián)網(wǎng)應用
2010/08/18
摘要:語(yǔ)音識別技術(shù)發(fā)展到現在已經(jīng)達到應用水平,這項技術(shù)的推廣普及必在移動(dòng)互聯(lián)網(wǎng)行業(yè)。也許有一天我們可以通過(guò)藍牙耳機直接呼出我們的問(wèn)題,在通過(guò)藍牙耳機聽(tīng)到我們想得到的答案,而這除了浪費點(diǎn)流量一切都是免費的。
最早接觸的語(yǔ)音識別軟件是臺灣的賽微,這家公司的語(yǔ)音識別技術(shù)在當時(shí)已經(jīng)達到應用的水平。軟件本身不錯,但是有兩個(gè)問(wèn)題:一是對不常用的詞語(yǔ)的識別率不高,識別速度一般,占用先相對多的內存;二是市場(chǎng)需求不強烈,因為技術(shù)不是非常成熟和市場(chǎng)處于培育期,多數用戶(hù)只是打著(zhù)試試的想法試用軟件。
賽微的語(yǔ)音識別技術(shù)只是應用于手機本身并不應用于網(wǎng)絡(luò )搜索,讓我們意料之外的是,最早將語(yǔ)音識別技術(shù)應用于移動(dòng)搜索的是歌曲的移動(dòng)搜索。在這類(lèi)移動(dòng)應用中佼佼者要數:midomi和shazam,這兩個(gè)軟件都支持多個(gè)手機平臺,感興趣的用戶(hù)可以下載,注意的是shazam是免費的。
這類(lèi)應用的功能和百度即將推出的哼唱搜索是一個(gè)概念,用戶(hù)只需打開(kāi)軟件通過(guò)話(huà)筒哼唱歌曲或接受播放的音樂(lè ),軟件根據采集的數據來(lái)識別相應的歌曲。原理是采集音頻數據,上傳數據,核對數據庫里類(lèi)似的音頻數據,發(fā)送結果到設備。這種技術(shù)已經(jīng)達到非常成熟的水平,識別率達到90%以上甚至更高(這里的識別率只針對標準的唱片音頻,每個(gè)人的水平參差不齊識別率的標準不好確定)。而且通過(guò)這類(lèi)手機軟件產(chǎn)生的流量也很少,一般維持在15k~30k。
賽微的語(yǔ)音識別技術(shù)止步于單純的手機應用,midomi和shazam等移動(dòng)終端應用也止步于音樂(lè )的在線(xiàn)搜索,而搜索引擎廠(chǎng)商如Google、Bing、還有后面跟進(jìn)的百度都在大力推進(jìn)語(yǔ)音識別搜索的網(wǎng)絡(luò )化。微軟的Bing移動(dòng)版和Google的Google地圖等率先實(shí)現語(yǔ)音識別技術(shù)應用于移動(dòng)搜索領(lǐng)域,而百度在語(yǔ)音移動(dòng)搜索這個(gè)領(lǐng)域看來(lái)也想分一杯羹。
從已經(jīng)發(fā)布的微軟和Google語(yǔ)音搜索應用中我們可以發(fā)現,語(yǔ)音搜索離我們的生活還是有一段距離。最大的阻礙還是語(yǔ)音識別率不高,尤其是生詞的識別率超低,生詞基本不能識別,識別時(shí)間較長(cháng),占用的內存和CPU較多等。就拿Bing移動(dòng)版來(lái)說(shuō),目前只支持英文語(yǔ)音搜索,而像Washington、blog、twitter等這類(lèi)超常用的詞匯識別率很高,識別用時(shí)也很短,而比較生僻的詞匯用時(shí)較長(cháng),識別率也很低。我們平時(shí)用手機鍵盤(pán)或虛擬鍵盤(pán)只要2~3秒可以完成的輸入,在語(yǔ)音搜索這里可能需要多達1分鐘才能輸入,而且還不一定準確。這就是我們現在語(yǔ)音搜索還不普及的原因,用戶(hù)要的是效率而不是新穎的噱頭。
個(gè)人還是相對看好百度的歌曲哼唱搜索,原因是這方面的語(yǔ)音識別中的音樂(lè )搜索技術(shù)相對要成熟些,但鑒于每個(gè)人哼唱的水平不一,識別率自然天差地別。今年以來(lái),百度開(kāi)始加強語(yǔ)音識別的投入力度。尤其上個(gè)月連續發(fā)出啟事,招募語(yǔ)音識別的技術(shù)帶頭人、高級工程師和工程師等崗位。并提出能敏銳把握語(yǔ)音識別技術(shù)方向,主導開(kāi)發(fā)過(guò)應用級別的語(yǔ)音識別系統,四年以上語(yǔ)音方向的研究經(jīng)驗等要求。
從國內來(lái)看,除百度外,盛大也對語(yǔ)音識別技術(shù)情有獨鐘。盛大網(wǎng)絡(luò )創(chuàng )新院早在去年便靜悄悄地組建了中國最強悍的語(yǔ)音識別團隊,而且盛大決定對外開(kāi)放哼唱搜索技術(shù)相關(guān)源代碼,以幫助國內這個(gè)領(lǐng)域的研究人員得到分享和幫助。
音樂(lè )搜索只是語(yǔ)音搜索的冰山一角,移動(dòng)語(yǔ)音搜索才是語(yǔ)音搜索的重頭戲。而現在語(yǔ)音搜索技術(shù)正在逐漸成熟,語(yǔ)音搜索正在擺脫噱頭的頭銜走向普及應用。請大家放心,短時(shí)間內語(yǔ)音搜索只能是噱頭,無(wú)聊地時(shí)候當噱頭在眾人前面擺弄下還是游刃有余的。 若干年后,我們的生活可以被“語(yǔ)音”得很科幻。
21世紀網(wǎng)
相關(guān)閱讀:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
阿克陶县|
望都县|
象州县|
渝北区|
凤凰县|
宁化县|
自治县|
和田市|
南充市|
澄迈县|
旬阳县|
睢宁县|
连云港市|
康保县|
班玛县|
漳州市|
通辽市|
合肥市|
长垣县|
大竹县|
大渡口区|
双柏县|
德保县|
瑞昌市|
迁安市|
仲巴县|
华容县|
临清市|
潞城市|
马关县|
陆河县|
桦甸市|
保山市|
济源市|
邯郸县|
汉沽区|
神农架林区|
阳新县|
邯郸县|
延庆县|
那曲县|
http://444
http://444
http://444
http://444
http://444
http://444