新型計算機語(yǔ)音識別功能接近大腦
2004/12/24
俄羅斯科學(xué)院無(wú)線(xiàn)電與電子技術(shù)研究所科研人員安齊佩羅夫開(kāi)發(fā)出一種全新的計算機語(yǔ)音識別系統。通過(guò)實(shí)驗發(fā)現,語(yǔ)音頻譜中最基本的成分接近1千赫。
安齊佩羅夫指出,理論上最智能的語(yǔ)音識別系統應該像人的大腦一樣,能在瞬間從大量聲音中分辨出已知的聲音,而不依賴(lài)聲音的大小和聲調。目前的計算機識別系統還沒(méi)有達到這種水平。每種聲音對機器識別系統來(lái)說(shuō),仍是獨一無(wú)二的,因此需要在機器上進(jìn)行訓練。由于長(cháng)期訓練的結果,在計算機的存儲系統中形成了一個(gè)信息庫,將某種聲音的大量方案存儲到這里,當計算機遇到某種聲音時(shí),就在這個(gè)信息庫里進(jìn)行挑選加工,然后選出某種可能的方案。
安齊佩羅夫在解釋自己開(kāi)發(fā)的語(yǔ)音識別系統時(shí)指出,這一獨特的語(yǔ)音識別系統最主要的是考慮了語(yǔ)音的分級體系,從中辨別語(yǔ)音中最基本的成分,就像鑒別音樂(lè )中的音調一樣,在寬廣的語(yǔ)音頻譜中,分辨出語(yǔ)音中最基本的具有思維性質(zhì)的聲音頻譜。實(shí)驗表明,這個(gè)頻譜的范圍接近1千赫,而其他那些帶有情感色彩的語(yǔ)調,屬于心理物理學(xué)范疇。
安齊佩羅夫進(jìn)一步介紹說(shuō),在上述理論指導下,他開(kāi)發(fā)的計算機語(yǔ)音識別系統接近大腦的識別功能:計算機在系統程序的指導下,將語(yǔ)音背景的個(gè)性成分清除,保留語(yǔ)音中最基本的成分,最大可能地簡(jiǎn)化了計算機的工作。在實(shí)驗中,科研人員讓十幾人用不同聲音進(jìn)行實(shí)驗,結果發(fā)現,計算機能夠避開(kāi)那些帶有情感色彩的語(yǔ)調的干擾,準確地通過(guò)語(yǔ)音中最基本的成分辨別聲音,1000比特的內存就能識別所有的數字和一些簡(jiǎn)單的語(yǔ)音
有關(guān)專(zhuān)家指出,該識別體系不僅達到了快速辨別語(yǔ)音的能力,還使計算機的存儲時(shí)間和內存降低。該科研成果最適合大量的移動(dòng)電子裝置領(lǐng)域。
科技日報
得意公司成功舉辦技術(shù)培訓并發(fā)布軟件新版本 2004-12-24 |
中科信利在電信級語(yǔ)音識別產(chǎn)業(yè)化方面取得突破性進(jìn)展 2004-12-16 |
科勝通EnsemblePro與言豐文語(yǔ)轉換引擎集成測試獲得成功 2004-12-15 |
短信和菜單用語(yǔ)音表示盲人使用手機不再有困難 2004-12-14 |
北京捷通華聲成為Eicon技術(shù)合作伙伴(ETP) 2004-12-13 |