英國東英吉利大學(xué)日前發(fā)布的新成果顯示,該校研究人員開(kāi)發(fā)的新型視覺(jué)語(yǔ)音識別系統能像專(zhuān)業(yè)人員那樣識別唇語(yǔ),且識別度更精確,未來(lái)在案件偵查以及輔助聽(tīng)力和語(yǔ)言有障礙的人士方面具有廣泛用途。
據新華網(wǎng)29日消息,據研究人員介紹,無(wú)論是專(zhuān)業(yè)人士還是現有的視覺(jué)語(yǔ)音電腦識別系統,在讀唇語(yǔ)時(shí)一個(gè)最大挑戰是如何區別容易混淆的發(fā)音,如英文中“p”、“b”、“m”發(fā)音時(shí),唇部動(dòng)作都非常相似,很難區別。但最新開(kāi)發(fā)的電腦系統利用特別設計的程序,能分辨出圖像中唇部最細微的變化,并且完全不需要語(yǔ)音信息輔助。
參與這項研究的東英吉利大學(xué)學(xué)者海倫·貝爾說(shuō),發(fā)“p”、“b”、“m”這樣的音時(shí),唇部動(dòng)作還是會(huì )有肉眼不易察覺(jué)的差別,這款電腦程序會(huì )不斷學(xué)習和積累相似發(fā)音的唇部動(dòng)作,并進(jìn)行相關(guān)分類(lèi),從而不斷提高識別的精確度。
貝爾表示,未來(lái)經(jīng)過(guò)進(jìn)一步優(yōu)化,這一系統能夠運用在多個(gè)領(lǐng)域中,除了用來(lái)幫助有聽(tīng)力和語(yǔ)言障礙的人士,相關(guān)技術(shù)也會(huì )對人工智能的發(fā)展起到很好的助推作用。