科大訊飛今年早些時(shí)候對外發(fā)布了四川話(huà)及河南話(huà)語(yǔ)音識別技術(shù),消息人士稱(chēng)目前東北話(huà)語(yǔ)音識別技術(shù)正在內測中,本月底將上線(xiàn)或先應用于訊飛輸入法中。該語(yǔ)音識別技術(shù)基于科大訊飛自主研發(fā)的方言語(yǔ)音識別引擎,具有自動(dòng)糾錯、智能聯(lián)想以及轉寫(xiě)文字的能力。
語(yǔ)音識別雖然不屬于新鮮技術(shù),但在方言識別領(lǐng)域卻鮮有公司涉入研究。目前,科大訊飛智能語(yǔ)音的研究方向包括方言語(yǔ)音及多語(yǔ)種識別合成,補缺了這一空白領(lǐng)域。此外,還率先將方言語(yǔ)音應用到社會(huì )生活中,并與移動(dòng)互聯(lián)網(wǎng)深度結合,從而開(kāi)辟了新的市場(chǎng)。
據知情人透露,科大訊飛即將發(fā)布的東北話(huà)語(yǔ)音識別技術(shù),不僅能夠識別濃厚東北口音的普通話(huà),對于純正地道的東北官話(huà)(包括沈陽(yáng)話(huà)、長(cháng)春話(huà)、哈爾濱話(huà))均有很好的識別能力。對于普羅大眾而言,最為關(guān)心的除識別準確率外還有使用場(chǎng)景等問(wèn)題。目前可知,科大訊飛的東北話(huà)識別準確率超過(guò)85%,達到實(shí)用水平;對用戶(hù)而言,提供的東北話(huà)語(yǔ)音識別不存在學(xué)習門(mén)檻,在家里、辦公室、大街上甚至噪聲環(huán)境下都能“即開(kāi)即用”;使用東北話(huà)同時(shí)就能轉成文字,方便用戶(hù)使用方言語(yǔ)音發(fā)QQ、發(fā)微信、發(fā)短信。
從發(fā)音規則上來(lái)看,東北話(huà)很“接地氣”,不僅聲調有個(gè)性而且有很多特色詞匯幾乎只可意會(huì )不能言傳,交流起來(lái)感情色彩豐富,這對于機器識別來(lái)說(shuō)有著(zhù)不小的壓力,因此需要通過(guò)量身定制的方言語(yǔ)音技術(shù)來(lái)識別。
待東北話(huà)正式發(fā)布時(shí),東北人就能用家鄉話(huà)一起嘮嗑,“開(kāi)春兒了,咱們這疙瘩又要暴土揚場(chǎng)、埋了巴汰的了”,“干活兒也別老禿擼反帳、半拉坷嘰的”……預計,科大訊飛此番推出的東北話(huà)識別可惠及東北三省1.2億人。截至目前,科大訊飛發(fā)布的方言語(yǔ)音識別已覆蓋3.2億人。