產(chǎn)綜研開(kāi)發(fā)利用語(yǔ)音直接檢索多媒體內容的技術(shù)
2008/10/15
日本產(chǎn)業(yè)技術(shù)綜合研究所宣布,開(kāi)發(fā)出利用語(yǔ)音直接檢索視頻共享網(wǎng)站等多媒體內容的技術(shù)。并將公開(kāi)基于該技術(shù)的檢索系統驗證網(wǎng)站。除互聯(lián)網(wǎng)方面的應用外,還設想應用于呼叫中心通話(huà)錄音系統的語(yǔ)音檢索、以及使用大量多媒體內容的廣播·教育領(lǐng)域。使用此次開(kāi)發(fā)技術(shù)的檢索系統的驗證網(wǎng)站
此次公開(kāi)的檢索系統,能夠利用關(guān)鍵詞直接檢索互聯(lián)網(wǎng)視頻共享網(wǎng)站和語(yǔ)音網(wǎng)站等多媒體內容中包含的語(yǔ)音。由于不使用原檢索系統所必需的語(yǔ)音識別辭典,因此即使是包含新固有名詞和生詞的單詞,也可不受限制地作為檢索關(guān)鍵詞。另外,無(wú)需維護、可實(shí)時(shí)檢索互聯(lián)網(wǎng)上的新內容。使用普通瀏覽器即可利用該系統。
檢索使用的是,比通常的語(yǔ)音檢索采用的音素更為細分、被認為是可保留語(yǔ)言信息最小單位的“音素片(SPS: Sub-Phonetic
Segment)”。根據音素片進(jìn)行檢索,檢索處理的精度降低問(wèn)題得以抑制,從而能夠實(shí)現不使用辭典的檢索。作為檢索對象的數據、檢索關(guān)鍵詞均按照音素片單位進(jìn)行拆分·編碼,將符號間的匹配數值化并進(jìn)行對照。這一對照處理方法中,也開(kāi)發(fā)了自主高速處理算法。
檢索系統的構成
由于不再依靠基于辭典的語(yǔ)言,較為容易支持多種語(yǔ)言及方言。另外,不僅可使用文字、還可通過(guò)語(yǔ)音輸入檢索關(guān)鍵詞。因此,老年人和殘疾人等難以用鍵盤(pán)輸入檢索語(yǔ)詞的用戶(hù)也能輕松利用該服務(wù)。
今后,產(chǎn)綜研將通過(guò)在用戶(hù)中招募試用者,驗證該系統的有效性,面向實(shí)用化進(jìn)行改進(jìn)。另外,還計劃促進(jìn)與原測試庫的語(yǔ)音檢索技術(shù)及多媒體內容的分類(lèi)·歸納等技術(shù)的融合,開(kāi)發(fā)更為地道的媒體檢索技術(shù)。
此外,產(chǎn)綜研預定在2008年10月20~21日于產(chǎn)綜研筑波中心舉辦的“產(chǎn)綜研開(kāi)放實(shí)驗室”上公開(kāi)該技術(shù)。
利用語(yǔ)音從多媒體內容中檢索特定場(chǎng)景的
日經(jīng)BP社
恒融同北京農商行合作開(kāi)發(fā)“視頻銀行”亮相金融展 2008-10-13 |
訊鳥(niǎo)與金算盤(pán)攜手 共享網(wǎng)購盛宴 2008-10-13 |
Aspect與微軟子公司Tellme合作提升聯(lián)絡(luò )中心語(yǔ)音平臺 2008-09-24 |
TouchStar呼叫中心支持NMS Open Access媒體處理平臺 2008-09-23 |
中國網(wǎng)通116114電話(huà)導航推出隨身號簿業(yè)務(wù) 2008-09-16 |