
據了解,該獎項是全球語(yǔ)音領(lǐng)域頂級會(huì )議interspeech2021的特別競賽,由牛津大學(xué)、麻省理工學(xué)院林肯實(shí)驗室、斯坦福語(yǔ)音技術(shù)研究實(shí)驗室、韓國Naver等全球頂尖高校和學(xué)術(shù)機構聯(lián)合舉辦。此次競賽高手云集,包括美國約翰霍普金斯大學(xué)、微軟研究院、思必馳、字節跳動(dòng)、國音智能、搜狗、美團等國內外一流高校、研究機構及企業(yè)。
聲紋識別是指通過(guò)人工智能技術(shù)識別兩段語(yǔ)音是否為同一人。目前聲紋識別廣泛應用在金融質(zhì)檢、安防、刑偵等領(lǐng)域,關(guān)系到用戶(hù)隱私和安全問(wèn)題。在應用的過(guò)程中,聲紋識別跨域問(wèn)題、復雜音頻環(huán)境問(wèn)題為各行各業(yè)提出了嚴峻的挑戰。如何在應用中,有效降低跨域對聲紋識別的干擾、提升聲紋識別在復雜音頻環(huán)境下的識別準確性能,成為了整個(gè)行業(yè)共同關(guān)心的課題。
本次競賽中,中關(guān)村科金使用基于深度學(xué)習的聲紋識別技術(shù),參加Trick1和Trick2兩個(gè)賽道的比賽。兩賽道均為文本無(wú)關(guān)聲紋識別任務(wù)。其中,Trick1采用指定的Voxceleb2dev作為訓練集,Track2則可使用測試集之外任何開(kāi)放數據作為訓練集。比賽最大挑戰是需要進(jìn)行跨語(yǔ)言及復雜環(huán)境下的聲紋識別。中關(guān)村科金通過(guò)探索新的數據增廣方案,改進(jìn)聲紋識別算法,優(yōu)化訓練損失函數,并融合多個(gè)SOTA(行業(yè)領(lǐng)先)模型,顯著(zhù)提升了聲紋識別在跨語(yǔ)言和復雜環(huán)境的魯棒性以及識別準確率,從而獲得兩個(gè)賽道的亞軍。
作為國內領(lǐng)先的人工智能科技公司,中關(guān)村科金長(cháng)期在聲紋識別技術(shù)領(lǐng)域進(jìn)行研發(fā)投入,基于海量預訓練模型以及AI算法助力,在聲紋識別公開(kāi)數據評測中,識別準確率超過(guò)99.7%,廣泛應用于客服、催收、投訴等場(chǎng)景,為保護用戶(hù)隱私和數據安全、保障數字經(jīng)濟健康發(fā)展提供先進(jìn)的科技力量支撐。
依托強大的AI算法能力和聲紋識別技術(shù),中關(guān)村科金助力銀行、保險、證券、信托、教育、醫療、智能制造等行業(yè)客戶(hù)實(shí)現安全、高效的數字化升級。目前,已為數百家知名行業(yè)機構、企業(yè)合作提供智能化轉型解決方案,在服務(wù)企業(yè)數字化轉型、實(shí)現低碳綠色發(fā)展方面處于行業(yè)領(lǐng)先地位。