• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 新聞 > 國內 >
     首頁(yè) > 新聞 > 國內 >

    科大訊飛包攬第五屆國際多通道語(yǔ)音分離和識別大賽冠軍

    2018-09-10 10:23:15   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      北京時(shí)間2018年9月7日,國際多通道語(yǔ)音分離和識別大賽(CHiME)組委會(huì )在微軟海得拉巴研發(fā)中心揭曉了最新一屆CHiME-5的比賽結果,科大訊飛團隊再次包攬大賽全部四個(gè)項目的冠軍并大幅刷新了各項目的最好成績(jì)!
      CHiME(Computational Hearing in Multisource Environments)屬于國際語(yǔ)音識別評測中的高難度比賽,始辦于2011年,由法國計算機科學(xué)與自動(dòng)化研究所、英國謝菲爾德大學(xué)、美國三菱電子研究實(shí)驗室等知名研究機構所發(fā)起。比賽的目的是希望學(xué)術(shù)界和工業(yè)屆針對高噪聲和混響等現象影響下的實(shí)際場(chǎng)景提出全新的語(yǔ)音識別解決方案,以進(jìn)一步提升語(yǔ)音識別的實(shí)用性和普適性,目前CHiME比賽已經(jīng)舉辦五屆,成為業(yè)界影響力最大、參賽隊伍最多、水平最高的多通道噪聲魯棒性語(yǔ)音識別比賽。
      歷屆CHiME比賽的參賽隊伍包括英國劍橋大學(xué)、美國卡內基梅隆大學(xué)、約翰霍普金斯大學(xué)、日本NTT、日立中央研究院、德國RWTH亞琛大學(xué)等國際一流高校和研究機構,以及清華大學(xué)、中科院聲學(xué)所、中科院自動(dòng)化所、西北工業(yè)大學(xué)等國內頂尖院校和研究所。
      本屆大賽組委會(huì )通過(guò)采用4聲道麥克風(fēng)陣列對20個(gè)真實(shí)家庭的晚餐進(jìn)行錄音來(lái)形成比賽數據,用以考察和測試在家庭聚會(huì )等不同場(chǎng)景中自由交談風(fēng)格下的遠場(chǎng)語(yǔ)音識別效果。






      音頻樣本采集場(chǎng)景
      賽事的難點(diǎn)主要來(lái)自以下方面:
    • 多麥克風(fēng)陣列的同步錄音
    • 對話(huà)風(fēng)格非常自由、近乎隨意
    • 大量的語(yǔ)音交疊(Speech Overlap)
    • 遠場(chǎng)混響和噪聲干擾對錄音的影響
      在兩年之前的上一屆比賽(CHiME-4)中,科大訊飛就曾通過(guò)和國內外知名院校專(zhuān)家、團隊的深入合作和討論,斬獲全部三個(gè)項目的桂冠并大幅刷新了各項目歷史最好記錄。
      而在本屆比賽中,科大訊飛與中國科學(xué)技術(shù)大學(xué)杜俊教授、西北工業(yè)大學(xué)陳景東教授、佐治亞理工大學(xué)李錦輝教授等國內外知名專(zhuān)家團隊再度攜手。最終在單麥克風(fēng)陣列任務(wù)、分布式麥克風(fēng)陣列任務(wù)(Rank A)和兩種麥克風(fēng)陣列對應的兩個(gè)端到端的語(yǔ)音識別任務(wù)(Rank B),共計四項任務(wù)中連續兩屆包攬所有項目冠軍,再次大幅刷新各項目的最好成績(jì)。
      各參賽機構詞錯誤率對比(單麥克風(fēng)陣列 Rank A)
      各參賽機構詞錯誤率對比(分布式陣列 Rank A)
      各參賽機構詞錯誤率對比(單麥克風(fēng)陣列 Rank B)
      各參賽機構詞錯誤率對比(分布式陣列 Rank B)
      根據比賽前官方數據,基于主流前端系統和深度學(xué)習模型下本次比賽的樣本語(yǔ)音識別詞錯誤率(Word Error Rate,WER)高達81.14%,堪稱(chēng)“史上最難語(yǔ)音識別任務(wù)"。
      而科大訊飛團隊所提交的系統,較官方基線(xiàn)系統將WER降低了絕對35個(gè)點(diǎn),在分布式麥克風(fēng)陣列任務(wù)中,系統的效果甚至超過(guò)近講麥克風(fēng),這不僅再次證明了科大訊飛在語(yǔ)音識別和多麥克風(fēng)陣列語(yǔ)音信號處理領(lǐng)域內扎實(shí)的基本功和雄厚的實(shí)力,也表明了科大訊飛在中文語(yǔ)音識別領(lǐng)域長(cháng)期保持被追趕地位的同時(shí),英語(yǔ)語(yǔ)音識別領(lǐng)域也達到了同等高度和層次。
      此前,在科技部召開(kāi)的《新一代人工智能發(fā)展規劃》暨重大科技項目啟動(dòng)會(huì )會(huì )上,國家宣布了首批四家國家新一代人工智能開(kāi)放創(chuàng )新平臺名單,明確依托科大訊飛建設智能語(yǔ)音國家新一代人工智能開(kāi)放創(chuàng )新平臺。
      啟動(dòng)會(huì )現場(chǎng)
      在本次大賽中,科大訊飛所提交的系統在分布式麥克風(fēng)陣列任務(wù)上所取得的優(yōu)于近講麥克風(fēng)效果的成績(jì),得到了大賽組辦方的高度贊揚。科大訊飛在智能語(yǔ)音技術(shù)方面的雄厚實(shí)力得到再次肯定與鞏固,未來(lái),科大訊飛將繼續堅持核心源頭技術(shù)研發(fā)創(chuàng )新,用AI賦能各行各業(yè)。
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 汤阴县| 墨竹工卡县| 东乌珠穆沁旗| 观塘区| 绥棱县| 广饶县| 屏南县| 苏尼特左旗| 靖西县| 开化县| 泽库县| 隆回县| 台南市| 济源市| 青河县| 达孜县| 双辽市| 龙川县| 遂溪县| 安化县| 天等县| 波密县| 西城区| 怀安县| 杭锦后旗| 岑溪市| 珠海市| 将乐县| 象山县| 垣曲县| 台东市| 尼玛县| 闽清县| 务川| 封开县| 长治县| 南华县| 吉安市| 南部县| 哈尔滨市| 剑川县| http://444 http://444 http://444 http://444 http://444 http://444