• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    科大訊飛劉聰:用系統性創(chuàng )新破局多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)難題

    2021-06-08 13:27:00   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      6月6日下午,全球人工智能技術(shù)大會(huì )期間,聚焦全球化多語(yǔ)種需求,著(zhù)眼于語(yǔ)言互通在“一帶一路”戰略中的基礎性作用,在多語(yǔ)種智能信息處理專(zhuān)題論壇上,科大訊飛研究院執行院長(cháng)劉聰發(fā)表《用系統性創(chuàng )新破局多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)難題》主題演講。
      用系統性創(chuàng )新破局多語(yǔ)種技術(shù)難題
      當前,語(yǔ)音已成為萬(wàn)物互聯(lián)時(shí)代人機交互的關(guān)鍵入口,語(yǔ)音輸入、語(yǔ)音搜索、語(yǔ)音交互等技術(shù)已經(jīng)成為手機、車(chē)載、玩具等智能產(chǎn)品的標配。另一方面,“一帶一路”國家戰略的建設依賴(lài)語(yǔ)言互通,多語(yǔ)種翻譯技術(shù)價(jià)值凸顯。此外,多語(yǔ)種語(yǔ)音語(yǔ)言技術(shù)也涉及國家信息安全等重大方向,成為世界各國競相布局的關(guān)鍵技術(shù)方向。
      因此,無(wú)論從社會(huì )剛需,還是國家戰略、信息安全等方面考慮,布局多語(yǔ)種語(yǔ)音語(yǔ)言技術(shù)都顯得尤為重要。
      劉聰表示,未來(lái)十年,我們將圍繞語(yǔ)音交互、語(yǔ)言翻譯等剛需應用場(chǎng)景,開(kāi)展多語(yǔ)種語(yǔ)音識別、語(yǔ)音合成、機器翻譯、圖文識別等智能語(yǔ)音語(yǔ)言技術(shù)的系統性布局,覆蓋包括“一帶一路”和世界主要國家在內的70多種語(yǔ)言。
      “我們非常清楚要將70多種語(yǔ)言的智能語(yǔ)音語(yǔ)言技術(shù)做到實(shí)用水平,并沒(méi)有那么容易,所以我們計劃用十年的時(shí)間去攻克這個(gè)難題。”
      針對未來(lái)十年布局,劉聰總結出多語(yǔ)種技術(shù)研發(fā)中面臨的三個(gè)挑戰:
      一是不同語(yǔ)言的用戶(hù)分布存在明顯的長(cháng)尾效應,小語(yǔ)種語(yǔ)言分析研究的積累和投入不足。不同語(yǔ)言獨特的語(yǔ)言現象十分復雜,相關(guān)知識的全面積累以及知識與技術(shù)的融合均存在困難;
      二是多語(yǔ)種訓練數據稀缺,制作難度和成本較大,難以支撐大量語(yǔ)種系統的研發(fā);
      三是語(yǔ)音合成、圖文識別、語(yǔ)音識別、機器翻譯等多語(yǔ)種技術(shù)涉及70多個(gè)語(yǔ)種、云端和本地引擎,以及不同領(lǐng)域需要研發(fā)部署成百上千套系統,眾多系統批量構建存在難題。同時(shí),當前基于級聯(lián)的語(yǔ)音翻譯、圖片翻譯也存在誤差擴散問(wèn)題。
      劉聰認為:“多語(yǔ)種技術(shù)的全面推動(dòng),包括技術(shù)創(chuàng )新和應用落地,不能只靠單點(diǎn)技術(shù)的創(chuàng )新,迫切需要通過(guò)系統性創(chuàng )新的方式來(lái)破局。”
      從數據、算法、平臺多維度
      構建多語(yǔ)種技術(shù)的系統性創(chuàng )新研發(fā)體系
      什么是系統性創(chuàng )新?科大訊飛總結了三大關(guān)鍵要素:一是關(guān)鍵的核心技術(shù)效果要跨越技術(shù)鴻溝,達到應用門(mén)檻;深度融合創(chuàng )新鏈條上的各個(gè)關(guān)鍵技術(shù),激發(fā)創(chuàng )新能力;針對重大的歷史命題社會(huì )命題進(jìn)行系統性解析,并將其轉化為科學(xué)問(wèn)題。
      單點(diǎn)技術(shù)突破方面,從2006年研發(fā)的中文口語(yǔ)評測機器評分超過(guò)專(zhuān)業(yè)評測員平均水平,到2015年研發(fā)的機器中文語(yǔ)音轉寫(xiě)正確率超過(guò)人類(lèi)速記員水平,再到智醫助理機器人通過(guò)國家執業(yè)醫師資格考試綜合筆試測試、中英語(yǔ)音翻譯達到CATTI全國翻譯專(zhuān)業(yè)資格(水平)考試二級合格標準……科大訊飛不斷在單點(diǎn)技術(shù)上取得突破。
      在創(chuàng )新鏈條上各關(guān)鍵技術(shù)的深度融合方面,基于核心技術(shù)的深度理解,我們可以進(jìn)行多個(gè)方向技術(shù)的協(xié)同創(chuàng )新。劉聰舉例,2016年,科大訊飛基于語(yǔ)音譜圖和圖像的相似性,成功將卷積神經(jīng)網(wǎng)絡(luò )應用于語(yǔ)音識別,提出DFCNN建模技術(shù),將其拓展到圖文識別任務(wù)上,效果取得了大幅提升。
      “對于多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)研發(fā)及產(chǎn)業(yè)化而言,由于其涉及語(yǔ)言眾多、技術(shù)實(shí)現復雜,我們將其作為一個(gè)系統工程進(jìn)行推動(dòng)。”劉聰表示。
      他從數據、算法、平臺等維度,分享了科大訊飛在多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)系統性創(chuàng )新中的思考和實(shí)踐。在數據方面,科大訊飛研發(fā)了基于人機協(xié)同的多語(yǔ)種數據標注平臺;在算法方面,重點(diǎn)開(kāi)展了多語(yǔ)種端到端統一建模框架、無(wú)監督/弱監督訓練,以及語(yǔ)音/圖片翻譯多任務(wù)協(xié)同優(yōu)化等方向的研究;在研發(fā)訓練效率優(yōu)化方面,構建了多語(yǔ)種模型自動(dòng)訓練及定制優(yōu)化平臺,以推動(dòng)多語(yǔ)種系統的批量研發(fā),解決人工耗時(shí)耗力問(wèn)題。
      “基于系統性創(chuàng )新,我們已經(jīng)完成一套完整的多語(yǔ)種語(yǔ)音語(yǔ)言系統研發(fā),包括60種語(yǔ)言的語(yǔ)音合成,69種語(yǔ)言的語(yǔ)音識別,56種語(yǔ)言的圖文識別,以及168種語(yǔ)言與中文的機器翻譯。”劉聰指出,部分語(yǔ)種現已上線(xiàn)訊飛開(kāi)放平臺,對外提供服務(wù)。
      用系統性創(chuàng )新推動(dòng)多場(chǎng)景廣泛落地
      得益于系統性創(chuàng )新,科大訊飛多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)在語(yǔ)音交互、語(yǔ)言翻譯等場(chǎng)景初步取得規模化應用落地。
      在多語(yǔ)種交互方面,科大訊飛與俄羅斯汽車(chē)工程研究院(NAMI)、奇瑞等國內外多個(gè)廠(chǎng)商開(kāi)展多語(yǔ)種合作,目前已覆蓋英語(yǔ)、俄語(yǔ)、日語(yǔ)、泰語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)等主要語(yǔ)種。
      在多語(yǔ)種翻譯方面,科大訊飛2016年發(fā)布的訊飛翻譯機開(kāi)創(chuàng )了AI翻譯機新品類(lèi),今年5月又推出雙屏翻譯機,持續引領(lǐng)智能翻譯硬件潮流。訊飛聽(tīng)見(jiàn)同傳產(chǎn)品廣泛應用于大型會(huì )議、發(fā)布會(huì )、展覽會(huì )等場(chǎng)景,已服務(wù)超1萬(wàn)場(chǎng)次大會(huì ),服務(wù)超3億人次。科大訊飛還成為北京2022年冬奧會(huì )和冬殘奧會(huì )官方自動(dòng)語(yǔ)音轉換與翻譯獨家供應商,助力打造人類(lèi)歷史上首個(gè)信息溝通無(wú)障礙的奧運會(huì )。
      此外,為了賦能海外開(kāi)發(fā)者,依托智能語(yǔ)音國家新一代人工智能開(kāi)放創(chuàng )新平臺,2020年4月科大訊飛在新加坡部署了海外站點(diǎn),為海外開(kāi)發(fā)者提供多語(yǔ)種語(yǔ)音識別、語(yǔ)音合成、機器翻譯、圖文識別和語(yǔ)音評測等能力,海外開(kāi)發(fā)者數量已經(jīng)超過(guò)7萬(wàn)人。
      劉聰指出,盡管在多語(yǔ)種技術(shù)研發(fā)和產(chǎn)業(yè)應用方面,我們取得初步成效,但我們也應清醒認識到,當前大量低資源語(yǔ)種的技術(shù)水平相比中英文等資源豐富語(yǔ)種還有較大差距。依托“科技冬奧”“科技創(chuàng )新2030”等國家科技部重點(diǎn)研發(fā)計劃,科大訊飛目前聯(lián)合了中科大、哈工大、新疆大學(xué)、上海外國語(yǔ)大學(xué)等國內眾多科研單位,已形成了廣泛的多語(yǔ)種產(chǎn)學(xué)研聯(lián)盟,共同推動(dòng)我國多語(yǔ)種智能語(yǔ)音語(yǔ)言技術(shù)進(jìn)步。
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 翁牛特旗| 五河县| 惠水县| 财经| 昂仁县| 分宜县| 扎赉特旗| 江油市| 信丰县| 裕民县| 龙海市| 涪陵区| 西青区| 青河县| 泸溪县| 东明县| 内乡县| 裕民县| 靖江市| 习水县| 罗城| 湘阴县| 轮台县| 丹江口市| 滦南县| 卓资县| 伊金霍洛旗| 长岭县| 甘谷县| 淳安县| 清水县| 余江县| 日土县| 淮北市| 南华县| 方城县| 尚义县| 泰兴市| 全南县| 巨野县| 蕲春县| http://444 http://444 http://444 http://444 http://444 http://444