• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    美的科技月 x 思必馳丨聲動(dòng)無(wú)限 共話(huà)未來(lái)

    2020-10-15 10:13:38   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      9月24日,第25屆美的科技月系列活動(dòng)在美的創(chuàng )新中心展開(kāi)。思必馳作為美的技術(shù)合作伙伴應邀參加,并協(xié)同舉辦了“聲動(dòng)無(wú)限·共話(huà)未來(lái)”的主題論壇。本次科技月活動(dòng),思必馳分別帶來(lái)產(chǎn)品方向、技術(shù)路線(xiàn)方面的分享,進(jìn)一步加深與合作伙伴的了解及增強雙方互動(dòng)。
      以下內容由思必馳轉寫(xiě)一體機記錄并轉寫(xiě)。思必馳智能會(huì )議轉寫(xiě)系統,自從開(kāi)會(huì )用上它,職場(chǎng)“社畜”早回家!
      1、思必馳人工智能語(yǔ)音技術(shù)簡(jiǎn)介
      分享環(huán)節中,思必馳商務(wù)總監申曉宇率先為參會(huì )人員介紹思必馳公司概況及主要產(chǎn)品技術(shù)、解決方案。思必馳一直以來(lái)專(zhuān)注于語(yǔ)音交互核心技術(shù)不斷升級以及AI+行業(yè)的商業(yè)落地,同時(shí)也擁有產(chǎn)業(yè)基金來(lái)孵化不同行業(yè)場(chǎng)景下的商業(yè)化應用,以擴大思必馳在整個(gè)行業(yè)里的布局。
      思必馳目前為合作伙伴提供全渠道的智能服務(wù),主要集中在IoT、智能家居、智能車(chē)載、智能電子、機器人等領(lǐng)域。同時(shí),思必馳業(yè)務(wù)范圍也逐漸覆蓋智慧金融、智慧醫療、智慧物流、智慧酒店等場(chǎng)景。
      目前,在整個(gè)IoT場(chǎng)景及車(chē)載場(chǎng)景市場(chǎng)占有率里,思必馳以亮眼數據占據了行業(yè)領(lǐng)先地位;同時(shí),智慧城市、智慧政務(wù)、智能客服等也是思必馳所嘗試的戰略發(fā)展新方向。細化AI+行業(yè),以AI賦能全行業(yè),是思必馳一直以來(lái)的用心所在。
      2、端側專(zhuān)用芯片——AI算法的理想載體
      思必馳全資子公司——深聰智能芯片總監查亮則對思必馳端側專(zhuān)用AI芯片做出了更詳細的闡述。
      根據IDC預測,2021年全球AI生態(tài)市場(chǎng)規模將超過(guò)520億美金。基于2021年全球AI生態(tài)系統的發(fā)展態(tài)勢,AI芯片迎來(lái)了新的發(fā)展機遇及挑戰,軟件定義芯片的時(shí)代已經(jīng)來(lái)臨。在傳統通用芯片市場(chǎng)上,芯片可匹配的應用場(chǎng)景很多,對算力要求不高,可以適配多種產(chǎn)品,但是通用性強可能導致芯片的專(zhuān)業(yè)性較弱。此外在市場(chǎng)層面,從最初的產(chǎn)品定義到軟件功能、硬件設計,及最后的用戶(hù)體驗,能夠給用戶(hù)帶來(lái)一套完整芯片方案是當前比較剛性的需求。所以軟硬件的結合,是更符合市場(chǎng)趨勢的一個(gè)產(chǎn)品方向。
      深聰智能自研發(fā)的TH系列芯片作為思必馳語(yǔ)音算法與芯片的完美結合,令客戶(hù)在選擇對傳統產(chǎn)品進(jìn)行智能化改造時(shí)擁有了更多樣化、更靈活的軟硬一體解決方案。深聰智能第一代芯片TH1520已量產(chǎn)上市并落地諸多案例,下一代芯片在開(kāi)發(fā)中針對算法、架構、物理實(shí)現了IP優(yōu)化,多模態(tài)視覺(jué)識別也在規劃中。
      3、語(yǔ)音前端信號處理技術(shù)
      在全鏈路語(yǔ)音技術(shù)分享環(huán)節中,思必馳前端信號處理負責人周強認為,語(yǔ)音交互仍面臨著(zhù)遠場(chǎng)拾音、多聲道同步采集、回聲消除、去混響、平穩噪聲降噪、自動(dòng)目標偵聽(tīng)和喚醒、目標聲源波達方向估計、目標聲源波束形成和干擾抑制等諸多聲學(xué)場(chǎng)景挑戰。信號處理可以提升語(yǔ)音的可懂度和信噪比,用來(lái)提升人人交互和人機交互的性能。
      思必馳在遠場(chǎng)語(yǔ)音通話(huà)、遠場(chǎng)語(yǔ)音喚醒識別等方面都有自己的一套處理算法,在不同的系統中做好降噪量和失真的權衡問(wèn)題也有著(zhù)比較充足的實(shí)戰經(jīng)驗。在談到思必馳所掌握的核心基礎技術(shù)時(shí),周強著(zhù)重介紹了波束成形技術(shù)及盲源分離技術(shù)的技術(shù)原理及關(guān)鍵指標。
      技術(shù)終將凝練成產(chǎn)品再系統形成成熟方案,基于過(guò)硬的全鏈路語(yǔ)音技術(shù),周強也簡(jiǎn)要介紹了思必馳的遠/近場(chǎng)交互方案。近場(chǎng)交互方案多應用于智能客服終端、機器人、自動(dòng)售賣(mài)機等案例中,它采用大陣列近場(chǎng)模型,對角度和距離進(jìn)行建模,能有效去除范圍外的噪聲干擾。遠場(chǎng)交互方案則廣泛用于家居場(chǎng)景中,目前思必馳遠場(chǎng)交互方案配合麥陣方案,可實(shí)現遠場(chǎng)3~5米識別率在94%以上。
      4、思必馳ASR(++)技術(shù)與平臺化應用
      思必馳語(yǔ)音識別技術(shù)總監薛少飛則從語(yǔ)音識別技術(shù)(ASR)、語(yǔ)音富信息技術(shù)(ASR++)以及語(yǔ)音技術(shù)平臺化幾個(gè)方向分享了思必馳的技術(shù)和產(chǎn)品思路。
      卷積神經(jīng)網(wǎng)絡(luò )(CNN)應用到語(yǔ)音識別中由來(lái)已久,最早應用在圖像識別領(lǐng)域,大約在2014年引入到語(yǔ)音識別領(lǐng)域。利用CNN將整個(gè)語(yǔ)音信號分析得到的時(shí)頻譜當作一張圖像一樣來(lái)處理,采用圖像中廣泛應用的深層卷積網(wǎng)絡(luò )對其進(jìn)行建模;從實(shí)用性上考慮,CNN也比較容易實(shí)現大規模并行化計算。在深度學(xué)習領(lǐng)域,思必馳聯(lián)合實(shí)驗室推出極深卷積神經(jīng)網(wǎng)絡(luò )(VDCNN)在識別魯棒性上展現出巨大的優(yōu)勢。產(chǎn)學(xué)研一體化之下,思必馳語(yǔ)音識別準確率高達98%,并具有反饋速度快、快速定制、強魯棒性等優(yōu)勢,這得益于思必馳語(yǔ)音算法的行業(yè)前瞻性及先進(jìn)性。
      語(yǔ)音識別支持通用以及包括金融、教育、音視頻等在內的領(lǐng)域場(chǎng)景,同時(shí)也提供語(yǔ)音識別自定制能力,賦能客戶(hù)自主優(yōu)化應用場(chǎng)景中的識別體驗;即使在本地也可以支持普通話(huà)、方言以及外語(yǔ)小語(yǔ)種的識別。而語(yǔ)音副信息技術(shù)則在語(yǔ)音識別基礎上加上了富信息識別,例如說(shuō)話(huà)人、情緒、年齡、性別等。
      目前思必馳語(yǔ)音富信息技術(shù)已落地至IoT、智能客服、金融安全、會(huì )議轉寫(xiě)、國防安全等場(chǎng)景。作為對話(huà)式AI平臺型公司,思必馳在語(yǔ)音技術(shù)平臺化方面也做了很多工作,推出的DUI平臺可面向物聯(lián)網(wǎng)場(chǎng)景進(jìn)行智能對話(huà)交互的定制化輸出,會(huì )話(huà)精靈則作為企業(yè)虛擬機器人定制平臺,幫助企業(yè)快速定制專(zhuān)屬服務(wù)和解決方案。
      5、全雙工及多模態(tài)交互技術(shù)
      思必馳全鏈路語(yǔ)音技術(shù)為各行各業(yè)智能交互添磚加瓦的同時(shí),全雙工交互貫穿始終。思必馳對話(huà)組負責人樊帥指出,在過(guò)去半雙工狀態(tài)下,用戶(hù)的跨領(lǐng)域交互每次交互都需要重新喚醒,而現在,思必馳全雙工技術(shù)方案可實(shí)現一次喚醒,在多個(gè)領(lǐng)域持續交互,跨領(lǐng)域指代消解。不僅如此,全雙工語(yǔ)音交互可以結合專(zhuān)業(yè)領(lǐng)域知識庫實(shí)現智能語(yǔ)義糾正、支持多領(lǐng)域的模糊信息確認、打破沉默主動(dòng)交互、根據用戶(hù)說(shuō)話(huà)節奏和內容動(dòng)態(tài)斷句等。
      全雙工交互技術(shù)的提升涉及到對話(huà)系統的各個(gè)模塊,不僅各個(gè)模塊的功能性、穩定性需要提升,對各模塊間的配合也提出了更高要求。思必馳專(zhuān)注人性化的智能語(yǔ)音技術(shù),依托DUI平臺,思必馳全雙工與當前全鏈路語(yǔ)音技術(shù)全面兼容,客戶(hù)可以選用思必馳全鏈路技術(shù)或采用云對云的方式接入全雙工。
      此外,樊帥提到多模態(tài)交互將極大提升人機交互體驗,他現場(chǎng)演示了一段視頻,展示多模態(tài)交互中的人臉拒識可以將非喚醒人的指令過(guò)濾,指令執行有條不紊。多模態(tài)交互可讓全雙工交互技術(shù)發(fā)揮更大的能量,配合聲紋識別、圖像處理等技術(shù),過(guò)濾無(wú)用信息,人機交互會(huì )變得更加貼合人性,這也是未來(lái)思必馳發(fā)力的方向。
      6、語(yǔ)音技術(shù)在IoT場(chǎng)景的應用
      成立至今,思必馳以AI賦能多種IoT產(chǎn)品,覆蓋了包括音箱、電視、穿戴、白電、故事機、廚電在內的多種IoT設備,為實(shí)現物聯(lián)網(wǎng)的智慧互聯(lián)而不懈努力。
      思必馳IoT產(chǎn)品負責人于鵬偉從語(yǔ)音交互流程出發(fā),簡(jiǎn)單系統解釋全鏈路的概念。說(shuō)話(huà)人說(shuō)話(huà)通過(guò)陣列采集形成原始音頻,進(jìn)入到信號處理模塊,包括回聲消除、降噪等流程,然后獲得一段相對純凈的音頻。這時(shí)通過(guò)本地語(yǔ)音識別進(jìn)入到本地語(yǔ)音播報并傳達給說(shuō)話(huà)人;或者通過(guò)云端語(yǔ)音識別進(jìn)入到自然語(yǔ)言理解模塊、對話(huà)管理、自然語(yǔ)言生成,最后再文字轉語(yǔ)音傳達給說(shuō)話(huà)人。
      基于關(guān)鍵全鏈路語(yǔ)音技術(shù),思必馳的近/遠場(chǎng)方案可以滿(mǎn)足智能客服、家居等多樣化場(chǎng)景需求。思必馳算法技術(shù)中的就近喚醒、聲紋識別、方言識別、通話(huà)降噪、圖像與多模態(tài)皆達到行業(yè)領(lǐng)先水平;此外,思必馳算法模型也已通過(guò)亞馬遜驗證標準測試,成為亞馬遜前端軟件推薦供應商,可協(xié)助合作客戶(hù)通過(guò)AmazonAlexa實(shí)驗室聲學(xué)認證測試,將來(lái)可為本土廠(chǎng)商發(fā)展海外市場(chǎng)、優(yōu)化多語(yǔ)言模型提供強大技術(shù)支持。
      7、聲動(dòng)無(wú)限共話(huà)未來(lái)
      美的科技月活動(dòng)始于1996年,在美的集團內部素有“科研奧斯卡”之稱(chēng),一直被美的視為科技創(chuàng )新實(shí)力和科技人員風(fēng)采的內部展示與交流平臺。
      思必馳與美的集團的合作由來(lái)已久,近日更是與美的集團共同創(chuàng )立“AI聯(lián)合研究實(shí)驗室”,旨在攜手打造全鏈路智能家居生態(tài)平臺。未來(lái),雙方也將在創(chuàng )新研發(fā)、產(chǎn)品更新、市場(chǎng)拓展等方面不斷深化合作,共建雙贏(yíng)格局,推進(jìn)未來(lái)設備數字化與智能化升級。
     
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 鲁山县| 广元市| 阳春市| 沈阳市| 德江县| 永和县| 福清市| 蓝山县| 德江县| 原阳县| 广宁县| 当雄县| 黎平县| 福泉市| 通榆县| 东丽区| 古浪县| 红河县| 荆门市| 寿阳县| 六枝特区| 嘉善县| 泽库县| 洮南市| 甘洛县| 泰来县| 江永县| 尼勒克县| 若尔盖县| 城步| 金寨县| 玛曲县| 葵青区| 山阳县| 永和县| 吉木萨尔县| 桂东县| 长汀县| 建宁县| 松溪县| 临漳县| http://444 http://444 http://444 http://444 http://444 http://444