• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    專(zhuān)訪(fǎng) | 標貝科技劉博:洞見(jiàn)智能語(yǔ)音賽道未來(lái)之路

    2021-05-25 09:53:24   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      聚焦成長(cháng)|賦能品牌
      為助力園區企業(yè)品牌宣傳、打造企業(yè)創(chuàng )新生態(tài),中關(guān)村東升科技園推出原創(chuàng )欄目《企業(yè)家專(zhuān)訪(fǎng)》。以“聚焦成長(cháng)+賦能品牌”為主題,深入了解企業(yè)成長(cháng)歷程、角色定位、企業(yè)文化等,并深入挖掘企業(yè)需求,提升企業(yè)長(cháng)期發(fā)展競爭力。
      本期《企業(yè)家專(zhuān)訪(fǎng)》欄目特別邀請標貝(北京)科技有限公司創(chuàng )始人&CEO劉博,透過(guò)標貝科技在智能語(yǔ)音領(lǐng)域的技術(shù)深研與發(fā)展路徑,洞見(jiàn)智能語(yǔ)音賽道未來(lái)之路。
      標貝科技創(chuàng )始人&CEO劉博
      中歐EMBA,對外經(jīng)貿大學(xué)碩士;連續創(chuàng )業(yè)者,曾創(chuàng )立蓋博資本管理有限公司,擔任創(chuàng )始人兼CEO;2016年,創(chuàng )立標貝科技,負責整體戰略發(fā)展、運營(yíng)管理及資本等。
      語(yǔ)音作為語(yǔ)言的物質(zhì)載體和人類(lèi)日常生活交流的重要信息載體,承載著(zhù)豐富的語(yǔ)言?xún)群侨祟?lèi)進(jìn)行信息交流的重要傳遞通道。日常生活中,超過(guò)20%以上的交流都需要通過(guò)語(yǔ)音來(lái)完成。同一語(yǔ)音情境下,不同的語(yǔ)調、語(yǔ)氣和情緒的不同都會(huì )影響語(yǔ)義的傳達。隨著(zhù)人工智能時(shí)代的到來(lái),智能語(yǔ)音交互技術(shù)也成為了人機智能交流的重要載體。智能語(yǔ)音作為橋接人和機器語(yǔ)音交流的人工智能應用,一方面承載著(zhù)機器和人的交流,另一方面直達知識和邏輯。如何通過(guò)海量數據的快速學(xué)習,讓機器理解不同情緒、語(yǔ)調下的多人語(yǔ)音內容和含義,通過(guò)機器生成更加自然的聲音體驗,是語(yǔ)音交互始終致力解決的難題。
      標貝科技通過(guò)語(yǔ)音技術(shù)與數據,將情感與用戶(hù)的有機串聯(lián),不斷拓展AI語(yǔ)音技術(shù)的應用場(chǎng)景,圍繞生活場(chǎng)景、辦公效率、行業(yè)協(xié)同,打造完整的智能語(yǔ)音生態(tài)服務(wù)體系。
      據了解,標貝科技從2016年成立至今,基于先進(jìn)AI語(yǔ)音算法及海量數據規模優(yōu)勢,已推出多場(chǎng)景應用的語(yǔ)音交互方案,包括通用場(chǎng)景的語(yǔ)音合成、語(yǔ)音識別,以及高音色TTS定制、聲音復刻、情感合成和聲音轉換等在內的語(yǔ)音技術(shù)產(chǎn)品。為機器賦予生命力,能夠有溫度的、有情感的與用戶(hù)進(jìn)行交流,讓人機交互變得更簡(jiǎn)單、美好。
      短短幾年時(shí)間,標貝科技從默默無(wú)聞到科技黑馬,從悄無(wú)聲息到一鳴驚人,更是在2020年成功入選“中國科創(chuàng )產(chǎn)業(yè)新銳TOP50”榜單。讓我們回顧標貝科技的成長(cháng)歷程,共同探索標貝如何實(shí)現從0到1的技術(shù)夯實(shí),以及從1到10的快速成長(cháng),從而處于智能語(yǔ)音交互領(lǐng)域行業(yè)標桿地位的探索升級之路。
      第一階段
      語(yǔ)音賽道數據為王
      2016年,標貝科技于中關(guān)村東升科技園成立。作為一家專(zhuān)注于智能語(yǔ)音交互和AI數據服務(wù)的人工智能公司,短短5年時(shí)間,標貝科技已與華為、騰訊、阿里、字節跳動(dòng)、人民日報、新華社等百余家知名企業(yè)及機構客戶(hù)建立戰略合作,服務(wù)項目累計超過(guò)1000項,涵蓋有聲閱讀、智能客服、智慧金融、AI教育、泛娛樂(lè )、自動(dòng)駕駛、智慧城市等眾多領(lǐng)域。
      作為語(yǔ)音交互技術(shù)領(lǐng)域的黑馬,標貝除了技術(shù)的深研和專(zhuān)注外,創(chuàng )始人劉博對于智能語(yǔ)音賽道的專(zhuān)注和獨到的戰略布局,也是標貝能在短時(shí)間內脫穎而出、巨量增長(cháng)的關(guān)鍵。
      回望整個(gè)標貝科技發(fā)展進(jìn)程及技術(shù)路徑,劉博表示,標貝創(chuàng )立之初便進(jìn)行了前瞻性的數據產(chǎn)業(yè)布局,基于3-5年的經(jīng)驗及技術(shù)累積迭代,標貝已經(jīng)建立了超過(guò)10萬(wàn)小時(shí)的數據庫,這些數據累積也為下一階段的技術(shù)運用打下了堅實(shí)基礎,初步建立了標貝的核心競爭力。
      專(zhuān)注、務(wù)實(shí)、創(chuàng )新,是標貝一路積微成著(zhù),走向行業(yè)領(lǐng)先道路上不可或缺的因素。
      第二階段
      算法深耕創(chuàng )新語(yǔ)音合成
      2017年,標貝邁入第二發(fā)展階段,即從數據的累積到基于算法的深層探索。劉博表示,海量的數據積累,為垂直行業(yè)多元化場(chǎng)景的深度結合打下了堅實(shí)的基礎。基于海量真實(shí)、有溫度、有情感的語(yǔ)音積累,結合算法的優(yōu)化迭代,標貝科技推出了可應用于泛娛樂(lè )、智能家居、智能客服等多個(gè)行業(yè)的多語(yǔ)種,多音色,多情緒的語(yǔ)音交互解決方案,實(shí)現了無(wú)差別與真實(shí)交互的“虛擬語(yǔ)音交互”。
      例如為金融領(lǐng)域提供的具有雙錄主播功能解決方案,通過(guò)提供無(wú)感知的虛擬數字人交互,在時(shí)效保證、服務(wù)標準、服務(wù)質(zhì)量、服務(wù)時(shí)長(cháng)等方面既保證了輸出的一致性,也減緩了企業(yè)的運營(yíng)成本。
      同時(shí),標貝科技融合了語(yǔ)音喚醒、語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解和人臉識別等系列技術(shù),通過(guò)移動(dòng)設備、智能大屏等終端展現形式,從多場(chǎng)景的實(shí)際需求出發(fā),打造的人機交互解決方案-AI虛擬數字人,以高仿真服務(wù)和7*24小時(shí)無(wú)差別的服務(wù)輸出,滿(mǎn)足場(chǎng)館介紹、產(chǎn)品介紹、業(yè)務(wù)介紹使用者只需選擇想要了解的內容進(jìn)行問(wèn)詢(xún)或操縱,虛擬數字人便可以娓娓道來(lái),效果不輸真人,實(shí)現用戶(hù)與虛擬數字人之間的“面對面”互動(dòng)交流、服務(wù)導覽、智能問(wèn)答、業(yè)務(wù)咨詢(xún)等服務(wù),以豐富的行業(yè)知識庫、靈活的配置管理、交互數據快速迭代更新,進(jìn)一步實(shí)現了企業(yè)的降本增效。
    三星堆講解
      語(yǔ)音合成方面,標貝科技發(fā)展至今已歷經(jīng)三個(gè)階段,無(wú)論是在場(chǎng)景落地還是技術(shù)演化方面,均有巨大突破。
      1.0階段注意力機制深度學(xué)習首次商用
      為了提高語(yǔ)音合成的自然流暢度,標貝科技的語(yǔ)音合成技術(shù)在聲學(xué)、韻律上采用了基于A(yíng)ttention機制的深度神經(jīng)網(wǎng)絡(luò )技術(shù)模型,充分利用文本數據,構建前端模塊、選擇合適的聲碼器,降低運算量,實(shí)現合成語(yǔ)音的發(fā)音自然、清晰、韻律感流暢,讓機器與人的互動(dòng)顯得更親近。
      2.0階段音色擴展個(gè)性化合成
      為了滿(mǎn)足不同場(chǎng)景的需求,標貝科技在音色和場(chǎng)景豐富度上持續發(fā)力。基于海量語(yǔ)音數據的優(yōu)勢,對音色庫進(jìn)行充分擴充,推出支持不同年齡、性別、以及語(yǔ)種的多類(lèi)型音色的TTS2.0解決方案,并支持用戶(hù)個(gè)性化需求定制,滿(mǎn)足了多場(chǎng)景及多業(yè)務(wù)的需求。
      語(yǔ)音技術(shù)方面,標貝打造了支持聲音復刻、情感合成等個(gè)性化、差異化的語(yǔ)音技術(shù)服務(wù)。聲音復刻與情感合成是基于語(yǔ)音技術(shù)本身的創(chuàng )新型應用。通過(guò)復刻聲音,為聲音注入豐富的情感,深度挖掘合成語(yǔ)音的個(gè)性化、定制化價(jià)值,更好的匹配有聲閱讀、AI教育等應用場(chǎng)景。
      3.0階段深度學(xué)習框架升級,更有表現力更自然的聲音
      全新升級的TTS3.0技術(shù)采用全新的Transformer機制和GAN聲碼器,升級了全新的模型結構的基礎上,依舊保持了對tts2.0舊模型的全部兼容,最大程度地保證無(wú)縫升級。同時(shí),新系統使用了高維度的聲學(xué)信息,可以承載更多的聲音細節,顯著(zhù)提升了現有發(fā)音效果。無(wú)論是自然講話(huà)、情緒講話(huà)、還是角色模仿,都大大提升了多場(chǎng)景下角色和情感表達判斷的精確性,同時(shí)保障了輸出音質(zhì)的穩定、清晰、順暢,聲碼器采用GAN結構,不但高效且真實(shí)的還原了波形,同時(shí)為合成聲音注入了真實(shí)質(zhì)感。
      第三階段
      需求出發(fā)打造AI語(yǔ)音生態(tài)戰略
      提及智能語(yǔ)音的未來(lái)愿景及標貝的發(fā)展,劉博的戰略格局則更為宏觀(guān)。在訪(fǎng)談中劉博透露:“人工智能的終極目的是解決實(shí)際需求。任何單點(diǎn)產(chǎn)品都無(wú)法完全解決核心問(wèn)題,標貝更希望通過(guò)數據的積累,以及算法的深度融合,最終實(shí)現一套完整的解決方案,形成優(yōu)化、快速響應的能力,從而打造標貝獨特的競爭優(yōu)勢和技術(shù)壁壘。”近年來(lái),高性能計算、信號處理、模式識別及聲學(xué)技術(shù)發(fā)展迅速,針對不同應用需求而研究開(kāi)發(fā)語(yǔ)音識別系統已成為可能,因此,語(yǔ)音識別技術(shù)在智慧辦公、智慧政務(wù)、物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)等眾多領(lǐng)域得到了廣泛的推廣和應用。同時(shí),標貝還在不斷拓展金融和泛娛樂(lè )版塊,通過(guò)三大場(chǎng)景的場(chǎng)景布局,打造未來(lái)戰略方向。
      劉博補充說(shuō)道,為進(jìn)一步提升技術(shù)產(chǎn)品服務(wù)能力及人工智能語(yǔ)音場(chǎng)景落地,滿(mǎn)足更多開(kāi)發(fā)者和商業(yè)化客戶(hù)對于智能語(yǔ)音交互的需求,全效助力開(kāi)發(fā)者構建AI語(yǔ)音生態(tài),標貝科技在今年4月正式推出智能語(yǔ)音開(kāi)放平臺。
      目前,標貝開(kāi)放平臺提供的智能語(yǔ)音服務(wù)主要包括語(yǔ)音合成(TTS)與語(yǔ)音識別(ASR),開(kāi)發(fā)者可以在平臺操作界面創(chuàng )建多個(gè)智能語(yǔ)音應用,系統會(huì )為該應用自動(dòng)匹配語(yǔ)音識別和語(yǔ)音合成服務(wù)。語(yǔ)音識別包括一句話(huà)識別、長(cháng)語(yǔ)音識別、錄音文件識別;語(yǔ)音合成可選擇在線(xiàn)合成、離線(xiàn)合成、長(cháng)文本合成三種,用戶(hù)可根據自身需求進(jìn)行用量、音色、并發(fā)等接入試用。通過(guò)快速的體驗、測試,讓開(kāi)發(fā)者和合作伙伴直接感受標貝語(yǔ)音技術(shù)的能力,通過(guò)豐富的文本接入指導,以及便捷的支付方式,讓用戶(hù)可以一站式的購買(mǎi)接入標貝的語(yǔ)音服務(wù)。
      未來(lái)
      屬于智能語(yǔ)音最好的時(shí)代即將到來(lái)
      談及智能語(yǔ)音的未來(lái)發(fā)展,劉博給出了自己的理解和預測,“其實(shí)從20-21年開(kāi)始。我們可以發(fā)現整個(gè)語(yǔ)音市場(chǎng)已經(jīng)逐漸進(jìn)入快速爆發(fā)性的增長(cháng)階段。”隨著(zhù)人工智能、計算技術(shù)和信號處理技術(shù)的飛速發(fā)展,以及自然語(yǔ)言與計算機網(wǎng)絡(luò )的結合,語(yǔ)音信息智能處理作為人機交互的關(guān)鍵技術(shù),已成為世界各國研究者廣泛關(guān)注的熱點(diǎn)問(wèn)題之一。尤其是隨著(zhù)數字化及5G時(shí)代的到來(lái),人們迫切需要對具有多通道、多場(chǎng)景、多語(yǔ)言特征的海量語(yǔ)音信息技術(shù)進(jìn)行智能語(yǔ)音的深化研究與創(chuàng )新突破。
      “智能語(yǔ)音第一次帶來(lái)了不需要任何門(mén)檻的全人類(lèi)的協(xié)作,人工智能的自我演化就此開(kāi)始,目前智能語(yǔ)音在進(jìn)化的道路上,還需要突破語(yǔ)義理解這道門(mén)檻,一旦機器能真正用人類(lèi)的方式進(jìn)行溝通,做出超越經(jīng)驗的預判,才真正實(shí)現了所謂的“智能”。但我相信不會(huì )太久,屬于語(yǔ)音最好的時(shí)代,便會(huì )到來(lái)!”
      官網(wǎng):https://www.data-baker.com/#/index
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    相關(guān)熱詞搜索: 標貝 智能語(yǔ)音

    上一篇:什么是會(huì )話(huà)分析?

    下一篇:最后一頁(yè)

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 海林市| 博客| 瑞安市| 东光县| 蓝山县| 渭源县| 鄂伦春自治旗| 辽阳市| 福鼎市| 茌平县| 泸定县| 永善县| 临泽县| 来凤县| 祁阳县| 鄂托克旗| 牙克石市| 潼南县| 来安县| 荃湾区| 平昌县| 云霄县| 屏山县| 万载县| 恭城| 高安市| 苍溪县| 富裕县| 广德县| 平度市| 潞西市| 河东区| 青田县| 忻州市| 嘉兴市| 五常市| 新巴尔虎右旗| 恩施市| 汝州市| 鄂托克旗| 长阳| http://444 http://444 http://444 http://444 http://444 http://444