• <strike id="fdgpu"><input id="fdgpu"></input></strike>
    <label id="fdgpu"></label>
    <s id="fdgpu"><code id="fdgpu"></code></s>

  • <label id="fdgpu"></label>
  • <span id="fdgpu"><u id="fdgpu"></u></span>

    <s id="fdgpu"><sub id="fdgpu"></sub></s>
    您當前的位置是:  首頁(yè) > 資訊 > 文章精選 >
     首頁(yè) > 資訊 > 文章精選 >

    2022年語(yǔ)音技術(shù)行業(yè)現狀之語(yǔ)音開(kāi)發(fā)平臺

    2022-03-15 09:24:35   作者:   來(lái)源:CTI論壇   評論:0  點(diǎn)擊:


      CTI論壇(ctiforum.com)3月15日消息(編譯/老秦): 語(yǔ)音平臺市場(chǎng)今年似乎正在接近一個(gè)重要的拐點(diǎn)。最初圍繞這項技術(shù)的熱情已經(jīng)消退。部署繼續增加,但比最初預期的要緩慢。因此,供應商正在改變他們的優(yōu)先事項,目標是這些變化將帶來(lái)突破,從而推動(dòng)市場(chǎng)采用。
      語(yǔ)音應用程序開(kāi)發(fā)平臺是構建商業(yè)和消費者語(yǔ)音應用程序的基礎。創(chuàng )建為用戶(hù)提供語(yǔ)音界面的基礎設施是一項艱巨的任務(wù),需要許多構建塊。一些區塊已經(jīng)到位,但許多仍在開(kāi)發(fā)中。
      年度回顧
    • 最初,供應商的努力集中在添加更多語(yǔ)言和擴展其開(kāi)發(fā)工具的范圍。這些領(lǐng)域的努力仍在繼續。
    • 3 月,微軟在 Azure 神經(jīng)文本轉語(yǔ)音中增加了對 11 種語(yǔ)言的支持。該供應商現在可以使用 60 種語(yǔ)言、142 種神經(jīng)語(yǔ)音和總共 219 種語(yǔ)音。
    • 4 月,提供語(yǔ)音人工智能和會(huì )話(huà)智能技術(shù)的SoundHound將其Houndify Voice AI 平臺擴展到 22 種語(yǔ)言。有了它,開(kāi)發(fā)人員可以將對話(huà)智能添加到他們的產(chǎn)品和服務(wù)中。
    • 開(kāi)發(fā)人員喜歡使用某些工具、語(yǔ)言和技能。作為回應,領(lǐng)先的供應商也為其產(chǎn)品線(xiàn)添加了新的開(kāi)發(fā)輔助工具。
    • 7 月,亞馬遜發(fā)布了迄今為止最大的新工具版本。開(kāi)發(fā)人員現在可以構建特色技能卡,以在主屏幕旋轉中提升他們的技能。
      此外,現在當 Alexa 響應常見(jiàn)請求時(shí)會(huì )建議他們的技能,例如"Alexa,給我講個(gè)故事";"Alexa,我們來(lái)玩個(gè)游戲吧";或"Alexa,我需要鍛煉。"個(gè)性化的技能建議基于客戶(hù)對相似技能的使用。新的上下文發(fā)現機制允許客戶(hù)使用自然語(yǔ)言并找到技能。
      在禮包中是開(kāi)發(fā)人員為他們的技能創(chuàng )建小部件的一種方式。有了它們,客戶(hù)可以通過(guò)屏幕輸入和語(yǔ)音與 Echo Show 或其他 Alexa 設備進(jìn)行交互。
      展望未來(lái)
      增加語(yǔ)言和工具的數量是有幫助的,但并不能解決主要的市場(chǎng)障礙:公司仍然難以構建語(yǔ)音應用程序部署的業(yè)務(wù)案例。"很少有公司來(lái)找我們構建純語(yǔ)音應用程序,"Chant 總裁兼創(chuàng )始人 John Earle 解釋道。
      大約十年前宣布語(yǔ)音接口時(shí),供應商模仿移動(dòng)應用程序開(kāi)發(fā)市場(chǎng)的努力,但語(yǔ)音并沒(méi)有像移動(dòng)應用程序那樣迅速流行或變得無(wú)處不在。
      市場(chǎng)領(lǐng)導者亞馬遜的經(jīng)驗有助于說(shuō)明該行業(yè)的演變并確定該行業(yè)的現狀。一方面,供應商已經(jīng)相當成功。超過(guò) 900,000 名開(kāi)發(fā)人員創(chuàng )建了超過(guò) 130,000 項 Alexa 技能,這些技能用于廣泛的主要消費者應用程序。
      但在最初的匆忙之后,技能開(kāi)發(fā)出現了顯著(zhù)下降。 2019 年前 10 個(gè)月,Alexa 技能收入僅為 140 萬(wàn)美元,遠低于亞馬遜 550 萬(wàn)美元的目標。從那以后,亞馬遜沒(méi)有公布其技能數量、開(kāi)發(fā)者收入或目標。
      為什么收入會(huì )下降?"最初的語(yǔ)音技能很豐富,但在許多情況下并不是很有用,尤其是對企業(yè)而言,"對話(huà)技術(shù)負責人兼萬(wàn)維網(wǎng)聯(lián)盟多模式交互工作組主席 Deborah Dahl 解釋道。"它們發(fā)展迅速,在許多情況下沒(méi)有經(jīng)過(guò)深思熟慮。"
      不過(guò),企業(yè)寄予厚望。例如,Uniphore首席技術(shù)官BalajiRaghavan表示,他們必須進(jìn)行檢查以保護客戶(hù)數據隱私。他補充說(shuō),最小的錯誤可能會(huì )導致嚴重的業(yè)務(wù)問(wèn)題,例如當銷(xiāo)售電話(huà)將呼叫者的意圖解釋為"去"而不是"不"時(shí),或者當呼叫中心的客戶(hù)因失去親人而哭泣時(shí),但語(yǔ)音機器人會(huì )嘗試快速結束通話(huà),以盡量減少處理時(shí)間。
      由于其他一些原因,語(yǔ)音應用程序開(kāi)發(fā)落后于移動(dòng)市場(chǎng)應用程序開(kāi)發(fā)。一個(gè)因素是前者經(jīng)過(guò)多年成熟并建立了一個(gè)強大的生態(tài)系統,代碼可以輕松混合和匹配。標準已經(jīng)出現,使供應商和第三方可以輕松混合和匹配軟件。因此,兼容的軟件具有高水平的互操作性和可移植性,使公司可以花更多的時(shí)間為他們的應用程序添加所需的功能,而不是試圖讓基本的基礎設施部分協(xié)同工作。
      因此,正在多方面開(kāi)展工作以解決這些缺點(diǎn)。在某些情況下,供應商負責鏟子工作。
      亞馬遜一直處于語(yǔ)音互操作性計劃 (VII) 的前沿。其目標是開(kāi)發(fā)通用接口,以便多個(gè)語(yǔ)音座席理同時(shí)在單個(gè)設備上工作。
      亞馬遜還開(kāi)發(fā)了多座席設計指南,為創(chuàng )建此類(lèi)解決方案提供了最佳實(shí)踐。該計劃獲得了 80 多家供應商的支持,其中包括消費電子品牌、汽車(chē)制造商、電信運營(yíng)商、硬件解決方案提供商和系統集成商。杜比、Facebook、Garmin 和小米都支持這項工作。
      該計劃具有潛力,但它專(zhuān)注于亞馬遜自身生態(tài)系統的開(kāi)發(fā)。范圍更廣的替代方案正在出現。
      2020 年 6 月,Linux 基金會(huì )成立了開(kāi)放語(yǔ)音網(wǎng)絡(luò )(OVN)。該計劃源于麻省理工學(xué)院 (MIT) Auto-ID 實(shí)驗室、凱捷咨詢(xún)和英特爾的合作。
      該聯(lián)盟確定語(yǔ)音座席需要合作,有時(shí)還需要相互合作。"開(kāi)放語(yǔ)音網(wǎng)絡(luò ) (OVN) 認為,互操作性應該使語(yǔ)音助手能夠共享對話(huà)、數據、上下文和控制,"Larson技術(shù)服務(wù)副總裁兼開(kāi)放語(yǔ)音網(wǎng)絡(luò )高級顧問(wèn)Jim Larson說(shuō)。
      OVN 概述了六個(gè)語(yǔ)音座席互操作性功能:
    • 調用遠程語(yǔ)音座席。目標是為語(yǔ)音提供與現在互聯(lián)網(wǎng)上的數據相同的普遍功能。語(yǔ)音座席地址使其能夠到達任何網(wǎng)絡(luò )目的地,無(wú)論平臺或位置如何。
    • 支持語(yǔ)音注冊系統。在互聯(lián)網(wǎng)上,域名系統 (DNS) 通過(guò)互聯(lián)網(wǎng)將特定網(wǎng)站的請求路由到指定網(wǎng)站。語(yǔ)音注冊系統 (VRS) 使語(yǔ)音座席所有者能夠注冊其軟件的唯一名稱(chēng),因此用戶(hù)可以直接連接到它們。
    • 在語(yǔ)音座席之間切換。目前,語(yǔ)音座席是隱蔽的。該行業(yè)必須轉向用戶(hù)可以調用多個(gè)語(yǔ)音座席的模型。
    • 處理隱式請求。現在,用戶(hù)必須直接提問(wèn)。他們應該能夠提出隱含的請求。
    • 在語(yǔ)音座席之間共享數據和上下文。消費者不希望必須回答每個(gè)語(yǔ)音座席的相同問(wèn)題。語(yǔ)音座席需要能夠共享它收集的任何用戶(hù)數據并將其放入正確的上下文中。
    • 擴展公司的角色。角色是指由語(yǔ)音座席呈現的聲音和特征。當用戶(hù)切換到第二個(gè)語(yǔ)音座席時(shí),開(kāi)發(fā)人員可以在用戶(hù)切換到第二個(gè)語(yǔ)音座席時(shí)維護第一個(gè)語(yǔ)音座席的角色,而不是在語(yǔ)音座席之間切換時(shí)切換角色。
      與此同時(shí),負責VoiceXML規范的萬(wàn)維網(wǎng)聯(lián)盟一直在研究第三種選擇。 W3C 語(yǔ)音交互社區小組希望一個(gè)語(yǔ)音應用程序將信息傳遞給第二個(gè)應用程序。他們正在研究的領(lǐng)域包括:
    • 發(fā)現具有特定專(zhuān)業(yè)知識的虛擬助手,例如可以提供天氣信息的虛擬助手;
    • 語(yǔ)音識別器統計語(yǔ)言模型的標準格式;
    • 參考常見(jiàn)概念的標準表示,例如時(shí)間;
    • 對話(huà)界面的互操作性;和
    • 對話(huà)管理或"工作流"語(yǔ)言的共同工作。
      最終結果是開(kāi)發(fā)語(yǔ)音行業(yè)標準的工作已經(jīng)開(kāi)始,這將使軟件供應商、第三方系統集成商和咨詢(xún)公司以及企業(yè)更容易將技術(shù)集成到他們的應用程序中。目前,這項工作正在自主進(jìn)行。"從技術(shù)上講,合并的潛力很大,"Dahl說(shuō)。
      但障礙依然存在,首先是標準的統一。"許可和知識產(chǎn)權(需要解決知識產(chǎn)權問(wèn)題),"她補充道。
      語(yǔ)音開(kāi)發(fā)平臺的基石不斷成型。供應商正在擴展他們的解決方案。語(yǔ)音座席互操作性項目正在獲得關(guān)注。預計這些可能性將在新的一年內競爭接受,并使供應商、企業(yè)和第三方更容易混合和匹配語(yǔ)音軟件。
      聲明:版權所有 非合作媒體謝絕轉載
      作者:Paul Korzeniowski
      原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-2022-State-of-Speech-Development-Platforms-151326.aspx
    【免責聲明】本文僅代表作者本人觀(guān)點(diǎn),與CTI論壇無(wú)關(guān)。CTI論壇對文中陳述、觀(guān)點(diǎn)判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

    專(zhuān)題

    CTI論壇會(huì )員企業(yè)

    亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 平山县| 惠安县| 丰城市| 高邑县| 张家界市| 九龙城区| 将乐县| 松溪县| 汝州市| 湖州市| 内黄县| 东莞市| 勐海县| 宣汉县| 加查县| 酒泉市| 临湘市| 当涂县| 和平区| 德江县| 武陟县| 阿克陶县| 隆子县| 玉环县| 绵竹市| 七台河市| 东乡| 竹溪县| 芮城县| 溆浦县| 革吉县| 尖扎县| 哈尔滨市| 乌兰察布市| 临潭县| 阿荣旗| 综艺| 乌拉特前旗| 安吉县| 财经| 广河县| http://444 http://444 http://444 http://444 http://444 http://444