近日,捷通華聲宣布推出最新一代電信級靈云語(yǔ)音識別(ASR)平臺級產(chǎn)品:jASR6.1版本,該產(chǎn)品可廣泛用于呼叫中心、IVR導航、語(yǔ)音質(zhì)檢分析等需要用到語(yǔ)音識別技術(shù)的領(lǐng)域,全面覆蓋企業(yè)級CTI應用。這預示著(zhù)捷通華聲將在提供語(yǔ)音合成(TTS)技術(shù)服務(wù)的基礎上為CTI領(lǐng)域同時(shí)提供語(yǔ)音識別技術(shù)服務(wù),滿(mǎn)足廣大CTI領(lǐng)域用戶(hù)應用智能語(yǔ)音交互技術(shù)的需求。
近年來(lái),智能語(yǔ)音交互技術(shù)在CTI領(lǐng)域得到了越來(lái)越廣泛的應用,據TechNavio預測,從2014年開(kāi)始全球自動(dòng)語(yǔ)音識別市場(chǎng)將會(huì )以年復合增長(cháng)率16.28%的驚人速度增長(cháng),這意味著(zhù)語(yǔ)音識別技術(shù)已經(jīng)被全球范圍內的企業(yè)和用戶(hù)接受,正在迅速從工具型應用走向成熟的商用領(lǐng)域。捷通華聲在此時(shí)推出的靈云語(yǔ)音識別平臺級產(chǎn)品恰好在兩者之間搭建一座橋梁,助推語(yǔ)音識別技術(shù)在CTI領(lǐng)域的商業(yè)化進(jìn)程。作為平臺級產(chǎn)品,靈云語(yǔ)音識別(ASR)平臺級產(chǎn)品具有功能強大、識別率高、識別速度快、SDK開(kāi)發(fā)簡(jiǎn)單、開(kāi)發(fā)包資源小等優(yōu)勢,能夠實(shí)時(shí)、準確地對輸入的語(yǔ)音進(jìn)行識別。jASR6.1實(shí)現了本地版、網(wǎng)絡(luò )版、負載版統一開(kāi)發(fā)接口,使用戶(hù)通過(guò)一個(gè)SDK包就可以調用不同的語(yǔ)音識別能力。
靈云語(yǔ)音識別(ASR)平臺級產(chǎn)品全面支持捷通華聲iSpeak語(yǔ)音識別系列引擎。iSpeak是捷通華聲基于最新的DNN(深層神經(jīng)網(wǎng)絡(luò ))技術(shù)開(kāi)發(fā),具有高識別準確率、高識別速度、可定制模型、支持多種處理模式等特點(diǎn)。
捷通華聲根據不同的用戶(hù)需求將iSpeak語(yǔ)音識別系列引擎劃分為三種:
1.iSpeak Freetalk(自由說(shuō)引擎):自由說(shuō)引擎又稱(chēng)“聽(tīng)寫(xiě)機”或“語(yǔ)音轉寫(xiě)”,基本上不限定用戶(hù)說(shuō)話(huà)的范圍、方式和內容。自由說(shuō)引擎可以對整段或者是分段傳入的音頻進(jìn)行識別,返回識別后的文本。
2.iSpeak KeywordSpot(關(guān)鍵詞檢出引擎):關(guān)鍵詞檢出引擎可以在連續語(yǔ)音流中檢測出是否存在某些感興趣的關(guān)鍵詞。在使用時(shí),需要事先給定一個(gè)關(guān)鍵詞列表,系統則給出識別出的關(guān)鍵詞在語(yǔ)音流中出現的位置。
3.iSpeak SpeechAnalysis(語(yǔ)音質(zhì)檢分析引擎):質(zhì)檢分析引擎在自由說(shuō)引擎的基礎上,加入了針對語(yǔ)音質(zhì)檢分析的一些額外的分析處理能力,包括話(huà)者分離、情緒檢測、靜音檢測和語(yǔ)速檢測等等。
上述三種引擎可以滿(mǎn)足企業(yè)在呼叫中心、IVR導航和語(yǔ)音質(zhì)檢等系統應用的雙向需求:企業(yè)既可以通過(guò)自助化語(yǔ)音服務(wù)進(jìn)行有效的分流、緩解客服壓力,也可以通過(guò)識別結果挖掘用戶(hù)需求、完善客服質(zhì)量,通過(guò)對內和對外協(xié)同作用實(shí)現企業(yè)的雙豐收。
捷通華聲作為國內最早提供智能語(yǔ)音技術(shù)服務(wù)的專(zhuān)業(yè)化廠(chǎng)商,捷通華聲的靈云多語(yǔ)種語(yǔ)音合成(TTS)技術(shù)早已在金融、電信、交通、能源及CTI等領(lǐng)域大規模應用,在高鐵、民航、醫院等眾多領(lǐng)域……捷通華聲的靈云語(yǔ)音合成技術(shù)幾乎無(wú)處不在,市場(chǎng)占有率達到50%,服務(wù)十三億大眾大十五年之久。十幾年來(lái),捷通華聲始終堅持自主研究語(yǔ)音合成、語(yǔ)音識別等智能人機交互(HCI)技術(shù),并不斷在智能語(yǔ)音技術(shù)領(lǐng)域取得突破,在為CTI領(lǐng)域提供多方面的技術(shù)服務(wù)支持的同時(shí),也為保證我國智能語(yǔ)音交互技術(shù)始終處于世界領(lǐng)先地位做出了重要貢獻。
在清華大學(xué)的支持下,捷通華聲開(kāi)始全面實(shí)施“靈云科技 源自清華 服務(wù)全球“的戰略規劃,此次捷通華聲推出的靈云語(yǔ)音識別平臺級產(chǎn)品與靈云語(yǔ)音合成技術(shù)產(chǎn)品相輔相成,不僅為呼叫中心、IVR導航、語(yǔ)音質(zhì)檢分析等CTI領(lǐng)域系統應用提供智能語(yǔ)音交互全面解決方案,也代表智能語(yǔ)音機交互技術(shù)在我國CTI領(lǐng)域應用進(jìn)入全面普及的階段。