CTI論壇(ctiforum)12月18日消息(記者 凡易):不久前,北京捷通華聲語(yǔ)音技術(shù)有限公司在京召開(kāi)的“靈云”發(fā)布會(huì )引起了產(chǎn)業(yè)界的廣泛關(guān)注,就智能人機交互(HCI)技術(shù)的發(fā)展和產(chǎn)品的落地應用展開(kāi)了廣泛探討。作為智能人機交互(HCI)產(chǎn)業(yè)中重要的組成部分之一,并作為未來(lái)十年最重要的技術(shù)之一,語(yǔ)音交互技術(shù)得到了各界朋友的特別青睞。
回眸語(yǔ)音技術(shù)的發(fā)展,除語(yǔ)音合成(TTS)技術(shù)應用較早外,更多的語(yǔ)音技術(shù)并沒(méi)有得到廣泛的應用,即使到今日,通過(guò)語(yǔ)音技術(shù)實(shí)現的場(chǎng)景應用并不是很多。其實(shí),語(yǔ)音技術(shù)一直在發(fā)展,以語(yǔ)音識別(ASR)技術(shù)舉例,從1952年貝爾研究所成功研究了世界上第一個(gè)能識別10個(gè)英文數字發(fā)音的實(shí)驗系統以來(lái),到如今中文語(yǔ)音識別技術(shù)已實(shí)現了自由說(shuō)輸入,語(yǔ)音識別技術(shù)從算法到模型都有了強勁的蛻變和發(fā)展。
捷通華聲公司從創(chuàng )立到如今,核心技術(shù)的研究也無(wú)時(shí)無(wú)刻的在創(chuàng )新發(fā)展。作為從事十余年的專(zhuān)業(yè)語(yǔ)音技術(shù)民營(yíng)企業(yè),捷通華聲憑借在語(yǔ)音合成(TTS)技術(shù)上的自主創(chuàng )新和精湛技術(shù),與國家扶持的科大訊飛公司幾乎平分了中國語(yǔ)音合成市場(chǎng)。時(shí)至今日,全國超過(guò)八成的銀行排隊叫號服務(wù)和全部高鐵站臺語(yǔ)音播報系統仍使用捷通華聲自主研發(fā)的語(yǔ)音合成TTS技術(shù)。在語(yǔ)音識別ASR技術(shù)上,捷通華聲公司也專(zhuān)注研發(fā),從無(wú)到有,從識別率一般到真實(shí)環(huán)境下普通話(huà)自由說(shuō)語(yǔ)音識別準確率超過(guò)90%,達到國內一流的技術(shù)水平,實(shí)現了質(zhì)的飛躍。近年,捷通華聲順應發(fā)展,推出了全球第一款人機交互(HCI)感知云:靈云!基于云技術(shù)的優(yōu)勢和特點(diǎn),靈云的語(yǔ)音技術(shù)達到更好的實(shí)際效果,得到更廣泛的應用。
從中文語(yǔ)音技術(shù)的發(fā)展現狀看,復雜的環(huán)境和中國語(yǔ)言文化的博大精深影響著(zhù)中文語(yǔ)音識別效果。僅從實(shí)際效果看,語(yǔ)音識別正確率能超過(guò)80%就已經(jīng)是很不錯了。靈云平臺的誕生,將捷通華聲語(yǔ)音識別技術(shù)與云計算有機結合起來(lái),再整合捷通華聲自身及合作伙伴的數據資源,讓語(yǔ)音識別技術(shù)形成了可落地的實(shí)際應用。如國內首款“能說(shuō)會(huì )聽(tīng)、能寫(xiě)會(huì )識”的智能手機助手小唐龍就應用了靈云的各項智能交互技術(shù)和百度、電信、移動(dòng)等數據資源,尤其語(yǔ)音技術(shù)讓其在功能上實(shí)現了人與機器間的語(yǔ)音交互過(guò)程。
同樣,作為智能人機交互(HCI)技術(shù)中重要的自然語(yǔ)言理解(NLU)也是靈云語(yǔ)音云中重要的一環(huán)。自然語(yǔ)言理解能力是實(shí)現語(yǔ)音識別和語(yǔ)音合成效果的保證,是實(shí)現人與機器的交互像人與人之間溝通的保障之一。靈云作為HCI技術(shù)交互平臺,在自然語(yǔ)言處理、分析、理解上下足了功課,在能源、金融、電信、服務(wù)等多個(gè)領(lǐng)域做出了應用。
語(yǔ)音技術(shù)作為智能人機交互(HCI)技術(shù)的一種,與靈云的其他各項HCI能力進(jìn)行了整合。如語(yǔ)音技術(shù)應用到靈云智能客服機器人中,實(shí)現了以自然語(yǔ)言理解和多種智能人機交互技術(shù)為核心,通過(guò)網(wǎng)頁(yè)、即時(shí)通訊等多種展現形式,實(shí)時(shí)與用戶(hù)進(jìn)行交互的智能系統。靈云文檔OCR識別技術(shù),更是增加了NLU模型,提升OCR中文識別校對能力,識別正確率幾近100%。
在發(fā)展語(yǔ)音技術(shù)的同時(shí),捷通華聲更看重與云平臺企業(yè)的合作,靈云與中國電信開(kāi)放平臺的深入合作、與中國惠普云基地的協(xié)作共贏(yíng),通過(guò)合作的模式讓靈云的語(yǔ)音技術(shù)得到更多的汲養,無(wú)論是云計算模式還是開(kāi)發(fā)者對語(yǔ)音技術(shù)的開(kāi)發(fā)應用,都為靈云語(yǔ)音技術(shù)開(kāi)拓了無(wú)限視野。
智能人機交互(HCI)技術(shù)的發(fā)展仍有很多關(guān)鍵技術(shù)亟待突破,靈云HCI平臺還有更多合作需要展開(kāi)。靈云中的語(yǔ)音技術(shù)作為人機交互的核心之一,在復雜環(huán)境的語(yǔ)音識別和語(yǔ)義理解等能力上還需進(jìn)一步探索完善。只有我們的核心技術(shù)不斷提高,才能讓人機交互更智能、更自然!更多信息請訪(fǎng)問(wèn)靈云網(wǎng)站(hcicloud.com)