一、智能語(yǔ)音客服
目前,通信運營(yíng)商等在客服領(lǐng)域比較先進(jìn)的企業(yè)已經(jīng)實(shí)現了智能文字客服,通過(guò)文字識別技術(shù)和智能匹配算法對通過(guò)短信和網(wǎng)站文字客服提出的服務(wù)訴求智能匹配答案,不需人工判斷。要實(shí)現智能語(yǔ)音客服,也要通過(guò)識別和匹配這兩關(guān)。
我們先說(shuō)說(shuō)識別吧。早在Siri之前,就已經(jīng)有很多語(yǔ)音識別工具問(wèn)世,最早的基于電子計算機的語(yǔ)音識別系統是由AT&T貝爾實(shí)驗室開(kāi)發(fā)的Audrey語(yǔ)音識別系統,它能夠識別10個(gè)英文數字,現在A(yíng)T&T的語(yǔ)音系統Watson已經(jīng)可以實(shí)現在線(xiàn)德語(yǔ)和英語(yǔ)的實(shí)時(shí)口譯。以現在的技術(shù),語(yǔ)音的識別依然比較困難,主要面臨的難點(diǎn)有2個(gè):
1.算法
算法是軟件的核心,目前的語(yǔ)音識別算法使用的語(yǔ)言模型仍是一種概率模型,還未發(fā)展成以語(yǔ)言學(xué)為基礎的文法模型,算法不突破,效果無(wú)法取得突飛猛進(jìn)的進(jìn)展。算法的優(yōu)化不是一朝一夕的事情,需要慢慢不斷地進(jìn)行,尤其語(yǔ)音這種非結構化數據(不便用數據庫二維邏輯表來(lái)表現的數據),但隨著(zhù)大數據分析技術(shù)(用于非結構化數據的管理分析)的發(fā)展,也會(huì )對新算法開(kāi)發(fā)帶來(lái)福音。一些核心算法如特征提取、搜索算法和自適應算法也都在一步步改進(jìn),且隨著(zhù)數據源的不斷豐富,算法的識別效果也就越來(lái)越精準。
2.適應性
由于方言、語(yǔ)氣、環(huán)境和音色等因素的影響,限制了語(yǔ)音識別算法的效果,這就需要語(yǔ)言識別系統具有一定的自適應性,不同口音、方言的識別都需要以一個(gè)龐大的語(yǔ)音數據庫為基礎,對這些非結構化數據的管理分析就更加指望大數據技術(shù)了。至于排除環(huán)境噪音、音色等因素,個(gè)人感覺(jué)要依賴(lài)半導體傳感技術(shù)的進(jìn)步,留待硬件領(lǐng)域的專(zhuān)家進(jìn)一步探討。
接下來(lái)就說(shuō)到匹配了。目前,匹配的算法已經(jīng)相對比較成熟了,也許和大數據技術(shù)沒(méi)有直接聯(lián)系,不過(guò)其準確性也有賴(lài)于數據源的豐富程度,同時(shí)要在不斷產(chǎn)生的“交互數據”中動(dòng)態(tài)地調整匹配結果。
綜上所訴,隨著(zhù)數據源越來(lái)越多,大數據技術(shù)的不斷進(jìn)步,語(yǔ)音識別系統也在持續地完善之中,說(shuō)到底,算法依然是核心,而數據則是基礎,對于這類(lèi)非結構化數據,也許傳統的數據庫技術(shù)Handle不住,但大數據技術(shù)卻大有可為。相信不久,語(yǔ)音識別的技術(shù)的突破不僅可以實(shí)現智能語(yǔ)音客服,還將變革人與物之間的交互方式。
二、語(yǔ)音文本轉換
因為這個(gè)功能的核心也是語(yǔ)音識別,所以大數據技術(shù)對的轉換準確度的保障支撐就不用再說(shuō)了。之所以單列出來(lái)談呢,是因為其對客戶(hù)服務(wù)別有一番作用。
對于呼叫中心而言,客服人員與用戶(hù)的通話(huà)都是要錄音備份的,這些語(yǔ)音數據可真的不小哦,僅以廣東移動(dòng)為例,廣東移動(dòng)客服中心每年就要新增約60T的數據存儲,這個(gè)體量對于一般的企業(yè)來(lái)說(shuō)已經(jīng)是“大數據”了。據悉,這些數據是用磁帶來(lái)保存的,而且這些要保存幾十年不能銷(xiāo)毀,想想到時(shí)候光這些磁帶所占用的房間租金就是不少錢(qián)啊,更何況是其他成本。而如果能將這些語(yǔ)音準確地轉換成文本之后,文本存儲所占用的空間就小的多(一個(gè)移動(dòng)硬盤(pán)都可以存儲一個(gè)圖書(shū)館的數據量了),存儲成本簡(jiǎn)直就是直線(xiàn)下降,不僅實(shí)現了低成本高效,對自然環(huán)境也是一種利好。