首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>>科大訊飛

科大訊飛吳曉如:語(yǔ)音技術(shù)助力更智能更安全的新一代呼叫中心

2009/04/15

  CTI論壇(ctiforum)04月15日消息: 2009年4月14日至15日,CTI論壇主辦2009中國呼叫中心及企業(yè)通信大會(huì )在北京國際會(huì )議中心隆重召開(kāi),會(huì )議展開(kāi)三十多場(chǎng)精彩紛呈的演講,邀請了一批業(yè)界知名專(zhuān)家在會(huì )上發(fā)表演說(shuō),以下是主題演講現場(chǎng)圖文報道:

  主持人:下面,有請安徽科大訊飛信息科技股份有限公司吳曉如先生,吳先生給大家演講的題目是《語(yǔ)音技術(shù)助力更智能、更安全的新一代呼叫中心》,有請吳先生進(jìn)行精彩的演講!

  吳曉如:各位嘉賓下午好!

  實(shí)際上在上午各個(gè)主題演講中,大家可以發(fā)現,我們最近的通信技術(shù)、IT技術(shù)的發(fā)展,使我們呼叫中心的功能更加強大。下面我演講的主題是通過(guò)智能語(yǔ)音技術(shù),如何使我們的呼叫中心更加智能、更加安全。

  實(shí)際上我也像揚州的領(lǐng)導一樣,我提出兩個(gè)問(wèn)題。第一個(gè)問(wèn)題是怎么讓我們新一代的呼叫中心更加聰明,第二個(gè)問(wèn)題是如何讓我們的新一代的呼叫中心在與用戶(hù)交互的過(guò)程中更加安全。

  我們科大訊飛是以語(yǔ)音交互技術(shù)為切入點(diǎn)的廠(chǎng)商,語(yǔ)音技術(shù)使信息時(shí)代的各種信息通過(guò)機器和人進(jìn)行交互。語(yǔ)音合成相當于給機器裝上了人工嘴巴,語(yǔ)音識別是使機器能夠聽(tīng)懂人聽(tīng)話(huà),聲紋識別是可以辨別說(shuō)話(huà)人的身份。

  語(yǔ)音產(chǎn)業(yè)伴隨著(zhù)社會(huì )信息化、網(wǎng)絡(luò )化、智能化的發(fā)展趨勢,語(yǔ)音技術(shù)的應用已經(jīng)進(jìn)入到社會(huì )各行業(yè),且不斷深化。語(yǔ)音技術(shù)的不斷進(jìn)步及當前產(chǎn)業(yè)特點(diǎn),以及我們經(jīng)濟的特點(diǎn),下一步的呼叫中心的服務(wù)將助力我們的呼叫中心建設。

  目前語(yǔ)音合成技術(shù)在我們呼叫中心中得到了廣泛的應用,大幅提升了呼叫中心動(dòng)態(tài)、海量信息的發(fā)布。

  大家可以看到,雖然聽(tīng)到了只是一句簡(jiǎn)單的提示音,但是這個(gè)提示音背后所蘊含的各個(gè)行業(yè)大量的動(dòng)態(tài)海量的信息,可以通過(guò)我們的語(yǔ)音合成播報給用戶(hù)。

  這幾年的語(yǔ)音識別已經(jīng)在我們的電信運營(yíng)過(guò)程中得到了大規模的應用,這在提升我們的服務(wù)水平上,起到了什么樣的支持呢?首先,我們對于呼叫中心目前面臨的一些挑戰,我們在這里提出,第一個(gè)是呼叫中心的規模不斷地擴張,呼叫中心的人均成本也是不斷地提升。

  剛才我們前面一些演講人說(shuō)過(guò),呼叫中心不但規模大,而且成本也很大,人員流動(dòng)管理困難。

  第二個(gè)挑戰是呼叫中心提供給用戶(hù)的信息越來(lái)越多,隨著(zhù)3G我們的統一通信,實(shí)際上我們的通信技術(shù)、IT技術(shù)越發(fā)達,呼叫中心推送給用戶(hù)的信息越多。推送這么多的信息,如何使我們能夠更好地設計人和呼叫中心之間交互的界面呢?

  這個(gè)地方是一個(gè)簡(jiǎn)單的菜單,比如說(shuō)一個(gè)用戶(hù)需要查詢(xún)卡里面的余額,他需要首先按鍵1得到個(gè)人的業(yè)務(wù),按鍵3得到基金、期貨等等的業(yè)務(wù),再按鍵3得到期貨和銀證的業(yè)務(wù)才可以查詢(xún)卡里面的余額。

  目前的IVR用戶(hù)只能通過(guò)9個(gè)鍵,才可以告訴IVR他有什么樣的需求。隨著(zhù)我們的服務(wù)越來(lái)越多,設計菜單的合理結構越來(lái)越困難。即使是我們精心設計的菜單,這種多級式的按鍵菜單也經(jīng)常使用戶(hù)不知所措。同時(shí),也是對我們用戶(hù)耐心極大地考驗。為什么很多的用戶(hù)一進(jìn)呼叫中心就直接按0進(jìn)入人工服務(wù)呢?就是他不能忍受當前的IVR。

  我們提出一個(gè)問(wèn)題,如果用戶(hù)對于IVR服務(wù)不滿(mǎn)意的話(huà),我們需要所有不滿(mǎn)意的用戶(hù)都轉向人工服務(wù)嗎?那么我們企業(yè)這么大規模的座席資源,是不是要消耗在一些很普通的查詢(xún)業(yè)務(wù)上呢?

  回到上層的菜單,我們首先通過(guò)語(yǔ)音識別,用戶(hù)直接可以查詢(xún)卡內的余額,即使是這種語(yǔ)音識別,也可以讓我們原來(lái)的多層次的按鍵式的菜單,變成扁平式的菜單,可以讓用戶(hù)迅速地通過(guò)扁平式的服務(wù)得到最后的結果。

  那么提出了這個(gè)問(wèn)題,我們如何來(lái)改進(jìn)呢?通過(guò)我們大量堆積我們的座席數量就需要提升我們的成本,那么通過(guò)增加座席質(zhì)量和提升用戶(hù)體驗,是不是魚(yú)和熊掌不可兼得呢?實(shí)際上我們認為,對于人和語(yǔ)音技術(shù)在呼叫中心的交互方面,對于IVR來(lái)說(shuō)有一個(gè)語(yǔ)音交互系統,通過(guò)開(kāi)放式的語(yǔ)音識別+語(yǔ)義解析+高品質(zhì)的語(yǔ)音合成,就可以得到高品質(zhì)的語(yǔ)音服務(wù)。

  在這種服務(wù)當中,用戶(hù)的電話(huà)接入之后,我們的語(yǔ)音導航可以把用戶(hù)帶來(lái)一般類(lèi)查詢(xún)的業(yè)務(wù)上。這種服務(wù)并不是說(shuō)我們不需要人工的,讓我們的人工資源可以滿(mǎn)足一些VIP,或者是一些專(zhuān)家型的更重要的業(yè)務(wù)上。使我們的專(zhuān)家座席具有更高的效率和更高的用戶(hù)投入產(chǎn)出比。

  前一段時(shí)間我使用過(guò)語(yǔ)音識別,但是不方便,我的菜單用戶(hù)怎么記得住?用戶(hù)必須準確說(shuō)出這個(gè)菜單的名稱(chēng),這種情況下,用戶(hù)必須準確記住菜單的名稱(chēng),或者是要求用戶(hù)必須按我們規定的方式說(shuō),對于用戶(hù)來(lái)說(shuō)是很痛苦事情。那么,有沒(méi)有更好的解決方案呢?能不能用戶(hù)跟IVR采用語(yǔ)音交互的過(guò)程更加愉快呢?這個(gè)時(shí)候,我們也想請我們各位參會(huì )的嘉賓先看一個(gè)演示。

(演講人演示,說(shuō):"我家的煤氣費沒(méi)錢(qián)了,我想交一點(diǎn)煤氣費", 菜單自動(dòng)跳轉到:煤氣交費)



  這個(gè)是我們叫做呼叫導航的系統,大家可以看到這個(gè)下拉菜單是用戶(hù)希望得到的服務(wù),但是我們這個(gè)服務(wù)列得不是很全。如果我們希望得到一項服務(wù),我家的煤氣費沒(méi)錢(qián)了,我想交一點(diǎn)煤氣費。大家可以看到,我可以以比較自由的方式,告訴IVR一件什么事情呢?就是我家的媒體費沒(méi)錢(qián)了,我要交煤氣費。在以前傳統的IVR的按鍵上,你可能需要按3、4次,但是現在用戶(hù)只需要說(shuō)他的需求。

  我們再來(lái)看一個(gè)。

(演講人演示,說(shuō):"我想把定期的儲蓄轉成活期的", 菜單自動(dòng)跳轉到:定期轉活期)

  我想把定期的儲蓄轉成活期的。這個(gè)演示實(shí)際上是給大家介紹一個(gè)什么叫做呼叫導航,與之前的基于命令的識別有什么差別。它可以給我們的呼叫中心起到一個(gè)什么幫助。

  在這種基于自由說(shuō)話(huà)的呼叫導航中,我們的用戶(hù)不用這么痛苦,必須記住我們的菜單名稱(chēng)。我們在設計我們的菜單的時(shí)候,我們整個(gè)呼叫中心的管理者,也不需要設計一個(gè)非常復雜的菜單。實(shí)際說(shuō)準確的呼叫導航是怎么做到的呢?叫做特定語(yǔ)音的語(yǔ)音識別,如果要語(yǔ)音識別,對于識別每一個(gè)字是很困難的,但是對于我們銀行的語(yǔ)音菜單是很簡(jiǎn)單的。即使1、2個(gè)字發(fā)生的困難,對于我們最后的解析也可以讓它理解我們最后用戶(hù)的需求是什么。所以,語(yǔ)音導航用戶(hù)只需要做什么事情呢?只需要說(shuō)說(shuō)你的需求。

  我們說(shuō)的呼叫中心,剛才說(shuō)怎么讓我們的呼叫中心變得更加聰明。第二個(gè)問(wèn)題是呼叫中心還面臨一個(gè)挑戰,當前的呼叫中心轉成成本中心,在一些用戶(hù)轉向呼叫中心做一些實(shí)際業(yè)務(wù)的時(shí)候,如何讓我們的呼叫中心變得更加安全。以我們銀行的呼叫中心,電話(huà)銀行是大家非常信任的業(yè)務(wù)的手段,但是有很多安全須知,千萬(wàn)不要泄露你的帳號、密碼,如果你泄露了你可能會(huì )很痛苦,你的財產(chǎn)會(huì )受到損失。對于這方面,我們的語(yǔ)音技術(shù)能不能做一些工作,使我們的呼叫中心變得更加安全呢?目前的語(yǔ)音識別可以使我們的呼叫中心在風(fēng)險控制方面得到很大的幫助。

  如果我們的座席人員了解他家里面每一個(gè)家人的聲音那么熟悉去了解用戶(hù)的聲音,對于座席人員有點(diǎn)難,幾乎不可能完成。但是語(yǔ)音識別可以做到,實(shí)際上我們對于我們的用戶(hù)和座席,在說(shuō)話(huà)的過(guò)程當中我們可以實(shí)時(shí)監控。如果發(fā)現當前的通話(huà)是一個(gè)可疑的對話(huà),可以告知座席,座席可以采取銀行要求他采取的步驟,這樣可以加強我們的風(fēng)險控制。

  對于有一些用戶(hù),我們實(shí)際上在他做這個(gè)業(yè)務(wù)的過(guò)程中,我們可以采用一些,吸入說(shuō)聲紋系統,對于他的聲紋進(jìn)行實(shí)時(shí)的監控,如果沒(méi)有聲紋識別,我們可以提醒這個(gè)用戶(hù)提高安全級別。

  聲紋識別是辨別說(shuō)話(huà)人身份的一項技術(shù),通話(huà)人說(shuō)的可以是特定的內容,也可以說(shuō)一些任意無(wú)關(guān)的內容。

  其中兩個(gè)最關(guān)鍵的技術(shù),一個(gè)是聲紋確認,比如說(shuō)這個(gè)用戶(hù)是某某帳號的聲紋,他說(shuō)話(huà)的時(shí)候可以跟語(yǔ)音庫里的聲音進(jìn)行對照。開(kāi)始我不知道你這個(gè)用戶(hù)是誰(shuí),你進(jìn)來(lái)之后我看你是不是屬于特殊的群體,比如說(shuō)是我們銀行需要關(guān)注的黑名單。這樣的話(huà),這個(gè)人在通話(huà)的過(guò)程中,我們可以和目標聲紋庫里的聲紋模板進(jìn)行匹配。如果是可疑分子,我們要通知銀行注意這個(gè)業(yè)務(wù)當中有風(fēng)險。

  實(shí)際上大家對于語(yǔ)音識別前期也在關(guān)注,但是我們覺(jué)得一個(gè)成功的語(yǔ)音識別有很多的核心技術(shù)。我們不但針對命令詞,而且對于連續的語(yǔ)音也可以識別,而且我們語(yǔ)音識別可以有很好的排除干擾的能力。同時(shí),我們的語(yǔ)音識別應該有語(yǔ)義解析,正確理解一個(gè)人說(shuō)話(huà)的目的。

  語(yǔ)音識別在實(shí)際的應用中,它會(huì )面臨不同的口音、不同的應用環(huán)境,需要我們對使用中大規模的語(yǔ)音數據通過(guò)語(yǔ)音模型進(jìn)行訓練,使我們可以排除不同的噪音。

  實(shí)際上,所有的語(yǔ)音識別的技術(shù)都是基于統計的。如果我們了解過(guò)不同的口音、不同的信道地之后就可以很好地處理這些不同的數據,一些不同口音的影響。

  科大訊飛我們在全國建了4個(gè)聯(lián)合實(shí)驗室,在中國科技大學(xué)、清華大學(xué)、社科院語(yǔ)言所、國家普通話(huà)測試站中心,最后會(huì )整合成我們最后的語(yǔ)音合成、語(yǔ)音識別、聲紋識別等等。

  另外,對于我們相關(guān)很重要的處理語(yǔ)音識別所需要的口音、信道,目前我們在全國省級電信運營(yíng)商部署的音樂(lè )搜索等大規模語(yǔ)音識別業(yè)務(wù)已超過(guò)50個(gè),覆蓋不同地域等,使我們的語(yǔ)音識別可以應用于不同的環(huán)境。

  自助式的語(yǔ)音服務(wù)之前一直是按鍵加錄音,TTS技術(shù)的出現,使我們的語(yǔ)音呼叫是按鍵+TTS。我們語(yǔ)音導航可以進(jìn)入ASR&TTS,用戶(hù)的需求不但可以通過(guò)3鍵和9鍵。

  我們科大訊飛是語(yǔ)音技術(shù)領(lǐng)域唯一的國家863計劃產(chǎn)業(yè)化基地、國家規劃布局內重點(diǎn)軟件企業(yè)、國家級企業(yè)技術(shù)中心。中國語(yǔ)音市場(chǎng)占有率最高達到了70%,同時(shí)我們代表工信部制定語(yǔ)音技術(shù)的國家標準,目前我們有700人左右,設有博士后的工作站在全國有4個(gè)聯(lián)合實(shí)驗室,公司是在去年的5月份在深交所正式發(fā)行上市。

  科大訊飛的中文語(yǔ)音合成技術(shù),在理歷屆的國內、國際的評測中都名列第一。2006年和2008年我們參加了全球英文語(yǔ)音技術(shù)合成大賽,我們也連續三年蟬聯(lián)了第一名。在這里,我簡(jiǎn)單地把我們的語(yǔ)音合成技術(shù),簡(jiǎn)單地做一個(gè)演示。

  同時(shí),我們的語(yǔ)音合成可以提供不同的音樂(lè )和語(yǔ)種。目前,我們的音樂(lè )合成技術(shù)首先整合了我們06到08年三年比賽的成果,同時(shí)我們的產(chǎn)品可以支持各種主流的語(yǔ)種,同時(shí)可以支持不同的方言音色,合成系統可以有男女老少各種因素供我們用戶(hù)選擇。

  為了使我們相關(guān)的產(chǎn)品可以在主流行業(yè)有更好的效果,我們針對像電信、金融等一些主流的行業(yè)進(jìn)行專(zhuān)門(mén)的優(yōu)化,可以提供專(zhuān)業(yè)的優(yōu)化版本。同時(shí),我們的系統還提供了多種實(shí)用的特性,它不僅僅是是文本轉語(yǔ)音,還可以進(jìn)行音頻的管理,可以進(jìn)行日志的管理和動(dòng)態(tài)的重啟。

  比如說(shuō)你分散式部署IVR的系統,你可以把所有的提示音通過(guò)我們TTS的音頻管理進(jìn)行統一的安排,這樣各地的IVR的服務(wù)器,可以通過(guò)FTP、HTTP的格式進(jìn)行轉換。

  聲紋識別目前在國際上最有名的技術(shù)評測是美國的國家標準技術(shù)研究院,每年會(huì )舉行一次大規模的聲紋識別大賽。科達訊飛在2008年我們參加了這次評測,這次評測包含了國際上像MIT和斯坦福參加的比賽,我們取得了第一名。這有一個(gè)識別錯誤里,如果有100個(gè)人想冒充別人,我發(fā)生錯誤的是3個(gè),我可以抓住97個(gè)。這次比賽也表明了我們科大訊飛在識別方向上我們是國際領(lǐng)先。

  目前,我們的語(yǔ)音識別除了目前已經(jīng)在各地電信廣泛音樂(lè )搜索中所使用的命令識別,你一說(shuō)一個(gè)歌曲的名稱(chēng)我就可以幫你下載下來(lái),我們目前有成熟的呼叫導航,可以進(jìn)行語(yǔ)義的解析,同時(shí)我們可以提供相關(guān)的語(yǔ)音搜索和檢索。以后有大量的音視頻的呼叫,怎么管理,我們可以制定一些語(yǔ)音的標簽,使我們搜索的時(shí)候更加方便。

  實(shí)際上我們說(shuō)了很多不同的語(yǔ)音服務(wù)的模塊,聽(tīng)上去很多,但是應用起來(lái)非常方便。

  我們有多種的語(yǔ)音合成,多種的語(yǔ)音識別,我們的聲紋識別引擎等等。所有這些我們都可以通過(guò)統一的網(wǎng)絡(luò )平臺技術(shù)封裝。這種封裝既可以通過(guò)之前各個(gè)廠(chǎng)商非常熟悉的接口形式進(jìn)行封裝,也可以通過(guò)最新的基于SIP的、MRCP的服務(wù)進(jìn)行統一的管理。用戶(hù)無(wú)論使用什么引擎都可以得到我們的語(yǔ)音管理的服務(wù)。

  目前我們這種平臺已經(jīng)可以支持華為、Avaya、思科等眾多的平臺,可以支持眾多主流的操作系統。我們科大訊飛有著(zhù)非常完備的研發(fā)和質(zhì)量體系,早在2006年的12月份我們就通過(guò)了CMMI L4評估認證,目前我們也是首個(gè)國家的標準試點(diǎn)基地。

  目前,我們在全國24個(gè)主要的城市設有子公司和辦事處,可以為我們所有的合作伙伴和用戶(hù)提供非常完備的技術(shù)支持和服務(wù)。

  科大訊飛在去年5月份上市以后,也是成立了我國第一家以語(yǔ)音技術(shù)為主要產(chǎn)業(yè)化方向的上市公司。在當前比較惡劣的經(jīng)濟環(huán)境下,科大訊飛受到了股市和分析師非常好的評價(jià),去年11月份開(kāi)始我們中小版上升了60%,我們大概上升了140%。我們現在的股價(jià)大概維持在30多元。其中股價(jià)只是很表面的表現,最主要的原因是各個(gè)行業(yè)的分析師,對于語(yǔ)音技術(shù)的水平,以及語(yǔ)音技術(shù)各個(gè)行業(yè)的廣泛應用,表示高度的認可。我們也希望我們不斷提供最優(yōu)的語(yǔ)音技術(shù),我們期待和我們的產(chǎn)業(yè)、呼叫中心相關(guān)的產(chǎn)業(yè)能夠合作共贏(yíng)、共同發(fā)展。我的介紹就到這里,謝謝大家!

  本文根據CTI論壇主辦的2009中國呼叫中心及企業(yè)通信大會(huì )會(huì )議記錄整理,轉載請注明出處!

CTI論壇報道



相關(guān)閱讀:
科大訊飛連續三年獲中國IP通信大獎 2010-10-14
訊飛助寧夏大學(xué)建成普通話(huà)模擬測試與學(xué)習平臺 2010-10-08
科大訊飛助力重慶時(shí)報 詮釋現代呼叫中心理念 2010-09-30
引領(lǐng)語(yǔ)音合成芯片發(fā)展 科大訊飛推出XFS4243CE 2010-09-26
訊飛語(yǔ)音服務(wù)城市公共自行車(chē)管理系統 2010-09-21

熱點(diǎn)專(zhuān)題:  呼叫中心  語(yǔ)音合成TTS 語(yǔ)音識別ASR  
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 平江县| 托里县| 红原县| 中西区| 平阴县| 桃园县| 鹤岗市| 阳朔县| 湖北省| 丹东市| 泉州市| 安福县| 古田县| 安庆市| 越西县| 林西县| 光泽县| 民县| 南宫市| 西乌| 泸溪县| 天全县| 乐山市| 深水埗区| 藁城市| 阿坝县| 临沭县| 阿拉善右旗| 株洲市| 嫩江县| 廉江市| 宁蒗| 巨野县| 昆明市| 汾阳市| 泰宁县| 南澳县| 临潭县| 牡丹江市| 淅川县| 富顺县| http://444 http://444 http://444 http://444 http://444 http://444