語(yǔ)音識別技術(shù)在自動(dòng)外呼和洗號系統的應用與優(yōu)勢
2011/07/18
摘要:
隨著(zhù)呼叫中心系統呼出業(yè)務(wù)量的不斷增多,正確識別號碼狀態(tài),提高撥號效率已經(jīng)成為外呼型呼叫中心需要解決的重要問(wèn)題。本文首先介紹了號碼識別在自動(dòng)外呼和洗號系統中的意義,接著(zhù)分析了信令分析檢測方式的不足,進(jìn)而提出一種基于語(yǔ)音識別技術(shù)的外呼系統,并闡述了語(yǔ)音識別技術(shù)在提高工作效率及降低成本上的優(yōu)勢及意義。
關(guān)鍵詞:呼叫中心;自動(dòng)外呼;洗號;語(yǔ)音識別;
1.引言
隨著(zhù)呼叫中心市場(chǎng)的不斷成熟,呼入型業(yè)務(wù)基本飽和,通過(guò)電話(huà)由坐席主動(dòng)對客戶(hù)進(jìn)行拜訪(fǎng)和推銷(xiāo)產(chǎn)品的呼出型業(yè)務(wù)正逐步成為贏(yíng)得客戶(hù)的關(guān)鍵手段。而如何對外呼號碼進(jìn)行準確識別和篩選(“洗號”),以通過(guò)提高撥號效率來(lái)提升營(yíng)銷(xiāo)利潤,已經(jīng)成為迫在眉睫的問(wèn)題。
現有的自動(dòng)外呼及洗號系統中的號碼識別方法一般是通過(guò)信令處理等技術(shù)來(lái)實(shí)現,而基于信令檢測的方式在準確性和效率保證上又存在嚴重的問(wèn)題。
為了提高號碼識別的準確性與效率,提出了一種基于語(yǔ)音識別技術(shù)的號碼識別方法,可應用于自動(dòng)外呼和洗號系統。該方法通過(guò)與信令檢測方法相結合,可使自動(dòng)外呼和洗號系統中的語(yǔ)音識別準確率達到95%以上;有效解決了傳統外呼和洗號系統中現存的弊端,很大程度上提高了撥號效率,從而達到了提高呼叫中心效益的目的。
2.自動(dòng)外呼和洗號系統
自動(dòng)外呼系統是一個(gè)自動(dòng)執行企業(yè)用戶(hù)定制的外呼任務(wù)的系統。它執行的特點(diǎn)是系統根據座席狀態(tài)和算法策略對指定號碼集自動(dòng)發(fā)起呼叫,通過(guò)分析呼叫過(guò)程中的信令和信號,對呼叫采取合適的處理。具體處理方法為:當呼叫接通時(shí),系統將呼叫轉接給座席;若用戶(hù)未接通,則繼續呼叫下一個(gè)號碼,同時(shí)代替座席記錄當前呼叫的狀態(tài)。
洗號系統也是自動(dòng)外呼系統的一個(gè)重要應用,其原理是系統提前將雜亂的號碼試呼一遍,清除一些無(wú)效號碼,如空號、停機、欠費、格式錯誤等,以此來(lái)提高外呼效率。
值得注意的是,自動(dòng)外呼和洗號系統都需要通過(guò)號碼識別來(lái)確定所呼號碼的狀態(tài),系統的效率很大程度上取決于其對號碼的識別能力。然而,目前常見(jiàn)的號碼狀態(tài)分為多種類(lèi)型:
- 號碼不可用(空號,停機,欠費,地址不全等);
- 暫時(shí)不可用(關(guān)機,不在服務(wù)中,通話(huà)中等);
- 可用(無(wú)應答,被叫忙等)、自動(dòng)應答號碼(傳真、企業(yè)總機等)。
由于三大運商營(yíng)對如此繁多的號碼狀態(tài)未作統一標準,加上信令檢測方式存在很多弊端,使得對號碼的識別具有相當大的挑戰。首先,錯誤的識別會(huì )導致部分數據的丟失,使企業(yè)失去一些潛在用戶(hù),直接導致利益損失。其次,識別速度過(guò)慢,不但影響系統的整體效率,還會(huì )影響座席人員的工作熱情,這也成為了提高企業(yè)利潤的瓶頸。因此,如何對號碼進(jìn)行正確、高效的識別是當前要解決的關(guān)鍵問(wèn)題,這也使得對號碼識別方式的研究具有了現實(shí)意義。
3.號碼識別方式分析
在實(shí)際網(wǎng)絡(luò )中,表示被叫用戶(hù)狀態(tài)有三種方式:標準Tone音、提示音和7號信令。每種方式又可細分為多種表現形式:
標準的Tone音:振鈴音,忙音,空號,不可達音等,這種方式在固定網(wǎng)中比較常見(jiàn)。
提示音:“該號碼不存在”,“該號碼是空號”,“該號碼已停機”等。通過(guò)提示音來(lái)顯示當前被叫用戶(hù)狀態(tài)多發(fā)生在移動(dòng)網(wǎng)絡(luò )中。
7號信令。在呼叫釋放的信令(releasecall),會(huì )帶釋放原因:“Unallocated Num”“user busy”等,也常被移動(dòng)網(wǎng)絡(luò )采用。
目前自動(dòng)外呼和洗號系統主要采用信令分析、語(yǔ)音識別技術(shù)(包括檢測音頻)等進(jìn)行號碼識別和篩選。下面將對幾種檢測方式進(jìn)行詳細說(shuō)明。
3.1 信令檢測方式分析
一般情況下,號碼識別需根據當前呼叫失敗的原因來(lái)判斷,因此,通常會(huì )利用呼叫過(guò)程中產(chǎn)生的信令來(lái)檢測。然而這種檢測方式存在嚴重的準確性和效率問(wèn)題,不能滿(mǎn)足呼叫中心自動(dòng)外呼和洗號的功能要求。
首先,采用這種方式進(jìn)行檢測準確性差。其原因是:在中國三大運營(yíng)商現網(wǎng)中,反映被叫用戶(hù)的狀態(tài)沒(méi)有統一的標準。甚至同一個(gè)運營(yíng)商的同一個(gè)本地網(wǎng)都會(huì )出現不相同的情況。標準的不統一,為信令的檢測造成了困難,經(jīng)常出現號碼狀態(tài)無(wú)法識別、錯誤識別的情況。
其次,采用信令檢測方式效率低下,由于PSTN普遍實(shí)施了呼叫失敗后語(yǔ)音提示的人性化功能,語(yǔ)音提示時(shí)長(cháng)可達60秒,然后才發(fā)送信令。這樣嚴重影響了信令檢測的效率。
下例為對河北移動(dòng)某呼叫中心自動(dòng)外呼系統的信令測試結果分析(該系統使用的交換機為Dialogic IMG1010網(wǎng)關(guān),信令方式為ISUP):
表1:信令號碼識別測試
從歸納的情況看,只有無(wú)應答和地址不全兩種情況是可靠信令分析來(lái)識別的,其他的5種情況都無(wú)法通過(guò)信令檢測識別。特別是暫時(shí)無(wú)法接通的語(yǔ)言提示,播放完提示音有3種不同的信令,應該是屬于不同的情況,但是放了相同的語(yǔ)音。因此造成號碼識別錯誤的現象。
綜上,信令分析檢測方式,對于釋放7號信令來(lái)表示用戶(hù)狀態(tài)的情況是十分有效的。但是,該方式不具備區分標準Tone音和提示音的能力,同時(shí)效率低下。要準確、高效的判斷用戶(hù)的當前狀態(tài),必須要通過(guò)一種更為準確可靠的方式——語(yǔ)音識別。
3.2 語(yǔ)音識別檢測方式分析
現有PSTN網(wǎng)絡(luò )普遍實(shí)施了呼叫失敗后語(yǔ)音提示或tone音的人性化功能,由于這些tone音和失敗提示音都是在臨時(shí)話(huà)路中播放的,因此信令的方式無(wú)法區分這兩種場(chǎng)景。但是語(yǔ)音識別技術(shù)恰恰是利用了這個(gè)特點(diǎn),對語(yǔ)音提示或tone音進(jìn)行快速的語(yǔ)音識別與匹配,在精確識別號碼的同時(shí),提升了識別的速率。
首先,采用語(yǔ)音識別技術(shù)可幫助自動(dòng)外呼和洗號系統提高號碼識別的準確率。系統通過(guò)語(yǔ)音匹配將相同信令的呼叫區分,幫助洗號系統正確的識別可用號碼,同時(shí)還能幫助自動(dòng)外呼系統正確的記錄座席呼叫狀態(tài),避免了因錯誤識別而導致數據丟失的情況發(fā)生。
其次,語(yǔ)音識別技術(shù)還可以幫助自動(dòng)外呼和洗號系統實(shí)現高效識別。系統通過(guò)特征和關(guān)鍵字匹配的方式,在幾秒鐘內就能完成語(yǔ)音匹配,幫助自動(dòng)外呼系統真正的提高了座席工作效率;同樣也幫助洗號系統提高了效率,使其以更少的設備投入獲得更好的效益。
綜上,采用語(yǔ)音識別技術(shù),進(jìn)行模式匹配,可以精確、高效的識別號碼狀態(tài),彌補了信令檢測方式的不足。但是語(yǔ)音識別技術(shù)也存在一些難點(diǎn),例如,樣本庫的建立、方言識別以及提高識別效率等等。這些技術(shù)難點(diǎn)也成為了語(yǔ)音識別檢測方式需要解決的重要問(wèn)題。
4.語(yǔ)音識別技術(shù)的應用
4.1 基本原理
語(yǔ)音識別技術(shù)就是讓機器通過(guò)識別和理解過(guò)程把語(yǔ)音信號轉變?yōu)橄鄳奈谋净蛎畹募夹g(shù)。語(yǔ)音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準則及模型訓練技術(shù)三個(gè)方面。它可用于對用戶(hù)呼叫失敗的情況進(jìn)行自動(dòng)分類(lèi)。
我們采用的語(yǔ)音識別技術(shù)主要靠匹配方式來(lái)進(jìn)行,分成Tone音匹配、AM音匹配和人類(lèi)自然語(yǔ)音檢測三部分。具體流程圖如下:
圖:語(yǔ)音處理流程圖
(VAD: Voice Activity Detection;LV: Live Speech;AM: Answering Machine)
圖中,Tone音匹配采用模式匹配方法,可以實(shí)現對振鈴音,忙音,空號,不可達音等100多種標準提示音的識別。AM(Answering Machine)音匹配主要負責識別傳真機、自動(dòng)答錄機等機器語(yǔ)音,同樣采用模式匹配方法,將收到的語(yǔ)音與標準樣本庫進(jìn)行比對。人類(lèi)自然語(yǔ)音檢測的功能主要通過(guò)人真實(shí)聲音的檢測,來(lái)判斷是否需要進(jìn)行語(yǔ)音匹配。
4.1.1 標準Tone音匹配
Tone音匹配采用的是模式匹配方法,將模擬語(yǔ)音信號轉換為數字信號,再同音庫中的樣本進(jìn)行比對,實(shí)現號碼狀態(tài)識別。
在標準Tone音匹配模塊里,因為某些單頻Tone音的頻率區間和DTMF之間存在重疊,為了避免不必要的混淆,采取順序檢測,即首先檢測是否是DTMF,再檢測是否是單頻的Tone音。
Tone音的一個(gè)顯要特點(diǎn)是在頻域上的某一個(gè)子帶上的能量特別強,而且這種情況是在后續所有非靜音的連續幀上都是持續的(如圖1所示)。基于此特點(diǎn),我們采用以下方法:
1.取第一幀非靜音幀的16個(gè)子帶能量特征,求出其最大子帶能量所在的子帶序號(在DTMF階段是取最大的兩個(gè)子帶序號)。
2.如果最大能量值所在的子帶序號一直保持若干幀不變,則我們認為從頻率角度滿(mǎn)足了作為一個(gè)Tone音的基本條件。
由于DTMF不存在時(shí)間持續長(cháng)短的相關(guān)信息,所以經(jīng)過(guò)上述步驟后,只需將最大能量的兩個(gè)序號在事先準備好的DTMF子帶序號表里查找即可得出結論,對于檢測DTMF顯然已經(jīng)足夠。但由于單頻的Tone音還存在持續時(shí)間長(cháng)短及靜音間歇的問(wèn)題,故對于輸入的信號,經(jīng)過(guò)前端數據處理過(guò)程之后,要利用它是否靜音幀的信息統計各段長(cháng)度,最后,同時(shí)考慮頻率和時(shí)間段列表,如果滿(mǎn)足庫中某一條的相關(guān)標準,才認為是一個(gè)標準Tone音。
4.1.2 AM音匹配
AM音匹配同樣采用模式匹配方法,對語(yǔ)音信號進(jìn)行采樣、量化、歸一化處理后,將模擬語(yǔ)音信號轉變?yōu)閿底终Z(yǔ)音信號。再與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結果返回。
假設模板庫里的特征條目的時(shí)長(cháng)應該至少是一個(gè)完整的AM音模板,因此從時(shí)間長(cháng)度上來(lái)看,輸入的待檢測語(yǔ)音長(cháng)度應小于模板里的最佳匹配項。
不像Tone音檢測模塊中使用的是各幀在前端處理過(guò)程中產(chǎn)生的16個(gè)子帶上的能量具體值,這里使用的特征卻是經(jīng)過(guò)歸一化后的二進(jìn)制向量。如果要比較的兩幀特征向量分別設為:
其中, 指異或操作,而函數 是求二進(jìn)制向量里“1”的個(gè)數。
然后,如果輸入語(yǔ)音樣本的幀數目為 ,則總距離定義為相應的 幀距離的和。
至于要得到這條語(yǔ)音樣本與特征庫里某個(gè)模板的最小距離,比較傳統的方法是用這待匹配的 幀同模板的開(kāi)始處 幀算距離,然后將待匹配音順次后移,一直到末端為止,得到的最小距離就是這個(gè)輸入樣本同這一模板的距離。然后,在實(shí)際實(shí)現過(guò)程中,因為對算法性能要求比較高,可以考慮加入不同的索引而達到減小計算次數的目的。索引的種類(lèi)和方法不一而足,在此就不再贅述了。
4.1.3 自然語(yǔ)音(Live Speech)檢測
該部分的主要功能是利用人類(lèi)自然語(yǔ)音特有的一些規律進(jìn)行啟發(fā)式判斷,從而確定是否需要進(jìn)入Tone音或AM音識別流程。該部分采用的規律如下:
A.如果正式語(yǔ)音之前的靜音段超過(guò)某一閾值,則認為是人類(lèi)自然語(yǔ)音
B.如果問(wèn)候語(yǔ)過(guò)長(cháng),時(shí)間上超過(guò)某一閾值,則認為是應答機錄音。
C.如果問(wèn)候語(yǔ)之后的靜音段過(guò)長(cháng)以至于超過(guò)某個(gè)門(mén)限,則認為是人類(lèi)自然語(yǔ)音。
D.如果問(wèn)候語(yǔ)中的詞語(yǔ)數目過(guò)多,則認為是應答機錄音。
除此之外,我們還設定了一個(gè)檢測最大時(shí)間,如果超過(guò)這一時(shí)間還沒(méi)有一個(gè)檢測結果,則返回一個(gè)“無(wú)法判斷”的結果。
最后,相關(guān)參數、時(shí)間以及判斷結果的關(guān)系如圖所示:
圖:人類(lèi)自然語(yǔ)音情況下各參數相對于時(shí)間軸的說(shuō)明
圖:自動(dòng)應答機錄音情況下各參數相對于時(shí)間軸的說(shuō)明
5.產(chǎn)品與應用
根據以上語(yǔ)音識別的方法,設計了基于語(yǔ)音識別技術(shù)的自動(dòng)外呼和洗號系統。以下部分將對該產(chǎn)品的框架及模塊進(jìn)行介紹。
5.1 技術(shù)架構
圖:系統技術(shù)架構
上圖為基于語(yǔ)音識別的自動(dòng)外呼和洗號系統的技術(shù)架構,由接入部分和平臺部分組成。其中終端為接入部分,提供包括PSTN傳統交換機、NGN軟交換和內部分機終端等多種網(wǎng)絡(luò )和終端的接入能力。平臺部分由ACD、CTI和MS等節點(diǎn)組成,提供呼叫中心語(yǔ)音接入、控制、管理和路由等功能。
ACD是呼叫中心的核心控制系統,主要負責呼叫中心信令、呼叫與控制節點(diǎn),負責信令識別。支持呼叫中心業(yè)務(wù)觸發(fā)到CTI。
CTI提供座席資源管理和排隊、路由策略,支持座席接入,同時(shí)支持MS的訪(fǎng)問(wèn)。
MS(Media Server,媒體服務(wù)器)是NGN架構中提供所有媒體資源的設備,是呼叫中心媒體匯聚與統一處理點(diǎn),所有的媒體資源處理都有MS來(lái)完成,包括IVR、DTMF、會(huì )議、錄音、傳真等。在媒體服務(wù)器上加入語(yǔ)音識別模塊,對收到的RTP語(yǔ)音流進(jìn)行實(shí)時(shí)的匹配和識別。
MS中新增加的語(yǔ)音識別模塊,由前端語(yǔ)音數據處理模塊、數據管理模塊、標準Tone音匹配模塊、人類(lèi)自然語(yǔ)音檢測模塊、AM音匹配模塊五部分組成,共同完成語(yǔ)音識別檢測。其模塊組成如下:
圖:語(yǔ)音識別的模塊組成
前端語(yǔ)音數據處理模塊,用來(lái)對語(yǔ)音進(jìn)行預處理和特征提取。數據管理模塊,主要工作為建庫。標準Tone音匹配模塊,匹配標準Tone音。人類(lèi)自然語(yǔ)音(Live Speech)檢測模塊,進(jìn)行人類(lèi)真實(shí)接聽(tīng)語(yǔ)音的判斷。AM音匹配模塊,從庫中匹配合適的模板音和判斷是否為庫外音。
該模塊負責進(jìn)行語(yǔ)音識別的第一步:預處理和特征提取。該模塊在模塊處理中的地位非常重要,對于數據管理模塊來(lái)說(shuō),AM庫文件的每一條內容是經(jīng)過(guò)前段語(yǔ)音數據處理以后的特征;而后面的三個(gè)檢測或匹配模塊都是建立在前端數據處理以后的數據基礎之上的。因此,前端語(yǔ)音數據處理的方法和所選用的特征對于檢測或匹配的準確率和算法的效率都至關(guān)重要。
本模塊的核心工作是對給定的Tone音標準和AM模板音庫進(jìn)行分析和特征提取,并存成相應的特征庫文件。特征庫主要分為T(mén)one庫和AM庫,其建立過(guò)程如下:
A.Tone庫
Tone庫的建立過(guò)程比較簡(jiǎn)單。因為有既定的標準,不需要從模板文件中讀取再生成。所以,采用的方法是直接從記錄有標準Tone音標準的文本文件中逐條逐項讀取,然后依樣存成二進(jìn)制庫文件Tone.dat。
B.AM庫
AM庫的建立過(guò)程比Tone音庫稍微復雜一些,原因是要經(jīng)過(guò)從相應的pcm文件模板進(jìn)行分析和提取特征的過(guò)程,因此就多了一個(gè)前端語(yǔ)音數據處理模塊。存入庫中的信息包括模板ID號、是否靜音幀、模板幀數目、FFT特征序列以及歸一化后的特征序列。歸一化前的特征序列會(huì )用于tone音檢測模塊,而歸一化后的特征序列用于A(yíng)M匹配。
該模塊的功能是進(jìn)行標準Tone音匹配。該系統采取的是順序檢測,即首先檢測是否是DTMF,再檢測是否是單頻的Tone音。
- 人類(lèi)自然語(yǔ)音(Live Speech)檢測模塊
該模塊負責判斷人類(lèi)真實(shí)語(yǔ)音。人類(lèi)自然語(yǔ)音檢測在三個(gè)檢測或匹配模塊中是最難處理的一塊。因為本質(zhì)上說(shuō),自動(dòng)應答機的話(huà)音也是人通過(guò)錄音機事先錄好的,所以從聲學(xué)層次并不能有效地將它們區分開(kāi)。該系統利用人類(lèi)自然語(yǔ)音特有的一些規律進(jìn)行啟發(fā)式判斷,來(lái)進(jìn)行人類(lèi)語(yǔ)音的識別。
AM音匹配模塊的主要任務(wù)是將輸入的語(yǔ)音經(jīng)過(guò)處理后,與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結果返回。若經(jīng)過(guò)與所有的特征模板都進(jìn)行比較后得出的最小距離仍然大于某一個(gè)門(mén)限值,則認為輸入語(yǔ)音是庫外音。
同時(shí),該系統還通過(guò)提取各地不同網(wǎng)絡(luò )、運營(yíng)商的提示音庫,建立了一個(gè)龐大的樣本庫。目前該系統已擁有三大運營(yíng)商、30多個(gè)省市的近300個(gè)樣本庫,可根據項目需要靈活加載部署,從而解決了方言識別的問(wèn)題。
5.2 平臺架構
基于語(yǔ)音識別技術(shù)的自動(dòng)外呼和洗號系統主要由管理應用、外呼與庫模塊、號碼與識別模塊三部分組成。每部分的功能如下:
圖:系統組成
5.2.1 管理應用
該部分由任務(wù)管理、號碼管理、提示音管理、自學(xué)系統四部分組成,任務(wù)管理負責創(chuàng )建洗號任務(wù),選擇號碼庫,設置時(shí)間速率等。號碼管理可以實(shí)現包括號碼導入導出,未洗號碼、已洗號碼分類(lèi)檢查,重聽(tīng)錄音等功能。提示音導入導出,試聽(tīng)檢測靠提示音管理來(lái)進(jìn)行。自學(xué)習系統能對不能識別號碼進(jìn)行人工干預和二次識別,將提示音加入庫,從而保證了提示音樣本庫的不斷增長(cháng)。
5.2.2 外呼與庫模塊
該部分由自動(dòng)外呼模塊、號碼庫、錄音庫、提示音庫四部分組成。自動(dòng)外呼模塊:按指定速率進(jìn)行外呼,并將呼叫結果保存入庫。號碼庫用來(lái)保存各種號碼資源,特別是有效號碼,包括移動(dòng)號碼(聯(lián)通、移動(dòng)、電信),固定號碼(電信、聯(lián)通)。提示音庫樣本庫覆蓋了各地、運營(yíng)商及網(wǎng)絡(luò )。錄音庫可對洗號結果進(jìn)行錄音,還可用于人工抽查,并且可進(jìn)行二次分析和自學(xué)習,提供增值能力。
5.2.3 呼叫與號碼識別模塊
該部分由CTI、ACD、MS三部分組成,也是系統的主要組成部分。CTI負責指示ACD發(fā)起外呼,上報結果。ACD控制信令檢測,而MS負責提供語(yǔ)音導航和自動(dòng)服務(wù)功能,可解析執行來(lái)實(shí)現語(yǔ)音交互能力,是完成語(yǔ)音識別的主要部分。
5.3 基于語(yǔ)音識別的號碼識別流程
下圖為該產(chǎn)品基于語(yǔ)音識別的號碼識別流程,具體洗號流程如下圖:
圖:基于語(yǔ)音識別的洗號流程
洗號流程發(fā)生在呼叫建立過(guò)程中,如果存在臨時(shí)話(huà)路(彩鈴、tone音、各種識別提示音等情況),則進(jìn)入到語(yǔ)音識別過(guò)程。具體:
- 系統發(fā)起呼叫,根據返回的信令確定下一步處理流程
- 如果是200響應碼,表明呼叫接通,直接轉到座席處理
- 如果是3XX-6XX響應碼,表明呼叫失敗,根據信令響應碼和Reason原因值進(jìn)行檢測
- 如果是18X響應碼,表明在振鈴階段,需要根據是否帶SDP確定下一步處理
- 如果18X帶了SDP,表明進(jìn)入了臨時(shí)話(huà)路,那么連接語(yǔ)音識別模塊進(jìn)行匹配處理
- 如果18X沒(méi)有帶SDP,則表明只是普通的振鈴,無(wú)需識別
5.4 系統特點(diǎn)
語(yǔ)音識別技術(shù)應用于號碼識別領(lǐng)域,對呼叫建立過(guò)程中臨時(shí)話(huà)路播放的語(yǔ)音進(jìn)行快速匹配,以實(shí)現號碼快速和精確的識別具有非凡的意義。基于以上語(yǔ)音識別模塊的洗號系統,相比單靠信令檢測的洗號系統,更高效可靠。其特點(diǎn)如下:
從技術(shù)方面來(lái)看,欣方公司的洗號系統目前面向PSTN(固定電話(huà)網(wǎng))、PLMN(移動(dòng)電話(huà)網(wǎng))和NGN(軟交換)網(wǎng)絡(luò ),能夠支持音頻(Tone音)檢測、信令(ISDN PRI、七號信令等)處理、語(yǔ)音識別等洗號產(chǎn)品關(guān)鍵技術(shù),號碼篩選準確率在95%以上,是國內洗號系統中有效號碼識別率最高的產(chǎn)品之一。
在固網(wǎng)中,交換機使用Tone標識被叫用戶(hù)狀態(tài)的比較多,如正常回鈴音、忙音等,欣方洗號系統針對Tone音的檢測能夠達到100%的準確率。
在標準的信令處理方面,被叫的交換機會(huì )主動(dòng)釋放呼叫(Release),并在信令中包含釋放原因,如“Unallocated Num”(空號)、“User Busy”(被叫忙)等。欣方洗號系統在信令處理方面能夠達到100%的準確率。
- 支持交換機網(wǎng)絡(luò )提示音的檢測。
這是欣方洗號系統中最具難度、同時(shí)也是最具技術(shù)含量的部分。由于國內三大電信運營(yíng)商在語(yǔ)音提示反映被叫狀態(tài)方面,沒(méi)有統一的標準。例如,同樣是被叫為空號的提示音,可能是“對不起,您撥的號碼是空號”,也可能是“對不起,您撥的號碼不存在”等等。為此,欣方洗號系統配置了一個(gè)可擴展的音庫,將各種提示音以及其具體的含義定義在里面。目前音庫中包含固網(wǎng)提示音600多條,移動(dòng)提示音100多條,基本上覆蓋了三大運營(yíng)商全國各省的網(wǎng)絡(luò )提示音。
由于國內三大電信運營(yíng)商(特別是固網(wǎng)運營(yíng)商)存在太多的不同品牌交換機,并且各個(gè)本地網(wǎng)的提示音經(jīng)常不相同(有時(shí)候即使提示內容相同,但是提示音的音調、語(yǔ)氣也可能不同),這就對洗號系統的語(yǔ)音識別能力提出了更高的要求。欣方洗號系統對外呼采用會(huì )議方式進(jìn)行全程錄音,會(huì )議方式錄音保證了錄音的可靠性。用戶(hù)通過(guò)對錯誤檢測錄音的分析,可以生成新的語(yǔ)音識別樣本庫,動(dòng)態(tài)加載到系統中。從而進(jìn)一步提高識別精準度。這種自學(xué)習的語(yǔ)音識別功能,保證了欣方洗號系統所具備的高識別率。
欣方洗號系統中單個(gè)呼叫在5秒內完成語(yǔ)音檢測,并結束呼叫。單個(gè)E1的配置情況下,每小時(shí)可以實(shí)現并發(fā)外呼8000個(gè)號碼。
欣方洗號系統軟件采用C++語(yǔ)言開(kāi)發(fā),運行于Linux環(huán)境下。由于使用的是呼叫中心、智能網(wǎng)平臺同一套底層代碼,因此系統穩定性非常高,是電信級的產(chǎn)品。同時(shí),硬件成本低,根據用戶(hù)成本,可以分別配置工控機+板卡或PC服務(wù)器+語(yǔ)音網(wǎng)關(guān)的方式。同時(shí)該平臺具有良好的擴展性,單臺機器可支持最少1E1,最大64E1的ISDN PRI或ISUP接入。
具有重呼機制:
對于語(yǔ)音識別出的用戶(hù)失敗的情況,例如用戶(hù)忙、無(wú)應答、不在服務(wù)區等情況,系統可設置重呼策略,包括重呼時(shí)間和重呼次數的設置。例如設置在10分鐘后重呼、重呼次數為2次,則在第1次呼叫失敗完畢后的10分鐘后進(jìn)行第1次重呼,若第1次重呼時(shí)還是無(wú)應答等情況,將在接下來(lái)的10分鐘后進(jìn)行第二次重呼。
6.測試結果
通過(guò)撥打固定電話(huà)、手機、軟電話(huà)、傳真機等通信終端,對語(yǔ)音識別部分每個(gè)模塊的準確性、時(shí)效性、并發(fā)性和穩定性進(jìn)行了測試,結果如下表:
表2 語(yǔ)音匹配系統系統功能表
從測試結果可以看出,該系統能與各種可能的回傳語(yǔ)音進(jìn)行匹配,實(shí)現準確、高效的語(yǔ)音檢測分類(lèi)功能。
7.成功案例
欣方綜合信令識別和語(yǔ)音識別技術(shù),為自動(dòng)外呼和洗號系統提供了完善的技術(shù)方案,典型案例如下:
- 信元博雅固話(huà)洗號平臺
- 系統配置:工控機+板卡,1E1(ISDN PRI接入)
- 目標號碼:全國固話(huà)號碼(電信、聯(lián)通)
- 洗號速率:并發(fā)20個(gè)呼叫,平均每個(gè)呼叫6-7秒,平均8000號/小時(shí),20萬(wàn)個(gè)號/日
- 識別準確率:95%
- 接通率:<1%
- 河北移動(dòng)卓望洗號平臺
- 系統配置:PC服務(wù)器+網(wǎng)關(guān),4E1( ISUP接入)
- 目標號碼:河北移動(dòng)手機用戶(hù)號碼
- 洗號速率:并發(fā)120個(gè)呼叫,平均每個(gè)呼叫6-7秒,平均48000號/小時(shí),120萬(wàn)個(gè)號/日
- 識別準確率:99%
- 接通率:<1%
8.結束語(yǔ)
本文提出了一種基于語(yǔ)音識別的檢測方法,該方法采用模式匹配對tone音、AM音進(jìn)行快速匹配,可以準確地識別號碼狀態(tài),很好的彌補了信令檢測方式的不足,很大程度上提高了號碼識別的準確率與效率。
目前,基于語(yǔ)音識別的檢測方法已經(jīng)產(chǎn)品化,并成功的應用到河北移動(dòng)卓望和信元博雅固話(huà)洗號平臺上。經(jīng)過(guò)測試,該系統具有良好的并發(fā)性與穩定性,同時(shí)通過(guò)對號碼的有效甄別和篩選,顯著(zhù)減少了座席等待時(shí)長(cháng),顯著(zhù)減少了座席等待時(shí)長(cháng),提高了撥號效率,進(jìn)而降低了外呼成本。
隨著(zhù)呼叫中心市場(chǎng)的成熟,基于語(yǔ)音識別檢測方法會(huì )對提高呼叫中心的效率、增加企業(yè)利潤具有重要意義,其應用前景將十分廣闊。但是在號碼識別領(lǐng)域,仍有許多值得研究的問(wèn)題。例如,隨著(zhù)樣本庫的擴增,號碼識別的準確度和效率也會(huì )隨之下降,因此采用區別于模式匹配的ASR語(yǔ)音識別方法來(lái)進(jìn)行號碼識別,將是我們研究的下一個(gè)重點(diǎn)。
作者供稿 CTI論壇編輯
相關(guān)閱讀:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
泰顺县|
荆州市|
马尔康县|
中宁县|
松桃|
龙口市|
甘谷县|
大宁县|
封丘县|
雅安市|
将乐县|
萨迦县|
大理市|
都匀市|
广南县|
宁南县|
宜城市|
定日县|
和平区|
仙游县|
田阳县|
平昌县|
保亭|
定远县|
呼图壁县|
马龙县|
仁怀市|
石楼县|
萨嘎县|
商都县|
新乡市|
永清县|
花垣县|
和田市|
和田县|
北川|
临猗县|
诏安县|
沙洋县|
麻城市|
高密市|
http://444
http://444
http://444
http://444
http://444
http://444