語音識(shí)別技術(shù)在自動(dòng)外呼和洗號(hào)系統(tǒng)的應(yīng)用與優(yōu)勢

2011/07/18

摘要：

　　隨著呼叫中心系統(tǒng)呼出業(yè)務(wù)量的不斷增多，正確識(shí)別號(hào)碼狀態(tài)，提高撥號(hào)效率已經(jīng)成為外呼型呼叫中心需要解決的重要問題。本文首先介紹了號(hào)碼識(shí)別在自動(dòng)外呼和洗號(hào)系統(tǒng)中的意義，接著分析了信令分析檢測方式的不足，進(jìn)而提出一種基于語音識(shí)別技術(shù)的外呼系統(tǒng)，并闡述了語音識(shí)別技術(shù)在提高工作效率及降低成本上的優(yōu)勢及意義。

關(guān)鍵詞：呼叫中心；自動(dòng)外呼；洗號(hào)；語音識(shí)別；

1.引言

　　隨著呼叫中心市場的不斷成熟，呼入型業(yè)務(wù)基本飽和，通過電話由坐席主動(dòng)對(duì)客戶進(jìn)行拜訪和推銷產(chǎn)品的呼出型業(yè)務(wù)正逐步成為贏得客戶的關(guān)鍵手段。而如何對(duì)外呼號(hào)碼進(jìn)行準(zhǔn)確識(shí)別和篩選（“洗號(hào)”），以通過提高撥號(hào)效率來提升營銷利潤，已經(jīng)成為迫在眉睫的問題。

　　現(xiàn)有的自動(dòng)外呼及洗號(hào)系統(tǒng)中的號(hào)碼識(shí)別方法一般是通過信令處理等技術(shù)來實(shí)現(xiàn)，而基于信令檢測的方式在準(zhǔn)確性和效率保證上又存在嚴(yán)重的問題。

　　為了提高號(hào)碼識(shí)別的準(zhǔn)確性與效率，提出了一種基于語音識(shí)別技術(shù)的號(hào)碼識(shí)別方法，可應(yīng)用于自動(dòng)外呼和洗號(hào)系統(tǒng)。該方法通過與信令檢測方法相結(jié)合，可使自動(dòng)外呼和洗號(hào)系統(tǒng)中的語音識(shí)別準(zhǔn)確率達(dá)到95%以上；有效解決了傳統(tǒng)外呼和洗號(hào)系統(tǒng)中現(xiàn)存的弊端，很大程度上提高了撥號(hào)效率，從而達(dá)到了提高呼叫中心效益的目的。

2.自動(dòng)外呼和洗號(hào)系統(tǒng)

　　自動(dòng)外呼系統(tǒng)是一個(gè)自動(dòng)執(zhí)行企業(yè)用戶定制的外呼任務(wù)的系統(tǒng)。它執(zhí)行的特點(diǎn)是系統(tǒng)根據(jù)座席狀態(tài)和算法策略對(duì)指定號(hào)碼集自動(dòng)發(fā)起呼叫，通過分析呼叫過程中的信令和信號(hào)，對(duì)呼叫采取合適的處理。具體處理方法為：當(dāng)呼叫接通時(shí)，系統(tǒng)將呼叫轉(zhuǎn)接給座席；若用戶未接通，則繼續(xù)呼叫下一個(gè)號(hào)碼，同時(shí)代替座席記錄當(dāng)前呼叫的狀態(tài)。

　　洗號(hào)系統(tǒng)也是自動(dòng)外呼系統(tǒng)的一個(gè)重要應(yīng)用，其原理是系統(tǒng)提前將雜亂的號(hào)碼試呼一遍，清除一些無效號(hào)碼，如空號(hào)、停機(jī)、欠費(fèi)、格式錯(cuò)誤等，以此來提高外呼效率。

　　值得注意的是，自動(dòng)外呼和洗號(hào)系統(tǒng)都需要通過號(hào)碼識(shí)別來確定所呼號(hào)碼的狀態(tài)，系統(tǒng)的效率很大程度上取決于其對(duì)號(hào)碼的識(shí)別能力。然而，目前常見的號(hào)碼狀態(tài)分為多種類型：

號(hào)碼不可用（空號(hào)，停機(jī)，欠費(fèi)，地址不全等）；

暫時(shí)不可用（關(guān)機(jī)，不在服務(wù)中，通話中等）；

可用（無應(yīng)答，被叫忙等）、自動(dòng)應(yīng)答號(hào)碼（傳真、企業(yè)總機(jī)等）。

　　由于三大運(yùn)商營對(duì)如此繁多的號(hào)碼狀態(tài)未作統(tǒng)一標(biāo)準(zhǔn)，加上信令檢測方式存在很多弊端，使得對(duì)號(hào)碼的識(shí)別具有相當(dāng)大的挑戰(zhàn)。首先，錯(cuò)誤的識(shí)別會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)的丟失，使企業(yè)失去一些潛在用戶，直接導(dǎo)致利益損失。其次，識(shí)別速度過慢，不但影響系統(tǒng)的整體效率，還會(huì)影響座席人員的工作熱情，這也成為了提高企業(yè)利潤的瓶頸。因此，如何對(duì)號(hào)碼進(jìn)行正確、高效的識(shí)別是當(dāng)前要解決的關(guān)鍵問題，這也使得對(duì)號(hào)碼識(shí)別方式的研究具有了現(xiàn)實(shí)意義。

3.號(hào)碼識(shí)別方式分析

　　在實(shí)際網(wǎng)絡(luò)中，表示被叫用戶狀態(tài)有三種方式：標(biāo)準(zhǔn)Tone音、提示音和7號(hào)信令。每種方式又可細(xì)分為多種表現(xiàn)形式：

　　標(biāo)準(zhǔn)的Tone音：振鈴音，忙音，空號(hào)，不可達(dá)音等，這種方式在固定網(wǎng)中比較常見。

　　提示音：“該號(hào)碼不存在”，“該號(hào)碼是空號(hào)”，“該號(hào)碼已停機(jī)”等。通過提示音來顯示當(dāng)前被叫用戶狀態(tài)多發(fā)生在移動(dòng)網(wǎng)絡(luò)中。

　　7號(hào)信令。在呼叫釋放的信令（releasecall），會(huì)帶釋放原因：“Unallocated Num”“user busy”等，也常被移動(dòng)網(wǎng)絡(luò)采用。

　　目前自動(dòng)外呼和洗號(hào)系統(tǒng)主要采用信令分析、語音識(shí)別技術(shù)（包括檢測音頻）等進(jìn)行號(hào)碼識(shí)別和篩選。下面將對(duì)幾種檢測方式進(jìn)行詳細(xì)說明。

　　3.1 信令檢測方式分析

　　一般情況下，號(hào)碼識(shí)別需根據(jù)當(dāng)前呼叫失敗的原因來判斷，因此，通常會(huì)利用呼叫過程中產(chǎn)生的信令來檢測。然而這種檢測方式存在嚴(yán)重的準(zhǔn)確性和效率問題，不能滿足呼叫中心自動(dòng)外呼和洗號(hào)的功能要求。

　　首先，采用這種方式進(jìn)行檢測準(zhǔn)確性差。其原因是：在中國三大運(yùn)營商現(xiàn)網(wǎng)中，反映被叫用戶的狀態(tài)沒有統(tǒng)一的標(biāo)準(zhǔn)。甚至同一個(gè)運(yùn)營商的同一個(gè)本地網(wǎng)都會(huì)出現(xiàn)不相同的情況。標(biāo)準(zhǔn)的不統(tǒng)一，為信令的檢測造成了困難，經(jīng)常出現(xiàn)號(hào)碼狀態(tài)無法識(shí)別、錯(cuò)誤識(shí)別的情況。

　　其次，采用信令檢測方式效率低下，由于PSTN普遍實(shí)施了呼叫失敗后語音提示的人性化功能，語音提示時(shí)長可達(dá)60秒，然后才發(fā)送信令。這樣嚴(yán)重影響了信令檢測的效率。

　　下例為對(duì)河北移動(dòng)某呼叫中心自動(dòng)外呼系統(tǒng)的信令測試結(jié)果分析（該系統(tǒng)使用的交換機(jī)為Dialogic IMG1010網(wǎng)關(guān)，信令方式為ISUP）：

　　表1：信令號(hào)碼識(shí)別測試

　　從歸納的情況看，只有無應(yīng)答和地址不全兩種情況是可靠信令分析來識(shí)別的，其他的5種情況都無法通過信令檢測識(shí)別。特別是暫時(shí)無法接通的語言提示，播放完提示音有3種不同的信令，應(yīng)該是屬于不同的情況，但是放了相同的語音。因此造成號(hào)碼識(shí)別錯(cuò)誤的現(xiàn)象。

　　綜上，信令分析檢測方式，對(duì)于釋放7號(hào)信令來表示用戶狀態(tài)的情況是十分有效的。但是，該方式不具備區(qū)分標(biāo)準(zhǔn)Tone音和提示音的能力，同時(shí)效率低下。要準(zhǔn)確、高效的判斷用戶的當(dāng)前狀態(tài)，必須要通過一種更為準(zhǔn)確可靠的方式——語音識(shí)別。

　　3.2 語音識(shí)別檢測方式分析

　　現(xiàn)有PSTN網(wǎng)絡(luò)普遍實(shí)施了呼叫失敗后語音提示或tone音的人性化功能，由于這些tone音和失敗提示音都是在臨時(shí)話路中播放的，因此信令的方式無法區(qū)分這兩種場景。但是語音識(shí)別技術(shù)恰恰是利用了這個(gè)特點(diǎn)，對(duì)語音提示或tone音進(jìn)行快速的語音識(shí)別與匹配，在精確識(shí)別號(hào)碼的同時(shí)，提升了識(shí)別的速率。

　　首先，采用語音識(shí)別技術(shù)可幫助自動(dòng)外呼和洗號(hào)系統(tǒng)提高號(hào)碼識(shí)別的準(zhǔn)確率。系統(tǒng)通過語音匹配將相同信令的呼叫區(qū)分，幫助洗號(hào)系統(tǒng)正確的識(shí)別可用號(hào)碼，同時(shí)還能幫助自動(dòng)外呼系統(tǒng)正確的記錄座席呼叫狀態(tài)，避免了因錯(cuò)誤識(shí)別而導(dǎo)致數(shù)據(jù)丟失的情況發(fā)生。

　　其次，語音識(shí)別技術(shù)還可以幫助自動(dòng)外呼和洗號(hào)系統(tǒng)實(shí)現(xiàn)高效識(shí)別。系統(tǒng)通過特征和關(guān)鍵字匹配的方式，在幾秒鐘內(nèi)就能完成語音匹配，幫助自動(dòng)外呼系統(tǒng)真正的提高了座席工作效率；同樣也幫助洗號(hào)系統(tǒng)提高了效率，使其以更少的設(shè)備投入獲得更好的效益。

　　綜上，采用語音識(shí)別技術(shù)，進(jìn)行模式匹配，可以精確、高效的識(shí)別號(hào)碼狀態(tài)，彌補(bǔ)了信令檢測方式的不足。但是語音識(shí)別技術(shù)也存在一些難點(diǎn)，例如，樣本庫的建立、方言識(shí)別以及提高識(shí)別效率等等。這些技術(shù)難點(diǎn)也成為了語音識(shí)別檢測方式需要解決的重要問題。

4.語音識(shí)別技術(shù)的應(yīng)用

　　4.1 基本原理

　　語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。它可用于對(duì)用戶呼叫失敗的情況進(jìn)行自動(dòng)分類。

　　我們采用的語音識(shí)別技術(shù)主要靠匹配方式來進(jìn)行，分成Tone音匹配、AM音匹配和人類自然語音檢測三部分。具體流程圖如下：

語音處理流程圖

圖:語音處理流程圖
（VAD: Voice Activity Detection；LV: Live Speech；AM: Answering Machine）
　　圖中，Tone音匹配采用模式匹配方法，可以實(shí)現(xiàn)對(duì)振鈴音，忙音，空號(hào)，不可達(dá)音等100多種標(biāo)準(zhǔn)提示音的識(shí)別。AM（Answering Machine）音匹配主要負(fù)責(zé)識(shí)別傳真機(jī)、自動(dòng)答錄機(jī)等機(jī)器語音，同樣采用模式匹配方法，將收到的語音與標(biāo)準(zhǔn)樣本庫進(jìn)行比對(duì)。人類自然語音檢測的功能主要通過人真實(shí)聲音的檢測，來判斷是否需要進(jìn)行語音匹配。

　　4.1.1 標(biāo)準(zhǔn)Tone音匹配

　　Tone音匹配采用的是模式匹配方法，將模擬語音信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，再同音庫中的樣本進(jìn)行比對(duì)，實(shí)現(xiàn)號(hào)碼狀態(tài)識(shí)別。

　　在標(biāo)準(zhǔn)Tone音匹配模塊里，因?yàn)槟承﹩晤lTone音的頻率區(qū)間和DTMF之間存在重疊，為了避免不必要的混淆，采取順序檢測，即首先檢測是否是DTMF，再檢測是否是單頻的Tone音。

　　Tone音的一個(gè)顯要特點(diǎn)是在頻域上的某一個(gè)子帶上的能量特別強(qiáng)，而且這種情況是在后續(xù)所有非靜音的連續(xù)幀上都是持續(xù)的（如圖1所示）�；诖颂攸c(diǎn)，我們采用以下方法：

　　1.取第一幀非靜音幀的16個(gè)子帶能量特征，求出其最大子帶能量所在的子帶序號(hào)（在DTMF階段是取最大的兩個(gè)子帶序號(hào)）。
　　2.如果最大能量值所在的子帶序號(hào)一直保持若干幀不變，則我們認(rèn)為從頻率角度滿足了作為一個(gè)Tone音的基本條件。

　　由于DTMF不存在時(shí)間持續(xù)長短的相關(guān)信息，所以經(jīng)過上述步驟后，只需將最大能量的兩個(gè)序號(hào)在事先準(zhǔn)備好的DTMF子帶序號(hào)表里查找即可得出結(jié)論，對(duì)于檢測DTMF顯然已經(jīng)足夠。但由于單頻的Tone音還存在持續(xù)時(shí)間長短及靜音間歇的問題，故對(duì)于輸入的信號(hào)，經(jīng)過前端數(shù)據(jù)處理過程之后，要利用它是否靜音幀的信息統(tǒng)計(jì)各段長度，最后，同時(shí)考慮頻率和時(shí)間段列表，如果滿足庫中某一條的相關(guān)標(biāo)準(zhǔn)，才認(rèn)為是一個(gè)標(biāo)準(zhǔn)Tone音。

　　4.1.2 AM音匹配

　　AM音匹配同樣采用模式匹配方法，對(duì)語音信號(hào)進(jìn)行采樣、量化、歸一化處理后，將模擬語音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字語音信號(hào)。再與庫文件中的特征模板進(jìn)行比較，選擇出最為相近的一條作為匹配結(jié)果返回。

　　假設(shè)模板庫里的特征條目的時(shí)長應(yīng)該至少是一個(gè)完整的AM音模板，因此從時(shí)間長度上來看，輸入的待檢測語音長度應(yīng)小于模板里的最佳匹配項(xiàng)。

　　不像Tone音檢測模塊中使用的是各幀在前端處理過程中產(chǎn)生的16個(gè)子帶上的能量具體值，這里使用的特征卻是經(jīng)過歸一化后的二進(jìn)制向量。如果要比較的兩幀特征向量分別設(shè)為：

　　其中，指異或操作，而函數(shù) 是求二進(jìn)制向量里“1”的個(gè)數(shù)。

　　然后，如果輸入語音樣本的幀數(shù)目為，則總距離定義為相應(yīng)的幀距離的和。

　　至于要得到這條語音樣本與特征庫里某個(gè)模板的最小距離，比較傳統(tǒng)的方法是用這待匹配的幀同模板的開始處幀算距離，然后將待匹配音順次后移，一直到末端為止，得到的最小距離就是這個(gè)輸入樣本同這一模板的距離。然后，在實(shí)際實(shí)現(xiàn)過程中，因?yàn)閷?duì)算法性能要求比較高，可以考慮加入不同的索引而達(dá)到減小計(jì)算次數(shù)的目的。索引的種類和方法不一而足，在此就不再贅述了。

　　4.1.3 自然語音（Live Speech）檢測

　　該部分的主要功能是利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷，從而確定是否需要進(jìn)入Tone音或AM音識(shí)別流程。該部分采用的規(guī)律如下：

　　A.如果正式語音之前的靜音段超過某一閾值，則認(rèn)為是人類自然語音
　　B.如果問候語過長，時(shí)間上超過某一閾值，則認(rèn)為是應(yīng)答機(jī)錄音。
　　C.如果問候語之后的靜音段過長以至于超過某個(gè)門限，則認(rèn)為是人類自然語音。
　　D.如果問候語中的詞語數(shù)目過多，則認(rèn)為是應(yīng)答機(jī)錄音。

　　除此之外，我們還設(shè)定了一個(gè)檢測最大時(shí)間，如果超過這一時(shí)間還沒有一個(gè)檢測結(jié)果，則返回一個(gè)“無法判斷”的結(jié)果。

　　最后，相關(guān)參數(shù)、時(shí)間以及判斷結(jié)果的關(guān)系如圖所示：

人類自然語音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

圖:人類自然語音情況下各參數(shù)相對(duì)于時(shí)間軸的說明
自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

圖:自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說明
5.產(chǎn)品與應(yīng)用

　　根據(jù)以上語音識(shí)別的方法，設(shè)計(jì)了基于語音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)。以下部分將對(duì)該產(chǎn)品的框架及模塊進(jìn)行介紹。

　　5.1 技術(shù)架構(gòu)

系統(tǒng)技術(shù)架構(gòu)

圖:系統(tǒng)技術(shù)架構(gòu)
　　上圖為基于語音識(shí)別的自動(dòng)外呼和洗號(hào)系統(tǒng)的技術(shù)架構(gòu)，由接入部分和平臺(tái)部分組成。其中終端為接入部分，提供包括PSTN傳統(tǒng)交換機(jī)、NGN軟交換和內(nèi)部分機(jī)終端等多種網(wǎng)絡(luò)和終端的接入能力。平臺(tái)部分由ACD、CTI和MS等節(jié)點(diǎn)組成，提供呼叫中心語音接入、控制、管理和路由等功能。

　　ACD是呼叫中心的核心控制系統(tǒng)，主要負(fù)責(zé)呼叫中心信令、呼叫與控制節(jié)點(diǎn)，負(fù)責(zé)信令識(shí)別。支持呼叫中心業(yè)務(wù)觸發(fā)到CTI。

　　CTI提供座席資源管理和排隊(duì)、路由策略，支持座席接入，同時(shí)支持MS的訪問。

　　MS（Media Server，媒體服務(wù)器）是NGN架構(gòu)中提供所有媒體資源的設(shè)備，是呼叫中心媒體匯聚與統(tǒng)一處理點(diǎn)，所有的媒體資源處理都有MS來完成，包括IVR、DTMF、會(huì)議、錄音、傳真等。在媒體服務(wù)器上加入語音識(shí)別模塊，對(duì)收到的RTP語音流進(jìn)行實(shí)時(shí)的匹配和識(shí)別。

　　MS中新增加的語音識(shí)別模塊，由前端語音數(shù)據(jù)處理模塊、數(shù)據(jù)管理模塊、標(biāo)準(zhǔn)Tone音匹配模塊、人類自然語音檢測模塊、AM音匹配模塊五部分組成，共同完成語音識(shí)別檢測。其模塊組成如下：

語音識(shí)別的模塊組成

圖：語音識(shí)別的模塊組成
　　前端語音數(shù)據(jù)處理模塊，用來對(duì)語音進(jìn)行預(yù)處理和特征提取。數(shù)據(jù)管理模塊，主要工作為建庫。標(biāo)準(zhǔn)Tone音匹配模塊，匹配標(biāo)準(zhǔn)Tone音。人類自然語音（Live Speech）檢測模塊，進(jìn)行人類真實(shí)接聽語音的判斷。AM音匹配模塊，從庫中匹配合適的模板音和判斷是否為庫外音。

前端語音數(shù)據(jù)處理模塊

　　該模塊負(fù)責(zé)進(jìn)行語音識(shí)別的第一步：預(yù)處理和特征提取。該模塊在模塊處理中的地位非常重要，對(duì)于數(shù)據(jù)管理模塊來說，AM庫文件的每一條內(nèi)容是經(jīng)過前段語音數(shù)據(jù)處理以后的特征；而后面的三個(gè)檢測或匹配模塊都是建立在前端數(shù)據(jù)處理以后的數(shù)據(jù)基礎(chǔ)之上的。因此，前端語音數(shù)據(jù)處理的方法和所選用的特征對(duì)于檢測或匹配的準(zhǔn)確率和算法的效率都至關(guān)重要。

數(shù)據(jù)管理模塊

　　本模塊的核心工作是對(duì)給定的Tone音標(biāo)準(zhǔn)和AM模板音庫進(jìn)行分析和特征提取，并存成相應(yīng)的特征庫文件。特征庫主要分為Tone庫和AM庫，其建立過程如下：

　　A.Tone庫

　　Tone庫的建立過程比較簡單。因?yàn)橛屑榷ǖ臉?biāo)準(zhǔn)，不需要從模板文件中讀取再生成。所以，采用的方法是直接從記錄有標(biāo)準(zhǔn)Tone音標(biāo)準(zhǔn)的文本文件中逐條逐項(xiàng)讀取，然后依樣存成二進(jìn)制庫文件Tone.dat。

　　B.AM庫

　　AM庫的建立過程比Tone音庫稍微復(fù)雜一些，原因是要經(jīng)過從相應(yīng)的pcm文件模板進(jìn)行分析和提取特征的過程，因此就多了一個(gè)前端語音數(shù)據(jù)處理模塊。存入庫中的信息包括模板ID號(hào)、是否靜音幀、模板幀數(shù)目、FFT特征序列以及歸一化后的特征序列。歸一化前的特征序列會(huì)用于tone音檢測模塊，而歸一化后的特征序列用于AM匹配。

標(biāo)準(zhǔn)Tone音匹配模塊

　　該模塊的功能是進(jìn)行標(biāo)準(zhǔn)Tone音匹配。該系統(tǒng)采取的是順序檢測，即首先檢測是否是DTMF，再檢測是否是單頻的Tone音。

人類自然語音（Live Speech）檢測模塊

　　該模塊負(fù)責(zé)判斷人類真實(shí)語音。人類自然語音檢測在三個(gè)檢測或匹配模塊中是最難處理的一塊。因?yàn)楸举|(zhì)上說，自動(dòng)應(yīng)答機(jī)的話音也是人通過錄音機(jī)事先錄好的，所以從聲學(xué)層次并不能有效地將它們區(qū)分開。該系統(tǒng)利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷，來進(jìn)行人類語音的識(shí)別。

AM音匹配模塊

　　AM音匹配模塊的主要任務(wù)是將輸入的語音經(jīng)過處理后，與庫文件中的特征模板進(jìn)行比較，選擇出最為相近的一條作為匹配結(jié)果返回。若經(jīng)過與所有的特征模板都進(jìn)行比較后得出的最小距離仍然大于某一個(gè)門限值，則認(rèn)為輸入語音是庫外音。

　　同時(shí)，該系統(tǒng)還通過提取各地不同網(wǎng)絡(luò)、運(yùn)營商的提示音庫，建立了一個(gè)龐大的樣本庫。目前該系統(tǒng)已擁有三大運(yùn)營商、30多個(gè)省市的近300個(gè)樣本庫，可根據(jù)項(xiàng)目需要靈活加載部署，從而解決了方言識(shí)別的問題。

　　5.2 平臺(tái)架構(gòu)

　　基于語音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)主要由管理應(yīng)用、外呼與庫模塊、號(hào)碼與識(shí)別模塊三部分組成。每部分的功能如下：

系統(tǒng)組成

圖：系統(tǒng)組成
　　5.2.1 管理應(yīng)用

　　該部分由任務(wù)管理、號(hào)碼管理、提示音管理、自學(xué)系統(tǒng)四部分組成，任務(wù)管理負(fù)責(zé)創(chuàng)建洗號(hào)任務(wù)，選擇號(hào)碼庫，設(shè)置時(shí)間速率等。號(hào)碼管理可以實(shí)現(xiàn)包括號(hào)碼導(dǎo)入導(dǎo)出，未洗號(hào)碼、已洗號(hào)碼分類檢查，重聽錄音等功能。提示音導(dǎo)入導(dǎo)出，試聽檢測靠提示音管理來進(jìn)行。自學(xué)習(xí)系統(tǒng)能對(duì)不能識(shí)別號(hào)碼進(jìn)行人工干預(yù)和二次識(shí)別，將提示音加入庫，從而保證了提示音樣本庫的不斷增長。

　　5.2.2 外呼與庫模塊

　　該部分由自動(dòng)外呼模塊、號(hào)碼庫、錄音庫、提示音庫四部分組成。自動(dòng)外呼模塊：按指定速率進(jìn)行外呼，并將呼叫結(jié)果保存入庫。號(hào)碼庫用來保存各種號(hào)碼資源，特別是有效號(hào)碼，包括移動(dòng)號(hào)碼（聯(lián)通、移動(dòng)、電信），固定號(hào)碼（電信、聯(lián)通）。提示音庫樣本庫覆蓋了各地、運(yùn)營商及網(wǎng)絡(luò)。錄音庫可對(duì)洗號(hào)結(jié)果進(jìn)行錄音，還可用于人工抽查，并且可進(jìn)行二次分析和自學(xué)習(xí)，提供增值能力。

　　5.2.3 呼叫與號(hào)碼識(shí)別模塊

　　該部分由CTI、ACD、MS三部分組成，也是系統(tǒng)的主要組成部分。CTI負(fù)責(zé)指示ACD發(fā)起外呼，上報(bào)結(jié)果。ACD控制信令檢測，而MS負(fù)責(zé)提供語音導(dǎo)航和自動(dòng)服務(wù)功能，可解析執(zhí)行來實(shí)現(xiàn)語音交互能力，是完成語音識(shí)別的主要部分。

　　5.3 基于語音識(shí)別的號(hào)碼識(shí)別流程

　　下圖為該產(chǎn)品基于語音識(shí)別的號(hào)碼識(shí)別流程，具體洗號(hào)流程如下圖：

基于語音識(shí)別的洗號(hào)流程

圖：基于語音識(shí)別的洗號(hào)流程
　　洗號(hào)流程發(fā)生在呼叫建立過程中，如果存在臨時(shí)話路（彩鈴、tone音、各種識(shí)別提示音等情況），則進(jìn)入到語音識(shí)別過程。具體：

系統(tǒng)發(fā)起呼叫，根據(jù)返回的信令確定下一步處理流程

如果是200響應(yīng)碼，表明呼叫接通，直接轉(zhuǎn)到座席處理

如果是3XX-6XX響應(yīng)碼，表明呼叫失敗，根據(jù)信令響應(yīng)碼和Reason原因值進(jìn)行檢測

如果是18X響應(yīng)碼，表明在振鈴階段，需要根據(jù)是否帶SDP確定下一步處理

如果18X帶了SDP，表明進(jìn)入了臨時(shí)話路，那么連接語音識(shí)別模塊進(jìn)行匹配處理

如果18X沒有帶SDP，則表明只是普通的振鈴，無需識(shí)別

　　5.4 系統(tǒng)特點(diǎn)

　　語音識(shí)別技術(shù)應(yīng)用于號(hào)碼識(shí)別領(lǐng)域，對(duì)呼叫建立過程中臨時(shí)話路播放的語音進(jìn)行快速匹配，以實(shí)現(xiàn)號(hào)碼快速和精確的識(shí)別具有非凡的意義�；谝陨险Z音識(shí)別模塊的洗號(hào)系統(tǒng)，相比單靠信令檢測的洗號(hào)系統(tǒng)，更高效可靠。其特點(diǎn)如下：

準(zhǔn)確率高

　　從技術(shù)方面來看，欣方公司的洗號(hào)系統(tǒng)目前面向PSTN（固定電話網(wǎng)）、PLMN（移動(dòng)電話網(wǎng)）和NGN（軟交換）網(wǎng)絡(luò)，能夠支持音頻（Tone音）檢測、信令（ISDN PRI、七號(hào)信令等）處理、語音識(shí)別等洗號(hào)產(chǎn)品關(guān)鍵技術(shù)，號(hào)碼篩選準(zhǔn)確率在95%以上，是國內(nèi)洗號(hào)系統(tǒng)中有效號(hào)碼識(shí)別率最高的產(chǎn)品之一。

支持Tone音檢測功能。

　　在固網(wǎng)中，交換機(jī)使用Tone標(biāo)識(shí)被叫用戶狀態(tài)的比較多，如正�；剽徱簟⒚σ舻�，欣方洗號(hào)系統(tǒng)針對(duì)Tone音的檢測能夠達(dá)到100%的準(zhǔn)確率。

支持7號(hào)信令和ISDN PRI信令。

　　在標(biāo)準(zhǔn)的信令處理方面，被叫的交換機(jī)會(huì)主動(dòng)釋放呼叫（Release），并在信令中包含釋放原因，如“Unallocated Num”（空號(hào)）、“User Busy”（被叫忙）等。欣方洗號(hào)系統(tǒng)在信令處理方面能夠達(dá)到100%的準(zhǔn)確率。

支持交換機(jī)網(wǎng)絡(luò)提示音的檢測。

　　這是欣方洗號(hào)系統(tǒng)中最具難度、同時(shí)也是最具技術(shù)含量的部分。由于國內(nèi)三大電信運(yùn)營商在語音提示反映被叫狀態(tài)方面，沒有統(tǒng)一的標(biāo)準(zhǔn)。例如，同樣是被叫為空號(hào)的提示音，可能是“對(duì)不起，您撥的號(hào)碼是空號(hào)”，也可能是“對(duì)不起，您撥的號(hào)碼不存在”等等。為此，欣方洗號(hào)系統(tǒng)配置了一個(gè)可擴(kuò)展的音庫，將各種提示音以及其具體的含義定義在里面。目前音庫中包含固網(wǎng)提示音600多條，移動(dòng)提示音100多條，基本上覆蓋了三大運(yùn)營商全國各省的網(wǎng)絡(luò)提示音。

具備自學(xué)習(xí)的語音識(shí)別能力。

　　由于國內(nèi)三大電信運(yùn)營商（特別是固網(wǎng)運(yùn)營商）存在太多的不同品牌交換機(jī)，并且各個(gè)本地網(wǎng)的提示音經(jīng)常不相同（有時(shí)候即使提示內(nèi)容相同，但是提示音的音調(diào)、語氣也可能不同），這就對(duì)洗號(hào)系統(tǒng)的語音識(shí)別能力提出了更高的要求。欣方洗號(hào)系統(tǒng)對(duì)外呼采用會(huì)議方式進(jìn)行全程錄音，會(huì)議方式錄音保證了錄音的可靠性。用戶通過對(duì)錯(cuò)誤檢測錄音的分析，可以生成新的語音識(shí)別樣本庫，動(dòng)態(tài)加載到系統(tǒng)中。從而進(jìn)一步提高識(shí)別精準(zhǔn)度。這種自學(xué)習(xí)的語音識(shí)別功能，保證了欣方洗號(hào)系統(tǒng)所具備的高識(shí)別率。

系統(tǒng)處理能力強(qiáng)。

　　欣方洗號(hào)系統(tǒng)中單個(gè)呼叫在5秒內(nèi)完成語音檢測，并結(jié)束呼叫。單個(gè)E1的配置情況下，每小時(shí)可以實(shí)現(xiàn)并發(fā)外呼8000個(gè)號(hào)碼。

系統(tǒng)穩(wěn)定、性價(jià)比高

　　欣方洗號(hào)系統(tǒng)軟件采用C++語言開發(fā)，運(yùn)行于Linux環(huán)境下。由于使用的是呼叫中心、智能網(wǎng)平臺(tái)同一套底層代碼，因此系統(tǒng)穩(wěn)定性非常高，是電信級(jí)的產(chǎn)品。同時(shí)，硬件成本低，根據(jù)用戶成本，可以分別配置工控機(jī)＋板卡或PC服務(wù)器＋語音網(wǎng)關(guān)的方式。同時(shí)該平臺(tái)具有良好的擴(kuò)展性，單臺(tái)機(jī)器可支持最少1E1，最大64E1的ISDN PRI或ISUP接入。

　　具有重呼機(jī)制：

　　對(duì)于語音識(shí)別出的用戶失敗的情況，例如用戶忙、無應(yīng)答、不在服務(wù)區(qū)等情況，系統(tǒng)可設(shè)置重呼策略，包括重呼時(shí)間和重呼次數(shù)的設(shè)置。例如設(shè)置在10分鐘后重呼、重呼次數(shù)為2次，則在第1次呼叫失敗完畢后的10分鐘后進(jìn)行第1次重呼，若第1次重呼時(shí)還是無應(yīng)答等情況，將在接下來的10分鐘后進(jìn)行第二次重呼。

6.測試結(jié)果

　　通過撥打固定電話、手機(jī)、軟電話、傳真機(jī)等通信終端，對(duì)語音識(shí)別部分每個(gè)模塊的準(zhǔn)確性、時(shí)效性、并發(fā)性和穩(wěn)定性進(jìn)行了測試，結(jié)果如下表：

　　表2 語音匹配系統(tǒng)系統(tǒng)功能表

　　從測試結(jié)果可以看出，該系統(tǒng)能與各種可能的回傳語音進(jìn)行匹配，實(shí)現(xiàn)準(zhǔn)確、高效的語音檢測分類功能。

7.成功案例

　　欣方綜合信令識(shí)別和語音識(shí)別技術(shù)，為自動(dòng)外呼和洗號(hào)系統(tǒng)提供了完善的技術(shù)方案，典型案例如下：

信元博雅固話洗號(hào)平臺(tái)

系統(tǒng)配置：工控機(jī)＋板卡，1E1（ISDN PRI接入）
目標(biāo)號(hào)碼：全國固話號(hào)碼（電信、聯(lián)通）
洗號(hào)速率：并發(fā)20個(gè)呼叫，平均每個(gè)呼叫6－7秒，平均8000號(hào)/小時(shí)，20萬個(gè)號(hào)/日
識(shí)別準(zhǔn)確率：95%
接通率：<1%

河北移動(dòng)卓望洗號(hào)平臺(tái)

系統(tǒng)配置：PC服務(wù)器＋網(wǎng)關(guān)，4E1（ ISUP接入）
目標(biāo)號(hào)碼：河北移動(dòng)手機(jī)用戶號(hào)碼
洗號(hào)速率：并發(fā)120個(gè)呼叫，平均每個(gè)呼叫6－7秒，平均48000號(hào)/小時(shí)，120萬個(gè)號(hào)/日
識(shí)別準(zhǔn)確率：99%
接通率：<1%

8.結(jié)束語

　　本文提出了一種基于語音識(shí)別的檢測方法，該方法采用模式匹配對(duì)tone音、AM音進(jìn)行快速匹配，可以準(zhǔn)確地識(shí)別號(hào)碼狀態(tài)，很好的彌補(bǔ)了信令檢測方式的不足，很大程度上提高了號(hào)碼識(shí)別的準(zhǔn)確率與效率。

　　目前，基于語音識(shí)別的檢測方法已經(jīng)產(chǎn)品化，并成功的應(yīng)用到河北移動(dòng)卓望和信元博雅固話洗號(hào)平臺(tái)上。經(jīng)過測試，該系統(tǒng)具有良好的并發(fā)性與穩(wěn)定性，同時(shí)通過對(duì)號(hào)碼的有效甄別和篩選，顯著減少了座席等待時(shí)長，顯著減少了座席等待時(shí)長，提高了撥號(hào)效率，進(jìn)而降低了外呼成本。

　　隨著呼叫中心市場的成熟，基于語音識(shí)別檢測方法會(huì)對(duì)提高呼叫中心的效率、增加企業(yè)利潤具有重要意義，其應(yīng)用前景將十分廣闊。但是在號(hào)碼識(shí)別領(lǐng)域，仍有許多值得研究的問題。例如，隨著樣本庫的擴(kuò)增，號(hào)碼識(shí)別的準(zhǔn)確度和效率也會(huì)隨之下降，因此采用區(qū)別于模式匹配的ASR語音識(shí)別方法來進(jìn)行號(hào)碼識(shí)別，將是我們研究的下一個(gè)重點(diǎn)。

共 4 頁：1 2 3 4

作者供稿 CTI論壇編輯

相關(guān)閱讀:

北京欣方承建河北博岳外呼呼叫中心系統(tǒng) 2011-07-15

案例：河南農(nóng)信部署ITSM服務(wù)平臺(tái) 2011-06-10

欣方中繼網(wǎng)關(guān)CIN-MG 2011-05-10

欣方外包呼叫中心及電銷企業(yè)洗號(hào)系統(tǒng)方案 2011-05-09

欣方多媒體呼叫中心系統(tǒng)解決方案 2011-05-06

熱點(diǎn)專題: 語音合成TTS 語音識(shí)別ASR 呼叫中心電話營銷
嵊泗县| 四川省| 蓝山县| 绥阳县| 馆陶县| 祁门县| 七台河市| 长沙市| 邹平县| 阿城市| 高邮市| 马山县| 萨嘎县| 浙江省| 海南省| 贵定县| 旺苍县| 陇南市| 杭锦旗| 开原市| 龙口市| 成武县| 乡宁县| 巴楚县| 曲靖市| 宣城市| 建昌县| 涪陵区| 连江县| 嘉禾县| 东丽区| 婺源县| 阿合奇县| 朝阳县| 南江县| 鹤岗市| 临潭县| 于田县| 鄂温| 白水县| 台北市|