首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>>得意音通

"得意關(guān)鍵詞檢出器"API

2003/11/24

  "得意關(guān)鍵詞檢出器"技術(shù)是一種自動(dòng)語(yǔ)音識別(ASR)技術(shù)。它應用于一些具有特定要求的場(chǎng)合, 由于速度、高檢出率或其他特定的要求,人們并不需要系統識別出整個(gè)句子,更不需要理解整個(gè)句子,而只關(guān)注那些包含特定詞(稱(chēng)為"關(guān)鍵詞")的句子。比如,對一些特殊人名、地名和詞語(yǔ)進(jìn)行電話(huà)監聽(tīng),又比如通過(guò)人名進(jìn)行自動(dòng)分機接駁服務(wù),等等。

  根據一些應用的特殊需要,關(guān)鍵詞檢出器有一些有別于其他自動(dòng)語(yǔ)音識別的地方。包括:
  (1) 有的應用需要限定或假設一個(gè)句子只能含有一個(gè)關(guān)鍵詞(如自動(dòng)分機接駁),而有的應用則不希望有這樣的限定(如電話(huà)監聽(tīng))。
  (2) 有的應用希望"寧錯勿漏"( 如電話(huà)監聽(tīng)),而有的應用則希望"寧漏勿錯"(如自動(dòng)分機接駁)。關(guān)鍵詞集內的詞沒(méi)有被檢出,稱(chēng)為"漏識",而關(guān)鍵詞集外的詞識別成一個(gè)集內詞,稱(chēng)為"誤警"或"虛報"。 對一個(gè)特定的關(guān)鍵詞檢出器,漏識率和誤警率兩者不可能同時(shí)達到其最低點(diǎn)。因而相對于其他語(yǔ)音識別器,關(guān)鍵詞檢出器需要在漏識率和誤警率之間找到需要的平衡點(diǎn),稱(chēng)為"操作點(diǎn)"。

  "得意關(guān)鍵詞檢出器"的應用編程接口(API)有如下的特征:

  (1) 非特定人。得意關(guān)鍵詞檢出器對不同人的說(shuō)話(huà)有一定的適應能力,不管是誰(shuí),只要說(shuō)的是標準普通話(huà)即可,帶一些輕微的口音沒(méi)有任何影響。
  (2) 詞表可隨意定制。開(kāi)發(fā)者可以利用API接口,方便地提供詞表定制工具,使得使用者無(wú)需具備專(zhuān)業(yè)知識就可以方便地定義自己的詞表;對新定義的詞表,系統無(wú)需重新訓練,立刻可以使用。
  (3) 句中關(guān)鍵詞個(gè)數可以設定。開(kāi)發(fā)者可以根據具體的應用情況,方便地指定一句話(huà)中僅含一個(gè)關(guān)鍵詞(只報出最可能的關(guān)鍵詞),還是允許多個(gè)關(guān)鍵詞(檢出多少關(guān)鍵詞就報多少)。
  (4) 良好的拒識性能。利用性能良好的拒識功能,檢出器將根據具體情況報出所檢出關(guān)鍵詞,不會(huì )因使用者設定的句子中可以含有的關(guān)鍵詞數目而強行虛報。
  (5) 得意關(guān)鍵詞檢出器具有很低的漏識率和很低的誤警率。
  (6) 操作點(diǎn)易于調整。開(kāi)發(fā)者可以根據具體應用需要,方便地設定操作點(diǎn),以在漏識率和誤警率之間達到很好的平衡。


  (7) 得意關(guān)鍵詞檢出器利用很好的通道歸一技術(shù)可以在各種不同的信道(如固定電話(huà)或手機)中使用,而不影響其性能。
  (8) 得意關(guān)鍵詞檢出器聲學(xué)模型所需存儲<40MB。
  應用舉例:"得意智能語(yǔ)音總機"產(chǎn)品

  得意智能語(yǔ)音總機是利用得意關(guān)鍵詞檢出器的API開(kāi)發(fā)出來(lái)的一個(gè)具體應用。具體技術(shù)設定為:
  (1) 詞表為人名,并附帶分機號碼信息。
  (2) 每句話(huà)中最多含一個(gè)關(guān)鍵詞。
  (3) 操作點(diǎn)靠近低誤警率一端。

  一個(gè)實(shí)際應用范例如下。
  下表是由某公司人事部門(mén)的管理人員輸入的用戶(hù)詞表:


  修改完畢后,得意智能語(yǔ)音總機的內部詞表編譯器將自動(dòng)把上述詞表轉換成內部詞表。轉換過(guò)程主要用拼音標出每個(gè)姓名的發(fā)音,同時(shí)對一人多名和多人同名進(jìn)行檢查。當有多人同名并且沒(méi)有"確認信息"或確認信息不能分出這些人時(shí),內部詞表編譯器將提示管理人員輸入可以互相區分這些人的確認信息。在發(fā)生重名時(shí),確認信息用以與用戶(hù)進(jìn)行對話(huà)以便確認要找的人。
  對話(huà)示例:
  a. 系統:請于嗶聲后說(shuō)出要找的人的姓名,按#跨過(guò)該提示,按0進(jìn)入人工服務(wù)…嗶…
  b. 用戶(hù):你好,我找張總。
  c. 系統:轉接張三,請稍后… [轉接1001分機]。
  a. 系統:請于…
  b. 用戶(hù):[按#]
  c. 系統:?jiǎn)?br>   d. 用戶(hù):王…王五在嗎?
  e. 系統:轉接王五,請稍后…[轉接1003分機]。
  a. 系統:請于…
  b. 用戶(hù):[按#]
  c. 系統:?jiǎn)?br>   d. 用戶(hù):麻煩你給我轉接李四先生。
  e. 系統:請問(wèn)你找市場(chǎng)部的還是財務(wù)部的?
  f. 用戶(hù):市場(chǎng)部的李四。【注:由于系統已經(jīng)自動(dòng)轉換為用戶(hù)確認詞表,因此不會(huì )檢出"李四"。】
  g. 系統:轉接市場(chǎng)部李四,請稍后…[轉接1002]。
  a. 系統:請于…
  b. 用戶(hù):[按#]
  c. 系統:?jiǎn)?br>   d. 用戶(hù):請接張山。
  e. 系統:如果您是找張三,按1;按#可重說(shuō);按0可轉人工服務(wù)
  f. 用戶(hù):[按1]。
  g. 系統:轉接張三,請稍后…[轉接1001]。

  應用舉例:"得意導航員"產(chǎn)品

  利用得意關(guān)鍵詞API,可以設計一個(gè)用聲音對Windows操作系統進(jìn)行"發(fā)號施令"的"得意導航員"產(chǎn)品。在這里,用戶(hù)只需口呼命令就可以直接控制Windows,如口呼"我的電腦"、"打開(kāi)字處理(即Word)"等可以打開(kāi)相應的資源或應用,而且應用程序運行后,導航系統可以自動(dòng)提取那些當前活動(dòng)的菜單項,甚至是活動(dòng)菜單的隱藏菜單子項,供用戶(hù)口呼使用。這個(gè)過(guò)程是自動(dòng)的,是對用戶(hù)透明的。
  與利用得意命令SDK開(kāi)發(fā)的語(yǔ)音命令導航員不同,得意導航員允許用戶(hù)的命令更靈活,可以?shī)A雜一些其他的字詞。

得意音通公司供稿 CTI論壇編輯



相關(guān)鏈接:
得意珠三角綜合智能信息增值平臺項目中標 2009-08-20
北京軟件產(chǎn)品質(zhì)量檢測檢驗中心對《海量語(yǔ)音文件的目標說(shuō)話(huà)人篩選系統》進(jìn)行測試 2009-06-25
廣東政府和清華大學(xué)舉行了全面開(kāi)展產(chǎn)學(xué)研合作協(xié)議簽約儀式 2009-06-25
得意中文整句輸入法V1.0開(kāi)源for Windows Mobile5.0 2009-01-23
得意聲紋識別VPR4.0_b20080808新版本發(fā)布 2008-08-27

分類(lèi)信息:     技術(shù)_語(yǔ)音識別_解決方案
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 特克斯县| 佳木斯市| 定州市| 招远市| 巧家县| 南漳县| 景德镇市| 林西县| 松阳县| 金溪县| 綦江县| 南丰县| 黄陵县| 云和县| 浪卡子县| 封丘县| 东光县| 福泉市| 游戏| 海丰县| 芷江| 云和县| 清流县| 应城市| 龙门县| 正宁县| 宿迁市| 富顺县| 电白县| 广南县| 盐边县| 洛阳市| 临沂市| 长岛县| 会昌县| 金寨县| 西和县| 烟台市| 喀喇沁旗| 长武县| 呼和浩特市| http://444 http://444 http://444 http://444 http://444 http://444