合成語(yǔ)音走向商用化
曉波 2001/08/02
7月18日,對于捷通華聲來(lái)說(shuō),是一個(gè)特別的日子。在這天,公司發(fā)布了最新的、語(yǔ)音質(zhì)量自然的TTS(文本轉語(yǔ)音技術(shù)),吸引了CTI和相關(guān)應用領(lǐng)域的眾多廠(chǎng)商代表。
在介紹捷通華聲的TTS技術(shù)之前,公司總經(jīng)理張連毅先生不止一次談到當年北京市長(cháng)熱線(xiàn)的建設情況。在當時(shí),系統集成商考慮到市長(cháng)熱線(xiàn)的內容會(huì )經(jīng)常變化,如果采用錄音播放,可能在時(shí)間緊急時(shí)來(lái)不及重新錄音;如果采用TTS技術(shù),只需改變文本內容,就簡(jiǎn)單得多了。所以,集成商采用了TTS技術(shù)。未曾想,在系統驗收時(shí),由于合成語(yǔ)音的質(zhì)量差被否定,只好連夜找人重新錄音。張總說(shuō)出了長(cháng)期阻礙TTS技術(shù)商用的一個(gè)原因,就是合成的語(yǔ)音質(zhì)量太差,不能為人們所接受。也因為此,捷通華聲為自己的新品推出組織了一個(gè)大型發(fā)布會(huì ),因為他們相信公司的TTS合成的語(yǔ)音質(zhì)量自然、流利。而事實(shí)上,會(huì )前采用TTS技術(shù)播放的新聞,就被不少人誤認為是錄音播放。
專(zhuān)注TTS和語(yǔ)音技術(shù)
看到語(yǔ)音技術(shù)的前景,眾多IT巨頭和公司加入市場(chǎng)的逐角。僅僅在漢語(yǔ)識別和合成領(lǐng)域,就聚集了微軟、Intel、Motorola、IBM、PHILIPS、松下等公司。而作為一家民營(yíng)企業(yè),捷通執著(zhù)地認為,漢語(yǔ)語(yǔ)音技術(shù)應該掌握在中國人自己手中,特別是在得知國內某家大型通信公司采用由以色列一家公司開(kāi)發(fā)完成的中文語(yǔ)音合成技術(shù),進(jìn)行電話(huà)查詢(xún)及聲訊業(yè)務(wù),而每一條電話(huà)線(xiàn)的技術(shù)使用費需要1萬(wàn)元/年之后,他更是這樣認為。
捷通為了加強在語(yǔ)音技術(shù)方面的研發(fā)實(shí)力,于去年聯(lián)合著(zhù)名語(yǔ)音技術(shù)專(zhuān)家呂士楠先生,共同投資創(chuàng )辦了專(zhuān)門(mén)從事漢語(yǔ)語(yǔ)音技術(shù)研究和應用的捷通華聲語(yǔ)音公司。由呂先生親自主持捷通華聲語(yǔ)音研發(fā)中心,并在TTS技術(shù)上不斷創(chuàng )新。去年2月,捷通的TTS實(shí)現了中英文混讀的功能;去年5月,實(shí)現語(yǔ)音合成技術(shù)在嵌入式操作系統中的移植;今年7月,推出語(yǔ)音質(zhì)量自然的語(yǔ)音合成系統。
應用在CTI領(lǐng)域
作為提供語(yǔ)音產(chǎn)品和平臺的廠(chǎng)商,捷通主要專(zhuān)注在三個(gè)領(lǐng)域:CTI領(lǐng)域、獨立軟件產(chǎn)品和嵌入式操作系統。由于公司TTS音庫大小可調節,可應用于不同的系統。對于CTI等大型應用系統,其語(yǔ)音庫約為2G
大小,語(yǔ)音質(zhì)量較高,而且自然;對于PC應用,語(yǔ)音庫壓縮為1.5~2M,但語(yǔ)音質(zhì)量沒(méi)有太大損傷,為PC個(gè)人用戶(hù)服務(wù);對于嵌入式操作系統以及掌上終端應用,語(yǔ)音庫大小為1M。
捷通TTS在CTI行業(yè)中的應用提供四種解決方案:電話(huà)智能語(yǔ)音中心、語(yǔ)音服務(wù)器方案、本地接口調用、離線(xiàn)合成。
電話(huà)智能語(yǔ)音中心
提供CTI可視化制作系統,由維護端和監視管理端兩部分組成,使用戶(hù)無(wú)需編程,就可完成簡(jiǎn)單的、計算機電話(huà)語(yǔ)音集成功能。該方案適用于簡(jiǎn)單的CTI應用,如中小企業(yè)的咨詢(xún)服務(wù)、統計調查,以及金融、工商、稅務(wù)、醫院等行業(yè)。
TTS語(yǔ)音服務(wù)器方案
直接提供裝載有捷通TTS語(yǔ)音服務(wù)系統的服務(wù)器,與現有的聲訊服務(wù)相平行,接受其指令和文字數據流,合成產(chǎn)生語(yǔ)音數據流返給原系統,適用于電信、大型企業(yè)CTI系統及聲訊臺改造、升級,如160、168等聲訊臺、UMS統一信息服務(wù)系統、呼叫中心等。
支持嵌入式系統
與其他文語(yǔ)轉換系統相比,捷通的TTS技術(shù)具有音庫壓縮特點(diǎn),從而使TTS技術(shù)向嵌入式操作系統的移植(尤其是向PDA上的移植)具備先決條件。同時(shí),捷通TTS技術(shù)在大規模真實(shí)錄音語(yǔ)音庫的基礎上,增加了音庫壓縮算法和音色變換算法形成核心技術(shù),音庫大小可縮擴,小音庫為1MB,適合基于嵌入式操作系統的應用。
針對嵌入式系統的應用,捷通提供了TTS開(kāi)發(fā)工具包CE版本,提供掌上電腦上的語(yǔ)音合成應用,即語(yǔ)音伴侶CE版本。
在TTS技術(shù)的基礎上,捷通將以語(yǔ)音合成技術(shù)為核心,逐步發(fā)展語(yǔ)音識別、自然語(yǔ)言理解、模式識別等人工智能處理技術(shù)。
摘自中國計算機報
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無(wú)怯步 2008-04-16 |
捷通華聲TTS成功登陸中國郵政儲蓄銀行 2008-04-03 |
捷通華聲 jTTS 5.5 全面支持 MRCPv2標準 2008-03-31 |
捷通華聲移動(dòng)導航HCI解決方案廣受青睞 2008-03-26 |
身邊的“智能”生活 2007-12-28 |