TTS與語(yǔ)音識別軟件
2001/12/17
TTS(text to speech),又稱(chēng)為文語(yǔ)轉換或機器朗讀系統。
ASR(Automatic Speech Recognization)又稱(chēng)語(yǔ)音識別系統。
三匯公司最早于1995年開(kāi)發(fā)成功第一代漢字語(yǔ)音庫,該語(yǔ)音庫采用真人錄音,并附加了漢字文本與相應語(yǔ)音之間的檢索表,可以實(shí)現簡(jiǎn)單的TTS應用。1999年三匯與IBM公司合作,成為IBM中文語(yǔ)音識別系統在國內最早的推廣應用者。
三匯關(guān)于中文TTS和語(yǔ)音識別的軟件產(chǎn)品有:
漢字語(yǔ)音庫
真人發(fā)音,支持全部的漢字發(fā)音,并提供二級字符內碼與語(yǔ)音庫偏移量的索引表。可用于簡(jiǎn)單的TTS應用,例如播放數字、人名、地名、股票名稱(chēng)等。提供C語(yǔ)言編程示例源代碼,適用于任何操作系統和任何語(yǔ)音卡。
中文TTS系統
完整的中文TTS系統,具有海量詞庫,能正確識別多音字,能正確掌握朗讀的語(yǔ)調和節奏。采用可選的男聲或女聲真人發(fā)音,可調的音量、語(yǔ)速和語(yǔ)調,具有較好的真實(shí)感,主觀(guān)可懂度大于99%。適用于IVR系統的語(yǔ)音提示,有聲EMAIL系統,大容量新聞信息發(fā)布等應用,可以省去繁瑣的預先錄音工作,支持全部型號的三匯語(yǔ)音卡。
系統可工作于預先合成和實(shí)時(shí)動(dòng)態(tài)合成兩種方式,采用客戶(hù)/服務(wù)器結構支持多通道大容量系統。
支持操作系統:
WINDOWS NT 4.0
WINDOWS 2000
使用編程工具:
VB、VC、BC、VF、PB、DELPHI等,提供豐富的編程序查源代碼。
IBM Viavoice Telephoney中文電話(huà)語(yǔ)音識別系統
三匯語(yǔ)音卡為國內最早集成IBM ViaVoice Telephony語(yǔ)音識別系統的公司,應用最成熟,是IBM公司在國內語(yǔ)音識別領(lǐng)域最重要的合作伙伴和系統經(jīng)銷(xiāo)商。所有三匯語(yǔ)音卡均支持IBM ViaVoice Telephony語(yǔ)音識別系統,同時(shí)該系統也為使用者提供了一個(gè)開(kāi)放式的語(yǔ)音識別引擎和完善的應用開(kāi)發(fā)環(huán)境,用戶(hù)可以方便快捷地在電話(huà)系統中集成語(yǔ)音識別功能,為聲訊服務(wù)系統、電子商務(wù)平臺和涉及電話(huà)通信的語(yǔ)音應用系統提供語(yǔ)音交互界面。
性能特點(diǎn):
◆語(yǔ)音識別引擎采用實(shí)際電話(huà)信道的語(yǔ)音樣本,連續語(yǔ)音識別率高。
◆語(yǔ)音識別引擎沒(méi)有特定授話(huà)人的限制,對于各種不同信噪比的電話(huà)信道均具有很好的適應性。
◆電話(huà)語(yǔ)音應用系統伸縮性較強,不僅可以運行在單機系統上,而且可以擴展為多引擎、多服務(wù)器的大型企業(yè)級應用。
◆語(yǔ)音合成自然清晰,易于理解。
◆語(yǔ)音識別引擎可以辨識無(wú)限量的詞匯表。
◆輸入語(yǔ)音即可添加詞匯,也可以在系統運行狀態(tài)下對詞匯集進(jìn)行動(dòng)態(tài)添加,添加方法靈活。
◆與硬件無(wú)關(guān)的C/C++應用編程接口,可以方便地掛接語(yǔ)音識別引擎和語(yǔ)音合成引擎。
◆可以輸出不同候選結果及相似度得分。
杭州三匯公司供稿 CTI論壇編輯
ADI Blackfin推出適合三匯的VoIP電話(huà)和呼叫中心方案 2009-05-11 |
杭州三匯榮獲CIPCA 2008中國IP通信大獎 2008-10-08 |
三匯成功開(kāi)發(fā)高性能真人接聽(tīng)檢測算法助推外撥應用 2008-08-26 |
三匯新一代C型傳真卡撼市登場(chǎng) 2008-05-15 |
三匯ATP-24A新型模擬錄音產(chǎn)品問(wèn)世 2008-05-05 |