在電話(huà)與計算機集成系統中,利用語(yǔ)音合成技術(shù)將文本轉化為語(yǔ)音,使用戶(hù)利用電話(huà)終端就可以聽(tīng)取文本的信息,對通信業(yè)務(wù)經(jīng)營(yíng)者和廣大用戶(hù)而言是必然的趨勢。
目前,在玖云平臺的業(yè)務(wù)中,有兩項業(yè)務(wù)使用到了TTS技術(shù):語(yǔ)音通知和語(yǔ)音驗證碼。
語(yǔ)音通知:批量撥打電話(huà),自動(dòng)播報用戶(hù)指定的文本信息。
語(yǔ)音驗證碼:自動(dòng)撥打電話(huà),播報用戶(hù)驗證碼。
在這倆項業(yè)務(wù)流程中,TTS負責將文本內容轉換為語(yǔ)音內容,再通過(guò)電話(huà)的方式向用戶(hù)展示內容。
TTS服務(wù)框架
在玖云平臺,我們通過(guò)如下框架提供穩定、快速、多樣化的TTS服務(wù)。

- 高效穩定:采用http模塊方式接入,數據接入穩定可靠,高并發(fā),低消耗。
- 統一入口:http url入口,接入簡(jiǎn)單,靈活方便,對外屏蔽具體的TTS接口,開(kāi)發(fā)更便捷。
- 多樣化:內部實(shí)現多種TTS接口適配,選擇多樣化。
- 部署方便:腳本化安裝部署,一條命令搞定全部安裝配置。
- 易于擴展:內部的TTS接口適配擴展方便快捷,互不影響,外部可部署NGINX,輕松實(shí)現集群化。
玖云平臺兼容常見(jiàn)的TTS接口
常見(jiàn)的TTS接口以及優(yōu)缺點(diǎn),玖云平臺目前兼容其中的大部分,根據實(shí)際需求適配切換
1,科大訊飛語(yǔ)音平臺
平臺:LINUX,WINDOWS
優(yōu)點(diǎn):穩定,速度快,TTS語(yǔ)音流暢自然
缺點(diǎn):需要安裝服務(wù)器,并且只有32位版本,收費(平臺費+并發(fā)線(xiàn)路費)
2,科大訊飛OPEN接口
平臺:LINUX,WINDOWS,ANDROID,IOS,JAVA,FLASH,WP,symbian
優(yōu)點(diǎn):有免費版本,開(kāi)發(fā)簡(jiǎn)單,平臺完善
缺點(diǎn):在線(xiàn)接口速度慢,離線(xiàn)接口收費(根據安裝數)
3,捷通華聲靈云平臺
平臺:Android,iOS,WindowsC/C++,WindowsJava
優(yōu)點(diǎn):有免費版本,開(kāi)發(fā)簡(jiǎn)單
缺點(diǎn):平臺支持少,云端速度慢,本地端安裝數受限
4,百度OPEN接口
平臺:LINUX,WINDOWS,ANDROID,IOS,JAVA,FLASH,WP,HTML5
優(yōu)點(diǎn):免費,平臺完善,TTS語(yǔ)音流暢自然
缺點(diǎn):在線(xiàn)接口速度慢,離線(xiàn)接口需要申請授權
未來(lái),TTS將會(huì )在玖云平臺發(fā)揮更大的作用,提供更多更好的平臺級應用。例如:語(yǔ)音查詢(xún),用戶(hù)通過(guò)撥打電話(huà),查詢(xún)當前賬戶(hù)的狀態(tài)、余額、關(guān)聯(lián)電話(huà)等信息。呼叫中心自動(dòng)應答機器人,根據用戶(hù)指令或語(yǔ)音(需要加入ASR語(yǔ)音識別模塊),自動(dòng)應答相關(guān)問(wèn)題。