11月28日,捷通華聲宣布靈云開(kāi)放平臺推出多語(yǔ)種語(yǔ)音合成(簡(jiǎn)稱(chēng)TTS)技術(shù),全面支持中文、英語(yǔ)、法語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、阿拉伯語(yǔ)、德語(yǔ)、葡萄牙語(yǔ)、日語(yǔ)、韓語(yǔ)、泰語(yǔ)等11種語(yǔ)言,覆蓋全球90%以上的國家和地區。這也是捷通華聲推出覆蓋92種語(yǔ)言的手寫(xiě)識別(HWR)技術(shù)之后的另一項重大突破。目前,靈云多語(yǔ)種TTS已經(jīng)在靈云開(kāi)放平臺全面開(kāi)放使用。
語(yǔ)音合成即TTS(Text to Speech)技術(shù),又稱(chēng)文語(yǔ)轉換技術(shù),能將任意文本信息實(shí)時(shí)轉化為標準流暢的語(yǔ)音朗讀,簡(jiǎn)單講就是讓“機器開(kāi)口講話(huà)”。通過(guò)TTS技術(shù),計算機可以在任何時(shí)候將任意文本“輕松”轉換成具有高自然度的語(yǔ)音,從而真正實(shí)現讓機器“像人一樣開(kāi)口說(shuō)話(huà)”。
2011年12月08日,捷通華聲創(chuàng )造性推出了全球第一個(gè)最大、最全的智能人機交互(HCI)技術(shù)開(kāi)放平臺 — 靈云。靈云是一種可以用語(yǔ)音、手寫(xiě)、拍照、手勢,將來(lái)甚至可使用腦波識別等智能手段來(lái)操作、感知手機、計算機等數字設備的網(wǎng)絡(luò )云服務(wù),發(fā)展目標是讓人機交互像人與人溝通一樣的簡(jiǎn)單自然。靈云以“云 + 端”方式,為中國整個(gè)信息產(chǎn)業(yè)領(lǐng)域提供語(yǔ)音合成(TTS)、語(yǔ)音識別(ASR)、手寫(xiě)識別(HWR)、光學(xué)字符識別(OCR)和自然語(yǔ)言理解(NLU)等多項核心技術(shù)能力。自靈云推出以來(lái),靈云開(kāi)放平臺與超過(guò)千家企業(yè)形成合作伙伴關(guān)系,為各行各業(yè)企業(yè)提供了全方位HCI技術(shù)支撐。兩年來(lái),靈云智能語(yǔ)音等HCI技術(shù)助力并通過(guò)百度導航、導航犬、搜狗地圖、嘀嘀打車(chē)、漢字英雄、天行聽(tīng)書(shū)、觸寶輸入法、百度PC輸入法、天行輸入法等家喻戶(hù)曉的移動(dòng)應用服務(wù)大眾,為超過(guò)近3億社會(huì )大眾提供輕松、便捷的HCI技術(shù)服務(wù)。
值得指出的是,此次捷通華聲靈云推出多語(yǔ)種語(yǔ)音合成技術(shù)云服務(wù),與兩周前推出的覆蓋92種語(yǔ)言手寫(xiě)識別技術(shù),可謂“珠聯(lián)璧合”,說(shuō)明靈云平臺已開(kāi)始具備服務(wù)全球的基本能力,為助力中國企業(yè)進(jìn)軍國際市場(chǎng)、全面參與國際競爭做好越來(lái)越充足的HCI技術(shù)能力支撐準備。相信也會(huì )對促進(jìn)中國與國際間的交流合作做出貢獻。
靈云平臺是一個(gè)開(kāi)放的平臺,也是一個(gè)企業(yè)間合作的平臺。未來(lái)發(fā)展,捷通華聲靈云將在發(fā)揮智能語(yǔ)音等多項HCI技術(shù)優(yōu)勢的基礎上,不斷與國內外學(xué)術(shù)界、產(chǎn)業(yè)界、包括國際跨國企業(yè)進(jìn)行合作,力爭通過(guò)全球范圍的合作,為世界各國用戶(hù)提供更多、更好、更全面的HCI技術(shù)能力,將合作共贏(yíng)的理念通過(guò)HCI技術(shù)融入中國IT產(chǎn)業(yè),也融入世界!