首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>>科大訊飛

CTI論壇專(zhuān)訪(fǎng)>>企業(yè)專(zhuān)訪(fǎng)

專(zhuān)訪(fǎng)科大訊飛吳曉如:語(yǔ)音與移動(dòng)互聯(lián)網(wǎng)共舞

曹建菊 2010/10/29

  10月28號的北京,秋日的陽(yáng)光分外燦爛,將西山的輪廓勾勒得格外清晰。位于西三環(huán)邊的香格里拉飯店,人聲鼎沸,科大訊飛“語(yǔ)音云”發(fā)布會(huì )選擇這里舉行。

  此次發(fā)布會(huì )與高速發(fā)展的移動(dòng)互聯(lián)網(wǎng)背景密不可分,移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)規模達到桌面互聯(lián)網(wǎng)十倍以上速度遞增。而在互聯(lián)網(wǎng)時(shí)代,社會(huì )變得越來(lái)越小,語(yǔ)音技術(shù)使開(kāi)車(chē)走路等移動(dòng)狀況下使用互聯(lián)網(wǎng)成為可能。數據表明,目前中國的8億手機用戶(hù)中,已經(jīng)有將近2億的移動(dòng)互聯(lián)網(wǎng)用戶(hù),到2012年,中國3G用戶(hù)也將超過(guò)2億以上,如此巨大規模的用戶(hù)群,為中國移動(dòng)互聯(lián)網(wǎng)的發(fā)展提供了源源不斷的動(dòng)力和持續成長(cháng)的舞臺。

  在這個(gè)大的發(fā)展趨勢中,對語(yǔ)音技術(shù)的投入力度和市場(chǎng)關(guān)注度前所未有,如IBM,微軟、蘋(píng)果以及Google都有對語(yǔ)音的規劃,IBM提出要把他的語(yǔ)音技術(shù)推向市場(chǎng),微軟在多種場(chǎng)合下提出來(lái),他未來(lái)看好的三大產(chǎn)業(yè)第一就是語(yǔ)音技術(shù),并且微軟即將推出來(lái)的Window7,也已經(jīng)把語(yǔ)音作為非常重要的一部分,而蘋(píng)果也正在研發(fā)語(yǔ)音識別技術(shù)等等。應該說(shuō)國際IT巨頭在中文語(yǔ)音領(lǐng)域,在全球范圍內對語(yǔ)音產(chǎn)業(yè)的高度關(guān)注,既促進(jìn)了這個(gè)產(chǎn)業(yè)快速的發(fā)展,也為我們中國語(yǔ)音企業(yè)提出了更大的挑戰。

  同時(shí),“云計算”一出世,就引起了行業(yè)人士的關(guān)注,而語(yǔ)音技術(shù)與呼叫中心的結合運用,更是大家期待的。科大訊飛此次推出“語(yǔ)音云”,是概念的重新整合還是標志著(zhù)一項新技術(shù)的誕生?如果是一項新的技術(shù),除了呼叫中心的應用之外,是否還能在別的領(lǐng)域帶給大家驚喜?這個(gè)新領(lǐng)域應用是否已有一些成果?

  為此,利用“語(yǔ)音云”發(fā)布會(huì )正式開(kāi)始前的間隙,CTI論壇記者專(zhuān)訪(fǎng)了科大訊飛高級副總裁吳曉如博士。

科大訊飛高級副總裁吳曉如博士  
上圖為:科大訊飛高級副總裁吳曉如博士

  1、CTI論壇記者:請您談?wù)効拼笥嶏w此次推出的“語(yǔ)音云”是一個(gè)新概念還是一項新技術(shù)?

  吳曉如:“訊飛語(yǔ)音云”,實(shí)際上是基于云計算技術(shù)作為基礎,將業(yè)界領(lǐng)先的智能語(yǔ)音技術(shù)向廣大移動(dòng)互聯(lián)網(wǎng)開(kāi)發(fā)者開(kāi)放,為各類(lèi)合作伙伴提供低門(mén)檻的語(yǔ)音合成、語(yǔ)音識別以及語(yǔ)音聽(tīng)寫(xiě)等智能語(yǔ)音交互式服務(wù)。

  而合作伙伴方面,可以像使用水、電那樣“即開(kāi)即有、按需取用”,非常方便。以前的合作開(kāi)發(fā),可能需要半年甚至幾年的時(shí)間,才能開(kāi)發(fā)一個(gè)應用,而現在,可以做到一、兩個(gè)月,甚至幾天就可以開(kāi)發(fā)一個(gè)新應用。也就是方便了合作伙伴,能在極短的時(shí)間內構建一個(gè)支持自然語(yǔ)音交互功能的特色移動(dòng)互聯(lián)網(wǎng)應用。

  另外,“訊飛語(yǔ)音云”的推出,還有一個(gè)重要的突破,就是將打破相關(guān)語(yǔ)音服務(wù)在本地調用時(shí),受本地資源條件限制,可實(shí)現的應用少、應用效果不盡人意的瓶頸,從而能有效培育和進(jìn)一步催生用戶(hù)需求,形成應用、市場(chǎng)、用戶(hù)各方面的良性互動(dòng)與促進(jìn)作用,推動(dòng)語(yǔ)音市場(chǎng)的發(fā)展。

  2、CTI論壇記者: 面向呼叫中心的中文語(yǔ)音合成技術(shù)近年來(lái)的發(fā)展水平?

  吳曉如:應該說(shuō)這十年的語(yǔ)音技術(shù)發(fā)展是相當快的,如果將中國一個(gè)最出色播音員的普通話(huà)作為滿(mǎn)分5分的話(huà),在2000年以前,我們還達不到3分, 2005年前后,我們能達到3.8分,而現在,我可以自豪地說(shuō),我們能達到4.5分了。4.5分是個(gè)什么概念,打個(gè)比方,比如咱倆的普通話(huà)標準可能只能達到4分左右。而我們的語(yǔ)音已經(jīng)能達到4.5分,比咱倆水平高。

  3、CTI論壇記者:如您上面所說(shuō),科大訊飛的語(yǔ)音合成技術(shù)早已公認為處于業(yè)界領(lǐng)先水平,但在語(yǔ)音識別方面有哪些競爭優(yōu)勢呢?

  吳曉如:科大訊飛有三個(gè)方面的優(yōu)勢,可以說(shuō)是全世界都比不了的。

  第一個(gè)優(yōu)勢是我們有龐大的語(yǔ)音庫,這個(gè)語(yǔ)音庫的容量已經(jīng)達到百萬(wàn)級。科大訊飛與國家教育部合作,是全國普通話(huà)測試協(xié)助商,大家都知道:全國每年都會(huì )有國家公務(wù)員、教師等職位必須進(jìn)行普通話(huà)考試,考試的所有語(yǔ)音數據我們都會(huì )存貯,可以說(shuō),我們有全中國每個(gè)省、每個(gè)市、甚至每個(gè)縣、每個(gè)鎮的基礎語(yǔ)音數據庫。

  第二個(gè)優(yōu)勢是科大訊飛的技術(shù)是產(chǎn)學(xué)研一體化的,我們與清華大學(xué)、中國科技大學(xué)、新疆大學(xué)等語(yǔ)音研究室進(jìn)行合作,可以說(shuō)語(yǔ)音研發(fā)的先進(jìn)技術(shù)能夠很好的得到應用體現。

  第三,我們采用了云計算平臺,上面說(shuō)的百萬(wàn)數據如何為我所用?我們對數據反復進(jìn)行研究,建立復雜的數學(xué)模型,這些都要求工程運算能力極強。

  4、CTI論壇記者: 語(yǔ)音識別在呼叫中心的應用價(jià)值體現?而目前在國內還未大規模應用,主要是什么原因?

  吳曉如:我覺(jué)得語(yǔ)音識別在呼叫中心的應用價(jià)值體現是顯而易見(jiàn)的,但最大體現在以下兩點(diǎn):
一是我們可以進(jìn)行自助語(yǔ)音服務(wù),這部分的服務(wù)現在已經(jīng)在銀行、保險及運營(yíng)商的客戶(hù)服務(wù)中心得到了良好的體驗;

  二是語(yǔ)音是一種非結構化的信息源,現在對語(yǔ)音的檢索還沒(méi)有用起來(lái),大段大段的語(yǔ)音,其實(shí)有很多是很有價(jià)值的資源,因為不象文字那么容易檢索,因而這部分的資源都沒(méi)有得到合理的應用。挖出有價(jià)值的語(yǔ)音信息,這是語(yǔ)音的另一個(gè)應用價(jià)值體現。

  但目前在國內,語(yǔ)音技術(shù)還沒(méi)有大規模應用起來(lái),主要原因是客戶(hù)的需求不是太迫切,另外,呼叫中心一般是成本中心,而且,呼叫中心對技術(shù)的成熟度要求很高,客戶(hù)可以用不是太方便的,但一定要用不能出問(wèn)題的。前幾年的語(yǔ)音技術(shù)還達到這個(gè)標準。現在的技術(shù)已經(jīng)能解決這個(gè)問(wèn)題。

  5、CTI論壇記者:訊飛語(yǔ)音識別的核心技術(shù)是什么?

  吳曉如:訊飛語(yǔ)音識別的核心主要有三大技術(shù):

  一是區分性訓練技術(shù):上面提到過(guò),我們有上百萬(wàn)的基礎語(yǔ)音數據庫,這么龐大的語(yǔ)音數據需要進(jìn)行區分;

  二是超大規模的解碼技術(shù):經(jīng)過(guò)對聲音區分性訓練后,建立復雜的數據模型,需要有超大規模的解碼技術(shù);

  三是有語(yǔ)音自適應技術(shù):當某些語(yǔ)音識別不了,進(jìn)行多次重復識別,識別率會(huì )更高。

  6、CTI論壇記者:科大訊飛未來(lái)的戰略的是什么?

  吳曉如:語(yǔ)音技術(shù)和產(chǎn)業(yè)一直是世界各國競相競爭的熱點(diǎn)和焦點(diǎn),而科大訊飛作為一家民族語(yǔ)音企業(yè),我們具有非常好的機遇及發(fā)展壯大中國語(yǔ)音產(chǎn)業(yè)的責任。

  “語(yǔ)音是文化的基礎,民族的象征”,智能語(yǔ)音技術(shù)不僅擁有廣闊的應用空間,還在國防軍事、漢語(yǔ)國際推廣、教育等國家重大戰略需求領(lǐng)域有著(zhù)重大應用價(jià)值。而移動(dòng)互聯(lián)網(wǎng)邁入語(yǔ)音時(shí)代、云計算時(shí)代,我們將語(yǔ)音與移動(dòng)互聯(lián)網(wǎng)結合,相信會(huì )對我國移動(dòng)互聯(lián)網(wǎng)語(yǔ)音應用及信息安全產(chǎn)生推動(dòng)作用。

  另外,科大訊飛不僅局限于中文領(lǐng)域,而且在英文技術(shù)領(lǐng)域方面也予以開(kāi)拓。

  CTI論壇記者:預祝此次科大訊飛“語(yǔ)音云”發(fā)布會(huì )圓滿(mǎn)成功!

  吳曉如博士簡(jiǎn)介:安徽科大訊飛信息科技股份有限公司高級副總裁,負責訊飛語(yǔ)音技術(shù)在電話(huà)和網(wǎng)絡(luò )上的業(yè)務(wù)。研究興趣為語(yǔ)音合成和語(yǔ)音識別等智能語(yǔ)音技術(shù)。曾參加了多個(gè)國家重點(diǎn)科研項目。2003、2004年度主持開(kāi)發(fā)了代表當年中文語(yǔ)音最高水平的中文語(yǔ)音合成系統,2006年主持開(kāi)發(fā)的英文語(yǔ)音合成系統獲得國際英文語(yǔ)音合成大賽第一名。此外,吳曉如長(cháng)期致力于推動(dòng)語(yǔ)音技術(shù)的應用深化,目前語(yǔ)音應用已覆蓋了電信、金融、電力等社會(huì )信息服務(wù)的各領(lǐng)域,鑒于在智能語(yǔ)音技術(shù)及其成果應用推廣方面所作的工作,吳曉如于2002年度獲國家科技進(jìn)步獎,2006年獲得信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎,2007年獲信息產(chǎn)業(yè)部先進(jìn)個(gè)人;

  聲明:CTI論壇(CTiforum)版權作品,未經(jīng)CTiforum書(shū)面授權,嚴禁轉載,違者將被追究法律責任。

CTI論壇報道



相關(guān)閱讀:
科大訊飛“語(yǔ)音云”發(fā)布 移動(dòng)互聯(lián)網(wǎng)邁入語(yǔ)音時(shí)代 2010-10-29
科大訊飛董事長(cháng)劉慶峰介紹語(yǔ)音云概念 2010-10-29
擬定增募資4.2億 科大訊飛加速語(yǔ)音技術(shù)產(chǎn)業(yè)化 2010-10-28
科大訊飛發(fā)布新產(chǎn)品“訊飛語(yǔ)音云” 2010-10-28
科大訊飛連續三年獲中國IP通信大獎 2010-10-14

熱點(diǎn)專(zhuān)題:  呼叫中心  語(yǔ)音合成TTS 語(yǔ)音識別ASR    移動(dòng)增值   移動(dòng)互聯(lián)網(wǎng)
分類(lèi)信息:  移動(dòng)增值_與_移動(dòng)互聯(lián)網(wǎng)  移動(dòng)增值_與_呼叫中心  移動(dòng)增值_與_企業(yè)  移動(dòng)互聯(lián)網(wǎng)_與_移動(dòng)
相關(guān)頻道:  增值電信文摘    
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 乌兰浩特市| 安多县| 克山县| 柳林县| 阿瓦提县| 同心县| 博客| 峡江县| 金溪县| 瓦房店市| 新密市| 邻水| 加查县| 卓尼县| 博客| 勐海县| 德阳市| 鄂州市| 桦南县| 固原市| 巧家县| 水城县| 曲阜市| 陆河县| 星子县| 兴城市| 吉隆县| 丁青县| 龙胜| 临邑县| 石城县| 广州市| 长治县| 鲁山县| 阳原县| 沂源县| 陵川县| 特克斯县| 左云县| 民和| 南宫市| http://444 http://444 http://444 http://444 http://444 http://444