首頁(yè)>>廠(chǎng)商>>語(yǔ)音識別與合成>>天朗語(yǔ)音

"科技成就夢(mèng)想"
――北京天朗語(yǔ)音技術(shù)有限公司市場(chǎng)部經(jīng)理劉歡采訪(fǎng)

2002/08/02

采訪(fǎng)人:記者
被采訪(fǎng)人:劉歡 天朗公司

  記者:據我所知,天朗語(yǔ)音公司的核心技術(shù)研發(fā)人員,產(chǎn)品設計人員,市場(chǎng)推廣銷(xiāo)售人員都是來(lái)自于國家863語(yǔ)音實(shí)驗室以及微軟、英特爾等國際化大企業(yè),是什么原因吸引了這么多優(yōu)秀的人才聚集到語(yǔ)音技術(shù)研究及產(chǎn)品化的這項事業(yè)中來(lái)呢?

  劉歡:語(yǔ)音技術(shù)的應用,是產(chǎn)業(yè)發(fā)展的必然。無(wú)論是PC平臺,還是高端的平臺、甚至移動(dòng)設備,各種形態(tài)的嵌入式的計算設備等等,語(yǔ)音技術(shù)都可以使冰冷的計算設備以更富友好和人性化的界面出現。我們相信,這項對人類(lèi)生活產(chǎn)生重大影響的技術(shù)必將使更多人、更多時(shí)間和更有樂(lè )趣地享受IT和計算帶來(lái)的深刻價(jià)值。尼葛洛龐帝在《數字化生存》一書(shū)中寫(xiě)到"在下一個(gè)千年里,我們會(huì )發(fā)現我們和機器說(shuō)的話(huà),與我們和人類(lèi)說(shuō)的話(huà)一樣多,或甚至比跟人類(lèi)說(shuō)的話(huà)還要多";而比爾·蓋茨在COMDEX展會(huì )上也說(shuō)道:"工業(yè)界應對語(yǔ)音識別領(lǐng)域的重大突破作好充分的準備,那將是席卷全球的另一次狂潮"。這一切都將預示著(zhù)語(yǔ)音技術(shù)的應用將為人類(lèi)未來(lái)的生活帶來(lái)巨大的變革。

  自20世紀90年代以來(lái),包括微軟、IBM等國外大企業(yè),都在語(yǔ)音領(lǐng)域加大了研發(fā)力度。語(yǔ)音技術(shù)的發(fā)展對IT業(yè),對建立高度智能的信息化社會(huì )有著(zhù)深遠的意義,語(yǔ)音技術(shù)的突破,將會(huì )在整個(gè)信息產(chǎn)業(yè)掀起一股狂潮。語(yǔ)音技術(shù),已被公認為是21世紀最有開(kāi)發(fā)潛力和應用前景的高科技技術(shù)。

  長(cháng)久以來(lái),軟件業(yè)的核心技術(shù)掌握在微軟、Oracle、IBM等國外軟件巨頭手中,甚至與我們毗鄰的印度在近10年的時(shí)間里,一躍成為除美國以外最大軟件出口國,它所生產(chǎn)的計算機軟件產(chǎn)品已遠銷(xiāo)75個(gè)國家,出口量是中國的100倍之多,2008年預計出口軟件總值將達到500億美元。

  與美國、印度等軟件大國相比,我們到底缺了什么?很顯然,國內軟件業(yè)在很長(cháng)一段時(shí)間里存在著(zhù)缺乏核心技術(shù)、科研規劃能力不強、人才流失等等一系列問(wèn)題。WTO時(shí)代的到來(lái),也正是國內軟件業(yè)大展鴻圖的契機。國家加大對軟件產(chǎn)業(yè)的扶持的力度以及重視對知識產(chǎn)權的保護,加之國內軟件本身市場(chǎng)潛力巨大以及國內軟件業(yè)具備本土化優(yōu)勢、教育高校人才云集等巨大優(yōu)勢完全可以帶動(dòng)國內軟件業(yè)的發(fā)展,當然國內軟件產(chǎn)業(yè)的提高最終還是需要自身技術(shù)的提高。

  如今,天朗公司擁有國際領(lǐng)先的核心語(yǔ)音技術(shù),有理由相信無(wú)論在傳統的IT和電信領(lǐng)域,還是在其它領(lǐng)域;我們將在不斷變化的市場(chǎng)中,提高我們自身的核心技術(shù)和核心技術(shù)適應能力。我們期望通過(guò)不斷的合作實(shí)現從今天開(kāi)始到未來(lái)的知識經(jīng)濟的時(shí)代的語(yǔ)音的科技之夢(mèng)。

  記者:語(yǔ)音技術(shù)曾一度是冷門(mén)學(xué)科,其科研工作過(guò)去也一直是在悄然中進(jìn)行,如今,雖然語(yǔ)音技術(shù)已經(jīng)達到一個(gè)相對高的水平,并正在從實(shí)驗室研究中走出來(lái),進(jìn)入一個(gè)實(shí)用化的階段,但在IT業(yè)界,相對其它軟件技術(shù)來(lái)講,語(yǔ)音在業(yè)界的聲音仍然很小,甚至,對于大多數人來(lái)說(shuō),對語(yǔ)音技術(shù)感受還是比較陌生,您是如何解釋這一現象?

  劉歡:語(yǔ)音技術(shù)包括語(yǔ)音識別和語(yǔ)音合成,而前者又比后者更難于實(shí)現。語(yǔ)音識別是指從人的語(yǔ)音波形中提取信息并確定其語(yǔ)言含義的過(guò)程。它是人機交互技術(shù)中最為關(guān)鍵,難度又很大的一個(gè)課題。語(yǔ)音識別與計算機幾乎是同時(shí)誕生,雖然有50年的研究歷史,但是要實(shí)現實(shí)質(zhì)上的突破,是被喻為和"人類(lèi)登月計劃"有著(zhù)同等難度的攻關(guān)計劃。

  機器識別語(yǔ)音難在什么地方呢?人說(shuō)話(huà)的語(yǔ)音信號是很不穩定的。不同人由于性別、年齡不同,所受的教育和性格不同,地方口音不同,說(shuō)話(huà)的輕重不同,甚至說(shuō)話(huà)時(shí)的心理、生理狀況不同等等,都會(huì )影響語(yǔ)音信號的特征,使得計算機感到對它難于琢磨。這就是專(zhuān)業(yè)術(shù)語(yǔ)所說(shuō)的語(yǔ)音信號的隨機性和多變性問(wèn)題。這種隨機性和多變性造就了語(yǔ)音本身的不定性和難懂性。

  清華-天朗語(yǔ)音科技研究中心在經(jīng)過(guò)多年的語(yǔ)音識別研究后,提出了一套新的語(yǔ)音識別模型和相應的訓練算法、識別算法。對聲學(xué)處理我們提出了一個(gè)新的語(yǔ)音識別模型,這個(gè)模型與國際上(包括國內大多數研究語(yǔ)音識別技術(shù)所使用的)流行的語(yǔ)音識別模型不同之處恰恰就在于它能夠描述于語(yǔ)音信號的隨機性和不平穩性。目前大眾對語(yǔ)音技術(shù)的陌生是很正常的,因為語(yǔ)音技術(shù)的全面深入應用是一個(gè)長(cháng)期發(fā)展的過(guò)程,語(yǔ)音技術(shù)的成熟性要分階段實(shí)現。相信經(jīng)過(guò)研究者的不斷努力,在攻克語(yǔ)音識別中的主要難題后,語(yǔ)音識別技術(shù)將對人類(lèi)的生活方式產(chǎn)生深遠的影響。

  記者:業(yè)內人士都知道:語(yǔ)音技術(shù)是被列為國家863重點(diǎn)科研攻關(guān)計劃,而清華-天朗語(yǔ)音科技研究中心作為長(cháng)期承擔國家863重點(diǎn)語(yǔ)音科研項目的研究機構,在王作英教授的帶領(lǐng)下,取得了多項科研成果。請問(wèn)天朗公司將如何把這些核心技術(shù)進(jìn)行封裝,實(shí)現產(chǎn)品化、產(chǎn)業(yè)化?同時(shí),對于語(yǔ)音行業(yè)未來(lái)的發(fā)展,天朗語(yǔ)音有一個(gè)什么樣的戰略規劃?

  劉歡:清華-天朗語(yǔ)音科技研究中心從80年代末開(kāi)始進(jìn)行語(yǔ)音識別和語(yǔ)音信號處理方面的研究。經(jīng)過(guò)十幾年的努力,取得了很多重要成果,自94年以來(lái),在國家863計劃組織的測試中連續三屆以較大優(yōu)勢獲得冠軍,代表了國內語(yǔ)音識別領(lǐng)域的最高水平。經(jīng)過(guò)近一段時(shí)間的努力,所擁有的技術(shù)目前已經(jīng)進(jìn)行了實(shí)用化和產(chǎn)品化的工作。并已經(jīng)將技術(shù)部分在飛利浦、中國電子器件總公司等投入使用。當今世界,科學(xué)技術(shù)發(fā)展日新月異,知識經(jīng)濟和理性互聯(lián)網(wǎng)的概念是主流的思想。世界各國和地區紛紛把發(fā)展高新技術(shù)產(chǎn)業(yè)作為提高經(jīng)濟競爭力的制高點(diǎn),大力增強技術(shù)創(chuàng )新能力,積極促進(jìn)科技成果商品化。核心技術(shù)的產(chǎn)品化是中國軟件產(chǎn)業(yè)必須堅持發(fā)展的道路。

  雖然,目前的語(yǔ)音識別技術(shù)還沒(méi)有達到非常理想的狀態(tài),但這并不妨礙以語(yǔ)音技術(shù)為核心的人機交流應用的發(fā)展。語(yǔ)音識別的應用是非常廣泛的,目前,語(yǔ)音識別已經(jīng)在聽(tīng)寫(xiě)機、電話(huà)查詢(xún)系統、家電控制等諸多領(lǐng)域獲得了廣泛的應用。天朗語(yǔ)音將力爭把核心語(yǔ)音識別技術(shù)深入應用到從電信、IT等領(lǐng)域,不斷擴充到消費電子、汽車(chē)、玩具、電話(huà)等和大眾生活息息相關(guān)的領(lǐng)域,讓更多的人感受到語(yǔ)音高科技所帶來(lái)的便利。如何更有效地將語(yǔ)音核心技術(shù)轉化為產(chǎn)品是我們現階段的工作重點(diǎn),同時(shí),我們將繼續研究語(yǔ)音目前存在的難題,分階段的解決這些問(wèn)題,研發(fā)出更為高端的語(yǔ)音核心技術(shù)。

  記者:自94年以來(lái),清華-天朗語(yǔ)音科技研究中心在國家863計劃組織的語(yǔ)音測試中連續三屆以較大優(yōu)勢獲得冠軍,代表了國內語(yǔ)音識別領(lǐng)域的最高水平。請問(wèn)天朗語(yǔ)音公司除了在語(yǔ)音識別技術(shù)上有優(yōu)勢以外,還有何別的競爭優(yōu)勢?

  劉歡:天朗語(yǔ)音的核心研發(fā)部門(mén)清華-天朗語(yǔ)音科技研究中心從國家開(kāi)展863計劃以來(lái),長(cháng)期承擔國家863計劃的重點(diǎn)語(yǔ)音課題,同時(shí)也為天朗語(yǔ)音提供了強大的技術(shù)后臺支持,這一點(diǎn)是天朗公司的核心競爭優(yōu)勢所在。但是,實(shí)現語(yǔ)音技術(shù)真正的產(chǎn)業(yè)化,缺少不了資本和市場(chǎng)的支持和接受。以市場(chǎng)為導向是語(yǔ)音公司能夠穩定發(fā)展的關(guān)鍵。天朗公司的投資方之一是北京市政府下屬的北京高新技術(shù)創(chuàng )業(yè)投資股份有限公司,具有豐富的高新投資經(jīng)驗的北京高新技術(shù)創(chuàng )業(yè)投資股份公司給天朗語(yǔ)音提供優(yōu)良的技術(shù)研究和開(kāi)發(fā)環(huán)境。北高投的介入為天朗語(yǔ)音提供了強大的政府資本支持,這也充分說(shuō)明政府對語(yǔ)音行業(yè)前景十分看好,對國內的語(yǔ)音事業(yè)充滿(mǎn)信心。此外,天朗語(yǔ)音的主要的產(chǎn)品化設計人員都來(lái)自英特爾、微軟等國際化企業(yè),具有豐富的產(chǎn)品設計和解決方案能力。同時(shí),天朗語(yǔ)音還擁有一個(gè)具備成熟管理經(jīng)驗的經(jīng)營(yíng)團隊,這一切都是天朗擁有的競爭優(yōu)勢。

  記者:大家都知道,美國常常將最先進(jìn)的科技運用到軍事上,而日本則往往將其應用在與百姓生活息息相關(guān)的領(lǐng)域里。那天朗呢,天朗語(yǔ)音公司今后技術(shù)發(fā)展方向及產(chǎn)品開(kāi)發(fā)方向的重點(diǎn)是什么?

  劉歡:語(yǔ)音技術(shù)的應用最重要的應用就是實(shí)現人機的自然交流。任何人、在任何時(shí)間、任何場(chǎng)所都能夠安全、方便、快捷、高效地獲取可支付得起的、豐富的、無(wú)語(yǔ)言障礙的、個(gè)性化的信息服務(wù),從而實(shí)現人與計算機的無(wú)障礙溝通。當這種溝通實(shí)現的時(shí)候,我們會(huì )在一個(gè)完全新型的計算環(huán)境和社會(huì )環(huán)境內。人們可以享受數字家庭的理想;可以利用移動(dòng)電話(huà),控制自己的家電;可以用簡(jiǎn)單的設備,實(shí)現家居的智能控制;語(yǔ)音技術(shù)的突破,使人們真正實(shí)現無(wú)障礙的地球村的夢(mèng)想。NEC公司在本次世界杯,成功的使用了由日本本國技術(shù)研發(fā)的語(yǔ)音掌上設備。這個(gè)產(chǎn)品能夠實(shí)現外國人和本國人的暢通溝通。我們期望在2008年的奧運會(huì )上我們本土的語(yǔ)音技術(shù)的應用能夠完全實(shí)現中國申辦奧運時(shí)的承諾,實(shí)現數字奧運的無(wú)障礙溝通。

  IT產(chǎn)業(yè)的迅速發(fā)展是不平衡的,主要表現在作為IT業(yè)主體技術(shù)的計算機并不是非常適合于人的操作。解決這些問(wèn)題,一直是人類(lèi)的夢(mèng)想,使這一夢(mèng)想成真是天朗人的神圣職責。

  記者:關(guān)于語(yǔ)音識別技術(shù)的發(fā)展水平及其商品化的時(shí)機問(wèn)題眾說(shuō)紛紜:有人認為語(yǔ)音識別技術(shù)商業(yè)化的時(shí)代已經(jīng)到來(lái),有人則說(shuō)還需那么三、五年時(shí)間。對此你有何看法?

  劉歡:語(yǔ)音識別技術(shù)商品化是一個(gè)過(guò)程。在《智能計算機》的有關(guān)研究中,"863智能計算機"專(zhuān)家組提出了"頂天立地"的四字方針。所謂頂天就是創(chuàng )新,立地就是要產(chǎn)業(yè)化。就技術(shù)所能夠達到的性能而言,今天的語(yǔ)音識別技術(shù)已經(jīng)能夠滿(mǎn)足許多方面的使用要求。對語(yǔ)音識別技術(shù)的應用要求是多方面的,而實(shí)現每一種應用產(chǎn)品的設計都需要解決特定的用戶(hù)需求。其中許多問(wèn)題就需要在產(chǎn)品化的過(guò)程中去解決。當然也有許多技術(shù)層面上的問(wèn)題,但是就目前而言,主要的問(wèn)題是如何把已經(jīng)達到的語(yǔ)音識別技術(shù)性能配上人性化的設計,應用到產(chǎn)品中去。語(yǔ)音技術(shù)的成熟性將會(huì )分階段實(shí)現。

  記者:聯(lián)盟一直是IT行業(yè)的一道獨特的風(fēng)景線(xiàn),而且正如您所說(shuō)到的:語(yǔ)音技術(shù)的發(fā)展是和周邊技術(shù)的發(fā)展分不開(kāi)的,那么天朗語(yǔ)音未來(lái)的發(fā)展策略是什么?

  劉歡:語(yǔ)音識別從學(xué)術(shù)上看,涉及了多種學(xué)科,屬于交叉學(xué)科的范疇;從產(chǎn)業(yè)上看,語(yǔ)音識別遍布計算領(lǐng)域。語(yǔ)音識別技術(shù)的研究不同于其他軟件技術(shù),它需要長(cháng)時(shí)間的積累,所需要的資源也是驚人的。語(yǔ)音識別技術(shù)的應用現階段的核心是語(yǔ)音技術(shù)和其他相關(guān)技術(shù)的聯(lián)合開(kāi)發(fā)。事實(shí)上,在缺乏完整的理想核心技術(shù)解決方案的現階段,應用技術(shù)和核心技術(shù)的聯(lián)合開(kāi)發(fā)將是非常重要的。

  語(yǔ)音產(chǎn)業(yè)離不開(kāi)應用的開(kāi)發(fā),離不開(kāi)解決方案的開(kāi)發(fā),離不開(kāi)運營(yíng)商的支持和理解。天朗語(yǔ)音的模式非常簡(jiǎn)單清楚:采用多贏(yíng)的合作模式,注重多領(lǐng)域的聯(lián)盟和適合客戶(hù)和市場(chǎng)的應用方案開(kāi)發(fā)。

  我們期望通過(guò)我們的核心技術(shù),和所有的應用開(kāi)發(fā)商聯(lián)合,共同開(kāi)發(fā)適合各種領(lǐng)域的應用產(chǎn)品,并提供部分解決方案和技術(shù)支持。同時(shí)我們將全力配合其它語(yǔ)音應用廠(chǎng)商和語(yǔ)音應用的運營(yíng)商全力推廣自身的產(chǎn)品。目前,天朗公司已和多家國際、國內高科技公司建立了戰略聯(lián)盟。唯有國內的企業(yè)、廠(chǎng)商都聯(lián)合起來(lái),結成統一戰線(xiàn),合作聯(lián)盟,才能攜手共創(chuàng )知識經(jīng)濟時(shí)代的科技之夢(mèng)!

天朗語(yǔ)音公司供稿 CTI論壇編輯



相關(guān)鏈接:
天朗分布式語(yǔ)音識別系統在語(yǔ)音門(mén)戶(hù)中的使用 2003-10-13
天朗分布式語(yǔ)音識別系統改造傳統IVR 2003-10-10
天朗分布式語(yǔ)音識別系統產(chǎn)品白皮書(shū) 2003-09-27
鍵盤(pán)漸成擺設,未來(lái)手機一呼通 2003-09-22
天朗語(yǔ)音成功開(kāi)發(fā)出分布式語(yǔ)音識別系統 2003-09-19

分類(lèi)信息:     新聞頻道   文摘   技術(shù)_語(yǔ)音識別_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 界首市| 沁源县| 鄂伦春自治旗| 阿拉尔市| 靖江市| 江源县| 东港市| 厦门市| 丰宁| 鞍山市| 鹤山市| 左云县| 张掖市| 龙泉市| 福贡县| 临猗县| 洪江市| 额敏县| 海城市| 和林格尔县| 重庆市| 英超| 五台县| 旬邑县| 尖扎县| 屯门区| 陆河县| 乌拉特前旗| 泽普县| 建水县| 获嘉县| 四平市| 蓝田县| 衡阳县| 云霄县| 白沙| 丹东市| 驻马店市| 大石桥市| 上饶市| 汶上县| http://444 http://444 http://444 http://444 http://444 http://444