首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音識別(ASR)  語(yǔ)音識別產(chǎn)品

智能識別領(lǐng)域的新三國演義

周速華 2003/03/31

  微軟之傷

  盡管在平臺軟件方面取得了壟斷性地位,但是微軟的創(chuàng )始人、現任微軟董事長(cháng)兼首席軟件設計師比爾.蓋茨卻并不滿(mǎn)足,因為他有一個(gè)夢(mèng)想-Natural Computing(指用戶(hù)可以用最自然的方法進(jìn)行操作的電腦環(huán)境)。

  為了這個(gè)目標,微軟已經(jīng)努力了很久。幾年前微軟推出了“Windows for Pen Computing”, 但在經(jīng)歷過(guò)多次嘗試后以失敗告終;兩年前,微軟又提出了“Tablet PC”的概念;不久前,微軟聯(lián)合幾大知名硬件廠(chǎng)商推出了實(shí)質(zhì)性的產(chǎn)品。如此種種,足以表明已在操作系統領(lǐng)域處于領(lǐng)導地位的微軟正朝Natural Computing步步逼近。

  在此過(guò)程中,困擾微軟最大的問(wèn)題是自然語(yǔ)言的識別技術(shù),包括文字輸入、語(yǔ)音輸入等技術(shù)。在智能識別技術(shù)上,微軟并不占據領(lǐng)先地位。目前在語(yǔ)音輸入和中文手寫(xiě)輸入占據領(lǐng)導地位的分別是IBM和中國的漢王公司,微軟要想搶占智能輸入的制高點(diǎn)就必須向這兩家公司發(fā)起挑戰。

  智能輸入和識別的未來(lái)

  智能識別到底有何魅力,使得計算機軟件領(lǐng)域的首席代表如此尷尬不已?

  人與計算機的交互一直是困擾廠(chǎng)商和用戶(hù)的一個(gè)難題。隨著(zhù)技術(shù)的不斷發(fā)展,人機交互日臻完美已經(jīng)不再停留在各種構想的可行性討論階段,結合計算機系統和生物系統,人們構想的各種交互方式已經(jīng)成為可能。

  試想一下,當我們手中的鋼筆成為最常用的輸入設備,成為替代軟盤(pán)的存儲介質(zhì)時(shí),你有什么樣的感慨?生活真的可以如此方便簡(jiǎn)單,它可以比傳統臺式和筆記本計算機更迅速快捷地記錄下我們思維中瞬間的閃光點(diǎn)。

  盡管人機交互的探討一直沒(méi)有定論,但是“語(yǔ)音加筆輸入”的輸入方式必是未來(lái)的人機界面的發(fā)展趨勢。隨著(zhù)信息技術(shù)的發(fā)展,人們正在逐漸擺脫線(xiàn)纜和體積的束縛,對于任何需要交互的設備來(lái)說(shuō),信息輸入都是必不可少的,而語(yǔ)音和筆輸入無(wú)疑是最理想的輸入方式。

  目前在智能終端設備上,手寫(xiě)輸入已經(jīng)全面普及。中高端掌上電腦基本上都具備了手寫(xiě)輸入的功能;具備手寫(xiě)輸入功能的智能手機也不斷面市,如索尼和愛(ài)立信聯(lián)合推出的P802手機,多普達推出的Pocket PC手機等都可成為見(jiàn)證。

  而語(yǔ)音輸入在我們的日常家居中更為普遍。采用語(yǔ)音輸入的基于嵌入式操作系統的智能家居設備已經(jīng)走出了實(shí)驗室;通過(guò)語(yǔ)音來(lái)控制家里的家電如燈光的亮度、空調的開(kāi)關(guān)都已經(jīng)成為可能。

  智能輸入使我們忙碌的生活變得精彩和簡(jiǎn)單,也給某些特殊的人群帶去福音。對于老年人而言,手寫(xiě)輸入使得他們能夠親自體驗信息技術(shù)的便利;而對于殘疾人來(lái)說(shuō),語(yǔ)言和手寫(xiě)輸入無(wú)疑便實(shí)現了其最大的價(jià)值。

  IBM和漢王領(lǐng)跑

  IBM在語(yǔ)音輸入方面的霸主地位不容否認,IBM在語(yǔ)音識別領(lǐng)域的研究也已有20多年的歷史,最近它又宣布將語(yǔ)音引擎放到Radhat的Linux中。在美國,IBM語(yǔ)音識別產(chǎn)品ViaVoice的銷(xiāo)量達到百萬(wàn)套以上。IBM通過(guò)持續的研發(fā)在最近的兩三年已經(jīng)取得了突破性的進(jìn)展,識別率接近95%。IBM希望將語(yǔ)音識別將從簡(jiǎn)單的聽(tīng)寫(xiě),發(fā)展到更廣的應用領(lǐng)域,人們將可以做到與計算機的真正對話(huà)。

  與此同時(shí),IBM也致力于將語(yǔ)音識別技術(shù)應用到PDA等移動(dòng)設備之中。由于通過(guò)鍵盤(pán)鼠標輸入不適用于移動(dòng)計算環(huán)境,因而在移動(dòng)計算領(lǐng)域,語(yǔ)音輸入具有極大的發(fā)展潛力。但移動(dòng)設備的資源通常比較有限,在這樣有限的空間內要集成語(yǔ)音識別技術(shù)有相當大的難度,而這也是語(yǔ)音技術(shù)應用的最大空間。另外,語(yǔ)音識別技術(shù)自身還存在許多技術(shù)難題需要解決,比如對方言的適應性、容易受外界環(huán)境的干擾等。

  而在中文手寫(xiě)輸入領(lǐng)域稱(chēng)霸的則是一向不太愛(ài)拋頭露面的漢王科技,這家脫鉤于中國科學(xué)院自動(dòng)化研究所國家文字識別中心的企業(yè),憑借近20年的技術(shù)積累,在技術(shù)以及市場(chǎng)上都已遙遙領(lǐng)先于其他競爭對手。

  早在1985年,現任漢王科技總裁劉迎建就研發(fā)成功了“聯(lián)機手寫(xiě)漢字識別在線(xiàn)裝置”,成為國內首創(chuàng )。劉迎建隨后向國家“863”計劃專(zhuān)家組提出的“樣本收集-方法研究-系統實(shí)現”三級研究開(kāi)發(fā)線(xiàn)路,在業(yè)界第一個(gè)把樣本收集整理提到了重要地位,對促進(jìn)我國手寫(xiě)漢字識別的研究起到了極其重要的作用。如今,漢王科技的手寫(xiě)識別系統已經(jīng)發(fā)展到了第10版,其中的“行草王”及“大字符集”兩大識別核心的突破,使得漢王手寫(xiě)識別產(chǎn)品不僅能識別一般的連筆字、繁體字、倒插筆順字,還能完全識別手寫(xiě)行草體漢字,并且能識別國家GBK漢字標準字庫中的所有27000個(gè)漢字,使手寫(xiě)輸入真正達到了輕松自如的境地,同時(shí)也進(jìn)一步確定了漢王在同業(yè)中的領(lǐng)先地位。

  據悉,在目前的手寫(xiě)輸入產(chǎn)品市場(chǎng),漢王的市場(chǎng)占有率已經(jīng)達到了75%。不管是商務(wù)通、聯(lián)想、名人等知名品牌的掌上電腦,還是基于Palm OS或者基于Pocket PC的其他一些掌上電腦設備,目前使用的都是漢王公司的手寫(xiě)識別技術(shù)。聯(lián)想、金長(cháng)城、金恒生等國內許多知名品牌的電腦,以及大部分集成了手寫(xiě)輸入功能的手機使用的也都是漢王的手寫(xiě)技術(shù)。正是因為在核心技術(shù)上的領(lǐng)先地位以及應用上的巨大成就,漢王手寫(xiě)識別技術(shù)還獲得了2001年度的國家最高科技獎項--國家科技進(jìn)步一等獎。

  IBM已經(jīng)將語(yǔ)音輸入擴展到了Linux、手機操作系統上,而漢王也將手寫(xiě)輸入擴展到了掌上電腦、電話(huà)機、手機上。2002年底,漢王科技進(jìn)一步明確了“做核心、做應用、做擴散”的發(fā)展思路。

  微軟的努力

  微軟顯然看到了智能識別技術(shù)這一發(fā)展趨勢,而IBM和漢王顯然不會(huì )放棄領(lǐng)先優(yōu)勢。習慣了領(lǐng)者風(fēng)范的微軟,絕對忍受不了與IBM和漢王各分一杯羹,可以預見(jiàn),一場(chǎng)關(guān)于智能輸入的爭奪戰即將拉開(kāi)序幕。

  由于自身缺乏核心技術(shù)的優(yōu)勢,因此在智能輸入上微軟還只能通過(guò)聯(lián)盟的方式進(jìn)行運作。早在1998年,微軟的Windows CE中文版使用的就是漢王的手寫(xiě)技術(shù),2001年6月,微軟推出的Pocket PC中文版再一次使用了漢王的手寫(xiě)技術(shù)。前段時(shí)間,當大家都在批評Tablet PC的中文手寫(xiě)識別不盡人意時(shí),業(yè)界又傳出消息:微軟正在就Tablet PC的手寫(xiě)輸入問(wèn)題與漢王進(jìn)行合作。

  作為軟件行業(yè)的霸主微軟顯然明白核心技術(shù)的重要,但現在微軟不得不面對在智能識別技術(shù)上受制于人的現狀。為了改善這種情況,微軟將一切希望寄托于1998年成立的微軟亞洲研究院,其前身是微軟中國研究院,是微軟公司在海外開(kāi)設的第二家基礎科研機構,也是亞洲地區唯一的基礎研究機構。

  顯然,微軟對其亞洲研究院給予厚望。微軟亞洲研究院的使命就是使未來(lái)的計算機能夠看、聽(tīng)、學(xué),能用自然語(yǔ)言與人類(lèi)進(jìn)行交流。目前在進(jìn)行智能識別技術(shù)研發(fā)的有多通道用戶(hù)界面組、語(yǔ)音技術(shù)組和自然語(yǔ)言組在各自領(lǐng)域進(jìn)行探索。

  微軟當然會(huì )利用其在PC操作系統方面的優(yōu)勢,今后在微軟的Windows和Office兩大主力產(chǎn)品中都會(huì )加入對手寫(xiě)和語(yǔ)音輸入的支持。微軟曾經(jīng)考慮過(guò)在Windows中加入對手寫(xiě)輸入的支持,由于礙于和漢王的合作關(guān)系最終沒(méi)有得逞,但是一旦微軟啟動(dòng)這一計劃,打擊也將是毀滅性的,Netscape失敗的例子已經(jīng)證明了微軟的威力。

  微軟野心勃勃,IBM希望締造一個(gè)全方位的語(yǔ)音平臺,漢王的目標是做中文非鍵盤(pán)輸入的領(lǐng)導者,三者誰(shuí)也不會(huì )示弱, IBM、微軟、漢王之間這場(chǎng)關(guān)于語(yǔ)音輸入和中文手寫(xiě)輸入的斗爭最后鹿死誰(shuí)手尚難預料。

eNet硅谷動(dòng)力(cio.enet.com.cn)


相關(guān)鏈接:
清華大學(xué)計算機應用專(zhuān)業(yè)博士鄭方聊天實(shí)錄 2003-03-14
中文語(yǔ)音語(yǔ)言處理技術(shù)與中國無(wú)線(xiàn)互聯(lián) 2003-03-14
結合ASR系統有聲有色 2003-03-11
語(yǔ)音技術(shù)帶來(lái)呼叫中心用戶(hù)體驗的變革 2003-03-11
也談?wù)Z(yǔ)音識別技術(shù)在玩具領(lǐng)域的低成本應用 2003-01-06

分類(lèi)信息:     文摘   技術(shù)_語(yǔ)音識別_文摘
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 灵璧县| 定安县| 北碚区| 启东市| 兴山县| 河北省| 普格县| 汉沽区| 德化县| 玉环县| 泸州市| 甘泉县| 乌兰察布市| 南投县| 阳信县| 石渠县| 民和| 全南县| 静海县| 郯城县| 弋阳县| 宜城市| 克什克腾旗| 聊城市| 邓州市| 通山县| 女性| 芦山县| 吐鲁番市| 山阴县| 特克斯县| 太保市| 霍城县| 泸西县| 旺苍县| 长垣县| 深圳市| 玛纳斯县| 长春市| 富锦市| 栾城县| http://444 http://444 http://444 http://444 http://444 http://444