首頁(yè)>>>技術(shù)>>>語(yǔ)音應用>>>語(yǔ)音合成(TTS)  語(yǔ)音合成產(chǎn)品

Google翻譯工具憑啥跨越語(yǔ)言障礙

2011/03/29

  出國旅游不懂當地語(yǔ)言怎么辦?沒(méi)有問(wèn)題,只要你的手機上裝有Google(谷歌)翻譯工具,你對著(zhù)它說(shuō)句中文,它就能立刻翻譯成當地語(yǔ)言,并直接“念”出來(lái)。

  Google翻譯這款產(chǎn)品誕生至今,一直在堅持創(chuàng )新,從網(wǎng)頁(yè)版到工具欄,再發(fā)展到今天移動(dòng)版,虛擬鍵盤(pán)、可選擇翻譯、朗讀等功能也相繼推出。“Google希望支持用戶(hù)多樣化的輸入和輸出,以便更加輕松地跨越語(yǔ)言的障礙。”近日,Google翻譯研發(fā)經(jīng)理陳雍昇在位于北京清華科技園的Google北京辦公室接受了《計算機世界》的專(zhuān)訪(fǎng),為我們揭開(kāi)了Google翻譯背后的技術(shù)面紗及其所承載的Google整體產(chǎn)品戰略的重要使命。

  懂得更多 全憑云統計

  2004年,Google創(chuàng )始人之一塞吉·布林(Sergey Brin)使用市面上的網(wǎng)絡(luò )翻譯服務(wù)來(lái)翻譯韓國粉絲的郵件,結果顯示:“生魚(yú)片帶著(zhù)它的愿望,用Google搜索綠洋蔥!”。這一與原意風(fēng)馬牛不相及的翻譯結果使塞吉下定決心要使Google做出靠譜的翻譯產(chǎn)品。

  如今,Google翻譯早已是很多人出國旅行和外文寫(xiě)作的必備工具,而Google也成為世界上最大的在線(xiàn)翻譯服務(wù)提供商,實(shí)現了跨語(yǔ)言搜索信息,并可將搜索結果和網(wǎng)頁(yè)等資訊以母語(yǔ)傳遞給用戶(hù)。目前,全世界超過(guò)1000萬(wàn)人使用的語(yǔ)言約100種,而Google翻譯已經(jīng)實(shí)現了對其中58種語(yǔ)言的支持。“雖然機器翻譯并不完美,但它可以讓非母語(yǔ)用戶(hù)接觸到之前無(wú)法觸及的世界各地的信息。”

  “值得注意的是,Google翻譯是個(gè)自動(dòng)翻譯機,也就是說(shuō),它借助的是技術(shù)而非人力。” 陳雍昇指出,當下大部分的商業(yè)翻譯系統都屬于規則法機器翻譯,需要做大量詞匯與語(yǔ)法的工作。不同于它們,Google翻譯是先往計算機內輸入大量的文字文本,涵蓋目標語(yǔ)言的文本和對應翻譯文本中現有的人工翻譯數據,然后構建統計翻譯模型。

  每年,Google都會(huì )從一些政府部門(mén)、學(xué)術(shù)機構搜集翻譯信息,完善自己的平行語(yǔ)料庫,所謂的平行語(yǔ)料就是兩種語(yǔ)言的對應詞組或者句子,比如,“l(fā)ong”的平行語(yǔ)料是“長(cháng)”、“time”的平行語(yǔ)料是“時(shí)間”,但詞組“l(fā)ong time”的平行語(yǔ)料卻不能只是兩個(gè)單詞的拼接,而是“很久”,句子“I have been here for a long time.”的平行語(yǔ)料則是“我已經(jīng)在這里很長(cháng)一段時(shí)間。”而為了保證翻譯質(zhì)量,除了嚴格限制平行語(yǔ)料的來(lái)源,Google還采用了國際認定標準Bleu Score來(lái)分析、調試平行語(yǔ)料的質(zhì)量。

  在采訪(fǎng)中,陳雍昇特別指出,Google翻譯之所以采用統計翻譯模型一個(gè)重要原因就是Google的云計算架構。機器翻譯需要海量的數據存儲空間以及高效的運算能力,而Google擁有GoogleMapReduce(分布式計算系統) 和BigTable(分布式存儲系統)正好滿(mǎn)足了這兩方面需求。

  所以從表面上看,支持的語(yǔ)言種類(lèi)多和必須在線(xiàn)使用是Google在功能上與市面上同樣流行金山詞霸、有道詞典等翻譯工具的功能區別,但背后最大的不同卻是,Google在云計算支撐下的統計翻譯模型。

  整合信息 人人皆受益

  “整合全球信息,使人人皆可訪(fǎng)問(wèn)并從中受益,這是Google的始終秉持的信條,也是它的產(chǎn)品戰略”,陳雍昇表示Google翻譯雖然并不是Google最大的研發(fā)部門(mén),但它與Android、Chrome甚至Youtube一樣,都是為Google實(shí)現整合全球信息的目標服務(wù)的。

  Google希望將分散在全球各地的,所有可以數字化的,不同語(yǔ)言、不同格式、不同類(lèi)型、不同版本的信息,進(jìn)行分析處理后,以最簡(jiǎn)便的方式提供給用戶(hù)使用,無(wú)論這些內容是來(lái)自某個(gè)地區的方言、書(shū)本或多媒體的內容,或是地圖等基本的生活信息。這也可以解釋為什么每次技術(shù)論壇上,Google都會(huì )在翻譯這款產(chǎn)品上大費唇舌,因為它代表了一種理想化的溝通形態(tài),即全球信息的無(wú)障礙流通。

  回到翻譯這款產(chǎn)品,有數據顯示,世界上超過(guò)99%的人每天的溝通都要靠母語(yǔ),但在互聯(lián)網(wǎng)上,英文信息占了80%,在剩下的20%中,法語(yǔ)占其中的大約5%,中文等其他語(yǔ)言信息所占百分比微不足道,至于其中的精華信息,更是少之又少。以阿拉伯語(yǔ)為例,世界上有8%的人說(shuō)阿拉伯語(yǔ),但是只有1%的網(wǎng)站使用阿拉伯語(yǔ)。這就是Google為什么如此重視一款小小的語(yǔ)言工具——為了讓每個(gè)人都能無(wú)語(yǔ)言障礙地,輕松地訪(fǎng)問(wèn)網(wǎng)頁(yè)。

  而除了對不同類(lèi)型、不同語(yǔ)言信息的橫向整合,Google還強調對自己的產(chǎn)品體系進(jìn)行縱向縱橫。從2010年開(kāi)始,有不少用戶(hù)發(fā)現,Google已經(jīng)在Chrome瀏覽器中整合了Google翻譯。當Chrome用戶(hù)訪(fǎng)問(wèn)與電腦系統默認語(yǔ)言(或是瀏覽器語(yǔ)言)不同的其他語(yǔ)種網(wǎng)站時(shí),Chrome瀏覽器就會(huì )出現Google翻譯工具欄,只要單擊“翻譯”按鈕,Google翻譯將把整個(gè)網(wǎng)站翻譯為系統默認語(yǔ)言。當然,用戶(hù)也可以讓Google翻譯將把整個(gè)網(wǎng)站翻譯為其他語(yǔ)言。

  此外,據記者了解,目前,Google 翻譯可以幫助用戶(hù)閱讀搜索結果、網(wǎng)頁(yè)、電子郵件、YouTube視頻字幕以及其他信息,用戶(hù)甚至還能在Gmail內進(jìn)行實(shí)時(shí)的多語(yǔ)言對話(huà)。事實(shí)上,剛剛在蘋(píng)果AppStore上線(xiàn)Google翻譯并不是第一個(gè)移動(dòng)版,因為早在一年前,Google就已經(jīng)在自己的移動(dòng)操作系統Android推出了Google翻譯工具,而今年Android 版Google翻譯又再接再厲推出了聊天模式(Conversation Mode)(目前只支持英語(yǔ)和西班牙語(yǔ)之間的互譯),其主要功能是讓使用者透過(guò) Android 手機來(lái)實(shí)時(shí)翻譯,為原本語(yǔ)言不通的人建立溝通橋梁。

  “在未來(lái),而眾所周知,在現實(shí)中的翻譯行業(yè),專(zhuān)業(yè)化、個(gè)性化是很重要的一環(huán)。”在采訪(fǎng)的最后,陳雍昇也表示,除了堅持在翻譯質(zhì)量、速度、用戶(hù)體驗方面進(jìn)一步挖掘潛力,未來(lái)Google也正在翻譯個(gè)性化上努力,以提供給用戶(hù)更多樣、精準的選擇。

計算機世界



相關(guān)閱讀:
美國移動(dòng)支付系統制造商VIVOtech準備2012年上市 2011-03-29
黑莓將在廣東推個(gè)人服務(wù) 已進(jìn)入最后準備階段 2011-03-29
多家銀行上線(xiàn)iPhone手機銀行客戶(hù)端 爭奪高端用戶(hù) 2011-03-29
卓望醞釀業(yè)務(wù)調整 夢(mèng)網(wǎng)模式或終結 2011-03-29
移動(dòng)社交應用市場(chǎng)進(jìn)入“虛熱”階段? 2011-03-29

熱點(diǎn)專(zhuān)題:  語(yǔ)音合成TTS 語(yǔ)音識別ASR    移動(dòng)增值
分類(lèi)信息:  移動(dòng)增值_與_語(yǔ)音應用  移動(dòng)增值_與_互聯(lián)網(wǎng)  移動(dòng)增值_與_移動(dòng)  移動(dòng)增值_與_互聯(lián)網(wǎng)
相關(guān)頻道:  增值電信新聞    

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩 菏泽市| 盐源县| 泸水县| 贵定县| 容城县| 玉林市| 祁阳县| 仲巴县| 武安市| 黄山市| 永福县| 湖北省| 蒙山县| 石台县| 汤阴县| 包头市| 灵寿县| 广灵县| 塘沽区| 武清区| 剑阁县| 红安县| 苏尼特右旗| 十堰市| 和政县| 孟州市| 盐津县| 吉林省| 正宁县| 平度市| 合阳县| 西贡区| 繁峙县| 兰考县| 衡阳市| 驻马店市| 贵州省| 鲁甸县| 资中县| 淳化县| 镇原县| http://444 http://444 http://444 http://444 http://444 http://444