微軟在其翻譯服務(wù)Translator中,又加入12種新語(yǔ)言和方言,包括巴什基爾語(yǔ)、迪維希語(yǔ)、藏語(yǔ)、土庫曼語(yǔ)、維吾爾語(yǔ)和烏茲別克語(yǔ)等,當前全球總共有8,460萬(wàn)人使用這些語(yǔ)言。微軟提到,在加入12種語(yǔ)言之后,Translator已經(jīng)可以支援100種語(yǔ)言,語(yǔ)言復蓋人數達到56.6億人。
由于主流語(yǔ)言資源多,因此翻譯服務(wù)要提供像是英語(yǔ)、華語(yǔ)、印地語(yǔ)、阿拉伯語(yǔ)和西班牙語(yǔ),相對簡(jiǎn)單許多,而近年來(lái)由于技術(shù)的進(jìn)步,人工智慧技術(shù)也逐漸可以對資源匱乏或是瀕臨滅絕的語(yǔ)言,提供翻譯服務(wù)。
微軟的機器翻譯服務(wù),使用一種稱(chēng)為Z-code的多語(yǔ)言人工智慧模型,該模型能夠結合同一家族語(yǔ)言,像是印地語(yǔ)、馬拉地語(yǔ)和古吉拉特語(yǔ)等印度語(yǔ),透過(guò)讓各個(gè)語(yǔ)言模型相互學(xué)習,降低達到高品質(zhì)翻譯所需要的資料量。微軟舉例,當翻譯模型使用相關(guān)的法語(yǔ)、葡萄牙語(yǔ)、西班牙語(yǔ)和義大利語(yǔ)資料一起訓練,羅馬尼亞語(yǔ)的翻譯品質(zhì)會(huì )得到提升。
微軟提到,借由共通性和遷移學(xué)習,能同時(shí)改進(jìn)整個(gè)語(yǔ)言家族的翻譯品質(zhì),而且減少資料需求,對資源有限或是母語(yǔ)人口減少,而瀕臨滅絕的語(yǔ)言,得以建立語(yǔ)言模型。