如何讓機器學(xué)會(huì )保持一個(gè)完整的對話(huà)始終是人工智慧界最困難的問(wèn)題之一。因為若想了解一句話(huà)或一段文字的真正意義,機器(甚至人)需要對世界有一定程度的理解,它們需要「常識」。
如今,為了解決這一難題,Salesforce公司的研究人員們想出了一個(gè)妙招:在教一個(gè)演算法其他技能之前,先教它說(shuō)第二種語(yǔ)言。

他們發(fā)現,當一個(gè)機器學(xué)習系統學(xué)會(huì )如何把一種語(yǔ)言翻譯成另外一種語(yǔ)言時(shí),它會(huì )自動(dòng)學(xué)會(huì )單詞之間的關(guān)系。而若以這個(gè)系統為基礎,再訓練另外一個(gè)應用時(shí)(比如對話(huà),或察覺(jué)文字中的情緒),它的表現將遠好于從零建立的系統。
Salesforce的首席科學(xué)家、機器學(xué)習專(zhuān)家Richard Socher對此表示:「我們所做的基本上就是把機器翻譯的數據拿來(lái),去教一個(gè)模型如何理解單詞和情境。」
有很多「機器學(xué)習的創(chuàng )新」可以用來(lái)提高機器人的語(yǔ)言能力,Salesforce的研究成果只是其中之一。正如許多基于深度學(xué)習的計算機視覺(jué)系統都會(huì )提前接受網(wǎng)路訓練,Socher認為,機器翻譯對自然語(yǔ)言系統的作用也是類(lèi)似的。
作為一個(gè)集銷(xiāo)售、營(yíng)銷(xiāo)以及客戶(hù)互動(dòng)管理為一體的大型網(wǎng)路平臺,Salesforce已經(jīng)在其Einstein平臺中提供一系列的人工智慧工具。比如,一個(gè)可以對電郵和訊息中的情緒進(jìn)行自動(dòng)分類(lèi)的工具,以及一個(gè)根據員工之前的工作,自動(dòng)對他需要追查的線(xiàn)索進(jìn)行優(yōu)化的工具。
Socher相信,他們這個(gè)發(fā)現將會(huì )提高Einstein平臺的自動(dòng)語(yǔ)言能力,「對于聊天機器人和自動(dòng)客服來(lái)說(shuō),它‘超級’有用。」
在測試中,研究人員首先需要訓練一個(gè)深度學(xué)習系統在英語(yǔ)和德語(yǔ)之間進(jìn)行翻譯。為此,他們給一個(gè)多層神經(jīng)網(wǎng)路提供了大量已經(jīng)翻譯好的文件,并慢慢調試各種參數,直至它可以自行產(chǎn)生不錯的翻譯結果。
在學(xué)會(huì )翻譯之后,研究人員們就開(kāi)始訓練這個(gè)「雙語(yǔ)人工智慧」去學(xué)習更多的技能了,比如判斷一段文字背后的情緒,對各種問(wèn)題進(jìn)行分類(lèi),以及回答問(wèn)題。在對比測試中,經(jīng)過(guò)雙語(yǔ)訓練的神經(jīng)網(wǎng)路的成績(jì)遠好于沒(méi)有經(jīng)過(guò)雙語(yǔ)訓練的系統。
由于機器翻譯已經(jīng)是一個(gè)成熟的領(lǐng)域,研究人員有大量的數據來(lái)進(jìn)行訓練。「翻譯和語(yǔ)言的其他部分之間有著(zhù)極其重要的關(guān)聯(lián),」Salesforce的研究員Bryan Mc Cann說(shuō)道:「(翻譯數據)一般涉及面非常廣,它們包含著(zhù)各種對自動(dòng)語(yǔ)言處理有用的信息。」