
Nuance研究部副總裁吳建雄曾將人工助手和機器助手作了一個(gè)很簡(jiǎn)單的類(lèi)比。最簡(jiǎn)單、最基本的一個(gè)助手其實(shí)是一個(gè)打字員,打字員的意思是你說(shuō)什么東西他能夠聽(tīng)得懂,這樣的話(huà)你就不需要把你想說(shuō)的東西跟每個(gè)人講,他可以把這個(gè)信息讓傳感器去做,這是最基本的,從技術(shù)上來(lái)說(shuō)就是語(yǔ)音識別,就是一個(gè)打字員。
第二個(gè)層次,更高級的是一個(gè)辦公室的文員,辦公室的文員跟打字員的區別是文員能夠幫助你去完成一個(gè)任務(wù)。比如說(shuō)你要到哪里,你的周末要去娛樂(lè )一下,最簡(jiǎn)單,你說(shuō)我要到某個(gè)餐廳去吃飯,你知道這個(gè)地址,你把車(chē)開(kāi)到那兒去,并不能夠幫助你完成這個(gè)任務(wù)。你到那個(gè)地方去,你要知道這個(gè)地方在哪里,你去的時(shí)候能不能訂到位置,車(chē)開(kāi)到那里能不能停車(chē)。文員幫你完成這樣一個(gè)任務(wù)。
再高一個(gè)層次人的助手是什么樣?就是秘書(shū)。秘書(shū)跟文員的區別是什么呢?秘書(shū)能夠領(lǐng)會(huì )領(lǐng)導的意思,有好多東西,領(lǐng)導想做的東西,他不說(shuō),秘書(shū)知道這是你想做的,有些時(shí)候,你只要稍微點(diǎn)一下,他就會(huì )幫你把好多東西都做完,甚至有的時(shí)候你還沒(méi)有說(shuō),他已經(jīng)幫你去完成這樣的一個(gè)任務(wù)。這是機器助手三個(gè)不同層次上的區別。

今天的技術(shù),打字員的功能已經(jīng)做得非常好,純粹語(yǔ)音識別的功能。并不是這個(gè)問(wèn)題全解決了,還是有很多情況下機器還會(huì )有錯,但是從技術(shù)上,特別是最近幾年技術(shù)的進(jìn)展非常快。現在正在解決的是第二步,要完成這個(gè)任務(wù)。完成這個(gè)任務(wù)跟第一個(gè)區別在哪里呢?光你聽(tīng)懂了這個(gè)東西,有些時(shí)候人不是把什么東西都給說(shuō)出來(lái),要完成一個(gè)任務(wù),機器要通過(guò)一個(gè)對話(huà),要提一些問(wèn)題,這個(gè)對話(huà)的技術(shù)非常自然的方法,用最快的方式把人要完成這個(gè)任務(wù)沒(méi)有說(shuō)出來(lái)的東西,把信息給搜索出來(lái)進(jìn)行一個(gè)交流。
到第三步,要領(lǐng)會(huì )意圖,更多地是能夠把每一個(gè)人的習慣、個(gè)性都通過(guò)這個(gè)東西把它給學(xué)習下來(lái),這樣有好多東西你就知道了,你想吃的,包括飲食的習慣,包括你要停車(chē)、加油或者是有什么品牌的愛(ài)好,都能夠通過(guò)機器學(xué)習的方法把它植入到助理的系統里面去。
Nuance是如何以人工智能和情境化推理推動(dòng)汽車(chē)助理技術(shù)發(fā)展?Nuance有什么核心技術(shù)?
第一,很智能的交互技術(shù)。交互技術(shù)包括了很多技術(shù)上的東西,從一開(kāi)始信號的獲取,做語(yǔ)音識別跟自然語(yǔ)言的理解,還有自然語(yǔ)言的生成。因為你要對話(huà),機器問(wèn)你問(wèn)題,它要去生成語(yǔ)言。有了很好對話(huà)的技術(shù),這樣能夠把總體的成功率提高。
第二,是個(gè)性化。像跟人類(lèi)一樣,一個(gè)好的助手、好的秘書(shū),個(gè)性化肯定是很重要。
第三,跟情境,跟上下文的東西相關(guān)。因為不同的場(chǎng)景之下人想要做的東西都會(huì )不一樣,并不是所有的東西都能把它解決。
第四,知識。把知識跟你想要完成相關(guān)的東西,這個(gè)系統里要有這個(gè)知識,而且在合適的場(chǎng)合下把知識運用上去。
今年年初在國際消費電子展發(fā)布的DragonDrive(聲龍駕駛)互聯(lián)汽車(chē)平臺已增加了人工智能和Automotive Assistant(汽車(chē)助手)功能,能夠提供高級語(yǔ)境化和個(gè)性化車(chē)載體驗。DragonDrive(聲龍駕駛)還可以提供時(shí)刻聆聽(tīng)的多乘客對話(huà)功能和基于人工智能的信息收發(fā)功能以及更多駕駛員個(gè)性化選項。
作為其Automotive Assistant(汽車(chē)助手)服務(wù)的一部分,DragonDrive(聲龍駕駛)已經(jīng)提供了認知推理功能,讓汽車(chē)制造商能夠將智能虛擬個(gè)人助手深入集成到人機界面中,從而聆聽(tīng)、理解、推理并做出反應。憑借來(lái)自汽車(chē)和駕駛員的語(yǔ)境化和情境化數據,DragonDrive(聲龍駕駛)所提供的汽車(chē)助手能夠主動(dòng)推薦導航路線(xiàn)、興趣點(diǎn)、音樂(lè )等內容。
