
一開(kāi)始,它只不過(guò)是個(gè)看似新奇的小玩意兒。2014年11月,亞馬遜發(fā)布了Echo智能音箱,它使用了人工智能技術(shù)來(lái)傾聽(tīng)人類(lèi)的提問(wèn)。Echo會(huì )掃描聯(lián)網(wǎng)數據庫中的數百萬(wàn)個(gè)單詞,不論你提出的問(wèn)題是深邃還是淺顯,它都能給出答案。目前,Echo智能音箱的銷(xiāo)量已達到4700多萬(wàn)臺,其用戶(hù)來(lái)自從阿爾巴尼亞到贊比亞的80多個(gè)國家,其服務(wù)器每天要回答用戶(hù)的1.3億多個(gè)問(wèn)題。亞馬遜的語(yǔ)音識別引擎Alexa得名于亞歷山大港的古埃及圖書(shū)館,它可以按照用戶(hù)的要求播放音樂(lè ),提供天氣預報信息或體育比賽的得分,甚至可以遠程調節用戶(hù)家里的室溫。它還會(huì )講笑話(huà),回答一些瑣碎的問(wèn)題,抖個(gè)機靈,或者開(kāi)些無(wú)傷大雅的玩笑。(比如你可以讓它放個(gè)屁來(lái)聽(tīng)聽(tīng))。
亞馬遜并沒(méi)有“發(fā)明”語(yǔ)音識別技術(shù),實(shí)際上語(yǔ)音識別技術(shù)已經(jīng)發(fā)明出來(lái)幾十年了。亞馬遜甚至并不是第一家提供主流語(yǔ)音識別應用的科技巨頭。蘋(píng)果的Siri和谷歌語(yǔ)音助手的上市時(shí)間要比它早得多。微軟Cortana的發(fā)布基本上與Alexa在同一時(shí)期。但是隨著(zhù)Echo的廣泛成功,語(yǔ)音識別領(lǐng)域的競爭驟然激烈了起來(lái),各大科技廠(chǎng)商紛紛投下重注,試圖將這些“智能”家居設備變得跟PC甚至和智能手機一樣重要。正如谷歌的搜索引擎算法徹底改變了人們的信息消費模式,進(jìn)而顛覆了整個(gè)廣告行業(yè)一樣,由人工智能技術(shù)驅動(dòng)的語(yǔ)音識別技術(shù)也會(huì )推動(dòng)類(lèi)似的革命。亞馬遜Alexa部門(mén)的首席科學(xué)家羅希特·普拉薩德表示:“我們想抹平用戶(hù)使用互聯(lián)網(wǎng)時(shí)的不順暢,而最自然的方法就是聲音。Alexa不是那種一下子給你展示很多搜索結果,然后說(shuō)‘選一個(gè)吧’的那種搜索引擎,而是會(huì )直接告訴你答案。”
各大科技廠(chǎng)商紛紛將人工智能與語(yǔ)音識別技術(shù)相結合,其目的遠遠不只是為了推出一款圣誕購物季最熱賣(mài)的小家電這么簡(jiǎn)單。目前,谷歌、蘋(píng)果、Facebook和微軟等公司紛紛砸下重金研發(fā)競品。據投資公司LoupVentures的分析師吉恩·蒙斯特估算,上述幾家科技巨頭每年在語(yǔ)音識別技術(shù)上的研發(fā)支出合計超過(guò)了50億美元,約占年度研發(fā)預算總額的10%。他認為,語(yǔ)音識別技術(shù)的出現是計算領(lǐng)域的一個(gè)“具有重大意義的變化”。他認為,語(yǔ)音指令很快將取代鍵盤(pán)和觸屏,成為“我們與互聯(lián)網(wǎng)交互的最常見(jiàn)的方式”。
隨著(zhù)各大廠(chǎng)商紛紛投入重注,語(yǔ)音識別助手領(lǐng)域的競爭也變得愈發(fā)激烈。從研究公司Canalys提供的數據看,目前亞馬遜在這一領(lǐng)域暫時(shí)領(lǐng)先,它在全球聯(lián)網(wǎng)音箱市場(chǎng)上的份額達到了42%。谷歌的Home智能家居設備以34%的份額暫居亞軍,它搭載了谷歌自研的谷歌助手,據說(shuō)近期的銷(xiāo)量已經(jīng)反超了亞馬遜。蘋(píng)果的HomePod價(jià)格最貴,加入戰局也是最晚,雖然市場(chǎng)占有率排名第三,但份額仍遠遠不如前面兩家。去年10月,Facebook也推出了自己的Portal系列影音設備,它們也具備部分語(yǔ)音識別功能。尤其值得注意的是,它搭載的也是亞馬遜的Alexa語(yǔ)音識別引擎。


當前,聯(lián)網(wǎng)智能音箱以及類(lèi)似設備的市場(chǎng)規模已然不小,而且還在繼續增長(cháng)。不過(guò)對于這些科技巨頭來(lái)說(shuō),語(yǔ)音識別技術(shù)的價(jià)值遠遠超過(guò)這些設備本身。據市場(chǎng)研究機構全球市場(chǎng)觀(guān)察公司(GlobalMarketInsights)的研究,2017年,全球智能音箱市場(chǎng)的銷(xiāo)售額是45億元,預計到2024年將增長(cháng)至300億美元。不過(guò)這幾家科技巨頭顯然并不在乎賣(mài)硬件的這點(diǎn)小錢(qián),比如亞馬遜基本是在將Echo保本甚至虧本銷(xiāo)售。在去年歐美地區的假日購物季期間,亞馬遜推出了迷你版的EchoDot音箱,售價(jià)只有29美元,ABI研究公司認為這個(gè)價(jià)格甚至還要低于它的零部件成本。各大廠(chǎng)商之所以肯做賠本生意,就是為了把用戶(hù)鎖定在他們的其它產(chǎn)品和服務(wù)上。比如亞馬遜就是要通過(guò)Echo產(chǎn)品提高亞馬遜Prime訂閱服務(wù)的價(jià)值。谷歌則寄希望于語(yǔ)音搜索功能能夠引來(lái)更多的廣告收入。蘋(píng)果則希望以語(yǔ)音識別技術(shù)為工具,將手機、電腦、電視遙控器甚至是車(chē)載軟件整合在一塊,打造一體化的體驗。
由于語(yǔ)音識別領(lǐng)域已經(jīng)吸引了這么多的投資,而且還在快速創(chuàng )新,因此現在預測誰(shuí)是贏(yíng)家還為時(shí)過(guò)早。但有一點(diǎn)大家已經(jīng)形成了共識,那就是有了人工智能加成的語(yǔ)音識別技術(shù),必然將向今天的智能手機一樣,成為我們訪(fǎng)問(wèn)互聯(lián)網(wǎng)的新用戶(hù)界面。另外,語(yǔ)音識別技術(shù)也將降低人們使用科技的門(mén)檻,促進(jìn)科技的普及。谷歌公司負責谷歌助手與搜索業(yè)務(wù)的產(chǎn)品與設計的副總裁尼克·福克斯表示:“它讓那些不太識字的人也能使用這個(gè)系統。另外,人們在開(kāi)車(chē)的時(shí)候也可以使用它,做飯的時(shí)候也可以用它來(lái)聽(tīng)菜譜。每過(guò)一段時(shí)間,科技就會(huì )發(fā)生一次結構性的轉變。我們認為,語(yǔ)音識別就是這樣一種轉變。”
雖然如此,但今天的語(yǔ)音識別技術(shù)仍然處于比較早期的階段。它的應用還比較初級,而且它也有一些比較大的風(fēng)險因素。比如科技公司會(huì )不會(huì )利用它對用戶(hù)進(jìn)行竊聽(tīng),以及科技公司通過(guò)收集公民的語(yǔ)音數據又攫取了多少權力,人們對這些問(wèn)題都存在著(zhù)合理的擔憂(yōu)。華盛頓大學(xué)電氣工程學(xué)教授、世界頂級的語(yǔ)音和語(yǔ)言技術(shù)科學(xué)家瑪麗·奧斯坦多夫表示:“有了人工智能語(yǔ)音識別技術(shù),我們就好比從螺旋槳飛機進(jìn)入了噴氣式飛機時(shí)代。”她指出,現在的語(yǔ)音識別技術(shù)已經(jīng)能夠很好地回答那些直截了當的問(wèn)題,但在真實(shí)語(yǔ)境的對話(huà)中,表現得仍然令人失望。“在能識別多少個(gè)單詞、聽(tīng)懂多少個(gè)指令上,人工智能語(yǔ)音識別技術(shù)表現得非常出色。但我們畢竟還沒(méi)進(jìn)入火箭時(shí)代。”
幾十年來(lái),科技行業(yè)一直堅信,語(yǔ)音識別技術(shù)必將成為下一個(gè)“殺手級應用”。早在上世紀50年代,貝爾實(shí)驗室就開(kāi)發(fā)了一個(gè)名為奧黛麗(Audrey)的系統,它可以識別從1到9的語(yǔ)音數字。20世紀90年代時(shí)已經(jīng)有了一款名叫DragonNaturallySpeaking的PC軟件,它可以實(shí)現簡(jiǎn)單的語(yǔ)音識別功能,而不需要說(shuō)話(huà)者每說(shuō)完一個(gè)單詞就尷尬地停頓一會(huì )兒。但直到蘋(píng)果公司2010年在iPhone上發(fā)布了Siri語(yǔ)音助手,消費者才意識到一個(gè)擁有強大計算能力的語(yǔ)音識別引擎能做哪些事。大約就在同一時(shí)間段,亞馬遜這樣一家充滿(mǎn)了《星際迷航》式幻想的公司(它的老板杰夫·貝佐斯也是一個(gè)正牌《星際》迷)開(kāi)始暢想,能不能將企業(yè)號星際飛船上的那種會(huì )說(shuō)話(huà)的電腦變成現實(shí)。亞馬遜公司的普拉薩德曾發(fā)表過(guò)上百篇關(guān)于語(yǔ)音識別人工智能及相關(guān)話(huà)題的科學(xué)文章,他表示:“在我們的暢想中,未來(lái)你可以通過(guò)語(yǔ)音與任何服務(wù)交互。”而Alexa就是為此而生的。它是一臺多才多藝的設備,可以讓消費者更容易地與亞馬遜進(jìn)行交互。
隨著(zhù)語(yǔ)音識別技術(shù)的進(jìn)步——也就是計算速度越來(lái)越快,價(jià)格越來(lái)越便宜,越來(lái)越普及,因此日益主流化——亞馬遜、谷歌、蘋(píng)果等科技廠(chǎng)商也得以更容易地建立一個(gè)無(wú)縫的網(wǎng)絡(luò ),利用語(yǔ)音識別技術(shù),將智能家居設備與他們旗下的其他系統連接起來(lái)。比如蘋(píng)果CarPlay的用戶(hù)下班路上可以告訴Siri,別忘了在蘋(píng)果電視上下載最新一集的《權力的游戲》,然后讓HomePod等我一回家就開(kāi)始播放。兩年前,谷歌也發(fā)布了基于語(yǔ)音識別技術(shù)的智能家居產(chǎn)品Home,它將谷歌的音樂(lè )服務(wù)(YouTube)和最新款的Pixel系列手機和平板產(chǎn)品結合在了一起。換言之,每個(gè)科技巨頭都將語(yǔ)音識別技術(shù)當作了連接其多個(gè)數碼產(chǎn)品的紐帶。
上述幾個(gè)科技巨頭個(gè)個(gè)都有超強的盈利能力,因此他們都有充足的資金來(lái)搞研究和營(yíng)銷(xiāo),最終拿出的產(chǎn)品也各不相同。蘋(píng)果和谷歌都有自己的移動(dòng)操作系統,也就是說(shuō),iPhone和所有的安卓手機在出廠(chǎng)時(shí)就已預裝了Siri或谷歌助手。相比之下,亞馬遜就得說(shuō)服用戶(hù)將Alexa應用下載到他們的iPhone或安卓手機上了。前華爾街分析師蒙斯特認為:“要打開(kāi)Alexa語(yǔ)音識別應用,就要比Siri和谷歌助手多花一步,這對亞馬遜是一個(gè)明顯的劣勢。”而相比之下,Siri和谷歌助手只需用戶(hù)喊一聲它們的名字就能激活。
不過(guò),iOS和Android是面向所有第三方開(kāi)發(fā)者的,而Alexa應用同時(shí)兼容這兩個(gè)平臺,也就是說(shuō),兩個(gè)平臺上的開(kāi)發(fā)者都可以寫(xiě)Alexa的程序。亞馬遜CEO杰夫·貝佐斯今年早些時(shí)候曾在一次財報發(fā)布會(huì )上稱(chēng):“有來(lái)自150多個(gè)國家的數萬(wàn)名開(kāi)發(fā)者”都在構建Alexa的應用程序,并將它們集成到非亞馬遜的設備里。而合作伙伴也是各大語(yǔ)音識別應用競爭的一個(gè)競爭戰場(chǎng)。現在,Sonos公司的“電聲棒”、Jabra公司的耳機,以及寶馬、福特、豐田等公司的汽車(chē)都已用上了Alexa。谷歌的語(yǔ)音識別程序則被集成到了索尼、鉑傲的音響、August公司的智能門(mén)鎖和飛利浦的LED照明系統上。蘋(píng)果的HomPod則與FirstAlert公司的安全防衛系統和霍尼韋爾公司的智能恒溫器進(jìn)行了合作。谷歌副總裁尼克斯表示:“這些合作的好處是將語(yǔ)音識別功能整合到了整個(gè)智能家居生態(tài)系統,我不用打開(kāi)手機也能使用應用程序了。我只要說(shuō)一聲:‘讓我看看誰(shuí)在門(mén)口’,門(mén)前的監控視頻就會(huì )自動(dòng)顯示出來(lái)。總之,它通過(guò)統一實(shí)現了簡(jiǎn)化。”
人工智能一直是反烏托邦文化里的常客,特別是在《終結者》和《黑客帝國》系列電影里,智能機器人甚至造了人類(lèi)的反,將人類(lèi)逼到了“亡球滅種”的邊緣。不過(guò)慶幸的是,現在的我們離被機器人奴役還有很遠。不過(guò)人工智能技術(shù)的進(jìn)步,以及廉價(jià)計算設備的普及,已經(jīng)讓很多具有科幻感的構思成為了現實(shí)。早期的語(yǔ)音識別程序雖然也不錯,但也沒(méi)有超過(guò)編寫(xiě)它們的程序員的最高水平。但現在這些應用卻變得越來(lái)越好了,這是因為它們通過(guò)互聯(lián)網(wǎng)與數據中心連接,而且科技公司花了好幾年時(shí)間,用大量數據對這些算法進(jìn)行“訓練”,使其學(xué)會(huì )了識別不同的語(yǔ)言模式。現在,這些人工智能語(yǔ)音識別應用不僅能識別單詞、方言和俗語(yǔ),甚至還能根據上下文分析語(yǔ)義(比如通過(guò)分析呼叫中心的客服代表與客戶(hù)的電話(huà)錄音,或者分析用戶(hù)與數字助手的互動(dòng))。


語(yǔ)音識別系統既依賴(lài)于計算機科學(xué),也依賴(lài)于物理學(xué)。語(yǔ)音會(huì )產(chǎn)生空氣振動(dòng),語(yǔ)音引擎則會(huì )接受模擬聲波,然后將其轉換成數字格式,計算機就會(huì )分析這些數據的意義,而人工智能則能夠加快這一過(guò)程。人工智能首先要搞清楚它收到的語(yǔ)音是不是指向它的系統的,因此它首先要檢測客戶(hù)選定的“喚醒詞”,比如“Alexa”。然后,系統會(huì )使用機器學(xué)習模型,對所接受的數據進(jìn)行猜測。由于這個(gè)模型已經(jīng)用幾百萬(wàn)個(gè)用戶(hù)貢獻的語(yǔ)料庫訓練過(guò),因此猜測的準確度是很高的。谷歌助手的工程副總裁約翰·斯考威克解釋道:“語(yǔ)音識別系統首先會(huì )識別聲音,然后會(huì )把這句話(huà)放到語(yǔ)境中去理解。比如說(shuō),如果我說(shuō)了一句:‘天氣怎么樣?’系統就知道,我所指的是一個(gè)國家或一個(gè)城市的天氣。我們的數據庫中有500萬(wàn)個(gè)單詞的英文詞匯,如果不結合語(yǔ)境,從500萬(wàn)個(gè)單詞中識別出一個(gè)詞是極其困難的。但如果人工智能知道你問(wèn)的是一個(gè)城市的情況,那么這就把范圍縮小到了三萬(wàn)分之一,這樣猜中就簡(jiǎn)單多了。”
有了強大的計算能力,系統就有了很多學(xué)習的機會(huì )。舉個(gè)真實(shí)的例子,為了讓Alexa打開(kāi)家里的微波爐,語(yǔ)音識別引擎首先要理解這個(gè)指令。也就是說(shuō),它得能夠聽(tīng)懂各州各省的方言,小孩子的高調門(mén)兒,或者是老外的怪腔怪調。與此同時(shí),它還要過(guò)濾廣播、音樂(lè )等無(wú)關(guān)的背景音。然后,人們使用微波爐時(shí)的指令也是不一樣的。有人可能會(huì )說(shuō):“把我的飯重新熱一下”;有人則可能說(shuō):“打開(kāi)微波爐”或“用微波爐把飯熱兩分鐘。”Alexa這種語(yǔ)音識別應用會(huì )將用戶(hù)的問(wèn)題與數據庫中的類(lèi)似指令進(jìn)行對比,從而明白“把我的飯重新熱一下”也是用戶(hù)有可能下的指令。
語(yǔ)音識別技術(shù)之所以近來(lái)大受歡迎,也是由于它在將人類(lèi)指令轉化為行動(dòng)方面表現得相當出色。谷歌公司的斯考威克表示,谷歌的語(yǔ)音識別引擎已經(jīng)能達到95%的準確率,比2013年的80%有了明顯提高,幾乎與人類(lèi)的理解能力不相上下了。近來(lái)該領(lǐng)域的一個(gè)重大成績(jì)是語(yǔ)音識別引擎已經(jīng)學(xué)會(huì )了如何過(guò)濾背景噪音。不過(guò)只有當用戶(hù)的指令或問(wèn)題比較簡(jiǎn)單時(shí),系統才能達到這樣高的識別率——比如問(wèn)它:“最新的《諜中諜6》什么時(shí)候上映?”如果你就某件事征求Alexa或谷歌助手的意見(jiàn),或是試圖跟它進(jìn)行一場(chǎng)拉鋸式的談話(huà),系統就要么會(huì )給出一個(gè)預先編程好的幽默答案,要么直接提出抗議:“我不知道怎么回答。”
在消費者看來(lái),語(yǔ)音識別設備不僅實(shí)用,有時(shí)也能給人帶來(lái)快樂(lè )。而在制造它們的科技巨頭看來(lái),語(yǔ)音識別設備雖小,但是極為高效的收集數據者。大約60%的亞馬遜Echo和谷歌Home的用戶(hù)至少將語(yǔ)音助手與一種智能家居設備相連(比如恒溫器、安全系統等),而這些智能家居設備可以透露關(guān)于用戶(hù)生活的無(wú)數細節。對于亞馬遜、谷歌和蘋(píng)果這些公司,他們收集的數據越多,就能更好地服務(wù)消費者——不管是通過(guò)附加服務(wù)、訂閱服務(wù),還是代表其他商家打廣告。
這個(gè)領(lǐng)域的商機也是顯而易見(jiàn)的。一位消費者只要將Echo與恒溫器相連,那么如果他看到了智能照明系統的廣告,就也會(huì )傾向于購買(mǎi)。如果你對隱私特別在意,你或許會(huì )覺(jué)得被“竊聽(tīng)”的感覺(jué)很不舒服。但借助這項技術(shù),科技巨頭們已經(jīng)坐擁了海量個(gè)人數據,反過(guò)來(lái)這些數據也使他們能更有效地向消費者進(jìn)行營(yíng)銷(xiāo)。
這幾家科技巨頭的總體戰略各不相同,對收集來(lái)的數據的使用方式也略有差異。亞馬遜表示,Alexa收集來(lái)的數據主要用于該軟件的后續研發(fā),以使它變得更加智能,對用戶(hù)更加實(shí)用。亞馬遜稱(chēng),Alexa進(jìn)化得越好,用戶(hù)就會(huì )越能看到亞馬遜的產(chǎn)品和服務(wù)的價(jià)值——包括它的Prime會(huì )員計劃。盡管亞馬遜也在大力推動(dòng)廣告業(yè)務(wù)(市場(chǎng)研究機構eMarketer認為,2018年亞馬遜的數字廣告業(yè)務(wù)收入將達到46.1億美元),但亞馬遜的一位發(fā)言人表示,公司目前不會(huì )利用Alexa的數據賣(mài)廣告。谷歌雖然擁有龐大的廣告業(yè)務(wù),卻也一反常態(tài)地表示,不會(huì )使用語(yǔ)音識別技術(shù)收集的數據賣(mài)廣告。蘋(píng)果向來(lái)號稱(chēng)不愿利用顧客數據換取商業(yè)利益,此次自然也不例外,蘋(píng)果表示,該公司從語(yǔ)音識別技術(shù)中獲取的用戶(hù)數據將僅僅用于改善用戶(hù)體驗——以及銷(xiāo)售更多昂貴的HomePod設備。
雖然亞馬遜是做購物起家的,但大多數用戶(hù)并未使用語(yǔ)音識別設備幫助他們購物。亞馬遜不愿透露有多少Echo的用戶(hù)用它購物,不過(guò)咨詢(xún)機構Codex集團最近對網(wǎng)購圖書(shū)者的一項調查顯示,只有8%的用戶(hù)通過(guò)Echo買(mǎi)過(guò)書(shū),有13%的用戶(hù)通過(guò)它聽(tīng)過(guò)電子書(shū)。研究機構Canalys的分析師文森特·蒂爾克表示:“人是習慣性動(dòng)物,如果你想買(mǎi)一個(gè)咖啡杯,你很難對智能音箱描述出你喜歡的杯子的樣式。”
亞馬遜表示,公司并未過(guò)分關(guān)注Echo作為購物助手的作用,不過(guò)它仍然希望亞馬遜的智能家居設備能反哺公司的零售業(yè)務(wù)。亞馬遜的自然語(yǔ)言處理科學(xué)家普拉薩德表示:“人總是根據以前的購物習慣去購物。如果你想買(mǎi)幾節電池,這種東西,你既不需要親眼去挑,也不需要記住買(mǎi)一種。如果以前你從沒(méi)買(mǎi)過(guò)電池,我們當然會(huì )建議你買(mǎi)亞馬遜品牌的。”
語(yǔ)音助手在購物上的作用遠遠不止買(mǎi)幾節電池。目前,很多商家都想跟這些科技巨頭合作,并利用這些平臺。據OC&C戰略咨詢(xún)公司預測,到2022年,語(yǔ)音識別購物的銷(xiāo)售額將從現在的20億美元增長(cháng)至400億美元。現在,有幾款智能家居設備的迭代產(chǎn)品已經(jīng)展現了這個(gè)潛力。比如亞馬遜和谷歌都推出了帶屏幕的智能家居設備,它們看起來(lái)有點(diǎn)像小型電腦和電視機的跨界產(chǎn)品,因此更適合用來(lái)網(wǎng)購。2017年春天,亞馬遜推出了230美元的EchoShow。跟其他Echo設備一樣,EchoShow也內置了Alexa應用,但用戶(hù)也能通過(guò)它看到圖像。這樣一來(lái),消費者就可以看見(jiàn)自己想買(mǎi)的商品和購物清單了。同時(shí),用戶(hù)也可以用它來(lái)看電視、聽(tīng)音樂(lè )、看監控視頻、旅行照片等等。而在做這些的時(shí)候,用戶(hù)無(wú)需點(diǎn)擊任何一個(gè)按鍵,也完全不需要操縱鼠標。
谷歌已經(jīng)與四家消費電子廠(chǎng)商展開(kāi)了合作,有些廠(chǎng)商最近已經(jīng)開(kāi)售安裝了谷歌助手的智能屏產(chǎn)品。比如聯(lián)想的SmartDisplay智能顯示器看起來(lái)很像Facebook的Portal產(chǎn)品,零售價(jià)為250美元,與JBL的LinkView設備相同。LG也計劃推出搭載谷歌助手的ThinQView設備。今年10月,谷歌也開(kāi)始銷(xiāo)售自己HomeHub設備了,該設備搭載了一塊7寸顯示屏,售價(jià)為149美元。
從長(cháng)遠來(lái)看,谷歌認為,擁有屏幕將使語(yǔ)音購物變得更容易。谷歌并不像亞馬遜那樣直接銷(xiāo)售產(chǎn)品,但它的“谷歌購物”網(wǎng)站卻將零售商與谷歌搜索引擎直接相連。目前,谷歌已經(jīng)將Home設備打造成一個(gè)購物工具了。比如谷歌與星巴克有合作,用戶(hù)只需要告訴谷歌助手點(diǎn)一杯“老樣子”,飲品就會(huì )自動(dòng)送上門(mén)。去年,谷歌還鞏固了與全球最大零售商沃爾瑪的合作關(guān)系。用戶(hù)可將沃爾瑪賬戶(hù)與谷歌購物網(wǎng)站相連,這樣通過(guò)谷歌的Home設備,用戶(hù)即可檢查附近的沃爾瑪門(mén)店里有沒(méi)有自己喜歡的運動(dòng)鞋,或是預訂一臺平板電視當日提取。如果你不知道離你最近的沃爾瑪在哪兒,它也能幫你找到。
而視覺(jué)識別技術(shù)(它可以看作是人工智能語(yǔ)音識別技術(shù)的小弟,這種技術(shù)早就被用來(lái)在人群中對比罪犯了)的興起,將使人們在這些設備上購物變得更加便利。今年9月,亞馬遜宣布,它正在用Snapchat相機測試一款新應用。消費只要用Snapchat的相機拍下某個(gè)產(chǎn)品或者條形碼的照片,就能在屏幕上看到亞馬遜的產(chǎn)品頁(yè)面。不難想象,要不了多久,用戶(hù)就能在他們EchoShow上實(shí)現類(lèi)似功能,到時(shí)候用戶(hù)不光能看見(jiàn)產(chǎn)品的價(jià)格和評價(jià),估計還能看見(jiàn)該產(chǎn)品是否支持Prime的兩天免費快遞上門(mén)服務(wù)。
雖然這項技術(shù)的前景令人興奮,可是對那些對高科技不敏感的人來(lái)說(shuō),他們可能得花一些時(shí)間,才能習慣跟機器對話(huà)。現在很多科技公司的社會(huì )公信力不高,他們必須得讓消費者相信,這些設備并不是在出于邪惡的原因在竊聽(tīng)他們。實(shí)際上,智能揚聲器只有檢測到“喚醒詞”才會(huì )切換到對話(huà)模式,比如“Alexa”或者“HeyGoogle”。今年5月,亞馬遜不小心將一位波特蘭市的高管與他妻子關(guān)于地板的一段對話(huà)發(fā)送給了他的一名員工。亞馬遜對此次事故公開(kāi)道歉,并表示它“曲解”了這段對話(huà)。
口頭指令的出錯可能要遠遠超過(guò)打字輸入的命令。有些時(shí)候,你甚至可能為此付出代價(jià)。比如去年,達拉斯的一個(gè)6歲的小女孩在跟Alexa討論餅干和玩偶等話(huà)題。幾天后,快遞員就給她家送來(lái)了4磅餅干和一個(gè)價(jià)值170美元的玩偶。亞馬遜表示,Alexa是有家長(cháng)控制功有的,如果啟用了該功能,這次事故本不會(huì )發(fā)生。
不管怎樣,人工智能語(yǔ)音識別的大規模采用很可能會(huì )是自然而然的事,畢竟它給我們帶來(lái)了更多的便利。目前,全球的人工智能語(yǔ)音識別設備已經(jīng)超過(guò)1億臺,語(yǔ)音成為人與機器的主要交互媒介只不過(guò)是個(gè)時(shí)間問(wèn)題——哪怕有時(shí)這種對話(huà)只是毫無(wú)營(yíng)養的惡搞和尬笑。(財富中文網(wǎng))
本文作者布萊恩·杜梅因撰寫(xiě)的關(guān)于亞馬遜的一本新書(shū)即將由斯克里布納出版社出版。
本文原載于2018年11月1日刊的《財富》雜志。
譯者:樸成奎