蘋(píng)果的Siri語(yǔ)音助理也被爆料,一直在悄悄保存用戶(hù)錄音,并讓承包商對這些錄音進(jìn)行分析。
蘋(píng)果已秘密加入谷歌亞馬遜行列,使用承包商對其用戶(hù)錄音進(jìn)行分析。在一名舉報人將錄音帶到英國《衛報》(The Guardian)后,蘋(píng)果證實(shí)了這一做法。這人說(shuō),Siri查詢(xún)會(huì )定期發(fā)送給人類(lèi)聽(tīng)眾進(jìn)行更細致的分析,但蘋(píng)果在其隱私政策中并未披露。
據報導,這些錄音與蘋(píng)果身份認證(Apple ID)無(wú)關(guān),但可長(cháng)達數秒,包含個(gè)人性質(zhì)的內容,并與其它顯示資料如方位、應用程序資料和聯(lián)絡(luò )人詳細資訊配對。
與其它公司一樣,蘋(píng)果說(shuō)這些資料由真人搜集并分析,以改進(jìn)其服務(wù),且所有分析均由受保密協(xié)定約束的員工在安全設施中完成。而蘋(píng)果也沒(méi)有自動(dòng)承認這一做法。
蘋(píng)果告訴《衛報》,每天發(fā)送的查詢(xún)不到1%,但當蘋(píng)果于無(wú)意之間不斷談?wù)揝iri查詢(xún)數量時(shí),談到數以?xún)|計的設備也經(jīng)常使用該功能,1%則激增為成千上萬(wàn)了。
正如舉報人指出的,Siri錄音中包括:醫生和患者之間的私人交談、商業(yè)交易、好像是罪犯之間的交易、性接觸等。
Siri的某些錄音是出于偶然,這是為什么需要培訓才能收聽(tīng)并識別的原因之一。意外錄音有時(shí)長(cháng)達數秒,且包含大量個(gè)人資訊,即便不與數位識別碼直接綁定。
語(yǔ)音助理要想「掌握」一門(mén)語(yǔ)言,需要解決兩個(gè)問(wèn)題:聲音識別和聲音合成。其中聲音識別是對機器輸入資訊,又分為兩步,分別是:第一步,將語(yǔ)音轉成文字的語(yǔ)音識別;第二步,語(yǔ)義理解,這里就需要用到自然語(yǔ)言處理技術(shù)。
但就目前而言,就算各家宣傳把語(yǔ)音助理、智能音箱吹噓得功能強大,它們依然只是初級人工智能。想讓機器聽(tīng)懂人類(lèi)語(yǔ)言,并準確「聰明」回應,依然需要大量人工介入。
蘋(píng)果并不是第一家被爆語(yǔ)音助理對話(huà)錄音會(huì )被其他人聽(tīng)到的科技公司,當然也不會(huì )是最后一家。
今年4月,彭博社消息顯示,亞馬遜(Amazon)在全球雇用了數千名合同工,他們會(huì )聽(tīng)到某些來(lái)自Echo智能音箱的使用者語(yǔ)音請求,并負責注釋標記這些轉錄語(yǔ)音,以提高Alexa識別人類(lèi)語(yǔ)言的能力。
7月11日,谷歌(Google)證實(shí)于全球各地聘請承包商員工收聽(tīng)一小部分錄音,并表示搜集的部分音檔用于開(kāi)發(fā)語(yǔ)音識別系統,以更適應各種語(yǔ)言,提升使用者體驗。