
美國馬里蘭大學(xué)(University of Maryland)的4名研究人員近日發(fā)表一自動(dòng)化系統unCAPTCHA,宣稱(chēng)可破解由Google打造的語(yǔ)音版reCAPTCHA,且準確率高達85.15%,并已藉由GitHub釋出了該系統。
Google的reCAPTCHA為全球最受歡迎的CAPTCHA系統之一,透過(guò)圖像來(lái)驗證來(lái)者是人類(lèi)或機器人,以保護網(wǎng)路服務(wù)不被龐大的機器人所侵襲,估計至少有數十萬(wàn)個(gè)網(wǎng)站采用reCAPTCHA。至於語(yǔ)音版的reCAPTCHA則是專(zhuān)為視障人士所設計,它在吵雜的背景環(huán)境中以不同的速度、音調或口音念出數字,并要求使用者填入所聽(tīng)見(jiàn)的數字。
而unCAPTCHA系統即是基於語(yǔ)音轉換成文字的技術(shù),先下載語(yǔ)音版的CAPTCHA,把這些語(yǔ)音切割成個(gè)別的數字音頻,再將各個(gè)數字音頻上傳到網(wǎng)路上的各種語(yǔ)音轉文字服務(wù),然後把這些服務(wù)的回應修改成數字,例如倘若聽(tīng)起來(lái)像是「True」,那麼可以假設這個(gè)數字是「Two」,整合這些不同服務(wù)的結果,并將數字回傳至答案上。
unCAPTCHA所利用的線(xiàn)上語(yǔ)音轉換文子服務(wù)涵蓋了IBM、Google Cloud、Google Speech Recognition、Sphinx, Wit-AI與Bing Speech Recognition。
在研究人員的測試中,unCAPTCHA辨識個(gè)別數字的準確率高達92%,而整串CAPTCHA的準確率也達到85%以上。