“聞聲識人”正在移動(dòng)支付領(lǐng)域拉開(kāi)應用大幕。近日,中國人民銀行正式發(fā)布了金融行業(yè)第一個(gè)生物識別技術(shù)標準《移動(dòng)金融基于聲紋識別的安全應用技術(shù)規范(標準編號:JR/T0164-2018)》(下稱(chēng)標準)。該標準由中國建設銀行、清華大學(xué)、北京得意音通技術(shù)有限責任公司(下稱(chēng)得意音通)等34家主要起草單位,歷時(shí)3年完成。
清華大學(xué)信息技術(shù)研究院教授、得意音通創(chuàng )始人鄭方認為,該標準的頒布,標志著(zhù)以聲紋識別為代表的生物特征識別技術(shù)首次得到金融監管部門(mén)的認可,形簡(jiǎn)意豐的語(yǔ)音信號可以為金融安全保駕護航,開(kāi)啟無(wú)監督情形下一種全新的“聲紋+”身份認證方式。
技術(shù)具有多重優(yōu)勢
什么是聲紋識別?簡(jiǎn)單地說(shuō),就是通過(guò)聲音進(jìn)行說(shuō)話(huà)人身份識別的過(guò)程。鄭方解釋?zhuān)Z(yǔ)音信號之所以被形容為“形簡(jiǎn)意豐”,是因為聲音包含有內容、身份、情感、年齡及健康狀況等豐富的信息。人類(lèi)語(yǔ)言的產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復雜的生理物理過(guò)程,理論上說(shuō),每個(gè)人說(shuō)話(huà)時(shí)的短時(shí)頻譜特征、聲源特征、時(shí)序動(dòng)態(tài)特征、韻律特征、語(yǔ)言學(xué)特征等都有差異,因此聲紋就像指紋一樣具有唯一性和獨特性。
2002年成立的得意音通是國內最早從事聲紋識別技術(shù)研發(fā)的企業(yè)之一,當時(shí)這一領(lǐng)域的研究機構不到5家。近年來(lái),隨著(zhù)移動(dòng)金融市場(chǎng)的快速發(fā)展,其對安全認證技術(shù)的需求隨之加大,加之聲紋識別技術(shù)的不斷發(fā)展,市場(chǎng)上涌現了不少投資聲紋識別技術(shù)的企業(yè)。從目前應用來(lái)看,聲紋識別主要分為聲紋辨認和聲紋確認兩類(lèi),前者用以判斷某段語(yǔ)音是若干人中的哪一個(gè)所說(shuō)的,是“多選一”問(wèn)題,已應用于公安技偵和國防監聽(tīng)等領(lǐng)域;而后者用以確認某段語(yǔ)音是否是指定的某個(gè)人所說(shuō)的,是“一對一判別”問(wèn)題,主要用于移動(dòng)金融、社保生存認證、聲紋鎖控等領(lǐng)域。
隨著(zhù)投資界和產(chǎn)業(yè)界對聲紋識別技術(shù)的投入加大,近年來(lái)該領(lǐng)域的專(zhuān)利申請也呈現快速增長(cháng)態(tài)勢。2013年,得意音通提交了“基于動(dòng)態(tài)密碼語(yǔ)音的身份確認系統及方法”的專(zhuān)利申請(專(zhuān)利號:ZL201310123555.0),并基于該專(zhuān)利開(kāi)發(fā)了“聲密保”聲紋識別系統。需要認證時(shí),該系統會(huì )隨機產(chǎn)生一組動(dòng)態(tài)碼(如6位或8位數字)要求用戶(hù)朗讀,系統對用戶(hù)讀出的聲音進(jìn)行語(yǔ)音識別并將識別的內容與發(fā)出的動(dòng)態(tài)碼數字進(jìn)行比對,同時(shí)系統對用戶(hù)的發(fā)音進(jìn)行聲紋比對,兩種認證手段都通過(guò)時(shí)才判斷通過(guò)。據介紹,通過(guò)核心專(zhuān)利和外圍專(zhuān)利布局,得意音通圍繞“聲密保”建立了內外兩層專(zhuān)利墻。
中國建設銀行在手機銀行和ATM上采用的聲紋識別技術(shù),就是得意音通的“聲密保”方案。相比其他生物特征識別,業(yè)內人士認為,聲紋識別具有多重優(yōu)勢:金融領(lǐng)域的很多應用場(chǎng)景都是高頻使用,對用戶(hù)體驗方面的需求較高,如果驗證方式較為繁瑣,往往用戶(hù)難以接受,聲音信息一般不涉及用戶(hù)隱私問(wèn)題,聲音采集通過(guò)一個(gè)麥克風(fēng)或者電話(huà)、手機就可完成,用戶(hù)的接受度比較高;更重要的是,聲紋不易纂改,再加之聲音信號中含有語(yǔ)言信息、副語(yǔ)言信息和非語(yǔ)言信息,綜合利用聲音中蘊含的豐富信息可以具備較高的安全特性。
標準助力應用推廣
相比聲紋識別,起步更早的人臉識別、指紋識別等的應用更為廣泛,為什么移動(dòng)金融領(lǐng)域會(huì )首先推出聲紋識別標準呢?
鄭方認為,這還是基于聲紋識別技術(shù)在保障金融安全方面具有的技術(shù)優(yōu)勢。在一次標準專(zhuān)家評審會(huì )上,來(lái)自中央網(wǎng)信辦、公安部、國家信息中心、國家信息安全研究中心、中國銀聯(lián)、中國金融認證中心、中國科學(xué)院、中國社會(huì )科學(xué)院、清華大學(xué)等單位的院士專(zhuān)家一致認為,“聲紋識別技術(shù)在個(gè)人隱私保護、身份認證強度等方面有一定的優(yōu)勢”。
據了解,標準全面規定了移動(dòng)金融服務(wù)場(chǎng)景中基于聲紋識別的安全應用技術(shù)要求,適用于手機銀行等移動(dòng)金融服務(wù)中基于聲紋識別的開(kāi)發(fā)、檢測與應用。隨著(zhù)國際上對移動(dòng)支付安全性和個(gè)人隱私保護等問(wèn)題的日益重視,標準也將安全性和個(gè)人隱私保護擺到了突出位置。標準明確了聲紋注冊、驗證、變更、注銷(xiāo)等環(huán)節的基本需求,提出了采樣、抗噪音、防攻擊、抗時(shí)變等技術(shù)要求,對聲紋信息采集、傳輸、存儲、處理、刪除等全生命周期進(jìn)行了規范。
值得注意的是,聲紋識別應用也存在一些缺點(diǎn),比如同一個(gè)人的聲音易受身體狀況、年齡、情緒等影響,具有時(shí)變性,同時(shí)也會(huì )存在有人通過(guò)錄音或者人工合成的聲音來(lái)假冒的情況,因此,抗時(shí)變和防攻擊成為提高聲紋識別技術(shù)的準確率和安全性的關(guān)鍵所在。在此次標準制定過(guò)程中,抗時(shí)變要求和防攻擊要求都被寫(xiě)入了標準之中。鄭方表示,這些都是企業(yè)研發(fā)的重點(diǎn)和難點(diǎn)。得意音通很早就開(kāi)展了抗時(shí)變研究,并通過(guò)錄音檢測等技術(shù),推出了防假體攻擊的方案,但是隨著(zhù)人工智能合成技術(shù)和語(yǔ)音轉換技術(shù)的發(fā)展,相關(guān)防攻擊技術(shù)的研發(fā)還需不斷跟進(jìn)。
可喜的是,標準的制定為技術(shù)的推廣帶來(lái)了福音。鄭方介紹,以前在向金融機構介紹聲紋識別技術(shù)時(shí),對于這一新技術(shù),很多人不了解,也不知道應達到什么標準。有了這個(gè)標準之后,用戶(hù)將有章可循。目前,除了建設銀行外,浦發(fā)銀行、民生銀行信用卡中心、貴陽(yáng)銀行、蘭州銀行、西安銀行等均已在手機銀行中正式應用了聲紋識別技術(shù),中國銀聯(lián)也已經(jīng)啟動(dòng)在其數據平臺的身份認證模塊中集成聲紋識別功能。在互聯(lián)網(wǎng)金融行業(yè),中國互聯(lián)網(wǎng)金融協(xié)會(huì )在其統一身份核驗平臺集成了聲紋識別功能,螞蟻金服在支付寶產(chǎn)品、騰訊在微信平臺中也都開(kāi)始應用聲紋識別作為身份認證的安全手段。