CTI論壇(ctiforum.com)7月14日消息(編譯/老秦): 位于猶他州的Cypher已經(jīng)開(kāi)發(fā)出一種技術(shù),這種技術(shù)利用深層神經(jīng)網(wǎng)絡(luò )來(lái)識別語(yǔ)音元素,去除語(yǔ)音通信中的背景噪聲。

根據Cypher的CEO約翰·沃克(John Walker)和首席戰略官約翰·尹(John Yoon)的介紹,除了神經(jīng)網(wǎng)絡(luò )技術(shù),這個(gè)解決方案還使用了數學(xué)和模式識別技術(shù)來(lái)檢測人的聲音,將噪音與主要講話(huà)者的聲音相隔離,忽略所有的背景噪聲。

沃克(Walker)介紹說(shuō),在最近的測試中,該項技術(shù)在A(yíng)mazon Echo's Alexa上的自動(dòng)語(yǔ)音識別過(guò)濾精度提高了121%,這是當背景噪聲存在時(shí)候的數據。他補充說(shuō),測試包括相當復雜的查詢(xún),比如一個(gè)特定城市的天氣如何,這不是僅需要一個(gè)字來(lái)回答的簡(jiǎn)單問(wèn)題。總的來(lái)說(shuō),測試包括了195種開(kāi)放式查詢(xún)。
據該公司介紹,ASR過(guò)濾解決方案完全是基于軟件的,可以嵌入到現有的芯片當中。
沃克說(shuō),背景噪音問(wèn)題越來(lái)越困擾大多數時(shí)間依靠移動(dòng)設備進(jìn)行通信的人群,他們經(jīng)常處于嘈雜的環(huán)境當中,并且越來(lái)越依賴(lài)個(gè)人助理Alexa等工具。
在Cypher與Harris于今年早些時(shí)候進(jìn)行的一項調查顯示,61%的手機用戶(hù)表示由于背景噪音的存在他們不得不結束通話(huà)。吵鬧的環(huán)境例如餐館或咖啡館(67%)、嬰兒啼哭的地方(49%)、繁忙的城市人行道(47%)和機場(chǎng)(39%)。
調查還發(fā)現,有近四分之三(74%)的手機用戶(hù)對手機是否可以控制背景噪音這樣的功能感興趣。
按照Cypher高管的說(shuō)法,這個(gè)調查結果顯示,市場(chǎng)急需一個(gè)更好的解決方案來(lái)處理背景噪音。

“所有其他的降噪解決方案將其看作是一個(gè)聲音問(wèn)題,”尹(Yoon)說(shuō)。“而我們的首席執行官約翰·沃克(John Walker)和我們的團隊的大部分人則將它看作是一個(gè)計算機科學(xué)問(wèn)題,所以他們著(zhù)重于深層神經(jīng)網(wǎng)絡(luò ),而不是尋求抑制噪聲,用這種方式研究語(yǔ)音匹配模式。”
根據尹(Yoon)的說(shuō)法,這種技術(shù)致力于發(fā)現語(yǔ)音元素,通過(guò)移動(dòng)設備或個(gè)人助理處理引擎傳遞這些元素。因此,Cypher技術(shù)的表現要三到四倍地優(yōu)于現有最好的降噪方案,尹(Yoon)介紹說(shuō)。
這項技術(shù)將在今年秋季與思科一起進(jìn)入公共安全市場(chǎng)(警察、消防等),沃克(Walker)介紹說(shuō)。
沃克補充道,根據調查,對于當今的噪音消除解決方案,電話(huà)運營(yíng)商、消費者、提供私人助理解決方案的企業(yè)以及使用它們的人們都不是很滿(mǎn)意的,所以他希望Cypher的技術(shù)在一年內獲得市場(chǎng)的認可。
聲明:版權所有 非合作媒體謝絕轉載
聲明:版權所有 非合作媒體謝絕轉載