雖然這些問(wèn)題的解決方案很好,但壞消息是,在未來(lái)一段時(shí)間內,其中一些問(wèn)題仍將存在于語(yǔ)音服務(wù)中。它們并不反映缺乏某些技術(shù),而是人性和人際關(guān)系方面的因素。
下面,我們將討論語(yǔ)音服務(wù)中存在的三個(gè)問(wèn)題以及解決這些問(wèn)題的方法。
1.Robocalling(機器人呼叫)
機器人呼叫或舊式的垃圾語(yǔ)音郵件繼續影響著(zhù)語(yǔ)音服務(wù)。隨著(zhù)語(yǔ)音機器人的發(fā)展,達到了一個(gè)新的水平。以前,垃圾語(yǔ)音郵件存在合理的物理限制 -- 運營(yíng)商一次只能撥打一個(gè)電話(huà)。如今,自動(dòng)呼叫中心每分鐘可以處理數百到數千個(gè)呼叫。
解決方案往往有兩種形式。首先,許多國家的監管措施對邪惡的搶劫者實(shí)施法律處罰,對涉及個(gè)人數據的機器人呼叫計劃進(jìn)行更嚴厲的處罰。其次,科技公司正在反擊。例如,谷歌在Pixel中引入了一種智能應答機,可以“回答”來(lái)電。如果程序算法將呼叫識別為“垃圾語(yǔ)音郵件呼叫”,則程序會(huì )掛斷。
這是一個(gè)有趣的解決方案,但所要求的資源龐大。而且,Google Pixel電話(huà)用戶(hù)數量與世界上的電話(huà)用戶(hù)總數量相比是很少的,如果運營(yíng)商將這樣的智能助理包括在他們的線(xiàn)路中,他們的網(wǎng)絡(luò )就會(huì )“癱瘓”,因為整個(gè)基礎設施幾乎每天都需要分析數十億的呼叫。
邪惡的搶劫者也不會(huì )懶散地坐著(zhù)。繞過(guò)各種防范的形式層出不窮,不誠實(shí)的搶劫者將繼續,直到他們看到投資回報。這就是電話(huà)垃圾郵件無(wú)法徹底根除的主要原因。
2、互連問(wèn)題
世界上有許多電信運營(yíng)商,每個(gè)運營(yíng)商的基礎設施運行良好 -- 只要你留在網(wǎng)絡(luò )中。如果您在同一個(gè)基礎架構中撥打電話(huà),您的呼叫將以高質(zhì)量和無(wú)失真的方式通過(guò)。但是,當有人呼叫網(wǎng)絡(luò )外部的基于云的聯(lián)絡(luò )中心時(shí),呼叫會(huì )“流過(guò)”電話(huà)網(wǎng)絡(luò )并產(chǎn)生較低質(zhì)量的記錄。反過(guò)來(lái)也一樣。結果,呼叫者和呼叫中心員工(人或機器人)都要忍受低質(zhì)量的音頻。
這個(gè)問(wèn)題是全球性的,可以通過(guò)創(chuàng )建一個(gè)公共網(wǎng)絡(luò )來(lái)解決 -- 而不是互聯(lián)網(wǎng)。在這種情況下,互聯(lián)網(wǎng)的最初目的是:將不同的網(wǎng)絡(luò )連接到一個(gè)全球系統中。當語(yǔ)音從一個(gè)網(wǎng)絡(luò )移動(dòng)到另一個(gè)網(wǎng)絡(luò )時(shí),問(wèn)題就開(kāi)始了,部分解決方案將是無(wú)處不在的5G實(shí)施。這將允許最大數量的用戶(hù)應用各種VoIP解決方案,避免使用通常的電話(huà)網(wǎng)絡(luò )。
5G可能過(guò)于樂(lè )觀(guān),不僅僅是語(yǔ)音服務(wù)方面。即使在實(shí)施階段之后,也不會(huì )涵蓋所有運營(yíng)商。因此,互連問(wèn)題仍然存在。與電話(huà)語(yǔ)音垃圾郵件相比,我們至少可以看到語(yǔ)音質(zhì)量將逐年提高的可能性。
3、電話(huà)會(huì )議音頻質(zhì)量
第三個(gè)問(wèn)題,主要是商業(yè)用戶(hù)面臨的問(wèn)題,是電話(huà)會(huì )議期間聲音的平庸質(zhì)量。這個(gè)問(wèn)題的傳統解決方案是對房間進(jìn)行“聲音”準備,最大限度地減少來(lái)自墻壁的聲波反射(相同的回聲和隆隆聲),減少來(lái)自外部聲源的聲音的穿透,并確定揚聲器的最佳布置和麥克風(fēng)基于預測的呼叫參與者數量。這不是最經(jīng)濟實(shí)惠的方法,是主要針對大公司的。
另一種方式是人工智能(AI),它實(shí)時(shí)處理外呼信號,“切斷”不必要的噪音并強調語(yǔ)音本身。這是一個(gè)真正的計算挑戰,因為意外的噪音是不同的,可以不斷變化。已有解決方案(Krisp,Solicall等),但不可能稱(chēng)它們是放之四海而皆準的。這樣的系統還有很長(cháng)的路要走,盡管它們今天做得很好。
要完善其他技術(shù),比如現場(chǎng)語(yǔ)音翻譯,還有很多工作要做。谷歌正在積極研究它,但這些系統目前處于活躍的機器學(xué)習階段。在運行中,這是一項非常困難的任務(wù),因為與機器翻譯不同,機器已經(jīng)學(xué)會(huì )做,語(yǔ)音包含許多細微差別。如果你在翻譯中失去了它們,那么你所說(shuō)的內容的含義就會(huì )大不相同。
回顧一下,這就是語(yǔ)音服務(wù)及其臭名昭著(zhù)的問(wèn)題:
- 在機器人的幫助下進(jìn)行大量語(yǔ)音垃圾郵件呼叫。監管機構和技術(shù)公司正在解決語(yǔ)音垃圾郵件問(wèn)題,但機器人呼叫將在未來(lái)一段時(shí)間內與我們如影隨形。
- 互連時(shí)傳輸信號的質(zhì)量問(wèn)題。到目前為止,該解決方案似乎是5G的大規模實(shí)施和VoIP的全球使用。但是,這不會(huì )立刻發(fā)生。
- 電話(huà)會(huì )議期間溝通質(zhì)量差。通過(guò)改進(jìn)能夠實(shí)時(shí)處理信號的AI,這個(gè)問(wèn)題正逐漸得到解決。
聲明:版權所有 非合作媒體謝絕轉載
作者:阿列克謝·艾拉羅夫(Alexey Aylarov)
原文網(wǎng)址:https://www.nojitter.com/video-collaboration-av/3-problems-still-facing-voice-services