隨著手機(jī)性能的提高，手游開始向復(fù)雜化發(fā)展。不再是以消消樂這種簡(jiǎn)單的小游戲?yàn)橹�，RPG、實(shí)時(shí)對(duì)戰(zhàn)類游戲開始變火。

　　這種游戲，由于有玩家間的交互，有團(tuán)隊(duì)作戰(zhàn)、配合，保證玩家能夠進(jìn)行實(shí)時(shí)語(yǔ)音通話，成為極大的需求。

　　本文將說明游戲語(yǔ)音通話的難點(diǎn)在哪？

　　現(xiàn)在的游戲語(yǔ)音通話解決方案存在什么問題？

　　目前有兩種解決方案：

　　1、第三方通話APP

　　這種方案，第三方的APP獨(dú)立在后臺(tái)運(yùn)行，比如YY語(yǔ)音手機(jī)版。這種方案存在兩個(gè)問題：

音效和語(yǔ)音的音量無法控制在一個(gè)合理比例，無法統(tǒng)一調(diào)節(jié)；
APP在后臺(tái)運(yùn)行，會(huì)自己關(guān)閉，或者掉線。
對(duì)手機(jī)性能要求很高，容易增加耗電量，造成手機(jī)發(fā)燙。

　　2、集成在游戲APP里的語(yǔ)音功能。

　　這種方案存在的問題是：

　　由于適配問題，安卓機(jī)型上游戲音效會(huì)被對(duì)方聽到，或者說話會(huì)有回聲。

　　游戲語(yǔ)音通話方案最注重什么？

　　1、游戲玩家最關(guān)心游戲語(yǔ)音的實(shí)時(shí)性。

　　高對(duì)戰(zhàn)游戲處處要求快，要求低延時(shí)。網(wǎng)游中，團(tuán)隊(duì)下副本，最影響團(tuán)隊(duì)成功率的就是加血的角色。一旦這個(gè)人加血加慢了，導(dǎo)致一個(gè)人犧牲。在激烈的時(shí)候，損失一個(gè)人的代價(jià)基本就宣判團(tuán)隊(duì)的死刑。

　　從技術(shù)的角度而言，要求的不是加血快，是加血的流程快。我們之前和強(qiáng)大的競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)PC上游戲通信軟件地位的時(shí)候，是什么案例讓我們活下來，就是一個(gè)加血的案例。我們用對(duì)手的軟件，隊(duì)友說，加血，加血。結(jié)果等了1s~2s才傳到保姆那里�？上攵€沒加，就掛了。而用我們的軟件，加血成功的概率提高了幾倍幾十倍。就算跨國(guó)玩游戲，我們延時(shí)也不過百毫秒。所以當(dāng)時(shí)，玩家像愛惜槍一樣愛惜、使用我們的軟件。

　　2、游戲廠商最關(guān)心的是占用系統(tǒng)資源量和耗電量

　　游戲廠商如果選擇語(yǔ)音通話SDK集成方案，那么SDK占用系統(tǒng)資源量和耗電量會(huì)起到很大的影響因素。SDK編解碼器、前后端處理性能差，造成手機(jī)CPU、內(nèi)存吃緊，會(huì)影響游戲體驗(yàn)，游戲卡，讓手機(jī)發(fā)燙，導(dǎo)致手機(jī)耗電量增加。這對(duì)一個(gè)游戲來說，是致命的硬傷。

　　這些恰恰是聲網(wǎng)Agora音視頻引擎通過多年研發(fā)和技術(shù)積累能給大家提供的技術(shù)特性和產(chǎn)品特性。聲網(wǎng)Agora。io實(shí)時(shí)云技術(shù)團(tuán)隊(duì)，曾經(jīng)提供10億分鐘每天的運(yùn)營(yíng)支撐，最多180w人同時(shí)在一個(gè)頻道內(nèi)實(shí)時(shí)視頻直播服務(wù)。并且可以提供多聲道甚至帶有垂直聲道的音頻音效系統(tǒng)。并提供“軍用”級(jí)的低延時(shí)傳輸系統(tǒng)。通過這些來助力VR游戲?qū)崿F(xiàn)通信和直播的業(yè)務(wù)需求。

　　接下來，就以聲網(wǎng)Agora.io的語(yǔ)音通話SDK為例，說明SDK解決方案如何解決這些問題。

　　聲網(wǎng)Agora.io是如何做的

　　通常整套的實(shí)時(shí)云通信系統(tǒng)概述下來包括后臺(tái)技術(shù)、客戶端技術(shù)和運(yùn)維技術(shù)等等。

　　全高清音頻通信系統(tǒng)，首先要怎么搭建這樣一個(gè)系統(tǒng)，通常搭建一個(gè)最小音頻子系統(tǒng)分成下面幾個(gè)步驟：

　　1、采集播放。如果把采集的數(shù)據(jù)存成文件，或是交給播放，就形成一個(gè)閉環(huán)，我稱他為第一閉環(huán)，也可以稱為ADM（audio device module）。

　　2、編碼解碼。只有采集播放還不夠，數(shù)據(jù)量太大，還要加上編碼解碼，進(jìn)行數(shù)據(jù)壓縮，采集壓縮后的數(shù)據(jù)再解壓縮播放，我稱他為第二閉環(huán)，加上的這個(gè)編解碼模塊叫作ACM（audio coding module）。

　　3、網(wǎng)絡(luò)模塊。實(shí)現(xiàn)網(wǎng)絡(luò)發(fā)送接收，ANM（audio network module），我叫他第三閉環(huán)。

　　4、前后處理模塊。也就是第四閉環(huán)，Audio Processing module。這個(gè)模塊主要實(shí)現(xiàn)3A引擎：回聲消除AEC，增益控制AGC，噪聲抑制ANS。

　　1.回聲消除

　　AEC是3A引擎的一部分，是很重要的一部分，為什么第一個(gè)問題就是它。因?yàn)槟闷痣娫挘悄愦虿煌�，打通了，不管質(zhì)量怎么樣，聲音一出來就是回聲，我在音頻行業(yè)做了11年，說長(zhǎng)不長(zhǎng)說短不短，深知國(guó)內(nèi)公司做音頻通常有個(gè)一很好的標(biāo)準(zhǔn)，“出聲就行”。但是沒有回聲消除，你出聲就是噪聲，最基本的底線都滿足不了。

　　那么，是什么問題困擾我們這么久，它就是回聲，準(zhǔn)確說是聲學(xué)回聲。自己的聲音傳到遠(yuǎn)端再通過遠(yuǎn)端的麥克風(fēng)錄音傳回來，就是回聲�；芈晱男盘�(hào)特性上看，有線性部分和非線性部分�；芈曄褪且ㄟ^信號(hào)處理算法消除這些回聲，消除回聲的線性部分和非線性部分。有電話的年頭就有回聲，早期是線路回聲，都是線性的，很好處理，一個(gè)自適應(yīng)濾波器，搞定了。

　　回聲消除的算法算算也有幾十年了，為什么今天還要研究？不是搞定了嗎，一個(gè)自適應(yīng)濾波就搞定了。不是的，回聲問題和設(shè)備緊密相關(guān)。一個(gè)回聲消除算法的設(shè)計(jì)實(shí)現(xiàn)和其他算法設(shè)計(jì)實(shí)現(xiàn)有很大的區(qū)別，因?yàn)樗驮O(shè)備緊密相關(guān)，和系統(tǒng)狀態(tài)緊密相關(guān)。早期，GIPS和某些AEC算法提供公司，通常設(shè)計(jì)AEC模塊的時(shí)候，都是給固定電話和移動(dòng)電話設(shè)備設(shè)計(jì)，是給定的一款設(shè)備，也就是說，芯片廠商設(shè)計(jì)公版硬件，找合作伙伴或是自己設(shè)計(jì)AEC模塊，然后針對(duì)該款設(shè)備調(diào)試AEC參數(shù)，調(diào)好之后就不變了，以后所有該款設(shè)備的出貨都用這組參數(shù)，一旦換了設(shè)備，軟件要重新調(diào)。當(dāng)初GIPS，SpritDSP就是做這些事情的公司。如果有人參與過手機(jī)出廠的回聲消除設(shè)計(jì)，你就知道每款手機(jī)的回聲消除參數(shù)都不同。

　　那么為什么回聲消除為什么和手機(jī)設(shè)備關(guān)系這么大呢？是信號(hào)特性決定的，回聲是聲音經(jīng)過揚(yáng)聲器傳導(dǎo)到mic，經(jīng)過了多少路徑就被處理多少次。通常手機(jī)由于聲腔的原因，沒辦法設(shè)計(jì)的音量很大所以當(dāng)你放大音量的時(shí)候，如果是10格調(diào)整的音量放大器，前5格還是線性放大，5格以上就是非線性放大，這是揚(yáng)聲器第一級(jí)處理。

　　聲音從外部傳給mic，經(jīng)過空氣和手機(jī)殼，設(shè)備殼的特性的傳導(dǎo)作用產(chǎn)生第二級(jí)的非線性影響。不同的手機(jī)殼，鐵殼，塑料殼，甚至手機(jī)殼發(fā)熱導(dǎo)致聲傳導(dǎo)特性不一樣，都會(huì)影響聲音傳導(dǎo)的處理，導(dǎo)致回聲消除算法不一樣。我曾經(jīng)遇到過，一套收回聲消除算法，換不換殼，就能決定算法工不工作。這是手機(jī)。

　　還有pc，如果pc外接音箱，音箱一般多少都會(huì)自帶功放，又是非線性放大。設(shè)備mic的位置也緊密相關(guān)，早期有一款thinkpad，mic和speaker離的非常近，極其難處理。談來談去，好像都是非線性放大的問題嘛，是的，線性的東西是科學(xué)，非線性的東西是藝術(shù)�？梢哉f，設(shè)備的差異性導(dǎo)致非線性問題，非線性信號(hào)的處理是回聲消除技術(shù)的第一個(gè)攔路虎。

　　非線性回聲問題是不是全部呢？不是的。回聲消除除了和設(shè)備有關(guān)，還和系統(tǒng)有關(guān)和系統(tǒng)有什么關(guān)系，回聲消除兩大模塊，自適應(yīng)濾波和非線性處理，一個(gè)是線性處理，一個(gè)是非線性處理。上一段說了非線性處理，線性處理部分還有問題，自適應(yīng)濾波前置第一個(gè)模塊就是延時(shí)搜索，其實(shí)WebRtc本身的延時(shí)搜索技術(shù)是非常先進(jìn)的，是由這個(gè)領(lǐng)域的大牛Keilgn大師設(shè)計(jì)的專利技術(shù)。但是大師東西雖好，但是有個(gè)依賴，延時(shí)估計(jì)要在一定范圍內(nèi)估計(jì)，就是要有一個(gè)預(yù)先設(shè)計(jì)的值，如果在一個(gè)很大的范圍內(nèi)搜索，會(huì)極大消耗CPU資源。而這個(gè)預(yù)設(shè)的delay值通常不準(zhǔn)，為什么不準(zhǔn)呢？因?yàn)榘沧肯到y(tǒng)線程調(diào)度設(shè)計(jì)不是很實(shí)時(shí)導(dǎo)致。一旦資源搶占，會(huì)在安卓底層buffer產(chǎn)生莫名的延時(shí)導(dǎo)致delay不準(zhǔn)。還是那個(gè)問題，每款手機(jī)甚至每個(gè)手機(jī)都不一樣。我遇到過一種情況，某國(guó)內(nèi)手機(jī)品牌，不同款手機(jī)delay不準(zhǔn)，同款手機(jī)不同子款比如（帶不帶s）。同款手機(jī)不同批次，delay不同，同款手機(jī)同一批次不同時(shí)間測(cè)試delay都不同。如何拿到穩(wěn)定的低延時(shí)的聲音信號(hào)，為此，谷歌專門有個(gè)一視頻教程。無奈，安卓手機(jī)的碎片化和私人裁剪導(dǎo)致這個(gè)問題無法一致性解決。

　　那么Agora怎么做的呢，Agora的回聲消除技術(shù)，發(fā)展到今天，已經(jīng)是第四代回聲消除技術(shù)。

　　聲網(wǎng)Agora的第三代回聲消除技術(shù)，通過逐個(gè)機(jī)型的適配。累計(jì)適配了幾百款機(jī)型，而我們的第四代“免”適配技術(shù)保證我們實(shí)現(xiàn)4000款機(jī)型的適配。

　　聲網(wǎng)Agora的“免”適配，免帶一個(gè)小引號(hào)。聲網(wǎng)Agora的免適配和適配相互配合，適配的機(jī)型，效果更好。不適配的機(jī)型是公版算法，基本也沒有大問題，一般不會(huì)出現(xiàn)整句回聲。只會(huì)間或的出現(xiàn)小回聲，比如2分鐘1次，或是10分鐘1次的殘留回聲。很小的回聲也會(huì)有，不想適配過的手機(jī)，你完全聽不到回聲。適配的機(jī)型，聲網(wǎng)Agora有整套測(cè)試方法驗(yàn)證；免適配的機(jī)型，聲網(wǎng)Agora依靠線上數(shù)據(jù)的反饋，判斷“免”的效果。也正是依賴聲網(wǎng)Agora線上數(shù)據(jù)的反饋，才能做到“免”適配。

　　如果線上數(shù)據(jù)反映效果不好，聲網(wǎng)Agora會(huì)嘗試聯(lián)系用戶和采購(gòu)機(jī)型進(jìn)行適配。正是因?yàn)槁暰W(wǎng)Agora充分適配了足夠多的機(jī)型，接觸過各式各樣的回聲消除技術(shù)和歷史才有這個(gè)把握掌握開發(fā)進(jìn)階技術(shù)。如果“免”適配技術(shù)無法滿足，立刻有適配技術(shù)補(bǔ)上。結(jié)合聲網(wǎng)Agora網(wǎng)絡(luò)傳輸?shù)膬?yōu)勢(shì)，“免”適配和適配互相配合，助力聲網(wǎng)Agora實(shí)現(xiàn)很好的回聲消除效果。當(dāng)然回聲消除只是我們APM引擎的一部分。在APM里，還有降噪技術(shù)，單麥克降噪雙麥克降噪，聲網(wǎng)Agora在個(gè)別機(jī)型上開啟了雙mic降噪功能。

　　2.測(cè)試評(píng)估

　　聲網(wǎng)Agora的評(píng)估體系有三個(gè)層次：

　　第一層次，客觀測(cè)試。我們把手機(jī)出廠測(cè)試和VOIP測(cè)試相結(jié)合，提出了我們的測(cè)試方法、這個(gè)測(cè)試方法是ITU、3GPP、ETSI或是電信運(yùn)營(yíng)商要求測(cè)試的標(biāo)準(zhǔn)通信測(cè)試的交集。按照這套方法，我們經(jīng)常會(huì)去泰爾實(shí)驗(yàn)室做客觀測(cè)試。國(guó)內(nèi)我們是第一個(gè)互聯(lián)網(wǎng)廠家把這套測(cè)試用在云服務(wù)標(biāo)準(zhǔn)上的。

　　第二個(gè)層次，主觀測(cè)試。因?yàn)榭陀^測(cè)試只是一個(gè)基本測(cè)試，很多手機(jī)出廠都做，但是出廠之后還是有很多很多問題，尤其對(duì)我們這樣的全平臺(tái)多機(jī)型通信引擎，只做客觀測(cè)試是不夠的，所以我們定義出很多細(xì)的標(biāo)準(zhǔn)，比如，聲音質(zhì)量、卡、失真、回聲情況、雙講情況、是否有切音、延時(shí)等等。安排測(cè)試人員，對(duì)海量機(jī)型，逐個(gè)機(jī)器逐個(gè)機(jī)型的去聽，去感受我們音頻的效果。

　　第三個(gè)層次，線上測(cè)試。也就是線上用戶的使用反饋，我們兩個(gè)DemoAPP，一個(gè)就是我們的Beckon，可以在AppStore搜索到，這個(gè)APP是我們用來做實(shí)驗(yàn)和演示的。用戶可以體驗(yàn)Beckon的效果，我們收集用戶的反饋，判斷我們音頻系統(tǒng)的質(zhì)量。

　　通過這三個(gè)層次的測(cè)試，我們能保證提供最好的音頻通信引擎。高清音頻通信引擎，整個(gè)通信系統(tǒng)都是32khz音頻采樣頻率，對(duì)系統(tǒng)的ADM，APM，ACM，ANM要求的處理算法都針對(duì)32Khz。我們比通信標(biāo)準(zhǔn)更早的把32Khz代入實(shí)際應(yīng)用，今天VoLTE還沒有普及全高清音頻傳輸系統(tǒng)，而我們做到了。

　　本文作者：

　　高澤華，11年音樂語(yǔ)音編解碼學(xué)習(xí)經(jīng)驗(yàn)。理解幾十種音頻編解碼標(biāo)準(zhǔn)。先后在中磊電子、士蘭微電子、虹軟科技主導(dǎo)音頻項(xiàng)目。任職YY期間負(fù)責(zé)語(yǔ)音音頻技術(shù)工作。對(duì)音頻算法在芯片設(shè)計(jì)、嵌入式系統(tǒng)、桌面軟件。在互聯(lián)網(wǎng)應(yīng)用和專利分析方面有多年研發(fā)經(jīng)驗(yàn)和積累。目前負(fù)責(zé)聲網(wǎng)Agora。io的音頻開發(fā)工作。

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

聲網(wǎng)Agora：游戲的語(yǔ)音通話解決方案

評(píng)論排行

推薦閱讀

專題