
這是繼今年6月任小楓入職后,iDST迎來(lái)的又一位大牛級人物。
馮津偉曾就讀國內聲學(xué)研究機構南京大聲學(xué)研究所,師從音頻聲學(xué)泰斗沙家正先生,并與導師一起研制出了全球第一臺揚聲器紙盆共振頻率的自動(dòng)測試系統,極大地幫助了國內的電聲行業(yè)提高生產(chǎn)效率。馮津偉博士畢業(yè)于在主動(dòng)降噪領(lǐng)域著(zhù)名的弗吉尼亞理工大學(xué)VAL實(shí)驗室。
Polycom是語(yǔ)音和視頻協(xié)作解決方案領(lǐng)域的全球領(lǐng)導者,占全球視頻會(huì )議市場(chǎng)份額第一。馮津偉曾在Polycom工作17年,擁有十余項美國專(zhuān)利,大部分已產(chǎn)品化,是名聲在外的世界級音頻專(zhuān)家。他曾主持開(kāi)發(fā)基于麥克風(fēng)陣列的視頻跟蹤系統,即在多人視頻會(huì )議時(shí),攝像頭能基于方位和距離,精準定位發(fā)言人,產(chǎn)品創(chuàng )新性引業(yè)內效仿。
阿里巴巴iDST語(yǔ)音團隊負責人鄢志杰表示:
馮博士的入職,是物理學(xué)和互聯(lián)網(wǎng)間的‘跨界’。阿里嚴肅看待智能語(yǔ)音交互技術(shù)全鏈路,逐步組建世界級專(zhuān)家團隊。從源頭和信號采集開(kāi)始,在端上做突破性的智能語(yǔ)音交互體驗。
此前,iDST語(yǔ)音團隊的技術(shù)成果已通過(guò)阿里云人工智能ET等對外輸出,在法庭庭審識別、智能客服、視頻審核和實(shí)時(shí)字幕轉寫(xiě)、聲紋驗證、物聯(lián)網(wǎng)等多個(gè)場(chǎng)景成功應用。全國有近300家法院和超過(guò)6000家法庭在使用ET,每年有超過(guò)1.2億次客服電話(huà)由ET協(xié)助人類(lèi)接聽(tīng)。
在語(yǔ)音交互產(chǎn)品方面,阿里iDST研究的技術(shù)平臺能夠精準轉換用戶(hù)的語(yǔ)音為對互聯(lián)網(wǎng)內容和服務(wù)的意圖,觸達手機、IoT設備、互聯(lián)網(wǎng)汽車(chē)、電視、智能音箱等各類(lèi)終端,如與斑馬網(wǎng)絡(luò )、上汽合作的的榮威互聯(lián)網(wǎng)汽車(chē)、與海爾合作的人工智能電視等。
馮津偉入職后將依托其在聲學(xué)與信號處理領(lǐng)域的背景,主持領(lǐng)導語(yǔ)音交互設備端的研究工作。聲學(xué)是物理學(xué)分支學(xué)科之一,研究媒質(zhì)中機械波的產(chǎn)生、傳播、接收和效應。以時(shí)下最熱門(mén)的智能音箱為例,如何選擇麥克風(fēng)的材質(zhì)、擺放位置、結構,就是聲學(xué)設計要解決的問(wèn)題。
關(guān)于加入阿里巴巴,馮津偉認為是一次全新的機會(huì )。他表示,過(guò)去自己的專(zhuān)業(yè)知識基本用于會(huì )議模式,而未來(lái)阿里豐富的智能交互場(chǎng)景將為聲學(xué)設計與信號處理的發(fā)展提供寶貴的實(shí)戰經(jīng)驗。
馮津偉的研究方向為“下一代人機自然交互技術(shù)”,該領(lǐng)域已經(jīng)得到阿里巴巴重點(diǎn)投入,此前成立的“達摩院”就包含這一研究領(lǐng)域。
阿里巴巴iDST透露,馮津偉已參與一秘密項目開(kāi)發(fā),項目在全球沒(méi)有先例。
速記員

阿里云的人工智能ET在綜合了iDST的語(yǔ)音能力后已在全國近300家法院和超過(guò)6000家法庭承擔起“書(shū)記員”的角色,在現場(chǎng)做同步的庭審記錄,且在試點(diǎn)中準確率高達96.%。而此前ET曾憑準確率0.67%的微弱優(yōu)勢戰勝第50屆國際速聯(lián)速記大賽全球速記亞軍姜毅。
智能客服

阿里云還推出了智能語(yǔ)音客服機器人“云小蜜”,它支持中文英文會(huì )話(huà),可以7*24小時(shí)在線(xiàn)工作。目前,已覆蓋阿里巴巴生態(tài)圈二十余個(gè)業(yè)務(wù)線(xiàn),每天服務(wù)600萬(wàn)客戶(hù),問(wèn)題解決率達到95%。每年有超過(guò)1.2億次客服電話(huà)由ET協(xié)助人類(lèi)接聽(tīng)。
智能音箱

今年雙11,阿里人工智能實(shí)驗室的首個(gè)智能語(yǔ)音終端——天貓精靈,創(chuàng )造了破100萬(wàn)臺的驚人銷(xiāo)量,其強大的聲紋識別能力正來(lái)源于過(guò)往阿里在語(yǔ)音技術(shù)上的積累。

互聯(lián)網(wǎng)汽車(chē)
上汽與阿里耗資十億打造榮威i6互聯(lián)網(wǎng)汽車(chē)也在智能語(yǔ)音交互上有亮眼表現,通過(guò)斑馬智行App,駕駛員可以通過(guò)語(yǔ)音指令實(shí)現車(chē)輛的語(yǔ)音控制、智能導航、娛樂(lè )影音的選擇保證了車(chē)輛的動(dòng)態(tài)安全。同時(shí)如果車(chē)內溫度過(guò)高或者過(guò)低,通過(guò)喚醒語(yǔ)音交互界面之后,僅需說(shuō)出“太冷”、“太熱”系統就可以識別用戶(hù)的需求從而做出相應的反饋。