“新發(fā)展格局下,產(chǎn)業(yè)數字化驅動(dòng)人工智能向多元化、融合化發(fā)展,技術(shù)輸出‘厚度’增加,‘邊界’擴大,智慧城市加速構建,‘泛在智能’初見(jiàn)雛形。”捷通華聲董事長(cháng)武衛東在接受億歐智庫獨家專(zhuān)訪(fǎng)中,對人工智能產(chǎn)業(yè)發(fā)展給出了這樣的判斷。同時(shí),結合自身20余年的發(fā)展歷程,與億歐智庫針對智能語(yǔ)音市場(chǎng)現狀與發(fā)展趨勢進(jìn)行了深度探討。

捷通華聲董事長(cháng)武衛東在2020中國人工智能年會(huì )上演講
中國人工智能產(chǎn)業(yè)發(fā)展的縮影
第三次人工智能發(fā)展浪潮來(lái)臨前夕。
2000年,幾位清華學(xué)子懷著(zhù)“讓機器‘能說(shuō)會(huì )聽(tīng),能寫(xiě)會(huì )看,能辨音會(huì )認人,能思考會(huì )判斷’,為人們的生活帶來(lái)輕松與便捷”的美好愿望,成立捷通華聲,是國內最早投入人工智能領(lǐng)域的創(chuàng )業(yè)團隊之一。
深度學(xué)習開(kāi)啟人工智能新一輪繁榮。
2011年,基于深度神經(jīng)網(wǎng)絡(luò )的聲學(xué)模型在大詞匯量連續語(yǔ)音識別任務(wù)上獲得了顯著(zhù)的性能提升,智能語(yǔ)音領(lǐng)域研究開(kāi)始轉向深度學(xué)習。這一年,捷通華聲對外發(fā)布靈云平臺,將語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解、機器翻譯等智能語(yǔ)音、智能語(yǔ)義技術(shù)面向產(chǎn)業(yè)全面開(kāi)放。
2016年,語(yǔ)音識別準確率第一次達到人類(lèi)水平,進(jìn)入快速落地期。智能語(yǔ)音成為金融、能源、電信、互聯(lián)網(wǎng)等行業(yè)產(chǎn)業(yè)提升發(fā)展戰略的關(guān)鍵詞。人工智能發(fā)展進(jìn)入新階段,成為新一輪產(chǎn)業(yè)變革的核心驅動(dòng)力。
深耕AI二十載,匠心鑄就領(lǐng)先。本著(zhù)對核心技術(shù)孜孜不倦的探索精神和務(wù)實(shí)推進(jìn)的原則,捷通華聲在不斷摸索中走出了自己的道路,即以自主研發(fā)的人工智能算法為核心,以市場(chǎng)應用為導向,推進(jìn)智能語(yǔ)音、智能語(yǔ)義等技術(shù)研發(fā)持續創(chuàng )新與融合,形成由技術(shù)到平臺、由產(chǎn)品到解決方案全覆蓋的產(chǎn)業(yè)生態(tài),全面融入經(jīng)濟社會(huì )發(fā)展。
智能語(yǔ)音:人機交互的綜合體現
語(yǔ)音是人類(lèi)最直接、最簡(jiǎn)潔的交流方式。同樣,以實(shí)現人和機器像人與人一樣無(wú)障礙交流為使命的智能語(yǔ)音技術(shù),被認為是數智化時(shí)代萬(wàn)物智聯(lián)最方便的入口。相對整個(gè)人工智能產(chǎn)業(yè),智能語(yǔ)音產(chǎn)業(yè)化程度更高,是所占份額比例較大的細分領(lǐng)域,正以其廣闊的產(chǎn)業(yè)化應用席卷人們日常生活和工作的方方面面。
“提到智能語(yǔ)音,公眾最直觀(guān)的感受可能是語(yǔ)音識別,但實(shí)際上智能語(yǔ)音所包含的內容遠比我們想象的復雜。”武衛東介紹到。
完整的智能語(yǔ)音包括聲音信號的前端處理、將聲音轉為文字供機器處理、在機器生成語(yǔ)言之后,用語(yǔ)音合成技術(shù)將文本語(yǔ)言轉化為聲波,從而形成完整的人機語(yǔ)音交互鏈條。背后涉及聲學(xué)研究、語(yǔ)言學(xué)研究、數字信號處理、自然語(yǔ)音處理研究及垂直場(chǎng)景的深度語(yǔ)義理解,如果要感知聲音的起止、講話(huà)人身份和語(yǔ)種等特征,還需另外進(jìn)行語(yǔ)音喚醒、聲紋識別和語(yǔ)種分類(lèi)等任務(wù)。“就像一個(gè)拼接的木桶,每一個(gè)環(huán)節出現短板,都將直接影響最終交互結果。”
捷通華聲與清華大學(xué)合作,成立靈云人工智能研究中心、清華海峽院人工智能研究中心,不斷加強對核心技術(shù)的研發(fā)投入,強化每一個(gè)板塊,實(shí)現語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解、機器翻譯等多項技術(shù)保持行業(yè)領(lǐng)先,同時(shí)推動(dòng)各項技術(shù)交叉融合,為人工智能持續發(fā)展積蓄力量。
正是對核心技術(shù)不斷創(chuàng )新和融合發(fā)展的堅持,捷通華聲在推進(jìn)各行業(yè)智能化發(fā)展的過(guò)程中形成了自身獨特的優(yōu)勢,成長(cháng)為中國人工智能技術(shù)實(shí)力的引領(lǐng)者和產(chǎn)業(yè)化應用的探索者。
資本是推手,技術(shù)是核心,產(chǎn)業(yè)需求才是根本
政策與市場(chǎng)雙重驅動(dòng)下,人工智能行業(yè)迎來(lái)了發(fā)展的黃金時(shí)代。作為萬(wàn)物智聯(lián)的入口,語(yǔ)音賽道更是有參與者不斷入局。但需要注意的是,這些企業(yè)雖然估值很高,盈利能力卻很有限,甚至可能還在虧本。
“人工智能產(chǎn)業(yè)發(fā)展過(guò)程中,資本是推手,技術(shù)是核心,產(chǎn)業(yè)需求才是根本。”武衛東這樣向記者釋疑。
高新技術(shù)是高投入、高回報、高風(fēng)險的領(lǐng)域,人工智能是引領(lǐng)未來(lái)的戰略性技術(shù),很受資本青睞。但是,僅依賴(lài)資本驅動(dòng),容易出現在投入、建設階段大干快上,卻在應用環(huán)節掉鏈子的行為。
“在人工智能領(lǐng)域,技術(shù)積累是一個(gè)漫長(cháng)的過(guò)程,短期內人工智能服務(wù)商難以將技術(shù)直接轉化收入,缺乏造血機能,也就無(wú)法提升實(shí)體產(chǎn)業(yè)效率和效益。”
風(fēng)口期快速積累資本,海量宣傳擴大企業(yè)知名度,再次吸引資本用于擴充疆土,規劃盈利目標進(jìn)行上市,這種模式很難形成核心競爭力,自然缺乏造血機能。
人工智能作為新一輪產(chǎn)業(yè)變革的核心驅動(dòng)力,其本質(zhì)是科技進(jìn)步對所有產(chǎn)業(yè)的提升。只有當人工智能實(shí)現與各傳統產(chǎn)業(yè)融合應用,才能創(chuàng )造經(jīng)濟和社會(huì )價(jià)值。“場(chǎng)景決定應用、應用決定市場(chǎng)、市場(chǎng)決定企業(yè)發(fā)展前景”,武衛東說(shuō)到。
產(chǎn)業(yè)數字化發(fā)展初期,通用型方案無(wú)法滿(mǎn)足定制化需求,每個(gè)行業(yè)都有自己的問(wèn)題要解決,有應用場(chǎng)景要突破,需要技術(shù)跟場(chǎng)景的深度融合,單一的AI能力已經(jīng)無(wú)法滿(mǎn)足。技術(shù)和產(chǎn)業(yè)不匹配,是現階段很多AI企業(yè)面臨的困境。“而且產(chǎn)業(yè)落地是有時(shí)間周期的,需要人工智能服務(wù)商具備一定的行業(yè)沉淀以及行業(yè)理解,進(jìn)行能力融合、應用融合和場(chǎng)景融合。只有提升行業(yè)的垂直縱深,技術(shù)才能擁有更大的落地價(jià)值。”
明者因時(shí)而變,知者隨事而制。經(jīng)過(guò)多年的實(shí)戰積累,捷通華聲對于人工智能的場(chǎng)景化應用經(jīng)驗頗豐,通過(guò)AI能力中臺和AI數據中臺雙驅動(dòng),廣泛賦能智慧城市、數字金融、智慧社區、智慧醫療、數字政府、智能交通等數字化應用場(chǎng)景。
堅持以核心技術(shù)突破為根本,以場(chǎng)景深度融合應用為目標,不斷將市場(chǎng)趨勢和用戶(hù)需求落地為方案和產(chǎn)品,是捷通華聲創(chuàng )造良好造血機能,成為行業(yè)內少有的盈利企業(yè),并持續保持領(lǐng)先的秘訣所在。
做有價(jià)值的人工智能
在談及捷通華聲未來(lái)發(fā)展規劃時(shí),武衛東表示,捷通華聲的初心一直沒(méi)有變,“讓每一家企業(yè)都能擁有人工智能,讓每一個(gè)人都能享受人工智能帶來(lái)的輕松與便捷。”
在人工智能領(lǐng)域,我們和世界發(fā)達國家仍存在一定的技術(shù)差距。堅持自主研發(fā),全面增強原始創(chuàng )新能力,在新一輪國際科技競爭中掌握主導權,是中國所有科技作者,包括捷通華聲的價(jià)值追求。“也是責任,我們將繼續探尋人工智能發(fā)展趨勢,堅持對核心技術(shù)的研發(fā)投入,力爭在行業(yè)持續領(lǐng)先。”武衛東表示。
人工智能深度融合實(shí)體經(jīng)濟是當前我國重要的經(jīng)濟戰略。捷通華聲作為智能語(yǔ)音龍頭企業(yè),責無(wú)旁貸。武衛東認為,“重點(diǎn)在于人工智能應用于傳統行業(yè)和服務(wù)業(yè),提升實(shí)體經(jīng)濟智能化水平。捷通華聲在服務(wù)客戶(hù)過(guò)程中,積累了豐富的智能化升級經(jīng)驗,我們將向全產(chǎn)業(yè)推廣。”
捷通華聲也在積極探索人工智能技術(shù)在社區養老等民生場(chǎng)景下的適用性。目前,已形成以靈云社區AI運營(yíng)大腦為核心,以設備數據信息橋、政府居民連心橋、社區生活便民橋為橋梁,通過(guò)靈云鄰通溝通、社區安防治理、社區咨詢(xún)服務(wù)、智慧生活服務(wù)、社區黨建文化、健康養老服務(wù)六大場(chǎng)景賦能智慧社區養老建設,打造老年人能用、會(huì )用、敢用、想用的智能化產(chǎn)品和服務(wù)應用。
武衛東說(shuō),“我有兩個(gè)愿望,一個(gè)是看到我們國家科技進(jìn)步,更加強大。另一個(gè)就是盡捷通華聲最大的能力,推動(dòng)中國人工智能產(chǎn)業(yè)發(fā)展,為經(jīng)濟社會(huì )發(fā)展貢獻一份力量。”