日前,捷通華聲董事長(cháng)、CEO武衛東在出席清華企業(yè)家協(xié)會(huì )(TEEC)活動(dòng)中,做了《全方位AI助推新基建,驅動(dòng)產(chǎn)業(yè)智能化轉型》主題分享,就人工智能之于新基建核心價(jià)值進(jìn)行了解讀,并介紹了捷通華聲基于靈云全方位人工智能開(kāi)放平臺在技術(shù)、產(chǎn)品與服務(wù)層面的最新進(jìn)展和助推各行業(yè)智能化升級的成果。
以下為分享實(shí)錄(有整理):
大家好,很高興今天有這樣一個(gè)機會(huì )和各位T友分享。
今年正好是捷通華聲成立20周年。
在人工智能這條路上,我們經(jīng)歷了很多,由最開(kāi)始人工智能概念普及,到技術(shù)突破(深度學(xué)習)掀起新一輪浪潮,今年上半年的科技戰疫、復工復產(chǎn),再到這次作為新基建7大領(lǐng)域之一被寫(xiě)入政府工作報告,每個(gè)階段我們都有參與,有些環(huán)節更是作為推動(dòng)者在做。
今天要和大家分享的,就是這些年我們在人工智能領(lǐng)域的一些經(jīng)驗、心得和思考。
人工智能可以理解成讓機器具備人的各項能力的技術(shù),是人的手眼感知的延伸,但本質(zhì)上是工具而不是人力,是為人類(lèi)所驅使的生產(chǎn)勞動(dòng)工具。捷通華聲在創(chuàng )立之初便定位提供多項人工智能技術(shù)。
捷通華聲成立于2000年,是較早進(jìn)入人工智能領(lǐng)域的企業(yè),始終致力于讓機器“能說(shuō)會(huì )聽(tīng)、能寫(xiě)會(huì )看、能辨音會(huì )認人、能思考會(huì )判斷”。
公司成立前十年是我們完成技術(shù)積累的十年。后來(lái)隨著(zhù)數據爆發(fā)式增長(cháng)、計算能力提升以及深度學(xué)習算法的成熟,人工智能開(kāi)啟了第三次發(fā)展浪潮。
正是這期間,捷通華聲在2011年推出了國內首個(gè)定位于全方位人工智能技術(shù)的開(kāi)放平臺——靈云,在這個(gè)平臺上承載了我們當時(shí)設計研發(fā)的智能語(yǔ)音、智能語(yǔ)義、智能圖像等多方面的人工智能技術(shù)。
現在回過(guò)頭來(lái)看,多項技術(shù)融合應用正是AI與各行各業(yè)交叉融合,實(shí)現產(chǎn)業(yè)智能化升級的基礎,這個(gè)也是新基建的特性之一。
經(jīng)過(guò)近10年的發(fā)展,現在我們已經(jīng)擁有語(yǔ)音識別、語(yǔ)音合成、自然語(yǔ)言處理、語(yǔ)義理解、聲紋識別、OCR、手寫(xiě)識別、人臉識別、大數據分析等15項核心技術(shù),通過(guò)靈云平臺向全產(chǎn)業(yè)開(kāi)放。
目前,我們已經(jīng)構建了全國范圍銷(xiāo)售與研發(fā)網(wǎng)絡(luò ),北京總部外,在上海、廣州、深圳、廈門(mén)、天津、成都、西安、武漢、長(cháng)沙、新疆等地成立分公司,為各行業(yè)客戶(hù)智能化升級提供技術(shù)、產(chǎn)品和服務(wù)支持。
產(chǎn)學(xué)研融合發(fā)展,提升核心技術(shù)競爭力
捷通華聲的發(fā)展同時(shí)得到了母校(清華大學(xué))的支持,2013年,清華大學(xué)產(chǎn)業(yè)基金投資捷通華聲,雙方建立“靈云科技源自清華”戰略合作。2014年,北京清華工業(yè)開(kāi)發(fā)研究院與捷通華聲聯(lián)合創(chuàng )建“清華靈云人工智能研究中心”。2015年,清華海峽研究院與捷通華聲聯(lián)合創(chuàng )建“人工智能研究中心”,由張鈸院士出任研究中心首席科學(xué)家,清華大學(xué)教授張長(cháng)水出任中心主任。
通過(guò)與清華大學(xué)的產(chǎn)學(xué)研合作,靈云AI技術(shù)學(xué)術(shù)研究保持著(zhù)全球領(lǐng)先,各產(chǎn)品核心技術(shù)性能指標都具備很強的競爭力。
在深耕技術(shù)、服務(wù)產(chǎn)業(yè)的過(guò)程中,我們也獲得了一些成績(jì)和認可,先后獲得中關(guān)村高新技術(shù)企業(yè)認證、北京市高新技術(shù)企業(yè)認證、北京市級企業(yè)科技研究開(kāi)發(fā)機構認證,2020年度北京市“專(zhuān)精特新”第一批名單。因為在今年上半年防疫抗疫、復工復產(chǎn)的突出表現,還入選2020中關(guān)村首臺(套)重大技術(shù)裝備試驗、示范項目。
期間,我們也有參與國家部委與相關(guān)行業(yè)組織的人工智能標準制定。國產(chǎn)化這一塊也在積極布局,完成與飛騰、兆芯、龍芯等主流處理器,麒麟、統信等主流操作系統,華為鯤鵬云服務(wù)的兼容性互認證,支持多元異構環(huán)境使用。
還有一些行業(yè)協(xié)會(huì )和媒體的認可。
人工智能之于新基建核心價(jià)值在于賦能
工信部數據顯示,上半年軟件和信息技術(shù)服務(wù)業(yè)實(shí)現收入同比增長(cháng)6.7%,正是人工智能、5G、物聯(lián)網(wǎng)等技術(shù)和傳統產(chǎn)業(yè)相融合,由產(chǎn)業(yè)質(zhì)變帶來(lái)的經(jīng)濟量變。
在我看來(lái),人工智能技術(shù)主要通過(guò)兩方面進(jìn)行產(chǎn)業(yè)賦能:一方面它能夠創(chuàng )造虛擬勞動(dòng)力,作為一種新的生產(chǎn)要素可以促進(jìn)生產(chǎn)力的提高,降本增效;二是創(chuàng )造新的需求和增長(cháng)點(diǎn),促進(jìn)經(jīng)濟的創(chuàng )新。總結下來(lái)就是開(kāi)源節流。
這次政府提出新基建,無(wú)論信息基礎設施還是融合基礎設施都繞不開(kāi)人工智能。人工智能被譽(yù)為云端大腦,依靠5G“高速公路”傳來(lái)的信息學(xué)習和演化,并通過(guò)工業(yè)互聯(lián)網(wǎng)連接人和物,推動(dòng)社會(huì )經(jīng)濟向數字化、智能化轉型,溢出效益明顯。
目前,人工智能已經(jīng)在眾多垂直領(lǐng)域實(shí)現應用,較為成熟的領(lǐng)域包括金融、電信、交通、能源、政務(wù)、醫療等,而且應用場(chǎng)景越來(lái)越多,需求也越來(lái)越踴躍。
通過(guò)靈云平臺,我們將語(yǔ)音識別、語(yǔ)音合成、語(yǔ)義理解、自然語(yǔ)言處理、OCR等AI能力輸出,讓各個(gè)行業(yè)能夠快速將人工智能技術(shù)引入到實(shí)際業(yè)務(wù)中,實(shí)現AI與細分場(chǎng)景的結合,完成產(chǎn)業(yè)智能化升級。這也是捷通華聲的愿景——“賦能百業(yè),共享AI未來(lái)”。

十五項自主研發(fā)的AI技術(shù)全面開(kāi)放
基于人工智能發(fā)展趨勢和市場(chǎng)需求,捷通華聲也在持續研發(fā)并逐步向市場(chǎng)開(kāi)放更多的人工智能技術(shù),這里是我們目前在靈云平臺推出的15項人工智能核心技術(shù),主要覆蓋智能語(yǔ)音、智能語(yǔ)義、智能視覺(jué)和大數據分析四個(gè)層面。
像語(yǔ)音合成和圖像處理,捷通華聲是國內最早投入研發(fā)并實(shí)現商業(yè)化的企業(yè)。最新建成的大興機場(chǎng),大家在高鐵站聽(tīng)到的站內廣播,08年奧運會(huì ),上海世博會(huì ),都用了捷通華聲語(yǔ)音合成的聲音。經(jīng)過(guò)多年技術(shù)迭代,不僅聲音更逼真,擁有男聲、女聲、童聲、卡通等不同音色,嚴肅、甜美等不同風(fēng)格,更支持維/藏等少數民族語(yǔ)言及多國語(yǔ)言的語(yǔ)音合成。
也是得益于先發(fā)優(yōu)勢和成熟的產(chǎn)學(xué)研合作體系,我們不僅擁有自主知識產(chǎn)權的核心技術(shù)還形成了自己的行業(yè)壁壘,就是海量語(yǔ)料、行業(yè)知識庫和業(yè)務(wù)場(chǎng)景。
大家現在會(huì )覺(jué)得從事人工智能這方面的公司越來(lái)越多,但實(shí)際上擁有核心技術(shù)的企業(yè)并不多。
一個(gè)原因就是從人工智能發(fā)展角度來(lái)講,除了算法算力,還需要數據/場(chǎng)景等關(guān)鍵要素,而這些恰恰是需要一個(gè)長(cháng)期的積累,需要一個(gè)韌性。這也是人工智能企業(yè)與互聯(lián)網(wǎng)經(jīng)濟、共享經(jīng)濟或者一些新的商業(yè)模式最大的不同。
舉一個(gè)例子,語(yǔ)音識別,算法擺在這里,要做一個(gè)通用模型可能很容易,但是深入到b端企業(yè),深入到行業(yè)場(chǎng)景里面,就需要做很多工作,單數據加工處理這一塊,我們在全國就有幾千人的外包團隊在做。沒(méi)有深耕這個(gè)行業(yè)的決心和一定的韌性是無(wú)法做到長(cháng)期發(fā)展的。
由技術(shù)層到平臺層、應用層,多維度服務(wù)產(chǎn)業(yè)智能化升級
當然,有了核心技術(shù)還不行,更多的還是通過(guò)平臺對外展示,與實(shí)際業(yè)務(wù)場(chǎng)景相融合。這些年來(lái),我們通過(guò)靈云平臺包括私有云平臺和公有云平臺輸出各項能力,與不同行業(yè)業(yè)務(wù)系統進(jìn)行快速對接,實(shí)現AI與細分場(chǎng)景的結合。
在尋求底層技術(shù)突破的同時(shí),捷通華聲也在進(jìn)行更加契合客戶(hù)需求的產(chǎn)品化開(kāi)發(fā),針對客戶(hù)的特殊需求,推出了不同形態(tài)的應用和解決方案,實(shí)現了在技術(shù)層、平臺層和應用層的全產(chǎn)業(yè)鏈布局。
技術(shù)層是以我們完全擁有自主知識產(chǎn)權的15項AI能力在支撐,中間平臺層是我們的私有云和公有云平臺,采用開(kāi)放式架構設計,客戶(hù)可以通過(guò)標準的開(kāi)放接口,靈活調用單項或組合多項AI能力,滿(mǎn)足客服、營(yíng)銷(xiāo)、運營(yíng)、管理、生產(chǎn)等不同業(yè)務(wù)部門(mén)的需求。
靈云AICC全智能客服助力智慧金融、智慧政務(wù)建設
在應用層,我們有在國內率先推出的全智能客服解決方案,針對客服中心和呼叫中心的一整套智能化解決方案,包括智能客服、智能語(yǔ)音導航、智能外呼、智能語(yǔ)音質(zhì)檢和實(shí)時(shí)坐席輔助。
在這一塊我們已經(jīng)積累了豐富的落地經(jīng)驗,客戶(hù)覆蓋銀行、保險、能源、電信和政府機構,并且每年都保持一個(gè)較高的增長(cháng)率。
今年上半年,靈云全智能客服解決方案在科技戰疫和復工復產(chǎn)過(guò)程中也發(fā)揮了很大作用。我們推出的智能外呼疫情防控機器人,實(shí)現了疫情通知、患者跟蹤、流動(dòng)人員排查、本地居民排查等場(chǎng)景呼出。相比純人工的方式,不僅信息傳遞效率更高,同時(shí)能夠避免工作人員線(xiàn)下調研、排查被感染的風(fēng)險。
這套系統也登上了工信部科技司的疫情防控信息公式平臺,同時(shí)也獲評了2020中關(guān)村的中關(guān)村首臺(套)重大技術(shù)裝備試驗、示范項目。
靈云全智能客服解決方案同時(shí)服務(wù)于大多數銀行機構,在響應央行、財政部、銀保監等五部門(mén)聯(lián)合提出的“加強全國范圍特別是疫情嚴重地區的線(xiàn)上服務(wù),引導企業(yè)和居民通過(guò)互聯(lián)網(wǎng)、手機APP等線(xiàn)上方式辦理金融業(yè)務(wù)”要求過(guò)程中,起到了有力的支撐作用,也獲得了我們客戶(hù)的一致好評。
例如,我們?yōu)槟彻煞葜沏y行搭建的智能語(yǔ)音導航系統,日接聽(tīng)量20萬(wàn)通,回答準確率91%,轉人工比例下降至20%,轉人工等待時(shí)長(cháng)下降30%,轉人工坐席接起率提升至99.78%。實(shí)現了企業(yè)客戶(hù)服務(wù)門(mén)戶(hù)的智能化和扁平化,成功避開(kāi)了防疫工作中無(wú)法集中辦公為客服中心帶來(lái)的挑戰,同時(shí)提升了服務(wù)效率和服務(wù)體驗。
這套全智能客服解決方案在智慧政務(wù)中也有廣泛應用,我們已經(jīng)為多省市建設了12345智能服務(wù)熱線(xiàn)。智能機器人能夠提供7*24h多渠道智能化服務(wù),將市民電話(huà)精準轉接給責任部門(mén),并對服務(wù)質(zhì)量進(jìn)行智能監督;為政務(wù)人員提供智能外呼機器人,進(jìn)行社情精準調研;通過(guò)對服務(wù)大數據分析,來(lái)輔助政務(wù)決策和精準優(yōu)化政府服務(wù)。
這樣的案例還有很多,這只是智慧城市的其中一個(gè)很小的模塊,最近我們在一些城市也展開(kāi)一些更多工作。
高效轉寫(xiě)、字幕投屏,打造數字時(shí)代智能會(huì )議系統
智能行業(yè)解決方案,包括我們針對多人會(huì )話(huà)場(chǎng)景推出的智能會(huì )議系統,它能夠提供會(huì )議發(fā)言的實(shí)時(shí)轉寫(xiě),字幕投屏展示,會(huì )后能夠快速的輸出會(huì )議紀要。這套方案在多地黨政系統、企事業(yè)單位都有應用。我們通過(guò)搭建一套系統,面向大概有300個(gè)委辦局、包括下面的地級市都能夠使用,因為是統一部署,也更好管理。
靈云智聲一體機是我們今年重點(diǎn)推出的一款高度集成軟硬一體化的產(chǎn)品,具備多語(yǔ)種識別及互譯(中-英/日/韓、漢-維/藏等),提供智能語(yǔ)音輸入法,字幕、投屏、音視頻轉寫(xiě)、實(shí)時(shí)翻譯、Office語(yǔ)音模塊等特色功能,適用于日常辦公、演講匯報、審訊問(wèn)詢(xún)、多人會(huì )議等多種語(yǔ)音場(chǎng)景。
除了功能多,另一個(gè)特點(diǎn)是所有運算都是在本地端完成的,不需要聯(lián)網(wǎng),數據存儲在本地端也更安全。
讓每個(gè)人都能享受人工智能帶來(lái)的輕松與便捷
AIoT智能物聯(lián)網(wǎng)這塊,像華為盒子、智能電視、導航、車(chē)載輸入法等很多都是由我們提供的解決方案。
在公有云這方面,我們通過(guò)向開(kāi)發(fā)者提供AI能力,這么多年下來(lái),已經(jīng)積累了10萬(wàn)+開(kāi)發(fā)者,服務(wù)用戶(hù)超過(guò)5個(gè)億。比如出國翻譯官,官方數據顯示有幾千萬(wàn)用戶(hù),日活在20萬(wàn),就是用了我們的AI能力。

我們也推出了自己的c端產(chǎn)品,靈云聽(tīng)語(yǔ),支持實(shí)時(shí)將聲音轉為文字和離線(xiàn)音頻轉寫(xiě),很受記者、政府公務(wù)員、白領(lǐng)、教師和學(xué)生歡迎,目前也處在一個(gè)快速發(fā)展階段。
賦能百業(yè),共享AI未來(lái)
人工智能作為新時(shí)代備受關(guān)注的技術(shù),其本質(zhì)是科技進(jìn)步對所有產(chǎn)業(yè)的提升,而并非單獨一個(gè)新興行業(yè),只有當人工智能技術(shù)在中國真正普遍地應用于傳統行業(yè),而不僅僅屬于科技巨頭時(shí),其經(jīng)濟潛力才會(huì )充分彰顯。
這就需要上下游產(chǎn)業(yè)鏈的共同努力,捷通華聲始終堅持“賦能百業(yè)共享AI未來(lái)”發(fā)展愿景,將繼續發(fā)揮在人工智能領(lǐng)域的優(yōu)勢,與合作伙伴優(yōu)勢互補,以工匠精神為產(chǎn)業(yè)智能化提供優(yōu)質(zhì)的產(chǎn)品和服務(wù)。
最后感謝大家的聆聽(tīng),歡迎大家來(lái)捷通華聲參觀(guān)指導,一起探索AI未來(lái)。