
普強信息CEO何國濤
眼下是互聯(lián)網(wǎng)投資最糾結的時(shí)刻:智能手機基本普及、互聯(lián)網(wǎng)+產(chǎn)品不斷開(kāi)發(fā),各行各業(yè)都在掀起革命,互聯(lián)網(wǎng)金融、互聯(lián)網(wǎng)農業(yè)、互聯(lián)網(wǎng)醫療等等遍地開(kāi)花,憑著(zhù)對互聯(lián)網(wǎng)新技術(shù)的敏感和激情,越來(lái)越多的投資機構也追逐創(chuàng )業(yè)者加入“互聯(lián)網(wǎng)+”的大軍,其背后卻是不足10%的創(chuàng )業(yè)成功率。領(lǐng)先一步的投資者已紛紛搶占了有利高地,而后續的突進(jìn)因為過(guò)重燒錢(qián)沒(méi)有護城河的模式和諱莫如深看不懂的體制深水紛紛受阻,互聯(lián)網(wǎng)加了半天還是湊不上去。本來(lái)年初VR給諸位打了不少雞血、仿佛商用指日可待,但現在看來(lái)目前的終端tooyoung、恐怕至多也才剛剛達到“塞班的階段”;而最近一直在提的內容、直播、網(wǎng)紅等伴隨著(zhù)政策的收緊、大平臺制肘和數據造假的曝光,看起來(lái)越來(lái)越不像是真正的風(fēng)口??以上的種種似乎讓投資機構們懵圈了,失去了往日的格局和耐心。
此時(shí),我們不妨用另一個(gè)角度來(lái)思考投資方向:即縱向深度開(kāi)發(fā)的科技。阿里巴巴,不過(guò)是利用現有互聯(lián)網(wǎng)技術(shù)整合現有資源,百度不過(guò)是利用現有計算機語(yǔ)言搜索社會(huì )既有的資源,騰訊不過(guò)是利用現有的技術(shù)為人與人的溝通搭建了一個(gè)橋梁,從這個(gè)意義上講,這些企業(yè)稱(chēng)之為高科技企業(yè)真是勉為其難,因為這些所謂的高科技企業(yè)雖然改變了人們的生活方式,但也都不過(guò)是利用現有的計算技術(shù)對現有資源進(jìn)行的整合,即科技的橫向利用。
那么重點(diǎn)來(lái)了:縱向深度開(kāi)發(fā)的科技,相對于橫向資源整合的科技來(lái)說(shuō),更能從根本方式上改變社會(huì )的全方面。語(yǔ)音識別,你沒(méi)看錯,語(yǔ)音識別技術(shù)正是一項縱向開(kāi)發(fā)的科技,這種語(yǔ)言的發(fā)明、發(fā)展、完善,以及語(yǔ)音識別技術(shù)的深入,必將深度影響人們社會(huì )生活的方方面面,同時(shí)也將引領(lǐng)社會(huì )各行業(yè)的新發(fā)展。語(yǔ)音識別技術(shù)的應用被美國新聞界評為計算機發(fā)展十件大事之一。蘋(píng)果Siri的出現,語(yǔ)音識別技術(shù)邁著(zhù)花哨的小碎步走進(jìn)大眾視野。這種語(yǔ)音識別技術(shù)讓機器通過(guò)識別和理解過(guò)程,把語(yǔ)音信號轉變?yōu)橄鄳奈谋净蛎睿瑥亩夥烹p手和眼睛,實(shí)現隨時(shí)隨地的人機交互。在未來(lái)商業(yè)領(lǐng)域,語(yǔ)音識別技術(shù)將逐步進(jìn)入工業(yè)、家電、通信、汽車(chē)電子、醫療、家庭服務(wù)、消費電子產(chǎn)品等各個(gè)領(lǐng)域,并且最終會(huì )成為人工智能的一項基礎科技。
語(yǔ)音識別技術(shù)作為科技縱向開(kāi)發(fā)的一項科技手段,成為人工智能和機器學(xué)習應用的一個(gè)重要方向,并將發(fā)展為一個(gè)具有廣闊前景的新興高技術(shù)產(chǎn)業(yè),具有敏銳嗅覺(jué)的商業(yè)巨頭們也在加速語(yǔ)音識別行業(yè)的布局。普強信息作為一家以智能語(yǔ)音識別和語(yǔ)言處理技術(shù)產(chǎn)業(yè)化為主要發(fā)展方向的新銳科技公司,成立于2009年美國加州硅谷,2010年于北京中關(guān)村設立中國運營(yíng)公司,其業(yè)務(wù)定位是以中文為主的智能語(yǔ)音和語(yǔ)言核心技術(shù)的提供商、應用方案提供商、云平臺服務(wù)提供商。經(jīng)過(guò)幾年時(shí)間的潛心研發(fā)和積累,普強信息正在成為眾多商業(yè)領(lǐng)域應用中不可小覷的龍頭企業(yè),其發(fā)展趨勢和市場(chǎng)份額的井噴式增長(cháng),似乎預示著(zhù)其角逐中國語(yǔ)音識別領(lǐng)域皇冠的決心。
技術(shù)為王
普強信息的創(chuàng )始人兼CEO,何國濤可謂是技術(shù)研究出身的管理人,作為一個(gè)具有管理上億元營(yíng)收公司規模又具有跨國技術(shù)經(jīng)驗的美籍華人,何國濤先生在普強信息創(chuàng )立伊始,就將目光鎖定在中國剛剛起步的語(yǔ)音產(chǎn)業(yè),并將“核心技術(shù)的研發(fā)”視為企業(yè)發(fā)展之靈魂。“之前普通大眾對普強信息的熟知度并不高,普強信息從成立到現在已經(jīng)成功走完了初級階段,這一時(shí)期我們專(zhuān)心做的是技術(shù)研發(fā)、定制化應用以及市場(chǎng)拓展,只是踏踏實(shí)實(shí)的做好技術(shù)提升和專(zhuān)業(yè)服務(wù)。”企業(yè)以此為經(jīng)營(yíng)理念的前提下,何國濤攜手聯(lián)合創(chuàng )始人李全忠博士(現任普強信息CTO,負責公司語(yǔ)音識別及語(yǔ)音分析技術(shù))蒲瑤女士(現任普強產(chǎn)品副總)開(kāi)啟了中國語(yǔ)音行業(yè)的征程。
普強信息在硅谷和中關(guān)村均建設有技術(shù)研發(fā)中心,集合了語(yǔ)音識別、語(yǔ)言處理和云計算技術(shù)領(lǐng)域世界級專(zhuān)家,擁有一流的研究及工程團隊。研發(fā)團隊占公司人員的80%左右,其中博士、碩士以上占團隊人員30%以上。
何國濤向《融資中國》記者介紹到,除此強大技術(shù)團隊之外,普強信息還與多名國內外技術(shù)領(lǐng)域專(zhuān)家以“技術(shù)顧問(wèn)”形式展開(kāi)合作,共同保障技術(shù)的領(lǐng)先性和前沿性。據了解,技術(shù)顧問(wèn)大多來(lái)自國內外知名大學(xué)從事語(yǔ)言學(xué)研究領(lǐng)域的專(zhuān)家,他們研發(fā)的成果大多被谷歌、微軟等科技巨頭公司所采用,技術(shù)方面的投入和研發(fā)正在為企業(yè)提供源源不斷的發(fā)展動(dòng)力和商業(yè)價(jià)值。
核心產(chǎn)品
“千語(yǔ)”語(yǔ)音識別引擎和“千語(yǔ)千尋”語(yǔ)音分析系統是普強信息自主研發(fā)的核心產(chǎn)品,普強信息擁有其全部的知識產(chǎn)權和專(zhuān)利。針對不同的行業(yè),普強信息進(jìn)行垂直化定制服務(wù),除了可以支持大詞匯量連續語(yǔ)音在線(xiàn)識別等語(yǔ)音服務(wù)外,還可以根據企業(yè)特有的應用環(huán)境優(yōu)化識別模型和相關(guān)語(yǔ)音服務(wù)定制。其語(yǔ)音模型和聲學(xué)模型業(yè)務(wù)覆蓋金融、保險、銀行、電商、教育、政府、運營(yíng)商等行業(yè),并提供定制化的SDK和接口調用。在中文系統的研發(fā)領(lǐng)域,普強信息已經(jīng)達到國際領(lǐng)先水平。“一些國際型巨頭公司可能會(huì )有多語(yǔ)言的語(yǔ)音識別,普強信息專(zhuān)攻中文語(yǔ)音領(lǐng)域的識別和分析,要好于國內外技術(shù)水平。在某些技術(shù)上,與科大訊飛基本屬于持平狀態(tài),在一些方面,甚至優(yōu)于國內龍頭企業(yè)。”何國濤介紹說(shuō),普強信息全文識別率可達85%以上,關(guān)鍵詞識別率達95%以上。
語(yǔ)音平臺是構建一個(gè)可擴展的大數據分布式語(yǔ)音數據處理的平臺。該平臺既可以部署在一臺服務(wù)器上運行,也可以擴展到幾百臺服務(wù)器上分布式運行,其設計思路一開(kāi)始就是針對處理大量的語(yǔ)音數據。基于此項設計特點(diǎn),該系統的很多組件都經(jīng)過(guò)精心設計,可以輕易擴展到分布式模式,以便減輕核心系統的負擔。系統中被經(jīng)常調用的部件也經(jīng)過(guò)優(yōu)化,使其對系統資源的占用減至最少,讓系統具備良好的封裝性和可擴展性。
“‘數據’已經(jīng)滲透到當今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數據的挖掘和運用,預示著(zhù)新一波生產(chǎn)率增長(cháng)和消費者盈余浪潮的到來(lái)。”何國濤向《融資中國》記者介紹說(shuō),在大數據的浪潮下,聯(lián)絡(luò )中心的客戶(hù)關(guān)系管理變得從未有過(guò)之近,也從未有過(guò)之重。企業(yè)借助普強信息的“千語(yǔ)千尋”語(yǔ)音分析系統,對聯(lián)絡(luò )中心龐大的客戶(hù)對話(huà)錄音內容進(jìn)行全面質(zhì)檢和挖掘分析,感知客戶(hù)情感傾向,建立客戶(hù)主評測模型和外呼實(shí)踐知識應用管理體系,在激烈市場(chǎng)競爭中迅速出擊。
“千語(yǔ)千尋”360度語(yǔ)音大數據分析系統建立的更深層意義在于支持數據的深度挖掘,具有對話(huà)信息分割、語(yǔ)速信息、靜音時(shí)長(cháng)、識別可信度、聲紋信息、音素信息、時(shí)間邊界、情緒分析等功能,將運營(yíng)中心座席與客戶(hù)的對話(huà)實(shí)時(shí)接入千尋系統的算法和模型,不僅能將不同地域口音的來(lái)電轉換成文字,還能根據不同的系統用戶(hù)需求,標注出關(guān)鍵用詞。這一分析系統支持市場(chǎng)上主要廠(chǎng)家的錄音系統,既可以實(shí)時(shí)接入,也支持批量導入。該系統在識別率和處理速度上穩居于行業(yè)優(yōu)先水平,目前公司客戶(hù)覆蓋金融、保險、汽車(chē)、教育、互聯(lián)網(wǎng)、政府、運營(yíng)商等行業(yè)。目前,北京銀行、招商銀行、招商信諾、華安保險、中荷人壽、眾泰汽車(chē)、北汽、四維圖新、世紀高通、尚德教育、奇虎360、酷我音樂(lè )盒、我的南京、中國電信、中國移動(dòng)、中國聯(lián)通、聯(lián)想等國內外著(zhù)名企業(yè)已經(jīng)和普強信息建立了合作關(guān)系。
產(chǎn)品優(yōu)勢成就企業(yè)價(jià)值,普強信息是全球領(lǐng)先的中文語(yǔ)音及語(yǔ)言技術(shù)提供商,作為技術(shù)原廠(chǎng)商,可保證項目達到最好的核心效果,公司具有中國大陸地區最好的語(yǔ)音分析、文本產(chǎn)品咨詢(xún)顧問(wèn),具有豐富的行業(yè)應用案例,以及項目管理經(jīng)驗;龐大的本地化技術(shù)團隊,從核心到應用均為自主研發(fā),可快速根據客戶(hù)的實(shí)際業(yè)務(wù)優(yōu)化語(yǔ)音識別效果和系統二次開(kāi)發(fā)。
公司成立七年來(lái),普強信心語(yǔ)音識別技術(shù)和應用已經(jīng)在合作客戶(hù)企業(yè)中產(chǎn)生了強效應。據可依據資料可以看到一組數字:通過(guò)將所有結構化和非結構化(錄音數據、隨路數據)的數據標簽進(jìn)行整合化分析,打造所有數據的可視化分析,為運營(yíng)中心各類(lèi)人員提供基于客戶(hù)心聲的360度視圖分析數據利用率達到100%;通過(guò)對所有錄音的自動(dòng)識別分析,各級質(zhì)檢、運營(yíng)、營(yíng)銷(xiāo)、管理人員的工作效率提升16倍;通過(guò)對業(yè)務(wù)(話(huà)術(shù))流程的改進(jìn),使各項營(yíng)銷(xiāo)業(yè)務(wù)的成單轉化率提升10%;通過(guò)對坐席服務(wù)能力和業(yè)務(wù)能力的改善,使客戶(hù)流失率降低5%;通過(guò)超長(cháng)通話(huà)分析、重復來(lái)電分析、靜音時(shí)長(cháng)分析降低來(lái)電量和平均通話(huà)時(shí)長(cháng),轉人工來(lái)電量降低3%,平均通話(huà)時(shí)長(cháng)降低10S左右。
普強信息通過(guò)語(yǔ)音識別和語(yǔ)音分析領(lǐng)域的深耕,目前擁有其全部的知識產(chǎn)權和專(zhuān)利,其研發(fā)的多種語(yǔ)音技術(shù)均是業(yè)界領(lǐng)先的技術(shù),目前已經(jīng)獲得9項國家專(zhuān)利,13個(gè)計算機軟件著(zhù)作權登記證書(shū)并參與制定2國家行業(yè)標準。
車(chē)載語(yǔ)音助手
普強信息作為四維圖新戰略布局重要一環(huán),以“千語(yǔ)”語(yǔ)音識別引擎和“千語(yǔ)千尋”語(yǔ)音分析系統為基礎支撐,著(zhù)眼中國車(chē)載語(yǔ)音市場(chǎng),通過(guò)普強信息車(chē)載語(yǔ)音助手,使駕駛者徹底解放雙手,真正實(shí)現讓汽車(chē)聽(tīng)清楚并理解人類(lèi)語(yǔ)言,聽(tīng)語(yǔ)音指令進(jìn)行硬件控制、通信、信息查詢(xún),最終實(shí)現智能駕駛和車(chē)聯(lián)網(wǎng)。對于這一目標的胸有成竹,普強信息的自信和底氣來(lái)自于與四維圖新的戰略合作。
從2011年四維圖新首次成為普強信息的合作伙伴,到2015年普強信息再度獲得由四維圖新領(lǐng)投的新一輪融資,從另一個(gè)側面看到了雙方在全面布局車(chē)聯(lián)網(wǎng)領(lǐng)域布局的決心和普強信息的競爭力優(yōu)勢。通過(guò)四維圖新的戰略布局,針對智能語(yǔ)音及語(yǔ)言技術(shù)研究、軟件及芯片產(chǎn)品開(kāi)發(fā)、語(yǔ)音信息服務(wù)及電子系統企業(yè)的布局,形成產(chǎn)業(yè)鏈閉環(huán)和強有力的壁壘,普強已經(jīng)把車(chē)載語(yǔ)音做到了同屬四維旗下的杰發(fā)科公司的公版上,完成了芯片級語(yǔ)音的第一步。
普強信息把注意力放在通話(huà)、導航和音樂(lè )等最基本的功能上,確保這些功能在駕車(chē)環(huán)境中穩定而可靠,把在智能手機上非常熟悉的應用和界面搬上車(chē)載顯示屏,整合各個(gè)汽車(chē)廠(chǎng)商定制的操控功能,采用智能語(yǔ)音技術(shù)進(jìn)行智能化控制;針對車(chē)載語(yǔ)音識別由于容易受到外部環(huán)境噪音、引擎噪音和車(chē)內環(huán)境噪音影響,普強信息在降噪技術(shù)上,一方面使用了DSP降噪芯片進(jìn)行硬件去回聲降噪,另一方面通過(guò)定制化采集不同車(chē)型上的胎躁,發(fā)動(dòng)機噪音,風(fēng)噪等噪音數據訓練聲學(xué)模型,進(jìn)行軟件降噪;同時(shí)還有2-4個(gè)的陣列硅麥麥克風(fēng)方案,實(shí)現聲源定位和聲源追蹤的功能。
隨著(zhù)公司不斷的積累,語(yǔ)音識別的技術(shù)和產(chǎn)品都相應獲得了全方面領(lǐng)先優(yōu)勢的發(fā)展。在產(chǎn)品的聲學(xué)建模上,開(kāi)發(fā)使用了深度神經(jīng)網(wǎng)絡(luò )技術(shù);公司研發(fā)的語(yǔ)音切分技術(shù)及識別結果的置信度算法,不但為企業(yè)級應用提供準確的識別結果,同時(shí)也提供了精確的說(shuō)話(huà)人分割、時(shí)間邊界以及識別結果的置信度等信息,這些信息使企業(yè)在應用中,更加便捷和準確地利用語(yǔ)音作為主要的交互方式,并且可以進(jìn)一步挖掘、分析和利用海量語(yǔ)音數據的內容。
高科技+互聯(lián)網(wǎng)的生活總是讓生活變得簡(jiǎn)單、智能。車(chē)載語(yǔ)音助手針對駕駛環(huán)境設計最人性化交互體驗,保證駕駛安全的同時(shí)又可以用最自然的語(yǔ)言進(jìn)行打電話(huà)、導航、音樂(lè )等。在未來(lái),只要你對它說(shuō)你要的命令,普強語(yǔ)音助手就可以理解并執行,既可收聽(tīng)股市、查詢(xún)天氣、周邊查詢(xún)、還能新聞閱讀、車(chē)輛控制等。未來(lái),通過(guò)普強信息與客戶(hù)需要的深度整合,車(chē)載語(yǔ)音助手可通過(guò)車(chē)窗,座椅加熱等接口開(kāi)放進(jìn)行控制。
對于語(yǔ)音識別技術(shù),口音和方言一直是其挑戰的詬病。普強信息主攻技術(shù)為中文識別,語(yǔ)音分析系統在大數據語(yǔ)音分析的時(shí)候,積攢了大量的口音數據,目前市場(chǎng)上見(jiàn)到的口音基本都已經(jīng)支持,針對個(gè)別方言需求也可以進(jìn)行定制開(kāi)發(fā)。
普強智能車(chē)載語(yǔ)音助手意在解決駕駛員的“手忙腳亂”,從前裝客戶(hù)提供完整、高效的車(chē)載語(yǔ)音交互,幫助車(chē)主實(shí)現真正的“全程脫屏”,并立足于前裝市場(chǎng)的云+端+芯方案,打造世界最好的中文車(chē)載語(yǔ)音交互系統。
未來(lái)發(fā)展趨勢
語(yǔ)音識別技術(shù)最早起源于1960年,英國的Denes等人研究成功了第一個(gè)計算機語(yǔ)音識別系統,開(kāi)啟了人類(lèi)與機器人的奇幻旅程。1986中國高科技發(fā)展計劃(863計劃)啟動(dòng),中國開(kāi)始了有組織的語(yǔ)音識別技術(shù)的研究,從此中國的語(yǔ)音識別技術(shù)進(jìn)入了一個(gè)前所未有的發(fā)展階段。
翻開(kāi)人類(lèi)語(yǔ)音識別發(fā)展歷程,不得不提國際巨頭Nuance,這家公司擁有世界上超過(guò)80%的語(yǔ)音識別,曾經(jīng)在語(yǔ)音領(lǐng)域具有一統江湖的地位,幾乎壟斷了全世界金融和電信行業(yè)。就算現在Nuance依舊是全球最大的語(yǔ)音技術(shù)公司,掌握著(zhù)全球多語(yǔ)種的語(yǔ)音技術(shù)專(zhuān)利。蘋(píng)果的Siri算是鼎鼎大名了,其技術(shù)經(jīng)過(guò)并購、研發(fā)逐漸走向成熟,算世界上語(yǔ)音識別的執牛耳者。除此之外,國際巨頭微軟、谷歌、Facebook、Amazon等更多大佬紛紛布局全球市場(chǎng)。
風(fēng)景這邊獨好,隨著(zhù)國內創(chuàng )業(yè)熱潮和資本驅使,國內語(yǔ)音市場(chǎng)近年來(lái)進(jìn)入加速跑時(shí)期。面對未來(lái)市場(chǎng)的商業(yè)價(jià)值,每個(gè)人都想在巨大蛋糕前分得缽滿(mǎn)盆滿(mǎn)。
科大訊飛是目前國內最有影響力的語(yǔ)音技術(shù)公司,成立于1999年,在2008年掛牌上市目前市值接近500億,根據2014年語(yǔ)音產(chǎn)業(yè)聯(lián)盟的數據調查顯示,科大訊飛占據了國內超過(guò)60%的市場(chǎng)份額,絕對是國內語(yǔ)音技術(shù)的龍頭企業(yè);百度也在很早將語(yǔ)音確立為戰略方向;搜狗開(kāi)始采用云知聲的語(yǔ)音識別引擎;但很快就搭建起自己的語(yǔ)音識別引擎。騰訊當然不會(huì )落后,微信也建立了自己語(yǔ)音識別引擎,用于將語(yǔ)音轉換為文字;阿里,愛(ài)奇藝,360,樂(lè )視等等也都在搭建自己的語(yǔ)音識別引擎。
未來(lái)的語(yǔ)音識別市場(chǎng),預計將會(huì )有越來(lái)越多的公司參與,未來(lái)語(yǔ)音識別的性能可能更多的體現在前端技術(shù)和語(yǔ)義理解上。機器要與人自然交流,當然就不能重復手機這套語(yǔ)音對話(huà)規則,必然就要考慮到用戶(hù)說(shuō)話(huà)的環(huán)境、周?chē)h(huán)境的噪音、用戶(hù)發(fā)音不準或者方言等等諸多因素,這就要求前端技術(shù)更加精準的模擬人體結構,仿真出機器人聽(tīng)覺(jué)系統,以實(shí)現解放雙手自由對話(huà)的目的。在這些方面,普強信息的技術(shù)水平已經(jīng)走在了國內前沿。
語(yǔ)音識別行業(yè)屬于聲學(xué)和計算機的交叉技術(shù),立足時(shí)代發(fā)展和科技進(jìn)步,普強信息以技術(shù)為核心競爭力,真正實(shí)現語(yǔ)音從識別到交互的自然體驗。不僅實(shí)現將語(yǔ)音轉換成文字,更專(zhuān)注于機器從文字中理解說(shuō)話(huà)人的含義,從而向穿戴設備、智能家居、機器人等領(lǐng)域進(jìn)軍,打造專(zhuān)業(yè)的行業(yè)地位,帶動(dòng)人類(lèi)向人工智能邁進(jìn)一步。