
在人工智能領(lǐng)域,有歷史的公司并不多,捷通華聲算一家。
1989年,畢業(yè)于清華大學(xué)環(huán)境工程系的張連毅,到紫光集團的前身——清華大學(xué)科技開(kāi)發(fā)總公司任職,負責推廣清華的OCR(光學(xué)字符識別)軟件。1992年,擔負著(zhù)將清華OCR技術(shù)商業(yè)化的使命,張連毅創(chuàng )建了北京清華文通技術(shù)有限公司。
1992年底,就在公司發(fā)展勢頭正旺的時(shí)候,張連毅選擇了出國深造,后來(lái)經(jīng)歷了創(chuàng )業(yè)、打工、讀書(shū)種種波折,6年后,他決定回國,重新創(chuàng )業(yè)。
1998年8月,張連毅在朋友的幫助下,在中關(guān)村留學(xué)人員創(chuàng )業(yè)基地的兩間小房子里,創(chuàng )建了捷通軟件,還做熟悉的“老本行”——漢字處理和錄入。
同年,捷通推出了“錄易漢語(yǔ)智能輸入輸出系統”,成為國內第一家將語(yǔ)音合成、語(yǔ)音識別、手寫(xiě)識別技術(shù)成功地集成在OA辦公軟件系統的公司。
然而,當時(shí)的OCR市場(chǎng)已經(jīng)有了眾多競爭對手——依托中科院自動(dòng)化所的漢王科技、同門(mén)公司紫光集團和北京文通,還有摩托羅拉。
由于OCR技術(shù)幾乎是和掃描儀綁定在一起,因此定位軟件開(kāi)發(fā)的捷通逐漸也賣(mài)起了掃描儀。不過(guò),張連毅很快意識到,硬件銷(xiāo)售風(fēng)險很大,利潤越做越薄,而且捷通一直缺乏核心技術(shù),于是2000年底,在硬件銷(xiāo)售額迅速躥升時(shí),張連毅選擇了轉型,他聯(lián)合著(zhù)名中文語(yǔ)音專(zhuān)家呂士楠教授,一起成立了北京捷通華聲語(yǔ)音技術(shù)有限公司,要做語(yǔ)音合成。
當時(shí),科大訊飛剛成立一年。
三次轉型,從語(yǔ)音合成到全方位人工智能
從2001年開(kāi)始,捷通華聲在國內語(yǔ)音市場(chǎng)占有率一直保持在20%左右,超過(guò)了IBM、摩托羅拉等國際巨頭,僅次于科大訊飛;服務(wù)客戶(hù)包括國航、華北電網(wǎng)、山東鐵通、農行、建行、中國銀行等企業(yè),合作伙伴包括IBM、英特爾、海爾集團,以及Nuance前身Scansoft、法國語(yǔ)音技術(shù)公司Acapela,產(chǎn)品和技術(shù)銷(xiāo)往美國、新加坡、日本等地。
然而,一沒(méi)借助資本、二沒(méi)擁抱政府高校的捷通華聲,很難與資源和技術(shù)實(shí)力雄厚的科大訊飛抗衡。光靠語(yǔ)音合成,很難養活企業(yè)。于是從2002年開(kāi)始,在兼顧語(yǔ)音合成、語(yǔ)音識別、OCR、手寫(xiě)識別的同時(shí),捷通又做起了SP(服務(wù)提供商),也就是以前功能機上的手機游戲,一做就是9年。
2011年,隨著(zhù)蘋(píng)果推出Siri語(yǔ)音助手,語(yǔ)音交互得到了一定程度的市場(chǎng)預熱。張連毅意識到語(yǔ)音技術(shù)的機會(huì )要來(lái)了,于是再一次決定轉型,砍掉游戲業(yè)務(wù),全力進(jìn)軍人工智能。
按照張連毅的理念,只有一項技術(shù)對于企業(yè)來(lái)說(shuō)十分危險,一旦被競爭對手趕超,企業(yè)將很難生存。而人工智能包含一整套技術(shù),相互之間有很強的關(guān)聯(lián)性,而且在很多場(chǎng)景下都需要同時(shí)使用,因此,不同于其他專(zhuān)注單一技術(shù)的AI公司,捷通華聲要做全方位的人工智能。
2011年,隨著(zhù)第一筆風(fēng)險資金的注入,捷通華聲推出了全球首個(gè)全方位人工智能開(kāi)放平臺——靈云平臺(AIcloud.com),將智能語(yǔ)音交互、圖像識別、生物特征識別、語(yǔ)義理解等技術(shù)整合起來(lái),提供一體化的AI技術(shù)云服務(wù)及各種解決方案。
2013年,清華大學(xué)產(chǎn)業(yè)基金入資捷通華聲。憑借清華在人工智能領(lǐng)域雄厚的研究力量,捷通華聲先后與北京清華工業(yè)研究院、清華海峽研究院共同創(chuàng )建靈云人工智能研究中心,致力于促進(jìn)清華大學(xué)科技成果轉化,提升靈云核心競爭力。
十項技術(shù),六大領(lǐng)域,三種方案
如今,靈云平臺提供的人工智能技術(shù)涵蓋語(yǔ)音識別、語(yǔ)音合成、聲紋識別、語(yǔ)義理解、OCR、手寫(xiě)識別、人臉識別、指紋識別、機器翻譯、數據挖掘十大方向。

表1:捷通華聲主要業(yè)務(wù)產(chǎn)品,來(lái)源:公開(kāi)轉讓說(shuō)明書(shū)
服務(wù)客戶(hù)覆蓋通信、金融、互聯(lián)網(wǎng)、能源、交通、IT、醫療、教育、政府、汽車(chē)等眾多行業(yè),包括國家電網(wǎng)、中石油、中石化等大型國企,華為、中興等信息通信供應商,建行、中信、華夏、太平洋保險等金融機構,網(wǎng)易、京東、愛(ài)奇藝等互聯(lián)網(wǎng)公司,以及寶馬、奔馳、比亞迪等國內外車(chē)企。

表2:捷通華聲服務(wù)領(lǐng)域及代表客戶(hù),來(lái)源:捷通華聲官網(wǎng)
產(chǎn)品生態(tài)體系包括靈云公有云服務(wù)、全智能能力平臺、以及智能解決方案,其中,公有云服務(wù)的運營(yíng)采用標準能力免費開(kāi)放以及能力方案定制服務(wù)兩種,而全智能能力平臺是以私有云方式部署的能力平臺級產(chǎn)品,智能解決方案則是以全智能能力平臺為基礎,開(kāi)發(fā)針對用戶(hù)各類(lèi)需求的綜合解決方案。總體來(lái)看,即公有云、私有云以及解決方案三種形式。
營(yíng)收及利潤增長(cháng)較快,整體毛利率有望提升
從財務(wù)表現來(lái)看,捷通華聲是高科技企業(yè)中少有的連續幾年盈利的企業(yè)之一。

表3捷通華聲2013-2016年上半年主要財務(wù)指標
根據捷通華聲股轉書(shū)及半年報數據,2014年、2015年、及2016年上半年,捷通華聲分別實(shí)現營(yíng)收3820萬(wàn)、5329萬(wàn)、3368萬(wàn)元,凈利潤503萬(wàn)、1068萬(wàn)、391萬(wàn)元。

表4捷通華聲2014年到2016年上半年營(yíng)收及凈利潤增長(cháng)率
從營(yíng)收和凈利潤增長(cháng)率來(lái)看,近兩年內兩項財務(wù)指標增速明顯加快。據張連毅透露,2016年全年,捷通總營(yíng)收將達7000-8000萬(wàn)元,未來(lái)營(yíng)收增長(cháng)將保持30%以上。

表5捷通華聲2014年到2016年上半年營(yíng)收結構及毛利率
注:2014年和2015年1-10月,“其他業(yè)務(wù)”為無(wú)線(xiàn)增值業(yè)務(wù),2016年上半年,“其他業(yè)務(wù)”為智能移動(dòng)及技術(shù)維護業(yè)務(wù)。
從營(yíng)收結構及毛利率來(lái)看,2014-2016年,捷通華聲軟件業(yè)務(wù)營(yíng)收占比一直保持在50%以上,并在2016年上半年有小幅提升;無(wú)線(xiàn)增值業(yè)務(wù)雖然在2011年已經(jīng)不再投入,但是由于長(cháng)尾效應,仍在產(chǎn)生收入,但下降幅度明顯;硬件業(yè)務(wù)在2016年還將保持在2000萬(wàn)元以?xún)龋诳偁I(yíng)收中的占比將明顯下降,有望帶動(dòng)整體毛利水平的提升。
技術(shù)融合大勢所趨,全能冠軍之路挑戰重重
捷通營(yíng)收持續增長(cháng),在一定程度上反映了近兩年人工智能產(chǎn)業(yè)應用的火熱,而捷通選擇的技術(shù)融合之路,也正在成為這一領(lǐng)域的發(fā)展趨勢。
首先,從供給端看,不僅科大訊飛、BAT等大公司陸續推出了包含語(yǔ)音、圖像、語(yǔ)義等在內的綜合性人工智能平臺,多家軟硬件AI技術(shù)創(chuàng )業(yè)公司也致力于整合多項AI技術(shù)提供給行業(yè)客戶(hù),比如做機器人操作系統的圖靈機器人,做機器人軟硬件方案的ROOBO智能管家等。
其次,從需求端看,包括金融、安防、電信等率先應用的行業(yè)對AI技術(shù)的需求也是全方位的,比如對于身份的認證、識別,更是需要語(yǔ)音、聲紋、人臉、手寫(xiě)識別等多項技術(shù)聯(lián)合使用,多重驗證。
在這樣的背景下,深耕行業(yè)多年、且背靠清華技術(shù)資源的捷通優(yōu)勢明顯。不過(guò),在幾項新興技術(shù)領(lǐng)域,捷通也面臨著(zhù)技術(shù)研發(fā)、產(chǎn)品打磨和推廣,以及閉環(huán)構建等一系列挑戰。同時(shí),在技術(shù)融合優(yōu)勢發(fā)揮出來(lái)之前,捷通仍然不可避免地要和各個(gè)領(lǐng)域的玩家進(jìn)行正面PK。
語(yǔ)音合成、語(yǔ)音識別等領(lǐng)域,有科大訊飛、云知聲、思必馳等通用和垂直型技術(shù)提供商;OCR和手寫(xiě)識別領(lǐng)域,有漢王科技、紫光集團等老牌企業(yè);智能客服領(lǐng)域,有小i機器人以及Udesk等幾家逐漸轉向智能客服的云客服公司;而人臉識別領(lǐng)域,又有曠視、商湯等實(shí)力較強的新興企業(yè)。
不過(guò),正如張連毅所說(shuō),這些公司可能要做百米冠軍、跳遠冠軍、跳高冠軍,而捷通要做的是十項全能冠軍。
由于產(chǎn)品線(xiàn)眾多,且市場(chǎng)需求增大,多年來(lái)一直有意控制團隊規模和成本的張連毅,最近也感受到了壓力,正在緊鑼密鼓地招兵買(mǎi)馬,以壯大團隊力量。捷通能否成為十項全能冠軍,在A(yíng)I領(lǐng)域大展拳腳,按照張連毅的預測,接下來(lái)兩三年內將見(jiàn)分曉。

圖:捷通華聲董事長(cháng)張連毅
近期,愛(ài)分析對捷通華聲董事長(cháng)張連毅進(jìn)行了調研訪(fǎng)談,現將部分內容摘錄如下。
Q:捷通的各項技術(shù)和業(yè)務(wù)發(fā)展有側重嗎?
A:有。捷通在技術(shù)上都有涉及,但是在商業(yè)化應用上是有步驟的。
第一主攻方向是智能語(yǔ)音交互,包括語(yǔ)音合成和語(yǔ)音識別。語(yǔ)音合成做了十多年,非常成熟,而語(yǔ)音識別真正開(kāi)始應用是在2013-2014年,現在已經(jīng)走過(guò)了這一階段。
第二主攻階段是自然語(yǔ)言理解,包括智能客服。這一階段跟小i競爭比較激烈。
現階段是第三主攻——圖像識別,包括OCR和手寫(xiě)識別。現在技術(shù)實(shí)現了突破,正在加緊轉化成商業(yè)化產(chǎn)品。
明年開(kāi)始向第四個(gè)方向主攻——生物特征識別,包括人臉識別和聲紋識別等。
Q:OCR技術(shù)現在有哪些難點(diǎn)?捷通取得了哪些突破?
A:OCR技術(shù)目前的難點(diǎn)在于模糊、壓線(xiàn)、重疊、有背景色等情況下的識別。比如駕駛證上面的機打字很多時(shí)候會(huì )打到橫線(xiàn)上,在識別的時(shí)候就會(huì )存在混淆,一些有背景色和圖案的名片,在識別文字的時(shí)候需要先對背景進(jìn)行去色等。
現在全球范圍內做得最好的OCR公司是俄羅斯的ABBYY,我們現在實(shí)驗室的內部測試已經(jīng)超越了ABBYY,接下來(lái)會(huì )推出相應的商業(yè)化產(chǎn)品。
Q:OCR技術(shù)一定要和掃描儀結合嗎?
A:早期掃描儀和OCR一定要結合,不過(guò)現在OCR技術(shù)逐漸開(kāi)始融入手機和高拍儀,但是大部分行業(yè)還是用的掃描儀。
Q:硬件業(yè)務(wù)除了掃描儀還有哪些?
A:硬件主要就是掃描儀,還有麥克風(fēng)陣列,以及一些輔助設備,比如服務(wù)器等。
Q:如何看待當前的人臉識別技術(shù)和市場(chǎng)?
A:人臉識別的技術(shù)要求是跟行業(yè)應用掛鉤的,比如公司考勤98%以上就足夠了,但是金融安防領(lǐng)域就要求準確率達到100%。所以我認為,人工智能在金融領(lǐng)域的應用,單一技術(shù)有難以承受的風(fēng)險,技術(shù)無(wú)法保證100%正確,只有通過(guò)多項技術(shù)融合,多重驗證,才能保證萬(wàn)無(wú)一失。
現在生物識別的準確率相比模式識別并不是很高,只有虹膜識別是最高的,所以捷通會(huì )把聲紋、人臉、指紋、證照識別一起用上。現在,我們的人臉識別已經(jīng)在中國人民銀行、北京市委新辦公樓投入使用,聲紋識別也用在了民生銀行和廈門(mén)國際銀行。明年我們會(huì )主攻人臉識別,之后還會(huì )推出全套的生物特征識別技術(shù)。
Q:200人的團隊規模并不大,捷通如何實(shí)現多項技術(shù)的研發(fā)和產(chǎn)品商業(yè)化?
A:這是一個(gè)Know-How的問(wèn)題,我一般都不正面回答。先別管我們怎么做到的,只用回到市場(chǎng),看我們有沒(méi)有做到就可以了。首先,語(yǔ)音合成、語(yǔ)音識別產(chǎn)業(yè)領(lǐng)域有捷通,明年華為手機手寫(xiě)識別都是捷通的,OCR技術(shù)已達到國內最高水平,智能客服捷通捷報頻傳,語(yǔ)音分析和數據挖掘捷通一舉拿下了三個(gè)大單子,共計1000多萬(wàn),人臉和聲紋識別,上面提到過(guò),中國人民銀行、民生銀行等都是我們的客戶(hù),已開(kāi)始商業(yè)化。
靈云科技,源自清華。捷通的很多技術(shù)都是基于清華二三十年的研究,捷通是站在巨人的肩膀上,與巨人同行的。所以相信清華,相信人工智能有它的道,這個(gè)道不是每家企業(yè)都能理解的。捷通的產(chǎn)品和團隊現在確實(shí)還不足,但是我們已經(jīng)取得了很好的商業(yè)化成果。接下來(lái),我們還會(huì )繼續用市場(chǎng)說(shuō)話(huà)。
Q:捷通的技術(shù)提供形式是什么樣的?
A:捷通正在從之前單獨的授權,向公有云、私有云解決方案轉變。比如智能客服,如果客戶(hù)不想搭服務(wù)器,我們可以提供公有云服務(wù),如果客戶(hù)要求數據保密,我們可以提供私有云服務(wù),也就是在能力基礎上提供方案服務(wù)。
Q:所有的服務(wù)都需要定制嗎?
A:對,不管是公有云還是私有云方案,都需要提前針對客戶(hù)的業(yè)務(wù)進(jìn)行訓練。比如客服領(lǐng)域,很多航空公司和金融機構都是我們的客戶(hù),這兩類(lèi)客戶(hù)具體業(yè)務(wù)差別很大,都需要有針對性地做定制,哪怕是同一行業(yè)的不同客戶(hù),由于業(yè)務(wù)具體內容的差別,也需要進(jìn)行定制。
當然工具類(lèi)的AI技術(shù)具有一定的通用性,但是對于服務(wù)類(lèi)和解決方案類(lèi)來(lái)說(shuō),定制不可避免,而且針對一些專(zhuān)業(yè)性較強的領(lǐng)域,也需要提前做大量訓練。
Q:軟件銷(xiāo)售毛利高,為什么還要做硬件?
A:軟件在中國還是不值錢(qián)的,純軟件銷(xiāo)售毛利確實(shí)高,但是價(jià)格要不高。
Q:目前投入主要在什么地方?
A:主要包括人力投入、設備投入、數據投入、科研投入等。我們200人的團隊,一年投入6000萬(wàn)左右,和清華合作研發(fā)也需要投入。
Q:和清華有哪些合作?
A:清華有四大研究院:北京清華工業(yè)研究院、深圳清華研究院、海峽清華研究院、以及長(cháng)三角清華研究院。北京清華工業(yè)研究院是我們的投資方,我們深圳的辦公室就在深圳清華研究院,另外我們和海峽清華研究院合作成立了靈云人工智能中心。
我們從原來(lái)的OCR、手寫(xiě)識別、語(yǔ)音合成,到現在包括語(yǔ)音識別、人臉識別、語(yǔ)義理解、機器翻譯等十項技術(shù),離不開(kāi)清華的支持與助力。
Q:對捷通的估值預期?
A:捷通不會(huì )包裝,用一些人的話(huà)說(shuō),叫“缺乏互聯(lián)網(wǎng)思維”。而且一直以來(lái)我對公司的成本和規模把控比較嚴格,所以人工智能各個(gè)領(lǐng)域的很多公司估值都比捷通高。
而且我們的公告數據讓很多人產(chǎn)生了誤會(huì )。2013年清華進(jìn)來(lái)的時(shí)候,說(shuō)先占5%,兩年后還按當時(shí)的價(jià)格再占5%,加上華軟也要進(jìn)來(lái),所以就有了今年年初我們公告里面的4億估值,其實(shí)那是2013年的價(jià)格。
現在我們投前估值15億,目前正在和一些投資人談,希望引入一些資金進(jìn)來(lái)。
Q:希望找什么樣的投資方?
A:我希望找能理解人工智能的投資人,甚至能夠允許公司虧損幾年。因為AI技術(shù)投入非常大,而且總是起起伏伏。如果能夠理解AI,確信投它是沒(méi)有錯的,就會(huì )比較放心。人工智能不是其他行業(yè)能夠想象的,它現階段確實(shí)不夠完美,但是產(chǎn)業(yè)機會(huì )已經(jīng)來(lái)了。如果有志同道合的投資方,我們歡迎,當然我們的原則是不對賭,不承諾不切實(shí)際的要求。
Q:對捷通的營(yíng)收增長(cháng)預期?
A:今年營(yíng)收大概7000-8000萬(wàn),我希望捷通接下來(lái)能夠保持30%的增長(cháng)。
其實(shí)從捷通的財務(wù)數據都能看出來(lái),過(guò)去捷通的收益主要是兩部分:軟硬件和SP業(yè)務(wù)。SP業(yè)務(wù)由于長(cháng)尾效應一直存在,它在捷通發(fā)展歷史上一直起著(zhù)重要作用。而做人工智能,從技術(shù)研發(fā)到產(chǎn)品的包裝和推廣,都不是一蹴而就的,它需要時(shí)間。
所以我們希望從今年開(kāi)始算元年,因為今年是營(yíng)收中沒(méi)有SP業(yè)務(wù)的第一年,我們又回到了公司較為良好的時(shí)候,算是歷史最高水平。接下來(lái),產(chǎn)業(yè)需求還會(huì )持續增長(cháng),我們也會(huì )繼續提高軟件業(yè)務(wù)比重。