
近幾年CV(計算機視覺(jué))一直是AI最火的技術(shù)領(lǐng)域之一。經(jīng)過(guò)幾年的攻城略地,國內市場(chǎng)已經(jīng)形成了曠視、依圖、商湯、云從這「CV四小龍」盤(pán)踞的格局。
但目前CV應用仍然局限在人臉識別領(lǐng)域,應用范圍有限并且容易看見(jiàn)天花板。隨著(zhù)人臉識別算法的普及,企業(yè)很難做出有競爭力的差異化產(chǎn)品。
國內的云通訊巨頭容聯(lián)云通訊(簡(jiǎn)稱(chēng)容聯(lián))從2018年起開(kāi)始涉足CV產(chǎn)業(yè)應用,將AI視覺(jué)技術(shù)帶入產(chǎn)業(yè),通過(guò)分析監控視頻為企業(yè)、項目的生產(chǎn)和運營(yíng)提供指導。
容聯(lián)的實(shí)踐無(wú)疑為已成紅海的CV行業(yè)指出了一條新的路子。
坐落于合肥的海爾滾筒洗衣機工廠(chǎng)中,工作人員正緊張有序的進(jìn)行洗衣機生產(chǎn)。生產(chǎn)線(xiàn)的另一邊,一臺機器通過(guò)攝像頭密切記錄著(zhù)生產(chǎn)情況。
當一臺生產(chǎn)好的洗衣機進(jìn)入傳送帶時(shí),機器迅速發(fā)出警報,因洗衣機表面出現略微凹陷。

這臺機器便是容聯(lián)的智能視覺(jué)分析平臺「慧眼」,2019年落地海爾智慧工廠(chǎng),通過(guò)監控分析來(lái)識別違規生產(chǎn)動(dòng)作、產(chǎn)品瑕疵和安全隱患,自動(dòng)識別違規操作并記錄,大大降低次品率和賠付成本。
海爾工廠(chǎng)的需求并不是特例,在常見(jiàn)的人臉識別等監控類(lèi)安防外,越來(lái)越多的企業(yè)需要一種操作系統,可以「讀懂」監控內容為生產(chǎn)提供指導。
這種操作系統可以稱(chēng)之為垂直于行業(yè)的CV產(chǎn)品,目前這個(gè)賽道還未完全成型,專(zhuān)注于此的大多數是在某一個(gè)行業(yè)深耕的創(chuàng )業(yè)公司,難見(jiàn)行業(yè)巨頭。
容聯(lián)是國內云通訊市場(chǎng)「老大哥」,2018年開(kāi)始推出行業(yè)CV產(chǎn)品,目前已經(jīng)涉足智能制造、化工園區、智慧工地等多個(gè)行業(yè),合作的頭部企業(yè)十幾家。
一、在CV行業(yè)沖出新路子
細數AI技術(shù)落地應用,CV應該可以說(shuō)是國內最成熟的一個(gè)市場(chǎng)。但正因成熟,目前市場(chǎng)競爭格局基本成型,巨頭環(huán)伺。
「CV四小龍」牢筑護城河,創(chuàng )業(yè)公司很難進(jìn)入,并且人臉識別算法的普及和應用遍地開(kāi)花,產(chǎn)品已經(jīng)很難做出差異。
生產(chǎn)端雖然火熱,但從實(shí)際落地情況看,除一些車(chē)站、小區、辦公園區等公共場(chǎng)所應用到人臉識別產(chǎn)品外,行業(yè)感知度并不高。
「AI技術(shù)雖然發(fā)展迅速,但大多數行業(yè)對AI應用都還很陌生。」容聯(lián)聯(lián)合創(chuàng )始人許志強說(shuō)。
并且對行業(yè)來(lái)說(shuō),人臉識別解決的問(wèn)題畢竟有限。而海爾工廠(chǎng)的案例也代表著(zhù)許多行業(yè)真正需求點(diǎn)。在監控產(chǎn)品外,他們還需要一個(gè)視覺(jué)分析系統,通過(guò)分析監控內容對生產(chǎn)運營(yíng)提供實(shí)際指導。
據許志強具體解釋?zhuān)@種系統可以看作是對監控的補充。系統對接監控攝像頭,通過(guò)標準協(xié)議采集攝像頭視頻流,對視頻進(jìn)行抽幀處理,然后根據配置的算法模型識別異常情況。包括人員入侵、煙火等安全問(wèn)題或者生產(chǎn)流程中不規范操作、產(chǎn)品瑕疵等等。

目前致力于行業(yè)CV的大多數是垂直某個(gè)行業(yè)的小型創(chuàng )業(yè)公司,難見(jiàn)行業(yè)巨頭,但需求極大,用許志強的話(huà)說(shuō),「這是一個(gè)百億級別的規模的,剛剛起步的市場(chǎng)。」
容聯(lián)成立于2013年,是云通訊市場(chǎng)最大的獨角獸。以云化和智能化的方式,為企業(yè)客戶(hù)提供全面的通訊服務(wù)。包括PaaS通訊能力(語(yǔ)音、短信等)、CC(云客服與云聯(lián)絡(luò )中心)、UC(IM即時(shí)通訊云、空中營(yíng)業(yè)廳、企業(yè)直播)和“通訊+AI”服務(wù),助力企業(yè)提高溝通體驗和經(jīng)營(yíng)效率。
2016年容聯(lián)開(kāi)始根據市場(chǎng)需求涉足AI,2018年與華中科技大學(xué)聯(lián)合成立AI實(shí)驗室,主要研發(fā)深度學(xué)習AI算法,在此基礎上推出了基于智能語(yǔ)音識別、自然語(yǔ)言理解的AICC、智能客服產(chǎn)品。
同時(shí),根據自身的視頻處理技術(shù)和AI算法的積累,容聯(lián)也向CV行業(yè)伸出了觸角,推出了智能視覺(jué)分析平臺「慧眼」和智能化視頻識別分析一體機「Aibox」兩款產(chǎn)品。
慧眼屬于平臺產(chǎn)品,適用于100路以上的攝像頭分析。不僅提供標準化的算法模型,還提供能力接口和模型優(yōu)化服務(wù),比如落地海爾工廠(chǎng)的慧眼就可根據生產(chǎn)情況定制工序檢查和生產(chǎn)線(xiàn)監控模型。
根據定制產(chǎn)品積累的算法模型,容聯(lián)后續又根據低預算客戶(hù)需求推出標準化硬件產(chǎn)品Aibox,內置多種算法模型,適用于100路以下攝像頭分析,不提供定制和優(yōu)化模型服務(wù)。
二、受海爾、國家電網(wǎng)等多家巨頭企業(yè)青睞,
能「讀懂」監控的算法什么樣?
目前容聯(lián)CV團隊近100人,產(chǎn)品已經(jīng)在化工園區、智慧工地、智慧工廠(chǎng)、明廚亮灶等多個(gè)行業(yè)落地,合作的客戶(hù)十幾家,包括海爾、國家電網(wǎng)、中國石化、中國石油等。
相比于傳統監控產(chǎn)品,慧眼和Aibox最大的優(yōu)勢就是可以深入行業(yè)環(huán)境幫助企業(yè)降本增效。
以智慧工地為例,慧眼可結合工地復雜現場(chǎng)做全方面檢測。
比如出入口人員檢測環(huán)節,除常規人臉識別外,還可做人數統計、安全帽、反光衣和聚集檢測,車(chē)輛檢測包括類(lèi)型識別、數量識別,甚至輪胎泥土檢測。

現場(chǎng)作業(yè)區域可識別入侵檢測、基坑堆放檢測、臨邊洞口檢測和跌倒檢測,人貨梯區域有人數超載檢測,一旦發(fā)現異常情況系統會(huì )立刻發(fā)出警報促進(jìn)問(wèn)題解決。


在化工園區,容聯(lián)已幫助多個(gè)化工園區完成視頻智能化升級改造
在生產(chǎn)車(chē)間、裝卸點(diǎn)、固定動(dòng)火點(diǎn)等作業(yè)區域可以識別安全帽、工裝、反光衣等勞保用品佩戴情況,在罐區、危化品倉庫、配電房等重點(diǎn)區域一旦有外來(lái)闖入人員,可自動(dòng)觸發(fā)系統告警,對于中控室等需要在崗值守場(chǎng)景,可自動(dòng)識別睡崗、離崗等行為,對整個(gè)化工園區可24h自動(dòng)識別煙霧火焰等目標,將事故隱患降至最低。
在智慧工廠(chǎng)領(lǐng)域,容聯(lián)產(chǎn)品已經(jīng)超越了安全檢測范圍,可以深入到生產(chǎn)流程檢測產(chǎn)品質(zhì)量。比如在與海爾工廠(chǎng)的合作中檢測范圍包括運輸越線(xiàn)、安全穿戴、工序流程和產(chǎn)品瑕疵,此前海爾合肥滾筒洗衣機廠(chǎng)年產(chǎn)洗衣機上百萬(wàn)臺,因次品賠付超過(guò)千萬(wàn)元。合作后該廠(chǎng)的違規操作、賠付成本都下降了30%,安全事故發(fā)生次數減少了50%。
在與某工廠(chǎng)合作項目中,慧眼可以檢測工廠(chǎng)和叉車(chē)人行道混亂、員工作業(yè)不規范、塔架坍塌和傳送帶停止等設備異常,讓工廠(chǎng)違規作業(yè)現象下降了30%,人力成本降低了10%,安全事故減少了50%。

在“明廚亮灶“領(lǐng)域,容聯(lián)也已具備完整的AI智能分析解決方案
對廚房操作間的人員行為進(jìn)行智能識別,如后廚吃飯、抽煙、玩手機等行為;對于廚師衣著(zhù)、帽子、口罩、手套等防護用具進(jìn)行智能檢測;對于老鼠蟲(chóng)害進(jìn)行智能檢測。
當然,目前AI的技術(shù)不可能百分百實(shí)現用戶(hù)的所有場(chǎng)景需求,經(jīng)常會(huì )有技術(shù)無(wú)法處理的情況發(fā)生,比如智慧工地中的高空墜物問(wèn)題,因物體速度下落太快,攝像頭難以精準捕捉到。不過(guò),容聯(lián)針對行業(yè)的解決方案已經(jīng)可以解決特定應用場(chǎng)景下80%以上的需求……
三、檢測準確率超過(guò)90%,容聯(lián)優(yōu)勢在哪?
相比于競爭對手,容聯(lián)產(chǎn)品的優(yōu)勢很明顯。前段時(shí)間做安全帽佩戴檢測的行業(yè)分析。許志強發(fā)現,容聯(lián)產(chǎn)品準確率相比競品高出很多。容聯(lián)產(chǎn)品準確率超過(guò)90%,而對方誤檢率超過(guò)了一半。
為什么容聯(lián)會(huì )有這個(gè)優(yōu)勢?
算法落地行業(yè),其實(shí)算法本身差別并不大。「算法技術(shù)的發(fā)展最先肯定是在學(xué)術(shù)界,每家企業(yè)只要對前沿技術(shù)盯得緊,都不會(huì )差太多。」許志強說(shuō)。
容聯(lián)的優(yōu)勢就是在于針對特定場(chǎng)景的數據增強處理、AI和傳統技術(shù)的結合以及工程化處理技術(shù)。
AI算法極度依賴(lài)數據,但是很多情況下數據采集又比較難,如火的素材采集,在正常的場(chǎng)景下很難出現這樣的素材,對于這類(lèi)素材,容聯(lián)自有的數據增強處理技術(shù)可以在素材比較少的情況下獲得比較好的效果。
雖然深度學(xué)習在機器視覺(jué)的圖像分類(lèi)、目標檢測、跟蹤等領(lǐng)域均有革命性的進(jìn)展。但深度學(xué)習不可避免地依賴(lài)于訓練數據,且深度學(xué)習輸出結果中一般都有“閾值”限制,實(shí)際應用中,很難設定適用于所有場(chǎng)景的統一閾值。
此時(shí)即需要結合傳統CV技術(shù),傳統技術(shù)的一般特點(diǎn)是通用性較強,結合深度學(xué)習后,可得到神經(jīng)網(wǎng)絡(luò )模型輸出的具有語(yǔ)義信息的結果,在保持通用性的同時(shí)提升精度。例如目標跟蹤場(chǎng)景,利用深度學(xué)習檢測圖像中特定種類(lèi)物體位置,結合傳統背景建模、幀差法、光流法等,達到一定集成學(xué)習的效果。
目前AI技術(shù)在落地過(guò)程中仍然受到數據量、數據質(zhì)量、標注成本、數據域變化等問(wèn)題的制約,單純依靠深度學(xué)習模型難以解決復雜場(chǎng)景下的實(shí)際CV問(wèn)題。容聯(lián)具備一系列針對實(shí)際應用場(chǎng)景的工程化優(yōu)化手段,包括圖像的時(shí)序分析機制、檢測目標屬性過(guò)濾機制、目標跟蹤及ReID機制等,提高算法在落地應用時(shí)的精度。
另外,除了技術(shù)上的壁壘,容聯(lián)CV產(chǎn)品一個(gè)重要的壁壘還是其在行業(yè)中的積累,因為做某個(gè)行業(yè)的視頻識別本質(zhì)上就是還是拼行業(yè)數據的積累、以及對行業(yè)的理解力。
容聯(lián)本身是國內最大的云通訊廠(chǎng)商,與多個(gè)行業(yè)內的頭部客戶(hù)有密切聯(lián)系,容易獲取客戶(hù)信任。實(shí)際上容聯(lián)最開(kāi)始做CV的契機就是客戶(hù)需求。
在實(shí)際操作中,準確洞悉行業(yè)痛點(diǎn)是一個(gè)周期很長(cháng)且很重的事情。CV落地會(huì )碰見(jiàn)許多問(wèn)題,在視頻源方面,客戶(hù)原本安裝的攝像頭可能會(huì )出現畫(huà)面被遮擋、光線(xiàn)變化大、距離較遠等問(wèn)題,需要要跟客戶(hù)溝通調整。
另外理解客戶(hù)實(shí)際需求本身到真正的算法落地需要相當長(cháng)的周期,短則三個(gè)月,長(cháng)則半年,在這期間需要不斷和客戶(hù)磨合,根據實(shí)際情況調整算法。最后才能形成一個(gè)在行業(yè)里面能夠達到生產(chǎn)級別落地的算法模型。
對于創(chuàng )業(yè)公司和之前沒(méi)有相關(guān)資源積累的企業(yè)來(lái)說(shuō),很難獲取行業(yè)頭部企業(yè)的信任。并且頭部企業(yè)往往就是一個(gè)行業(yè)的標桿,在服務(wù)大客戶(hù)過(guò)程中會(huì )積累到很多行業(yè)數據和經(jīng)驗,提升算法精度,容易建立自身優(yōu)勢,優(yōu)勢又會(huì )帶來(lái)更多客戶(hù),滾雪球式的筑起一個(gè)很高的壁壘。
容聯(lián)的標準化產(chǎn)品Aibox就是在服務(wù)不同行業(yè)客戶(hù),積累許多數據模型的基礎上產(chǎn)生的。正是由于這些積累,容聯(lián)能在很短的時(shí)間內做出優(yōu)于他人的產(chǎn)品demo,獲得客戶(hù)的青睞。
在未來(lái),容聯(lián)打算繼續深耕垂直行業(yè),從「CV產(chǎn)品提供商」深入到「解決方案提供商」,與一些合作伙伴一起,提供「發(fā)現問(wèn)題-解決問(wèn)題」一體化服務(wù)。比如在智慧工地行業(yè)與合作伙伴一起提供CV增強的建筑工地信息化系統,幫助企業(yè)更好的解決問(wèn)題。
四、尾聲
當前國內的AI技術(shù)已進(jìn)入爆發(fā)式發(fā)展,但如何應用落地還是亟待解決的問(wèn)題,正如許志強所說(shuō),大多數行業(yè)對AI都沒(méi)有感知力。
研究一些成功的落地案例可發(fā)現,AI作為一種高精尖技術(shù)自帶「不落凡塵」的氣質(zhì),但如果讓技術(shù)扎根落地,最重要的還是真正下沉產(chǎn)業(yè)。
也就是說(shuō),很多時(shí)候掌握技術(shù)只是一個(gè)基礎,在此基礎上開(kāi)發(fā)應用還需要更多的思考與實(shí)踐。容聯(lián)的CV實(shí)踐無(wú)疑是提供了一個(gè)非常好的方向。