4月11日,《互聯(lián)網(wǎng)周刊》&eNet研究院、德本咨詢(xún)聯(lián)合發(fā)布《2021數據標注公司排行》。其中,云測數據憑借最高99.99%精準度數據標注能力和場(chǎng)景化訓練數據方案等實(shí)力,蟬聯(lián)“在數據標注公司排行”TOP1.本次排行榜的入選,是業(yè)內對云測數據綜合實(shí)力的又一權威認可。

在整個(gè)人工智能體系中,算力、算法和數據是人工智能進(jìn)化的三大要素,分別承擔著(zhù)人工智能基礎設施能力、工作指導方法和算法進(jìn)化依據的角色。這三大要素相輔相成,共同推動(dòng)人工智能的發(fā)展落地。“數據”作為至關(guān)重要的算法訓練“原料”,從本質(zhì)上決定了人工智能的智能水平。
如今,人工智能已經(jīng)進(jìn)入商業(yè)化落地的階段。隨著(zhù)人工智能深入無(wú)人駕駛、智慧醫療、語(yǔ)音交互等諸多行業(yè)領(lǐng)域,數據維度和樣本復雜性的要求正在變得越來(lái)越高,這對數據標注技術(shù)、標注平臺能力、不同維度數據協(xié)同標注等都提出了挑戰。
面對嚴峻的競爭形勢和挑戰,云測數據充滿(mǎn)底氣。《2021數據標注公司排行》中分析指出,作為國內頭部人工智能數據采集標注服務(wù)商,云測數據的核心優(yōu)勢之一就是支持各種類(lèi)型標注,完整的數據管理流程操作更便捷、效率更優(yōu);同時(shí)支持標注工具的定制開(kāi)發(fā),可靈活滿(mǎn)足不同的標注需求,配合客戶(hù)進(jìn)行數據處理落地;最高99.99%的數據標注精準度可更好地應對人工智能產(chǎn)業(yè)落地的情況,形成企業(yè)護城河。

云測數據作Testin云測旗下AI數據標注服務(wù)品牌,通過(guò)自建數據場(chǎng)景實(shí)驗室和數據標注基地,目前已經(jīng)實(shí)現為智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領(lǐng)域提供高精度、場(chǎng)景化的數據采集、數據標注服務(wù),全方位支持文本、語(yǔ)音、圖像、視頻等各類(lèi)型數據的處理,幫助人工智能相關(guān)企業(yè)更快更好的實(shí)現產(chǎn)品商業(yè)化落地。
最高精準度99.99%記錄保持者
為解決產(chǎn)業(yè)化落地的現實(shí)問(wèn)題,助力AI企業(yè)占領(lǐng)未來(lái)發(fā)展高地,云測數據作為國內AI數據服務(wù)頭部企業(yè),在2020年中國國際服務(wù)貿易交易會(huì )上,進(jìn)行了“標注項目最高交付精準度99.99%”的成果展示,被媒體譽(yù)為“AI數據行業(yè)真正的高質(zhì)量數據的倡導者和踐行者”。
為了提高數據準確度,云測數據設計了從創(chuàng )建任務(wù)到最后的驗收等科學(xué)規范的數據處理流程;并且面對不同領(lǐng)域的企業(yè)都堅持場(chǎng)景化服務(wù)的理念,通過(guò)自有技術(shù)攻克難關(guān),通過(guò)多樣化的種類(lèi)標注類(lèi)型和標注方法靈活滿(mǎn)足客戶(hù)多樣化的數據需求。
首創(chuàng )行業(yè)“場(chǎng)景數據實(shí)驗室”
現階段人工智能在各個(gè)領(lǐng)域百花齊放,應用場(chǎng)景越來(lái)越多。作為人工智能的基石,數據的重要性不言而喻。但想要實(shí)現在各個(gè)細分領(lǐng)域深層次的應用,就必須對場(chǎng)景化數據精確處理。為了進(jìn)一步攻克場(chǎng)景化數據這一難題, 云測數據開(kāi)創(chuàng )“數據場(chǎng)景實(shí)驗室”,成為行業(yè)內第一個(gè)規范化進(jìn)行場(chǎng)景化數據生產(chǎn)的數據服務(wù)商。
如在音頻領(lǐng)域,為保證音頻數據采集的質(zhì)量,云測數據開(kāi)發(fā)了“音頻檢測”功能,通過(guò)對音頻的底噪和能量值進(jìn)行檢測,來(lái)保證底噪和能量值在閾值范圍之內。這種預處理方式可大幅提升數據的采集質(zhì)量并切實(shí)提升數據采集的效率。

為了進(jìn)行多角度多姿態(tài)的采集任務(wù),云測數據專(zhuān)門(mén)在橫店設置了“數據場(chǎng)景實(shí)驗室”,進(jìn)行特定動(dòng)作和表情的捕捉。據了解,云測數據也是目前唯一聘請群眾演員進(jìn)行人工智能數據采集的公司。云測數據在橫店的駐站采集負責人接受采訪(fǎng)時(shí)曾表示,AI數據采集中有形形色色的項目需求,大部分項目的難點(diǎn)在于場(chǎng)景還原的把控,比如采集自然光線(xiàn)下的曝光、強光或背光場(chǎng)景等,有時(shí)需要看天,有時(shí)需要臨時(shí)搭棚,但其中表情采集可以稱(chēng)得上最難之一。
前沿的平臺技術(shù)研發(fā)能力
高質(zhì)量的數據標注工作是推進(jìn)人工智能技術(shù)落地的重要環(huán)節之一,數據標注的質(zhì)量和規模對于提升AI模型訓練效果的成功至關(guān)重要。在這一過(guò)程中,如何從技術(shù)、工具層面提升人員效率、標注精準度,成為重要課題。

云測數據的技術(shù)實(shí)力重點(diǎn)之一體現在數據標注平臺上。云測數據標注平臺屬于自主研發(fā),貫通了從創(chuàng )建任務(wù)、分配任務(wù)、標注流轉、到質(zhì)檢/抽檢環(huán)節和最后的驗收等更完善的管理流程,由專(zhuān)業(yè)人員來(lái)把控節點(diǎn),進(jìn)行上下游銜接,在保證質(zhì)量的前提下提高效率;平臺支持圖片、點(diǎn)云、視頻、文本、音頻、數據清洗等各類(lèi)型的數據標注,針對每種類(lèi)型設置了具有代表性的標注模板。如計算機視覺(jué)類(lèi)的標注模板,包括圖片通用標注、OCR文字轉寫(xiě)、REID目標跟蹤、語(yǔ)義分割、3D點(diǎn)云標注等。
目前,云測數據做到了視覺(jué)、語(yǔ)音、文本、點(diǎn)云等全數據類(lèi)型的支撐,涵蓋了計算機視覺(jué)、語(yǔ)音識別、自然語(yǔ)言處理、知識圖譜等AI主流技術(shù)領(lǐng)域。合作伙伴包含眾多世界500強企業(yè)、高校科研機構、政府機構、頭部AI企業(yè)和大型互聯(lián)網(wǎng)企業(yè)。
持續提升數據采集及標注能力 釋放數據要素價(jià)值
受政策利好、人工智能發(fā)展迅猛、場(chǎng)景需求劇增的影響,AI數據服務(wù)行業(yè)發(fā)展利好。2020年中央公布的第一份關(guān)于要素市場(chǎng)化配置的文件《中共中央、國務(wù)院關(guān)于構建更加完善的要素市場(chǎng)化配置體制機制的意見(jiàn)》中,將數據納入新型生產(chǎn)要素,并上升到國家戰略層面。
面對國家政策與市場(chǎng)變革對數據及服務(wù)提出的巨大需求,云測數據將持續發(fā)揮高質(zhì)量+場(chǎng)景化的獨特優(yōu)勢,深耕數據采集標注產(chǎn)業(yè),持續提升數據采集及標注能力,打造更為高品質(zhì)、高標準的AI數據服務(wù),釋放數據要素價(jià)值。