再接再厲!
在第四屆圖像識別競賽WebVision中
華為云EI以82.97%的準確率
擊敗來(lái)自全世界的94支參賽隊伍
奪得桂冠!


WebVision 競賽由蘇黎世聯(lián)邦理工(ETH)、Google Research、卡耐基梅隆大學(xué)(CMU)等共同組織,是目前圖像識別領(lǐng)域最權威的競賽之一,被業(yè)界譽(yù)為人工智能“世界杯”, 接棒曾經(jīng)推動(dòng)計算機物體分類(lèi)準確率超過(guò)人類(lèi)的ImageNet 競賽。
競賽中,參賽選手通過(guò)AI模型將1600萬(wàn)+張圖片精準分類(lèi)到5000個(gè)類(lèi)目中,其所用數據集直接從互聯(lián)網(wǎng)爬取,沒(méi)有經(jīng)過(guò)人工標注,因此數據中含有很多噪音,且數據類(lèi)別的數量存在著(zhù)極大不平衡。
此項競賽相較于 ImageNet,WebVision 難度提高許多,同時(shí)也更加貼近于實(shí)際應用中的場(chǎng)景。
WebVision競賽展示了另外一種可能性:基于弱監督學(xué)習,深度學(xué)習可以不再以人工標注數據為基礎,人工智能有望真正擺脫“人工”。

此次競賽中,華為云EI基于ModelArts訓練大規模圖像分類(lèi)模型,基于先進(jìn)的分布式訓練方法,可以縮短超大規模數據集的訓練時(shí)間。
華為云利用伴隨圖像數據的文本描述信息,融合文本與視覺(jué)多模態(tài)特征,通過(guò)訓練過(guò)程中的動(dòng)態(tài)評估,識別并剔除大量噪聲數據;通過(guò)知識蒸餾進(jìn)一步降低噪聲對模型訓練的影響;從互聯(lián)網(wǎng)上自動(dòng)爬取大規模數據集進(jìn)行學(xué)習,最終在完全沒(méi)有人工標注的情況下,訓練得到準確率82.97%高精度模型。

華為云EI在本次比賽中運用的圖像識別技術(shù),可廣泛用于通用物品識別、圖像/視頻標簽等領(lǐng)域。
近十年來(lái)計算機視覺(jué)取得的進(jìn)展離不開(kāi)大量人工標注的數據集,但由于人工標注需要較高的成本,幾乎不太可能構建包羅萬(wàn)象的超級數據集。
互聯(lián)網(wǎng)上存在幾乎取之不盡的無(wú)標注圖像數據,利用這些數據的周邊文本等信息作為帶噪聲的弱標注數據進(jìn)行學(xué)習,能夠在很大程度上降低圖像識別對人工標注的依賴(lài)。
華為云EI在視覺(jué)研究領(lǐng)域有著(zhù)豐富的技術(shù)積累,在6月14日-19日舉辦的CVPR2020(國際計算機視覺(jué)和模式識別大會(huì ))中,華為貢獻論文34 篇,涵蓋遷移學(xué)習、半監督學(xué)習、網(wǎng)絡(luò )架構搜索、模型算子優(yōu)化、知識蒸餾、對抗樣本生成等前沿領(lǐng)域。
2019年,基于華為云圖像識別能力,在上海天文臺與國際組織SKA(平方公里陣列射電望遠鏡) 合作的項目中,科學(xué)家們僅用10.02 秒即完成了對 20 萬(wàn)顆星體的識別,同時(shí)可以準確地對某一類(lèi)星體進(jìn)行定位,而傳統方式完成如此大量的星體識別工作需要 169 天時(shí)間。
目前,華為云EI內容審核、人臉識別、圖像搜索、視頻分析等服務(wù)已經(jīng)成功應用于互聯(lián)網(wǎng)、媒資、園區、物流、工業(yè)等行業(yè)。