近日,在國際頂級賽事Pascal VOC挑戰(zhàn)賽目標(biāo)檢測 comp4上,來自中國的搜狗視覺研究團(tuán)隊獲得了第一名的成績,其single model和ensemble model均展現(xiàn)出了具有明顯優(yōu)勢的精準(zhǔn)度,刷新了此前的世界最好成績,彰顯了搜狗在人工智能領(lǐng)域的領(lǐng)先地位與技術(shù)積累。
據(jù)了解,PASCAL VOC挑戰(zhàn)賽是全球計算機(jī)視覺領(lǐng)域知名的數(shù)據(jù)庫和權(quán)威賽事,其數(shù)據(jù)集標(biāo)注質(zhì)量高、場景復(fù)雜、目標(biāo)多樣、檢測難度大,是快速檢驗算法有效性的首選。在計算視覺領(lǐng)域,Pascal VOC挑戰(zhàn)賽與ImageNet同為世界頂級的比賽,是國內(nèi)外AI公司競相展開激烈競爭的主賽場。截至目前,PASCAL VOC挑戰(zhàn)賽吸引了全球近百支專業(yè)隊伍參賽,包括Facebook、谷歌、微軟研究院、CMU(美國卡耐基-梅隆大學(xué))、清華大學(xué)、阿里、平安等國內(nèi)外語音合成領(lǐng)域的頂尖團(tuán)隊。
PASCAL VOC的數(shù)據(jù)集包括 20 個類別:人類,動物(鳥、貓、牛、狗、馬、羊),交通工具(飛機(jī)、自行車、船、公共汽車、小轎車、摩托車、火車),室內(nèi)物體(瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視)。其中,搜狗視覺研究團(tuán)隊參加了Object Detection(Competition4)子任務(wù),在20類不同的目標(biāo)上獲得了大多數(shù)的最優(yōu)結(jié)果,體現(xiàn)了參賽團(tuán)隊的模型設(shè)計和技術(shù)功底。
通過近一年的算法積累與迭代,搜狗目前已經(jīng)建立了一套高效易用的通用檢測分割框架,可以針對任務(wù)快速遷移算法模型,達(dá)到實際應(yīng)用需求。而除了VOC外,搜狗在包括CVPR2018 WAD和Cityscapes的賽事中取得了優(yōu)秀的成績,這充分表明搜狗的通用檢測分割框架已基本成熟,可高效復(fù)用到各任務(wù)場景中,滿足實際的需求。