6月18日,三大世界頂級(jí)計(jì)算機(jī)視覺(jué)會(huì)議之一-計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(Conference on Computer Vision and Pattern Recognition 2019,CVPR 2019)在美國(guó)長(zhǎng)灘拉開(kāi)帷幕,蘇寧美國(guó)硅谷研究院人工智能專家Honglong Cai攜論文“Multi-Scale Body-Part Mask Guided Attention for Person Re-identification”(多尺度人體掩膜引導(dǎo)下的行人重識(shí)別)參與會(huì)議并作主題報(bào)告。
作為計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的頂級(jí)會(huì)議,CVPR 2019吸引超過(guò)9200位頂尖專家、研究學(xué)者以及產(chǎn)業(yè)界人士參與,共同推進(jìn) CV 技術(shù)的發(fā)展與落地。CVPR保持著一貫嚴(yán)苛的論文錄取審核標(biāo)準(zhǔn),其錄取率通常不超過(guò)30%,而能有幸在CVPR上進(jìn)行報(bào)告的論文比例更是不高于5%。
今年,一共有 5160 篇論文向CVPR進(jìn)行投稿,但僅接收 1294 篇論文,接受率為 25.5%,蘇寧美國(guó)硅谷研究院項(xiàng)目團(tuán)隊(duì)的論文被頂會(huì)成功接收并受邀進(jìn)行口頭報(bào)告,體現(xiàn)了研究項(xiàng)目所具備的極大價(jià)值,這不僅是蘇寧美國(guó)硅谷研究院獲得的一份榮譽(yù),更向業(yè)界展現(xiàn)出蘇寧科技在行人重識(shí)別相關(guān)領(lǐng)域的大量研究和產(chǎn)品化探索。
行人重識(shí)別是要識(shí)別不同圖片中的行人是否為同一個(gè)人,主要用來(lái)解決不同角度,不同攝像頭下的行人匹配和跟蹤問(wèn)題,該技術(shù)可以通過(guò)側(cè)臉、局部的動(dòng)作、姿態(tài)等進(jìn)行識(shí)別,主要用于智能安防、門(mén)店客流統(tǒng)計(jì)、無(wú)人店客戶跟蹤、智能尋人等方面;人流量較多的大型公共場(chǎng)所,如超市、火車站、展覽館等,也是比較具象的行人重識(shí)別應(yīng)用場(chǎng)景。
由于不同攝像設(shè)備之間的差異,同時(shí)行人兼具剛性和柔性的特性,行人重識(shí)別容易受到背景環(huán)境、行人姿態(tài)、穿著、視角和遮擋等因素影響。蘇寧科技美國(guó)硅谷研究院這篇論文創(chuàng)新性的提出借助在深度神經(jīng)網(wǎng)絡(luò)中加入注意力機(jī)制,使得我們的深度神經(jīng)網(wǎng)絡(luò)可以過(guò)濾掉背景噪聲,更好的注意在行人身上。
Honglong Cai講解到,“我們借助多尺度的人體掩膜來(lái)訓(xùn)練我們的注意力機(jī)制,在多尺度人體掩膜的引導(dǎo)下,我們的注意力機(jī)制可以識(shí)別出行人的不同部位,更好的克服行人姿態(tài)變化和行人局部被遮擋的問(wèn)題,更好的提取行人的局部特征和全局特征。可以說(shuō),我們的模型達(dá)到了行業(yè)最高水平”。