近日,國(guó)內(nèi)人工智能企業(yè)澎思科技(Pensees)在行人再識(shí)別(Person Re-identification,簡(jiǎn)稱ReID)算法上取得突破,在三大主流ReID數(shù)據(jù)集測(cè)試(Market1501,DukeMTMC-reID,CUHK03)中,算法關(guān)鍵指標(biāo)首位命中率(Rank-1 Accuracy)獲得業(yè)內(nèi)最好成績(jī),刷新了世界紀(jì)錄。
在行人再識(shí)別(ReID)技術(shù)研究領(lǐng)域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是衡量算法水平的核心指標(biāo)。此次,澎思科技一舉實(shí)現(xiàn)了在三大數(shù)據(jù)集上Rank-1關(guān)鍵指標(biāo)的大幅提升,在Market 1501的Rank-1指標(biāo)上已經(jīng)達(dá)到96.73%,領(lǐng)先了人們熟知的大華、云從科技等頭部廠家。
同時(shí),在Duke MTMC-reID、CUHK03兩個(gè)數(shù)據(jù)集上,澎思科技也刷新了之前業(yè)內(nèi)最高紀(jì)錄,Rank-1指標(biāo)分別達(dá)到了92.01%和84.57%,尤其在最具挑戰(zhàn)的CUHK03上提升明顯,在Rank-1和mAP上均達(dá)到業(yè)界最好水準(zhǔn)。
據(jù)介紹,行人再識(shí)別(ReID)技術(shù)起源于多攝像頭跟蹤,用于判斷非重疊視域中拍攝到的不同圖像中的行人是否屬于同一個(gè)人。作為人臉識(shí)別技術(shù)的重要補(bǔ)充,其發(fā)展內(nèi)核便是在不同視頻中,在無(wú)法獲取清晰人臉特征信息前提下,機(jī)器通過穿著、發(fā)型、體態(tài)等信息將同一個(gè)人識(shí)別出來(lái),增強(qiáng)數(shù)據(jù)的時(shí)空連接性。
而此次澎思科技在算法上的突破主要得益于以下幾個(gè)方面:
首先,采用human parsing對(duì)人體分割,結(jié)合金字塔水平分塊策略,使得網(wǎng)絡(luò)準(zhǔn)確提取細(xì)粒度區(qū)域特征的能力大幅提升;
訓(xùn)練階段,借鑒curriculum learning思路,難樣本比例逐步提升,使得損失函數(shù)更易收斂;
通過圖網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)得到各個(gè)細(xì)粒度特征的加權(quán)系數(shù),進(jìn)一步提高特征的分辨能力;
最后,在測(cè)試階段,除常規(guī)距離計(jì)算手段,引入重構(gòu)距離,提升網(wǎng)絡(luò)對(duì)未對(duì)齊、遮擋等技術(shù)難點(diǎn)的健壯性。
行人再識(shí)別(ReID)技術(shù)涉及計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、模式識(shí)別等多個(gè)學(xué)科領(lǐng)域,可以廣泛應(yīng)用于智能視頻監(jiān)控、安保、刑偵等領(lǐng)域。在公共安全以外,行人再識(shí)別(ReID)技術(shù)還可以應(yīng)用于智慧城市、智能交通、智慧零售、智能制造、智慧園區(qū)等領(lǐng)域,有很高的應(yīng)用價(jià)值。