2019年11月19日,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)公布了全球最權(quán)威的人臉識(shí)別供應(yīng)商測(cè)試(FRVT)的最新結(jié)果,來自滴滴安全產(chǎn)品技術(shù)部的安全算法組的Didi Global Face-001(DGF-001)成績(jī)顯著,榮獲兩項(xiàng)全球第一名及全場(chǎng)景綜合第四排名。如果僅計(jì)入國(guó)內(nèi)參賽廠商,滴滴出行則綜合排行第二。特別指出的是在非常復(fù)雜困難的“跨14年犯罪嫌疑人識(shí)別”項(xiàng)目中滴滴出行排名第一!
人臉識(shí)別算法測(cè)試FRVT由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST,National Institute of Standards and Technology)主辦,并作為美國(guó)國(guó)家采購(gòu)的官方指導(dǎo),其主要任務(wù)是建立國(guó)家計(jì)量基準(zhǔn)與標(biāo)準(zhǔn),以提高國(guó)家技術(shù)基礎(chǔ),改進(jìn)行業(yè)產(chǎn)品和服務(wù)。由于FRVT測(cè)試數(shù)據(jù)均來自于真實(shí)業(yè)務(wù)場(chǎng)景,要求廠商提供完整的預(yù)測(cè)代碼,并且在主辦方的同一個(gè)平臺(tái)上運(yùn)行,其測(cè)試數(shù)據(jù)均不公開,有效避免算法過擬合及作弊,對(duì)于算法的效率也有嚴(yán)格的限制,所有提交只能使用不超過CPU 單線程1秒的計(jì)算資源來處理一張圖片從人臉檢測(cè)、人臉對(duì)齊、特征提取到識(shí)別的所有流程。因此FRVT測(cè)試被認(rèn)為是全球工業(yè)界實(shí)際應(yīng)用的黃金標(biāo)準(zhǔn)。
圖1 簽證、嫌疑人、視頻照片、自拍、自然場(chǎng)景的測(cè)試圖片樣例
FRVT 測(cè)試分為四個(gè)子任務(wù),每個(gè)任務(wù)對(duì)應(yīng)來自不同場(chǎng)景的不同類型照片樣本,分別為簽證照片(Visa)、嫌疑人照片(Mugshot)、非約束自然環(huán)境人臉照片(Wild)、非約束環(huán)境下兒童照片(Child ),部分樣例請(qǐng)參照?qǐng)D1。在11月19日所公布的最新結(jié)果中,滴滴獲得兩項(xiàng)全球第一(犯罪嫌疑人識(shí)別與跨14年犯罪嫌疑人識(shí)別)的成績(jī)。并且,值得一提的是,F(xiàn)RVT的排名發(fā)布的是各個(gè)機(jī)構(gòu)提交的歷史最優(yōu)結(jié)果,在最大程度上保證測(cè)試結(jié)果的準(zhǔn)確性與權(quán)威性。FRVT截至目前已經(jīng)測(cè)評(píng)二十余次,全球已有178家不同的公司、高校和研究機(jī)構(gòu)參與測(cè)評(píng),基本涵蓋了全球領(lǐng)先的各大人臉識(shí)別供應(yīng)商。如VisionLabs(俄羅斯)、EverAI(美國(guó))、Vocord(俄羅斯)、Imperial College London(英國(guó))、FaceSoft(英國(guó))、Neven Vison(Google收購(gòu))、Cognitec System GmbH(德國(guó))、國(guó)內(nèi)廠家如曠視、商湯、依圖、格林深瞳、愛奇藝、???、大華、騰訊等等。
DGF算法的核心在于基于當(dāng)前人臉識(shí)別前沿的大間距特征度量學(xué)習(xí)(Large Margin Metric Learning),充分使用超大規(guī)模的有標(biāo)注和無標(biāo)注人臉數(shù)據(jù)集來獲得更加優(yōu)異的識(shí)別性能。針對(duì)側(cè)臉變化、年齡變化利用預(yù)先優(yōu)化的GAN網(wǎng)絡(luò)來進(jìn)行數(shù)據(jù)增強(qiáng),利用超大規(guī)模的無標(biāo)注數(shù)據(jù)來提升網(wǎng)絡(luò)的識(shí)別性能,所以可以看到DGF在FRVT的測(cè)試中的跨年齡場(chǎng)景和側(cè)臉情形具備非常好的性能。并且DGF對(duì)Intel CPU環(huán)境進(jìn)行特殊優(yōu)化,在官方測(cè)試服務(wù)器環(huán)境E5-2630 v4 CPU上單線程運(yùn)行包括人臉檢測(cè)、對(duì)齊和識(shí)別全流程耗時(shí)僅650ms左右。在四個(gè)不同場(chǎng)景的測(cè)試中均表現(xiàn)不錯(cuò),尤其是在非常復(fù)雜跨14年的犯罪嫌疑人識(shí)別測(cè)試中取得了第一名的佳績(jī)。在業(yè)務(wù)實(shí)戰(zhàn)中,這個(gè)模型也顯示很好的性能,在低質(zhì)人臉場(chǎng)景下效果突出。
目前滴滴平臺(tái)在以人臉識(shí)別為核心的技術(shù)鏈條中,圍繞人、證、車打造完整的圖像視頻數(shù)據(jù)采集、識(shí)別和驗(yàn)證、安全防偽的技術(shù)體系,有效打擊黑色產(chǎn)業(yè)鏈,降低業(yè)務(wù)中的人不符、證不符和車不符。人臉識(shí)別、車臉識(shí)別、證件OCR、智能審核、安全相機(jī)等產(chǎn)品(見圖3)成為滴滴司乘準(zhǔn)入的基礎(chǔ)設(shè)施,默默守護(hù)著司乘安全。
此前,滴滴在世界最權(quán)威的人臉檢測(cè)公開評(píng)測(cè)集WIDERFACE中獲得五項(xiàng)測(cè)評(píng)的第一,滴滴在FRVT測(cè)評(píng)又獲佳績(jī),體現(xiàn)了滴滴致力于利用計(jì)算機(jī)視覺技術(shù)來保障出行安全,推動(dòng)技術(shù)更新,不斷迎接更多挑戰(zhàn)。滴滴將持續(xù)利用先進(jìn)的AI技術(shù)提升用戶體驗(yàn)、助力行業(yè)轉(zhuǎn)型升級(jí),進(jìn)而構(gòu)建智能出行新生態(tài)。