10月27日至11月2日,兩年一屆的國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)ICCV 2019(International Conference on Computer Vision)在韓國(guó)首爾召開(kāi)。國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)與計(jì)算機(jī)視覺(jué)模式識(shí)別會(huì)議(CVPR)、歐洲計(jì)算機(jī)視覺(jué)會(huì)議(ECCV)并稱(chēng)計(jì)算機(jī)視覺(jué)方向的三大頂級(jí)會(huì)議。澎思科技首次參加便一舉獲得ICCVLFR三項(xiàng)競(jìng)賽第一,并獲得組委會(huì)頒發(fā)的特別創(chuàng)意獎(jiǎng),這彰顯了澎思在落地應(yīng)用場(chǎng)景化的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)力。
無(wú)約束條件下的靜態(tài)圖像人臉識(shí)別和動(dòng)態(tài)視頻人臉識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域研究最為深入的課題之一,在視頻監(jiān)控、生物醫(yī)療等領(lǐng)域擁有廣泛的應(yīng)用場(chǎng)景。近年來(lái),計(jì)算機(jī)視覺(jué)各領(lǐng)域的新技術(shù)、新方法都在多個(gè)頂級(jí)計(jì)算機(jī)視覺(jué)會(huì)議上被提出,基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)也取得了階段性的進(jìn)展。
盡管在人臉識(shí)別領(lǐng)域的研究取得了很多成果,但在基于深度學(xué)習(xí)的輕量級(jí)人臉識(shí)別研究和努力仍有待加強(qiáng)。在面對(duì)大數(shù)據(jù)庫(kù)人臉識(shí)別應(yīng)用的背景下,尋找一個(gè)可以在無(wú)限制的動(dòng)態(tài)監(jiān)控視頻場(chǎng)景下有優(yōu)異的表現(xiàn)的輕量級(jí)高精度的模型依然是一個(gè)挑戰(zhàn)。
ICCV LFR(Lightweight Face Recognition Challenge)輕量級(jí)人臉識(shí)別挑戰(zhàn)賽正是基于這樣的目的設(shè)立。它也成為今年ICCV的一項(xiàng)重要競(jìng)賽,吸引了來(lái)自全球292支競(jìng)賽隊(duì)伍的參加。不同于其他人臉識(shí)別比賽,ICCV LFR挑戰(zhàn)賽嚴(yán)格限制了訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。在如此嚴(yán)格的限制條件下,如何在292個(gè)參賽隊(duì)伍中脫穎而出變得異常艱難。
此次ICCV LFR挑戰(zhàn)賽一共分為四項(xiàng)競(jìng)賽,每項(xiàng)競(jìng)賽都有各自的限制和側(cè)重點(diǎn):
1、Protocol-1 (DeepGlint-Light) 圖像人臉識(shí)別輕量級(jí)識(shí)別模型,運(yùn)算復(fù)雜度小于1Gflops,模型大小小于20MB,數(shù)據(jù)類(lèi)型float32,特征維度512 (FPR@1e-8);
2、Protocol-2 (DeepGlint-Large) 圖像人臉識(shí)別大型級(jí)識(shí)別模型,運(yùn)算復(fù)雜度小于30Gflops,數(shù)據(jù)類(lèi)型float32,特征維度512 (FPR@1e-8);
3、Protocol-3 (IQIYI-Light) 視頻人臉識(shí)別輕量級(jí)識(shí)別模型,運(yùn)算復(fù)雜度小于1Gflops,數(shù)據(jù)類(lèi)型float32,特征維度512 (FPR@1e-4);
4、Protocol-4 (IQIYI-Large) 視頻人臉識(shí)別大型識(shí)別模型,運(yùn)算復(fù)雜度小于30Gflops,數(shù)據(jù)類(lèi)型float32,特征維度512 (FPR@1e-4)。
最終,澎思新加坡研究院申省梅團(tuán)隊(duì)提出基于關(guān)系圖的無(wú)監(jiān)督學(xué)習(xí)方法來(lái)強(qiáng)化特征,在ICCVLFR挑戰(zhàn)賽的輕量級(jí)圖像識(shí)別、大型圖像識(shí)別和輕量級(jí)視頻圖像識(shí)別三項(xiàng)競(jìng)賽中成績(jī)第一,領(lǐng)先微軟亞洲研究院、中科院自動(dòng)化所、京東、今日頭條等參賽的研究機(jī)構(gòu)和企業(yè),并與它們拉開(kāi)了不小的差距。在輕量級(jí)圖像識(shí)別比賽中,誤報(bào)率在億分之一(1e-8)的情況下,澎思科技取得了93.41%成績(jī),比其他參賽者高了近六個(gè)百分點(diǎn)。在輕量級(jí)視頻圖像比賽中,澎思科技72.23%的成績(jī)比其他參賽者高了近九個(gè)百分點(diǎn)。
在ICCV LFR的Workshop上,澎思新加坡研究院團(tuán)隊(duì)做了題為“A Graph Based Unsupervised Feature Clustering for Face Recognition”的口頭報(bào)告,闡述了團(tuán)隊(duì)提出的無(wú)監(jiān)督學(xué)習(xí)方法,利用測(cè)試數(shù)據(jù)兩兩之間的關(guān)系,使得屬于同一個(gè)ID的特征分布更加緊湊,不同ID的特征之間距離更加分散,由此大幅度提高了識(shí)別精度。該方法的有效性在IJB-C,YTF和CFP數(shù)據(jù)庫(kù)上都已經(jīng)被驗(yàn)證,并且大幅度提高了基線模型(baseline)的精度。
除了在ICCVLFR挑戰(zhàn)賽上取得三項(xiàng)第一外,澎思科技最新的算法模型在美國(guó)NIST人臉識(shí)別公開(kāi)數(shù)據(jù)集IJB-C上的表現(xiàn)也打破了世界記錄。IJB-C是在無(wú)限制條件下的美國(guó)NIST人臉識(shí)別公開(kāi)數(shù)據(jù)集中最為科學(xué)全面的基準(zhǔn)數(shù)據(jù)庫(kù)。在LFW,CFP-FP,AgeDB-30精確度普遍飽和的今天,IJB-C是目前最貼近視頻監(jiān)控實(shí)戰(zhàn)應(yīng)用場(chǎng)景的人臉識(shí)別基準(zhǔn)數(shù)據(jù)庫(kù)。
不僅僅是人臉識(shí)別領(lǐng)域,澎思科技近期在行人再識(shí)別(ReID)、視頻行人再識(shí)別(Video-based ReID)、即時(shí)定位與地圖構(gòu)建(SLAM)等計(jì)算機(jī)視覺(jué)技術(shù)上均取得突破,獲得多項(xiàng)世界冠軍。
- 7月,澎思科技在行人再識(shí)別(ReID)三大主流數(shù)據(jù)集測(cè)試Market1501,DukeMTMC-reID,CUHK03上刷新世界紀(jì)錄。
- 8月,澎思科技刷新視頻行人再識(shí)別(Video-based ReID)三大數(shù)據(jù)集PRID-2011,iLIDS-VID,MARS歷史最好成績(jī)。
- 10月,在剛剛結(jié)束的ISMAR 2019上,澎思科技在AR-SLAM挑戰(zhàn)賽中獲得VSLAM競(jìng)賽第三名。SLAM技術(shù)可以用于各種應(yīng)用包括自動(dòng)駕駛,運(yùn)動(dòng)機(jī)器人,3D重建,增強(qiáng)現(xiàn)實(shí)和混合現(xiàn)實(shí)。視覺(jué)SLAM是澎思科技在計(jì)算機(jī)視覺(jué)技術(shù)上的一個(gè)重要積累,也將為公司在現(xiàn)有和將來(lái)的業(yè)務(wù)中附加更多價(jià)值。正在舉行的2019深圳安博會(huì)上,澎思科技推出了面向安防場(chǎng)景的無(wú)人巡邏警車(chē),后續(xù)澎思自研的深度學(xué)習(xí)Visual SLAM技術(shù)就將逐步替代3D LiDAR來(lái)完成無(wú)人巡邏車(chē)的定位導(dǎo)航,從而降低成本,擴(kuò)展應(yīng)用場(chǎng)景。
目前,澎思科技在北京和新加坡兩地設(shè)立研究院,不斷匯聚全球AI人才,擁有全自研、全棧的計(jì)算機(jī)視覺(jué)技術(shù),橫跨計(jì)算機(jī)視覺(jué)多個(gè)研究領(lǐng)域。在此基礎(chǔ)之上,澎思科技一方面立足于現(xiàn)有業(yè)務(wù)和商業(yè)模式,結(jié)合公司的發(fā)展方向展開(kāi)面向場(chǎng)景的AI技術(shù)研發(fā)和創(chuàng)新;另一方面不斷從全球視角探索前沿技術(shù),讓公司始終保持對(duì)突破性科技的敏感度和關(guān)注度,為公司發(fā)力人工智能領(lǐng)域、探索新業(yè)務(wù)做好技術(shù)儲(chǔ)備。