a&s專業(yè)的自動化&安全生態(tài)服務平臺

公眾號

安全自動化

安防知識網(wǎng)

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應用搜索

首頁 > 資訊 > 正文

從圖片到視頻，澎思科技行人再識別（ReID）技術(shù)再創(chuàng)新高

2019-08-23 10:52 閱讀 1373 來源：安防知識網(wǎng) 評論區(qū)

澎思科技(Pensees)在基于視頻的行人再識別數(shù)據(jù)集(PRID-2011，iLIDS-VID，MARS)中再次取得突破性進展，一舉實現(xiàn)在三大數(shù)據(jù)集上實現(xiàn)算法關(guān)鍵指標首位命中率(Rank-1 Accuracy)大幅度提升。

　　繼在三大主流單幀圖片行人再識別數(shù)據(jù)集(Market1501，DukeMTMC-reID,CUHK03)刷新世界紀錄后，近日，澎思科技(Pensees)在基于視頻的行人再識別數(shù)據(jù)集(PRID-2011，iLIDS-VID，MARS)中再次取得突破性進展，一舉實現(xiàn)在三大數(shù)據(jù)集上實現(xiàn)算法關(guān)鍵指標首位命中率(Rank-1 Accuracy)大幅度提升，準確率均創(chuàng)歷史新高。

　　PRID-2011、iLIDS-VID和MARS均為基于視頻的行人再識別數(shù)據(jù)集。PRID-2011數(shù)據(jù)集中的視頻對通過兩個固定的監(jiān)控攝像頭進行采集，攝像頭A包含385個行人，攝像頭B包含749個行人。這些行人中，只有200個行人同時出現(xiàn)在兩個攝像頭中。iLIDS-VID是在PRID-2011之后公布的數(shù)據(jù)集，與PRID-2011相比，數(shù)據(jù)更加整齊，也更有挑戰(zhàn)性。iLIDS-VID數(shù)據(jù)集是通過機場到達大廳的CCTV監(jiān)控視頻采集得到的，包含300個行人在兩個攝像頭下的600段視頻。視頻中存在嚴重的著裝相似，光照和視角變化，復雜背景和遮擋現(xiàn)象，因此識別難度大。MARS數(shù)據(jù)集是目前基于視頻ReID最大的數(shù)據(jù)集，是單幀圖片行人再識別數(shù)據(jù)集Market1501的擴充版，圖像數(shù)量由32,668幅擴展到了1,191,003幅。

　　與單幀圖片的行人再識別數(shù)據(jù)集一樣，首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision，mAP)是衡量視頻行人再識別ReID算法水平的核心指標。澎思科技此次一舉實現(xiàn)在三大數(shù)據(jù)庫上，僅利用原始數(shù)據(jù)就實現(xiàn)Rank-1 Accuracy關(guān)鍵指標大幅度提升。目前，澎思科技算法在最大的視頻數(shù)據(jù)集MARS上的首位命中率指標已經(jīng)達到88.8%，領(lǐng)先香港中文大學、中科大、北京大學等國內(nèi)外知名機構(gòu)。在iLIDS-VID和PRID-2011等數(shù)據(jù)集上首位命中率也分別達到了88.0%和95.5%。

　　澎思科技行人再識別ReID算法在MARS數(shù)據(jù)集的部分測試結(jié)果

　　立足澎思現(xiàn)有業(yè)務，展開垂直領(lǐng)域技術(shù)研發(fā)和創(chuàng)新

　　澎思科技此次成果的取得源于澎思新加坡研究院對算法的自研創(chuàng)新和融合探索，是立足于澎思現(xiàn)有業(yè)務和商業(yè)模式，結(jié)合公司的發(fā)展方向針對性開展垂直領(lǐng)域技術(shù)研發(fā)和創(chuàng)新。主要包括以下幾個方面：

　　1、受遮擋、姿態(tài)變化、視角變化等因素的影響，視頻序列中行人的特征是不連續(xù)的。用全局特征來度量每一幀圖片的權(quán)重往往會損失掉許多重要的信息。采用分割重組策略將特定局部特征重組成多個視頻序列進行學習，進而極大減少局部特征損失對最終特征的影響。

　　2、其次，提出了全新的雙向圖注意力機制模塊。將圖卷積神經(jīng)網(wǎng)絡和SENet完美結(jié)合，在整個序列上進行通道域的模式選擇學習。同時通過雙向網(wǎng)絡進行空間域的注意力區(qū)域?qū)W習。由于圖卷積網(wǎng)絡的特性，每一幀圖片的注意力特征都是與其他幀相互學習結(jié)合的結(jié)果，從而極大提高特征的代表性。

　　3、最終，利用幀間相似度進行序列融合。與大多數(shù)利用循環(huán)神經(jīng)網(wǎng)絡進行融合算法相比，最大的優(yōu)勢是不需要訓練額外的模型參數(shù)，僅僅通過數(shù)學計算的方式就可以達到融合的目的。這樣，數(shù)據(jù)的類內(nèi)相似度得到了極大的提高。在結(jié)合三元損失函數(shù)進行訓練后，類間相似度得到了降低，進而提高重識別效果。

　　基于視頻的行人再識別與單幀圖片的行人再識別任務目的是相同的，即在視角不重疊的多攝像機網(wǎng)絡下進行行人的匹配。盡管基于單幀圖片的行人再識別算法已經(jīng)取得了不錯的進步，但由于單幀圖片只包含有限的行人信息，網(wǎng)絡提取的特征不具備足夠的代表性，檢測結(jié)果往往受圖片質(zhì)量的影響較大。

　　與此相比，視頻序列的優(yōu)勢便凸顯出來。一個短視頻序列往往包含行人多運動狀態(tài)下的更多特征，并且利用時序信息，可以將背景、遮擋等干擾因素的影響降到最低，提升識別的準確度。

　　加速AI技術(shù)落地，持續(xù)推進AI產(chǎn)業(yè)化落地進程

　　基于視頻的行人再識別(ReID)技術(shù)更貼近智慧城市建設的諸多應用場景，能有效解決行人信息有限、特征不足及其他干擾因素等問題，相比單幀圖片的行人再識別具備更長遠的落地應用空間。接下來，澎思科技將進一步加大在視頻行人再識別算法上的研究，并逐步將算法應用到平安城市、智慧社區(qū)、智慧園區(qū)、智慧零售、智慧交通等實戰(zhàn)應用場景中。

　　澎思科技作為一家專注于計算機視覺和物聯(lián)網(wǎng)技術(shù)，提供“以人為核心”行業(yè)綜合應用解決方案的人工智能公司，在人工智能行業(yè)進入商業(yè)化落地主導的產(chǎn)業(yè)化階段，一方面將不斷加強自研技術(shù)創(chuàng)新，提升技術(shù)競爭力;另一方面堅持“行業(yè)+AI”策略，針對用戶需求深挖場景，發(fā)現(xiàn)行業(yè)痛點并不斷打磨算法和產(chǎn)品，將技術(shù)真正應用到業(yè)務場景中，推動AI技術(shù)的產(chǎn)品化落地和商業(yè)化進程。

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

上一篇

湖南省惠民惠農(nóng)補貼資金全經(jīng)“一卡通”發(fā)放
下一篇

大華股份助力諸暨楓橋創(chuàng)建“楓橋式”交警中隊

您可能也喜歡這些文章

參與評論

回復：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

從圖片到視頻，澎思科技行人再識別（ReID）技術(shù)再創(chuàng)新高