前言:本文提出了一種基于大數(shù)據(jù)與人工智能分析的現(xiàn)代人口管控技術(shù),研究了復(fù)雜條件下人像識(shí)別技術(shù),并將成果成功應(yīng)用于基層公安實(shí)戰(zhàn),探索了一條結(jié)合集成實(shí)際的公安信息化建設(shè)的道路。其成果能夠有效整合跨警種、跨部門(mén)的人員信息資源,有效的提升公共安全領(lǐng)域的信息化水平,并在實(shí)戰(zhàn)中取得優(yōu)異成績(jī)。
文/李夏風(fēng) 云從科技研發(fā)總監(jiān)
(一)背景/引言:
隨著經(jīng)濟(jì)的高速發(fā)展以及城鎮(zhèn)化進(jìn)程的加快,我國(guó)城市人口日趨密集,城市人口流動(dòng)性也大大增加,但是各種犯罪活動(dòng)也爆發(fā)式增長(zhǎng),犯罪手段也越來(lái)越豐富隱秘,如通過(guò)使用多重身份證、假身份證實(shí)行犯罪,逃避抓捕等,加之交通便利、人口流動(dòng)性大,更加大了公安工作人員打擊抓捕犯罪嫌疑人的難度與力度。
當(dāng)前城市治安視頻監(jiān)控系統(tǒng)正處在大規(guī)模建設(shè)階段的后期,地方也投入大量資金人力去建設(shè)平安城市,但是僅僅依靠采集到的視頻圖像。當(dāng)前應(yīng)用的現(xiàn)狀是僅僅各級(jí)監(jiān)控中心走馬觀花的看看各監(jiān)控點(diǎn)的視頻,和在發(fā)生案件后刑偵部門(mén)為查找線索翻翻錄像資料。這種簡(jiǎn)單的應(yīng)用對(duì)于幾千萬(wàn)甚至幾個(gè)億的建設(shè)投資,或每年成百上千萬(wàn)租賃費(fèi)用來(lái)講,顯然是遠(yuǎn)遠(yuǎn)不夠的。同時(shí)在大規(guī)模視頻監(jiān)控系統(tǒng)中,因其缺乏對(duì)視頻的智能分析,要在海量的監(jiān)控視頻以及百萬(wàn)計(jì)的照片庫(kù)中找出犯罪嫌疑人,不僅費(fèi)時(shí)費(fèi)力,還有可能造成遺漏等情況,破案的效率大打折扣。對(duì)治安事件無(wú)法實(shí)時(shí)記錄和預(yù)警;長(zhǎng)期觀察監(jiān)控視頻也突顯了人員疲勞的局限性;而且海量的錄像數(shù)據(jù)難以管理和有效查看。對(duì)公安刑偵視頻破案、對(duì)犯罪嫌疑人、重點(diǎn)高危人員實(shí)時(shí)布控等需要智能信息技術(shù)的支撐。
進(jìn)一步,由于沒(méi)有統(tǒng)一建設(shè)一個(gè)信息化平臺(tái),造成了公安機(jī)關(guān)各部門(mén)的信息資源不能得到充分的利用,也不能為領(lǐng)導(dǎo)的決策提供及時(shí)、準(zhǔn)確、詳細(xì)的可靠依據(jù)。各級(jí)各部門(mén)的信息化建設(shè)目前基本處在各自應(yīng)用的水平,沒(méi)有達(dá)到各警種各部門(mén)之間的信息共享,各類(lèi)信息的應(yīng)用資源沒(méi)有得到充分的挖掘和合理有效的綜合利用,還不能為領(lǐng)導(dǎo)決策提供科學(xué)及時(shí)的服務(wù),也不能為一線民警提供全天候、全方位、全過(guò)程的綜合信息支持。
在進(jìn)入人工智能時(shí)代,人臉識(shí)別技術(shù)在以上情況下解決視頻、圖片等非結(jié)構(gòu)化信息到人員照片、身份信息等結(jié)構(gòu)化的轉(zhuǎn)變。針對(duì)目前現(xiàn)存的社會(huì)維穩(wěn)、反恐工作壓力巨大,警力資源有限,傳統(tǒng)工作模式和技術(shù)手段難以支撐等各種問(wèn)題,需要建立一套專業(yè)的公安人臉大數(shù)據(jù)實(shí)戰(zhàn)應(yīng)用平臺(tái),助力公安辦案業(yè)務(wù)智能化。比如,對(duì)案發(fā)嫌疑人進(jìn)行視頻偵查需要對(duì)嫌疑人的動(dòng)態(tài)活動(dòng)軌跡、社會(huì)關(guān)系等的數(shù)據(jù)的及時(shí)采集和分析,對(duì)重點(diǎn)場(chǎng)所的防控離不開(kāi)對(duì)場(chǎng)所的人流趨勢(shì)、風(fēng)險(xiǎn)因素等深度分析;對(duì)重點(diǎn)人群的服務(wù)離不開(kāi)對(duì)重點(diǎn)人群的組成、行為習(xí)慣等的分析;對(duì)社會(huì)矛盾的化解離不開(kāi)對(duì)幕后推手的深挖。
因此,結(jié)合公安實(shí)戰(zhàn),研究基于大數(shù)據(jù)與人工智能分析的現(xiàn)代人口管控技術(shù)與應(yīng)用,就可以最大限度發(fā)揮各類(lèi)人像數(shù)據(jù)資源的作用,為各級(jí)公安機(jī)關(guān)和各警種提供服務(wù),實(shí)現(xiàn)以“人臉”找人,深挖各類(lèi)影像數(shù)據(jù)的實(shí)戰(zhàn)價(jià)值,為公安實(shí)戰(zhàn)提供簡(jiǎn)單、高效、實(shí)用的技術(shù)手段。
同時(shí)將人像比對(duì)應(yīng)用“嵌入”到平安城視頻監(jiān)控系統(tǒng)中,在治安和刑偵業(yè)務(wù)開(kāi)展環(huán)節(jié),實(shí)現(xiàn)可疑身份、在逃份子等有效監(jiān)管,能夠有效利用現(xiàn)有視頻監(jiān)控資源。通過(guò)后期查詢抓拍庫(kù)的人員,確認(rèn)出現(xiàn)在某個(gè)攝像機(jī)下的人員身份,能夠有效震懾犯罪,消除社會(huì)治安隱患。
人像比對(duì)就是在尋找一種人像的描述方式,能夠不受各種因素影響。但是,無(wú)論是最早使用的幾何描述方式還是后來(lái)比較常用的代數(shù)描述方式,都不可避免地存在各種干擾。正因?yàn)樵谌四樧R(shí)別的過(guò)程中存在上述的各種各樣的問(wèn)題,因此在實(shí)際的檢測(cè)和識(shí)別過(guò)程中,當(dāng)這些因素疊加到一起的時(shí)候,情況就變得更加復(fù)雜,輕微的光線變化就有可能導(dǎo)致識(shí)別失敗。本文的研究是基于深度神經(jīng)網(wǎng)絡(luò),通過(guò)引入深度學(xué)習(xí)技術(shù),提升人像比對(duì)準(zhǔn)確率,適應(yīng)公安實(shí)戰(zhàn)需要。
一、分層矢量化模型
圖:?jiǎn)螌拥奶卣骶幋a的流程圖
為了解決深度神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)的問(wèn)題,我們提出了分層矢量化多媒體信息表達(dá)體系。分層矢量化實(shí)際上是一個(gè)多層的特征編碼的過(guò)程。一個(gè)單層的特征編碼由以下幾個(gè)步驟組成:首先,對(duì)圖片庫(kù)里所有的人臉圖像進(jìn)行分塊;其次對(duì)每塊區(qū)域提取局部特征(如LBP、SIFT)形成局部特征描述子;然后,對(duì)所有局部特征進(jìn)行量化形成字典;最后,根據(jù)字典信息和人臉圖像的映射,編碼形成人臉圖像的特征向量,我們定義該特征向量為人臉DNA。
人臉DNA特征能夠很好的描述特定人臉的不變量,該特征對(duì)人臉光線、角度、表情以及各種圖片噪聲具有一定的抗干擾性,再由雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化與學(xué)習(xí),人臉的區(qū)分性更強(qiáng),識(shí)別效果更佳。
舉個(gè)例子:我們認(rèn)一個(gè)人,最簡(jiǎn)單的從這個(gè)人的身高、體型出發(fā)、發(fā)型等來(lái)判斷是誰(shuí)(認(rèn)知第一層);更深一層從這個(gè)人的人臉、骨骼、虹膜、指紋來(lái)確認(rèn)這個(gè)人的身份(認(rèn)知第二層);更深層次,我們可以通過(guò)這個(gè)人的DNA來(lái)確認(rèn)這個(gè)人的真實(shí)身份(認(rèn)知第三層)。所以認(rèn)知一個(gè)人,隨著逐層深入,一層比一層更加可靠。
人臉DNA類(lèi)似,在計(jì)算機(jī)人臉識(shí)別過(guò)程中,我們可以將人臉的最外在特征眼睛大小形狀(丹鳳眼、濃眉大眼等),鼻子形狀(鷹鉤鼻、平鼻),嘴的大小形狀(櫻桃小嘴)理解成第一層;可以將眼睛的距離,五官的位置,臉的輪廓等理解成第二層;將人臉信息更抽象,提煉出人臉不隨光照、角度、年齡等影響的特征,就是更深的層,我們定義為人臉DNA。
二、雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)
為了將兩張照片映射到同一特征空間中進(jìn)行比較,在異構(gòu)深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,我們提出了雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)模型。此模型中每層都是一個(gè)深度網(wǎng)絡(luò)(分別以兩張照片為輸入),在訓(xùn)練時(shí)采用二分類(lèi)損失函數(shù)并對(duì)兩個(gè)網(wǎng)絡(luò)中對(duì)應(yīng)權(quán)值的差異性進(jìn)行正則化,可實(shí)現(xiàn)不同圖像空間到相同特征空間的映射。在特征空間中,相同身份人臉圖像的類(lèi)內(nèi)差異變小,而不同身份人臉圖像的類(lèi)間差異變大,從而增強(qiáng)了特征的判別性。
以人證合一為例:人的證件照要和現(xiàn)場(chǎng)的抓拍照或者普通照片上的人臉進(jìn)行比對(duì),我們不能直接拿來(lái)比對(duì),這樣因?yàn)槟挲g、光照等各種信息影響,識(shí)別不準(zhǔn)。我們應(yīng)該將證件照送到深度神經(jīng)網(wǎng)絡(luò)的一層,現(xiàn)場(chǎng)照送到深度神經(jīng)網(wǎng)絡(luò)的另一層,兩張照片通過(guò)兩層不同的網(wǎng)相互交換信息(年齡差距、角度差距、光照影響等),逐漸的去掉這些對(duì)人臉識(shí)別不利的因素,將兩張人臉照片映射到同一個(gè)可比的空間再進(jìn)行比較。
圖:雙層異構(gòu)深度神經(jīng)網(wǎng)絡(luò)示意圖