近年來(lái),人臉識(shí)別越來(lái)越受到人們的關(guān)注。與此同時(shí),許多研究機(jī)構(gòu)也一直在研究將人臉識(shí)別技術(shù)應(yīng)用到監(jiān)控當(dāng)中的方法。如何將人臉識(shí)別“植入”監(jiān)控,有何難點(diǎn),本文為您講述一二。
應(yīng)用現(xiàn)狀
自2001年的911事件和2004年的倫敦地鐵爆炸案發(fā)生以來(lái),在視頻監(jiān)控中應(yīng)用人臉識(shí)別的呼聲越來(lái)越高。圖1給出了美國(guó)FRVT2006人臉識(shí)別測(cè)試發(fā)表的國(guó)際上歷年來(lái)人臉識(shí)別的代表性的性能指標(biāo)。
根據(jù)圖1可以看出,2006年國(guó)際上已達(dá)到了在錯(cuò)誤接收率為0.1%時(shí),人臉識(shí)別的正確識(shí)別率為99%。這確實(shí)是一個(gè)高的技術(shù)指標(biāo),但是,得到這一高指標(biāo)的條件是達(dá)到兩眼距離為450像素的人臉?lè)直媛?,同時(shí),還需要可控光照和正面人臉的條件。然而,在普通監(jiān)控條件下,人臉圖像的質(zhì)量遠(yuǎn)遠(yuǎn)達(dá)不到這些可以稱為苛刻的條件。
我們知道,人臉識(shí)別分為辯識(shí)(identification)、驗(yàn)證(verification)、監(jiān)視目標(biāo)人識(shí)別(watch list)三類。辯識(shí)是通過(guò)未知人的人臉圖像與數(shù)據(jù)庫(kù)內(nèi)已知身份的人臉圖像進(jìn)行比對(duì)來(lái)確定未知人身份的過(guò)程,是一對(duì)多的人臉識(shí)別;驗(yàn)證是通過(guò)當(dāng)前被識(shí)別人的人臉圖像與數(shù)據(jù)庫(kù)中被識(shí)別人所聲明身份的人臉圖像的比對(duì)來(lái)驗(yàn)證被識(shí)別人所聲明身份對(duì)或錯(cuò)的過(guò)程,屬于一對(duì)一的人臉識(shí)別;監(jiān)視目標(biāo)人識(shí)別,是對(duì)于一個(gè)未知身份的待測(cè)樣本,人臉識(shí)別系統(tǒng)探測(cè)其是否在監(jiān)視名單上,屬于一對(duì)多的人臉識(shí)別。圖1所列的指標(biāo)屬于驗(yàn)證的性能指標(biāo)。FRVT2006沒(méi)有測(cè)試監(jiān)視目標(biāo)人識(shí)別的性能指標(biāo),而在FRVT2002發(fā)布的監(jiān)視目標(biāo)人識(shí)別的性能指標(biāo)中,最好的成績(jī)是虛警率(指不是監(jiān)視名單中的人被認(rèn)定為是監(jiān)控名單中的人的概率)為0.1%時(shí),目標(biāo)人在第一名的正確識(shí)別率不到60%(圖庫(kù)大小為3000),而實(shí)際場(chǎng)景的性能指標(biāo)將更差。
我們分析當(dāng)前人臉識(shí)別成功應(yīng)用的一些實(shí)例,如出入境的護(hù)照查驗(yàn),是清晰照片之間的比對(duì);而應(yīng)用在火車站的治安管理上,被識(shí)別人也是在室內(nèi)規(guī)范地站在攝像機(jī)前拍攝人臉。圖2為人臉識(shí)別在2008年北京奧運(yùn)中的應(yīng)用實(shí)例,這是一種驗(yàn)證人臉識(shí)別,其人臉拍攝的條件相對(duì)較好,場(chǎng)景是在大棚內(nèi),被識(shí)別人站在攝像機(jī)前(有停留),這是較為典型的應(yīng)用??梢哉f(shuō),當(dāng)前人臉識(shí)別的成功應(yīng)用,主要是有條件的人臉識(shí)別應(yīng)用。
難點(diǎn)及解決方案
在三類識(shí)別中,監(jiān)視目標(biāo)人識(shí)別是最難的,主要原因在于非主動(dòng)性的識(shí)別方式和場(chǎng)景的差異性,姿態(tài)、光照以及年齡、人臉?lè)直媛实确矫娴淖兓瘒?yán)重地影響了人臉識(shí)別率。許多研究單位一直在研究如何將人臉識(shí)別技術(shù)應(yīng)用到監(jiān)控中。筆者認(rèn)為,在當(dāng)前的條件下,首先應(yīng)該考慮的仍然是拍攝到好的人臉圖像。除算法方面的努力外,從系統(tǒng)應(yīng)用本身來(lái)看,主要需要解決如下的問(wèn)題:系統(tǒng)結(jié)構(gòu)問(wèn)題、人臉?lè)直媛蕟?wèn)題、姿態(tài)問(wèn)題、光照問(wèn)題和年齡問(wèn)題。[nextpage]
系統(tǒng)結(jié)構(gòu)問(wèn)題及解決方案
監(jiān)控系統(tǒng)是一個(gè)大型系統(tǒng),如何在現(xiàn)有系統(tǒng)中插入人臉識(shí)別,這是一個(gè)系統(tǒng)結(jié)構(gòu)問(wèn)題。例如一個(gè)監(jiān)控群有100個(gè)監(jiān)控點(diǎn),有兩種方案可供選擇:每一個(gè)監(jiān)控點(diǎn)都進(jìn)行人臉識(shí)別或者選擇性地對(duì)監(jiān)控點(diǎn)進(jìn)行人臉識(shí)別。圖3為選擇性進(jìn)行人臉識(shí)別的系統(tǒng)結(jié)構(gòu)示意圖。根據(jù)圖示,如果將人臉識(shí)別服務(wù)器置于監(jiān)控中心,視頻圖像的通道較少(如16路)。在條件允許的情況下,可另外設(shè)置一個(gè)電視墻用來(lái)顯示人臉識(shí)別的結(jié)果,可同時(shí)顯示報(bào)警通道號(hào)、報(bào)警時(shí)間等日志信息,也可顯示監(jiān)控的當(dāng)前目標(biāo)人和數(shù)據(jù)庫(kù)對(duì)應(yīng)的目標(biāo)人圖像。
在大型監(jiān)控群里選用每一個(gè)監(jiān)控點(diǎn)都進(jìn)行人臉識(shí)別的方案,需要增添更多的設(shè)備,改變當(dāng)前的監(jiān)控結(jié)構(gòu),或增添專用硬件。
人臉?lè)直媛蕟?wèn)題及解決方案
在監(jiān)視目標(biāo)人識(shí)別的應(yīng)用中,應(yīng)用了人臉?lè)直媛实母拍?。人臉檢測(cè)技術(shù)可以檢測(cè)到人臉?lè)直媛实偷娜四槪F(xiàn)在的人臉識(shí)別技術(shù)對(duì)人臉?lè)直媛蕝s有一定的要求,美國(guó)FRVT2006所指的低分辨率是指兩眼的距離為75像素,滿足這一條件的人臉圖像尺寸約為180(寬)x240(高)。而在實(shí)際監(jiān)控中,不管是標(biāo)清還是高清,大量獲得的是人臉?lè)直媛实偷娜四槇D像。通過(guò)采用綜合人臉檢測(cè)、人臉?lè)直媛蕶z測(cè)和自動(dòng)變焦的技術(shù)方案,可以獲得滿足人臉識(shí)別需要的人臉?lè)直媛矢叩膱D像。通常所提到的最佳二維人臉,其中包括最佳姿態(tài)、最佳人臉?lè)直媛实雀拍?,采用這種方案需要在系統(tǒng)軟件上增添自動(dòng)變焦功能。
另一種方案則采用一些其它的新技術(shù),包括應(yīng)用專用硬件,來(lái)獲得滿足人臉識(shí)別需要的分辨率高的人臉圖像。
姿態(tài)問(wèn)題及解決方案
姿態(tài)問(wèn)題是監(jiān)視目標(biāo)人識(shí)別非常棘手的問(wèn)題。主要是在姿態(tài)判別??爝M(jìn)行姿態(tài)的判別,云臺(tái)的調(diào)整也是為了獲得更好的拍攝角度。如果當(dāng)前人臉的水平轉(zhuǎn)動(dòng)角、俯仰角在某一范圍之內(nèi),則可直接進(jìn)行人臉識(shí)別;如果在特定范圍之外,可以采用人臉形成技術(shù),形成正面人臉圖像,繼而進(jìn)行人臉識(shí)別。人臉形成算法的復(fù)雜度較高,要考慮運(yùn)行速度問(wèn)題。當(dāng)然,也可以安裝多部攝像機(jī)來(lái)拍攝一個(gè)人,通過(guò)選優(yōu)的方法選取最好姿態(tài)的人臉圖像。
同時(shí),在正面人臉形成的方法中,有單攝像機(jī)和多攝像機(jī)的區(qū)別。一般來(lái)說(shuō),多攝像機(jī)的信息多于單攝像機(jī)的信息,由此形成的正面人臉的效果要優(yōu)于單攝像機(jī)的效果,但代價(jià)較高(包括攝像數(shù)量、合成算法的復(fù)雜度等)。[nextpage]
光照問(wèn)題及解決方案
光照問(wèn)題是監(jiān)視目標(biāo)人識(shí)別的又一個(gè)難點(diǎn)。人臉光照是指外界光源照射在人臉上,經(jīng)人臉表面反射后傳播到感光器材上的光線強(qiáng)度。實(shí)際采集圖像時(shí)的光照條件千變?nèi)f化,不同的光照條件如偏光、測(cè)光、高光所導(dǎo)致的人臉圖像過(guò)亮、過(guò)暗、陰陽(yáng)臉等都會(huì)使人臉檢測(cè)和識(shí)別的性能大幅度下降。
光照的估計(jì)和分類可以依據(jù)水平和俯仰角度等要素來(lái)進(jìn)行。有條件的場(chǎng)所應(yīng)對(duì)光照進(jìn)行控制,也盡量將全天候的露天環(huán)境改造為室內(nèi)環(huán)境并適當(dāng)采用補(bǔ)光的措施。當(dāng)然,采用近紅外的光照可以減弱環(huán)境光的影響。
年齡問(wèn)題及解決方案
要將當(dāng)前人的人臉和他十年前的人臉進(jìn)行識(shí)別,其難度是很大的。采用年齡估計(jì)與年齡模擬的方法,可以在一定程度上改善識(shí)別效果。圖4為一個(gè)年齡模擬的實(shí)驗(yàn)效果。
在實(shí)際應(yīng)用中,常采用數(shù)據(jù)即時(shí)更新的方法,把身份確認(rèn)后的當(dāng)前采集的人臉圖像替代以前存儲(chǔ)的人臉圖像,以減少年齡變化帶來(lái)的不利影響。
應(yīng)該注意的是,當(dāng)前用于監(jiān)視目標(biāo)人識(shí)別的人臉識(shí)別技術(shù)亟待發(fā)展,技術(shù)水平也還有待于進(jìn)一步提升,具有很大的發(fā)展空間。
目前,在機(jī)場(chǎng)、地鐵等公共場(chǎng)所已經(jīng)安裝了一些監(jiān)視目標(biāo)人識(shí)別的人臉識(shí)別系統(tǒng),這是可喜的事情。但是,應(yīng)用效果距離應(yīng)用方的要求尚有較大距離。在這個(gè)階段,廠家不要夸大其詞,用戶也不要漫無(wú)邊際,廠家與用戶的有機(jī)結(jié)合,將有助于人臉識(shí)別性能在應(yīng)用中提高。