人臉識別技術(shù)是目前安防領(lǐng)域乃至全球保安系統(tǒng)最熱門的研究方向之一,有著廣闊的應(yīng)用前景和實(shí)現(xiàn)需求。而人臉識別技術(shù)的應(yīng)用與創(chuàng)新,則是今后人們在人臉識別方面有所進(jìn)步的重要分析環(huán)節(jié),也是理論與實(shí)踐相結(jié)合的重要依據(jù),它是使人臉識別技術(shù)取得突破和完善的有力后盾。本文著重介紹了人臉識別技術(shù)應(yīng)用與創(chuàng)新的應(yīng)用背景、原理以及需要創(chuàng)新的方向和創(chuàng)新實(shí)現(xiàn)的結(jié)果。
人臉識別創(chuàng)新特點(diǎn)
創(chuàng)新點(diǎn)一——快速動態(tài)多視角人臉檢測定位
在人流密集以及畫面中同時出現(xiàn)多個人臉的場合,系統(tǒng)對移動中不配合的布控對象的人臉進(jìn)行快速的動態(tài)檢測和定位。
1、創(chuàng)新程度
眾所周知,生物特征的檢測采集和預(yù)處理是生物識別技術(shù)中工作量最大最耗時的環(huán)節(jié),大部分同類產(chǎn)品和技術(shù)都需要用戶在鏡頭前停頓以配合識別比對,才能順利地完成人臉檢測定位。而快速動態(tài)多視角人臉檢測定位技術(shù)的創(chuàng)新點(diǎn)在基于統(tǒng)計(jì)分析的特征檢測方法基礎(chǔ)上,采用連續(xù)自適應(yīng)Boost算法訓(xùn)練由強(qiáng)分類器組成的瀑布型檢測器,以及通過姿態(tài)預(yù)估計(jì)和多分辨率搜索技術(shù)提高檢測速度,可以非常準(zhǔn)確而又快速地完成檢測定位工作。在P4 2GHZ的PC上,對一幅640×480的圖片進(jìn)行準(zhǔn)確的人臉檢測定位的處理時間平均不超過60ms。
此外,為了優(yōu)化對多姿態(tài)多角度人臉的檢測,需要先對圖像進(jìn)行梯度處理,再對局部直方圖進(jìn)行統(tǒng)計(jì),以局部直方圖作為特征,提高多姿態(tài)檢測的穩(wěn)定性。
在用戶不主動配合以及人流不受控制的實(shí)際布控場合,該技術(shù)項(xiàng)目系統(tǒng)能對每秒鐘20-30幀的實(shí)時視頻流進(jìn)行快速的人臉檢測和預(yù)處理,也就是需要在每秒鐘連續(xù)完成20-30次基于視圖的人臉檢測定位處理工作。考慮到人流密集、人臉運(yùn)動、以及畫面中同時出現(xiàn)多個人臉時,同時定位帶來的工作量和處理難度,該系統(tǒng)進(jìn)行快速動態(tài)多姿態(tài)人臉檢測和定位的核心技術(shù)已經(jīng)進(jìn)行了優(yōu)化,且已達(dá)到國際領(lǐng)先水平(如圖1)。
2、創(chuàng)新難度和需要重點(diǎn)解決的問題
快速準(zhǔn)確的多姿態(tài)實(shí)時人臉檢測,長期以來一直是理論研究和實(shí)際應(yīng)用領(lǐng)域的難點(diǎn)問題,為了準(zhǔn)確有效地進(jìn)行人臉檢測,可以采用連續(xù)自適應(yīng)Boost算法替代訓(xùn)練整合得到強(qiáng)分類器,并組成基于視圖的瀑布型檢測器進(jìn)行逐層人臉樣本篩選。同時為了大幅度地提高檢測速度,將瀑布的前幾層作為姿態(tài)預(yù)估計(jì)器,使姿態(tài)預(yù)估計(jì)和人臉檢測同步進(jìn)行,并且按搜索量化步長的大小,對圖像進(jìn)行金字塔式逐次細(xì)化的多分辨率搜索。
然而檢測技術(shù)的優(yōu)化往往需要在準(zhǔn)確率和速度之間進(jìn)行折衷,加速策略會導(dǎo)致正確率的下降。姿態(tài)估計(jì)器和多分辨率搜索,能夠?qū)z測速度提高兩倍甚至更多,但是這會造成在檢測率相當(dāng)?shù)那闆r下誤報率會有所上升。[nextpage]
需要重點(diǎn)解決的問題在于根據(jù)實(shí)際監(jiān)控系統(tǒng)的應(yīng)用需求對目前的方法進(jìn)行進(jìn)一步的優(yōu)化,設(shè)計(jì)出最佳性能的姿態(tài)估計(jì)器,以及能夠在正確率和速度之間取得最佳平衡的多分辨率搜索參數(shù),如搜索步長和分辨率層次的選擇。
上述工作需要深入掌握連續(xù)自適應(yīng)Boost算法、分類器設(shè)計(jì)、ANN訓(xùn)練、統(tǒng)計(jì)學(xué)習(xí)方法等模式識別領(lǐng)域的知識技能,以及進(jìn)行相關(guān)的科研實(shí)驗(yàn)和實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析,并能完成基于實(shí)時視頻流的應(yīng)用設(shè)計(jì)及開發(fā),具有比較高的難度。
創(chuàng)新點(diǎn)二——光線歸一化預(yù)處理及陰影消除
光線變化是目前限制人臉識別技術(shù)性能的最關(guān)鍵因素之一。唯有克服其強(qiáng)度變化和方向變化對人臉圖像的影響,才能使得系統(tǒng)進(jìn)行人臉識別辨認(rèn)的精確度在正常光線環(huán)境變化的情況下保持穩(wěn)定。
1、創(chuàng)新程度
一些專業(yè)研究人員在目前最新的光照錐和球諧函數(shù),以及基于商圖像的光照歸一化方法的基礎(chǔ)上,提出基于全局光照子空間的光照歸一化方法,建立能夠表示人臉在固定姿態(tài)任意光線情況下的圖像集合的低維線性人臉光照子空間,進(jìn)而合成虛擬光照圖像,使比較的兩幅圖像幾乎處于相同的光照條件下。同時通過對在監(jiān)控現(xiàn)場長時間獲得的且灰度變化的圖像序列反射邊緣和陰影邊緣進(jìn)行分析,利用邊緣圖中值消除陰影邊緣,并根據(jù)不含陰影的人臉圖像擁有類似反射邊緣的原理,進(jìn)一步用梯度光照子空間消除光線造成的陰影。通過有效的歸一化和陰影消除,該技術(shù)項(xiàng)目可以做到識別效果基本不受正常光線變化的影響(如圖2)。
2、創(chuàng)新難度和需要重點(diǎn)解決的問題
美國國土安全部門對生物護(hù)照進(jìn)行的首輪測試以及國際權(quán)威的FRVT-2002測試均表明,在光線變化的情況下,人臉識別的錯誤率可能達(dá)到50%。而對于光線問題,迄今為止尚無理想的解決方法和實(shí)質(zhì)性的進(jìn)展。
一些專家嘗試從三維的角度對光線問題進(jìn)行分析,并在光照錐、球諧函數(shù)以及商圖像理論的基礎(chǔ)上,提出了新的基于全局光照子空間的光線歸一化方法。并充分利用監(jiān)控布控應(yīng)用能夠用靜止攝像機(jī)采集到固定場景長時間的不同光線圖像序列的優(yōu)勢,采用基于圖像序列的極大似然估計(jì)算法,結(jié)合梯度光照子空間來消除人臉圖像中的光照陰影。
但是全局光照子空間的歸一化方法的性能會受到樣本不足的限制,而用梯度光照子空間約束來消除陰影的方法需要正面光照的人臉圖像最為訓(xùn)練集,因此尋找人臉的其他約束,進(jìn)一步提高光線預(yù)處理的效果是深入研究需要解決的問題。
上述工作是目前整個人臉識別領(lǐng)域的重點(diǎn)難點(diǎn)課題,需要開發(fā)人員對目前為止該領(lǐng)域的研究成果和進(jìn)展具有深入了解,并能在此基礎(chǔ)上創(chuàng)造性地提出更加行之有效的方法。研究過程中還需要收集大量的人臉光線樣本數(shù)據(jù)進(jìn)行復(fù)雜的統(tǒng)計(jì)學(xué)習(xí)研究,具有非常高的難度。[nextpage]
創(chuàng)新點(diǎn)三——遠(yuǎn)距離低分辨率下的精確匹配
與普通的近距離主動配合式身份驗(yàn)證應(yīng)用(如門禁、信息安全登陸等)不同,基于普通通用監(jiān)控?cái)z像機(jī)進(jìn)行遠(yuǎn)距離(5米之外)布控,同時考慮到人臉可能出現(xiàn)的范圍,所捕獲的人臉在有限分辨率(例如640×480、720×576)的視頻畫面中僅占一定比例的大小。因此需要在人臉分辨率較低的情況下(兩眼瞳孔之間約20-30像素)完成準(zhǔn)確識別。
1、創(chuàng)新程度
首先,基于SIFT(Scale Invariant Feature Transform)算法原理,從利用高斯差分函數(shù)極值粗略定位圖像尺度空間極值開始,在局部圖像梯度分析的基礎(chǔ)上,采用瀑布式篩選過濾的方法,快速有效地逐層提取那些與圖像縮放和尺度無關(guān)的、穩(wěn)定的關(guān)鍵特征點(diǎn)。并通過多尺度濾波實(shí)現(xiàn)尺度不變性,通過8個方向的梯度直方圖實(shí)現(xiàn)旋轉(zhuǎn)不變性和部分仿射不變。從而可以在有限分辨率,以及尺度變化的人臉圖像中分析提取出能夠進(jìn)行精確人臉識別的特征信息。因此,該系統(tǒng)可以在國內(nèi)普通分辨率監(jiān)控?cái)z像機(jī)的平臺上,以及由于人臉出現(xiàn)時與攝像機(jī)距離不固定造成的人臉大小(即分辨率)變化的情況下,仍然保持識別正確率的穩(wěn)定性。
2、創(chuàng)新難度和需要重點(diǎn)解決的問題
關(guān)于提取與尺度旋轉(zhuǎn)等變化無關(guān)的穩(wěn)定特征點(diǎn)的研究,目前還處在完善和提高階段,還需要大量的進(jìn)一步研究和探索。尤其是在監(jiān)控應(yīng)用中,人臉的不清晰和大小變化往往受三維角度的變化和光線變化的影響。因此需要在對理想化圖像的尺度無關(guān)特征提取的基礎(chǔ)上,針對人臉這一類識別對象共有的特征約束進(jìn)行優(yōu)化,并考慮光線和角度變化等復(fù)雜情形下的穩(wěn)定性。
上述工作需要開發(fā)人員在深入了解和掌握SIFT算法原理及技巧的基礎(chǔ)上,從人臉識別的全局角度配合光線角度等因素的優(yōu)化處理解決尺度問題,需要進(jìn)行大量創(chuàng)新性的嘗試研究工作,具有比較高的難度。
創(chuàng)新點(diǎn)四——長時間跨度的準(zhǔn)確人臉分析
在實(shí)際監(jiān)控布控應(yīng)用中,通常無法讓布控對象主動配合進(jìn)行人臉注冊,也很難獲取其近期的照片,往往手頭能找到的照片具有很長的時間跨度。因此需要在布控識別對象不同年齡的人臉樣本之間完成準(zhǔn)確的識別匹配。
1、創(chuàng)新程度
由于該技術(shù)的核心識別算法主要基于圖像中所體現(xiàn)出的人臉骨骼特征信息的提取和對比,而將皮膚皺紋、皮膚顏色深淺、兩腮胖瘦、發(fā)型胡須等時間所能造成的變化排除在外。成人的骨骼不會隨時間發(fā)生明顯或過大的變化,然而由于臉部肌肉、紋理會隨著年齡的變化而有所改變,因而導(dǎo)致人臉圖像的變化。在這里,大家采用非線性流形學(xué)習(xí)的方法(Nonlinear Manifold Learning),將同一個人不同時間段的樣本用最近鄰的方法,連接成為一個復(fù)雜的流形,這樣每個人都有一個流形。然后采用區(qū)分分析法,尋求不同人的流形的最佳投影方向,從而達(dá)到良好的分類效果,實(shí)現(xiàn)跨時間段識別。
在此基礎(chǔ)上,研發(fā)人員還基于統(tǒng)計(jì)分析方法在大量的不同年齡的人臉樣本的基礎(chǔ)上進(jìn)行算法學(xué)習(xí)和訓(xùn)練,提取出不隨時間變化的穩(wěn)定特征點(diǎn),同時淘汰那些容易受年齡影響的面部特征信息,對時間跨度下的識別性能進(jìn)行進(jìn)一步的優(yōu)化。該技術(shù)系統(tǒng)目前已經(jīng)可以在監(jiān)控應(yīng)用中用平均3年之內(nèi)的照片準(zhǔn)確識別現(xiàn)場人臉,部分樣本實(shí)驗(yàn)可以識別10年以上的人臉(如圖3)。
[nextpage]
2、創(chuàng)新難度和需要重點(diǎn)解決的問題
目前,所有的幾何骨骼特征信息,都是從受到光線及其他因素影響的圖像中提取出來的,尤其是人臉的骨骼凹凸在光照下產(chǎn)生的陰影,這樣在沒有很好地解決光線影響的情況下,必然會影響正確率。此外,年齡跨度的研究和進(jìn)一步完善,需要建立在對大量不同人在不同時間的人臉樣本的統(tǒng)計(jì)分析的基礎(chǔ)之上,如何獲取足夠豐富的樣本,就構(gòu)成了進(jìn)一步研究的難度。
上述工作需要開發(fā)人員在很好地解決光線影響的基礎(chǔ)之上對人臉隨年齡變化的規(guī)律進(jìn)行研究,并對非線性流形學(xué)習(xí)和區(qū)分判別分析法有深入的了解和掌握,同時還需要收集大量的人臉樣本進(jìn)行進(jìn)一步的統(tǒng)計(jì)分析學(xué)習(xí),具有比較高的理論和實(shí)際操作難度。
創(chuàng)新點(diǎn)五——高效穩(wěn)定的系統(tǒng)結(jié)構(gòu)
1、創(chuàng)新程度
獨(dú)立模塊化的體系結(jié)構(gòu),高度靈活的可擴(kuò)展性,基于網(wǎng)絡(luò)的數(shù)據(jù)傳輸,支持服務(wù)器組并行處理存儲的系統(tǒng)架構(gòu),高容錯能力以及局部發(fā)生故障時,整個系統(tǒng)的照常運(yùn)轉(zhuǎn)(如圖4、圖5)。
2、創(chuàng)新難度和需要重點(diǎn)解決的問題
對整個算法和功能流程,以及系統(tǒng)架構(gòu)進(jìn)行模塊化設(shè)計(jì)和劃分,使各個系統(tǒng)單元獨(dú)立運(yùn)行,并制定單元之間的通訊握手標(biāo)準(zhǔn),以及為容錯性考慮設(shè)計(jì)好,各個計(jì)算節(jié)點(diǎn)的冗余分配方案。
上述工作,需要開發(fā)人員深入掌握服務(wù)器組和并行計(jì)算集群的分析設(shè)計(jì)原理,數(shù)據(jù)庫維護(hù)和優(yōu)化方法,以及計(jì)算機(jī)接口和網(wǎng)絡(luò)通訊協(xié)議,且需要具有相當(dāng)程度的技巧,具有一定難度。(本文作者:黃曉斌 現(xiàn)任職于北京時代鼎典信息技術(shù)有限公司)