人臉圖像預(yù)處理技術(shù)
人臉圖像預(yù)處理是基于人臉檢測(cè)結(jié)果,對(duì)圖像進(jìn)行處理并最終服務(wù)于特征提取的過(guò)程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機(jī)干擾,往往不能直接使用,必須在圖像處理的早期階段對(duì)它進(jìn)行灰度校正、噪聲過(guò)濾等圖像預(yù)處理。對(duì)于人臉圖像而言,其預(yù)處理過(guò)程主要包括人臉圖像的光線補(bǔ)償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
圖像是人類獲取信息、表達(dá)信息和傳遞信息的重要手段。利用計(jì)算機(jī)對(duì)圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等的理論、方法和技術(shù)稱為數(shù)字圖像處理。
數(shù)字圖像處理技術(shù)已經(jīng)成為信息科學(xué)、計(jì)算機(jī)科學(xué)、工程科學(xué)、地球科學(xué)等諸多方面的學(xué)者研究圖像的有效工具。數(shù)字圖像處理主要包括圖像變換、圖像增強(qiáng)、圖像編碼、圖像復(fù)原、圖像重建、圖像識(shí)別以及圖像理解等內(nèi)容。數(shù)字圖像的邊緣檢測(cè)是圖像分割、目標(biāo)區(qū)域識(shí)別、區(qū)域形狀提取等圖像分析領(lǐng)域十分重要的基礎(chǔ),也是圖像識(shí)別中提取圖像特征的一個(gè)重要屬性,邊緣檢測(cè)算子可以檢查每個(gè)像素的鄰域并對(duì)灰度變化率進(jìn)行量化。
空域?yàn)V波按照空域?yàn)V波器的功能又可分為平滑濾波器和銳化濾波器。平滑濾波器可以用低通濾波實(shí)現(xiàn),目的在于模糊圖像或消除噪聲;銳化濾波器是用高通濾波來(lái)實(shí)現(xiàn),目的在于強(qiáng)調(diào)圖像被模糊的細(xì)節(jié)。
光照不理想的情況下,為了把人臉區(qū)域從非人臉區(qū)域分割出來(lái),需要使用適合不同膚色和不同光照條件的可靠的膚色模型。常用的RGB表示方法不適合于皮膚模型,在RGB空間,三基色(R、G、B)不僅代表顏色,還表示了亮度。由于周?chē)h(huán)境光照的改變,亮度可能使人臉的檢測(cè)變得更加復(fù)雜,在皮膚的分割過(guò)程中是不可靠的。為利用膚色在色度空間的聚類性,需要把顏色表達(dá)式中的色度信息與亮度信息分開(kāi),將R、G、B轉(zhuǎn)換為色度與亮度分開(kāi)的色彩表達(dá)空間可以解決這個(gè)問(wèn)題。
RGB色彩系統(tǒng)用R、G、B三種基本顏色分量來(lái)表示數(shù)字圖像像素的顏色值。我們非常熟悉的計(jì)算機(jī)屏幕的顯示通常采用RGB色彩系統(tǒng)。這是最常見(jiàn)的色彩系統(tǒng),RGB色系坐標(biāo)中三維空間的三個(gè)軸分別與紅、綠、藍(lán)三基色相對(duì)應(yīng),原點(diǎn)對(duì)應(yīng)于黑色,離原點(diǎn)最遠(yuǎn)的頂點(diǎn)對(duì)應(yīng)于白色,其他顏色落在三維空間中由紅、綠、藍(lán)三基色組成的彩色立方體中。其他的色彩系統(tǒng)常以RGB色彩系統(tǒng)為基礎(chǔ),其分量可以描述為RGB三色的線性或非線性函數(shù)。RGB色彩系統(tǒng)通過(guò)色彩的相加來(lái)產(chǎn)生其他顏色,通常稱為加色合成法。
當(dāng)光照條件發(fā)生變化時(shí),人臉的顏色也會(huì)發(fā)生一定的變化。實(shí)驗(yàn)表明,當(dāng)待檢測(cè)的圖像亮度高于訓(xùn)練圖像的亮度時(shí),人臉大部分區(qū)域的顏色不會(huì)超過(guò)正常光照條件下人臉顏色的變化范圍。但當(dāng)待檢測(cè)的人臉圖像的亮度低于訓(xùn)練樣本圖像的亮度時(shí),人臉顏色很可能超出正常光照條件下人臉顏色的變化范圍。為了解決這一問(wèn)題,就要對(duì)待檢測(cè)的人臉圖像進(jìn)行光線補(bǔ)償。光線補(bǔ)償對(duì)于畫(huà)面較暗的圖像很有效,能極大提高后續(xù)膚色建模的效果。對(duì)于光線較暗的圖片進(jìn)行光線補(bǔ)償可以很好地提高人臉膚色建模的效果。
在運(yùn)動(dòng)場(chǎng)景下,多數(shù)時(shí)候會(huì)抓拍到的只有半張臉的圖片,使用對(duì)稱補(bǔ)值的方式,能有效地為下一步特征提取補(bǔ)齊整張人臉的最低特征值,并進(jìn)行有效識(shí)別;對(duì)于動(dòng)態(tài)識(shí)別場(chǎng)景,往往出現(xiàn)人臉信息不全的情況,特別是對(duì)于疑犯等,都存在故意壓低頭或者側(cè)臉?lè)绞叫凶撸苊獗槐O(jiān)控抓拍到全臉的情況;使用半臉對(duì)稱補(bǔ)值方式,有效地解決了此場(chǎng)景問(wèn)題。
在一系列的預(yù)處理后,人臉識(shí)別的最終準(zhǔn)確率及效率得到大幅度提升,且能適用更多的應(yīng)用場(chǎng)景,對(duì)于原始已建設(shè)的安防系統(tǒng),不需要二次的改造,不僅節(jié)約成本,也解決實(shí)際問(wèn)題。