3.黃河連線:我們可以經(jīng)常聽到人臉識別,而且猴子和人類都屬于靈長類動物,那么猴臉識別的原理與人臉識別類似么?是什么原理?
苗啟廣:金絲猴的面部特征和人臉的面部特征存在一定的相似之處,但同時(shí)也存在較大的差異,主要表現(xiàn)在面部結(jié)構(gòu)和面部的紋理。當(dāng)我們初次聽說或看到猴臉識別時(shí),多數(shù)人的直觀的想法就是利用現(xiàn)有的人臉識別方法進(jìn)行猴臉識別。而人臉特征和動物面部特征之間存在較大差異,如果將現(xiàn)有的人臉檢測和識別方法直接應(yīng)用于動物面部檢測與識別會產(chǎn)生一系列問題。
雖然金絲猴面部特征與人臉特征之間存在一定的相似之處,但在面部結(jié)構(gòu)、器官形狀和面部紋理特征等諸多方面存在較大差異,主要體現(xiàn)在三個(gè)方面:
■ 第一,相對于人臉,金絲猴面部由毛發(fā)和皮膚兩個(gè)部分組成;
■ 第二,金絲猴的面部(特別是面部毛發(fā)區(qū)域)具有更復(fù)雜的紋理特征;
■ 第三,相對于人臉特征的全局相似性,金絲猴面部特征具有顯著的局部差異性。
因此,針對金絲猴面部圖像的檢測與識別,不能直接采用現(xiàn)有的人臉檢測與識別的方法。
圖1 金絲猴面部圖像與人臉圖像對比
基于深度學(xué)習(xí)的猴臉識別的基本原理其實(shí)是和人臉識別類似的,也就是利用深度學(xué)習(xí)算法提取金絲猴面部的有效特征,進(jìn)而對其進(jìn)行更有效的個(gè)體識別。但是我們不能直接使用現(xiàn)有的人臉識別的方法進(jìn)行猴臉識別,我們需要根據(jù)具體的任務(wù),對算法模型進(jìn)行相應(yīng)的改進(jìn),使其更適合于猴臉識別任務(wù)。
4.黃河連線:與人臉識別相比,猴臉識別的難度如何?精確度如何?
苗啟廣:相對于人臉識別,猴臉識別還是存在一定難度的,除了上邊提到的環(huán)境復(fù)雜,面部角度和形態(tài)多樣性之外,還有就是猴臉的相似性。相對于人臉,猴臉識別就類似于"多胞胎"的識別,相同年齡階段同一性別的金絲猴的長相非常相似,人類僅憑視覺難以準(zhǔn)確識別,這也給我們設(shè)計(jì)猴臉識別算法提出了較高的要求,也就是如何能夠提取出長相相似的不同金絲猴個(gè)體面部的差異性特征,以及同一金絲猴個(gè)體在不同因素影響下面部的相似性特征。
好在目前具有多隱層的人工神經(jīng)網(wǎng)絡(luò)有著優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)到的特征對數(shù)據(jù)有著更本質(zhì)的刻畫,更有利于對金絲猴個(gè)體的識別。相比于一些傳統(tǒng)的學(xué)習(xí)方法,在精度上,有了很大的提高。目前已經(jīng)對197只金絲猴進(jìn)行了識別,識別準(zhǔn)確率在97%以上,包括秦嶺皇冠朝陽溝保護(hù)區(qū)的23只金絲猴,佛坪熊貓谷的48只金絲猴和周至的126只金絲猴。
5.黃河連線:猴子的活躍度遠(yuǎn)高于人,且不受控制,能否順利識別?在技術(shù)上有什么解決辦法?
苗啟廣:在野外,猴子的活躍度高,不受控制,但是事實(shí)上我們并不需要和猴子近距離接觸,只需要拍攝記錄下猴子的照片或視頻即可,在圖像或視頻幀中猴臉分辨率在100×100左右,且不存在運(yùn)動模糊和大面積遮擋,就可以進(jìn)行識別。目前常用的有200萬像素的智能手機(jī)就可以滿足要求,當(dāng)然單反相機(jī)就更好了。因此,獲取猴臉圖像在設(shè)備上不存在問題。而主要的問題在于如何能夠拍到側(cè)臉角度較小,也就是小于30°的側(cè)臉,沒有大面積遮擋的猴臉。對于不聽指令,活躍度很高的金絲猴,這一任務(wù)具有較大的挑戰(zhàn)。
在單個(gè)人拍攝的情況下,我們總結(jié)了相應(yīng)的拍攝策略和參數(shù)要求,并且形成了相應(yīng)的規(guī)范。目前我們在進(jìn)行多物種動物拍攝過程中,基本都是按照這一規(guī)范進(jìn)行的。我們可以在已拍攝的圖像和視頻中實(shí)現(xiàn)金絲猴面部的檢測與識別,并且已經(jīng)實(shí)現(xiàn)了基于淺層ResNet模型的金絲猴面部識別的實(shí)用軟件,這個(gè)軟件運(yùn)行在基于Tegra K1的Jetson TK1嵌入式系統(tǒng)開發(fā)平臺上。
而在后期,我們將會嘗試多攝像頭組合的方式(即布置攝像頭點(diǎn)陣),這樣就可以在不同方向?qū)鸾z猴進(jìn)行拍攝,就能夠很大程度上拍攝到他們的有效面部圖像。進(jìn)一步,再進(jìn)行視頻拼接,三維建模等研究,以更好地實(shí)現(xiàn)在大場景下對金絲猴進(jìn)行面部檢測、識別與追蹤。