聽過人臉識別,但是你聽過猴臉識別么?可否用人臉識別的方法去識別猴子?猴子生長在野外,且天生好動(dòng),又該如何獲取猴子的影像呢?黃河連線帶著這些疑問,特此專訪了西安電子科技大學(xué)苗啟廣教授,苗啟廣教授是計(jì)算機(jī)視覺方面的專家,在猴臉識別領(lǐng)域有著深入的研究和實(shí)踐基礎(chǔ)。以下為專訪實(shí)錄:
1.黃河連線:非常感謝苗教授能接受黃河連線的專訪,提到人臉識別大家可能還會比較熟悉,那提到猴臉識別讓人感覺會很興奮,但是感覺離我們的現(xiàn)實(shí)應(yīng)用比較遠(yuǎn),當(dāng)時(shí)為什么會有這樣的想法呢?
苗啟廣:金絲猴是國家一級保護(hù)動(dòng)物,對其進(jìn)行保護(hù)的重要性是不言而喻的。對金絲猴進(jìn)行保護(hù),就要了解它的個(gè)體和群體的習(xí)性,活動(dòng)規(guī)律,生存狀態(tài)以及社會群體的組織結(jié)構(gòu)等。那么在此過程中,首要的任務(wù)就是個(gè)體識別。只有認(rèn)識了每一個(gè)個(gè)體,才能進(jìn)一步研究群體規(guī)模,社會結(jié)構(gòu)等。
陜西有一個(gè)金絲猴保護(hù)區(qū),首先,對動(dòng)物飼養(yǎng)員來說,金絲猴具體有多少只,只能知道大概,那對金絲猴的保護(hù)是一個(gè)難題。其次,很多學(xué)校經(jīng)常做金絲猴的動(dòng)物實(shí)驗(yàn),相關(guān)專業(yè)的學(xué)生需要到山上觀察金絲猴的行為,往往蹲點(diǎn)觀察1-2個(gè)月才能把金絲猴分別開來,然后進(jìn)行正式工作,這樣就很浪費(fèi)時(shí)間。
對于金絲猴的個(gè)體識別,傳統(tǒng)的方法就是采用人工標(biāo)記或者是"照片相面"。人工標(biāo)記方法指的是在金絲猴身體的某個(gè)部分打上標(biāo)簽,這種方法存在較大的局限性,隨著金絲猴的成長會對金絲猴的身體造成一定的傷害,這也就違背了我們保護(hù)金絲猴的初衷。而"照片相面"方法其實(shí)就是人工記憶,這種方法很大程度上受限于個(gè)人經(jīng)驗(yàn),并且當(dāng)群體規(guī)模較大時(shí),人工記憶難度較大,極易產(chǎn)生相互混淆的情況,此外,人腦還存在遺忘的問題。為解決這些問題,又鑒于目前機(jī)器學(xué)習(xí)方法,特別是近年來深度學(xué)習(xí)方法在人臉識別方面取得輝煌成果,希望能夠利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)金絲猴的個(gè)體識別。這些工作,都是我和我的已經(jīng)畢業(yè)的博士生許鵬飛博士共同做出的研究成果。
就目前的研究進(jìn)展,利用金絲猴的面部特征進(jìn)行個(gè)體識別是完全可行的。猴臉識別是通過拍照或者錄像的方式獲取圖片數(shù)據(jù),然后由計(jì)算機(jī)執(zhí)行相應(yīng)算法實(shí)現(xiàn)個(gè)體識別。這種方法不會對金絲猴產(chǎn)生任何傷害,也不會影響他們的活動(dòng)規(guī)律,完全是一種非接觸式的監(jiān)測方式。
此外,拍照或錄像可以長時(shí)間持續(xù)(這里指的是每天,每月,每年等等)進(jìn)行,這樣就可以持續(xù)記錄每只金絲猴的"相貌",并且計(jì)算機(jī)不存在人腦遺忘的情況。我們做的種種努力都是為了能夠利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)復(fù)雜情況下對金絲猴進(jìn)行個(gè)體識別,這些研究成果將為后期對金絲猴個(gè)體的行為監(jiān)控、群體生存狀態(tài)檢測和活動(dòng)規(guī)律的研究奠定基礎(chǔ),進(jìn)而為金絲猴保護(hù)政策和措施的制定提供更可靠的依據(jù)。
2.黃河連線:這需要解決哪些難點(diǎn)?
苗啟廣:猴臉識別需要解決的第一個(gè)難題就是建立猴臉數(shù)據(jù)庫。與人臉識別一樣,猴臉識別也需要首先建立一個(gè)猴臉數(shù)據(jù)庫。但相對于人臉數(shù)據(jù)庫,猴臉圖像的獲取存在更大難度。主要原因在于,我們無法讓動(dòng)物按照我們的意愿來接受我們對其進(jìn)行拍攝,更多情況下是我們主動(dòng)尋找機(jī)會去捕獲他們的面部圖像。
此外,金絲猴獲得的場景較為復(fù)雜,特別是野生金絲猴,拍攝時(shí)會受到多種因素的影響。例如:
■ 野外環(huán)境的復(fù)雜性和不可控制性。金絲猴生活在野外環(huán)境,不同季節(jié)的野外環(huán)境存在巨大差異。并且,全球金絲猴分布區(qū)域廣泛,不同國家、不同區(qū)域的金絲猴所棲息的野外環(huán)境也存在較大差異。
■ 布置在野外的紅外相機(jī)或者可見光相機(jī)的位置和角度都是固定的,在面臨各種環(huán)境光照的考驗(yàn)時(shí),可能出現(xiàn)側(cè)光、背光和高光等現(xiàn)象,同時(shí)還會出現(xiàn)各個(gè)時(shí)段光照不同的現(xiàn)象。
過去差不多一年的時(shí)間我們都在摸索如何能夠快速有效地拍攝到金絲猴面部圖像數(shù)據(jù)的方法。為了能夠拍攝到有效的猴臉圖像,我們經(jīng)過多次拍攝實(shí)踐,制定了相應(yīng)的拍攝策略和方法,同時(shí)對拍攝設(shè)備和相關(guān)參數(shù)也進(jìn)行了相關(guān)設(shè)置。目前我們已經(jīng)捕獲有220多只金絲猴的面部圖像共計(jì)有30000余幅。
由于金絲猴面部特征的相似性和易變性,相同年齡階段的不同金絲猴個(gè)體在其頭部形狀、面部結(jié)構(gòu)、器官外形、頭部毛發(fā)的顏色和紋理等方面都非常相似。這也就對識別算法的性能提高了更高的要求。此外,與人類相似,金絲猴也可以通過面部的變化產(chǎn)生多種表情,這些表情導(dǎo)致了其面部形狀特征和紋理特征的不穩(wěn)定。如果在野外環(huán)境下,金絲猴面部可能受到樹枝、樹葉等事物的遮擋,或者其面部粘有污泥等,這都會導(dǎo)致金絲猴面部特征的發(fā)生變化。由面部表情變化以及其他環(huán)境因素的變化所引入的非線性因素是金絲猴面部特征識別過程中需要解決的一個(gè)難題。