不久前,阿里巴巴集團(tuán)董事局主席馬云在德國(guó)玩的一場(chǎng)“刷臉秀”吸引了很多人的目光,在這次活動(dòng)中,馬云向德國(guó)總理默克爾與我國(guó)國(guó)務(wù)院副總理馬凱,演示了螞蟻金服的Smile to Pay掃臉技術(shù),利用“刷臉支付”從淘寶網(wǎng)上購(gòu)買了1948年漢諾威紀(jì)念郵票。
人臉識(shí)別最古老也最自然
“刷臉支付”其實(shí)也不是什么新鮮事兒,它是眼下研究很熱門、發(fā)展很迅猛的人身識(shí)別技術(shù)的一種。
除了極端嚴(yán)重的“臉盲癥”患者,我們識(shí)別一個(gè)人最原始、最自然、最方便的方法就是看他的臉。走在路上,迎面一個(gè)人過來,等我們看清了他的臉,就認(rèn)出來了,“哦,老張!”
識(shí)別一個(gè)人的身份,是社會(huì)生活中十分重要的一件事情。以往人們想出了很多辦法來做這件事,比如用鑰匙,用證件,用密碼等等,但這些都是身外之物,一旦遺失了、忘記了或被盜了,就很麻煩。
近幾十年來,人們想到了利用人體固有的生物特征進(jìn)行身份識(shí)別的辦法,這就叫生物特征識(shí)別技術(shù)。由于這些生物特征是長(zhǎng)在人的身體上的,所以也就不存在遺失、忘記或被盜的問題了。
這些辦法有很多,比如指紋識(shí)別,這是應(yīng)用最早、最廣泛,也是目前最成熟的生物特征身份鑒別方法;再比如虹膜識(shí)別,虹膜是眼球前部含色素的環(huán)形薄膜,含有極其豐富的結(jié)構(gòu)和紋理特征,到目前為止,虹膜識(shí)別的錯(cuò)誤率是各種生物特征識(shí)別中最低的。此外,還有利用人的行為特征進(jìn)行的筆跡識(shí)別、步態(tài)識(shí)別、聲紋識(shí)別等等。
但是有一條,這些生物特征識(shí)別方法一般都需要人們的行為配合,比如按個(gè)指印兒,把眼睛貼到什么儀器上之類,顯得很不自然,也不太友好。因此,最自然的方法還是要返璞歸真——看見你的臉,就把你認(rèn)出來了!
五十年來獲得長(zhǎng)足發(fā)展
早在19世紀(jì)末,有個(gè)叫高爾頓的測(cè)量狂人(這個(gè)人也是智商測(cè)量的始作俑者)就想到了人臉識(shí)別的問題,他在1888年和1910年分別在《自然》雜志上發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章。他用一組數(shù)字代表不同的人臉側(cè)面特征,并對(duì)人類自身的人臉識(shí)別能力進(jìn)行了分析。但是當(dāng)然,當(dāng)時(shí)還不可能涉及人臉的自動(dòng)識(shí)別問題。
據(jù)西安理工大學(xué)王映輝教授介紹,自動(dòng)人臉識(shí)別的研究論文最早見于1965年,到現(xiàn)在已有五十年的歷史。近年來,人臉識(shí)別研究得到了諸多研究人員的青睞,涌現(xiàn)出了很多新的技術(shù)和方法。尤其是自1990年以來,人臉識(shí)別更得到了長(zhǎng)足的發(fā)展,每年都有大量的學(xué)術(shù)論文發(fā)表。現(xiàn)在,幾乎所有知名的理工科大學(xué)和主要的IT產(chǎn)業(yè)公司都有研究組在從事人臉識(shí)別的研究。
人臉識(shí)別的具體過程可分為以下四步:第一步,搜集并初步處理人的臉部圖像信息;第二步,從采集到的圖像中提取關(guān)鍵的信息;第三步,進(jìn)一步處理已有信息并將它們保存;第四步,比對(duì),把需要識(shí)別的人臉與已經(jīng)保存在數(shù)據(jù)庫(kù)中的人臉信息進(jìn)行匹配和甄別。
存在困難超乎一般人想象
這些看上去好像并不難,但對(duì)實(shí)際的人臉識(shí)別來說,面臨的困難其實(shí)是超乎想象的,王映輝教授就介紹了以下幾點(diǎn):
光照問題。這是機(jī)器視覺中存在已久的問題,在人臉識(shí)別中的表現(xiàn)尤為明顯,即使目前最好的人臉識(shí)別系統(tǒng),在室外光照環(huán)境下,其識(shí)別率也會(huì)急劇下降;
姿態(tài)問題。這也是目前人臉識(shí)別研究中需要解決的一個(gè)技術(shù)難點(diǎn)。目前多數(shù)的人臉識(shí)別算法主要針對(duì)正面、準(zhǔn)正面人臉圖像,當(dāng)發(fā)生俯仰或者左右側(cè)面比較厲害的情況下,人臉識(shí)別算法的識(shí)別率也將會(huì)急劇下降;
表情問題。很遺憾,人的面部不像手指、虹膜,它是有豐富表情的地方。表情是一種很復(fù)雜的肌肉運(yùn)動(dòng),每種表情是幾十塊面部肌肉共同運(yùn)動(dòng)的組合,很難用一個(gè)準(zhǔn)確的數(shù)學(xué)模型來描述這些肌肉的運(yùn)動(dòng)。此外,表情的表現(xiàn)形式也因人而異,同一種表情在不同的人面部上有不同的表現(xiàn)形式。因此,如何有效地識(shí)別帶有表情的圖像,從而提高人臉識(shí)別的準(zhǔn)確率,也是一個(gè)重要的挑戰(zhàn);
遮擋問題。對(duì)于非配合情況下的人臉圖像采集,遮擋問題是一個(gè)非常嚴(yán)重的問題。特別是在監(jiān)控環(huán)境下,往往被監(jiān)控對(duì)象都會(huì)戴著眼鏡、帽子等飾物,使得被采集出來的人臉圖像有可能不完整,從而影響了后面的特征提取與識(shí)別;
生長(zhǎng)問題。和指紋、虹膜不同,隨著年齡的變化,面部外觀也會(huì)變化,特別是對(duì)于青少年,這種變化會(huì)更加明顯;
低質(zhì)量照片問題。目前的多數(shù)人臉識(shí)別系統(tǒng)在算法設(shè)計(jì)和模型訓(xùn)練方面往往都只針對(duì)圖像質(zhì)量很好的情況,但對(duì)智能監(jiān)控、公安系統(tǒng)犯罪嫌疑人照片比對(duì)等應(yīng)用而言,照片的質(zhì)量可能非常差。如何提高系統(tǒng)對(duì)這些低質(zhì)量照片的識(shí)別能力也是人臉識(shí)別亟待解決的關(guān)鍵問題之一……
利用三維信息擁有更好未來
正是由于以上存在的種種困難,人臉識(shí)別的準(zhǔn)確性目前仍低于虹膜、指紋識(shí)別,但由于它的無侵害性和方便、友好的方式,還是得到人們更多的重視。
王映輝教授介紹,人臉識(shí)別技術(shù)發(fā)展到今天,許多成果仍然是在二維信息基礎(chǔ)上取得的,而真實(shí)世界中的人臉是三維的,三維信息特別是三維圖像較之二維圖像更能提供完整而真實(shí)的內(nèi)容。如何有效地利用人臉的三維信息進(jìn)行識(shí)別,將是一個(gè)極具挑戰(zhàn)性的研究課題。
每種生物特征識(shí)別技術(shù)都有其一定的適用范圍和要求,單一的生物特征識(shí)別在實(shí)際應(yīng)用中顯現(xiàn)出各自的局限性,如有些人的指紋無法提取特征,患眼疾的人虹膜會(huì)發(fā)生變化等。統(tǒng)計(jì)顯示,目前還沒有一個(gè)單生物特征能達(dá)到完美無誤的要求。因此,生物特征識(shí)別領(lǐng)域出現(xiàn)了一種新方向,即多模態(tài)生物特征識(shí)別技術(shù)結(jié)合使用。
小貼士
生物特征識(shí)別
人體所固有的生物特征有許多,能夠用來認(rèn)證身份的生物特征應(yīng)該具有以下的特性:
普遍性:每個(gè)正常人都應(yīng)該具有這種特征;
惟一性:不同的人應(yīng)該具有各不相同的特征;
可采集性:所選擇的特征可以定量測(cè)量;
穩(wěn)定性:所選擇的特征至少在一段較長(zhǎng)的時(shí)間內(nèi)是不變的,并且特征的采集不隨條件、環(huán)境的變化而變化。
在實(shí)際的生物特征識(shí)別系統(tǒng)中,還應(yīng)考慮如下一些因素:
性能:識(shí)別的準(zhǔn)確性、速度、可靠性以及為達(dá)到所要求的準(zhǔn)確性和速度所需要的資源;
可接受性:使用者在多大程度上愿意接受這種生物特征識(shí)別系統(tǒng);
安全性:用欺詐的方法騙過系統(tǒng)的難易程度。