計算機(jī)科學(xué)家已經(jīng)開發(fā)出一種新的人臉識別算法,在識別人臉的能力上比人類本身更加強(qiáng)大。
我們每個人都有過認(rèn)不出某個自己曾經(jīng)認(rèn)識的人的經(jīng)歷,在不同的姿勢、光照和表情下,這其實(shí)是一件比較困難的事情。計算機(jī)識別系統(tǒng)同樣存在這些問題。事實(shí)上,盡管全世界的計算機(jī)科學(xué)家努力了這么多年,還是沒有任何一種計算機(jī)識別系統(tǒng)在識別人臉方面能夠像人類一樣強(qiáng)大。
但這并非是說人臉識別系統(tǒng)不夠準(zhǔn)確。恰恰相反,最好的人臉識別系統(tǒng)在理想情況下比人類識別的表現(xiàn)要好的多。但是一旦環(huán)境情況變糟,系統(tǒng)的表現(xiàn)就差強(qiáng)人意了。而計算機(jī)科學(xué)家們當(dāng)然是非常想要開發(fā)出一種算法,在各種情況下都能夠表現(xiàn)優(yōu)異。
現(xiàn)在,中國香港大學(xué)的湯曉鷗教授和他的學(xué)生路超超(音譯)宣布他們攻克了這個難題。他們開發(fā)了一種叫“高斯”的人臉識別算法首次超過了人類自身。
新的識別系統(tǒng)對于各種平臺都能夠提供人類級別的識別能力,從手機(jī)到電腦游戲中的人臉識別,從安全系統(tǒng)到密碼控制等等。
任何一個人臉自動識別程序,首先要考慮的就是去構(gòu)建一個合適的數(shù)據(jù)集來測試算法。那需要一個非常大范圍的,各種各樣的,帶著各種復(fù)雜動作、光線和表情的,不同臉的圖像,各種人種、年齡和性別都要考慮在內(nèi)。然后還要考察服裝、發(fā)型以及化妝等其他因素的影響。
比較幸運(yùn)的是,已經(jīng)有這么一個擁有各種不同人臉的標(biāo)準(zhǔn)數(shù)據(jù)庫——Labelled Faces。它擁有超過13,000張不同人臉的圖片,它們是從網(wǎng)絡(luò)上收集的6000個不同的公眾人物。更重要的是,每個人都擁有不止一張人臉圖片。
當(dāng)然也存在其他的人臉數(shù)據(jù)庫,但是Labelled faces目前是計算機(jī)科學(xué)家們所公認(rèn)的最具參考價值的測試數(shù)據(jù)集。
面部識別的任務(wù)是去比較兩張不同的圖片,然后判斷他們是否是同一個人。(你可以試試看,能否看出這里展示的每對圖片是否是同一個人。)
人類在這個數(shù)據(jù)庫上的表現(xiàn)可以達(dá)到97.53%的準(zhǔn)確度。但是沒有任何一個計算機(jī)算法能夠達(dá)到這個成績。
直到這個新算法的出現(xiàn)。新的算法依照5點(diǎn)圖片特征,把每張臉圖規(guī)格化成一個150*120的像素圖,這些特征分別是:兩只眼睛、鼻子和嘴角的位置。
然后,算法把每張圖片劃分成重疊的25*25像素的區(qū)域,并用一個數(shù)學(xué)向量來描述每一個區(qū)域的基本特征。做完了這些,就可以比較兩張圖片的相似度了。
但是首先需要知道的是到底要比較什么。這個時候就需要用到訓(xùn)練數(shù)據(jù)集了。一般的方法是使用一個獨(dú)立的數(shù)據(jù)集來訓(xùn)練算法,然后用同一個數(shù)據(jù)集中的圖片來測試算法。
但是當(dāng)算法面對訓(xùn)練集中完全不同的兩張圖片的時候,經(jīng)常都會識別失敗。“當(dāng)圖片的分布發(fā)生改變的時候,這種訓(xùn)練方法就一點(diǎn)都不好了。”超超和曉鷗說到。
相反,他們用四個擁有不同圖片的,完全不同的數(shù)據(jù)集來測試“高斯”算法。舉個例子,其中一個數(shù)據(jù)集是著名的Multi-PIE數(shù)據(jù)庫,它包含了 337個不同的物體,從15種不同的角度,在19種不同的光照情況下,分別拍攝4組圖片。另一個數(shù)據(jù)庫叫做Life Photes包含400個不同的人物,每個人物擁有10張圖片。
用這些數(shù)據(jù)庫訓(xùn)練了算法后,他們最終讓新算法在Labelled Faces數(shù)據(jù)庫上進(jìn)行測試。目標(biāo)是去識別出所有匹配和不匹配的圖片對。
請記住人類在這個數(shù)據(jù)庫上的表現(xiàn)是97.53%的精確度。“我們的“高斯”算法能夠達(dá)到98.52%的精確度,這也是識別算法第一次擊敗人類。”超超和曉鷗說到。
這是一個令人印象深刻的結(jié)果,因?yàn)閿?shù)據(jù)中的照片包含各種各樣不同的情況。
超超和曉鷗指出,仍然有很多挑戰(zhàn)在等著他們?,F(xiàn)實(shí)情況中,人們可以利用各種附加的線索來識別,比如脖子和肩膀的位置。“超過人類的表現(xiàn)也許只是一個象征性的成就罷了”他們說。
另一個問題是花費(fèi)在訓(xùn)練新算法上的時間,還有算法需要的內(nèi)存大小以及識別兩幅圖所需要的時間。這可以用并行計算和特制處理器等技術(shù)來加快算法的運(yùn)行時間。
總之,精確的人臉自動識別算法已經(jīng)到來了,而且鑒于現(xiàn)在的事實(shí),這只會更快。