CVPR 會議前夕,一篇由德國埃爾朗根-紐倫堡大學、馬克斯·普朗克計算機科學研究所、斯坦福大學三家學術機構(gòu)5名科學家共同創(chuàng)作的論文“實時人臉捕捉和再扮演—— Face2Face”引起了國內(nèi)科技圈的熱議。CVPR全稱為計算機視覺和模式識別大會 (Computer Vision and Pattern Recognition),是一年一度的視覺領域最高學術會議。因此,早在該研究成果公布伊始,國內(nèi)媒體就對其進行了報道:“這個技術的原理是通過一種密集光度一致性辦法(Dense Photometric Consistency measure),達到跟蹤源和目標視頻中臉部表情的實時轉(zhuǎn)換,由于間隔的時間很短,使得‘復制’面部表情成為可能,但現(xiàn)在還沒辦法實現(xiàn)聲音也一樣模仿出來。”
那么,在一個人不知情的情況下,他人能夠通過偷拍視頻的方式,通過此項技術模仿他人人臉,進而順利實現(xiàn)人臉解鎖,攻破金融、安防、門禁等領域?特別是在線上環(huán)境中,不法份子是否容易通過偷拍他人視頻偽造身份通過認證?
作為服務中國銀聯(lián)、中國移動、小米、京東華為等企業(yè)的人工智能公司,商湯科技的人臉識別算法在陌生人識別領域超越人眼準確率,并積累了大量的人臉識別實戰(zhàn)經(jīng)驗。商湯科技主任研發(fā)工程師李誠認為:“在人臉識別風險控制上,商湯率先進行了布局,投入大量研發(fā)資源,利用大數(shù)據(jù)視頻分析技術,身份認證系統(tǒng)能處理各種照片、視頻攻擊。Face2Face也是模仿人臉的學術成果之一,主要是驅(qū)動被模仿者已有視頻來進行模擬運動,將模仿者肌肉運動轉(zhuǎn)移到視頻中的人臉上。但如果想應用于工業(yè)級別人臉識別攻擊,該技術仍有較大局限:模仿者不能改變視頻中的頭部和人臉運動,對需要被測人主動進行動作(例如左右轉(zhuǎn)動人臉),商湯的系統(tǒng)在第一時間就會阻止模仿用戶;商湯現(xiàn)有的人臉技術已經(jīng)支持估計人臉眼睛注視的位置以及分析人臉紋理,足以區(qū)分模仿視頻。”
?。▓D為商湯科技自主研發(fā)的“換臉”技術,可以實現(xiàn)在側(cè)臉、動態(tài)等情況下實時變臉)
李誠還強調(diào),就算攻擊者真的能完全模擬人臉的運動,還有很多問題要解決。例如,攻擊者需要把攻擊用的視頻,傳輸進應用里面。這個過程往往通過用手機攝像頭翻拍屏幕來實現(xiàn),此時的屏幕圖像與真實圖像就會存在差異。只要翻拍的過程中出現(xiàn)一點這樣的端倪,活體檢測都會予以報警。
誠然,伴隨著技術的升級,人臉識別系統(tǒng)遭受攻擊的可能性確實存在,但抵御攻擊的技術水平也在不斷提升。隨著大數(shù)據(jù)方法持續(xù)進化,人臉識別身份認證安全性也會越來越高,終將超越人能判別的極限。