上周五晚,第四季《最強(qiáng)大腦》在江蘇衛(wèi)視首播。百度研發(fā)的“小度機(jī)器人”成為公認(rèn)“腦王”,不僅在人臉識(shí)別賽題中,僅根據(jù)童年照片比對(duì)就發(fā)現(xiàn)了蜜蜂少女隊(duì)中隱藏的同卵雙胞胎隊(duì)員,依靠萬(wàn)分之一的區(qū)別概率選出了正確答案,人類“最強(qiáng)大腦”王峰2:3惜敗于人工智能機(jī)器人“小度”。
《最強(qiáng)大腦》幕后首席科學(xué)團(tuán)總顧問(wèn)、北京師范大學(xué)心理學(xué)院院長(zhǎng)劉嘉稱:“小度在人臉識(shí)別領(lǐng)域暫時(shí)排名世界第一,從計(jì)算的難度來(lái)講,甚至可能會(huì)超過(guò)現(xiàn)在特別火的AlphaGo。”
在“小度”參與“人機(jī)大戰(zhàn)”前,機(jī)器與人類的PK多在下棋、答題等領(lǐng)域,從1997年IBM深藍(lán)戰(zhàn)勝卡斯帕羅夫起,似乎就意味著人類智力在棋類游戲中不敵人工智能。隨著人工智能的不斷進(jìn)化,機(jī)器還會(huì)從程序運(yùn)算走向抽象思維認(rèn)知全新階段,在更多的領(lǐng)域超越人類。“小度”此次戰(zhàn)勝人類對(duì)手正是機(jī)器探索抽象思維認(rèn)知的階段性成果。
人臉識(shí)別與下棋大有不同。簡(jiǎn)單說(shuō),人臉識(shí)別包含兩種技術(shù):一種是1:1 的人臉比對(duì),比如像銀行的應(yīng)用場(chǎng)景,通過(guò)比對(duì)希望知道這張人臉是不是身份證上面的那個(gè)人;還有一種更通用的 1:N 人臉識(shí)別,N 可以是幾千、幾萬(wàn)或者幾十萬(wàn)進(jìn)行比對(duì),這叫 1:N 的比對(duì)或者是 1:N 的人臉識(shí)別。“小度”在《最強(qiáng)大腦4》中與名人堂輪值主席王峰PK時(shí)展現(xiàn)出的人工智能技術(shù),則屬于第二種,而且是其中最復(fù)雜的跨年齡識(shí)別。
眾所周知,人類童年時(shí)的照片與成年后的臉部相比有明顯區(qū)別。雖然人腦傳承了祖先上百萬(wàn)年積累的臉部識(shí)別天賦,但跨年齡識(shí)別仍是很難完成的挑戰(zhàn)。百度深度學(xué)習(xí)實(shí)驗(yàn)室(IDL)科學(xué)家們選擇了用度量學(xué)習(xí)的方法破解這一難題,即通過(guò)學(xué)習(xí)非線性投影函數(shù)將圖像空間投影到特征空間中,在大量樣本中,縮小同一個(gè)人跨年齡的兩張人臉的距離??紤]到跨年齡人臉的稀缺性,IDL還采用了一個(gè)用大規(guī)模人臉數(shù)據(jù)訓(xùn)練好的模型底座,并用跨年齡數(shù)據(jù)對(duì)其進(jìn)行更新,從而大幅提升跨年齡識(shí)別的識(shí)別率。通俗一點(diǎn)說(shuō),“小度”采用的技術(shù)手段是在臉部骨骼上取盡可能多的采樣點(diǎn),把其與需要篩選的大量人臉逐個(gè)比較。當(dāng)然,雙胞胎由于骨骼相似差別細(xì)微,所以識(shí)別的難度也要比普通人更大。
技術(shù)原理看似輕描淡寫,實(shí)際情況是,盡管百度大腦經(jīng)過(guò)了兩億多習(xí)題的人臉識(shí)別訓(xùn)練,在該領(lǐng)域的能力目前世界領(lǐng)先,但跨年齡識(shí)別等技術(shù)對(duì)計(jì)算能力要求極高,“為了這次比賽,我們也收集了一些跨年齡的數(shù)據(jù),根據(jù)跨年齡這個(gè)場(chǎng)景再進(jìn)一步優(yōu)化模型,跨年齡數(shù)據(jù)大概在幾千張這個(gè)級(jí)別,并不算特別的多。” 百度深度學(xué)習(xí)實(shí)驗(yàn)室(IDL)主任林元慶表示“小度”獲勝并非易事,而且在現(xiàn)場(chǎng)識(shí)別人臉時(shí),光照、人臉姿態(tài)、遮擋程度等因素會(huì)對(duì)人臉檢測(cè)帶來(lái)干擾,光照、表情、遮擋、年齡、模糊也會(huì)影響到人臉識(shí)別的精度,特別是面對(duì)年齡跨度較大的情況,由于缺乏兩個(gè)年齡中間的足夠數(shù)據(jù),所以“小度”更難學(xué)習(xí)和掌握人臉的變化。
關(guān)于“小度”的實(shí)際應(yīng)用,擁有超強(qiáng)人臉識(shí)別功能的“小度”,不僅能識(shí)別雙胞胎,更能在高年齡跨度之下掌握人臉的變化,因此,對(duì)于走失兒童的尋找和匹配,將有很大的意義。
盡管受節(jié)目效果影響有吹捧百度之意,但無(wú)論是互聯(lián)網(wǎng)企業(yè)還是安防企業(yè),以及一系列真正擁有深度學(xué)習(xí)算法的人臉識(shí)別公司的崛起,人工智能的發(fā)展,將在未來(lái)幾年邁向新的高峰期。