據(jù)英國《金融時報》報道,微軟目前已經(jīng)悄然刪除其最大的公開人臉識別數(shù)據(jù)庫——MSCeleb。
MSCeleb數(shù)據(jù)庫2016年建立,擁有超過1000萬張圖像,將近10萬人的面部信息。微軟描述其為世界上最大的公開面部識別數(shù)據(jù)集,并用于培訓(xùn)全球科技公司和軍事研究人員的面部識別系統(tǒng)。據(jù)了解,數(shù)據(jù)庫中的面孔來自公眾人物,但許多人并沒有授權(quán)微軟使用自己的面部照片。相反,微軟是通過“知識共享”許可來抓取圖像和視頻的。根據(jù)“知識共享”許可,你可以將照片用于學(xué)術(shù)研究,但照片中的人物并不一定授權(quán)許可,而是擁有版權(quán)所有者授權(quán)。
微軟技術(shù)與研究院首席研究員 / 研究經(jīng)理張磊博士曾對外表示,MS-Celeb-1M 的目標(biāo)是識別百萬人臉,是計算機視覺內(nèi)最大規(guī)模的分類問題,并且其中一個人物對應(yīng)一個 entity,綁定了知識庫,并且知識庫中提供了每個人的職業(yè),性別等等豐富的信息,從而解決了人物重名的問題,可以從識別達(dá)到認(rèn)知。
雖然在微軟的認(rèn)知中,最開始這個數(shù)據(jù)集是面向?qū)W術(shù)界做的,但后來,這一數(shù)據(jù)集被許多工業(yè)界的同行所使用。根據(jù)相關(guān)的引文資料,MS-Celeb-1M 數(shù)據(jù)庫已經(jīng)被多商業(yè)機構(gòu)所使用,比如說 IBM、松下電氣、阿里巴巴、輝達(dá)、日立、商湯科技、曠視科技等,甚至有消息稱,也有相關(guān)的軍事研究人員采用了這一數(shù)據(jù)庫來訓(xùn)練面部識別系統(tǒng)。
“這個網(wǎng)站是用于學(xué)術(shù)用途,它是由一位已經(jīng)不在Microsoft工作的員工運行的,并且已被刪除。”微軟稱。不過,即使MSCeleb已被刪除,其內(nèi)容仍可以從網(wǎng)絡(luò)上下載獲得。“你不能讓數(shù)據(jù)庫消失。一旦你發(fā)布它,人們下載它,它就存在于全世界的硬盤上?!卑l(fā)現(xiàn)MSCeleb數(shù)據(jù)庫侵權(quán)問題的柏林研究員AdamHarvey在接受媒體采訪時稱。
值得一提的是,伴隨著微軟刪除了 MS-Celeb-1M 數(shù)據(jù)庫,另外兩個學(xué)術(shù)單位也刪除了它們旗下的類似相關(guān)數(shù)據(jù)庫,包括由杜克大學(xué)研究人員建造的 Duke MTMC 監(jiān)控數(shù)據(jù)庫和斯坦福大學(xué)的 Brainwash 數(shù)據(jù)庫。