正被美國(guó)全球通緝的斯諾登昨天“闖入”上海一場(chǎng)大數(shù)據(jù)研討會(huì)。確切地說(shuō),研討會(huì)的多位講者都提到被斯諾登捅破的“棱鏡門(mén)”。從純技術(shù)角度觀察,“棱鏡”是一個(gè)典型的通過(guò)分析海量通訊數(shù)據(jù)獲取安全情報(bào)的大數(shù)據(jù)案例;但它也引發(fā)思考:大數(shù)據(jù)時(shí)代,個(gè)人隱私該何處安放?
昨天發(fā)言的上海交大教授汪小帆透露,美國(guó)《科學(xué)》雜志兩周前刊文提到了大數(shù)據(jù)和“棱鏡門(mén)”,只需看標(biāo)題就能明白它的意思:《網(wǎng)絡(luò)科學(xué)處于監(jiān)控爭(zhēng)議的中心》。
昨天的研討會(huì)由高級(jí)智庫(kù)“中國(guó)信息化百人會(huì)”主辦,主題是“大數(shù)據(jù):挑戰(zhàn)和機(jī)遇”。不過(guò),講者談挑戰(zhàn)比談機(jī)遇更多;而諸多挑戰(zhàn)中,隱私是核心關(guān)鍵詞。
手機(jī)將“出賣(mài)”你
大數(shù)據(jù)時(shí)代,隱私空間之小,也許超出人們的想象。
電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心主任周濤教授介紹了今年公開(kāi)的一項(xiàng)最新研究成果:某個(gè)手機(jī)用戶只要曾出現(xiàn)在4個(gè)基站的服務(wù)區(qū),利用大數(shù)據(jù)模型,研究者就能把他從百萬(wàn)用戶中區(qū)分出來(lái),識(shí)別他的身份,準(zhǔn)確率為95%。此文發(fā)表在《自然》出版集團(tuán)的學(xué)術(shù)刊物《科學(xué)報(bào)告》上。
周濤半開(kāi)玩笑地說(shuō),這篇論文的結(jié)論就是,別讓我在4個(gè)基站看到你。
周濤是舍恩伯格撰寫(xiě)的暢銷書(shū)《大數(shù)據(jù)時(shí)代》的中文譯者。他表示,大數(shù)據(jù)的“1.0版本”僅僅是分析那些與目標(biāo)直接相關(guān)的數(shù)據(jù),但到“2.0版本”后,大數(shù)據(jù)更關(guān)心“數(shù)據(jù)的外化”,也就是將更多看似無(wú)關(guān)的數(shù)據(jù)納入視野。
周濤本人也正研究如何通過(guò)大數(shù)據(jù)識(shí)別個(gè)人信息,結(jié)論同樣驚人。他告訴記者,通過(guò)分析一個(gè)人某段時(shí)間的GPS定位數(shù)據(jù),就能知道他的性取向:“瞞了家人幾十年的秘密,也許一個(gè)手機(jī)軟件就能出賣(mài)你。”此外周濤還透露,他還在用類似方法發(fā)現(xiàn)腐敗分子,識(shí)別率也很高。
無(wú)論是“4個(gè)基站”,還是“手機(jī)與性取向”的研究,說(shuō)到底都提示出一點(diǎn):通常被認(rèn)為與隱私無(wú)甚關(guān)聯(lián)的信息,在大數(shù)據(jù)時(shí)代都將發(fā)生質(zhì)變。周濤透露,國(guó)外科學(xué)家已經(jīng)建立了模型,通過(guò)分析人們?cè)?ldquo;臉譜”網(wǎng)站(Facebook)上的行為,也能判斷他的性取向,所需要的只是用戶添加的“喜歡”或“不喜歡”標(biāo)簽,大約需要100個(gè)。
當(dāng)規(guī)則遭遇現(xiàn)實(shí)
周濤強(qiáng)調(diào),他的研究被置于嚴(yán)格的監(jiān)管之下,而且是基于同性戀者自愿提供的信息,并不侵犯隱私。但是否每個(gè)大數(shù)據(jù)從業(yè)者都如此遵守規(guī)則?
在行業(yè)內(nèi)某公司董事長(zhǎng)章林光看來(lái),現(xiàn)在的問(wèn)題是根本沒(méi)有完善的規(guī)則。
目前,公認(rèn)的網(wǎng)絡(luò)隱私原則,簡(jiǎn)單說(shuō)是“知情同意”。某機(jī)構(gòu)在獲取網(wǎng)民信息前,必須就信息獲取的范圍、用途等,向網(wǎng)民告知并獲得同意。但章林光說(shuō),大數(shù)據(jù)時(shí)代,這種知情同意失去了操作性。比如,谷歌曾嘗試分析網(wǎng)民搜索的關(guān)鍵詞組合,比如“感冒藥”“藥房”等,于是能領(lǐng)先政府疾控部門(mén)一個(gè)星期預(yù)測(cè)出流感疫情。但在知情同意的問(wèn)題上,谷歌并非無(wú)可指摘。且不說(shuō)該研究要得到億萬(wàn)網(wǎng)民的同意是否可行,起碼的一點(diǎn)是,用大數(shù)據(jù)分析海量的搜索行為,其研究方向本身就是不確定的――誰(shuí)都不知道,看似無(wú)關(guān)的數(shù)據(jù)被整合之后,最終能挖掘出什么。因此,要網(wǎng)站每次都明確告知用戶搜集信息的目標(biāo),基本沒(méi)有可能。
章林光說(shuō),如果基于現(xiàn)在的原則,那么數(shù)據(jù)的采集、挖掘、處理、管理只能在法律面前徘徊。而且在他看來(lái),目前的規(guī)則必然導(dǎo)致“個(gè)人信息交易的黑市”。
中國(guó)工程院院士鄔賀銓昨天也明確提出,平衡信息共享與隱私保護(hù)的矛盾,是大數(shù)據(jù)發(fā)展的關(guān)鍵,亟需出臺(tái)《信息公開(kāi)法》和《信息保護(hù)法》,既要鼓勵(lì)面向群體且服務(wù)社會(huì)的數(shù)據(jù)挖掘,又要防止侵犯?jìng)€(gè)人隱私。[nextpage]
網(wǎng)民該讓步嗎?
北京郵電大學(xué)管理學(xué)院教授萬(wàn)巖說(shuō),她曾對(duì)自己的學(xué)生做了一個(gè)問(wèn)卷:公開(kāi)自己的信息從而得到更有針對(duì)性的營(yíng)銷,或是嚴(yán)格保護(hù)隱私但必須自己動(dòng)手搜索商品,你會(huì)選哪一個(gè)?學(xué)生們的回答大致是五十對(duì)五十。
章林光也提出,“棱鏡門(mén)”事件雖然反響惡劣,但也有調(diào)查表明,半數(shù)美國(guó)人對(duì)美國(guó)政府的做法未必持反對(duì)態(tài)度。
這些結(jié)論似乎暗示,普通人對(duì)網(wǎng)絡(luò)隱私的態(tài)度,也許還很有寬容度。
章林光建議,公眾必須接受、或者說(shuō)忍受一個(gè)事實(shí)――大數(shù)據(jù)時(shí)代,人就是透明的,“個(gè)人隱私保護(hù)現(xiàn)在被過(guò)度解讀,這窒息了數(shù)據(jù)共享。”
中國(guó)電信政企客戶事業(yè)部總經(jīng)理韓臻聰和電子科大的周濤也持類似觀點(diǎn)。他們都認(rèn)為,民眾中有一股不冷靜的情緒,而這將阻礙社會(huì)進(jìn)步。
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)副理事長(zhǎng)高新民透露,今年央視“315”晚會(huì)曝光網(wǎng)絡(luò)營(yíng)銷公司用Cookie軟件定位網(wǎng)民的事件后,不少企業(yè)向他反映,許多人關(guān)閉了Cookie。高新民認(rèn)為,Cookie不等于暴露隱私,沒(méi)有Cookie就沒(méi)有大數(shù)據(jù)。
章林光呼吁,有必要對(duì)隱私的定義進(jìn)行公開(kāi)討論,真正劃清“個(gè)人隱私”與“公開(kāi)數(shù)據(jù)”的邊界,否則大數(shù)據(jù)就是紙上談兵,未來(lái)十年也未必有什么進(jìn)展。
如果所有人都可以真正參與討論,這當(dāng)然是一個(gè)中肯的建議。昨天,有影響力人物都已異口同聲地表態(tài),網(wǎng)民們究竟該如何選擇呢?