人們對(duì)大數(shù)據(jù)寄予了許多的希望:賣(mài)出更多的貨物,做出更好的產(chǎn)品,找到更酷的朋友,甚至幫我們決定明天早上是否睡個(gè)懶覺(jué)?,F(xiàn)在,凡是有信息流通的地方,都有人們對(duì)大數(shù)據(jù)的期望。
大數(shù)據(jù)果真如此神通嗎?大數(shù)據(jù)不能做什么?下面從幾個(gè)方面來(lái)談?wù)劥髷?shù)據(jù)的反面。
一、大數(shù)據(jù)不能對(duì)具體行為作出精確預(yù)測(cè)
事實(shí)上,人們的社會(huì)行為具有不可預(yù)測(cè)性。甚至我們不妨可以定性地歸成一個(gè)大數(shù)據(jù)測(cè)不準(zhǔn)原理:人和事件,如果放到越大的空間和時(shí)間范圍,則是越可以精確預(yù)測(cè)的;如果放到越小的空間和時(shí)間范圍,則是越不可以精確預(yù)測(cè)的。
舉個(gè)例子說(shuō):我們幾乎可以在100%的程度上預(yù)測(cè)一個(gè)人24小時(shí)的范圍內(nèi)會(huì)吃飯,但若精確到某一分鐘,則幾乎不可能預(yù)測(cè)準(zhǔn)確。進(jìn)一步我們會(huì)發(fā)現(xiàn),利用更多過(guò)去一段時(shí)間的數(shù)據(jù),能夠幫助我們提高預(yù)測(cè)某半個(gè)小時(shí)內(nèi)是否吃飯的幾率,但如果把時(shí)間精確到某一分鐘,則更多的數(shù)據(jù)幾乎提高不了預(yù)測(cè)的準(zhǔn)確性。
其實(shí),行為的不可預(yù)測(cè)性早已植根于人類(lèi)的潛意識(shí)中。
比如,我國(guó)前一陣子發(fā)射了嫦娥三號(hào)探月飛船,在嫦娥三號(hào)發(fā)射前,科學(xué)家們已經(jīng)計(jì)算出了在未來(lái)的一個(gè)月之后的某個(gè)小時(shí)、分、秒,嫦娥三號(hào)在月球上空高度和經(jīng)緯度,如果這個(gè)計(jì)算結(jié)果偏離預(yù)計(jì)幾十米,則可能推遲發(fā)射,重新計(jì)算校準(zhǔn)。這是科學(xué)對(duì)未來(lái)的精確預(yù)測(cè)。
相對(duì)的情形是,在晚上10點(diǎn)以后,當(dāng)我們準(zhǔn)備睡覺(jué)的時(shí)候,能預(yù)測(cè)明天早餐后下樓碰到的第一個(gè)人是誰(shuí)嗎?幾乎沒(méi)有人能知道,但這個(gè)巨大的不可預(yù)測(cè)卻沒(méi)有引起人的關(guān)注,幾乎沒(méi)有人會(huì)因?yàn)椴恢老聵桥龅降牡谝粋€(gè)人是誰(shuí)而影響睡覺(jué)。人們對(duì)不可預(yù)測(cè)性熟視無(wú)睹。
大數(shù)據(jù)的有效范圍討論,需要引進(jìn)一個(gè)假設(shè):人們可以自由決定自己的行為(常常稱(chēng)為“自由意志”)。一個(gè)人自由決定自己行為,在別人看來(lái),就是他的行為無(wú)法預(yù)測(cè),如果能夠精確預(yù)測(cè)未來(lái)的一舉一動(dòng),就不具備任何的自我決定的自由。
因此,大數(shù)據(jù)不能對(duì)具體行為作出精確預(yù)測(cè),即大數(shù)據(jù)測(cè)不準(zhǔn)原理。
大數(shù)據(jù)的不可預(yù)測(cè)性說(shuō)明,企圖利用大數(shù)據(jù)預(yù)測(cè)用戶具體行為的努力或許是徒勞的,我們哪怕掌握一個(gè)人從出生開(kāi)始就有的全部行為信息,也無(wú)法預(yù)測(cè)明天早餐他會(huì)吃什么。這也意味著,許多基于用戶歷史數(shù)據(jù)進(jìn)行行為分析的努力會(huì)遇到瓶頸,預(yù)測(cè)縮小到一定范圍之后,無(wú)法再精確下去。
二、大數(shù)據(jù)不能用來(lái)消除不確定性
大數(shù)據(jù)不能對(duì)具體行為進(jìn)行預(yù)測(cè),還表現(xiàn)大型社區(qū)的行為預(yù)測(cè)上。
最近,很多城市的商業(yè)中心開(kāi)始引入了大數(shù)據(jù)技術(shù),希望對(duì)用戶行為作出精確的預(yù)測(cè)來(lái)提高商業(yè)中心的有效使用。從單個(gè)商家的角度出發(fā),知道進(jìn)店顧客的精確行為,能提供更針對(duì)性的服務(wù),但是,從整個(gè)商區(qū)的角度來(lái)做預(yù)測(cè)會(huì)出現(xiàn)悖論。
之所以大型商圈不僅僅有購(gòu)物超市,還有甜品店、美食街,人們不是沖著甜品店、美食街來(lái)的,但是,因?yàn)槿藗冃袨榈牟淮_定性,不知道購(gòu)買(mǎi)襯衣、牛奶等生活用品究竟會(huì)花多長(zhǎng)時(shí)間,購(gòu)物間隙才有了甜品的用武之地,如果購(gòu)物結(jié)束靠近用餐時(shí)間,美食街也會(huì)有生意。
不僅甜品、美食,商場(chǎng)里的新商品也都是因?yàn)槿藗冃袨榈牟淮_定才被銷(xiāo)售出去的,因?yàn)樾庐a(chǎn)品并不在人們計(jì)劃購(gòu)物的范圍內(nèi)。如果刻意增加購(gòu)物預(yù)測(cè)的精確性將會(huì)怎樣?甜品店、美食街甚至電影院都將是多余的。
生態(tài)之美源于不確定性,生態(tài)中每一個(gè)參與者都表現(xiàn)出足夠的自由度,世界才會(huì)豐富多彩,大型商業(yè)區(qū)具有生態(tài)特征,對(duì)生態(tài)型社區(qū)進(jìn)行精確預(yù)測(cè),會(huì)讓整個(gè)社區(qū)失去生機(jī),所以大數(shù)據(jù)不能夠用來(lái)消除生態(tài)中的不確定性。
三、大數(shù)據(jù)不能預(yù)測(cè)新業(yè)務(wù)
大數(shù)據(jù)的宣講案例中,常常有一個(gè)啤酒和尿不濕的故事,建議把啤酒和尿不濕放在一起賣(mài),說(shuō)是數(shù)據(jù)統(tǒng)計(jì)發(fā)現(xiàn),男人買(mǎi)啤酒的時(shí)候會(huì)順便買(mǎi)尿不濕,這顯然是一個(gè)誤導(dǎo),因?yàn)樾『⑿枰虿粷翊蟾胖挥?年,一個(gè)活70年的男人,只有幾年處在需要給孩子買(mǎi)尿不濕的情況,也就是說(shuō),大多數(shù)情況下,買(mǎi)啤酒的男人沒(méi)有買(mǎi)尿不濕的必要。
當(dāng)然,買(mǎi)啤酒和買(mǎi)尿不濕在一定的情況下會(huì)成為關(guān)聯(lián)事件,比如一個(gè)青年公寓,生孩子的情況比較集中,但是,此時(shí)數(shù)據(jù)出現(xiàn)關(guān)聯(lián)只是結(jié)果,青年公寓才是原因。
一些極端情況下,根據(jù)數(shù)據(jù)進(jìn)行類(lèi)似啤酒和尿不濕搭配可能會(huì)出問(wèn)題,比如香水和避孕套,男人在逛超市時(shí)為取哄情人會(huì)買(mǎi)香水,當(dāng)然,也會(huì)偷偷買(mǎi)好避孕套,但是,如果把香水和避孕套放在一起,讓男人當(dāng)著情人面去買(mǎi)避孕套就會(huì)產(chǎn)生問(wèn)題。
不能從大數(shù)據(jù)的相關(guān)性直接得出結(jié)論,而是要先確定業(yè)務(wù)邏輯,再用數(shù)據(jù)相關(guān)性去驗(yàn)證。數(shù)據(jù)只是行為的結(jié)果而不是相反,大數(shù)據(jù)之所以能夠輔助預(yù)測(cè),是因?yàn)槿说男袨榫哂幸?guī)律性,一個(gè)具有朝九晚五、周末大休規(guī)律的白領(lǐng),行為數(shù)據(jù)才會(huì)呈現(xiàn)出以日、周、月、年為周期。
創(chuàng)新業(yè)務(wù),也就是跟過(guò)去不一樣的業(yè)務(wù),因此,大數(shù)據(jù)是沒(méi)法預(yù)測(cè)新業(yè)務(wù)的,也沒(méi)法根據(jù)數(shù)據(jù)分析確定新出現(xiàn)的業(yè)務(wù)關(guān)聯(lián)性是臨時(shí)的,還是可持續(xù)的。
延伸閱讀:
大數(shù)據(jù)時(shí)代下軟件服務(wù)業(yè)的創(chuàng)新發(fā)展