中國電信上海研究院 梁篤國
到處都在說大數(shù)據(jù)
2008年9月,《自然》在推出名為“大數(shù)據(jù)”的封面專欄中,講述了數(shù)據(jù)在數(shù)學、物理、生物等基礎(chǔ)學科以及工程、社會經(jīng)濟等應(yīng)用學科中扮演越來越重要的角色。
2010年2月,《經(jīng)濟學人》推出大數(shù)據(jù)專題,其中一篇文章的題目是:“數(shù)據(jù),到處都是數(shù)據(jù)!”。聽起來有點危言聳聽。副標題 “信息已從稀缺轉(zhuǎn)為過剩,在帶來巨大新利益的同時它也讓人頭疼”,讓人覺得多少有些幸福的煩惱。
其實還可以再列舉《科學》、《華爾街日報》、《求是》等等。這些知名的“權(quán)威媒體”,都曾經(jīng)不吝篇幅地對大數(shù)據(jù)大加報道。
時至今日,打開百度或者谷歌搜素大數(shù)據(jù),其結(jié)果也已經(jīng)“大”到“讓人頭疼”了。改編一下《經(jīng)濟學人》的標題或許可以形容此時的媒體形式,那就是:“大數(shù)據(jù),到處都在說大數(shù)據(jù)!”
用數(shù)字來描述大數(shù)據(jù)有多重要可能比較形象,2012年,全球的電腦用戶平均每天創(chuàng)造230億GB數(shù)據(jù)。沃爾瑪僅每小時處理的客戶交易就超過100萬次,其存儲的信息量大約為美國國會圖書館所有藏書信息量的167倍。Facebook上的照片有400億張;YouTube網(wǎng)站用戶每分鐘上傳48小時時長的視頻;還有Google,每秒要進行數(shù)萬次搜索。
這些被學術(shù)界分為結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)話的數(shù)據(jù),就是“大數(shù)據(jù)”(big data)。它被認為有四個V的特點:Volume(數(shù)據(jù)量大)、Velocity(實時性強)、 Variety(種類多樣)、Veracity(真實性)。
令人矚目的事實是,全世界數(shù)據(jù)中有90%都是在近兩年被創(chuàng)造的。媒體的熱議看來是有道理的——大數(shù)據(jù)顯然已經(jīng)成為了這個時代的標志符號。
安防領(lǐng)域,大數(shù)據(jù)時代尚未到來
物聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù),在安防視頻監(jiān)控領(lǐng)域,隨著高清監(jiān)控時代的到來,產(chǎn)生了越來越多的海量視頻數(shù)據(jù)。但筆者認為安防大數(shù)據(jù)時代尚未到來,原因有下面幾點。
第一,大量的視頻數(shù)據(jù)仍然是獨立的、零散的。視頻錄像數(shù)據(jù)散布在各個行業(yè)、單位獨立的系統(tǒng)中,沒有發(fā)揮達到聯(lián)網(wǎng)、共享,業(yè)界也沒有形成對數(shù)據(jù)挖掘、利用的通用方法,核心技術(shù)(如視頻結(jié)構(gòu)化描述VSD)仍然在研究中,尚沒有實現(xiàn)重大突破。
一般來說,視頻錄像存儲的時間一般為1-3個月,有些行業(yè)目前正在考慮延長到6個月。這么多的數(shù)據(jù),帶來了很大的成本壓力。而存儲系統(tǒng)占安防系統(tǒng)的成本比例為20%~30%。建設(shè)成本和運營成本很大,耗用大量電力,碳排放也很多,但視頻錄像數(shù)據(jù)發(fā)揮的作用非常有限,僅僅是在發(fā)生案件后進行錄像搜索,而且為了不產(chǎn)生漏報,絕大多數(shù)是靠人工肉眼檢索。
第二,目前大量的視頻數(shù)據(jù)主要用在了治安刑偵領(lǐng)域,而且是以人工搜索為主;政府之間跨警種、跨部門、跨區(qū)域的聯(lián)網(wǎng)共享應(yīng)用仍然較少,更不用說為老百姓、為社會所用的應(yīng)用還沒有啟動。以人員走失為例,目前每年社會上走失的老人、小孩成千上萬,如能開放這些視頻資源,開發(fā)“人員走失查詢系統(tǒng)”,為老百姓服務(wù),而不僅僅用于治安、刑事案件,將是社會的福音。
何時政府和各單位建設(shè)的攝像頭資源能為社會所用,能通過信息公開、數(shù)據(jù)共享、數(shù)據(jù)挖掘推動新型的數(shù)據(jù)服務(wù)業(yè)的大發(fā)展,安防大數(shù)據(jù)時代就真的來臨了。
推薦閱讀:
安防大數(shù)據(jù)時代,海量信息的事后分析與處理
大數(shù)據(jù)時代,提升“統(tǒng)一監(jiān)控”平臺的門檻
海量視頻,催生大數(shù)據(jù)技術(shù)應(yīng)用