了解大數(shù)據(jù)才能有效運(yùn)用
相較於傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)至少具有三個(gè)差異極大的特性。首先是數(shù)據(jù)量(Volume),如果換算成數(shù)位數(shù)據(jù)單位,基本單位通常已經(jīng)是TB、PB等級(jí),不但要考量收集及儲(chǔ)存成本,如何迅速傳遞這麼龐大的數(shù)據(jù),也是大數(shù)據(jù)應(yīng)用必須思考的重點(diǎn);其次是時(shí)效性(Velocity),即使是這麼大的數(shù)據(jù)量,仍然要在最短的時(shí)間內(nèi)產(chǎn)生分析結(jié)果,如傳統(tǒng)的年報(bào)統(tǒng)計(jì),往往是在今年收集去年的數(shù)據(jù),卻在隔年才出版,曠日廢時(shí)的結(jié)果,往往會(huì)讓數(shù)據(jù)分析結(jié)果失真。
PredPol應(yīng)用大數(shù)據(jù)分析技術(shù),預(yù)測出犯罪機(jī)率高甚至下一次可能發(fā)生犯罪情況的區(qū)域,并於地圖上標(biāo)示出一塊塊500平方英尺的區(qū)域,供警察參考。
最後也是最大的差別,就是數(shù)據(jù)的多樣性(Variety),傳統(tǒng)的數(shù)據(jù)通常有明確的結(jié)構(gòu)性,選項(xiàng)也比較少,如年齡、性別、等級(jí)等,但大數(shù)據(jù)可能會(huì)有各種形式,包括文字、影音、圖像、網(wǎng)頁等,不但沒有明顯的結(jié)構(gòu),而且大數(shù)據(jù)還常常出現(xiàn)形式交錯(cuò)的現(xiàn)象,如Youtube上的影片除了有點(diǎn)擊數(shù)外,同時(shí)還有留言討論。
由此可知,傳統(tǒng)的數(shù)據(jù)收集方式,顯然已經(jīng)不能滿足城市安防對於大數(shù)據(jù)的需求,所幸在物聯(lián)網(wǎng)(InternetofThings;IoT)、云端運(yùn)算及4G無線寬頻等技術(shù)的發(fā)展下,要取得物與物、物與人、人與人的互聯(lián)互通數(shù)據(jù),技術(shù)上已不是問題,但必須得先迅速建構(gòu)起收集、傳遞及儲(chǔ)存大數(shù)據(jù)的基礎(chǔ)建設(shè),才有可能建立全面感知的能力,成為城市安防決策的最佳後盾。
但只是從感知層獲取資訊是不夠的,因?yàn)橄胍龊么髷?shù)據(jù)深度分析,就必須要有能力針對復(fù)雜且開放式的問題尋找答案,并藉由視覺化分析工具,透過連續(xù)性的篩選和抽象化,才能洞悉重要資訊。然而大數(shù)據(jù)具有的超大量半結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)的特性,往往會(huì)造成傳統(tǒng)關(guān)聯(lián)式數(shù)據(jù)庫管理系統(tǒng)(RDBMS)的運(yùn)作瓶頸,必須要導(dǎo)入全新的大數(shù)據(jù)分析工具,方能真正靈活運(yùn)用大數(shù)據(jù)。
此外,大數(shù)據(jù)的價(jià)值既然遠(yuǎn)超過傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)的真實(shí)、安全及穩(wěn)定性,就必須加以重視。尤其是現(xiàn)在的網(wǎng)路應(yīng)用無所不在,舉凡機(jī)場、銀行、捷運(yùn)、車站、水電油氣供應(yīng)機(jī)制等,都可能被駭客入侵,加上政府為了能讓掌握的數(shù)據(jù)更有價(jià)值,必須要采取公開透明的數(shù)據(jù)使用機(jī)制,當(dāng)公共事業(yè)的數(shù)據(jù)開放愈多,可能被入侵的機(jī)會(huì)也愈高,因此想要利用大數(shù)據(jù)來解決城市安防的問題,首先就得先做好大數(shù)據(jù)的保護(hù),因此資安技術(shù)的導(dǎo)入及專業(yè)人員的配置,絕對不能輕忽。
大數(shù)據(jù)對城市公共衛(wèi)生及治安的幫助
目前已有許多歐美城市開始藉由蒐集及分析大量數(shù)據(jù)、預(yù)知可能出現(xiàn)的危機(jī),進(jìn)而作為城市安防的參考。如紐約的康乃爾大學(xué)威爾醫(yī)學(xué)院(WeillCornellMedicalCollege)計(jì)算與系統(tǒng)生物醫(yī)學(xué)助理教授ChristopherE.Mason的研究團(tuán)隊(duì),花了18個(gè)月的時(shí)間在紐約400多個(gè)地鐵站的車廂、樓梯扶手、座椅、燈桿、垃圾桶等地方蒐集樣本,總共發(fā)現(xiàn)15,152種微生物,其中來自於人類的DNA只占0.2%,將近一半的樣本是人類未知的有機(jī)生物,27%是活性且具有抗生素抗藥性的細(xì)菌,所幸其中僅有12%會(huì)讓人生病。
這項(xiàng)名為PhthoMap的研究計(jì)畫,還透過華爾街日報(bào)網(wǎng)站提供互動(dòng)地圖,讓使用者可以用來觀看特定車站的研究成果,如收集的樣本來源、微生物來源比例、細(xì)菌種類與說明等,也可利用搜尋細(xì)菌的種類,了解那些車站有這些細(xì)菌的存在,等於也展示了公衛(wèi)數(shù)據(jù)開放使用的過程。