作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來(lái)的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。對(duì)于“大數(shù)據(jù)”(Big data)研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
具體來(lái)說(shuō)大數(shù)據(jù)(bigdata)是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理、處理的數(shù)據(jù)集合。而更具廣泛的理解是,大數(shù)據(jù)是通過(guò)誕生于各個(gè)終端、通過(guò)工具采集,并具備存儲(chǔ)、分析這些龐大數(shù)據(jù)的能力。大數(shù)據(jù)的意義不僅僅是在掌握龐大的數(shù)據(jù)信息,而在于這些數(shù)據(jù)背后的“隱含內(nèi)容”,其利益最大化的是數(shù)據(jù)加工、分析、挖掘在數(shù)據(jù)背后的“增值”信息。
大數(shù)據(jù)”這個(gè)術(shù)語(yǔ)最早期的引用可追溯到apache org的開(kāi)源項(xiàng)目Nutch。當(dāng)時(shí),大數(shù)據(jù)用來(lái)描述為更新網(wǎng)絡(luò)搜索索引需要同時(shí)進(jìn)行批量處理或分析的大量數(shù)據(jù)集。隨著谷歌Map Reduce和Google File System (GFS)的發(fā)布,大數(shù)據(jù)不再僅用來(lái)描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度。
早在1980年,著名未來(lái)學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書(shū)中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂(lè)章”。不過(guò),大約從2009年開(kāi)始,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,每?jī)赡瓯銓⒎环壳笆澜缟?0%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們?cè)诨ヂ?lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車(chē)、電表上有著無(wú)數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
大數(shù)據(jù)具有四個(gè)特點(diǎn):第一,數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別;第二,數(shù)據(jù)類(lèi)型繁多,諸如日志、視頻、圖片、地理位置信息等;第三,價(jià)值密度低,商業(yè)價(jià)值高,大量數(shù)據(jù)中只有片段數(shù)據(jù)是有效的;第四,處理速度快,1秒定律。業(yè)界將其歸納為4個(gè)“V”--Volume,Variety,Value,Velocity。
二、金融安防領(lǐng)域的大數(shù)據(jù)
在安防行業(yè),包括金融行業(yè)、平安城市、智能交通、政府機(jī)構(gòu)、大型企業(yè)等目前存在著大量的“視頻存儲(chǔ)數(shù)據(jù)”,但這些數(shù)據(jù)之間沒(méi)有任何聯(lián)系與關(guān)聯(lián),只是簡(jiǎn)單的分布存儲(chǔ)或集中存儲(chǔ),在金融行業(yè)中,如一個(gè)國(guó)有銀行的二級(jí)分行,一般會(huì)有數(shù)千個(gè)視頻監(jiān)控點(diǎn),視頻存儲(chǔ)數(shù)據(jù)量非常大,但這些數(shù)據(jù)很難關(guān)聯(lián),而是一種“孤島式”的散存在各個(gè)前端存儲(chǔ)設(shè)備之中。
在安防金融行業(yè)中,其海量數(shù)據(jù)的最重要組成部分是視頻、圖片類(lèi)數(shù)據(jù)。因此金融安防監(jiān)控大數(shù)據(jù)以視頻類(lèi)數(shù)據(jù)作為樣本數(shù)據(jù)進(jìn)行分析,這些視頻類(lèi)數(shù)據(jù)具有如下特點(diǎn):
海量數(shù)據(jù)。隨著安防高清化的應(yīng)用,已經(jīng)從TB級(jí)別躍升為PB級(jí)別,如果存儲(chǔ)一路4M的720P圖像,1個(gè)月就有1.236TB的實(shí)際存儲(chǔ)空間需求。
數(shù)據(jù)類(lèi)型眾多,信息豐富。其內(nèi)容涵蓋日志信息、報(bào)警信息、視頻數(shù)據(jù)、圖片數(shù)據(jù)、聲音數(shù)據(jù)等,這其中有些是結(jié)構(gòu)化數(shù)據(jù),有些是非結(jié)構(gòu)化數(shù)據(jù),還有半結(jié)構(gòu)化數(shù)據(jù)。
單條監(jiān)控?cái)?shù)據(jù)的價(jià)值密度低,需要從海量數(shù)據(jù)中尋求一些最有價(jià)值的信息。如銀行金庫(kù)里某點(diǎn)的視頻監(jiān)控,其不間斷的監(jiān)控錄像中,有價(jià)值的數(shù)據(jù)可能就幾分鐘或者幾秒鐘。
海量監(jiān)控?cái)?shù)據(jù)難以快速分析,而實(shí)際的需求是能及時(shí)處理,這樣轉(zhuǎn)換的價(jià)值才高。但現(xiàn)實(shí)的情況很難做到,必須依靠人工不間斷的進(jìn)行錄像調(diào)閱。
目前金融行業(yè)視頻聯(lián)網(wǎng)工作已經(jīng)進(jìn)行了多年,已經(jīng)實(shí)現(xiàn)各個(gè)“孤島式”存儲(chǔ)設(shè)備的遠(yuǎn)程調(diào)閱,但沒(méi)有實(shí)現(xiàn)統(tǒng)一化的管理和應(yīng)用,在使用這些存儲(chǔ)數(shù)據(jù)時(shí)候,必須依靠各種已知信息到各個(gè)“孤島式”存儲(chǔ)設(shè)備進(jìn)行定向訪問(wèn)。比如要在銀行內(nèi)所有視頻數(shù)據(jù)中快速檢索某人相關(guān)的錄像數(shù)據(jù),在目前這種安保系統(tǒng)方案的技術(shù)架構(gòu)上,是難以實(shí)現(xiàn)的,再比如在銀行中需要查詢(xún)某個(gè)銀行卡號(hào)關(guān)聯(lián)的錄像,首先到銀行的相關(guān)部門(mén)獲取此卡號(hào)辦理過(guò)的柜臺(tái)號(hào)或者ATM自助設(shè)備信息,然后進(jìn)行定向查找,難以實(shí)現(xiàn)快速的查找和調(diào)閱應(yīng)用。
推薦閱讀:金融安防管理系統(tǒng)將成未來(lái)的重心
金融安防創(chuàng)新發(fā)展 高清智能仍是趨勢(shì)方向
三、云計(jì)算&云存儲(chǔ)
提到大數(shù)據(jù),不得不提到云計(jì)算的概念,這兩者存在眾多交集,“大數(shù)據(jù)離不開(kāi)云”,支撐大數(shù)據(jù)的眾多底層技術(shù)就是云技術(shù)。兩者之間是一種綁定的關(guān)系,大數(shù)據(jù)概念是建立在云計(jì)算之上的。
云計(jì)算是一種通過(guò)網(wǎng)絡(luò)以服務(wù)的方式,提供動(dòng)態(tài)可伸縮的、虛擬化的資源計(jì)算模式。通過(guò)大量的分布式計(jì)算機(jī),根據(jù)服務(wù)的需求訪問(wèn)計(jì)算機(jī)和存儲(chǔ)系統(tǒng)等資源,而且這些資源是動(dòng)態(tài)擴(kuò)展且是可虛擬化的。
何謂云存儲(chǔ)呢?云存儲(chǔ)是云計(jì)算概念上延伸和發(fā)展的新概念,指通過(guò)集群應(yīng)用,虛擬化、分布式文件系統(tǒng)等技術(shù)和功能,整合大量不同類(lèi)型的存儲(chǔ)設(shè)備,協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問(wèn)功能的一個(gè)系統(tǒng),云存儲(chǔ)是一個(gè)以數(shù)據(jù)存儲(chǔ)和管理為核心的云計(jì)算系統(tǒng)。
大數(shù)據(jù)的分布式計(jì)算,都需基于儲(chǔ)存、計(jì)算等資源的靈活應(yīng)用。大數(shù)據(jù)沒(méi)有海量數(shù)據(jù)的存儲(chǔ)作為基礎(chǔ),也就不存在“大數(shù)據(jù)”應(yīng)用之說(shuō)。大數(shù)據(jù)快速的數(shù)據(jù)分析處理能力不采用云計(jì)算,似乎只有尋求超級(jí)計(jì)算途徑了。除了云計(jì)算、云存儲(chǔ)之外,信息感知采集與信息傳輸技術(shù),視頻智能分析,大數(shù)據(jù)挖掘等,這些都是安防行業(yè)大數(shù)據(jù)應(yīng)用的重要組成部分。
四、金融安防信息數(shù)據(jù)集成
經(jīng)過(guò)多年的發(fā)展,在金融安防中,包括視頻監(jiān)控子系統(tǒng)、入侵報(bào)警子系統(tǒng)、門(mén)禁控制子系統(tǒng)、網(wǎng)絡(luò)對(duì)講子系統(tǒng)、智能分析子系統(tǒng)、消防預(yù)警子系統(tǒng)、環(huán)境量監(jiān)控子系統(tǒng)等眾多系統(tǒng)從各個(gè)感知終端采集了海量信息。這些海量數(shù)據(jù)包括視頻信號(hào)、報(bào)警信號(hào)、環(huán)境量信號(hào)以及日志信息、地理信息等各類(lèi)數(shù)據(jù)。如何將這些海量信息數(shù)據(jù)進(jìn)行集成呢?
金融安防信息數(shù)據(jù)的集成不是簡(jiǎn)單的信息搜集、無(wú)意義的堆疊,而是一種有規(guī)律的深度集成。是包括信息采集、適配、分析、關(guān)聯(lián)、處理、存儲(chǔ)等多個(gè)階段,將各種無(wú)序的數(shù)據(jù)形成有規(guī)則模型的集成管理信息,將各種結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)形成有關(guān)聯(lián)關(guān)系的海量數(shù)據(jù)信息,其后的存儲(chǔ)與管理工作可以通過(guò)前面所述的云存儲(chǔ)實(shí)現(xiàn)。
金融數(shù)據(jù)集成的必要性、重要性不言而喻,其在大數(shù)據(jù)戰(zhàn)略規(guī)劃中處于核心的地位,數(shù)據(jù)集成應(yīng)用其集成的數(shù)據(jù)范圍,集成的傳輸設(shè)計(jì),集成的架構(gòu)設(shè)計(jì),集成的業(yè)務(wù)應(yīng)用范圍都是重要組成部分。前面提到大數(shù)據(jù)與云計(jì)算是綁定的,而大數(shù)據(jù)與信息集成是互存發(fā)展的。數(shù)據(jù)集成需通過(guò)大數(shù)據(jù)應(yīng)用分析、挖掘等來(lái)體現(xiàn)其數(shù)據(jù)集成背后的價(jià)值,反之大數(shù)據(jù)的構(gòu)建需要依靠數(shù)據(jù)集成技術(shù)進(jìn)行支撐。
推薦閱讀:金融安防管理系統(tǒng)將成未來(lái)的重心
金融安防創(chuàng)新發(fā)展 高清智能仍是趨勢(shì)方向
五、大數(shù)據(jù)應(yīng)用的難點(diǎn)與機(jī)會(huì)
長(zhǎng)期以來(lái),金融行業(yè)對(duì)安防技術(shù)的應(yīng)用一般都是走在前沿,往往都采用了當(dāng)時(shí)最先進(jìn)、最前沿的技術(shù)和設(shè)備,金融安防應(yīng)用趨勢(shì)基本上代表了安防行業(yè)的整體發(fā)展趨勢(shì)。
而近幾年,隨著安防設(shè)備高清化、網(wǎng)絡(luò)化、智能化發(fā)展與應(yīng)用的日趨成熟,云存儲(chǔ)、云計(jì)算、大數(shù)據(jù)等產(chǎn)品不斷在市場(chǎng)試水,而金融行業(yè)安防面對(duì)這些新技術(shù)時(shí),更多的選擇了觀望或是試點(diǎn)性應(yīng)用,其實(shí)金融行業(yè)自身對(duì)于高清應(yīng)用的需求非常迫切,出現(xiàn)這種狀態(tài)的原因可以銀行為例進(jìn)行分析:
高清化后的存儲(chǔ)容量增加。視頻監(jiān)控高清化是智能分析的基礎(chǔ)。標(biāo)清的
4CIF碼流,按照碼流1.5Mb/s計(jì)算,30天需要存儲(chǔ)容量為0.4635TB,常見(jiàn)的720P高清,按照碼流4Mb/s計(jì)算,這樣30天就有1.236TB,相當(dāng)于存儲(chǔ)容量需要翻2.67倍。因此高清化后的存儲(chǔ)容量出現(xiàn)幾何級(jí)的增長(zhǎng),需要更多存儲(chǔ)空間,這就需要更多存儲(chǔ)設(shè)備。
銀行網(wǎng)點(diǎn)帶寬制約。這也是銀行長(zhǎng)期以來(lái)網(wǎng)絡(luò)化、高清化發(fā)展中最大的障礙,很多銀行的監(jiān)控專(zhuān)用帶寬仍為2~4M,如果將帶寬提速,銀行將會(huì)增加大量的租賃費(fèi)用,如果不進(jìn)行提速,未來(lái)大數(shù)據(jù)的統(tǒng)一管理與存儲(chǔ)將在帶寬上遇到瓶頸。
高性能計(jì)算框架的缺失。目前諸如開(kāi)源如hadoop等大數(shù)據(jù)框架,基本是源于互聯(lián)網(wǎng)行業(yè)的框架,不是針對(duì)視頻監(jiān)控領(lǐng)域,不適合處理流式數(shù)據(jù)。比如在海量數(shù)據(jù)存儲(chǔ)的文件系統(tǒng),其中文件顆粒度、文件格式必定與傳統(tǒng)的文件系統(tǒng)有很大區(qū)別,同時(shí)在面向行業(yè)應(yīng)用方面,安防行業(yè)需要類(lèi)似視頻、圖片個(gè)性化的基礎(chǔ)應(yīng)用功能,如關(guān)鍵幀數(shù)據(jù)信息、智能預(yù)分析數(shù)據(jù)的存儲(chǔ)等,因此直接照搬互聯(lián)網(wǎng)行業(yè)應(yīng)用不現(xiàn)實(shí)。
缺少足夠的應(yīng)用需求。銀行安防對(duì)大數(shù)據(jù)的業(yè)務(wù)需求沒(méi)有涌現(xiàn)出來(lái),大數(shù)據(jù)分析、挖掘模型難以抽象出來(lái),很難去推動(dòng)大數(shù)據(jù)在金融行業(yè)的應(yīng)用,相信未來(lái)必定會(huì)出現(xiàn)類(lèi)似的需求。
雖然存在上述的眾多難點(diǎn),但并不意味著大數(shù)據(jù)在金融安防行業(yè)沒(méi)有發(fā)展的機(jī)會(huì),也存在下面幾點(diǎn)有利條件:
安防企業(yè)如??低暰鸵呀?jīng)推出自己的大數(shù)據(jù)解決方案。國(guó)內(nèi)的大數(shù)據(jù)應(yīng)用方案開(kāi)始被廣泛提出,大數(shù)據(jù)作為安防行業(yè)未來(lái)重要的發(fā)展方向,有研發(fā)實(shí)力的安防廠家也開(kāi)始構(gòu)建專(zhuān)為相關(guān)行業(yè)應(yīng)用優(yōu)化的大數(shù)據(jù)解決方案以及高性能計(jì)算框架方案,未來(lái)的大數(shù)據(jù)不僅僅是一個(gè)概念,也會(huì)開(kāi)始走向?qū)嶋H應(yīng)用。
高清化與網(wǎng)絡(luò)帶寬未來(lái)不會(huì)成為瓶頸。高清已出現(xiàn)了高壓縮算法,720P可以壓縮到2Mb/s,而傳統(tǒng)的標(biāo)清4CIF是1.5Mb/s,這樣對(duì)于存儲(chǔ)空間的需求不會(huì)出現(xiàn)幾何級(jí)的增長(zhǎng)。隨著“三網(wǎng)融合”等進(jìn)程,未來(lái)的網(wǎng)絡(luò)系統(tǒng)肯定會(huì)朝著專(zhuān)網(wǎng)或者大型的光纖網(wǎng)路方向發(fā)展,網(wǎng)絡(luò)制約也許就不存在了。
云計(jì)算、云存儲(chǔ)開(kāi)始在安防領(lǐng)域?qū)嵤?、落地,為后續(xù)大數(shù)據(jù)應(yīng)用做了很好的基礎(chǔ)鋪墊。國(guó)內(nèi)已經(jīng)出現(xiàn)安防行業(yè)專(zhuān)業(yè)的視頻云計(jì)算、云存儲(chǔ)產(chǎn)品,并且陸續(xù)在項(xiàng)目中實(shí)際應(yīng)用,諸如海量的視頻數(shù)據(jù)存儲(chǔ),海量數(shù)據(jù)的快速檢索,海量視頻的視頻分析等應(yīng)用都成為現(xiàn)實(shí)。
六、總結(jié)
金融行業(yè)安防中的高清時(shí)代已經(jīng)到來(lái),產(chǎn)生的視頻數(shù)據(jù)越來(lái)越多,但目前金融行業(yè)的大數(shù)據(jù)時(shí)代仍未全面到來(lái),大量的數(shù)據(jù)仍然是獨(dú)立的、零散的,包括網(wǎng)絡(luò)、系統(tǒng)平臺(tái)等在內(nèi)的基礎(chǔ)實(shí)施仍無(wú)法滿(mǎn)足視頻數(shù)據(jù)的統(tǒng)一管理及存儲(chǔ),同時(shí)視頻分析等相關(guān)的核心技術(shù)仍然需要發(fā)展。目前,諸如人臉識(shí)別等智能分析的精確度仍需要提高,而最重要的是金融安防對(duì)于安防數(shù)據(jù)應(yīng)用的業(yè)務(wù)需求,這才是推動(dòng)大數(shù)據(jù)在金融安防發(fā)展的根本原因,例如平安城市的刑偵應(yīng)用,其視頻大數(shù)據(jù)有著非常明確的應(yīng)用。
大數(shù)據(jù)不是一個(gè)全新的技術(shù),但大數(shù)據(jù)在金融行業(yè)想真正的應(yīng)用和落地還是有一定困難,目前相對(duì)做的比較好的是采集、存儲(chǔ)和管理,而分析、掘等方面還有很長(zhǎng)一段路要走。
推薦閱讀:金融安防管理系統(tǒng)將成未來(lái)的重心
金融安防創(chuàng)新發(fā)展 高清智能仍是趨勢(shì)方向