隨著通信、計算機、多媒體技術的發(fā)展,以及安防、金融、教育等行業(yè)日益增漲的客戶需求,大型的遠程視頻監(jiān)控系統(tǒng)正在全國各地迅速地建設起來。視頻監(jiān)控在經歷了模擬監(jiān)控、數(shù)模結合監(jiān)控、全數(shù)字化監(jiān)控的發(fā)展后,正朝著網絡化、平臺化、大型化、綜合化的方向發(fā)展。
傳統(tǒng)的視頻監(jiān)控技術已無法滿足新的業(yè)務需求與新的業(yè)務模式。視頻監(jiān)控的發(fā)展,越來越需要各種技術的綜合,并且不斷創(chuàng)新。未來的視頻監(jiān)控系統(tǒng)將是各種先進技術的集大成者。下面簡要闡述目前視頻監(jiān)控需要用到的各種主流技術。
一 、流媒體技術
實時視頻監(jiān)視與錄像回放是視頻監(jiān)控的兩大重要基本業(yè)務,其本質是將視頻源上的多媒體數(shù)據傳送到視頻接收端。實時視頻監(jiān)視要求完成視頻的實時傳輸,具有很強的實時性;錄像回放則類似于VOD業(yè)務,具有一定的實時性(但并非很強),要求畫面清晰流暢,并且能完成各種播放控制操作。
我們可以將前端的攝像機看成是實時的A/V源,而將錄像文件看成是存儲的A/V文件,那么目前解決此類問題的一個很好的辦法便是運用流媒體技術。
我們知道,流式傳輸及流媒體(StreamingMedia)是為了解決信息傳輸實時性問題而開發(fā)的。流式傳輸主要指通過網絡傳輸媒體(如音頻、視頻等)的技術總稱,其特定含義為通過網絡將音視頻等信息傳輸?shù)接脩艚K端播放時,無須等全部文件下載完畢才可播放,而是將連續(xù)的音視頻信息壓縮后放于服務器,用戶終端播放時只要將開始部分的內容存入其內存,其余數(shù)據流由用戶終端在后臺繼續(xù)接收并播放,直至播放完畢或用戶中止操作。這樣,用戶播放媒體的等待時間將顯著減少,且無須太大緩存。流媒體指使用流式傳輸技術的連續(xù)時基媒體。
流式傳輸主要是為了區(qū)別于下載傳輸而提出的。傳統(tǒng)的下載轉輸方式有兩個基本條件,一是基于文件操作,二是文件要全部下載后才能使用(播放)。對于實時視頻監(jiān)視而言,不存在文件的概念,因此無法用“下載”的方式實現(xiàn)。對于錄像業(yè)務,錄像數(shù)據可以以文件形式存在,但是,如果錄像數(shù)據如果必須等完全下載后才能播放的話,會帶來很大的時延,用戶無法忍受。所以,比較理想的方式是采用流式傳輸。
實現(xiàn)流式傳輸有順序流式傳輸(ProgressiveStreaming)和實時流式傳輸(RealtimeStreaming)兩種方法。視頻監(jiān)控業(yè)務主要采用實時流式傳輸。
圖1為采用流媒體技術的視頻監(jiān)控系統(tǒng)架構示意圖。網絡攝像機可以看成是一臺提供實時A/V源的服務器,當用戶請求進行實時監(jiān)視時,網絡攝像機采用實時流式傳輸方式向用戶終端傳送監(jiān)控畫面??紤]到多個用戶同時訪問網絡攝像機將帶來流量瓶頸等問題,可以使用視頻服務器來進行中轉,讓視頻服務器來提供強大的負載能力。
以上只是原理性的簡要說明。上述方案可以滿足小型的視頻監(jiān)控系統(tǒng),但在大型的視頻監(jiān)控系統(tǒng)中,監(jiān)控前端設備與用戶終端的數(shù)目都非常龐大,除了增加考慮組播、廣播等方案外,更需要一套完善的媒體分發(fā)、調度機制來保證媒體的高效傳送。在這方面,目前尚無現(xiàn)成的成熟方案,中國通信標準化組織(CCSA)正對此展開積極研究,以便為未來的視頻監(jiān)控系統(tǒng)提供標準的媒體傳送機制。[nextpage]
二、 Presence技術
提到Presence,大家首先想到的肯定是即時通信(IM)。而Presence技術與視頻監(jiān)控的結合似乎是一個比較新的提法。以傳統(tǒng)方式來思考,似乎兩者沒有太大瓜葛。其實不然,Presence可以很好地為服務于視頻監(jiān)控。
Presence,也作“PresenceInformation”,中文一般譯為“呈現(xiàn)”,用以傳達用戶狀態(tài)以及用戶通過一組設備進行通信的能力。Presence最常用于即時通信工具中,比如,在很多IM軟件中有:聯(lián)機、忙碌、離開、顯示為脫機等狀態(tài)。這些便稱為“Presence狀態(tài)”,它們表征了用戶當前所處的某種狀態(tài)。同時,這些狀態(tài)還反映出與該用戶與其他用戶進行通信的能力,比如若用戶處于“脫機”狀態(tài)的話,別的用戶便不能用即時消息與之通信。
一個最簡單的Presence過程如下:一個用戶(稱為Watcher)訂閱(SUBSCRIBE)他感興趣的另一用戶(Presentity)的Presence狀態(tài),Presentity接受訂閱請求。以后Presentity的狀態(tài)發(fā)生變化之后他會發(fā)布(PUBLISH)自己的新狀態(tài),這個新狀態(tài)會通知(NOTIFY)給Watcher。下圖給出的是RFC2778提出的Presence模型。
從系統(tǒng)的角度來看,視頻監(jiān)控中的各個監(jiān)控前端設備與IM系統(tǒng)中的用戶有很多相似之處,比如說,系統(tǒng)應時刻了解各監(jiān)控前端設備:(1)是否已登錄到系統(tǒng);(2)具備什么樣的能力集(比如支持何種編碼方式,是否支持加密,是否支持遠程PTZ控制);(3)是否正在被用戶訪問,以及被哪些用戶訪問等等。
不難發(fā)現(xiàn),以上這些“狀態(tài)”的維護正是Presence技術的擅長之處。可見,如果能將Presence的技術成果運用到視頻監(jiān)控系統(tǒng)中,將會帶來很大的方便。
三、 智能視頻技術
智能視頻監(jiān)控是網絡化視頻監(jiān)控領域最前沿的應用模式之一。
智能視頻(IV,IntelligentVideo)源自計算機視覺(CV,ComputerVision)技術。計算機視覺技術是人工智能(AI,ArtificialIntelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關系,從而使計算能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內容。
視頻監(jiān)控中所提到的智能視頻技術主要是指:“自動的分析和抽取視頻源中的關鍵信息。”如果把攝像機看作人的眼睛,而智能視頻系統(tǒng)或設備則可以看作人的大腦。
建造視頻監(jiān)控系統(tǒng)的目的,一是為了視覺上的延伸——把處于別地的畫面通過網絡與設備“拉近”到眼前,因此有了遠程監(jiān)控;二是為了智力上的延伸——讓系統(tǒng)自動為我們分析問題并解決問題,于是有了智能監(jiān)控。當然,后者是更高層次上的要求,但也是視頻監(jiān)控今后發(fā)展的必然要求。
傳統(tǒng)的視頻監(jiān)控系統(tǒng)缺乏智能,在很大程度上依賴于人的判斷。然而,人類有著自身難以克服的弱點,比如:(1)人力有限,人的反應與處理速度有限,導致我們在指定的時間內能夠進行監(jiān)視的地點有限。這也就意味著各個被監(jiān)控點并非每時每刻都處于監(jiān)控當中。(2)人并非一個可以完全信賴的觀察者,無論是在觀看實時的視頻流還是在觀看錄像回放的時候,由于自身生理上的弱點,我們經常無法察覺安全威脅,從而導致漏報現(xiàn)象的發(fā)生。