視頻監(jiān)控技術的發(fā)展正受到兩個方面的壓力。一方面,監(jiān)控系統(tǒng)作用和功能被認可,各行各業(yè)都表現(xiàn)出巨大的需求,視頻監(jiān)控已成社會管理、環(huán)境監(jiān)控、業(yè)務監(jiān)管、狀態(tài)控制,特別是公共事務管理的首選和必備手段。同時上級領導、主管部門也對監(jiān)控系統(tǒng)建設及取得的效益給予了充分的肯定,作為政績考核的重要內容??梢哉f從上到下對視頻監(jiān)控都表現(xiàn)出巨大的、剛性的需求。
另一方面,早期項目和建成系統(tǒng)反映出的許多技術問題與不足,系統(tǒng)運行過程中暴露出的缺欠和管理上的問題沒有得到很好的解決。系統(tǒng)獲得的信息量巨大,但應用水平低。同時系統(tǒng)建設投入大,實際效益卻與期望差別較大。顯然,這方面的壓力是監(jiān)控技術發(fā)展負面的因素。
在這兩個壓力的相互作用下,加之視頻技術快速發(fā)展,新技術不斷涌現(xiàn),而其成熟度和實際效果并未得到實踐的證明,致使用戶在進行選擇時猶豫不決。因此有人評論當前視頻監(jiān)控系統(tǒng)建設正處于進退兩難、舉棋不定的糾結狀態(tài)。
視頻監(jiān)控技術要想得到更廣泛的應用,走上新臺階,解開糾結,必須要重新、全面地規(guī)劃監(jiān)控系統(tǒng)的結構、功能、技術指標和技術構成。在紛繁的技術環(huán)境下做出正確、可行的選擇。希望安防技術工作者,不是一味地宣傳什么趨勢、潮流,呼喚新時代的到來,而是把新技術、新產品創(chuàng)新的實質、它將帶來的影響和改變,可以達到的限度(技術限值)、特別是它們目前的成熟性、適用范圍及應用的切入點告訴大家。
增加量、提高質
公共事務管理需要建設大型的視頻監(jiān)控系統(tǒng),許多小系統(tǒng)也需要通過聯(lián)網進行整合,大型化成為視頻監(jiān)控系統(tǒng)的趨勢。但正是這種大型系統(tǒng)突現(xiàn)了上述的負面問題。因此在進一步推廣和普及監(jiān)控系統(tǒng)應用時,是通過增加量來實現(xiàn)系統(tǒng)的大型化,還是努力提高質量來提高系統(tǒng)的效能,成為須首要決定的問題。
在傳統(tǒng)視頻監(jiān)控系統(tǒng)的設計模式上,增加攝像機的數(shù)量,擴大系統(tǒng)的覆蓋是最簡單的方法。但它會加劇上述問題,導致更嚴重的負面影響。而且單純的提高攝像機的數(shù)量,并不能解決看不見、看不清、系統(tǒng)信息資源利用率低的問題。提高系統(tǒng)的質,意味著要采用新技術和新產品,然而在目前的技術環(huán)境下,新技術和新產品在功能、性能和成熟性方面有一定的限度。即使大家寄予厚望的高清攝像機、視頻智能分析技術也不能從根本上解決看不見、看不清、看不了的問題??床灰姴⒉煌耆且驗闆]有攝像機,看不清通常不是由于攝像機分辨率不夠,而看不見、看不清的時候無法進行智能分析,智能處理并不能生成沒有獲得的信息和恢復丟失的信息。所以提高系統(tǒng)的質,并不是看不見增加攝像機、看不清換高清、看不了上智能這么簡單的事,而是一定要采用新的設計思路和理念,在系統(tǒng)設計上進行創(chuàng)新。
重視攝像機合理布局的設計
要重視攝像機合理布局的設計,要從不同機型的選擇、組合和安裝方式,方位、數(shù)量、照明等方面綜合考慮,統(tǒng)一規(guī)劃;不能孤立地、一個點一個點地規(guī)劃攝像機的選型和配置。要建立監(jiān)控區(qū)的概念,根據(jù)其性質和要求,通過多個攝像機形成有效的覆蓋。“有效覆蓋”不是傳統(tǒng)的攝像機視場的無縫拼接(無死角),而是通過攝像機的組合,保證在監(jiān)控區(qū)內,目標和事件的捕捉率達到規(guī)定的幾率,如一個目標在監(jiān)控區(qū)內活動,可以獲得的一定數(shù)量的圖像。按無死角的思路去設計系統(tǒng),只能是增加攝像機來提高覆蓋,是沒有限度的;有效覆蓋則是按規(guī)定的要求去設計系統(tǒng),追求系統(tǒng)的綜合效果、最優(yōu)性價比,正是法網恢恢、疏而不漏的哲學。
加強系統(tǒng)的實時監(jiān)控功能
要加強系統(tǒng)的實時監(jiān)控功能,視頻監(jiān)控系統(tǒng)原本就是依此設計的,實時監(jiān)控是系統(tǒng)的基本功能,畢竟人的觀察是發(fā)現(xiàn)稍縱即逝的事件(信息)和實現(xiàn)快速響應的最好方式。無論系統(tǒng)智能化程度多高,實時監(jiān)控都是系統(tǒng)不可缺少的功能。然而目前許多系統(tǒng)已弱化了這一功能,甚至不具備實時監(jiān)控的條件,系統(tǒng)的基本功能已轉變?yōu)槭潞蟛樽C(信息存貯)。主要表現(xiàn)為:圖像顯示環(huán)境的人機關系不適合于人的觀察;系統(tǒng)的控制不便于針對目標或事件的監(jiān)控。所以加強實時監(jiān)控功能一定要改變系統(tǒng)設計思路和理念,并在系統(tǒng)結構上實現(xiàn)創(chuàng)新:
· 要專門設計系統(tǒng)的監(jiān)控位,建立較好的觀看環(huán)境(屏幕的布置和人機關系),保證系統(tǒng)具有監(jiān)控適當數(shù)量圖像的能力;加強值機人員的培訓并采用適當?shù)募顧C制,提高觀察方法和技巧,提高通過實時監(jiān)控發(fā)現(xiàn)事件及其動向的能力;
· 要改進系統(tǒng)的結構,監(jiān)控位應具有(經授權)自主生成局域的或以事件為中心的子系統(tǒng),子系統(tǒng)的攝、存、控可以獨立的管理和操作。這樣的子系統(tǒng)可以按事件記錄圖像信息(看與錄的內容一致)和以事件為特征進行圖像檢索。
建立報警提示的功能
要建立報警提示的功能,報警聯(lián)動、切換圖像是安防系統(tǒng)的傳統(tǒng)功能,這一功能現(xiàn)已弱化,主要是沒有合適的探測手段。對開放環(huán)境,確實不能像封閉性局域系統(tǒng)一樣,使用入侵探測器來觸發(fā)報警,切換相關圖像??梢圆捎萌藱C互動(巡邏人員報警,報警按鈕),形成報警觸發(fā)機制;在這方面圖像智能分析可能會有所作為,通過對不規(guī)范行為的識別、及時提示、警告,記錄信息、傳送警情(圖像),也可適當采用圖像智能分析技術提示值機員、切換圖像來提高監(jiān)控的效率,避免遺漏。[nextpage]
加強系統(tǒng)深化應用
要加強圖像搜索、過濾、關聯(lián)、綜合分析技術的研究,提高圖像,特別是存貯圖像的應用水平。所謂深化應用就是把有用的信息,及時、準確地提取、記錄、整理出來。
數(shù)字、模擬
很多人認為數(shù)字視頻監(jiān)控系統(tǒng)已經很成熟、很普及,實則不然,目前、數(shù)字視頻系統(tǒng)還有許多問題需要解決,它真正的優(yōu)勢還沒有體現(xiàn)出來,真正的數(shù)字視頻監(jiān)控系統(tǒng)也不多。人們一直在對數(shù)字、模擬兩者的技術優(yōu)勢、經濟性和適用性進行權衡、比較。視頻監(jiān)控技術“三化”的趨勢確實不是新概念,但遠未實現(xiàn)。數(shù)字化是網絡化、智能化的基礎或前提,必須將數(shù)字視頻技術本質的優(yōu)勢表現(xiàn)出來,并選擇適當?shù)那腥朦c,數(shù)字視頻監(jiān)控系統(tǒng)才有可能得到廣泛的普及。
視頻監(jiān)控系統(tǒng)的數(shù)字化是必然的,但并不意味著模擬系統(tǒng)會完全被替代,即使數(shù)字系統(tǒng)廣泛的應用了,模擬視頻監(jiān)控系統(tǒng)仍然有一定的市場和發(fā)展空間,特別是在局域性的系統(tǒng)中。兩者在不同的環(huán)境下,各具優(yōu)勢(技術、標準化、經濟性和圖像質量),很多情況下,模數(shù)混合方式將是一種合理的選擇。
數(shù)字化的本質優(yōu)勢在于可以獲得和表達更加豐富的信息,并能較大的降低系統(tǒng)開銷(資源的占用)。數(shù)字視頻監(jiān)控系統(tǒng)一定要獲得很高的圖像質量(比之模擬系統(tǒng)),才能得到市場真正的認可和接受,因此系統(tǒng)的設計思想應從在規(guī)定的(通常是窄帶的)資源出發(fā)來設計系統(tǒng)可達到的圖像質量,轉變?yōu)橐砸?guī)定的圖像質量要求去規(guī)劃系統(tǒng)所需要的資源。
高清攝像系統(tǒng)是視頻監(jiān)控數(shù)字化的切入點。在視頻系統(tǒng)數(shù)字化的進程中,有過最后一根視頻電纜多長,既在什么地方進行模數(shù)轉換的問題。真正的高清攝像機(數(shù)字機)沒有這根電纜,實現(xiàn)了全系統(tǒng)信息流的數(shù)字化,同時傳送高清的圖像格式(保證高清圖像質量),因此是真正的數(shù)字化系統(tǒng)。
數(shù)字化視頻監(jiān)控的實現(xiàn)途徑
數(shù)字化(高清)視頻監(jiān)控的實現(xiàn)主要有兩種途徑:HDcctv和網絡視頻。
HDcctv,由廣播電視系統(tǒng)SDI方式發(fā)展而來,從系統(tǒng)結構上看:它是傳統(tǒng)監(jiān)控模式的延伸,核心的特征是閉路的結構和傳輸介質的專用性。它對攝像機輸出的視頻流不分包、不壓縮,所以傳送圖像不失真、不抖動、實時性好,為系統(tǒng)后臺的圖像智能分析提供最佳的圖像。這樣的結構利于系統(tǒng)從標清到高清,從模擬到數(shù)字平滑的轉換,或構成標/高清、模/數(shù)混合系統(tǒng)。平滑轉換并不意味著完全兼容,所謂“插上就用”是不對的,認為它與模擬視頻是完全相同的觀點也是錯誤的。系統(tǒng)中采用的同軸電纜或BNC連接器與模擬CCTV系統(tǒng)中的產品在性能上完全不同。
SDI系統(tǒng)的數(shù)據(jù)流不是通常的視頻壓縮編碼信號,而是將并行的視頻分量信號轉換為串行順序制信號的數(shù)字流,因其不做壓縮處理,故數(shù)據(jù)率很高。通常、SDI是270M系統(tǒng),而HD-SDI是1.5G系統(tǒng)。因此、傳輸距離受到很大的限制,但隨著光通信技術的進步和應用,這一點會得到明顯的改善,HDcctv方式的應用范圍也將不斷的擴展。
網絡視頻,利用網絡平臺的數(shù)字視頻系統(tǒng)。其特點是開放、系統(tǒng)可自主生成、便于系統(tǒng)的擴展和升級。目前、基于網絡傳輸?shù)囊曨l監(jiān)控系統(tǒng)已有了大量的應用,但與模擬視頻監(jiān)控系統(tǒng)相比,在圖像質量上還沒有表現(xiàn)出優(yōu)勢。通常認為圖像質量的主要指標是圖像格式(分辨率)和延時,其實抖動是一個更嚴重的問題。網絡視頻系統(tǒng)產生圖像延時有多種原因,如編/解碼、數(shù)據(jù)分包等,也包括攝像機本身的圖像處理(寬動態(tài)、圖像積累等),但這些因素不會引起圖像的抖動。所謂抖動是指圖像幀率的波動,主要由網絡環(huán)境決定,如網絡帶寬的變化和各種干擾。網絡視頻監(jiān)控系統(tǒng)一般沒有前向糾錯功能,圖像傳輸受網絡環(huán)境的影響,會產生較大的圖像抖動,如出現(xiàn)錯碼和丟包時,需要進行數(shù)據(jù)重發(fā)。這種圖像幀率的不穩(wěn)定對圖像內容分析的影響很大,是今后網絡視頻系統(tǒng)要注意解決的問題。
目前有所謂三大標準(HDcctv、ONVIF、PSIA)之爭,實際上就是上面的兩種選擇,有人認為網絡視頻是最終的解決方案,HDcctv是其完善前的過渡。其實兩者各有長處,具有互補性,在相當長的時間內,兩者會共同存在,并各有自己的市場。
高清、標清
高清晰度攝像機是借用廣播電視的概念,應用電視一直用分辨率來評價圖像表達細節(jié)的能力。高分辨率是應用電視攝像機一直追求的目標,在保持掃描格式不變的條件下,水平分辨率不斷地提高,如所謂模擬高清攝像機,其分辨率可達600-700TVL。有些攝像機的攝像器件像素數(shù)可達130萬、500萬,甚至更高,它們的輸出信號是標清的視頻信號,在電子變焦(拍攝或顯示局部圖像)時,可得到很高的分辨率,但它們仍是標準電視制式設備,與之保持完全的互換性。還有些大像素的攝像機,因不能保證足夠的幀率,已屬數(shù)碼相機的范疇。[nextpage]
高清電視攝像機則不同,它要求圖像分辨率在水平、垂直兩方向上比平均標準電視增加一倍,并且亮、色分離(標清是通過頻譜交錯技術復合在一起),所以(電視)掃描制式、基帶信號格式與標清電視不同,兩者不再兼容,不可互換。目前高清攝像機的圖像輸出主要是數(shù)字流。
推廣高清監(jiān)控系統(tǒng),首先要明確高清圖像在哪些方面能表現(xiàn)出它的優(yōu)勢。顯然,在觀察局部圖像和希望獲得圖像細節(jié)信息時,高清圖像的價值才能體現(xiàn)出來。如將局部圖像全屏顯示時,圖像仍具有很高分辨率,并不出現(xiàn)馬賽克現(xiàn)象;電子警察或道路卡口系統(tǒng)在進行號牌識別時,足夠的像素數(shù)才能得到較高識別率。再如進行圖像個體識別時、高分辨率(像素)圖像是重要的條件。但在通常的實時監(jiān)控環(huán)境下(觀看距離與顯示動態(tài)圖像),高清圖像與標清圖像的觀察效果差別不大;在進行圖像行為分析時,對圖像的幀率穩(wěn)定性(時間分辨能力)要求很高,而對圖像(空間)分辨率要求并不高。所以建設視頻監(jiān)控系統(tǒng)時,要具體問題具體分析、因地而宜,選擇合適的場合和部位采用高清攝像機,不要簡單地從概念出發(fā),一刀切。
目前高清視頻監(jiān)控系統(tǒng)還沒有形成統(tǒng)一的標準(制式),如何實現(xiàn)系統(tǒng)中攝像、傳輸、錄像、顯示、圖像變換和處理設備完整的配套和統(tǒng)一的接口。這也是高清視頻監(jiān)控技術要盡快解決的問題。只有建立統(tǒng)一的標準,形成完整的配套,才能做到,各廠家設備的互換性和通用性,為用戶提供更多的選擇。
最重要的是要解決高清圖像與標準圖像系統(tǒng)的集成問題。它們不能簡單地成為兩個獨立的系統(tǒng),以保證高清系統(tǒng)的高質量圖像和高分辨率。視頻監(jiān)控系統(tǒng)必須對系統(tǒng)中各種信號源的圖像進行綜合顯示、記錄和編輯等處理,對高清圖像進行下變換,或對標準圖像進行上變換。目前很少見到將標清信號上變換的系統(tǒng),大多系統(tǒng)在圖像顯示時,都是將高清圖像信號解碼成標清格式(下變換),顯然這樣的系統(tǒng)將高清攝像機的圖像質量打了折扣。
談到實現(xiàn)高清視頻監(jiān)控系統(tǒng)的技術途徑,又回到上節(jié)的問題,既存在HDcctv和網絡視頻兩種方案。從媒體的宣傳看,網絡視頻的呼聲似乎很高,最近有關HDcctv的聲音才逐漸多起來,其實在技術成熟性和圖像質量方面,后者是有優(yōu)勢的,只是受傳輸帶寬的限制,應用范圍上有一定限度。而網絡視頻目前主要應用于視頻監(jiān)控系統(tǒng)的組網,重點還放在解決網絡間的互聯(lián),系統(tǒng)間的互操作和數(shù)據(jù)間的互通(解碼)等方面,對實現(xiàn)高清圖像的傳輸并沒提出更好的方案。
強調制訂統(tǒng)一的標準就引出一個問題,既高清監(jiān)控系統(tǒng)是否與廣播電視保持基本相同的制式。我們知道應用電視一直采用與廣播電視基本相同的制式,保持基本設備的通用和互換性,在傳輸、記錄、顯示、編輯方面基本采用廣播電視的設備,而把專用攝像機做為自己研發(fā)的重點。視頻監(jiān)控技術在數(shù)字化過程中,產生了許多獨具特色的設備,如數(shù)字存貯設備和上面提到的攝像機,好像要與廣播電視分道揚鑣,于是產生了高清監(jiān)控系統(tǒng)是否繼續(xù)堅持原有的選擇的疑問。其實毋庸置疑,在高清時代,應用電視仍將與廣播電視保持基本相同的制式。做為電視技術的兩個輪子,它們具有共同的技術基礎,廣播電視在巨大市場需求的拉動下,是電視技術進步的箭頭,也帶動著應用電視的技術進步。保持這種方式符合技術規(guī)律和市場規(guī)律,也最具經濟性。
圖像識別、內容分析
人們把解決現(xiàn)行視頻監(jiān)控系統(tǒng)的不足寄望予智能化,甚至期望它能解決目前存在的所有問題,然而現(xiàn)實與期望相差還很遠。
圖像的自動解釋是視頻監(jiān)控系統(tǒng)智能化的基本標志,但其真正的含義、基本功能及實現(xiàn)的途徑是經過很長時間的探索才逐漸清楚的。通過圖像來識別個體是安全系統(tǒng)最迫切的要求,近年來,圖像識別有了大量的成果,各領域,特別是安全領域都有了初步的應用,主要有兩種方式:
· 驗證:通過對監(jiān)控目標的識別,確認目標的身份及正在發(fā)生行為的合法性。這是安防系統(tǒng)的基本功能和典型應用;
·識別:將輸入特征與數(shù)據(jù)庫中大量的參考值進行比對,確定目標的身份,以發(fā)現(xiàn)各種事件的相關線索。是偵察系統(tǒng)的典型應用,這樣的系統(tǒng)要建立海量的樣本數(shù)據(jù)庫。[nextpage]
以上兩種方式和應用都要求系統(tǒng)首先要定義特征,并保證原始輸入和現(xiàn)場輸入的相關性,也就是建立一個稍加限制的環(huán)境。然而通常的視頻監(jiān)控系統(tǒng)達不到這個要求。這就必須導找一個新的途徑,我們知道圖像的兩個分辨能力為圖像識別、內容分析提供了條件,成為圖像技術研究的方向。內容分析自主的定義(簡單)特征不與原始輸入相對比,而是通過圖像關聯(lián)來實現(xiàn)目標的識別、行為分析和預測等,所以稱為圖像內容分析。它以通常的視頻(監(jiān)控)系統(tǒng)為基礎平臺,是監(jiān)控系統(tǒng)智能化的方向和實現(xiàn)途徑(筆者六年前在a&s上撰文時提出的)。
圖像內容分析的研究分四個階段,產品和應用也分四個層面:
· 將(運動)目標從視頻圖像中分離出來。并能在簡單環(huán)境下(單目標、背景單純)對目標分類;
· 在簡單環(huán)境下對目標進行行為分析,判定其運動的方向、方式,目標的復合或離散,發(fā)現(xiàn)和告警異常的行為;產生目標的運動軌跡,并能進行目標的自動跟蹤;進行目標的統(tǒng)計、關聯(lián)、過濾、趨勢預測等;
· 在復雜環(huán)境(既通常的視頻監(jiān)控環(huán)境)下實現(xiàn)上述功能,并實現(xiàn)(單源、多源)圖像的關聯(lián);
· 實現(xiàn)視頻語義的解析,通過對一個圖像序列的分析,理解其包含的真實信息。
前兩個層面是圖像內容分析的定義,目前已有了一些成果;第三個層面是技術實用性的關鍵,達到了這一點,系統(tǒng)才具有應用價值,目前大多數(shù)產品還達不到這一階段;視頻的語義解釋是技術的最高境界,它表明機器具有了與人一樣的理解圖像的能力,但具有人所不能達到的效率,目前還達不到這個程度,但可以通過內容分析對圖像信息進行標引,進而圖像信息間的關聯(lián),圖像與聲音、圖形、文本之間的關聯(lián),這是圖像信息深化應用的前提,可稱為視頻半語義解釋。
圖像內容分析不同于視頻探測,也不同于圖像識別,視頻監(jiān)控系統(tǒng)智能化的真正含義和基本功能就在于此。圖像內容分析既要處理單幀圖像(分離目標),又處理圖像序列(行為分析等),既關聯(lián)單個圖像源(攝像機)的圖像,又要關聯(lián)多源的圖像。既可在前端處理,又需要系統(tǒng)(后臺)處理。因此一定要采用分布式增強處理結構,引入云計算的概念并成為物聯(lián)網的核心技術。
物聯(lián)網在安防系統(tǒng)的應用并不是成熟產品的應用,而是概念的推廣和關鍵技術的突破。傳感網是物聯(lián)網的基本單元,它的核心功能是真實感知和各傳感器之間的互聯(lián)(信息的關聯(lián))。圖像內容分析技術充分實現(xiàn)視頻探測的功能,并可進行各種信息的關聯(lián),因此可成為傳感網的核心,正是物聯(lián)網迫切需要突破的關鍵技術。
視頻監(jiān)控系統(tǒng)的智能化是逐步發(fā)展的過程,不可能一蹴而就,也沒有終極的結果,要經過不斷的技術積累,特別是核心技術的突破。
監(jiān)控技術智能化已經實現(xiàn)的觀點是不正確的,希望它能解決目前監(jiān)控系統(tǒng)的所有問題和不足也不現(xiàn)實。
圖像系統(tǒng)智能化的重要標志是信息的機器解釋,但不能完全代替實時監(jiān)控,應通過圖像分析技術來提高實時監(jiān)控的效率和效果,消除和改善實時監(jiān)控容易出現(xiàn)的問題。通過分析,發(fā)現(xiàn)超出正常的狀態(tài),確定其相應的(風險)等級,然后產生相應的提示、警告、反應信息,再通過實時監(jiān)控,捕捉到轉瞬即失的事件、事態(tài)圖像。
要積極的選擇合適的場合應用圖像內容分析技術,只有應用才能促進它的發(fā)展,讓人們認識到它的作用,改進它的不足。但不能不分場合的、盲目的遍地開花。
結語
視頻監(jiān)控技術正處在大變革的時期,我們面對多種選擇,需要正確的把握方向。因此、要傾聽各種聲音,既要跟上技術的潮流,又要作到不跟風,不盲從。特別要注意國內外知名品牌(企業(yè))的動向,注意理解技術后面深層次的東西.