智能視頻監(jiān)控技術其實是計算機視覺技術在安防領域的應用延伸。而計算機視覺技術作為人工智能的分支之一,它主要研究計算機如何能夠像人腦通過人眼一樣,分析和理解圖像或者視頻中的內(nèi)容。智能視頻監(jiān)控借助于計算機強大的數(shù)據(jù)處理功能,依靠算法,對圖像或者視頻中的海量數(shù)據(jù)進行高速分析與理解,去粗取精,去偽存真,向使用者提供真正有用的關鍵信息。這種技術的范圍包括攝像機的標定和三維重建,背景圖像的獲取與維護,目標檢測、識別與跟蹤,運動的語義理解、運動估計等。
目前,計算機視覺技術應用遍布遙感圖像分析、文字識別、醫(yī)學圖像處理、圖像數(shù)據(jù)庫、工業(yè)檢測、多媒體技術、視覺監(jiān)控與軍事等多個領域。計算機視覺技術在智能視頻監(jiān)控中主要是解決攝像機的定標,多個攝像機的協(xié)同,基于主動視覺的感興趣區(qū)域劃分,景深及目標尺寸估計,目標的運動估計,目標的分類及行為分析,特殊情況報警及控制,系統(tǒng)的動態(tài)學習等問題。
智能視頻監(jiān)控(Intelligent Video Surveillance)技術業(yè)界簡稱IVS技術,而智能視頻分析則被稱作IVA(Intelligent Video Analyzing)技術。智能視頻監(jiān)控技術主要是對視頻自動進行分析,從視頻中提取關鍵信息,發(fā)現(xiàn)和識別異常的相關事件,從而可以替代人為監(jiān)控或者協(xié)助人為監(jiān)控。顯然,視頻分析與識別涉及到復雜的軟件算法,它可以通過編程識別出奇怪與異常的行為。視頻內(nèi)容分析與識別軟件能通過分析現(xiàn)場或記錄的視頻流,檢測識別出可疑的活動、事件或者行為模式。因此,智能視頻監(jiān)控技術的核心,就是智能視頻分析技術,而智能視頻分析技術的核心,應為復雜的智能軟件算法。顯然,它的研究不但有極其重要的實踐意義,而且還有重要的理論研究意義。然而,如何定位智能視頻分析技術,用戶又應如何識別智能視頻分析技術的真?zhèn)文?
實際上,智能視頻分析技術是一種通過高級的視頻分析,將原始的視頻數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的信息和系統(tǒng)智能的技術。智能視頻分析技術在視頻監(jiān)控系統(tǒng)(以及其他視頻系統(tǒng))中的應用,將使用戶獲得更多、更精確的參考信息,從而進一步幫助用戶作出更快、更好的決策。
智能視頻分析技術也可以說是網(wǎng)絡視頻產(chǎn)品功能的自然擴展,如Axis多年以前就已在其網(wǎng)絡視頻產(chǎn)品中集成了移動探測(Motion Detection)功能,只有在指定的區(qū)域內(nèi)有運動物體出現(xiàn)時,視頻數(shù)據(jù)才會被發(fā)送和傳輸,從而大大減少了用戶對無用數(shù)據(jù)的接收和存儲。也就是說,在視頻管理軟件的控制和管理下,只存儲有運動物體出現(xiàn)、視頻圖像發(fā)生變化時段內(nèi)所發(fā)生的事件。這些存儲下來的事件可以被用來進行事后詳細分析與取證,并使得對關鍵的視頻的搜索變得非常簡單、快捷。
從狹義上來說,智能視頻分析是對視頻畫面進行分析,從而在畫面中截取一些有用的信息,它在某種程度上代替監(jiān)控人員,節(jié)省了人力資源。根據(jù)以上的定義要求,首先開發(fā)出了移動偵測系統(tǒng)。其原理是在畫面中用前一幀的畫面減去現(xiàn)在這一幀的畫面,從而找出兩者的差異,然后通過差異占總體畫面的百分比產(chǎn)生報警信號。但采用這種方式往往誤報率十分高,因為畫面十分容易因外界因素而產(chǎn)生細微或大幅度的變化,如下雨、日光下的光線變化等外界環(huán)境因素。因此,這種方式不能在大規(guī)模、大場景下采用。嚴格來說,移動偵測不能定性為智能視頻,但它確實是智能視頻分析的最早體現(xiàn)模式。
眾所周知,“監(jiān)”和“控”是相輔相承的,做到“監(jiān)”并不太難,而真正做到“控”才是至關重要的。如要更好更快地實現(xiàn)“控”的要求,就必須通過智能視頻分析技術,來提升“監(jiān)”的有效性。智能視頻分析技術需要自動識別監(jiān)控對象,及時感知目標對象所發(fā)生的變化,而當異常情況出現(xiàn)時能夠?qū)崿F(xiàn)自動報警等功能。
智能視頻分析技術的產(chǎn)業(yè)化發(fā)展為視頻監(jiān)控智能化提供了絕好的機遇。智能視頻分析系統(tǒng)對視頻中異常行為事件進行實時提取和篩選,并及時發(fā)出預警,從而改變了傳統(tǒng)視頻監(jiān)控系統(tǒng)只能“監(jiān)”不能“控”的被動局面。因此,它比傳統(tǒng)視頻監(jiān)控系統(tǒng)有更加快速的反應時間與更加強大的數(shù)據(jù)檢索和分析功能,從而使監(jiān)控能力得到極大的提高。
隨著技術的不斷成熟,在世界范圍內(nèi)逐漸出現(xiàn)了一些專業(yè)的IVS研究廠家,如美國的ObjectVideo、Vidient;以色列的NICE、Mate、IOImage;澳大利亞的IOmniscient等。它們相繼進入中國市場,但終因其技術與中國國情的差異性,無法真正滲透中國市場。這一現(xiàn)狀給國內(nèi)的智能視頻技術研究廠家?guī)硖魬?zhàn)的同時,同樣也提供了一個非常好的發(fā)展機遇。如今IVS產(chǎn)業(yè)在國內(nèi)也初具規(guī)模,如智安邦、飛瑞斯、貝爾信等智能視頻分析研究廠家,其相關產(chǎn)品也先后在平安城市以及各重點行業(yè)初步取得了應用。
公安部在“十一五”規(guī)劃中明確提出,將人臉識別、智能分析與目標識別作為其重點發(fā)展方向。如今,智能視頻監(jiān)控在國內(nèi)已經(jīng)有了一定規(guī)模的應用:如在2007年10月竣工驗收的青藏鐵路項目中,全線1300路通道采用智能視頻分析技術,對全線鐵路進行入侵保護;北京地鐵5號線,全線23個車站,重點區(qū)域均采用了丟炸彈及入侵探測;北京航空信息中心機房,采用了入侵及防尾隨探測;北京奧運會、上海世博會、廣州亞運會場館建設項目,均已使用了智能視頻分析技術……
現(xiàn)代的智能視頻系統(tǒng)大多采用場景維護的方法來解決移動探測的誤報問題。這樣,智能視頻系統(tǒng)往往會利用其軟件,自動學習場景的細微變化,從而建立并維護一個實時更新的背景環(huán)境(會根據(jù)環(huán)境的細微變化而變化)。由于運動目標可以從背景中抽離,并可給出目標在畫面中相對應的像素坐標,這樣便可根據(jù)其坐標位置進行特定的報警處理。由于軟件本身是根據(jù)環(huán)境的變化而不斷自動學習,這樣便可大大降低系統(tǒng)的誤報率。
利用智能視頻分析技術的智能視頻監(jiān)控系統(tǒng)雖能局部或全部替代監(jiān)控人員,大大提高安防的監(jiān)控力度。但由于只是處于初級階段,目前其仍存在不少瑕疵。
· 利用智能視頻分析技術的智能視頻監(jiān)控系統(tǒng),對監(jiān)控場景的環(huán)境要求較高,其通常需要根據(jù)不同的環(huán)境,以及不同的需求進行不同的參數(shù)設置;
· 具有智能視頻分析技術的智能視頻監(jiān)控系統(tǒng),需專業(yè)人員指導安裝才可以順利使用實施。因為只有熟悉技術的專業(yè)人員才能根據(jù)經(jīng)驗對現(xiàn)場環(huán)境進行判斷分析,再指導安裝實施使用;
· 由于用戶普遍對智能視頻監(jiān)控系統(tǒng)的認識有限,以致其在產(chǎn)品的運用和操作使用面臨技術難題,因此還需要較長時間的引導。