文/張展 博康智能網(wǎng)絡(luò)科技股份有限公司PBU總監(jiān)
安防監(jiān)控發(fā)展至今,視頻監(jiān)控作為一種廣泛使用的技術(shù)防范手段,在城市社會治安綜合防控體系中發(fā)揮著重要作用,隨著視頻監(jiān)控逐步由標清向高清發(fā)展,畫質(zhì)的提高使得視頻監(jiān)控中捕獲到的細節(jié)內(nèi)容也越來越豐富,利用智能視頻分析,在海量的視頻監(jiān)控數(shù)據(jù)中檢索感興趣目標成為可能,智能分析快速、準確的檢索無疑大大提高了視頻檢索的效率。
常用的智能視頻分析有哪些
常用的智能視頻分析廣義上主要分為:行為分析類、事件檢測類、特征識別類、圖像處理類。
行為分析類,從監(jiān)控視頻中檢測出目標,并判斷目標運動行為,也包括目標計數(shù)。
事件檢測類,主要應(yīng)用于交通行業(yè),從監(jiān)控視頻中檢測出車輛目標和行人目標,并對目標事件進行判斷,形成一系列交通事件,如擁堵分析、車輛逆行、行人出現(xiàn)、行人橫穿等。
特征識別類,從監(jiān)控視頻中檢測出目標,并對目標進行分析識別,包括車輛特征識別(車牌、車標、車身顏色、車輛子品牌等)、人臉識別等。
圖像處理類,主要是針對一些模糊不清圖像進行優(yōu)化處理,以增加視頻的可監(jiān)控性能。
行為分析類
通過場景中背景和目標分離,并追蹤在視頻場景中出現(xiàn)的目標,用戶可以通過不同場景中設(shè)置不同的報警規(guī)則,一旦目標在場景中出現(xiàn)了違反預(yù)先定義的規(guī)則,智能識別系統(tǒng)會自動發(fā)出預(yù)警,工作人員根據(jù)報警提示進行相關(guān)處置措施。行為分析主要廣泛應(yīng)用于公共安全相關(guān)領(lǐng)域,如監(jiān)所、銀行等重點場所。行為分析效果和室外監(jiān)控場景關(guān)系非常大,受到光線和其它干擾影響比較大,如晚上效果比白天差,光線、陰影、樹葉晃動等情況都會影響使用效果,因此,行為分析應(yīng)用應(yīng)該充分了解應(yīng)用場景和環(huán)境條件情況下使用合適的行為分析功能。
行為分析應(yīng)用上可分為周界防范預(yù)警、可疑行為預(yù)警、目標計數(shù)。
周界防范預(yù)警:用于檢測視頻監(jiān)控區(qū)域出現(xiàn)的單向/雙向跨線越界、區(qū)域闖入、區(qū)域離開等行為事件。該功能以連續(xù)的視頻幀為處理數(shù)據(jù),提取目標特征,分析其運動行為,從而實現(xiàn)多種應(yīng)用功能。周界防范預(yù)警主要應(yīng)用于一些重點場所的安全防范,如監(jiān)獄周界、工廠周界、金庫等,利用周界防范預(yù)警功能可以把監(jiān)控工作人員從繁重的純?nèi)斯けO(jiān)控方式轉(zhuǎn)變?yōu)橹悄茴A(yù)警方式,監(jiān)控工作人員只需要監(jiān)看實時報警畫面即可。
可疑行為預(yù)警:分析打架斗毆、區(qū)域徘徊、遺留物品、物品移動等可疑行為,從而實現(xiàn)及時預(yù)警功能??梢尚袨轭A(yù)警主要應(yīng)用于如監(jiān)所、銀行、博物館等場所。
目標計數(shù):基于對運動目標的智能跟蹤與識別技術(shù),通過對區(qū)域和方向的設(shè)定來統(tǒng)計通過人數(shù),以及人群流動量、人群流動方向的統(tǒng)計及分析數(shù)據(jù),計數(shù)主要應(yīng)用于機場、商城等需要了解客流情況的場所。
事件檢測類
視頻檢測常采用多目標識別與多目標跟蹤技術(shù),可對視頻圖像中的所有目標進行檢測、鎖定、跟蹤,精確描述其運動軌跡,準確測量其位移量,從而實現(xiàn)各類交通事件檢測。事件檢測主要應(yīng)用于交通行業(yè),主要功能見表1.
表1 交通行業(yè)事件檢測主要功能
特征識別類
特征識別首先需要對視頻/圖片中的目標檢測分析,需要檢測出目標類型,再進行比對分析,從而實現(xiàn)目標的特征識別,目前常用的主要包括人臉識別、車輛特征識別。
車輛特征識別
車輛特征識別是基于視頻流、圖片的分析,可以對車輛的身份進行識別,包括車牌號碼、車身顏色、車標、安全帶檢測、打手機檢測、夜間遮陽板檢測、車輛子品牌及具體年款等。
基于視頻流分析的車輛特征識別廣泛應(yīng)用卡口和電子警察系統(tǒng),目前很多廠家在前端DSP相機中直接集成車輛特征識別功能,相機能直接輸出車輛特征信息,但由于DSP性能限制,一般能夠識別的車輛特征信息較后端分析方式相對有限;基于圖片分析的車輛特征識更多應(yīng)用卡口/電警圖片的二次識別中,通常采用后端分析方式,能夠?qū)崿F(xiàn)所有的車輛特征信息識別,二次識別系統(tǒng)能夠?qū)σ呀ǜ鲝S商卡口/電警系統(tǒng)集中二次分析,可以實現(xiàn)糾正一次識別錯誤,提供更多車輛特征信息,主要應(yīng)用于交警和公安行業(yè)。主要的車輛特征信息如下:
車頭特征信息:
·車牌號碼——對車牌號碼的檢測識別;
·車牌顏色——顏色可分為藍、黃、白、黑等;
·車牌類型——軍牌、教練牌等多種類型車牌識別;
·車身顏色——對車身顏色的檢測識別;
·車型細分——大型貨車、大型客車、中型客車、小型客車、小型貨車、兩輪車等類型的車型細分;
·車標粗分——主流車標的檢測識別(如大眾、別克等);
·車輛子品牌細分——同一車標的品牌子類細分(例如大眾如桑塔納2006款);
·無牌車識別——對于無牌、牌照遮擋、牌照污損車輛的車身顏色、車型、車輛品牌及子品牌的識別;
·未系安全帶識別——識別主副駕駛位置人員未系安全帶;
·打手機識別——識別駕駛?cè)藛T打手機;
·夜間遮陽板——識別夜間主副駕駛位置人員遮陽板遮擋人臉行為;
·人臉檢測——檢測出主副駕駛?cè)四槨?/p>
車尾特征信息:
·車牌號碼——對車牌號碼的檢測識別;
·車牌顏色——顏色可分為藍、黃、白、黑等;
·車牌類型——軍牌、教練牌等多種類型車牌識別;
·車身顏色——對車身顏色的檢測識別;
·車標粗分——主流車標的檢測識別(如大眾、別克等);·車輛子品牌細分——同一車標的品牌子類細分(例如大眾如桑塔納2006款);
·無牌車識別——對于無牌、牌照遮擋、牌照污損車輛的車身顏色、車型、車輛品牌及子品牌的識別;
·黃牌車車型細分——針對黃牌車,可根據(jù)車尾特征區(qū)分集裝箱、卡車、吊車、拖車、油罐車、水泥車、大巴等。
人臉識別
人臉識別是基于視頻流、圖片的分析,主要包含了人臉檢測及人臉識別兩大部分。人臉檢測指通過一定算法分析,從圖片或視頻背景中分析并定位出人臉模型的工作;人臉識別是指將已定位出的人臉模型進行進一步的比對分析,從而確定人臉身份。
人臉識別一般分為基于圖片靜態(tài)比對方式和基于視頻流的動態(tài)比對方式。靜態(tài)比對一般多應(yīng)用于人員身份識別確認,樣本圖片和人臉身份庫進行比對,以相似度方式由高到低排列出來,再結(jié)合人工復(fù)核確認人員身份,人臉身份庫通常情況非常大,地市人臉庫為百萬級,省或直轄市人臉庫為千萬級。采用圖片采集比對能夠較好的控制光線和角度,效果較動態(tài)比對要更加理想。動態(tài)比對主要從監(jiān)控相機中檢測人臉,再和人臉庫實時比對,多應(yīng)用于黑名單布控報警等應(yīng)用,動態(tài)比對的人臉庫一般比較小(幾千~幾萬),由于動態(tài)方式采集到的人臉受光線和角度影響,比對為首位命中方式,漏報和誤報是目前階段較難解決的問題,一般情況在室內(nèi)光線相對恒定,場景為通道型場所,人臉黑名單庫較小的前提下能夠?qū)崿F(xiàn)較好的應(yīng)用。
人臉識別與人體的其它生物特征(指紋、虹膜等)都具有人的身份識別,與其它類型的生物識別比較人臉識別具有一定的特點:
·非強制性,用戶不需要專門配合人臉采集設(shè)備,幾乎可以在無意識的狀態(tài)下就可獲取人臉圖像,這樣的取樣方式?jīng)]有“強制性”;
·非接觸性,用戶不需要和設(shè)備直接接觸就能獲取人臉圖像;
·并發(fā)性,在實際應(yīng)用場景下可以進行多個人臉的分揀、判斷及識別;
·除此之外還具有操作簡單、結(jié)果直觀、隱蔽性好等特點。
圖像處理類
圖像處理主要是對各種降質(zhì)影像進行恢復(fù)處理,改善圖像質(zhì)量,突出影像細節(jié),以輔助應(yīng)用人員更好的挖掘圖像中有用信息,如車輛牌照號、人臉細節(jié)特征等。
常見圖像處理主要有低照度處理、去霧處理、去抖動處理、聚焦模糊處理、多幀超分辨等,一般對視頻錄像和圖片進行處理,主要應(yīng)用于公安偵查、檢察機關(guān)等行業(yè)。
視頻質(zhì)量診斷分析
對監(jiān)控系統(tǒng)視頻狀況進行巡檢,檢測監(jiān)控設(shè)備故障、質(zhì)量下降、傳輸干擾、惡意破壞監(jiān)控系統(tǒng)等情況,只檢測不做圖像處理,一般采用視頻輪巡方式處理診斷。視頻質(zhì)量診斷分析一般應(yīng)用于大型監(jiān)控系統(tǒng),為系統(tǒng)運維提供服務(wù)。
檢測內(nèi)容包括:清晰度、亮度、對比度、色彩、噪聲、視頻干擾、凍結(jié)、抖動、信號丟失、視頻劇變、PTZ功能、視頻遮擋。
視頻濃縮摘要
通過對歷史視頻錄像的分析,提取出其中的運動分量,對視頻內(nèi)容進行整合壓縮形成摘要,并可通過摘要視頻,快速定位運動目標,回溯原始錄像。一段稀疏目標的24小時監(jiān)控視頻經(jīng)過摘要處理后可能壓縮到10-30多分鐘,大大提高查閱視頻的效率。
通常情況摘要密度是能夠設(shè)置調(diào)整,視頻摘要處理可選擇同一畫面顯示的目標個數(shù),在保證效率的同時不遺漏;具有區(qū)域過濾設(shè)置,包括關(guān)注區(qū)和屏蔽區(qū),即框選自己感興趣的區(qū)域或者不感興趣的區(qū)域進行運動目標的過濾,大大減少觀看摘要視頻的時間。雙擊運動目標可即刻回溯該運動目標出現(xiàn)的原始視頻,而不需要到原始視頻中手動尋找對應(yīng)時間點,提高了目標搜尋效率。
以圖搜圖/以圖搜視頻方式特征比對
是利用已有樣本圖片,在選定視頻或圖片中搜索樣本圖片中的目標,一般提供多種模式的以圖搜圖/視頻:顏色方式、紋理方式和人臉方式。以圖搜圖/以圖搜視頻方式特征比對能夠在發(fā)現(xiàn)嫌疑目標的前提下,利用已抓拍的目標圖像在海量視頻或圖片中快速搜索,提高了目標搜尋效率,主要應(yīng)用公安圖像偵查。
結(jié)合應(yīng)用場景選用合適的智能分析
何種應(yīng)用場景該選用怎樣的智能分析技術(shù)呢?筆者列舉了不同應(yīng)用場景對智能分析功能的不同需求(如表2所示),相信這些對用戶朋友們選擇智能分析產(chǎn)品會有所幫助。
表2 不同應(yīng)用場景對智能分析功能的不同需求