然而,監(jiān)控的目的就是對監(jiān)視場景中的異常事件或監(jiān)控對象的行為進(jìn)行檢測與分析。而在長時間視頻序列中采用人工的方法處理此類工作既不實用也不經(jīng)濟,因此在視頻序列中利用計算機進(jìn)行視頻智能自動檢測就顯得十分重要。
據(jù)了解,就目前較成熟的視頻異常行為智能檢測包括雙向越界、單向越界、進(jìn)入禁區(qū)、離開禁區(qū)、徘徊、無人值守、驟變、人員聚集、煙霧檢測、快速運動、逆行、打架等事件。而異常行為檢測的實現(xiàn)方法通常有兩類:1、把小概率行為或與先驗規(guī)則相反的行為看作異常行為。2、把與已知正常行為的模式不匹配的行為看作異常行為。
核心算法
智能視頻分析技術(shù)對異常事件進(jìn)行分析需要核心的算法和技術(shù)做支撐,這些核心算法包括:(1) 將人類行為進(jìn)行建模的虛擬現(xiàn)實的技術(shù);(2)3D建模技術(shù),通過對攝像機場景的實際參照標(biāo)定構(gòu)建場景的三維模型,從而能夠準(zhǔn)確計算出場景中任意物體的高度及任意兩點之間的距離,為威脅目標(biāo)分析提供準(zhǔn)確的依據(jù);(3)基于對象的標(biāo)簽分類,能夠準(zhǔn)確區(qū)分人、交通工具和其他對象;(4)基于環(huán)境變化的自學(xué)習(xí)自適應(yīng),理解和鑒別行為模式,自學(xué)習(xí)自適應(yīng)環(huán)境,內(nèi)置多種環(huán)境模型(街道、圍墻、水面、雨雪霧天氣等等),能夠根據(jù)環(huán)境的變化自動調(diào)節(jié);(5)自檢測自保護,在環(huán)境能見度低、視場受阻、攝像機角度偏移、視頻信號故障、低信號或無信號等異常情況時,立即發(fā)出報警;(6)敏感度自適應(yīng),根據(jù)場景環(huán)境持續(xù)自學(xué)習(xí)和自調(diào)節(jié)參數(shù),確保外部敏感度自適應(yīng)能力達(dá)到7×24全天候(在各種惡劣環(huán)境和照明條件下提供高可靠性的檢測,無需外部人工干預(yù)調(diào)節(jié))。相關(guān)技術(shù)如下:
圖像異常檢測算法
(1)圖像信號丟失、被遮擋:檢測圖像方差。如果方差很小,可以認(rèn)為圖像丟失或者鏡頭被蓋住等現(xiàn)象發(fā)生。(2)相機被扭轉(zhuǎn)到新方向: 通過和指定背景進(jìn)行比對來檢測是否發(fā)生扭轉(zhuǎn)。(3)圖像信號質(zhì)量下降,如有大量噪點,周期性干擾(橫紋等):對幀差信號進(jìn)行方差、FFT分析。
圖像增強算法
(1)超分辨率技術(shù),就是使用多張同一物體的低分辨率圖像整合成一張高分辨率圖像?,F(xiàn)在主要應(yīng)用在公安偵破案件上。例如還原一張較為模糊的車牌或者人臉等。(2)對比度增強、去霧化技術(shù)。對于一些“霧蒙蒙”的圖像,可以簡單地通過直方圖平衡或者通過對顏色中的散射成分進(jìn)行過濾從而提高圖像的“清晰度”。應(yīng)該注意到這些技術(shù)手段并沒有從源頭增強有用信號,而是選取了適合人眼觀測習(xí)慣的表達(dá)方式。所以這些過濾后的信號適合提供給監(jiān)控人員觀看,而不是作為智能視頻監(jiān)控系統(tǒng)的輸入。(3)防抖動技術(shù)。相機抖動通常是由風(fēng)吹而引起。在采用長焦鏡頭的時候,圖像抖動更為明顯。防抖動有兩種思路, 一種是對檢測到的抖動進(jìn)行平滑;另外一種就是爭取將圖像象釘子釘住一樣一動不動。前一種技術(shù)適合過濾給監(jiān)控人員直接觀看的信號,后一種是智能視頻分析系統(tǒng)所需要的。主流的基于背景建模的運動檢測方法需要穩(wěn)定的輸入信號,否則容易在對比強烈的邊緣等處產(chǎn)生誤報警。
運動檢測算法
(1)固定相機的運動檢測:這是主流應(yīng)用。通常是通過將當(dāng)前幀和背景模型之間進(jìn)行比對,發(fā)現(xiàn)的差異作為可能的運動物體輸入給跟蹤模塊。算法的差異主要集中在背景模型如何建立,選擇何種特征進(jìn)行前景和背景的比對?;旌细咚故墙?jīng)典的背景模型,簡單,有一定的自適應(yīng)性,現(xiàn)在市場上的產(chǎn)品主要采用此方法。在一些特殊場合,例如水面波浪,樹枝擺動等場景,混合高斯不一定可以有效處理。這時候就需要采用動態(tài)背景或者其他技術(shù)手段來更好地進(jìn)行背景建模,代價是計算量大大增加。采用像素灰度值作為特征進(jìn)行比對是主流應(yīng)用。出于過濾陰影、提高信噪比的考慮,也可以使用彩色像素值,但是數(shù)據(jù)量增大很多。另外也有采用紋理、梯度等特征進(jìn)行前景、背景比對的。它們對光照突變、陰影不敏感,有助于消除誤報警。(2)運動相機(云臺)的運動檢測:據(jù)了解,目前在國內(nèi)安防領(lǐng)域還沒有商業(yè)應(yīng)用。在國外的一些高端監(jiān)控系統(tǒng)和實驗系統(tǒng)上已經(jīng)有一些嘗試。主要是和云臺跟蹤相配合,甚至是多云臺相機之間的配合中采用此技術(shù)。
跟蹤技術(shù)
(1)單目標(biāo)跟蹤技術(shù):單目標(biāo)跟蹤本質(zhì)上就是定義、提取目標(biāo)特征,并預(yù)測最新待選區(qū)域及目標(biāo)特征,進(jìn)而通過尋找匹配極值來鎖定目標(biāo)的過程。目標(biāo)特征可以選用像素值,Blob幾何特征,像素分布特征(直方圖、HOG等),目標(biāo)的預(yù)測、更新過程可以靠Kalman濾波、粒子濾波等過程來驅(qū)動。尋找最佳匹配可以通過Camshift,甚至窮盡搜索等方法。(2)多目標(biāo)跟蹤技術(shù):簡單地使用“貪婪”匹配就可以完成大多數(shù)運動物體的跟蹤。但是有時候會出現(xiàn)多個物體和多個Blobs匹配的情況。這時候要按照全局優(yōu)化的原則來完成多對多的匹配。(3)云臺相機的跟蹤技術(shù):云臺相機跟蹤最大的難度來源于運動物體的縮放以及模型的更新。 即使是同一物體,在鏡頭拉近拉遠(yuǎn)情況下物體的形態(tài)、顏色等特征有很大的差別。容易造成在縮放過程中丟失對運動物體的跟蹤。在物體大小基本保持不變的情況下,現(xiàn)在有Camshift,HOG等較為有效的跟蹤手段。(4)計數(shù):計數(shù)的技術(shù)基礎(chǔ)是跟蹤。難度主要來源于較為擁擠情況下,尤其是對Blob融合、分割需要考慮周全。
模式識別技術(shù)
(1)目標(biāo)分類技術(shù):主要是識別運動物體是人、人群、自行車(助力車)、汽車還是噪聲等種類。典型的手段是通過訓(xùn)練對目標(biāo)種類形成一些模型定義,然后將新發(fā)現(xiàn)的運動物體與模型比對。通用的方法有支持向量機、決策樹、神經(jīng)網(wǎng)絡(luò)等。當(dāng)然在上述常見的種類之外,用戶可以指定某種特殊物體,如渣土車等,在完成專門訓(xùn)練后就可以進(jìn)行有針對性的檢測。
(2)行為識別技術(shù):主要是識別打架、奔跑、跌倒、徘徊、哨兵離崗等簡單異常行為。 也可能是收銀員的異常操作等較為復(fù)雜的行為。主要算法可以是非常有針對性的特定行為的檢測;也可以較為通用的方法,如隱形馬爾科夫過程等。(3) 車牌識別、集裝箱號識別:由于實際應(yīng)用時間較長,這類技術(shù)相對于上述技術(shù)而言更成熟些。通常采用決策樹、神經(jīng)網(wǎng)絡(luò)或者組合技術(shù)。
應(yīng)用力求突破
在平安城市建設(shè)的推動下,安防視頻監(jiān)控應(yīng)用日趨普及。隨著智能化技術(shù)的普及使用,市場漸漸不再滿足于現(xiàn)有的智能視頻分析技術(shù)種類,而是尋求更新的算法、更豐富的業(yè)務(wù)應(yīng)用、更整體化的系統(tǒng)應(yīng)用,力求實現(xiàn)在應(yīng)用的廣度、深度上的突破。為此,安防行業(yè)已經(jīng)開始進(jìn)行對新一代智能視頻分析技術(shù)的研究,提出了一些新的產(chǎn)品形態(tài)、新的應(yīng)用模式、新的系統(tǒng)架構(gòu)。這些新技術(shù)、新產(chǎn)品正在逐漸與市場結(jié)合,探求新的發(fā)展空間。
一些廠家將一些簡單的功能,如跨線、區(qū)域入侵、人臉檢測等算法直接嵌入到芯片中,從而降低相關(guān)產(chǎn)品的開發(fā)門檻,進(jìn)而推動智能視頻分析的分布式應(yīng)用,對網(wǎng)絡(luò)帶寬占用、視頻存儲空間的降低等方面均會有一定的改觀。
面臨問題
目前來看,雖然近年智能視頻分析技術(shù)迅速發(fā)展,應(yīng)用范圍也在不斷擴展,市場上已經(jīng)有了網(wǎng)絡(luò)監(jiān)控的各種產(chǎn)品,如網(wǎng)絡(luò)攝像機、網(wǎng)絡(luò)矩陣等,但由于這些產(chǎn)品的質(zhì)量還有待提高,圖像看起來有明顯的延遲、跳動、不夠清晰等缺陷,由于硬件本身性能不夠穩(wěn)定,易出現(xiàn)死機、重啟、誤漏報等問題。而智能視頻分析本身算法的局限,在理想環(huán)境下才可實現(xiàn)其全部功能,所以在實際應(yīng)用中,只能初步實現(xiàn)較簡單的功能。目前智能視頻分析主要面臨以下幾個方面問題:
第一是技術(shù)層面:室外夜間光照不足、惡劣天氣、圖像壓縮處理、網(wǎng)絡(luò)傳輸鏈路帶寬受限等因素造成圖像質(zhì)量下降,給安防智能視頻分析帶來先天困難;目標(biāo)與背景相似或背景雜亂等導(dǎo)致目標(biāo)分割以及特征信息提取困難;針對復(fù)雜異常行為、事件建模困難,相應(yīng)的智能分析算法識別性能不高。上述因素容易造成虛假報警、漏報警、跟蹤困難等不良后果,制約了智能視頻分析應(yīng)用系統(tǒng)實戰(zhàn)性能的提升。
第二是產(chǎn)業(yè)層面:主要的困惑還是客戶對智能視頻分析產(chǎn)品的過高期望與該技術(shù)的性能表現(xiàn)易受使用條件的限制。由于用戶對智能分析這類產(chǎn)品接觸不多,對這類產(chǎn)品的效果有疑問。而有的廠家為了能夠吸引客戶進(jìn)行夸大宣傳,結(jié)果實際使用效果與宣傳效果不符,使得這些客戶對智能視頻分析產(chǎn)品再無好感。廠商對產(chǎn)品大部分用戶沒有認(rèn)真梳理應(yīng)用需求;產(chǎn)品研發(fā)部門缺乏對安防行業(yè)的深入理解,導(dǎo)致智能視頻分析產(chǎn)品功能千遍一律,缺乏針對性。再者,缺少權(quán)威的標(biāo)準(zhǔn)認(rèn)證體系,導(dǎo)致用戶對產(chǎn)品的性能無法有效把控。
第三是市場層面:目前很多智能視頻分析產(chǎn)品多是自主研發(fā),而這類企業(yè)就需要攤薄早期的開發(fā)成本。因此,這類產(chǎn)品在定價方面可能要高于一般客戶的承受能力,這也就決定了智能分析產(chǎn)品尤其是行為分析產(chǎn)品只能在監(jiān)獄、高檔小區(qū)或者機關(guān)重地等具有嚴(yán)格、精準(zhǔn)監(jiān)控需求的地方。
只有開展基礎(chǔ)、共性的關(guān)鍵技術(shù)攻關(guān),為突破智能視頻分析深度應(yīng)用創(chuàng)造條件;做好典型項目的示范作用,引導(dǎo)用戶從管理流程上重視智能視頻分析提供的信息;深化行業(yè)的智能應(yīng)用,建立“研發(fā)+集成商+行業(yè)用戶”的合作機制,為研發(fā)和應(yīng)用提供一個互動平臺;加快制定標(biāo)準(zhǔn)和規(guī)范,提高智能視頻分析產(chǎn)品性能鑒定的權(quán)威性和可操作性,才能為智能視頻分析應(yīng)用推廣“保駕護航”,智能視頻分析也才能在更多行業(yè)、領(lǐng)域得到應(yīng)用。
智能視頻分析作為一項仍在不斷發(fā)展與完善的新技術(shù),如果企業(yè)不能迅速建立自己獨具特色的核心競爭力和核心產(chǎn)品,想要取得市場的話語權(quán)和持續(xù)性的發(fā)展不是一件容易的事情。目前智能視頻分析技術(shù)仍處于成長階段,最大的挑戰(zhàn)其實還是來自于技術(shù),這是一個需要能夠靜下來專心研究做產(chǎn)品和價值的行業(yè),作為產(chǎn)業(yè)鏈底層的技術(shù)供應(yīng)商,最終還是需要靠產(chǎn)品說話。作為視頻監(jiān)控未來發(fā)展的必然方向,智能化雖然現(xiàn)在還存在一些問題,但隨著計算機技術(shù)以及智能技術(shù)的發(fā)展,這些問題都會得到很好的解決,智能化視頻技術(shù)將得到更為廣泛的應(yīng)用。