視頻分析(video analyzing)是用計(jì)算機(jī)從視頻中通過運(yùn)算和分析,提取視頻中有用信息的一項(xiàng)技術(shù)。對(duì)計(jì)算機(jī)來說,視頻圖像只是一個(gè)數(shù)據(jù)數(shù)列,一個(gè)包含每一幀每一個(gè)像素點(diǎn)的灰度值或彩色值的數(shù)列,其目標(biāo)信息包含在那些像素點(diǎn)的值所組成的平面圖像序列中,是需要從“整體”上進(jìn)行“理解”才能獲得的。而視頻分析技術(shù)便是通過特定的核心算法程序提取視頻信號(hào)中所包含的內(nèi)容信息或個(gè)體運(yùn)動(dòng)信息,以實(shí)現(xiàn)計(jì)算機(jī)對(duì)于視頻的理解—— “明白”視頻中所展現(xiàn)的內(nèi)容或者發(fā)生的的事情,即“事件”。
視頻分析技術(shù)范圍很廣,只要是從視頻中通過運(yùn)算處理,提取有用信息的方式都可稱作視頻分析技術(shù)。目前發(fā)展相對(duì)成熟并形成產(chǎn)品投入實(shí)際項(xiàng)目應(yīng)用的技術(shù),如車牌識(shí)別技術(shù)、視頻檢索技術(shù)、視頻人臉檢測(cè)等,皆可歸為“視頻分析技術(shù)”。嚴(yán)格來講,這類技術(shù)原本只是視頻分析技術(shù)中較為粗淺的一部分,不過由于它們已被較好地挖掘和應(yīng)用,出現(xiàn)一些專門的稱謂,才被單獨(dú)提了出來。當(dāng)前,通常所說的視頻分析技術(shù)一般特指從視頻中目標(biāo)運(yùn)動(dòng)行為的分析、提取和識(shí)別,它常用于安防監(jiān)控領(lǐng)域,其所指稱的范圍比之字面含義已有大幅縮小。
視頻分析技術(shù)運(yùn)作流程是:首先使得計(jì)算機(jī)知道視頻中“發(fā)生的是什么事”,再將其與對(duì)應(yīng)的規(guī)則相比對(duì)和判斷,由此計(jì)算機(jī)即可斷定事件的特性。從視頻中個(gè)體運(yùn)動(dòng)行為的分析、提取和識(shí)別角度來看,即令計(jì)算機(jī)判斷出這些個(gè)體進(jìn)行了一些什么行為,進(jìn)而能夠判斷這些行為是否符合某些規(guī)則,是否屬于“某一類型”的行為。一旦出現(xiàn)的行為或事件不符合相應(yīng)的規(guī)則,即刻發(fā)出告警信息,從而擺脫人工的干預(yù)和判斷,實(shí)現(xiàn)令計(jì)算機(jī)“代替”人進(jìn)行監(jiān)控,也即實(shí)現(xiàn)了自動(dòng)監(jiān)控或“智能監(jiān)控”。
實(shí)際上,智能視頻分析技術(shù),起源于計(jì)算機(jī)視覺技術(shù)。計(jì)算機(jī)視覺(ComputerVision)技術(shù),是人工智能(ArtificialIntelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關(guān)系,從而能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內(nèi)容。計(jì)算機(jī)視覺技術(shù)可分為低層視覺技術(shù)(Low-level Vision)與高層視覺技術(shù)(High-level Vision)。低層視覺技術(shù)要解決特征提取、運(yùn)動(dòng)檢測(cè)、多目標(biāo)根蹤等基本問題;高層視覺技術(shù)要解決對(duì)場(chǎng)景的語義理解,如目標(biāo)運(yùn)動(dòng)軌跡的判別,異常行為異常事件的最終結(jié)論等。因此,在計(jì)算機(jī)視覺領(lǐng)域中,一個(gè)最根本的問題就是如何從底層原始視頻數(shù)據(jù)得到高層的語義理解,而智能視頻監(jiān)控技術(shù)中的智能視頻分析技術(shù)的研究正是緊緊圍繞這個(gè)基本問題,其研究范圍不是僅局限于某個(gè)特定問題,而是涉及到計(jì)算機(jī)視覺中從底層到高層的許多基本問題。
智能視頻監(jiān)控技術(shù)主要是對(duì)視頻自動(dòng)進(jìn)行分析,從視頻中提取關(guān)鍵信息,發(fā)現(xiàn)與識(shí)別異常的感興趣事件,從而可以替代人為監(jiān)控或者協(xié)助人為監(jiān)控。顯然,視頻分析與識(shí)別涉及到復(fù)雜的軟件算法,它可以通過編程識(shí)別出奇怪與異常的行為。視頻內(nèi)容分析與識(shí)別軟件能通過分析現(xiàn)場(chǎng)或記錄的視頻流,檢測(cè)識(shí)別出可疑的活動(dòng)、事件或者行為模式。視頻監(jiān)控系統(tǒng)的智能化是指在不需要人為干預(yù)的情況下,系統(tǒng)能自動(dòng)實(shí)現(xiàn)對(duì)監(jiān)控畫面中的異常情況進(jìn)行檢測(cè)、識(shí)別,并及時(shí)作出預(yù)/報(bào)警。
視頻分析技術(shù)通常采用背景減除技術(shù)來進(jìn)行圖像變化的檢測(cè)(如入侵、丟包、逆行等都是一種模式的圖像變化),即對(duì)視頻幀與基準(zhǔn)背景圖像進(jìn)行比較,相同位置的像素(區(qū)域)變化則認(rèn)為是變化了的區(qū)域,對(duì)這些區(qū)域進(jìn)一步處理、識(shí)別、跟蹤,得到包括目標(biāo)位置、尺寸、形狀、速度、停留時(shí)間等基本形態(tài)信息和動(dòng)態(tài)信息,完成目標(biāo)的跟蹤和行為理解之后,也就完成了圖像與圖像描述之間的映射關(guān)系,從而使系統(tǒng)進(jìn)一步進(jìn)行規(guī)則判定,直到觸發(fā)報(bào)警。
目前,普遍使用的運(yùn)動(dòng)目標(biāo)檢測(cè)方法就是背景減除法,其算法雖較簡(jiǎn)單,但仍然會(huì)受到光線、天氣等自然條件及背景自身變化(海浪、云影、樹葉搖動(dòng)等情況)的影響。針對(duì)不同的天氣以及自然干擾,已應(yīng)用有多種附加算法(過濾器)來彌補(bǔ)這些干擾。隨著光電圖像處理技木及微電子技術(shù)的發(fā)展,相信智能視頻分析技術(shù)會(huì)進(jìn)一步成熟。
從廣義上來說,也可以把智能視頻分析技術(shù)分為如下三類。
視頻分析類
該類主要是在監(jiān)控圖像中找出目標(biāo),并檢測(cè)目標(biāo)的運(yùn)動(dòng)特征屬性。如目標(biāo)相對(duì)的像素點(diǎn)位置,目標(biāo)的移動(dòng)方向及相對(duì)像素點(diǎn)移動(dòng)速度,目標(biāo)本身在畫面中的形狀及其改變。根據(jù)以上的基本功能,視頻分析可分為以下幾個(gè)功能模塊。
· 周界入侵檢測(cè)、目標(biāo)移動(dòng)方向檢測(cè);
· 目標(biāo)運(yùn)動(dòng)、停止?fàn)顟B(tài)改變檢測(cè);
· 目標(biāo)出現(xiàn)與消失檢測(cè);
· 人流量、車流量統(tǒng)計(jì);
· PTZ自動(dòng)追蹤系統(tǒng);
· 系統(tǒng)智能自檢功能等。
視頻識(shí)別類
該類包括人臉識(shí)別、步態(tài)識(shí)別與車牌識(shí)別,其主要技術(shù)是在視頻圖像中找出局部中一些畫面的共性。如人臉必然有兩個(gè)眼睛,如果可以找到雙目的位置,那么就可以定性人臉的位置及尺寸(在現(xiàn)有技術(shù)條件下,人臉識(shí)別系統(tǒng)必須在雙目可視的情況下,才可進(jìn)行人臉比對(duì))。視頻識(shí)別類其主要包括。
· 人臉識(shí)別系統(tǒng);
· 步態(tài)識(shí)別系統(tǒng);
· 車牌識(shí)別系統(tǒng);
· 照片比對(duì)系統(tǒng);
· 工業(yè)自動(dòng)化上的零件識(shí)別即機(jī)器視覺系統(tǒng)等。
視頻改善類
該類主要是針對(duì)一些不可視、模糊不清,或者是對(duì)振動(dòng)的圖像進(jìn)行部分優(yōu)化處理,以增加視頻的可監(jiān)控性能。具體包括。
· 紅外夜視圖像增強(qiáng)處理;
· 車牌識(shí)別影像消模糊處理;
· 光變與陰影抑制處理;
· 潮汐與物體尺寸過濾處理;
· 視頻圖像穩(wěn)定系統(tǒng)等。