從技術(shù)方面來(lái)說(shuō),圖像信息的自動(dòng)解釋關(guān)系圖像系統(tǒng)最核心的問(wèn)題——圖像信息的利用水平??梢哉f(shuō):圖像信息的自動(dòng)解釋是監(jiān)控系統(tǒng)智能化標(biāo)志,是現(xiàn)代視頻監(jiān)控的基本特征。
圖像信息的自動(dòng)解釋有兩個(gè)基本途徑:一是圖像識(shí)別,主要利用圖像信息的空間分辨能力,實(shí)現(xiàn)個(gè)體的身份認(rèn)證;二是圖像內(nèi)容分析、主要是利用圖像信息的時(shí)間分辨能力,理解圖像,進(jìn)行目標(biāo)行為的分析。
圖像識(shí)別
主要是指通過(guò)對(duì)一幀圖像中指定目標(biāo)的特征識(shí)別,實(shí)現(xiàn)個(gè)體身份認(rèn)證,典型的實(shí)例是人臉識(shí)別。研究證明,人的行為也是一種生物特征,如步態(tài),眼部動(dòng)作等。對(duì)人步態(tài)的分析可以用于個(gè)體的識(shí)別,但它是通過(guò)對(duì)一段圖像序列的識(shí)別來(lái)進(jìn)行個(gè)體身份的認(rèn)證。無(wú)論什么方式,圖像識(shí)別都有要求兩個(gè)基本條件,一是定義特征、一是建立一定數(shù)量的樣本數(shù)據(jù)庫(kù)。定義特征,選擇具有唯一性和相對(duì)穩(wěn)定的特征來(lái)表示個(gè)體,如用人臉上的標(biāo)志點(diǎn)來(lái)形成特征矢量。樣本數(shù)據(jù)庫(kù),按特征的定義采集一定數(shù)量(根據(jù)應(yīng)用)的樣本特征,建立樣本庫(kù)。
圖像識(shí)別的基本工作方法是:將現(xiàn)場(chǎng)采集的目標(biāo)特征數(shù)據(jù)與樣本庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì)。這就這要求現(xiàn)場(chǎng)采集的特征數(shù)據(jù)和樣本庫(kù)數(shù)據(jù)具有相關(guān)(可比)性,因此、必須建立一個(gè)適當(dāng)限制的應(yīng)用環(huán)境,才能保證系統(tǒng)正常的工作。
個(gè)體身份認(rèn)證是安全系統(tǒng)最迫切的要求,近年來(lái)、有了大量的成果,也有了初步的應(yīng)用,主要有兩種方式:第一是驗(yàn)證,識(shí)別監(jiān)控目標(biāo),確認(rèn)目標(biāo)的身份及正在發(fā)生行為的合法性。是安防系統(tǒng)的功能和典型應(yīng)用;第二則是識(shí)別,將現(xiàn)場(chǎng)采集的特征與樣本庫(kù)進(jìn)行比對(duì),確定目標(biāo)的身份,以發(fā)現(xiàn)事件的相關(guān)線索。是偵察工作的典型應(yīng)用。系統(tǒng)要建立海量的樣本數(shù)據(jù)庫(kù)。通常的視頻監(jiān)控系統(tǒng)達(dá)不到上述應(yīng)用的環(huán)境條件。
圖像識(shí)別系統(tǒng)包括:圖像輸入、圖像的預(yù)處理、特征的提取和圖像的解釋(識(shí)別)等技術(shù)環(huán)節(jié)和設(shè)備。其關(guān)鍵技術(shù)或難點(diǎn)在于實(shí)現(xiàn)系統(tǒng)能在一種適當(dāng)控制的環(huán)境下,針對(duì)移動(dòng)目標(biāo)實(shí)時(shí)地運(yùn)行,這些目標(biāo)通過(guò)靜止攝像機(jī)可能會(huì)產(chǎn)生大小不同、角度不同及光照效果不同的圖像。并在各種可能的非最佳條件下進(jìn)行識(shí)別,如由于年齡、面部表情、配飾(眼鏡、帽子)及可能的偽裝(化妝)造成圖像的差異。就要求系統(tǒng)采用適當(dāng)?shù)膱D像輸入方法和預(yù)處理技術(shù),以保證圖像特征有效地提取,樣本的生成和數(shù)據(jù)庫(kù)的建立。
圖像識(shí)別的方法基本上分為統(tǒng)計(jì)方法和結(jié)構(gòu)分析兩類(lèi),前者是以數(shù)學(xué)決策理論為基礎(chǔ),建立統(tǒng)計(jì)學(xué)的識(shí)別模型,指紋、掌形的識(shí)別多采用這種方法,其特點(diǎn)是穩(wěn)定、但很少利用圖像本身的結(jié)構(gòu)關(guān)系。后者則主要是分析圖像的結(jié)構(gòu),它充分地發(fā)揮了圖像的特點(diǎn),但容易受圖像生成過(guò)程中噪聲干擾的影響。
[nextpage]
圖像內(nèi)容分析
由于通常的監(jiān)控系統(tǒng)不適合于進(jìn)行圖像識(shí)別,監(jiān)控系統(tǒng)的智能化就必須尋找新的途徑。圖像內(nèi)容分析就成了智能監(jiān)控的切入點(diǎn)。圖像內(nèi)容分析,自主的定義(簡(jiǎn)單)特征、不與原始輸入相對(duì)比;通過(guò)目標(biāo)狀態(tài)和行為的分析,理解圖像內(nèi)容(判斷正常/不正常、預(yù)測(cè)趨勢(shì));通過(guò)圖像關(guān)聯(lián),實(shí)現(xiàn)目標(biāo)的識(shí)別。
圖像內(nèi)容分析分為兩個(gè)層次:首先是視頻探測(cè),視頻探測(cè)在模擬電視技術(shù)中就已得到了應(yīng)用。在一幅上開(kāi)圖像一個(gè)窗口,檢測(cè)其亮度電平的變化,就可以實(shí)現(xiàn)探測(cè)。通過(guò)一系列窗口的監(jiān)測(cè)其亮度電平的變化,就可以實(shí)現(xiàn)運(yùn)動(dòng)探測(cè)。但它不是真正的視頻探測(cè),因?yàn)樗荒艽_定目標(biāo)。在數(shù)字視頻基礎(chǔ)上,首先確認(rèn)圖像中的探測(cè)目標(biāo),然后再進(jìn)行其行為的分析,判斷出圖像中是否出現(xiàn)了“不正?!鼻闆r,及時(shí)發(fā)出報(bào)警。是真正的視頻探測(cè),它可準(zhǔn)確地判斷事件,實(shí)現(xiàn)真實(shí)探測(cè)。視頻探測(cè)還非常適于空間的多維探測(cè)和多參數(shù)探測(cè),同時(shí)地處理來(lái)自不同方位攝像設(shè)備的圖像信號(hào),可以作到對(duì)目標(biāo)多方位的監(jiān)控,實(shí)現(xiàn)對(duì)特定空間和目標(biāo)的完全封閉;其次是視頻語(yǔ)義解釋?zhuān)ㄟ^(guò)閱讀一段圖像,理解圖像的內(nèi)容(視頻語(yǔ)義)并把它表達(dá)出來(lái),它描述的不是圖像本身,而是圖像的結(jié)構(gòu)及表現(xiàn)的內(nèi)容、情節(jié),既視頻語(yǔ)義。根據(jù)語(yǔ)義可以對(duì)圖像信息進(jìn)行標(biāo)引,在記錄圖像的同時(shí),生成鏡像的標(biāo)引文件,然后可以通過(guò)標(biāo)引文件對(duì)存貯信息進(jìn)行快速和準(zhǔn)確的檢索;進(jìn)而實(shí)現(xiàn)圖像信息間的關(guān)聯(lián),圖像信息與聲音、圖形、文本信息之間的關(guān)聯(lián),這是圖像信息深化應(yīng)用的前提。
圖像內(nèi)容分析研究的過(guò)程分四個(gè)階段,產(chǎn)品和應(yīng)用也分四個(gè)層面;第一是將(運(yùn)動(dòng))目標(biāo)從視頻圖像中分離出來(lái)。并能在簡(jiǎn)單環(huán)境下(單目標(biāo)、背景單純)對(duì)目標(biāo)分類(lèi);第二是在簡(jiǎn)單環(huán)境下對(duì)目標(biāo)進(jìn)行行為分析,判定其運(yùn)動(dòng)的方向、方式、目標(biāo)的復(fù)合或離散,發(fā)現(xiàn)和告警異常的行為;產(chǎn)生目標(biāo)的運(yùn)動(dòng)軌跡,并能進(jìn)行目標(biāo)的自動(dòng)跟蹤;進(jìn)行目標(biāo)的統(tǒng)計(jì)、關(guān)聯(lián)、過(guò)濾、趨勢(shì)預(yù)測(cè)等。第三是在復(fù)雜環(huán)境(既通常的視頻監(jiān)控環(huán)境)下實(shí)現(xiàn)上述功能,并實(shí)現(xiàn)(單源、多源)圖像的關(guān)聯(lián);第四是實(shí)現(xiàn)視頻語(yǔ)義的解析,通過(guò)對(duì)一個(gè)圖像序列的理解,做出視頻語(yǔ)義解釋。目前已有了一些成果,但尚不具實(shí)用性。其中第三個(gè)階段是技術(shù)實(shí)用性的關(guān)鍵,達(dá)到了這一點(diǎn),系統(tǒng)才具有應(yīng)用價(jià)值,目前大多數(shù)產(chǎn)品還達(dá)不到這一階段。
視頻的語(yǔ)義解釋是內(nèi)容分析的最高境界,它表明機(jī)器具有了與人一樣的理解圖像的能力,但具有人所不能達(dá)到的效率,目前還達(dá)不到這個(gè)程度。關(guān)于圖像結(jié)構(gòu)和內(nèi)容的描述還需要目視解釋的幫助。前三階段的工作可稱(chēng)為視頻的半語(yǔ)義解釋。主要是判斷圖像中是否出現(xiàn)了不正常的情況,還不能準(zhǔn)確、充分地理解圖像內(nèi)容。