安防視頻監(jiān)控從上世紀90年代至今,獲得了快速發(fā)展。隨著IP技術(shù)在視頻監(jiān)控領(lǐng)域的大規(guī)模應(yīng)用,視頻監(jiān)控規(guī)模從幾十路發(fā)展到成千上萬路。在此背景下,如何有效提高視頻監(jiān)控的應(yīng)用效率成為視頻監(jiān)控建設(shè)的重要問題。因此,智能視頻監(jiān)控成為視頻監(jiān)控建設(shè)的發(fā)展方向。
在以往的視頻監(jiān)控項目中,智能視頻分析技術(shù)得到越來越多的應(yīng)用。但是真正成功的應(yīng)用確非常少,即使在一些相對應(yīng)用成功的案例中,智能視頻分析往往只是作為補充手段,而且以拌線、禁區(qū)等簡單算法居多。例如卡口應(yīng)用中,也只是作為感應(yīng)線圈的后備技術(shù),在感應(yīng)線圈故障的時候采用拌線識別抓拍車牌。
出現(xiàn)這種呼聲與實際嚴重差距的原因,主要總結(jié)為兩點:準確率和成本。這兩者相互依賴,密不可分。
就準確率來說,目前智能分析算法的誤報率和漏報率顯然是無法令人滿意的。這主要有幾個原因,首先在我看來目前國內(nèi)很少有真正屬于視頻監(jiān)控自身的視頻分析算法。目前使用的大部分算法都是按照實驗室單純環(huán)境總結(jié)圖像規(guī)律而來的。然而安防視頻監(jiān)控主要是面向保護人和財產(chǎn)的,所以視頻來源主要是路口、廣場、建筑物出入口、通道等相對復雜的環(huán)境。這些環(huán)境往往圖像變化率大,受燈光環(huán)境干擾多。以人臉識別為例,目前的主流算法對人臉圖像有非常嚴格的要求,取景各個角度、距離、瞳孔之間的像素都要在一個很小的范圍內(nèi),反之則無法識別。
怎么解決準確率的問題,關(guān)鍵是樣本,智能分析算法的本質(zhì)是比對,和樣本的比對。由于視頻監(jiān)控的環(huán)境復雜性,導致很難得到具有統(tǒng)一規(guī)律的樣本。不同應(yīng)用場景,具有不同的樣本規(guī)則。所以要解決準確率,智能分析算法就要具備自我學習,樣本自我采集的能力。在不同的場景中,智能分析出現(xiàn)誤報漏報,操作員對智能分析服務(wù)器反饋誤報漏報數(shù)據(jù),搜集特殊樣本,從而幫助智能分析服務(wù)器在以后的相似場景下,能計算準確分析結(jié)果。
另外阻礙智能分析發(fā)展的就是成本。雖然目前有很多廠商的編碼器、攝像機帶有簡單的智能分析,但是目前大部分相對復雜的智能分析還是以單獨服務(wù)器分析的方式應(yīng)用。服務(wù)器收取到視頻流,還原為YUV、RGB等數(shù)據(jù)再做樣本比對,然后再編碼輸出。所以一臺服務(wù)器要解碼、分析、再編碼,性能成為很大的瓶頸。
導致這種情況的原因是視頻分析算法從九十年代末至今,實際并沒有算法上的根本進步,發(fā)展的只是運算能力的提高,也就是計算機技術(shù)的發(fā)展。同樣以車牌識別為例,國內(nèi)大部分廠商還是在別人的算法基礎(chǔ)上不停的優(yōu)化。在基礎(chǔ)沒有得到優(yōu)化的情況下,外圍的優(yōu)化只能說效果了了。
對于計算性能和算法性能一定的情況下,視頻監(jiān)控產(chǎn)品是否還能有效提高智能分析的效率?答案是一定的,軟件架構(gòu)。我認為,云和格的思想在軟件架構(gòu)的應(yīng)用可以有效的提高智能分析的效率,降低成本。云是這兩年最火的概念,核心思想是共享,格是前幾年在網(wǎng)絡(luò)領(lǐng)域得到發(fā)展,核心思想是協(xié)同計算。視頻智能分析主要是計算圖像的變化量和對比度,很多數(shù)據(jù)要在前端、服務(wù)器和客戶端反復計算,導致了計算量的浪費,試想如果把前端編碼計算變化量共享給智能分析服務(wù)器,數(shù)據(jù)對比的計算量由服務(wù)器和多個客戶端協(xié)同計算,就能大大降低服務(wù)器的計算量,從而大大提高智能分析的效率,降低智能分析應(yīng)用的成本。
我相信,在有效技術(shù)手段下,提高智能分析準確率,降低建設(shè)成本,智能視頻分析一定能在視頻監(jiān)控領(lǐng)域得到快速的應(yīng)用和發(fā)展。