2017年3月,“人工智能”首次寫進(jìn)政府工作報(bào)告,多只人工智能概念股在兩會(huì)期間也表現(xiàn)搶眼。安防領(lǐng)域主要是以視頻為核心數(shù)據(jù),通過視頻的直觀展現(xiàn)實(shí)現(xiàn)安防實(shí)際需求,隨著安防領(lǐng)域視頻的逐步增多,已經(jīng)無法通過人眼進(jìn)行實(shí)時(shí)瀏覽和監(jiān)看,此時(shí)通過對(duì)非結(jié)構(gòu)化視頻數(shù)據(jù)的結(jié)構(gòu)化描述,達(dá)到快速定位視頻興趣區(qū)域,快速檢索查找的目的,實(shí)現(xiàn)類似人類大腦一樣的數(shù)據(jù)分析與信息碰撞,形成安防領(lǐng)域的行業(yè)數(shù)據(jù)應(yīng)用。所有這些將會(huì)極大提升視頻安防領(lǐng)域應(yīng)用前景,為人工智能在安防領(lǐng)域拓展多種機(jī)遇。
安防是人工智能最具市場(chǎng)空間的應(yīng)用領(lǐng)域
視頻是安防領(lǐng)域內(nèi)應(yīng)用最多的數(shù)據(jù),而視頻結(jié)構(gòu)化描述又是人工智能最直接的表達(dá)方式,隨著國家對(duì)維穩(wěn)的重視,視頻結(jié)構(gòu)化描述面臨爆發(fā)的增長模式,因此人工智能在安防領(lǐng)域最具市場(chǎng)空間。
安防領(lǐng)域的人工智能主要集中在人、車、行為的分析識(shí)別上,不同的目標(biāo)有著不同的識(shí)別算法。對(duì)于人的人工智能主要包括人臉識(shí)別和行人識(shí)別,人臉識(shí)別特征,如性別、年齡、民族、眼鏡、笑容以及人臉特征數(shù)據(jù),行人識(shí)別特征,如背包、挎包、拉桿箱、裙子、帽子、傘、頭發(fā)、圍巾等。當(dāng)前的安防領(lǐng)域人臉的應(yīng)用,對(duì)于定點(diǎn)的,按照人臉抓取要求條件安裝的攝像機(jī)可實(shí)現(xiàn)落地應(yīng)用,對(duì)于通用的安防類攝像機(jī),其應(yīng)用水平將大打折扣,不適合落地。
而對(duì)于行人特征識(shí)別受到攝像機(jī)分辨率、光線以及角度的影響,在當(dāng)下的技術(shù)水平尚無法實(shí)現(xiàn)高精度的人體識(shí)別。車輛特征化比較成熟,在卡口/微卡口系統(tǒng)中基本做到落地實(shí)用,但是在治安攝像機(jī),其精準(zhǔn)度受到光線和角度的影響,精準(zhǔn)度快速下降,無法達(dá)到落地實(shí)用。異常行為,如絆線、區(qū)域、遺留等可實(shí)現(xiàn)落地使用,其他如徘徊、聚集、火焰等需在特定場(chǎng)景下才可落地實(shí)用,通用場(chǎng)景尚無法落地實(shí)用。
深度學(xué)習(xí)與高效計(jì)算奠定技術(shù)基礎(chǔ)
目前支持人工智能在安防領(lǐng)域內(nèi)得以落地的關(guān)鍵技術(shù)就是深度學(xué)習(xí)與高效計(jì)算。眾所周知,由于深度學(xué)習(xí)的出現(xiàn)使得人臉識(shí)別技術(shù)得到突飛猛進(jìn)的發(fā)展,由原來的實(shí)驗(yàn)室階段一躍成為現(xiàn)場(chǎng)可使用的技術(shù),但是深度學(xué)習(xí)帶來的另外一個(gè)負(fù)面效應(yīng)就是超大計(jì)算量。由于傳統(tǒng)的CPU不適合并行的圖像運(yùn)算,使得人臉的解決方案面臨高昂的代價(jià),而GPU(或TPU)等高密度計(jì)算的出現(xiàn)極大地緩解了深度學(xué)習(xí)對(duì)計(jì)算資源的需求,使得人工智能最終實(shí)現(xiàn)落地。
人工智能在安防領(lǐng)域面臨的挑戰(zhàn)
盡管人工智能的應(yīng)用已是大勢(shì)所趨,但就當(dāng)前的行業(yè)應(yīng)用現(xiàn)狀來看,人工智能在安防領(lǐng)域的應(yīng)用仍然存在相關(guān)技術(shù)限制,首要的挑戰(zhàn)便是技術(shù)的普適性,如光線、分辨率、環(huán)境等的影響。以人臉為例,按照人臉采集標(biāo)準(zhǔn)設(shè)立的攝像機(jī)與普通的治安攝像機(jī)在捕捉人臉的數(shù)量和質(zhì)量上存在巨大差異。其次是技術(shù)計(jì)算需求,我們知道人工智能需要大量的機(jī)器運(yùn)算,這對(duì)系統(tǒng)建設(shè)和維護(hù)都提出了較高的要求。當(dāng)前流行的CPU(i7)只能處理3-4路1080P分辨率下的人臉捕捉與特征化,如果要進(jìn)行大量的人臉采集入庫,則需要大量的計(jì)算資源。現(xiàn)在很多公司為了提高計(jì)算效率,采用GPU,但是如何保證GPU7X24不間斷穩(wěn)定運(yùn)行,仍是橫亙?cè)诟骷夜久媲暗碾y題。最后在市場(chǎng)上,人工智能當(dāng)前還處于應(yīng)用前期,這注定其處于較高的價(jià)位,如要進(jìn)行大面積應(yīng)用,必然會(huì)對(duì)其價(jià)格提出較為適宜的要求。
當(dāng)然,隨著人工智能在安防領(lǐng)域的大面積應(yīng)用,必然會(huì)催生更加適合應(yīng)用場(chǎng)景的技術(shù)創(chuàng)新,使得人工智能能夠適應(yīng)多種應(yīng)用場(chǎng)景,真正實(shí)現(xiàn)落地實(shí)用。
(本文根據(jù)北京中盛益華科技有限公司研發(fā)總監(jiān)顧長海專訪整編)