文/中安消技術(shù)有限公司
摘要:針對智能視頻監(jiān)控的三個(gè)技術(shù)挑戰(zhàn)而言,包括編碼的技術(shù)挑戰(zhàn),多攝像頭搜索的技術(shù)挑戰(zhàn),以及現(xiàn)在的圖像質(zhì)量不夠的技術(shù)挑戰(zhàn)等,目前在進(jìn)行很多的積極嘗試,但現(xiàn)有的技術(shù)水平距離智慧城市對視頻的質(zhì)量和監(jiān)控系統(tǒng)的要求,還存在一定的差距。
視頻監(jiān)控是一座城市安全的重要保障,在平安城市、數(shù)字城市,乃至智慧城市建設(shè)中起著至關(guān)重要的作用。在今年3月24日于香港召開的第二屆智慧城市與智能系統(tǒng)院士論壇上,高文院士結(jié)合監(jiān)控視頻處理技術(shù)發(fā)展歷程和存在的挑戰(zhàn),就其在監(jiān)控視頻處理技術(shù)領(lǐng)域的應(yīng)用與前景提出了前瞻性的觀點(diǎn),獲得了與會(huì)院士、專家及業(yè)內(nèi)人士的高度認(rèn)可。
第二屆智慧城市與智能系統(tǒng)院士論壇由中國工程院、香港中文大學(xué)、香港中文大學(xué)(深圳)、中國安防技術(shù)有限公司(英文簡稱CSST)成員企業(yè)智慧中國集團(tuán)(Smart China)聯(lián)合主辦。高文院士在發(fā)言中表示:在現(xiàn)有的城市管理各應(yīng)用子系統(tǒng)中,監(jiān)控視頻的數(shù)據(jù)占比相對較高,2010年約占50%,到2015年預(yù)計(jì)將接近70%,隨著大數(shù)據(jù)的大幅增長,監(jiān)控視頻的比例會(huì)逐漸減少,但預(yù)計(jì)在2020年仍有可能達(dá)到40%以上,因此視頻監(jiān)控的數(shù)據(jù)處理這一問題,必須引起足夠重視。
在巨大的市場需求推動(dòng)下,高文院士與筆者公司經(jīng)過多次交流探討,以北京大學(xué)數(shù)字視頻編解碼技術(shù)國家工程實(shí)驗(yàn)室以及筆者公司為合作主體,雙方建立戰(zhàn)略合作伙伴關(guān)系,成立“北京大學(xué)-CSST智能視頻技術(shù)協(xié)同創(chuàng)新中心”。該中心主要面向智能監(jiān)控行業(yè)的發(fā)展需要,圍繞智能視頻技術(shù)開展前瞻性的研究開發(fā)工作,同時(shí)不斷吸引國內(nèi)外頂尖專家,組建一流的研發(fā)團(tuán)隊(duì),承擔(dān)國家重大科研任務(wù),努力建成國內(nèi)一流、國際具有重要影響的研發(fā)平臺,以及具有重要國際影響的智能視頻技術(shù)研究開發(fā)領(lǐng)導(dǎo)者。
視頻監(jiān)控三大挑戰(zhàn)
在本屆論壇上,高文院士結(jié)合監(jiān)控視頻技術(shù)現(xiàn)狀提出:智能視頻監(jiān)控面臨的技術(shù)挑戰(zhàn)主要可以集中體現(xiàn)為三大挑戰(zhàn),簡要概括為“存不下”、“找不到”、“看不清”。“存不下”,即編碼壓縮的問題,“找不到”是有效搜索的問題,“看不清”則是視頻質(zhì)量問題,這三大挑戰(zhàn)對于智能視頻監(jiān)控技術(shù)提出了更高的要求。
挑戰(zhàn)一:視頻編碼技術(shù)
第一個(gè)挑戰(zhàn)是關(guān)于視頻編碼技術(shù)的挑戰(zhàn)。視頻編碼經(jīng)過一段時(shí)期的快速發(fā)展,期間已經(jīng)歷了三代技術(shù):第一代技術(shù)在1994年前后出現(xiàn);第二代技術(shù)在2003年完成,至今仍在監(jiān)控視頻領(lǐng)域普遍應(yīng)用;第三代技術(shù)在2013年初步完成,目前還暫未投入使用。按照10年一代的頻率推測,預(yù)計(jì)將在2023年出現(xiàn)第四代視頻編碼技術(shù)。
事實(shí)上,視頻編碼技術(shù)的進(jìn)步和數(shù)據(jù)增長的速度并不吻合,視頻編碼技術(shù)每十年革新一次,而與監(jiān)控有關(guān)的大數(shù)據(jù)則是每年呈幾何倍增長,依靠傳統(tǒng)技術(shù)的進(jìn)步,解決監(jiān)控?cái)?shù)據(jù)本身的增長量,顯然遠(yuǎn)遠(yuǎn)不夠。因此,需要從根本上解決視頻數(shù)據(jù)的編碼效率問題以及傳輸存儲(chǔ)等相關(guān)問題,找到對于視頻監(jiān)控?cái)?shù)據(jù)最為行之有效的壓縮方法。
視頻編碼有三個(gè)關(guān)鍵技術(shù)。其一是變換編碼技術(shù),即把實(shí)時(shí)信號放在頻率上進(jìn)行處理,使用數(shù)據(jù)工具進(jìn)行編碼壓縮;其二是預(yù)測編碼技術(shù),即把同一幀里的共同點(diǎn)與不同幀里的相同點(diǎn),通過預(yù)測找到共性的信息;其三是商業(yè)編碼技術(shù),也就是將信息商用商業(yè)編碼進(jìn)行表達(dá),提高效率。視頻編碼技術(shù)實(shí)際上是三個(gè)技術(shù)的組合,具有理論上限,目前可以達(dá)到的成果離理論上限還有非常大的空間,所以從數(shù)學(xué)上來講,這個(gè)領(lǐng)域大有可為。
變換編碼、預(yù)測編碼,商業(yè)編碼這三個(gè)數(shù)據(jù)技術(shù)工具,對于視頻編碼應(yīng)用領(lǐng)域的貢獻(xiàn)有所不同。前兩個(gè)變換,包括彩色空間和整體空間的變換,對于視頻編碼的貢獻(xiàn)率為6倍左右。在視頻編碼技術(shù)前30年的發(fā)展期間,平均每10年性能提高一倍,主要貢獻(xiàn)依靠的是預(yù)測編碼每一代的技術(shù)提升。隨著時(shí)間的推移和技術(shù)的成熟,將逐漸使用更復(fù)雜的算法取得編碼效率的提高,主要體現(xiàn)在預(yù)測編碼和商業(yè)編碼,其中預(yù)測編碼將起到很大的作用。
面向視頻監(jiān)控應(yīng)用領(lǐng)域,則需要用更好的技術(shù),即長時(shí)的、虛擬幀的參考技術(shù)。所謂長時(shí),是當(dāng)場景可以長時(shí)間使用時(shí),即通過模型計(jì)算的方法生成虛擬幀,通過使用虛擬幀提高效率。在各類視頻中,背景和前景的區(qū)分非常關(guān)鍵,靜態(tài)的背景通過虛擬幀進(jìn)行表達(dá),動(dòng)態(tài)的前景則使用精細(xì)編碼進(jìn)行表達(dá)。為了更好地確認(rèn)靜態(tài)背景,通過不斷計(jì)算得出了一項(xiàng)新技術(shù)——基幀產(chǎn)生技術(shù)。基幀產(chǎn)生技術(shù)帶來的最大的好處,是很容易進(jìn)行任意圖像序列的前景、背景的分離,前景和背景分離之后,會(huì)有效降低編碼計(jì)算的復(fù)雜度,大幅提高編碼效率和運(yùn)動(dòng)搜索效率。
挑戰(zhàn)二:有效搜索
第二個(gè)挑戰(zhàn)是有效搜索的問題。有效搜索包括以下幾個(gè)問題:一是搜索對象能否檢測到;二是檢測到的對象能否進(jìn)行跟蹤;三是不同攝像機(jī)如何切換以持續(xù)跟蹤搜索對象。其中前兩個(gè)問題是一般搜索模式必須解決的技術(shù)問題,而多攝像機(jī)的網(wǎng)絡(luò)跟蹤,包括攝像機(jī)和攝像機(jī)之間的位置、朝向、時(shí)間切換點(diǎn)等等,將這些參數(shù)很好地結(jié)合在一起,還有很多需要研究解決的技術(shù)問題。
理想的搜索和跟蹤狀態(tài),是把編碼和分析技術(shù)融合在一起,集中在一個(gè)編碼框架下,真正將視頻監(jiān)控融合到智慧城市運(yùn)營管理中。為了達(dá)到這一目標(biāo),需要在技術(shù)上形成完整的描述,制訂適合的語法,通過描述詞和語法的組合,將具體的行為、事件描述出來,包括車輛是正常行進(jìn)還是非正常行進(jìn),或人群集聚是正常行為還是非正常的行為等等,通過技術(shù)描述將其實(shí)現(xiàn)。
與此同時(shí),在多個(gè)攝像機(jī)的切換,以及整個(gè)監(jiān)測對象的轉(zhuǎn)移等技術(shù)領(lǐng)域,需要持續(xù)不斷地進(jìn)行多項(xiàng)技術(shù)實(shí)驗(yàn),最終實(shí)現(xiàn)攝像頭之間的有效切換與跟蹤。
挑戰(zhàn)三:攝像頭質(zhì)量
第三個(gè)挑戰(zhàn)是攝像頭的質(zhì)量問題。目前大多數(shù)視頻監(jiān)控的攝像頭質(zhì)量達(dá)不到要求,嚴(yán)重影響了對圖像的精確識別。提高攝像頭質(zhì)量,具有挑戰(zhàn)性的兩個(gè)問題是:攝像頭進(jìn)入方向的圖像分辨率不夠,以及圖像的清晰度不夠。造成這兩個(gè)問題的原因是各種各樣的,如光照等,而針對這兩個(gè)問題的研究從未間斷過。
提高攝像頭的分辨率,并非短期內(nèi)可以實(shí)現(xiàn)。目前監(jiān)控系統(tǒng)所使用的攝像頭大部分無法真正滿足要求,而理想的4K攝像頭數(shù)量極少,隨著時(shí)間的推移,將現(xiàn)有的攝像頭逐步替換為分辨率高的攝像頭,是必然的發(fā)展趨勢。除了硬件替換之外,另一個(gè)可行的解決辦法,是通過后臺技術(shù)彌補(bǔ)攝像頭的質(zhì)量問題,即通過不同的計(jì)算方法提高分辨率。除此之外,還有一個(gè)方法,就是把視頻流里面多個(gè)照片一起使用,實(shí)現(xiàn)分辨率的有效提升。
總而言之,針對智能視頻監(jiān)控的三個(gè)技術(shù)挑戰(zhàn)而言,包括編碼的技術(shù)挑戰(zhàn),多攝像頭搜索的技術(shù)挑戰(zhàn),以及現(xiàn)在的圖像質(zhì)量不夠的技術(shù)挑戰(zhàn)等,目前在進(jìn)行很多的積極嘗試,但現(xiàn)有的技術(shù)水平距離智慧城市對視頻的質(zhì)量和監(jiān)控系統(tǒng)的要求,還存在一定的差距。當(dāng)然,這個(gè)差距同時(shí)也預(yù)示著更多的機(jī)會(huì),在智慧城市建設(shè)領(lǐng)域,中國會(huì)在很多地方達(dá)到領(lǐng)先,而視頻監(jiān)控領(lǐng)域也將有望達(dá)到世界領(lǐng)先水平。
因此,監(jiān)控視頻處理技術(shù)在智慧城市建設(shè)中的有效應(yīng)用尤為重要。隨著智慧城市建設(shè)的廣泛推進(jìn),智慧城市視頻監(jiān)控技術(shù)將面臨著一系列的挑戰(zhàn),對于企業(yè)而言,高文院士認(rèn)為,擁有過硬的視頻監(jiān)控技術(shù)是應(yīng)對各種挑戰(zhàn)、分得智慧城市一杯羹的關(guān)鍵籌碼之一。基于此,國內(nèi)各大安防企業(yè)集團(tuán)對智慧城市中的視頻監(jiān)控技術(shù),紛紛作出了積極嘗試。
結(jié)語
憑借高度的社會(huì)責(zé)任心和使命感,筆者公司始終將智慧城市智能視頻監(jiān)控技術(shù)作為重要的研發(fā)課題,不斷在該領(lǐng)域進(jìn)行有意義的探索和嘗試,除了自主研發(fā)之外還與高文院士團(tuán)隊(duì)成立了聯(lián)合研究中心,組建一流的研發(fā)團(tuán)隊(duì),開展面向視頻監(jiān)控的前瞻性技術(shù)研究,將高文院士提出的視頻監(jiān)控處理技術(shù)與現(xiàn)有的各項(xiàng)智能技術(shù)不斷的融合,并擴(kuò)展到各種產(chǎn)品形態(tài)中,應(yīng)用在視頻監(jiān)控的各個(gè)環(huán)節(jié),形成完整的產(chǎn)業(yè)鏈配套,從產(chǎn)品、技術(shù)、解決方案、系統(tǒng)集成、運(yùn)營服務(wù)等領(lǐng)域提供一站式服務(wù),努力建成國內(nèi)一流、國際具有重要影響的研發(fā)平臺。