AVS-S標準的推出,盡管有利于民族安防產業(yè)的發(fā)展,但其并不占據(jù)市場主流,為了讓AVS在當前更好地得到推廣應用,采用轉碼技術,可以使得其更好地與市場主流編碼標準互聯(lián)互通。
在AVS工作組天津會議上,視頻專題組率先完成了完整的AVS-S視頻編碼標準,這是全球范圍內首個針對視頻監(jiān)控需求制定的視頻編碼標準。在該標準制定過程中,一共有16項視頻提案被采納,分別涉及背景幀技術、靈活條帶集技術、核心幀技術、非參考P幀技術、改進的運動矢量縮放、場景模式編碼技術、受限的DC預測模式以及高層語法設計等多個方面。正是這些新的編碼工具的加入,才使得AVS-S標準功能更加全面,特色鮮明,能夠滿足當前視頻監(jiān)控的應用需求及未來發(fā)展的需要。
基于歷史原因,監(jiān)控市場仍以廣泛使用的國際音視頻編碼標準,如H.263、MPEG-2、MPEG-4、MPEG-4 AVC(簡稱AVC,也稱JVT、H.264)等為主流,其核心技術專利和知識產權都被歐美等國、日本的少數(shù)公司和科研院所壟斷。對于中國的安防產業(yè)來說,知識產權與專利收費問題的壓力將不斷增加,由此對企業(yè)生產經營的負面影響也將日趨突出。在核心標準上受制于人將極大地阻礙我國安防產業(yè)的持續(xù)健康發(fā)展。
在安防監(jiān)控中采用AVS標準在某種程度上解決了民族安防產業(yè)健康、穩(wěn)步發(fā)展的后顧之憂,是建設“和諧社會”和保障國家公共安全的長遠之計。但AVS占據(jù)主流還需要一個發(fā)展過程,在此期間,采用轉碼技術,實現(xiàn)AVS同國際音視頻編碼標準的互聯(lián)互通,具有重要的現(xiàn)實意義。
視頻轉碼應用背景
近年來隨著平安城市工程建設的推進,全國各地通過有限的經濟投入完成城市安防監(jiān)控體系的更新改造,取得了重要的進展,但同時由于各行業(yè)、各部門分塊建設,目前的視頻監(jiān)控系統(tǒng)存在著信源、信道、終端等多種異構性,對視頻監(jiān)控資源的高效融合提出了嚴峻挑戰(zhàn),具體主要包括以下方面:
·信源的異構性:在視頻監(jiān)控領域目前存在多種信源編碼格式,包括MPEG-4、H.263、H.264、AVS等,這些不同的編碼格式適用于不同的應用場景,例如MPEG-4適用于交互式對象編碼、流媒體應用,是面向對象的編碼標準;H.263適用于極低碼率的應用場景,因此,如何適應信源編碼格式的異構性是當前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn);
·信道的異構性:在視頻監(jiān)控領域目前存在多種傳輸信道,包括ISDN、xDSL、GPRS、CDMA等,其中與有線信道相比,無線信道的帶寬較低,通常只有幾十Kbps,誤碼率則較高,可以達到10-3~10-5,而且不同的無線信道具有不同的帶寬和誤碼率,因此,如何適應信道帶寬和誤碼率的異構性是當前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn);
·終端的異構性:在視頻監(jiān)控領域目前存在多種終端設備,不同的終端如PC、掌上電腦、手機等具有不同的計算能力和顯示能力,如MOTOROLA A780型號手機最大僅支持播放320×240、15f/s的視頻,因此,如何適應終端計算和顯示能力的異構性是當前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn)。
上述視頻監(jiān)控系統(tǒng)中存在的信源、信道、終端等多種異構性,使得各視頻監(jiān)控系統(tǒng)中的海量視頻資源難以高效融合,無法保障監(jiān)控系統(tǒng)跨行業(yè)、跨區(qū)域的互聯(lián)互通、共享共用。因此,如何突破異構網絡環(huán)境下信源、信道、終端之間差異造成的互聯(lián)、互通、協(xié)同工作的技術瓶頸,實現(xiàn)各類監(jiān)控報警系統(tǒng)海量音視頻資源之間的融合,成為當前視頻監(jiān)控系統(tǒng)亟待解決的關鍵問題。而近年來逐漸成為研究熱點的視頻轉碼技術正是解決這一問題的有效途徑。[nextpage]
視頻轉碼概述
視頻轉碼是一種將已壓縮的視頻數(shù)據(jù)從一種格式轉換為另一種格式的技術,其中視頻數(shù)據(jù)的格式參數(shù)包括信源格式、分辨率、碼率等。相應地,轉碼也主要分為:信源格式、降碼率、降分辨率等多種轉碼。
在異構網絡環(huán)境下,通過視頻轉碼技術進行格式轉換是保障監(jiān)控視頻整合和共享的有效手段(如圖1所示)。具體而言,視頻轉碼在異構網絡環(huán)境下視頻監(jiān)控系統(tǒng)中的應用方式主要包括以下幾種:
·信源格式轉碼:信源格式轉碼能夠通過不同信源格式之間的語法映射,將壓縮視頻從原始信源壓縮格式轉換為目標信源壓縮格式,從而適應視頻監(jiān)控系統(tǒng)信源格式的異構性;
·降碼率轉碼:降碼率轉碼能夠通過對壓縮視頻數(shù)據(jù)進行二次量化,將其從較高的原始碼率轉換為較低的目標碼率,從而適應視頻監(jiān)控系統(tǒng)信道帶寬的異構性;
·降分辨率轉碼:降分辨率轉碼能夠通過空間下采樣和跳幀,將壓縮視頻數(shù)據(jù)由較高的空間和時間分辨率轉換為較低的空間和時間分辨率,以適應視頻監(jiān)控系統(tǒng)終端計算和顯示能力的異構性。對于視頻轉碼,最簡單的方案就是全解全編,即解碼器將輸入碼流完全解碼成原始視頻序列,編碼器再將這個視頻序列編碼為目標格式。但是這種方案沒有利用轉碼輸入視頻流的信息,轉碼效率很低。因此,如何基于轉碼前后視頻流的相關性,在已知輸入視頻流特征信息的條件下盡量提高輸出視頻流的轉碼效率,是視頻轉碼的核心問題。
目前基于信息重用的視頻轉碼方案可以大致分為四種:像素域閉環(huán)方案、開環(huán)方案、頻率域閉環(huán)方案、快速頻率域閉環(huán)方案:
·像素域閉環(huán)方案:同全解全編方案類似,不同的是能夠重用原始碼流中的宏塊模式和運動矢量信息,因此不需要或者只需要部分進行運動估計和模式選擇,從而顯著提高了轉碼速度;
·開環(huán)方案:直接在壓縮域(DCT域)上進行轉碼,因而轉碼的速度最快,但是,因為在轉碼過程中會產生漂移誤差,因此開環(huán)結構的轉碼器在轉碼后視頻質量有較大的損失;
·頻率域閉環(huán)方案:與開環(huán)方案相比,頻率域閉環(huán)方案在編碼部分引入了閉合回路來消除漂移誤差的影響,能夠獲得較好的視頻質量;與像素域閉環(huán)方案相比,頻率域閉環(huán)方案避免了變換和反變換的計算,能夠獲得較低的計算復雜度;
·快速頻率域閉環(huán)方案:在頻率域閉環(huán)方案的基礎上進一步省略了一次頻域運動補償計算,從而能夠獲得更低的計算復雜度,同時還可以節(jié)省一半運動補償所需要的幀緩存空間。[nextpage]
視頻轉碼實現(xiàn)
在綜合評估現(xiàn)有各類視頻編碼標準性能和城市監(jiān)控聯(lián)網的現(xiàn)實條件和需求的基礎上,具體而言,AVS為公安監(jiān)控網上的信源編碼標準具有以下優(yōu)勢:AVS代表了先進的視頻編碼技術,其編碼效率為MPEG-2的2倍以上,與AVC/H.264處于同一水平,可見,AVS已經步入國際視頻壓縮的先進水平行列;實現(xiàn)復雜度低,經大致估算,AVS解碼復雜度相當于AVC/H.264的30%,編碼復雜度為AVC/H.264的70%,易于軟硬件的實現(xiàn);能夠保證信息安全,AVS的專利技術大多由我國自主持有,相關產品無需依賴國外進口,可以從源頭上杜絕盜竊、濫用和泄漏國家機密的可能。同時,AVS專利授權模式簡單,專利費用低廉(遵循1元人民幣的原則)。
MPEG-4 SP(Simple Profile)主要針對低復雜度、低比特率的視頻通信應用,目前MPEG-4 SP是視頻監(jiān)控網上目前使用最為廣泛的編碼標準。如上所述,AVS有望在今后成為視頻監(jiān)控領域的主導編碼標準,但其大規(guī)?;瘧蒙行钑r日,故構建高效MPEG-4到AVS轉碼器可以緩解目前AVS視頻碼流緊缺的壓力,實現(xiàn)AVS標準的平穩(wěn)過渡。針對公安視頻監(jiān)控網對資源整合的需求,我們將參照下面的要求構建MPEG-4到AVS轉碼器:
·充分利用城市范圍內現(xiàn)有的各類圖像資源,通過開發(fā)多功能轉碼器將分布在城市各處的具有不同圖像編碼格式、不同接入帶寬的圖像監(jiān)控系統(tǒng)連接起來;
·轉碼器能夠支持主流的視頻編碼格式標準及監(jiān)控網上通用的圖像尺寸;
·轉碼系統(tǒng)可以根據(jù)網絡帶寬實現(xiàn)對輸出圖像碼率的控制;
·轉碼后的圖像質量損失??;
·出于安全性考慮,對監(jiān)控圖像的訪問和瀏覽必須是實時的,從而要求轉碼器轉碼速度不得低于25fps。
在上文中,筆者介紹了常見的幾種轉碼方案,在表1中則列舉各自的優(yōu)點與缺陷以便明確它們的最合適應用場景。
如表1所示,不同的轉碼方案在技術性能方面各有優(yōu)缺點?;谛枨鬀Q定系統(tǒng)結構的原則,下文對照AVS轉碼器的性能需求逐步找到我們最需要的系統(tǒng)結構。
在表2中,筆者逐項對應轉碼器的性能需求給出了最佳的轉碼器參考結構。通過分析可以發(fā)現(xiàn),中選次數(shù)最多的參考轉碼器是重解重編方案和頻域閉環(huán)方案。再次對兩者進行比較,轉碼速度似乎成為頻域閉環(huán)方案優(yōu)于重解重編方案的唯一理由。但這“唯一的優(yōu)點”似乎也有限制:MPEG-4使用8×8DCT,AVS使用8×8類DCT整數(shù)變換,故基于變換域的編碼操作(MC、幀內預測、圖像降采樣等)并不能直接實施,需要首先完成MPEG-4 DCT系數(shù)到AVS整數(shù)變換系數(shù)的映射,這勢必延長頻域閉環(huán)方案轉碼時間;DCT-MC的快速實現(xiàn)與輸入圖像特征有關,當圖像區(qū)域運動劇烈時,DCT系數(shù)矩陣稀疏程度并不高,故會大大增加矩陣元素運算的次數(shù),這也會延長頻域閉環(huán)方案轉碼時間。[nextpage]
基于上述分析,我們采用基于像素域閉環(huán)方案的快速轉碼器體系,其主要特征包括:
·對輸入MPEG-4碼流完全解碼,以得到各類編碼信息用于后續(xù)AVS編碼;
·在進行AVS編碼前,根據(jù)轉碼應用需求,進行相應的跳幀處理和空域降采樣濾波,并且遵循時間域處理在前、空間域處理在后的原則;
·與時間域/空間域圖像處理相伴隨,根據(jù)解碼得到的編碼信息合成候選運動向量并決定輸出宏塊的候選編碼模式;
·對輸入視頻流進行AVS編碼,在候選運動向量、宏塊編碼模式之上,進行小范圍的運動信息修正和精化,并隨之完成編碼過程。
視頻轉碼測試結果
在本部分內容中,筆者將展示上述轉碼方案的實際測試性能表現(xiàn)。由于篇幅限制,筆者僅披露部分樣本序列的測試結果,包括Akiyo、Mother and Daughter(簡稱Mother)、Foreman、Mobile、Tempete和Flower,其分辨率都為CIF(352×288)。同時考慮到碼率算法對系統(tǒng)性能的影響,我們將所有測試序列以384kbps的碼率編碼為MPEG-4碼流后,使用固定量化參數(shù)(QP=36)轉碼為AVS碼流,同樣的設置也應用于對比實驗中。此處對比的對象為重解重編方案,其編碼模塊基于參考軟件RM5.2c。圖2為轉碼前后圖像視覺效果對比圖。
從圖2中可以看出,轉碼前后主觀圖像質量并無顯著下降。在轉碼效率方面,由于采用了多項快速轉碼策略,使得與級聯(lián)型轉碼器相比,AVS編碼時間不及前者的10%,在多路并行轉碼應用中,完全能夠滿足實時轉碼需求。然而,由于并未在轉碼系統(tǒng)中進行完備的基于率失真模型的宏塊模式選擇,另外復用的運動向量精度欠佳,故與重解重編方案相比,客觀圖像質量與前者相比相差0.5dB-1.5dB。