AVS-S標(biāo)準(zhǔn)是武漢大學(xué)國家多媒體軟件工程技術(shù)研究中心率先面向安防監(jiān)控制定的數(shù)字音視頻編解碼標(biāo)準(zhǔn)。AVS-S標(biāo)準(zhǔn)的順利出臺,將使我國安防產(chǎn)業(yè)擺脫沒有自主核心產(chǎn)權(quán)標(biāo)準(zhǔn)的尷尬局面,為產(chǎn)業(yè)發(fā)展帶來新的契機。那么,AVS-S標(biāo)準(zhǔn)具有哪些技術(shù)特色?目前標(biāo)準(zhǔn)進展如何?未來又該如何實現(xiàn)產(chǎn)業(yè)化發(fā)展?
AVS-S標(biāo)準(zhǔn)化歷程
視頻信號壓縮技術(shù)是數(shù)字化安防最為基礎(chǔ)的技術(shù),它是安防產(chǎn)業(yè)向數(shù)字化、網(wǎng)絡(luò)化邁進的前提。安防產(chǎn)業(yè)經(jīng)過多年發(fā)展,人們注意到,不同于傳統(tǒng)的數(shù)字媒體產(chǎn)業(yè),安防監(jiān)控業(yè)務(wù)對視頻編碼存在一些特殊要求,這些需求包括:支持感興趣區(qū)域的高質(zhì)量編碼,支持變化環(huán)境的優(yōu)化編碼,能適應(yīng)多種網(wǎng)絡(luò)情況,支持通過專網(wǎng)、互聯(lián)網(wǎng)、無線網(wǎng)絡(luò)等傳輸,支持位置信息等輔助信息疊加,面向存儲的優(yōu)化編碼等等。
當(dāng)前安防產(chǎn)業(yè)仍然沿用ITU或MPEG組織的標(biāo)準(zhǔn),由于這些標(biāo)準(zhǔn)制定時沒有考慮上述需求,在利用它們開發(fā)安防產(chǎn)品時,并不能達到最佳性能。同時,我國安防產(chǎn)業(yè)從2000年不到100億的產(chǎn)業(yè)規(guī)模高速發(fā)展到2008年近1800億的產(chǎn)業(yè)規(guī)模,已成為國民經(jīng)濟的支柱產(chǎn)業(yè)之一,為了擺脫國外的專利風(fēng)險,為安防產(chǎn)業(yè)的長期健康發(fā)展提供保障,制定滿足安防監(jiān)控應(yīng)用的編碼標(biāo)準(zhǔn)迫在眉睫。
在這一背景下,作為我國多媒體安防監(jiān)控領(lǐng)域的重要科研基地,武漢大學(xué)國家多媒體軟件工程技術(shù)研究中心率先倡議制定面向安防監(jiān)控的數(shù)字音視頻編解碼標(biāo)準(zhǔn)。在2007年6月AVS哈爾濱會議上,武漢大學(xué)團隊聯(lián)合公安部一所提出了面向視頻監(jiān)控的AVS標(biāo)準(zhǔn)(簡稱AVS-S)完整的技術(shù)需求,從視頻編碼、音頻編碼、系統(tǒng)安全等方面定義了安防監(jiān)控業(yè)務(wù)中的音視頻技術(shù)規(guī)格,AVS組織正式啟動了AVS-S技術(shù)方案的征集和評估工作。
AVS-S標(biāo)準(zhǔn)是AVS接下來兩年中的一項主要工作內(nèi)容。在2008年9月的AVS工作組天津會議上,視頻專題組率先完成了完整的AVS-S視頻編碼標(biāo)準(zhǔn),這是全球范圍內(nèi)首個針對視頻監(jiān)控需求制定的視頻編碼標(biāo)準(zhǔn)。2009年3月在杭州舉行的AVS標(biāo)準(zhǔn)工作組第28次會議翻開了歷史新篇,其最鮮明的特色是走國際化道路,在本次會議上,AVS-S的標(biāo)準(zhǔn)文本最終確定下來,并將其定為AVS的伸展檔次,同時例行進入90天的內(nèi)部審閱期。AVS-S音頻部分工作啟動稍晚些,目前還處于WD文件起草階段。
AVS組織專門為安防監(jiān)控業(yè)務(wù)量身定制標(biāo)準(zhǔn),這一工作在世界上屬于首創(chuàng),具有非同尋常的意義,相關(guān)工作引起了國際同行的重視,AVS工作組正與MPEG國際標(biāo)準(zhǔn)化組織協(xié)商,以視頻標(biāo)準(zhǔn)的伸展檔為基礎(chǔ),制訂國際安防監(jiān)控音視頻壓縮與處理標(biāo)準(zhǔn)MPEG-S,這將進一步推動國際安防監(jiān)控行業(yè)標(biāo)準(zhǔn)化進程和技術(shù)進步。應(yīng)MPEG組織的邀請,在今年4月召開的第88次MPEG大會上,中國代表團正式提交了MPEG-S的需求草案。
AVS-S的順利出臺,將使我國安防產(chǎn)業(yè)擺脫沒有自主核心產(chǎn)權(quán)標(biāo)準(zhǔn)的尷尬局面,為產(chǎn)業(yè)發(fā)展帶來新的契機。采用AVS-S對普通DVR、DVS等前端監(jiān)控產(chǎn)品升級后,將使壓縮碼流具備更好的可伸縮性,滿足了在不同帶寬傳輸能力的異構(gòu)網(wǎng)絡(luò)上傳遞監(jiān)控圖像的要求,同時也便于手機、大屏幕電視墻等不同顯示分辨率的監(jiān)控終端融合到統(tǒng)一的監(jiān)控平臺中。在3G移動通信蓬勃發(fā)展的今天,AVS-S標(biāo)準(zhǔn)必將促進以手機視頻監(jiān)控為代表的移動監(jiān)控業(yè)務(wù)的廣泛應(yīng)用。
AVS-S的技術(shù)特色
在AVS-S視頻標(biāo)準(zhǔn)制定過程中,一共有16項視頻提案被采納,分別涉及感興趣區(qū)域(ROI)編碼技術(shù)、背景幀技術(shù)、靈活條帶集技術(shù)、核心幀技術(shù)、非參考P幀技術(shù)、改進的運動矢量縮放、場景模式編碼技術(shù)、受限的DC預(yù)測模式等多個方面。其中,ROI、背景幀技術(shù)和場景模式編碼技術(shù)最富特色,下面就三者簡單介紹。[nextpage]
ROI編碼
重點目標(biāo)和特殊區(qū)域的圖像清晰度是安防業(yè)務(wù)對監(jiān)控視頻最重要的技術(shù)需求,AVS-S采取ROI編碼技術(shù)來滿足這一要求。與傳統(tǒng)的無差異性編碼不同,感興趣區(qū)域算法將監(jiān)控圖像根據(jù)重要性劃分為不同的區(qū)域,不同區(qū)域采用不同的壓縮策略,將有限的資源分配給車牌、人面部等權(quán)重高的重點區(qū)域,以此保證監(jiān)控錄像滿足公安的交管、刑偵等業(yè)務(wù)對高效視頻壓縮技術(shù)的實際需求(如圖1)。AVS-S中的ROI技術(shù)主要由武漢大學(xué)提供,這也是ROI技術(shù)首次被AVS標(biāo)準(zhǔn)采納。
需要提出的是,目前對象分割算法的復(fù)雜度是非常高的,精細準(zhǔn)確的分割對象很難實際應(yīng)用。所以,針對視頻監(jiān)控的特殊需求,往往只考慮對目標(biāo)物體所在的區(qū)域進行區(qū)分。在許多的監(jiān)控應(yīng)用領(lǐng)域,如對銀行ATM機的監(jiān)控、小區(qū)門口的監(jiān)控等等,主要監(jiān)控區(qū)域是固定的,可以在壓縮標(biāo)準(zhǔn)中提供交互接口,預(yù)先設(shè)定需要高清編碼的區(qū)域。
背景幀
在視頻監(jiān)控應(yīng)用中,監(jiān)控圖像的內(nèi)容一般不會發(fā)生太大的變化,因此可以將監(jiān)控場景的背景圖作為長期參考幀,保存在編碼器和解碼器中,以提升視頻編碼的編碼效率。背景幀技術(shù)就是根據(jù)監(jiān)控圖像的這個特點,在編碼過程中,引入背景幀和背景預(yù)測幀兩種新的幀類型,并且背景預(yù)測幀只能參考背景幀,編碼過程可以用背景預(yù)測幀替代原有的I幀,進而提升編碼效率。
場景模式編碼技術(shù)
場景模式編碼技術(shù)則考慮如何讓視頻編碼器更好地適應(yīng)監(jiān)控場景的多樣性。在視頻監(jiān)控應(yīng)用中,使用監(jiān)控攝像的應(yīng)用場景多種多樣,例如,室內(nèi)監(jiān)控,室外監(jiān)控,紅外監(jiān)控等。即使是同一監(jiān)控場景,因為環(huán)境光照變化,拍攝的監(jiān)控序列特性變化也比較顯著,存在白天、夜晚、陰雨天、雨雪天等不同氣候條件。這些監(jiān)控的應(yīng)用場合變化或環(huán)境光照的變化對視頻編碼器的編碼性能影響比較大,使用同一種編碼方法對這些不同場景的序列進行編碼將導(dǎo)致視頻編碼器的編碼效率下降。
針對這種情況,AVS-S采納了場景模式編碼技術(shù),將輸入圖像序列按照不同場景,分成不同的場景序列進行編碼。將確定的場景模式及其場景特征參數(shù)輸入到視頻編碼器中,并將場景模式和模式參數(shù)編碼后輸入到編碼碼流中。圖2給出了通過場景模式及場景模式參數(shù)來控制縮放、量化編碼過程。[nextpage]
經(jīng)初步的性能測試結(jié)果表明,AVS-S的編碼性能達到了和H.264相當(dāng)?shù)乃?。在背景相對靜止(攝像頭不動)的典型監(jiān)控序列上,AVS-S比H.264有明顯的性能提高,并且AVS-S抗誤碼能力出色,具有可分級功能,支持感興趣區(qū)域編碼,能夠滿足安防監(jiān)控的特殊需求。
AVS產(chǎn)品化之路
基于歷史原因,監(jiān)控市場仍以廣泛使用的國際音視頻編碼標(biāo)準(zhǔn),如H.263、MPEG-2、MPEG-4、MPEG-4 AVC(簡稱AVC,也稱JVT、H.264)等為主流,其核心技術(shù)專利和知識產(chǎn)權(quán)都被日本、歐美等國的少數(shù)公司和科研院所壟斷。對于中國的安防產(chǎn)業(yè)來說,知識產(chǎn)權(quán)與專利收費問題的壓力將不斷增加,由此對企業(yè)生產(chǎn)經(jīng)營的負(fù)面影響也將日趨突出。在核心標(biāo)準(zhǔn)上受制于人將極大地阻礙我國安防產(chǎn)業(yè)的健康持續(xù)發(fā)展。
AVS產(chǎn)業(yè)化的最佳模式是設(shè)計高性能DSP芯片加AVS編碼算法,便于廠家快速設(shè)計和開發(fā)產(chǎn)品,而避開復(fù)雜的AVS算法。這種模式具有軟件算法靈活可調(diào)的優(yōu)點,方便擴充算法功能。該硬件方案采用模塊化設(shè)計,根據(jù)功能的不同主要有音視頻編解碼模塊、音視頻信號數(shù)模變換模塊、外部存儲模塊(DDR2存儲器、NOR Flash、NAND Flash、硬盤、SD卡等)、CPLD邏輯控制模塊、10/100M自適應(yīng)以太網(wǎng)通信模塊、USB接口模塊、紅外遙控模塊、鍵盤控制模塊、云臺控制模塊、GPS定位模塊、CF無線網(wǎng)卡模塊、串口(包括RS232和RS485)、電源管理模塊和總線擴展槽等模塊組成。該模式不僅能同時滿足視頻應(yīng)用對運算能力和控制功能的要求,而且大大簡化了系統(tǒng)設(shè)計的復(fù)雜性。
在我國,大部分監(jiān)控設(shè)備廠商尚不具備AVS編碼算法的研發(fā)能力的現(xiàn)狀下,該模式很好的滿足了現(xiàn)在嵌入式視頻應(yīng)用領(lǐng)域?qū)μ幚砥餍酒囊?,很有可能成為今后視頻應(yīng)用處理器芯片的主流解決方案。
視頻監(jiān)控系統(tǒng)中存在的信源、信道、終端等多種異構(gòu)性,使得各視頻監(jiān)控系統(tǒng)中的海量視頻資源難以高效融合,無法保障監(jiān)控系統(tǒng)跨行業(yè)跨區(qū)域的互聯(lián)互通、共享共用。因此如何突破異構(gòu)網(wǎng)絡(luò)環(huán)境下信源、信道、終端之間差異造成的互聯(lián)、互通、協(xié)同工作的技術(shù)瓶頸,實現(xiàn)各類監(jiān)控報警系統(tǒng)海量音視頻資源之間的融合,成為當(dāng)前視頻監(jiān)控系統(tǒng)亟待解決的關(guān)鍵問題。具體主要包括以下方面。[nextpage]
(1)信源的異構(gòu)性:在視頻監(jiān)控領(lǐng)域目前存在多種信源編碼格式,包括MPEG-4、H.263、H.264、AVS等。這些不同的編碼格式適用于不同的應(yīng)用場景,例如MPEG-4適用于交互式對象編碼、流媒體應(yīng)用,是面向?qū)ο蟮木幋a標(biāo)準(zhǔn);H.263適用于極低碼率的應(yīng)用場景。因此,如何適應(yīng)信源編碼格式的異構(gòu)性是當(dāng)前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn)。
(2)信道的異構(gòu)性:在視頻監(jiān)控領(lǐng)域目前存在多種傳輸信道,包括ISDN、xDSL、GPRS、CDMA等。其中與有線信道相比,無線信道的帶寬較低,通常只有幾十Kbps,誤碼率則較高,可以達到10-3-10-5。而且不同的無線信道具有不同的帶寬和誤碼率。因此如何適應(yīng)信道帶寬和誤碼率的異構(gòu)性是當(dāng)前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn)。
(3)終端的異構(gòu)性:在視頻監(jiān)控領(lǐng)域目前存在多種終端設(shè)備,不同的終端如PC、掌上電腦、手機等具有不同的計算能力和顯示能力。如MOTOROLA A780型號手機最大僅支持播放320×240、15f/s的視頻。因此,如何適應(yīng)終端計算和顯示能力的異構(gòu)性是當(dāng)前視頻監(jiān)控系統(tǒng)的一個挑戰(zhàn)。
上述視頻監(jiān)控系統(tǒng)中存在的信源、信道、終端等多種異構(gòu)性,使得各視頻監(jiān)控系統(tǒng)中的海量視頻資源難以高效融合,無法保障監(jiān)控系統(tǒng)跨行業(yè)跨區(qū)域的互聯(lián)互通、共享共用。因此如何突破異構(gòu)網(wǎng)絡(luò)環(huán)境下信源、信道、終端之間差異造成的互聯(lián)、互通、協(xié)同工作的技術(shù)瓶頸,實現(xiàn)各類監(jiān)控報警系統(tǒng)海量音視頻資源之間的融合,成為當(dāng)前視頻監(jiān)控系統(tǒng)亟待解決的關(guān)鍵問題。而近年來逐漸成為研究熱點的視頻轉(zhuǎn)碼技術(shù)正是解決這一問題的有效途徑。
視頻轉(zhuǎn)碼是一種將已壓縮的視頻數(shù)據(jù)從一種格式轉(zhuǎn)換為另一種格式的技術(shù)。其中視頻數(shù)據(jù)的格式參數(shù)包括信源格式、分辨率、碼率等。相應(yīng)地轉(zhuǎn)碼也主要分為:信源格式、降碼率、降分辨率等多種轉(zhuǎn)碼。
在異構(gòu)網(wǎng)絡(luò)環(huán)境下,通過視頻轉(zhuǎn)碼技術(shù)進行格式轉(zhuǎn)換是保障監(jiān)控視頻整合和共享的有效手段,如圖3所示。
對于視頻轉(zhuǎn)碼,最簡單的方案就是全解全編:解碼器將輸入碼流完全解碼成原始視頻序列,編碼器再將這個視頻序列編碼為目標(biāo)格式。但是這種方案沒有利用轉(zhuǎn)碼輸入視頻流的信息,因此轉(zhuǎn)碼效率很低。因此如何基于轉(zhuǎn)碼前后視頻流的相關(guān)性,在已知輸入視頻流特征信息的條件下盡量提高輸出視頻流的轉(zhuǎn)碼效率,是視頻轉(zhuǎn)碼的核心問題。目前基于信息重用的視頻轉(zhuǎn)碼方案可以大致分為四種:像素域閉環(huán)方案、開環(huán)方案、頻率域閉環(huán)方案、快速頻率域閉環(huán)方案。
AVS有望在今后成為視頻監(jiān)控領(lǐng)域的主導(dǎo)編碼標(biāo)準(zhǔn),但其大規(guī)模應(yīng)用尚需時日,故構(gòu)建高效MPEG-4到AVS轉(zhuǎn)碼器可以緩解目前AVS視頻碼流緊缺的壓力,實現(xiàn)AVS標(biāo)準(zhǔn)的平穩(wěn)過渡。[nextpage]
·充分利用城市范圍內(nèi)現(xiàn)有的各類圖像資源,通過開發(fā)多功能轉(zhuǎn)碼器將分布在城市各處的具有不同圖像編碼格式、不同接入帶寬的圖像監(jiān)控系統(tǒng)連接起來;
·轉(zhuǎn)碼器能夠支持主流的視頻編碼格式標(biāo)準(zhǔn)及監(jiān)控網(wǎng)上通用的圖像尺寸;
·轉(zhuǎn)碼系統(tǒng)可以根據(jù)網(wǎng)絡(luò)帶寬實現(xiàn)對輸出圖像碼率的控制;
·轉(zhuǎn)碼后的圖像質(zhì)量損失??;
·出于安全性考慮,對監(jiān)控圖像的訪問和瀏覽必須是實時的,從而要求轉(zhuǎn)碼器轉(zhuǎn)碼速度不得低于25fps。
產(chǎn)品化關(guān)鍵點之思考
AVS編碼效率的研究,是AVS編碼器達到實用的關(guān)鍵所在。下面分別給出這幾方面的應(yīng)用技術(shù)方案。
AVS視頻編碼算法的編碼效率優(yōu)化
考慮與現(xiàn)有的視頻編碼標(biāo)準(zhǔn)兼容互通問題,此無線視頻編碼框架中的碼流結(jié)構(gòu)和語法采用AVS標(biāo)準(zhǔn),保證在低碼率下編碼性能優(yōu)越且計算量小,保留那些對編碼貢獻較高的編碼工具和選項,獲得最經(jīng)濟的編碼方案,具體如下:
·幀內(nèi)預(yù)測:通過鄰塊中已解碼的相鄰像素對4x4小塊進行預(yù)測,其中亮度采用5種預(yù)測模式,為DC預(yù)測、水平、垂直、右下對角和左下方向的空間預(yù)測,色度采用4種預(yù)測模式,為DC、水平、垂直和PLANE預(yù)測;
·幀間預(yù)測:采用多種塊模式組合的運動補償,塊模式大小為16x16、16x8、8x16、8x8;運動向量的精度為1/4像素;參考幀為1~2幀;預(yù)測時塊匹配標(biāo)準(zhǔn)采用SAD公式計算;
·整數(shù)變換:采用4x4大小的整數(shù)變換,變換系數(shù)為1、2基,變換與量化同AVS;
·熵編碼:CAVLC編碼,同AVS標(biāo)準(zhǔn);
·環(huán)濾波:按塊模式分類的不同強度的去塊濾波器,參考AVS標(biāo)準(zhǔn)中的定義。
AVS視頻編碼算法在DSP上的運算效率優(yōu)化
無線通信設(shè)備大多為電池供電的手持設(shè)備,通信耗電最小一直都是移動通信的基本要求。在多媒體通信中,手持設(shè)備的功耗主要包括通信能耗和計算能耗兩個方面,因此其計算能力遠不及固定設(shè)備。同時,移動設(shè)備的成本限制制約了其存儲空間和顯示能力,在此環(huán)境下的無線視頻應(yīng)用,編解碼計算量和內(nèi)存要求必須適合當(dāng)前移動設(shè)備設(shè)計和制造水平。為減少計算量,必須在保證大致相同編碼質(zhì)量和效率的前提下提出可替代的快速算法,并在高效實現(xiàn)過程中考慮內(nèi)存占用問題。
因此,以效率優(yōu)化為主要研究目標(biāo)。擬采取如下綜合優(yōu)化手段:代碼優(yōu)化、關(guān)鍵算法的優(yōu)化、數(shù)據(jù)結(jié)構(gòu)優(yōu)化、程序流程的優(yōu)化、編譯參數(shù)優(yōu)化、結(jié)合體系結(jié)構(gòu)的優(yōu)化。每種優(yōu)化策略都緊密結(jié)合處理器的硬件體系結(jié)構(gòu)展開。
面向低功耗的快速模式選擇算法
在混合編碼框架下,支持多編碼模式編碼。如果利用Rate-Distortion Optimal工具來優(yōu)化,會將所有編碼模式全部循環(huán)一遍,會帶來計算復(fù)雜度的巨大增加,使功耗上升。在編碼效率和計算復(fù)雜度間進行平衡,需要對當(dāng)前塊的編碼模式進行有效的估計。
AVS-S的所有可能的編碼模式分為三個層次,如圖4所示:[nextpage]
第一個層次將所有的預(yù)測模式按照去除冗余信息的類型分成兩個類別,幀內(nèi)預(yù)測(Intra prediction)和幀間預(yù)測(Inter prediction),這個層次的模式選擇下文統(tǒng)稱為Intra/Inter模式選擇。第二個層次是根據(jù)預(yù)測模式塊的大小進一步分類,其中幀內(nèi)模式又可以分成Intra16×16、Intra8×8、兩種大小,這三個類別之間的選擇下文統(tǒng)稱為Intra預(yù)測塊大小選擇;幀間預(yù)測模式可以分為16×16、16×8、8×16、8×8四種塊大小。第三個層次是按照幀內(nèi)預(yù)測的方向進一步細分,每一個不同的方向為一個Intra預(yù)測模式,這個層次的選擇稱為Intra模式選擇。
AVS視頻編解碼算法的魯棒性能優(yōu)化
互聯(lián)網(wǎng)或3G無線網(wǎng)絡(luò)丟包、誤碼、延遲問題突出,帶來對差錯敏感的壓縮視頻還原質(zhì)量嚴(yán)重退化,而實時視頻傳輸對時延敏感,出錯數(shù)據(jù)不可能重傳。因此,需要在視頻編解碼算法中實施容錯技術(shù)來減輕傳輸過程中的差錯干擾。
抗錯性視頻編碼工具是研究得最早也是研究成果最多領(lǐng)域,其研究成果已經(jīng)被H.263+、H.263++、MPEG-4、H.264等視頻壓縮協(xié)議廣泛采用。它通過修改標(biāo)準(zhǔn)壓縮算法的語法或語義結(jié)構(gòu)來增加一定的冗余信息,達到在出錯情況下解碼器更快地重同步或使錯誤隱藏效果更好的目的,因而非常有效。但是,H.264等標(biāo)準(zhǔn)中采用的容錯工具只是定義了語法和語義,并沒有定義具體的實現(xiàn)算法(類似運動估計這類開放的問題),所以,研究計算效率高、容錯性能優(yōu)異的控制算法是容錯編碼工具在應(yīng)用中需要解決的迫切問題。
容錯編碼技術(shù)通過添加冗余信息增強信道傳輸?shù)聂敯粜?,但卻犧牲了編碼效率,幀內(nèi)編碼可以有效阻止差錯擴散,但是編碼效率不高,必須解決信源編碼效率和信道傳輸魯棒性之間的矛盾,在優(yōu)化端到端的總體失真度的基礎(chǔ)上進行編碼模式的合理選擇。
為抑制錯誤的幀間擴散,通過解碼器的反饋,編碼器自適應(yīng)地插入幀內(nèi)宏塊。在視頻編碼中插入一定數(shù)量的幀內(nèi)模式的宏塊或I幀可以有效地控制視頻編碼中的錯誤擴散。但是過多地插入幀內(nèi)模式的宏塊和I幀會導(dǎo)至編碼效率的下降,產(chǎn)生端到端的時延??梢钥闯?,如果要求視頻編碼提高出錯抑制性能、增強魯棒性,就必然會降低視頻編碼的效率,傳輸數(shù)據(jù)增加,產(chǎn)生時延。為此必須利用端到端的RD模式優(yōu)化,使編碼效率和容錯效果達到最佳平衡,最終在網(wǎng)絡(luò)接收端得到最佳的視頻質(zhì)量,從而優(yōu)化網(wǎng)絡(luò)視頻通信系統(tǒng)的性能。
視頻信源編碼器在做運動估計、編碼模式判決和碼率控制時都是基于率失真模型的,傳統(tǒng)的率失真模型只是考慮信源編碼失真,沒有考慮信道傳輸?shù)氖д妫ㄈ缯`碼、丟包),因此,將這個模型直接應(yīng)用于容錯視頻編碼會產(chǎn)生較大的模型失真。所以,需要建立一個面向IP分組丟失信道的率失真估計模型,該模型能準(zhǔn)確表示信道統(tǒng)計和瞬時特性,并能將預(yù)估結(jié)果提供給編碼和傳輸層算法使用。
綜合AVS視頻編碼方案的魯棒性和實時性的考慮,采用如下差錯控制編碼解碼技術(shù):基于編碼器的差錯彈性編碼、基于解碼器的錯誤掩蓋、編解碼交互的差錯控制。(本文由國家多媒體軟件工程技術(shù)研究中心胡瑞敏、張晉東、王中元提供)