MPEG-7標(biāo)準(zhǔn)被稱為“多媒體內(nèi)容描述接口”,為各類多媒體信息提供一種標(biāo)準(zhǔn)化的描述,這種描述將與內(nèi)容本身有關(guān),允許快速和有效的查詢用戶感興趣的資料。它將擴(kuò)展現(xiàn)有內(nèi)容識(shí)別專用解決方案的有限的能力,特別是它還包括了更多的數(shù)據(jù)類型。換而言之,MPEG-7規(guī)定一個(gè)用于描述各種不同類型多媒體信息的描述符的標(biāo)準(zhǔn)集合。該標(biāo)準(zhǔn)于1998年10月提出,于2001年最終完成并公布。
MPEG-7的目標(biāo)是支持多種音頻和視覺(jué)的描述,包括自由文本、N維時(shí)空結(jié)構(gòu)、統(tǒng)計(jì)信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對(duì)于視覺(jué)信息,描述將包括顏色、視覺(jué)對(duì)象、紋理、草圖、形狀、體積、空間關(guān)系、運(yùn)動(dòng)及變形等。
MPEG-7的目標(biāo)是根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對(duì)信息的需求。以視覺(jué)內(nèi)容為例,較低抽象層將包括形 狀、尺寸、紋理、顏色、運(yùn)動(dòng)(軌道)和位置的描述。對(duì)于音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。最高層將給出語(yǔ)義信息:如“這是 一個(gè)場(chǎng)景:一個(gè)鴨子正躲藏在樹后并有一個(gè)汽車正在幕后通過(guò)。”抽象層與提取特征的方式有關(guān):許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據(jù)視覺(jué)描述的查詢?nèi)z索聲音數(shù)據(jù),反之也一樣。
MPEG-7的目標(biāo)是支持?jǐn)?shù)據(jù)管理的靈活性、數(shù)據(jù)資源的全球化和互操作性。
MPEG-7標(biāo)準(zhǔn)化的范圍包括:一系列的描述子(描述子是特征的表示法,一個(gè)描述子就是定義特征的語(yǔ)法和語(yǔ)義學(xué));一系列的描述結(jié)構(gòu)(詳細(xì)說(shuō)明成員之間的結(jié)構(gòu)和語(yǔ)義);一種詳細(xì)說(shuō)明描述結(jié)構(gòu)的語(yǔ)言、描述定義語(yǔ)言(DDL);一種或多種編碼描述方法。
(1)MPEG-7系統(tǒng):它保證MPEG-7描述有效傳輸和存儲(chǔ)所必須的工具,并確保內(nèi)容與描述之間進(jìn)行同步,這些工具有管理和保護(hù)的智能特性;
(2)MPEG-7描述定義語(yǔ)言:用來(lái)定義新的描述結(jié)構(gòu)的語(yǔ)言;
(3)MPEG-7音頻:只涉及音頻描述的描述子和描述結(jié)構(gòu);
(4)MPEG-7視頻:只涉及視頻描述的描述子和描述結(jié)構(gòu);
(5)MPEG-7屬性實(shí)體和多媒體描述結(jié)構(gòu);
(6)MPEG-7參考軟件:實(shí)現(xiàn)MPEG-7標(biāo)準(zhǔn)相關(guān)成分的軟件;
(7)MPEG-7一致性:測(cè)試MPEG-7執(zhí)行一致性的指導(dǎo)方針和程序。
在我們的日常生活中,日益龐大的可利用音視頻數(shù)據(jù)需要有效的多媒體系統(tǒng)來(lái)存取、交互。這類需求與一些重要的社會(huì)和經(jīng)濟(jì)問(wèn)題相關(guān),并且在許多專業(yè)和消費(fèi) 應(yīng)用方面都是急需的,尤其是在網(wǎng)絡(luò)高度發(fā)展的今天,而MPEG-7的最終目的是把網(wǎng)上的多媒體內(nèi)容變成象現(xiàn)在的文本內(nèi)容一樣,具有可搜索性。這使得大眾可以接觸到大量的多媒體內(nèi)容。
MPEG-7標(biāo)準(zhǔn)可以支持非常廣泛的應(yīng)用,具體如下:
(1)音視數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索;
(2)廣播媒體的選擇(廣播、電視節(jié)目);
(3)因特網(wǎng)上的個(gè)性化新聞服務(wù);
(4)智能多媒體、多媒體編輯;
(5)教育領(lǐng)域的應(yīng)用(如數(shù)字多媒體圖書館等);
(6)遠(yuǎn)程購(gòu)物;
(7)社會(huì)和文化服務(wù)(歷史博物館、藝術(shù)走廊等);
(8)調(diào)查服務(wù)(人的特征的識(shí)別、辯論等);
(9)遙感;
(10)監(jiān)視(交通控制、地面交通等);
(11)生物醫(yī)學(xué)應(yīng)用;
(12)建筑、不動(dòng)產(chǎn)及內(nèi)部設(shè)計(jì);
(13)多媒體目錄服務(wù)(如,黃頁(yè)、旅游信息、地理信息系統(tǒng)等);
(14)家庭娛樂(lè)(個(gè)人的多媒體收集管理系統(tǒng)等)。
原則上,任何類型的AV(Audio-Video)材料都可以通過(guò)任何類型的查詢材料來(lái)檢索,例如,AV材料可以通過(guò)視頻、音樂(lè)、語(yǔ)言等來(lái)查詢,通過(guò)搜索引擎來(lái)匹配查詢數(shù)據(jù)和MPEG-7的音視頻描述。