MPEG-7标准及其应用简介

2005-12-31 13:32:43 作者:dvbcn热度:

MPEG-7标准及其应用简介
人们如何在海量的媒体信息中迅速找到自己所需的内容,并对其进行个性化的访问?MPEG-7媒体内容描述规范使无法通过现有的搜索引擎查询视频、音频等内容的难题迎刃而解。本文分析了MPEG-7的描述方案,并重点分析了它的集中应用。

一、引言

国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface), 其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩的表示方式如MPEG-1和MPEG-2,又不同于基于对象的表示方式如MPEG-4,而是将对各种不同类型的多媒体信息进行标准化描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。

二、MPEG-7的目标

1.支持多种音频和视觉的描述

描述包括自由文本、n维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述可能包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形

等。对于音频信息,描述可能包括音调、调式、音速、音速变化等。

2.根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次的用户对信息的需求。

3.支持数据管理的灵活性、数据资源的全球化和互操作性。

三、MPEG-7构成要素

MPEG-7的主要元素包括以下几种。

1.描述工具,包括一组描述符D(Descriptor )和描述方案DS (Description Schemes )。描述符是指用来定义和表达实体某一方面特征的句法或语法。表达实体是由特征标识符(如颜色)和数据类型 (如字符串)等构成的。数据类型可以是“复合”的,既可以由几个数据类型的组合来构成,也可以由数个D来“描述”一个特征。描述方案是由一个或多个D和DS构成,DS规定了它们相互关系的结构和语法。

2.描述定义语言DDL(Description Definition Language),用来指定描述方案的一种语言。它是一种模式化语言,是对音视频数据建模结果的一种表征。DDL规定了MPEG的描述工具,包括描述符和描述方案,并提供了把描述符构建为描述方案的规则。DDL同时也允许定义特殊应用中的扩展DS. 描述工具通过DDL被实例化,并以文本格式(XML)被描述。

3.用来支持多路描述、同步问题、传输机理、文件格式等的系统工具。

四、MPEG-7属性描述工具

MPEG-7标准提供了一系列的属性描述工具对属性进行统一的管理,属性描述工具多用在多于一个媒体被描述时(如音频和视频)。这些描述工具根据功能分为内容描述、内容管理、内容组织、

导航和访问以及使用者交互5类。

1.基本元素(Basic Elements)

基本的数据类型提供了一组对描述AV(Audio-Visual)内容有帮助的扩展的数据类型和数学类型,如矩阵和向量等。基本数据类型同时也能构建连接媒体文件、定位内容、描述时间、地点、人物等。正是这些基本元素通过DS规范构成了定义MPEG-7描述方案的基础。

2.内容描述(Content Description)

内容描述的目的是描述可察觉信息内容,用以表征可知觉的内容信息。内容描述包括结构和语义两个方面的内容。结构工具通过划分片断、帧、静态和动态区域来描述AV内容的时间及空间方面的结构信息。语义工具通过对象、事件、抽象观念和关系等描述了和AV内容所反映的现实世界。结构工具和语义工具通过链接共同作用,共同完成了对内容的描述。

3.内容管理(Content Management) 内容管理用于处理那些与多媒体文档创建、媒体所有权和编码等相关的信息,即那些不能被抽象出来的信息。4.内容组织(Content Organization)内容组织提供一种来描述多媒体数据的分析和分类的方法,它可以用来描述一群对象的属性。

5.导航和访问(Navigation and Access)

责任编辑:DVBCN编辑部

为您推荐

MPEG-4的音频标准

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起,在诸多领域内给予高度的灵活性。MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓“自然音频”(natur

MPEG4之前世今生

MPEG全称是MovingPicturesExpertsGroup,动态图象专家组的英文缩写,MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。DIVX视频编码技术实际就是MPEG4压

NTT开发的声音可逆压缩技术成为MPEG国标

图1:利用最新款电脑进行可逆压缩时,各技术的压缩率和解码时间比较。2005年12月27日,NTT宣布由其主导开发的声音可逆压缩(无损编码)技术日前已被批准为MPEG国际标准规格“MPEG-4ALS”。据称,此技术可用于主数据(MasterData)保存和高音质声音数据收发等用途。所谓可逆压缩,就是指能够准确无误地重现原始数字波形数据的压缩方式。不过,数据压缩率通常都低于MP3等非可逆压缩方式。MPEG-4ALS的压缩率取决于采样频率和音乐类型,一般在15%~70%之间。过去的可逆压缩技术包括微软开发的“WindowsMediaAudioLossless”,苹果电脑的“Ap

采用MPEG-4方式的VBI数据广播系统(上)

关键词:MPEG-4,VBI数据广播,图文电视,教育信息网目前MPEG-4数据压缩格式已经广泛应用于低码流的视音频传输和纪录系统中。中国教育电视台的VBI数据广播系统就是采用MPEG-4方式。MPEG-4对视、音频信号的处理范围很广,是一种能将巨大的数字包压缩成能在线传输的小型文件的音视频处理技术。该技术,很象目前一些通用的媒体格式,如MP3、RealVideo和WindowsMedia。但更重要的是MPEG-4可以提供交互式功能。一、VBI数据广播系统VBI(VerticalBlankingInterval)是指利用电视画面的逆程消隐期间传送数字信号的技术。我们知道电视图像画面是通过电视的正