基于MPEG-7内容整合的应用研究

2006-03-14 11:58:49来源:imas 作者:dvbcn热度:
【内容提要】 本文试图通过信息整合向内容整合延伸的逻辑分析,寻求基于MPEG-7标准语言的数据逻辑,以构建面向视频对象的描述模型,进而打通数据检索与视频检索的逻辑通道,并在媒体资产管理系统中得到应用。
【关键词】 辛迪加 视频BPR 元素层整合 元数据 描述子
  
一. 问题的提出
随着媒体资产管理被广泛接受,信息整合的关键技术——面向对象的检索机制受到普遍关注。特别是新媒体,迫切期待以方便快捷的方式,占有极大丰富的内容资源。
自从有了《广播电视节目资料分类法》的广电行业指导性技术文件(GY/Z 199-2004),在广电的内容归档和检索方面有了重大突破。然而,当依据GY/Z 199建成媒体资产管理系统以后,运行的经验告诉人们:工作流出现了拥塞。这不仅表现在按照“图书馆学”和“档案学”原理,在人工录入“资料分类”的编目上耗人耗力,同时,也表现在为了使用而全方位占有视频资料的检索中,索取的资料还不能完整地表达创意者的构思意图。这是因为,“图书馆学”或“档案学”对于内容的描述和刻画远没有视频图像那样深刻,比如在“图书馆学”或“档案学”上,并没有依据视觉整合原理,对图像的纹理结构、色彩分布、运动轨迹、GOP序列、图像标识等等实现深层描述,而这些内容却在视觉效果和内容描述中充当了极为重要的元素,也是极具视频特征的数据信息。因而,只能认为“图书馆学”或“档案学”的分类归档是关于视频图像内容描述的子集。
再从IT的“整合之路”看,从信息整合到内容整合的历程经过了10多年。1993年哈佛出版了迈克尔·哈默(Michael Hammer)与担任CSC Index管理顾问公司董事长的James Champy博士合著的《再造企业(Reengineering the Corporation)》,并以“管理革命的宣言”作为副标题,掀起了研究世界性企业信息整合的浪潮。随后,IBM在业务流程重组(Business Process Reengineering,BPR)上寻找突破口,以5大品牌整合工具、6大“粒度”精细化的整合价值,提供了从信息整合,到内容整合,再到流程整合的一系列企业信息化原则与理念。当“富媒体”概念进入数字视频,并以“辛迪加(Syndicate)”产业平台再造新媒体的时候,虽然全国广电开始认同了数字媒体内容整合的概念,频频谈论内容整合之大计。但是,叫响“整合”的毕竟是IT,而IT毕竟还是面对文件级数据整合的研究,所提出的内容管理系统(Content Management Systems,CMS),还只能从广义上适应企业营销的内容需求。即便是影响整个图像检索界的IBM QBIC(Query By Image Content,IBM)系列商用产品,也不能深入到视频流内部,以跨媒体的思路去理解视频流级的VA内容整合。而理论界的研究成果,如哥伦比亚大学的Visual SEEK查询系统以及麻省理工学院媒体实验室开发的PhotoBook检索系统等,虽然是面向视频、基于流样本的研究,但还未能进入面向新媒体业务(对象)的实际应用。
还有进入千禧年的视频领域前沿,当时的领军人Sony率先以“改革工作流程”的口号,推出了视频归档存储系统,接着又有了“Work Smart,Work Sony!”此刻,迈克尔·哈默的信息整合飓风终于刮到了视频领域,开始了BPR的实质性应用。然而,BPR的“清除、简化、整合、自动化”(Eliminate、Simplify、Integrate、Automate,ESIA)的流程原则,是基于信息化的内容整合,一方面当时的电视媒体还没能进入依托网络“再造传媒信息化”的愿望和现实,另一方面即便是硬件的归档存储Sony也不擅长(已经停产),就更不必谈充分表现软体结构的内容整合了。而今天,“网络的力量”已经把传统电视媒体推向了数字新媒体,今非昔比的“成本、质量、服务、速度”,为广电再造媒体、再造流程、直至再造视频整合,产生了前所未有的巨大推动力。
因此,一方面研究跨媒体内容整合不仅十分迫切,而且极为现实(全球都在行动),另一方面仅仅依靠IT的整合概念还不够,还需将其精髓通过“概念移植”,产生适用于广电流程的媒体内容整合的概念和理念,以至整合成为整套的视频数字序列和P2P的检索机制。 二. 视频内容整合基本概念

责任编辑:DVBCN编辑部

为您推荐

MPEG-4的音频标准

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起,在诸多领域内给予高度的灵活性。MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓“自然音频”(natur

MPEG4之前世今生

MPEG全称是MovingPicturesExpertsGroup,动态图象专家组的英文缩写,MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。DIVX视频编码技术实际就是MPEG4压

MPEG-7标准及其应用简介

MPEG-7标准及其应用简介人们如何在海量的媒体信息中迅速找到自己所需的内容,并对其进行个性化的访问?MPEG-7媒体内容描述规范使无法通过现有的搜索引擎查询视频、音频等内容的难题迎刃而解。本文分析了MPEG-7的描述方案,并重点分析了它的集中应用。一、引言国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(MultimediaContentDescriptionInterface),其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩

NTT开发的声音可逆压缩技术成为MPEG国标

图1:利用最新款电脑进行可逆压缩时,各技术的压缩率和解码时间比较。2005年12月27日,NTT宣布由其主导开发的声音可逆压缩(无损编码)技术日前已被批准为MPEG国际标准规格“MPEG-4ALS”。据称,此技术可用于主数据(MasterData)保存和高音质声音数据收发等用途。所谓可逆压缩,就是指能够准确无误地重现原始数字波形数据的压缩方式。不过,数据压缩率通常都低于MP3等非可逆压缩方式。MPEG-4ALS的压缩率取决于采样频率和音乐类型,一般在15%~70%之间。过去的可逆压缩技术包括微软开发的“WindowsMediaAudioLossless”,苹果电脑的“Ap