MP4的背后:MPEG-2 AAC

2006-02-07 21:35:35来源:世纪音频 作者:苏信东热度:

介绍篇

1、MPEG-2 AAC 与 MP4
  MPEG-2 AAC(Advanced Audio Coding),简称A2B或AAC,是目前MPEG音频家族中较新的成员。MP4是基于这一技术而形成的一种商品。
  之所以说MP4是一个商品,是因为MP4出现的主要目的就是意图采用一种带有版权限制的音乐格式去取代目前在网络上泛滥的MP3。AT&T公司对MPEG-2 AAC技术进行了一些改良,增加了最关键的音乐传播认证技术,这样就形成了MP4这一种东西。

2、MP4的加密技术
  在这里简单说一下MP4里面使用到的加密技术:首先要认识到的是这一切都离不开网络的帮助。在网络上出售音乐的公司需要为自己的客户创建一个所谓的安全数据库,每一个用户都需要在这个数据库里面创建一个唯一的密钥。当用户以播放、复制、出售等方式去处理手头的音乐时,一切的活动都必须通过这一个密钥,结合音乐格式内含的限制信息,去查询安全数据库中的许可协议,看看用户究竟有没有做这种活动的权力。数据库中的许可协议可以应用户要求随时修改,使得MP4歌曲本身包含的版权信息也可以随时更换。

3、MP4的前景
  虽然MP4有很多先进的优点,但在与MP3竞争的过程中鹿死谁手还有待分晓。关键原因是MP3的使用没有任何限制,这种特性在本来就没有限制的网络上得到充分体现。相反的是虽然AAC技术是公开的,但MP4本身却是受到严格的专利和使用许可证保护的。毫无疑问这肯定使得MP4的应用范围非常狭窄。而且,现在网络上应用了AAC技术的声音格式、编码器、播放器等由于最终文件格式的原因而基本上互不兼容。这一点非常致命:用户要选择一棵树,然后在那棵树上吊死。
  要消灭一种正在流行中的东西是需要用很长的时间的。而且,新的音乐技术已经诞生,比如MPEG-4的Structure Audio,可以实现完全无失真、100:1的音频压缩,到了新技术流行的时候,MP4相信也会很快被淘汰掉。

技术篇

4、MPEG-2和MPEG 2.5
  MPEG-1和MPEG-2在音频方面都使用相同的音频编解码家族: Layer-1, -2 和 -3共三层。数字越小,相对应的技术就越简单,越容易实现。MPEG-2的新音频特性主要表现在MPEG-2具有低采样率扩展以满足只具备非常有限的带宽的应用范围。新的采样频率为: 16, 22.05 或 24 kHz, 比特率则扩展到 8 kbps。
  MPEG-2标准允许比特率低到8kbps,在该种情况下,实际有效的音频带宽需要做出限制,比如限制到3khz。因此,实际的采样率会被减少到8khz。采样率越低,频率分辨率就越好,时间分辨率就越差,流格式中控制信息和音频数据的消耗比就越好。由于MPEG-2定义的最低的采样率为16kHz,于是Fraunhofer便对此进行扩展,将原来MPEG-2所支持的低采样率再除以2,得到: 8, 11.025, 和 12 kHz ,称为 "MPEG 2.5"。在第三层的音质表现上,8 kbps @ 8 kHz 或 16 kbps @ 11 kHz 明显比 8 或 16 kbps @ 16 kHz 要好。

关于MPEG-1,请参阅本站的其他文章:MP3 FAQ中文版

4、AAC技术
  AAC于1997年形成国际标准ISO 13818-7。在MPEG-2制订的早期,本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地,这个标准是不兼容MPEG-1的,因此被称为MPEG-2 AAC。换句话说,从表面上看,要制作和播放AAC,都需要使用与MP3完全不同的工具。

5、AAC的工作方式
  AAC之所以不兼容MP3,关键是它使用了不同的压缩处理算法,并且增加了许多新的特性。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。
  我们来看看MPEG-2 AAC 是如何工作的。首先,音频数据通过多相积分滤波(PQF)被分离为四个标准的子带。对于每一个子带都传输一个独立的增益,作为边信息(side information)。在增益控制下的子带数据然后以长度为256的MDCT来(对于瞬时条件长度为32)转换。在MDCT中使用的窗口是 Kaiser-Bessel derived (KBD) 或正弦窗,两者的频谱特性不相同可适应不同的信号。在瞬时条件下使用较短的窗口以改善时间分辨率。

责任编辑:DVBCN编辑部

为您推荐

MPEG-4的音频标准

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起,在诸多领域内给予高度的灵活性。MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓“自然音频”(natur

MPEG4之前世今生

MPEG全称是MovingPicturesExpertsGroup,动态图象专家组的英文缩写,MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。DIVX视频编码技术实际就是MPEG4压

MPEG-7标准及其应用简介

MPEG-7标准及其应用简介人们如何在海量的媒体信息中迅速找到自己所需的内容,并对其进行个性化的访问?MPEG-7媒体内容描述规范使无法通过现有的搜索引擎查询视频、音频等内容的难题迎刃而解。本文分析了MPEG-7的描述方案,并重点分析了它的集中应用。一、引言国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(MultimediaContentDescriptionInterface),其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩

NTT开发的声音可逆压缩技术成为MPEG国标

图1:利用最新款电脑进行可逆压缩时,各技术的压缩率和解码时间比较。2005年12月27日,NTT宣布由其主导开发的声音可逆压缩(无损编码)技术日前已被批准为MPEG国际标准规格“MPEG-4ALS”。据称,此技术可用于主数据(MasterData)保存和高音质声音数据收发等用途。所谓可逆压缩,就是指能够准确无误地重现原始数字波形数据的压缩方式。不过,数据压缩率通常都低于MP3等非可逆压缩方式。MPEG-4ALS的压缩率取决于采样频率和音乐类型,一般在15%~70%之间。过去的可逆压缩技术包括微软开发的“WindowsMediaAudioLossless”,苹果电脑的“Ap