MPEG-4的音频标准

2005-12-31 13:21:40 作者:dvbcn热度:

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起,在诸多领域内给予高度的灵活性。

   MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓“自然音频”(natural audio)和新颖的“结构音频”(structured audio)以及自然和合成混合在一起的“合成/自然混合编码”(Synthetic/natural hybrid coding)简称SNHC。其中SNHC是MPEG-4中关于音视频的一个很重要的概念。
   1 传统的自然音频编码

  一个基本的概念就是MPEG-4的编码工具不再仅限于支持码率的减少,其各种不同的工具支持从智能语音到高质量多声道音频信号,以及此范围内的音频信号的质量。MPEG-4编码工具支持的其他功能还有:
   .速度的变化,允许不改变音调实现时间尺度变化;
   .音调的变化,允许不改变时间尺度实现音调改变;
   .码率的可分级性,对比特流的分解可在传输或解码器中进行;
   .带宽的可分级性,代表部分频谱的比特流的一段可在传输或解码过程中被抛弃;
   .编码器复杂度的可分级性;
   .强纠错性等。
   MPEG-4标准的自然音频编码将码率范围规定为每声道2kbit/s~64 kbit/s。在如此宽的范围内定义了三种类型的编码器或叫编码工具。在最低的码率范围2~6 kbit/s之间使用的是参数编码(parametric coding),最适合于采样率为8kHz的语言信号;在6~24 kbit/s的码率范围内使用的是编码激励的线型预测编码(code excited linear predictive coding)简称CELP,支持采样率为8kHz和16 kHz的语言和音频信号;在最高的16~64 kbit/s的码率范围内使用的是时间/频率编码(time/frequency
coding)技术,比如MPEG-2 AAC标准,支持采样率为8~96 kHz的任意音频信号。
   1.1 参数编码
   参数编码提供了两种编码工具:HVXC和HILN。
   谐音矢量激励编码HVXC(Harmonic Vector eXcitation Coding)编码工具允许对语言信号在2kbit/s和4kbit/s之间进行可分级性编码。HVXC的解码过程分四步进行:参数的反量化;对声音帧用正弦合成产生激励信号和加上噪声分量;对非声音帧通过查找码书产生激励信号;LPC(线型预测编码)合成。对合成语言质量的增强可以使用频谱后置滤波。
   HVXC提供了在延迟模式上的可分级性。其编码器和解码器可以独立地选择低或正常的延迟模式。
   谐音和独立线性加性噪声HILN(Harmonic and Individual Line plus Noise)编码工具允许对非语言信号,例如音乐以4kbit/s和更高的码率进行编码。HILN支持在速度、音调、码率和复杂度上的可分级性。其独立线性基础解码器从比特流中重建线性参数频率、幅度和包络。增强解码器使用更好的量化对上述参数进行重建,并且对线性参数相位也进行了重建。信号解码的速度可以仅通过改变帧长来实现,音调的改变通过在合成之前利用一个比例因子复合每一个频率参数来实现,而且无须改变帧长,也不会引起相位失真。增强解码器由于对相位进行重建而带来了诸多优点,使解码器输出的信号近似于编码器输入的波形。
   可以将HVXC和HILN联合起来使用以获得更宽范围内的信号和码率。可以在两者编码器的输出之间动态地切换或混合。
   1.2  CELP编码
   CELP的解码器包括一个激励源、一个合成滤波器和一个需要时添加的后置滤波器。

责任编辑:DVBCN编辑部

为您推荐

MPEG4之前世今生

MPEG全称是MovingPicturesExpertsGroup,动态图象专家组的英文缩写,MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。DIVX视频编码技术实际就是MPEG4压

MPEG-7标准及其应用简介

MPEG-7标准及其应用简介人们如何在海量的媒体信息中迅速找到自己所需的内容,并对其进行个性化的访问?MPEG-7媒体内容描述规范使无法通过现有的搜索引擎查询视频、音频等内容的难题迎刃而解。本文分析了MPEG-7的描述方案,并重点分析了它的集中应用。一、引言国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(MultimediaContentDescriptionInterface),其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩

NTT开发的声音可逆压缩技术成为MPEG国标

图1:利用最新款电脑进行可逆压缩时,各技术的压缩率和解码时间比较。2005年12月27日,NTT宣布由其主导开发的声音可逆压缩(无损编码)技术日前已被批准为MPEG国际标准规格“MPEG-4ALS”。据称,此技术可用于主数据(MasterData)保存和高音质声音数据收发等用途。所谓可逆压缩,就是指能够准确无误地重现原始数字波形数据的压缩方式。不过,数据压缩率通常都低于MP3等非可逆压缩方式。MPEG-4ALS的压缩率取决于采样频率和音乐类型,一般在15%~70%之间。过去的可逆压缩技术包括微软开发的“WindowsMediaAudioLossless”,苹果电脑的“Ap

采用MPEG-4方式的VBI数据广播系统(上)

关键词:MPEG-4,VBI数据广播,图文电视,教育信息网目前MPEG-4数据压缩格式已经广泛应用于低码流的视音频传输和纪录系统中。中国教育电视台的VBI数据广播系统就是采用MPEG-4方式。MPEG-4对视、音频信号的处理范围很广,是一种能将巨大的数字包压缩成能在线传输的小型文件的音视频处理技术。该技术,很象目前一些通用的媒体格式,如MP3、RealVideo和WindowsMedia。但更重要的是MPEG-4可以提供交互式功能。一、VBI数据广播系统VBI(VerticalBlankingInterval)是指利用电视画面的逆程消隐期间传送数字信号的技术。我们知道电视图像画面是通过电视的正