一种基于H.264的快速运动估计算法

2010-06-24 15:22:00来源:维库开发网 热度:

摘要:H.264是现有最重要数据压缩编码国际标准之一。同时快速运动估计算法一直是视频压缩中的研究热点。本文针对一些快速估计算法过早确定了搜索方向,容易陷入局部最小点,损失了搜索精度的情况,在原有基础上,运用菱形十字搜索算法(DCS)与阈值估计相结合的方法提高了运动估计的性能。实验结果表明,该算法可以用较小的搜索代价取得与全搜索(FS)相当的效果,并且在搜索速度方面优于钻石法DS)。

0 引言

H.264采用了减少视频图像各帧间冗余度的运动估计算法。运动估计算法传统的有全搜索(FS)、三步搜索(TSS)、新三步搜索(NTSS)、四步搜索(FSS)等;常用的是钻石搜索(DS)和非对称十字交叉多层次六边形格点运动搜索算法(UMHexagonS)。运动估计是整个视频编码中运算量最大的模块,可占整个软件编码器运算量的70%以上。因此视频系统中编码器的复杂部分取决于运动估计算法体系结构的复杂性。

1 运动估计算法分析

1.1 钻石搜索(DS)算法

DS算法即钻石搜索算法,被MPEG-4国际标准采用并收入验证模型VM(Verification Model)中,是MPEG-4建议采用的快速运动估计算法。 DS算法采用了两种搜索模板,分别是有9个检测点的大模板和有5个检测点的小模板。搜索时先用大模板LDSP在搜索区域中心及周围8个点处进行匹配计算,当最小块误差出现在中心点处时,将大模板LDSP换为SDSP,再进行匹配计算,这时5个点中的MBD(Minimum Block Distortion)即为最优匹配点;否则,改变中心位置,仍用LDSP重复计算。

1.2 菱形十字搜索(DCS)算法

菱形十字搜索算法(DCS)算法是在DS算法基础上改进而来,DCS的匹配模板是建立在两种不同的搜索模板之上的,即大菱形十字型(LDCSP)和小菱形十字型(SDCSP),如图1所示。其中,十字型可以对应于实际的运动的矢量分布,而交叉型则是为了加速搜索效果。

DCS算法在进行运动估计匹配运算时,有三种可能的情况:

(1)若MBD点位于LDCSP中心位置,说明图像是静止的,DCS算法一步结束;

(2)若MBD点位于LDCSP小十字位置,说明图像的运动较小,则在此基础上按照SDCSP模板反复进行交叉搜索。

(3)若MBD点位于LDCSP大十字位置,说明图像的运动较大,则在此基础上按照LDCSP模板反复进行交叉搜索。

由此可以看出,DCS算法的优点是,可以根据图像的运动类型(如上述三种情况),白适应选择下一步相应的搜索模板,使搜索与图像内容有关(基于内容的搜索),从而得到较好的搜索效果;DCS算法的搜索并不一定要经历模板由大到小的必然过程,有时一步即可完成搜索;用DCS搜索时,十字形模板对应于实际的运动矢量分布,交叉形模板则有准确性“聚焦”特性,这从本质上体现了DCS是粗定位和准确定位的有效结合。

2 运动估计的阈值确定

视频图像的运动矢量大部分为零矢量或运动很小的矢量。运动矢量为零的块称为静止块;运动矢量很小的块(以搜索窗口中心为圆心,两像素为半径的圆内)称为准静止块:而其他的称为运动块。如果有超过80%运动矢量很小的块可被看作静止或准静止块。因此,可设一个阀值T,当运动矢量的值小于T时,可用SDCSP搜索法直接进行精确定位,找出最优点;当运动矢量的值大于T时,可用LDCSP搜索算法找出最优点。

运动矢量空间域的预测方式有运动矢量中值预测、空间域的上层块模式运动矢量;在时间域的预测方式有前帧对应块运动矢量预测和时间域的邻近参考帧运动矢量预测。本文采用运动矢量中值预测方式。根据与当前E块相邻的左边A块,上边B块和右上边C块的运动矢量,取中值作为当前块的预测运动矢量。如图2所示。

设当前要编码块E的运动矢量为MVp。如果运动矢量的值MVp≥T,则与E块相邻的各块间运动的相关性较高,表明该区域的变化比较平缓;如果运动矢量的值MVp

3 自适应运动估计算法

结合上述DCS算法和阈值的确定,可采取先对视频图像的运动块进行阈值的判断,再根据判断结果进行最佳匹配块的搜索。具体搜索步骤描述如下:

Step 1:判断当前块运动矢量MVp和阈值确大小。若MVp≥T,则进入Step 2;若MVp

Step 2:用LDCSP在搜索区域中心及周围8个点进行匹配运算,然后判断,找出MBD点。若MBD点位于中心点,说明宏块是静止的,DCS算法一步结束,得到最优匹配块;否则进行Step 3。

Step 3:若MBD点为LDCSP模版的小十字处,以该点为中心构建SDCSP进行匹配计算,若MBD点位于中心点,所[FS:Page]得MBD点为所求。否则,进入Step 4。

Step 4:若MBD点为LDCSP模版的大十字处,以该点为中心构建LCSP进行匹配计算,进入step 2。

Step 5:用LDCSP在搜索区域中心及周围5个点进行匹配运算,然后判断,找出MBD点。若MBD点位于中心点,所得MBD点为所求;否则继续Step 5。算法流程图如图3所示。

4 实验结果及说明

用搜索时间和PSNR值两个指标来验证DCS的性能。本节实验用到的所有视频文件均为QCIF(Quartet commonintermediate format)格式。实验以主频1.8GHz的PC机上运行的VisualC++6.0为平台。测试对象为:missa、salesman、news、grandmother、foreman、carphone、claire,搜索范围为16×16的矩形框,量化范围为2~12,测试序列中每帧图像的大小为176×144。

4.1 搜索时间的比较

为了时间测试的准确性,测试时采用的是VC++提供的两个精确时间函数:QueryPerformanceFrequency()和OuerPerformanceCounter()精度对标准测试序列missa、salesman、news、grandmother、foreman、carphone进行精确测定,得表1(数据均为三次测量所求得的平均值)。

从表1可知:a.FS搜索效果最佳,但耗时太长;DS算法有较大改进,可以实现实时压缩;DCS比DS,运行时间都有不同程度的减少,故DCS算法在搜索速度有优势。b.从单个序列来看,DCS算法对missa和salesman时间优化最为显著,分别只占FS算法的7.42%、7.50%和DS算法的98.17%、97.49%;对carphone序列的搜索速度也有很大优化,占FS搜索算法的7.97%和DS算法的97.82%。综合视频特性可知:DCS算法针对运动平缓的视频对象搜索速度优化明显。

4.2 信噪比的比较

对标准测试序列claire和carphone序列进行测定,计算PSNR得表2。

表2中FS的平均PSNR最高,达到42.38,但搜索时间最长;DS的PSNR最低,为42.31,而DCS为42.35,高于DS算法,且仅低于FS算法0.03dB。从单个序列来看,DCS算法对claire的优化程度最大,超过了FS的PSNR值,说明DCS算法身体静止仅面部表情运动特点视频适用。用DCS算法计算得到的carphone的PSNR值虽然低于FS算法,但高于DS算法;missa序列的DCS算法的PSNR值和FS、DS法的相差不大。故DCS算法在搜索速度、图像质量上均有保证。

5 结束语

本文从搜索时间和图像质量两方面对各种块匹配运动估计算法进行了性能分析比较。实验结果表明,将菱形十字交叉搜索算法和阈值判断结合,在搜索速度方面,有很大程度的优化,而且能得到与FS、DS搜索算法相当的图像质量。DCS算法针对运动平缓的视频作用明显,由此推知该算法适用于电视电话、远程教育等实时视频压缩。

责任编辑:chengxi

为您推荐

AVS-M手机电视系统面世 专家批评H.264臃肿

尽管AVS尚未成为IPTV国家标准,但中科院计算所不想仅仅被动等待,而是希望以手机电视领域为切入点,打消整个产业链的观望心理,推动AVS产业化进程。12月19日,中科院计算所与广州富年公司联手推出AVS标准的手机电视系统AVS-M,这套系统基于中科院计算所的AVS编码、解码标准,由富年公司提供后台系统和终端的软件解决方案,而非芯片。上海中科计算技术有限公司常务副所长、AVS-M项目技术负责人陈益强博士认为,由于19日正式推出的AVS-M系统尚不涉及芯片设计、终端生产等产业链环节,因此对运营商和服务提供商来说,推出AVS-M手机电视服务的成本很低,风险很小。

算通科技成功研制出采用H.264压缩标准的编码器产品

算通科技于2007年全新推出的编码器产品------E601型,此编码器采用H.264压缩标准,作为新一代的压缩标准H.264,其算法更趋完备。 此外E601H.264编码器支持立体声音频编码,支持MPEG-1Layer2音频编码和AAC编码。在编码效率上具有重大的改进,运营商以现有的设施为基础,可传送更多高质量的内容,大大降低在有线、卫星和电信网络传送广播级质量视频的成本,同时非常适用于IPTV、移动电视、视频存储播放、新闻传递等领域。 算通科技的E601H.264编码器产品将在CCBN2007及NAB2007展会上全新亮相,届时欢迎大家莅临展馆参观指导。

NEC电子新款机顶盒SoC集成H.264解码功能

该两款新产品将视频及音频等数字信号解码功能以及图像显示功能等接收数字信号系统必须的功能集成在一颗芯片上。EMMA3SL/HD支持高清(以下简称HD)播放,EMMA3SL/SD支持标清(以下简称SD)播放。新产品的主要特征有:(1)可支持压缩率为目前普及的MPEG2两倍以上的新一代H.264视频标准;(2)内置了音频数据处理DSP,因此可支持新一代音频规格Dolby®DigitalPlus(注1)和HE-AAC;(3)集成了USB、Ethernet等外部接口功能。此外,EMMA3SL/HD中内置了近年来市场中不断普及的如HDMI接口等高清数字家电接口。使用该新产品的用户,可根据自身需要设

NEC推出适用于H.264标清(SD)机顶盒系统芯片

NEC电子日前完成了2款适用于东欧、俄罗斯、印度、南非等地区的系统芯片方案,支持新一代“H.264”标清(以下简称SD)视频标准的机顶盒(以下简称STB)系统的开发,并以“EMMA3SL/LP”、“EMMA3SL/L”的产品名于即日起提供样品。该两款图像处理芯片将视频及音频等数字信号解码功能以及图像显示功能等接收数字信号系统必须的功能集成在一颗芯片上。此外,EMMA3SL/LP内置了高级安全规格,防止不正当使用收费数字电视的功能。新产品的主要特征有:(1)即使是压缩率为目前普及的MPEG2两倍以上的新一代H.264视频标准,该芯片也可支持H.264SD播放;(2)由于内置了系统搭建所必须的各种