返回 政治论文 首页
H.264熵编码的技术研究及H.264的应用展望

  摘 要:随着视频通信的发展,多媒体通信平台功能越来越强大,同时也对视频编码的性能提出了更高要求。H.264视频编码标准正因为使用了熵编码技术,使得其压缩效率大大提高,同时图像质量和差错鲁棒性方面也表现优异,成为图像处理和通信领域研究的热点问题之一。论文搭建了H.264的系统框图,对H.264的三种熵编码分别进行了技术研究,得到H.264编码的整体优势,通过其在视频通信上的应用调查,阐述H.264的前景。
  关键词:H.264 熵编码 指数哥伦布编码 CAVLC CABAC
  中图分类号:TN47文献标识码:A 文章编号:1007-3973 (2010) 05-080-02
  
  1引言
  近几年视频通信得到迅速的发展,卫星电视、交互式电视、视频点播以及个人无线视频通信系统等业务需求越来越强烈,为人们提供了功能更为强大的多媒体通信平台,同时也对视频编码各方面的性能提出更高的要求。国际标准化组织(ISO)及国际电子学委员会(IEC)于1988年成立了运动图像专家组,简称MPEG(Moving Picture Experts Group)相继制定了一系列视音频编码国际标准 。传统的视频编码没有充分利用视频信号的非静态特性,且忽略了语法元素的高阶统计相关性。新一代的数字视频编码标准H. 264在相同的压缩质量情况下,码率相对于MGPEG-4、H.263和MPEG-2,分别减少 39%,49%和64%,压缩效率和对IP网络的支持都比以前的标准有很大的改善。目前,H.264视频编码标准以更好的率失真效果及其更强的差错鲁棒性,已得到业界专家们的肯定,同时也是当今图像处理和通信领域研究的热点问题之一。
  2H.264熵编码的技术研究
  2.1H.264标准及其系统结构
  H.264吸收了以前视频编码标准中的一些行之有效的算法,充分考虑了多媒体通信对视频编解码的各种要求,同时又采纳了视频编码、图像处理领域的最新研究成果,在提高压缩编码效率和增强网络适应能力等方面有了质的飞跃。根据应用场合的不同,H.264制定了不同的算法集和技术限定 ,共分为三个类:基本档次、主要档次和扩展档次,各类型包含不同的技术,每个类下面又可以划分成不同的等级。
  H.264视频编码标准主要包括预测编码(帧内预测、帧间预测、运动估计与补偿)、变换编码和熵编码,在保留运动补偿和变换编码技术的基础上,加入了如离散余弦整数变换(DCT)、基于内容的自适应技术等新技术。根据H.264所包含各个编码部分的工作原理所设计的H.264视频编码整体框架如图1所示。
  H.264视频编码在完成DCT变换、量化后,残差数据被送往熵编码器进行编码。熵编码作为整个编码器的最后一部分,直接和信号的传输连接。因此,其压缩效率对整个视频编码器起着至关重要的作用。H.264中的熵编码技术主要包括变长编码(VLC)和内容自适应二进制算术编码(CABAC),其中VLC又分为指数哥伦布编码、内容自适应变长编码(CAVLC)。
  2.2指数哥伦布编码
  指数哥伦布编码方法简单,只要使用一张码表就可以对所有的符号进行编码,是一种有规则的可变长编码。对所有的句法元素,除了量化系数外,使用单一无限可扩展的码字表,这样就不必为每个句法元素设计一个专用的 VLC表。
  指数哥伦布编码是对参数编码,具体映射方式为:对于经常出现的值赋予较短的码字,而对于出现较少的值赋予较长的码字。
  采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布,灵活地确定以k阶指数哥伦布码编码,如果k选得恰当,则编码效率可以逼近信息熵。
  2.3内容自适应熵编码技术
  内容自适应技术的主要思想是在熵编码过程中根据内容信息自主切换码表(变长编码器)或更新符号的条件概率(算术编码器),这较好的解决了以往熵编码技术中全局统计概率分布与编码符号局部概率分布不一致的问题,从而提高了编码效率。
  CAVLC和CABAC是H.264中采用的两种熵编码方法,两种编码都是通过基于内容的自适应来提高编码的效率。
  2.3.1 内容自适应变长编码(CAVLC)
  CAVLC用残差数据经过整数变换及量化后的系数特性,根据以往编码的数据在若干码表中自适应的选择,找出与当前编码数据统计特性最相符的一个码表来进行编码,最大可能地与当前数据的概率模型相匹配,达到更好的自适应性。
  CAVLC主要是对帧模式下Z顺序扫描之后的残差数据块进行编码,它充分利用了量化之后块的以下特性:(1)块经过预测,变换和量化之后变为典型的稀疏矩阵;(2)经过帧模式下Z顺序扫描之后,高频部分的非零系数主要是�;(3)相邻块的非零系数的个数是相关的,利用查找表对非零系数进行编码,查找表的选择取决于相邻块的非零系数的个数;(4)扫描后,位于低频处的非零系数值较大,高频处则相反,由此自动的选择Level的码表。
  2.3.2 内容自适应算术编码(CABAC)
  基于内容自适应的算术编码是一种自适应的二元算术编码 ,它是在自适应算术编码的基础上引入上下文模型的概念。上下文模型是根据当前符号周围已编码符号的情况构造的,每个上下文模型内,概率随着编码进行自适应的更新,不同的上下文模型,其概率分配也是不同的,此时的概率即为条件概率。采用恰当的上下文模型,就可以更好的估计和适应信源的实际概率分布,降低信源的信息熵,提高编码效率。
  
  图3 CABAC熵编码系统编码流程图
  CABAC熵编码过程主要分三步:(1)根据已编码符号的信息为当前符号从有效模型中选择一个合适的模型;(2)将非二进制符号(变换系数或运动矢量)转换成二进制符号串,即二值化;(3)将表示当前符号的二进制符号串逐位送入自适应二进制编码器进行编码。每一位编码完成后,相关的模型将被更新,从而实现对视频统计特性的跟踪。
  2.3.3CAVLC 与CABAC的比较
  两种编码应用于H.264的不同档次。在主要档次和扩展档次中可以对这两种熵编码方式进行选择,而在基本档次中只能使用CAVLC。相比CAVLC,在相同的图像质量下,编码电视信号使用CABAC将会节省比特率10~15%。但是,压缩效率的提高同时编码复杂度也相对要高,对实时性能有影响,而且抗误码的性能也不好,所以CABAC常适用于需要高质量编码的非实时应用 。
  3H.264的应用展望
  多媒体视频传输是第三代(3G)及以后的移动通信系统的一个重要应用。一般来说,移动终端是小型的手持设备,其功率和存储能力有限。因此,一个移动视频编码器必须尽可能降低复杂度,并且仍然保持高效性和鲁棒性。对于时延要求不高的视频应用可以通过重传来实现,但对视频实时会话服务来说不可能进行大量数据的重传;此外,在一个移动蜂窝区域的系统容量有限,且传输的数据量在不断变换。因此,要求视频编解码器能在有限时间内随着环境的变换来改变编码速率,以适应信道环境的变换。
  作为面向未来IP和无线环境的视频编码标准,H.264采用全新的编码结构,首次提出了网络适配层(NAL)的概念,其码流结构对网络的适应性更强,还采用了数据分区、数据掩盖和错误恢复等技术使之具备了在高误码率、丢包多发的信道中传输的能力,增强了H.264视频流的鲁棒性。同时为了便于误码以后的再同步,在一帧的视频数据中还提供了一定的重同步点。另外,帧内宏块刷新和多参考帧模式使编码器在决定宏块模式的时候不仅可以考虑编码效率,还可以考虑传输信道的特性 。


  H.264中还定义了数据分割模式,解码器可方便地检测出受损数据的类型,减少误码对图像质量造成的损伤。这种模式也利于信道编码时进行不等保护,即对重要的数据进行等级较高的保护。
  正是由于熵编码,使得在同等速率下H.264比H.263减小50 %的码率,也就是说,用户即使只利用384kbit/s的带宽,也可以享受H.263下高达768kbit/s的高质量视频服务。H.264不但有助于节省庞大开支,还可以提高资源的使用效率,同时令达到商业质量的视频会议服务拥有更多的潜在客户。
  H.264的上述优点必将使其在视频通信领域得到广泛应用,如实时视频通信、Internet视频传输、视频流媒体服务、异构网上的多点通信、压缩视频存储、视频数据库等。在未来的移动视频通信领域,H.264具有非常广阔的应用前景,发展潜力巨大。
  但是H.264性能的提高是以复杂度的提高为代价获得的。据估计,H.264编码的计算复杂度大约相当于H.263的3倍,解码复杂度相当于H.263的2倍。这种高复杂度对H.264的应用是一个瓶颈,尤其难于在硬件上实现,因此迫切需要寻找H.264关键技术的在硬件上实现的方案。国外的少数几个公司已开发出 H.264 的硬件编解码器 ,可实现部分级别视频的快速编解码,这类产品在网络和数字电视等领域拥有广泛市场。在将来的移动通信中,H. 264也将会有很大的发挥空间。
  
  注释:
   Joint Video Team (JVT) of ISO/IEC MPEG and ITU-T VCEG Draft ITU-T recommendation and final draft international standard of joint video specification (ITU-T Rec. H.264/ISO/IEC 14 496-10 AVC),” JVTG050,2003.
   吴乐南.数据压缩[M].北京:电子工业出版社,2006. 6.
   Detlev Marpe, Heiko Schwarz and Thomas Wiegand. Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard .IEEE Trans. On Circ. and Systems for Video Technology. July 2003. pp.620~636.
   于庆梅.H.264熵编码技术研究与硬件设计[D].北京:北京交通大学,2008.
   吴琼.基于H.264视频编码的关键技术及其复杂度测试[J].现代电子技术,2009,(20):60-62.



【相关论文推荐】
  • H.264视频编码的研究
  • 浅析H.264标准中的CAVLC编码
  • 基于CUDA的H.264视频编码实现
  • H.264标准的视频加密技术分析与展望
  • 基于H.264编码技术的竞赛视频图像采集终端设计
  • 基于H.264视频编码的关键技术及其复杂度测试
  • 基于H.264编码的多屏共享系统研究
  • H.264视频编码多参考帧抗误码性能的研究
  • H.264运动估计算法的优化研究