您好, 访客   登录/注册

图像压缩编码研究

来源:用户上传      作者: 龙进 霍芳

  摘要:随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此,图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。
  关键词:图像处理 压缩
  
   (一)图像压缩简介信息是现代社会的主要特征,其主要载体有声音、文字、图像等
   相比于其它的载体,用图像表示信息的优点在于其直观性强、信息量大、容易被人们接受。图像作为最常见的信息存储方式和表现形式生动而直观,能提供比其它数据形式更多的信息。图像压缩就是在没有明显失真的前提下,将图像的位图信息转变成另外一种能将数据量缩减的表达形式,即用最小的数据量表达图像信息。由于数字图像在存储与传输过 程中保真度高,并且易于进行各种数学处理,其应用范围越来越广。用数码相机拍摄的图像、计算机中存放的各种图像、数字电视等都是数字图像,数字图像与我们的日常生活密切相连。数字图像有很多的优点,但它的缺点也很突出,数据量大是其最主要的缺点之一。因为这会给数字图像的存储与传输造成很大的困难。以每帧像素数为1024×1024,每像素 24bit,播放速率为 24 帧/秒的电影图像为例,播放一秒所需的数据量为72M,以播放时间为一小时计算,播放这样一部片子所需的数据量为 240G 以上,实际电影播放时间可能比这要长许多,这就需要更多的数据量。当前大多数人计算机硬盘的存储容量一般在 40-120g之间,远远小于一部影片所需的存储量。数字图像需要如此多的数据,这就为图像的存储与传输带来了很大的麻烦。图像压缩就是为解决这种问题而诞生的学科。由前面的分析可知,电影的图像数据如果不经压缩,普通计算机的存储量是不能满足电影的存储需求的。电影的图像数据经过压缩后,数据量大大减小,普通的计算机上也可以存储多部电影。不光是电影图像存在数据量大的问题,其它的数字图像,如遥感图像、医学用图像、气象云图、数字电视等都存在这一问题,图像压缩是一个很有现实意义的学科。
   (二)图像压缩的可行性我们可以从图像的视觉系统特性和图像的统计特性两方面来论证图像压缩的可行性
   1、人类视觉系统的特性
   我们可以将人类视觉系统看作一个通常意义下的输入输出系统,而其输入和输出之间的关系,就是视觉特性。人类视觉系统主要表现出以下几种特性:
   (1)对比灵敏度在数字图像中,图像的亮度表示为一系列的离散值,即灰度值。经实验证明,视觉系统很难正确判断亮度的绝对大小,然而当判断两亮度中哪个较大时,视觉系统则有较好的能力。这就是说,人眼有较好的对比灵敏度,利用此特性,只要保证图像压缩处理后的亮度信息与原图像有比较一致的对比度即可,而不要求有很大的亮度范围。
   (2)空间分辨率 空间分辨率指人眼区分相邻的两个发光点的能力。通常用能够分辨的两个发光点之间的最小视角表示,该视角一般为 1'。这说明人眼的空间分辨力是有限的。视角小于某个值时,人眼将无法分辨相邻的像点,也就是说,当图像沿空间上的任一方向变化太快时,将超出人眼的接受范围。因此,从空间频域上看,人眼视觉呈低通特性。
   (3)时间分辨力时间分辨力指人眼对于随着时间而变化的目标的分辨力。由于人眼的视觉惰性和频闪效应等使人眼的视觉特性从时间频率域上看,也呈低通特性。
   (4)可见度域值 指人眼刚好能发现的干扰值,低于该域值的干扰是察觉不出来的。通过分析,可见人的视觉系统是有一定限制的,并不能分辨出图像中的所有信息。因此,可以对原始图像中许多人眼不敏感的信息,不予处理,这样并不影响人眼对图像的识别,从而实现对图像数据的压缩处理。
   2、图像的统计特性
   对图像的统计特性的研究是非常重要和有意义的。了解图像这方面的特性是采用 各类图像压缩编码方法的基本依据。因为图像抽样值本身存在的一些联系和规律,对图像数据压缩具有指导的意义。下面我们从空间域和频率域两方面来讨论图像的统计特性:
   (1)图像的空间域统计特性在空间域中,数字图像表现为在空间上分布的点阵。通过观察一幅数字图像,发现相邻或相近的像素,其灰度值总是相近的。这说明图像的像素间存在很强的相关性。
   (2)图像的频率域统计特性在频率域上,图像表现为不同分量系数的分布。按照空间域和频率域的对应关系,空间域中的强相关性,即图像存在大量的平坦区域,反映在频率域中就是图像的能量集中于低频部分。通过对图像统计特性的分析,发现大多数图像相邻像素之间有较大的相关性,这就会造成信息冗余。假若知道某类图像的统计特性,那么根据信息论的原理,对于这类特殊图像而言,总可以找到最佳的或者最接近的压缩编码方法,它们将以图像的信息熵为其编码率的下限。
   (三)现有图像压缩编码方法
   实现图像信息的数据压缩所采用的各类编码方法,称为图像的压缩编码。方法按 其原理不同,它们大致可以分为以下几种:
   1、预测法它指的是的是线性预测法。其中最常用的是差值脉冲编码调制法(DPCM)增量调制法,此外还有线性预测。
   2、变换法变换法是正交变换的简称,主要有傅立叶变换、Walsh-Hadamard 变换、哈尔变换余弦变换、霍特林变换以及小波变换。分形编码法也可以看做是一种变换编码。
   3、平均信息法有熵编码法、主要包括霍夫曼编码及算术编码法等变字长和准变字长的编码方法。
   4、内插法。有低取样率法、亚取样法、亚行法、亚场法、亚帧法等。
   5、运动补偿法针对活动图像中的运动景物采取的帧间编码法。主要有运动补偿内插法和位移估值法。而后者包括方块匹配法和像素递归法。
   6、自适应法它不是一种独立的编码方法。针对图像的某种局部的或瞬时的统计特性,它能自动的调节编码方案中的某些参数,达到更高图像压缩效能。它总是结合某种或某几种编码方法被采用。
   7、面向对象综合分析方法和模型基方法对图像进行分析建模,得到模型参数,利用参数编码。
   8、其他编码方法有方块编码方法、矢量量化法、综合高频法、轮廓编码法、游程编码法等。在这些编码方法中预测法和变换法占据比较重要的地位,对它们的研究较多,应用也较广泛。小波和分形的编码方法则是公认的最有前途的新一代编码法方法,其中小波编码方法的研究要比分形编码方法成熟很多,对分形编码的研究还有很大的潜力。


转载注明来源:https://www.xzbu.com/1/view-1665005.htm