您好, 访客   登录/注册

基于内容图像检索的关键技术探析

来源:用户上传      作者: 张新华

  [摘要]围绕基于内容图像检索中的关键技术,系统地研究图像各种特征的提取技术。主要包括图像的颜色特征、形状特征以及颜色的空间分布特征以及相关反馈技术,介绍多特征提取的特点,并对CBIR技术的未来发展做展望。
  [关键词]基于内容的图像检索相关反馈
  中图分类号:TP3文献标识码:A文章编号:1671-7597(2009)1210078-01
  伴随着计算机信息处理能力的提高和网络资源的广泛应用,各类资源日益丰富,尤其是直观、形象的图像资源备受人们的青睐。近年来很多领域实现了大规模图像数据库,如何高效、准确的在数据库中检索图像成为了关键。
  于是人们提出了基于图像内容的图像检索(Content Based Image Retrieval,简称CBIR)技术。这一技术可由机器自动提取包含图像内容的颜色、纹理、形状和空间关系等可视特征,对数据库中图像和查询样本图像在特征空间进行相似匹配,检索出与样本相似的图像,在相关反馈逐步成熟的过程中,也不断提高检索的准确性。基于内容的图像检索技术克服了传统检索方法的缺陷,具有检索效率的优越性,成为当前的研究热点。
  
  一、基于内容图像检索技术的分类
  
  当前,图像检索技术等研究主要停留在根据图像的颜色、纹理、形状、空间关系等基本特征进行检索这一等级[2]。
  (一)基于颜色特征的检索。颜色特征是图像最直观、最明显的特征,是图像内容组成的基本要素,是人眼识别图像的主要感知特征之一。颜色特征非常稳定,对于旋转、平移、尺度变化,甚至各种形变都不敏感,表现出相当强的鲁棒性[3]。该类方法的核心思想是在一定的色彩空间对图像各种色彩出现的频数进行统计。目前的图像检索多是基于颜色直方图,颜色直方图法具有运算速度快、存储空间要求低的特点,并且具有图像的尺度及旋转变化不敏感等特点,因此得到了广泛关注。但是,基于不同颜色空间的检索系统的查询效果不同,没有统一的标准,增加了对各种检索系统评价的难度。
  (二)基于纹理特征的检索。纹理是指图像中所具有的局部不规则而宏观有规律的特性。其本质是刻画像素的邻域灰度空间分布规律[4]。人们公认的一个有效的纹理表达方法是共生矩阵,现有的纹理特征与人的相似性感知之间还存在较大差异,且依赖于具体的纹理图像的性质,缺乏一定的通用性且计算量大。而且,单纯依靠纹理特征进行图像检索,其应用范围较窄。要进一步提高检索精度及其实用性,在实际应用中还需综合考虑图像的颜色及其分布等其它视觉信息。
  (三)基于形状特征的检索。形状是图像的重要视觉特征之一,形状是刻画物体最本质的特征,也是最难描述的特征之一,主要难在对图像中感兴趣目标的分割。目前,基于形状特征的检索主要是围绕着从形状的轮廓特征和形状的区域特征建立图像索引,关于前者的描述主要有:直线段描述、样条拟合曲线、傅里叶描述子以及高斯参数曲线等;对于后者主要有形状的无关矩、区域的面积、形状的纵横比等。相对颜色和纹理特征来说,基于形状特征的检索比较困难。其关键在于对图像中感兴趣对象的形状的提取和描述。
  (四)空间关系特征。图像中对象所在的位置和对象之间的空间关系同样是图像检索中非常重要的特征。提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。用空间关系特征来进行图像检索,一直是图像数据库检索的重要研究方向。
  (五)基于语义的图像检索。前面的论述是基于图像的低层特征进行检索的讨论,在理想状况下,图像的检索是用户根据图像的含义进行的检索。图像的含义包含了人对图像的理解,这种理解是无法直接从图像的视觉特征获得的,而要根据人的知识经验来判断。研究者普遍认为,可以通过嵌入知识表示、推理学习机制和机器学习技术,采用统计的方法自动建立图像多维信息特征的索引结构,自动选取合适的低层特征及其组合以实现图像与其语义内容的对应,有效地实现基于图像语义的检索。
  
  二、图像检索过程中的相关反馈
  
  相关反馈是一种交互式检索过程,用户被要求对系统当前的检索结果给出相关性的判断,系统再动态地学习用户反馈,以更好地把握用户的信息需求,给出更好的检索结果。基于内容的图像检索系统应该尽可能地做到以用户为中心,而不是以计算机为中心。反馈是调整技术以适应用户需求和提高检索精度的常用手段。
  
  三、基于综合特征的图像检索算法研究
  
  一幅图像往往可以具有如颜色、纹理、形状等多个特征,同一图像的同一特征,也有多种不同的表示方法。使用多特征的综合检索方法时可以在颜色、纹理、形状等几种查询特征中,选择两种或两种以上进行综合查询,提高了检索的准确率。纹理、颜色、形状等都是图像检索中使用极为频繁的视觉特征,但是由于人眼睛的特殊生理结构,观察图像时往往不是只基于一个特征,而是综合多个特征。实验证明:基于多种特征的图像检索系统无论在哪个方面都优于基于单一视觉特征的图像检索系统。
  
  四、未来研究热点
  
  如前所述,即使是同一图像的同一特征,也有多种不同的表示方法。使用多特征的综合检索方法时可以在颜色、纹理、形状等几种查询特征中,选择两种或两种以上进行综合查询,提高了检索的准确率。
  1.综合多种视觉特征进行检索需要解决的一个重要问题就是算法匹配结果的归一化。它们的期望、方差可能会相差很远,所以必须进行归一化,这样才能保证不同的算法在加权重处于平等的地位。
  2.如何解决检索精度和检索效率之间的矛盾。要提高检索精度,就需要加入更多的特征量,这就必然提高特征向量的维数,使系统计算量成倍增大,降低检索效率。采取适当的措施,平衡检索精度和检索效率之间的矛盾,是在基于内容的图像检索中不变的一个重点研究方向。
  3.在基于图像底层特征提取的基础上,实现基于语义的图像特征提取。使得检索智能化,是今后研究的热点之一。
  
  参考文献:
  [1]钱纪初,基于内容的图片检索研究[D].浙江:浙江工业大学,2007.
  [2]冯国光、齐影虹、肖扬波,基于内容的图像检索技术综述[J].科技广场,2007,(3):233-236.
  [3]张涛、张星明,基于内容的图像检索技术[J].广州大学学报(自然科学版),2004,10.
  [4]Suresh K.Choubey,Vijay V.Raghavan.Generic and fully antomatic content-based image retrieval using color[J].Pattern recognition letters,1997,18:1233-1240.
  作者简介:
  张新华(1982-),女,山西太原人,太原理工大学计算机与软件学院在职研究生,太原大学外语师范学院现代信息技术系助讲,研究方向:计算机应用技术。


转载注明来源:https://www.xzbu.com/8/view-1067035.htm