在线客服

咨询热线

基于压缩感知的单目标多尺度跟踪关键算法研究

作者:未知

  【摘要】目标跟踪是视频监控、视频压缩、人工智能等所必须的技术,本文提出针对目标跟踪提出了解决问题的关键算法,用于解决目标跟踪过程中遇到的干扰。
  一、绪论
  “天眼”是指视频监控,视频监控已经在城市道路,商场监控,车站机场等公共场合得到了普遍应用,随着移动终端的兴起,家庭等私人场所的监控使用的数量也是与日俱增。传统的视频监控系统主要是以闭路电视录像的方式进行记录和保存,当遇到异常情况时需要调用相关视频时,需要工作人员对视频记录进行异常分析来查找原因,或者需要专门的技术人员一直盯着监控屏幕的方式来进行场景实时监控,这种方式需要有人长时间盯着监控器,容易造成人员视觉疲劳,对于实时监控,长时间监视屏幕也容易出现漏报、误报等现象以及不能及时发现异常。由于受到光照变化,目标形变以及突然加速等因素的干扰,建立一个稳定、效率高的跟踪系统仍然非常具有挑战性。本文我们提出了两种鲁棒实时的跟踪算法:基于预测的多尺度压缩跟踪算法和基于颜色修正的多尺度压缩跟踪算法,用于解决跟踪过程中遇到的干扰。
  二、目标跟踪概述
  一个成熟完善的监控系统由视频采集、图像预处理、目标检测、目标分类、目标跟踪、异常检测、事件分析与理解和预警报警等几个步骤组成。其中,目标跟踪是其中一个视频监控中重要的功能模块,它的作用是检测出需要的目标对象,然后通过跟踪目标对象并获得其运动轨迹,为上层算法提供判断分析的数据。
  视频中的目标跟踪主要有目标对象、搜索机制和模型更新三部分组成。
  由于Lucas 和 Kanade的重要贡献,全局模板被提出用于目标跟踪。随后,为了适应表观模型的变化,提出了基于子空间的跟踪算法[1]。Mei和Ling提出基于稀疏表示的跟踪算法来处理目标跟踪中发生的表观模型受到损坏的情况。除了基于模板的表示方法,还有颜色信息表示、边缘直方图信息表示、梯度直方图信息表示,灰度特征以及纹理特征等[2]。依据表示方式不同,目标跟踪有不同的分类方法。依据文献[3]提出的分类方法,可以把基于目标特征的跟踪分为三类,即基于点特征的跟踪、基于边缘轮廓以及剪影特征的跟踪以及基于目标对象外观特征构建的跟踪。
  基于点特征的跟踪是使用点集来对表示目标对象,通过对前后两帧图像中的相关点集进行检测来实现跟踪目标,根据所采用的点特征的方法,基于点特征的目标跟踪又分为基于贝叶斯模型的后验概率统计方法和确定性计算方法;后验概率性统计方法是通过观测模型和测量模型来估计目标的最终状态[3]。比较著名的后验概率算法有卡尔曼滤波跟踪算法、扩展的卡尔曼滤波算法和粒子滤波跟踪算法[3]。由于卡尔曼滤波要求被跟踪目标的观测状态和预测状态都要服从线性高斯分布才能进行,而现实目标跟踪中,这样的情况很难实现,所以Rosales等对卡尔曼滤波进行了改进,提出了改进的扩展卡尔曼滤波(Extended Kalman Filter,EKF),扩展的卡尔曼滤波只要求跟踪目标服从高斯分布就可运用,但在实际使用中还是受到了一定的限制;Kitagawa等提出了粒子滤波跟踪算法对卡尔曼滤波进一步改进,粒子滤波跟踪算法对被跟踪目标的观测状态和预测状态没有作要求,因此,可以更好的满足现实目标跟踪的需要。确定性方法则是在一定约束条件下,通过代价函数建立相邻两帧间点的对应关系。
  基于线跟踪是利用目标对象的边界或者轮廓信息来表示目标对象,然后通过轮廓演变或者形状匹配来跟踪目标对象。这类跟踪一般分为两类:形状匹配和外形跟踪。基于面跟踪通过构建跟踪对象的外观信息来表示跟踪对象,然后在后续帧中以一定的搜索机制搜索目标,并在搜索到目标后更新目标外观信息。根据对目标外观信息表述的不同,可以将基于面的跟踪分为两类:产生式表观模型跟踪算法和判别式表观模型跟踪算法。产生式表观模型跟踪方法是只利用目标本身的表观信息来建立模型,而后通过搜索算法在下一帧中搜索目标。而判别式跟踪方法是把跟踪当成二分类问题,利用分类器把目标从背景中分离出来,不仅需要用到目标本身的信息,也要用到背景信息。较为典型的相关文献有生成模型的基于稀疏表达的外观模型[4],基于正交匹配追踪的外观模型[5],增量学习方法[6]等。这些已有的生成式外观模型最大的问题在于,外观特征的学习需要的训练样本数目较多,为了降低计算复杂度,只能在线下學习并假设目标外观在整个跟踪过程中是不变的。而且生成式模型不能充分利用目标附近的背景信息,这些背景信息往往有利于提升跟踪效果。比较典型的判别式跟踪模型有利用支持向量机分类器的跟踪,在线提升跟踪算法,半监督在线提升跟踪算法,多实例学习跟踪算法,压缩跟踪算法等。
  三、压缩感知在目标跟踪中的应用
  在视频视觉跟踪领域有很多的基于稀疏表示和压缩感知的跟踪算法。这些算法用一些目标模板的稀疏线性组合来表示目标。一些模板利用Li规则最小化可以很近似的表示一个目标。在文献[7]中,最小误差边界策略被引用进来,但仍然远不能达到实时性的要求。在文献[8]中,Li等人利用正交匹配基跟踪算法扩展了L1跟踪算法,虽然效率得到了很大的提高,实现了实时跟踪,但由于不能充分利用目标附近的背景信息,往往导致跟踪的效果不是很好。Kaihua Zhang等人提出将压缩感知理论应用到目标跟踪中去降低提取的特征的维数,提出了压缩跟踪,由于采用非常稀疏的随机投影矩阵,使得在压缩域内的计算复杂度大大降低。该算法简单、实时、高效,但还存在一些问题,如没有充分利用目标的上下文信息,当目标突然加速或者光照变化大时,容易发生漂移,甚至丢失目标;由于使用了固定尺度的跟踪框,在跟踪过程中由于目标尺度的变化,容易发生跟踪漂移的问题。Huilan Luo等提出了结合目标预测位置的压缩跟踪,利用前帧的信息预测目标在下一帧的位置,并结合检测,取得了良好的效果,但是尺度没有变化,还是容易出现漂移问题。后来,Kaihua Zhang等人在压缩跟踪的基础上,提出了快速的压缩跟踪,并提出了尺度的变化,但尺度变化不明显。Yunxia Wu等人在压缩跟踪的基础上提出了多尺度跟踪,把粒子滤波和压缩跟踪结合,解决了尺度变化问题,取得了比较好的效果,但对遮挡情况效果不理想。   四、基于预测的多尺度压缩跟踪
  目标跟踪是计算机视觉研究领域的一个热门课题,在社会生活中的应用越来越广。由于跟踪过程中,跟踪环境的复杂多变,跟踪目标外观易受到光线干扰、运动目标大小尺度发生变化、运动目标与摄像机之间的角度的偏移造成的目标观测外观变化、背景和目标的相似性干扰、对目标遮挡以及运动突然加速造成的目标外观模糊等情况,开发一个性能满足需要,又适应多个场景中干扰因素的算法非常困难。在通过检测实现跟踪的算法中,Kaihua Zhang等提出用压缩感知对正负采样样本降维跟踪的算法,提高了目标跟踪处理的速度。但是,该算法有以下不足:第一,由于采用了固定大小的跟踪框来检测识别目标,使得目标在跟踪过程中,跟踪框不能随目标尺度变化而变化,从而影响目标跟踪的鲁棒性;第二,在搜索目标位置时,由于选用了固定半径的搜索策略。这使得目标在跟踪过程中,不能运行的太快或偏离上一帧目标位置太远,否则,搜索半径就会很大,影响跟踪的实时性;第三,没有充分前一帧中的信息,比如可以提高跟踪性能的背景信息。本文针对以上问题,提出了基于预测的多尺度压缩跟踪算法,通过利用上一帧目标的位置信息,预测目标的大概位置;然后再在该位置精搜索目标的准确位置,并利用尺度空间信息量的度量方法,来实现目标的多尺度自适应变化;最后,在对贝叶斯分类器参数的更新上,采用了非线性的更新方式,对处理遮挡问题有更好的效果。通过在benchmark挑战图像序列中的测试,我们的算法与CT、FCT、MSCT算法进行了对比,实验证明总体表现都比上述基于压缩跟踪的算法效果要好。
  五、关键算法
  1、目标的压缩特征提取方法。在基于检测的跟踪中,需要提取一些目标特征来表示目标。而为了减少计算量,传统的方法,有的是构建子空间模型来表示目标,有的是利用增量子空间模型表示目标来适应目标外观的变化,有的通过支持向量机(SVM)来提高判别特征的选择,但是这些方法的计算复杂度高,不能满足实际应用的需要。为了降低计算量,本文拟在目标附近选取一些正样本块,在远离目标的区域取一些负样本块,再将这些样本与方框滤波器进行卷积,得到正负样本的高维特征向量;由于高维特征向量的维数仍然很大,进一步利用测量矩阵对高维特征向量进行降维,可大大的降低运算量,得到压缩域内的正负样本特征向量,初步研究表明,该降维后的特征基本保留了原向量的大部分信息,对跟踪的精度影响较小。
  2、目标的压缩特征的多尺度表示方法。在目前的跟踪方法中,大部分跟踪使用固定大小的跟踪框检测识别样本,跟踪框不随目标尺度变化而改变,无法适应目標尺度变化对跟踪效果的影响,从而影响跟踪的效果。本项目拟通过正负样本与多尺度方框滤波器进行卷积得到正负样本的高维多尺度特征向量,然后再通过测量矩阵的投影,得到压缩域的低维的多尺度特征,以实现目标尺度变化的鲁棒性。
  3、压缩目标位置的预测方法:在大多数的跟踪方法中,把跟踪看成对每一帧的检测问题,即基于检测的跟踪问题。由于只考虑当前帧的信息,忽略了时空信息,造成跟踪算法存在以下的以下问题:1)跟踪目标突然加速或者漂移时,在当前帧检测目标搜索的范围就会相应的变大,相应的计算量也会明显的提高,影响跟踪的实时性。2)由于没有充分利用时空上下文帧的信息,当目标被遮挡时,因检测不到目标造成跟踪失败,丢失目标。结合预测目标位置的跟踪算法,可以利用前一帧的信息,通过预测算法预测目标在下一帧的位置,不仅可以减少目标的搜索范围,对目标遮挡也有一定的免疫性。因此对目标位置的预测对于提高算法的速度和鲁棒性都非常有必要。Mean-shift算法是一种基于核概率密度估计的无参数算法。该类算法应用于预测目标位置有很好的效果。本文拟采用修正的背景权重直方图框架的mean-shift方法预测目标的位置,该方法通过降低目标跟踪中目标模型和背景模型的显著背景特征来减少背景干扰,更准确的预测目标的位置。
  4、多尺度描述下的特征搜索策略:在基于检测的跟踪算法中,目标的搜索影响着跟踪的速度,精确度和稳定性。传统的跟踪算法中,对目标的检测一般是在目标的上一帧位置处开始搜索,这就要求在目标跟踪过程中,不能运动太快或偏离目标在上一帧的位置处太远,否则需要搜索的半径就非常大,并且要求目标跟踪中要始终比较精确,否则会存在积累错误,造成目标的最终跟丢。因此,选择一个好的搜索策略,不仅影响到跟踪的速度,还影响到跟踪的稳定性和精确性。本文拟采用先粗后精的搜索策略,先通过上一帧的信息预测目标在下一帧的位置,然后在该预测位置以半径25,步长4搜索到目标的大致位置,再在此位置以半径10,步长1搜索目标的最终位置,这可以很大程度减少计算量,提高跟踪的速度;并且结合预测的目标位置,还可以减少对漂移的影响,提高跟踪的精度。
  基金项目:云南省教育厅指导性项目《基于压缩感知的单目标多尺度跟踪算法研究》(201ZDX139)
  参考文献:
  [1]Baker S,Matthews I. Lucas-kanade 20 years on: A unifyingframework[J]. International journal of computer vision, 2004,56(3): 221-255.
  [2]X. Mei and H. Ling. Robust Visual Tracking using L1Minimization. In ICCV, 2009.
  [3]蒋良卫. 图像序列中目标跟踪技术研究[D].华中科技大学,2013.
  [4]Mei X, Ling H. Robust visual tracking and vehicleclassification via sparse representation[J]. IEEE Transactions onPattern Analysis and Machine Intelligence. 2011, 33(11):2259-2272.
  [5]Li H,Shen C,Shi Q. Real-time visual tracking usingcompressive sensing[C]// IEEE Conference on ComputerVision and Pattern Recognition (CVPR). 2011: 1305-1312.
  [6]Ross D A,Lim J,Lin R S,et al. Incremental learning forrobust visual tracking[J]. International Journal of ComputerVision, 2008, 77(1-3): 125-141.
  [7]Grabner H, Grabner M, Bischof H. Real-Time Tracking viaOn-line Boosting[C]// British Machine Vision Conference2006, Edinburgh, Uk, September. 2006:47-56.
  [8]Grabner H,Leistner C,Bischof H. Semi-supervised on-lineboosting for robust tracking[M]//Computer Vision–ECCV2008. Springer Berlin Heidelberg,2008: 234-247.
转载注明来源:https://www.xzbu.com/2/view-14969989.htm