您好, 访客   登录/注册

基于半监督学习的行人检测方法研究

来源:用户上传      作者: 马志伟 崔荣一 金小峰

  摘 要:本文提出了基于半监督学习的行人检测方法,用以解决大量的无标记样本问题。在集成分类器的训练过程中,选择BP神经网络分类器、SVM分类器和KNN分类器作为3个子分类器,利用协同训练机制对各个子分类器进行协同训练。针对半监督学习中误标记样本问题,引入富信息策略和辅助学习策略消除训练过程引入的噪声,同时充分利用无标记样例,进而提高分类器的分类精度。通过对测试集和实时视频进行的行人检测实验,证明了本文方法的可行性和有效性。
  关键词:行人检测;半监督;协同训练;BP神经网络;支持向量机
  中图分类号:TP391.41 文献标识码: A DoI: 10.3969/j.issn.1003-6970.2012.06.007
  Research on pedestrian detection based on semi-supervised learning
  Ma Zhi-wei, CUI rong-yi, JIN Xiao-feng
  (Intelligent Information Processing Lab., Dept. of Computer Science & Technology, Yanbian University, Yanji 133002, China)
  【Abstract】 In order to implement effective detection and utilize large numbers of unlabeled samples, a pedestrian detection method
  based on Semi-Supervised learning was presented in this paper. Firstly, BP neural networks classifier, SVM classifier and KNN classifier were selected as the three sub-classifiers, and then, the Co-Training mechanism was adopted to train each classifier. Rich information strategy and assistant learning strategy were added in to remove the wrong-marked samples and improve the accuracy of the algorithm by making the most of unlabeled samples. through the experiments on the test set and real time videos, the feasibility and effectiveness of the approach are verified well.
  【Key words】 pedestrian detection; Semi-Supervised learning; Co-Training; BP neural networks; SVM
   0 引言
  行人检测是当前目标检测方面的研究热点之一,在视频监控、智能交通、人机交互、虚拟现实等领域有着广泛的应用[1-2]。基于视觉的行人检测属于人体运动分析的研究范畴,通过对人体的检测、跟踪、轨迹分析以及行为识别,系统可实时检测异常事件并报警,变被动监视为主动预警。行人检测除了具有的服饰变化、姿态变化、模式多样等难点外,还具有中远距离行人分辨率低、特征信息不明显、场景复杂多变等问题,这些困难使得行人检测成为一个极具挑战性的研究课题[3]。
  目前比较常用的行人检测方法大致分为两大类[4]: 基于形状的方法和基于统计学习的方法。
  1) 基于形状的方法又分为基于明确人体模型的方法[5]和基于模板匹配的方法[6]。前者需要构造明确的人体模型,可以处理遮挡问题及推断出人体的姿态,缺点是模型比较难构建,模型求解也比较复杂;后者通过存储一些灰度或轮廓模板来表示行人,其算法简单,但很难构造出足够的模板以处理不同的行人姿态。
  2) 基于统计分类的方法通过从一系列训练数据中学习得到一个分类器。该方法的优点是鲁棒性较好,缺点是需要很多训练数据,并且很难解决姿态和遮挡的问题。常用的统计分类方法有基于神经网络(NN)的方法[7]、基于支持向量机(SVM)的方法[8,9]和基于Adaboost的方法[10]。
  在很多实际数据集中,未标记样例的数量远大于已标记样例的数量。如果只使用少量已标记样例,训练得到的学习模型不具有很好的泛化能力,同时造成大量未标记样例的浪费;如果只使用大量未标记样例,将会忽略已标记样例的价值,而且所得学习模型不够精确[11]。针对行人检测问题,本文提出了一种基于半监督学习的行人检测方法。该方法通过多分类器的协同训练机制,不断利用已标记样本和未标记样例优化各个子分类器,同时采用辅助学习策略剔除因误分类而引入的错误样本,直至最终集成分类器性能不再变化。
   1 结合辅助学习策略的协同训练半监督学习
  半监督学习的基本思想是利用数据分布上的模型假设,建立学习器对未标记样例进行标记[12,13]。如何综合利用已标记样例和无标记样例,是半监督学习需要解决的问题。协同训练
  从图3中可以看出,本文方法可以应用于实时行人检测,并得到较好的检测结果。场景一的检测效果要优于场景二,这主要由于场景二较场景一复杂,光照变化、树木摇摆等因素影响使得背景重建效果差,检测效果下降。实验中,车辆等对于不满足统计特征的ROIs可以进行有效的滤除,但背景重构效果差的区域不能获得有效ROIs,进而无法进行行人检测,因此ROIs分割对于检测系统起到相当大的作用。
  本文针对复杂场景中的行人检测问题, 提出了基于半监督的行人检测方法,解决行人检测中无标记样本问题。该方法通过协同训练机制和辅助学习策略,利用大量的无标记样例,同时有效剔除因误分类而引入的错误标记样本,提高了集成分类器的整体性能。实验结果表明了该方法的有效性。
  通过实验发现,尽管行人分类器设计是方法的核心,但前期的ROIs分割直接决定了行人检测的整体效果,因此如何在复杂场景中进行快速目标分割及构造适应性强、计算代价低的行人检测分类器是需要进行的下一步研究工作。 Jia H X, Zhang Y J. A Survey of Computer Vision based Pedestrian Detection for Driver Assistance Systems[J]. Acta Electronic Sinica, 2007, 33(1): 84-90. (in Chinese)
  [4] 杨涛, 李静. 基于场景模型与统计学习的鲁棒行人检测算法[J].自动化学报, 2010, 36(4): 499-508. Yang T, Li J. Scene Modeling and Statistical Learning Based Robust Pedestrian Detection Algorithm[J]. Acta Electronic Sinica, 2010, 36(4): 499-508. (in Chinese)
  [5] Yasuno M, Yasuda N, Aoki M. Pedestrian Detection and Tracking in Far Infrared Images. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC, USA, 2004: 125-125.
  [6] Leibe B, Seemann E, Schiele B. Pedestrian Detection in Crowded Scenes. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. San Diego, USA, 2005: 878-885.
  [7] Zhao L, Thorpe C. Stereo and Neural Network-based Pedestrian Detection[J]. IEEE Transactions on Intelligent Transportation Systems, 2000, 1(3): 148-154.
  [8] Grubb G, Zelinsky A, Nilsson L, et al. 3D Vision Sensing for Improved Pedestrian Safety. Proceedings of IEEE Intelligent Vehicles Symposium. Parma, Italy, 2004: 19-24.
  [9] Dalai N, Triggs B. Histograms of Oriented Gradients for Human Detection. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. San Diego, USA, 2005: 886-893.
  [10] Benezeth Y, Emile B, Laurent H, et al. Vision-Based System for Human Detection and Tracking in Indoor Environment[J]. International Journal of Social Robotics, 2010, 2(1): 41-52.
  [11] Zhou Z H, Zhan D C, Yang Q. Semi-Supervised Learning with Very Labeled Training Examples. Proceedings of the 22nd National Conference on Artificial Intelligence. Melbourne, Australia. 2007: 675-68.
  [12] 鲁珂, 赵继东, 叶娅兰等. 一种用于图像检索的新型半监督学习算法[J]. 电子科技大学学报, 2005, 34(5): 669-673. Lu K, Zhao J D, Ye Y L, et al. Algorithm for SemiSupervised Learning in Image Retrieval[J]. Journal of University of Electronic Science and Technology of China, 2005, 34(5): 669-673. (in Chinese)
  [13] 孙广玲, 唐降龙. 基于分层高斯混合模型的半监督学习算法[J].计算机研究与发展, 2004, 41(1): 156-160. Sun G L, Tang J L. A Semi-Supervised Learning Algorithm based on a Hierarchical GMM[J]. Journal of Computer Research and Development, 2004, 41(1): 156-160. (in Chinese)
  [14] Zhou Z H, Li M. Tri-training: Exploiting Unlabeled Data Using Three Classifiers[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(11): 1529-154.
  [15] Zivkovic Z, Heijden F V. Efficient Adaptive Density Estimation per Image Pixel for the Task of Background Subtraction[J]. Pattern Recognition Letters, 2006, 27(7): 773-780.
转载注明来源:https://www.xzbu.com/8/view-3717297.htm