基于机器视觉的运动目标检测算法综述
来源:用户上传
作者:张冬梅 武杰 李丕丁
摘要:近年来,机器视觉技术的发展越来越迅速,对视觉图像信息的智能处理也成为了研究重点,基于人工智能算法和资源构架的运动目标检测算法作为机器视觉领域的核心技术,在很多领域中发挥着关键性作用,具有重要的研究意义,本文首先对运动的目标检测过程中所用到的相关图像处理方法进行了描述,包括图像的预处理、分割、特征提取等方法。其次描述了这几年来常用的运动目标检测算法,即光流法、帧间差分法、背景差分法。简单分析了方法原理、对比了3个方法的优缺点,并介绍了这几个算法的适用场景。
关键词: 机器视觉技术; 图像预处理; 图像分割; 特征提取; 运动目标检测
【Abstract】 In recent years, The development of machine vision technology is more and more rapid, and the intelligent processing of visual image information has also become a research focus. The motion target detection algorithm based on artificial intelligence algorithm and resource architecture is the core technology in the field of machine vision, which plays an important role in many fields and has great research significance. This paper first describes the related image processing methods used in the detection of moving target, including image preprocessing, segmentation and feature extraction. Secondly, the paper describes the moving target detection algorithms commonly used in recent years , including optical flow method, interframe difference method and background difference method. Finally, the paper briefly analyzes the corresponding theories, compares the advantages and disadvantages of the three methods and introduces the applicable scenarios of these algorithms.
【Key words】 machine vision; image preprocessing; image segmentation; feature extraction; moving target detection
0 引 言
机器视觉是一个可以自动获取有关目标图像,并对所得图像的各种特征进行分析、处理及对结果做出解释,从而得到有关目标的某种认识来做出决策的系统。运动目标检测技术是机器视觉系统的功能之一,是指在序列图像中检测出变化区域并将运动目标从背景图像中提取出来的过程,该项研究旨在通过检测出视频图像序列中与摄像头发生相对移动的运动物体,为后续目标的提取和跟踪提供具有说服力的数据源。运动目标检测算法通常面向于特定的应用场景,目前还没有一个通用的算法能适用于所有场合,也就是说每个算法都有其一定的应用范围。即使这些检测算法在同一环境下工作,也是各有优缺点。运动目标检测算法从应用对象的角度来看,主要分为2种:光流法和图像相邻帧间的差分算法。其中,基于图像相邻帧间的差分算法还可以分为帧差法和背景相减法。
1 机器视觉图像预处理
通常情况下,因为有很多噪声的干扰和条件上的限制,运动目标检测系统获取的图像不能直接在视觉系统中使用,而是先要进行图像预处理来提高所获取的图片的质量。图像预处理的目的是消除图像中无用的噪声来改善有用信息的可检测性,通常包含着灰度化、几何变换、图像增强这几个流程[1],主要方法有平均值法、最大值法、加权平均值法和分量法[1]。其中,图像几何变换通过图像平移、图像镜像、图像转置、图像旋转、图像缩放等几何变换对采集的图像进行处理[1],用于修正图片采集仪器位置的随机误差和采集系统中的系统误差。图像增强可分为空域法和频域法[1]。目前使用较多的是空域法,空域法大致可分为3种类型,分别为:灰度变换、用于消除噪声的各类平滑方法以及用于增强边缘的各类锐化方法。其中,灰度变换是在图像的单个像素上操作的,通过点运算来改变图像像素的灰度值;而平滑和锐化都是通过图像滤波来进行操作的。图像滤波可分为线性滤波和非线性滤波[2-3]。因为非线性滤波既可以保护图像细节又可以去除噪声,所以成为了当前图像滤波方法中的研究热点。非线性滤波最常用的方法有Kalman滤波和粒子滤波。Kalman滤波简单易实现,具有良好的鲁棒性[4],被普遍应用在机器视觉跟踪领域 。虽然粒子滤波算法[5]可以作为解决SLAM问题的有效手段,但是仍然存在需要用大量的样本数量、样本贫化、样本数量的自适应采样策略等问题,是当前该算法的研究重点。图像的预处理在机器视觉图像目标识别的过程中起到了重要的作用。
2 机器视觉图像分割
图像分割是指利用颜色、灰度、纹理和空间几何等特征把图像分成若干个特定的区域,使这些特征在同一块区域里显示出相似性或者相同性,但是在不同的區域又显示出明显的差异性。图像分割是机器视觉中对图像目标自动识别的关键步骤,其分割后的图像质量对后面图像分析处理有着重要的影响。如何快速、精确地把目标从复杂的图像中分割出来是国内外学者一直以来的研究重点[2]。图像分割的常用方法有区域分割法、阈值分割法、边缘检测法[6]。近年来还提出了深度学习分割法[7],其基本思想是通过建立神经网络,对样本进行训练来达到分割的目的。但是该方法也有一定不足,就是需要对大量的数据进行训练、没有一个通用的网络结构。
转载注明来源:https://www.xzbu.com/8/view-15265579.htm