您好, 访客   登录/注册

基于SSD的道路车辆目标检测

来源:用户上传      作者:

  摘 要:针对道路交通场景下的3类目标(小车,公交车,卡车),本文先创建特定场景下的目标数据集,并对其中的数据标注规则,标注方法以及标注手段进行实验。采用SSD目标检测算法,训练得到特定场景下的目标检测模型,并融合数据增广等方式对数据集优化。通过实验分析,本文的训练模型检测准确度高,并且模型的鲁棒性好。
  关键词:SSD;自制数据集;检测模型
  道路交通运输行业在国民经济发展中发挥着重要作用,越来越多的机动车涌入道路,如果对道路中的目标不加以交通管制或采取一定的措施防范控制道路中目标的数量,将会引发更多的交通问题,例如:交通拥堵和交通违章越来越严重,致使交通中文明出行变得微乎其微。随着互联网时代的到来,各种智能硬件设备应用到交通场景,有效的缓解了部分交通问题。但是,由于硬件设备的安装繁杂、老化严重以及更新成本巨大,使交通管理部门的运营成本昂贵,本文分析一种基于视频分析的交通监控算法,不仅降低了交通管理的运营成本,而且其准确度相比部分硬件设备有了明显的提高。
  1 常见的目标检测算法
  目标检测目前有one-stage和two-stage两种,two-stage指的是检测算法需要分两步完成,首先需要获取候选区域,然后进行分类,比如R-CNN系列;与之相对的是one-stage检测,可以理解为一步到位,不需要单独寻找候选区域,典型的有SSD/YOLO。
  1.1 基于候选区域的目标检测
  首先将每个像素作为一组,求出各自的特征,然后将两个最为接近的特征进行组合。为了避免大目标对小目标的淹没,需设置不同尺度大小的ROI区域,在不同的卷积层进行矩形框的组合。这些区域被转换为固定大小的图像,并分别送到卷积神经网络中。在输出层采用SVM分类器,使用Logic函数计算损失来修正边界框,以实现目标分类并得到边界框。
  1.2 基于端对端学习的目标检测
  该类方法无需预先提取候选区域,以YOLO目标检测算法为例,整个模型的训练和检测都进行了简化,其将目标检测的类别和位置同时进行预测,可以归纳为回归问题。主要步骤为:卷积层进行图像特征提取;全连接层用于后续类别和目标位置的回归预测。
  2 SSD目标检测算法
  2.1 算法原理
  一种基于回归的SSD检测模型,其不同于候选框提取的目标检测算法,例如:Faster R-CNN检测算法,此算法不再提取候选框以及对像素或特征进行采样,其将所有计算封装在单网络中使得SSD容易训练或直接集成到需要检测组件的系统。同时,SSD对不同大小的输入图像的目标检测具有更好的精度,更快的速度。
  SSD的模型结构使用VGG-16网络作为基础,然后添加额外的特征提取层,在不断进行卷积的时候,得到的特征图尺寸逐渐减小而后输入到Extra feature层用来得到多个尺度检测的预测值,形成了多个输出路径。为了简化说明,我们把模型简化为单输出的网络,即只有一个输出路径,每个路径都是一个全卷积网络。
  2.2 模型的训练
  SSD算法中实现了多种数据集的训练方法,而对于自己的数据集需要修改文件中的不同参数设置以及对训练方法进行改进才能使得训练出来的模型适合特定的应用场景。下面将对训练方法做具体分析:
  (1)采集数据样本,对分辨率不高或目标不明显的图像和视频帧删除,统计所有样本,并把目标的矩形坐标保存到文本文件,保证图像和目标矩形框能一一对应。
  (2)生成训练数据集,先将图片和标签文件轉化为LevelDB或lmDB数据库,我们将训练验证集和测试集以一定的比例划分开,最后将这些数据库格式的文件输入到深度学习的网络中。
  3 实验结果
  通过对不同数据集的训练,得到其不同输出结果的训练模型。并将训练模型用于检测高速公路场景内的目标,实验发现:小车类的检测准确度较高其平均准确度为93.2%,公交类的检测平均准确度为89.7%,卡车类的准确度为87.4%,主要由于卡车类的训练目标较少。可以看出,这三类目标检测性能较好,基本符合应用场景。
  其次,我们对SSD中不同的基础网络模型也进行了测试分析,可以发现:当使用ResNet101基础网络框架再结合分类器能够检测出场景内的更多目标,而基于VGG19和ZFNet5基础网络结构检测三类目标的准确度略低,说明在一定范围内卷积层数越多,检测准确度越好。另外,对不同输入尺度的图像或视频流(本文分析了300x300和512x512),模型的检测速度差异很大,对于场景中目标不多且明显的车辆,可以采用速度较快的300x300的图像大小作为输入。
  4 结语
  本文创建了特定场景下的数据集,训练不同的网络模型并对网络训练过程中的参数微调和模型优化进行测试分析。通过实验分析,本文采用的SSD目标检测算法,在自制数据集上性能表现良好,后期主要研究如何把模型参数进行压缩,在嵌入式设备中进行实时检测目标。
  参考文献:
  [1]张向清.高速公路场景下基于深度学习的车辆目标检测与应用研究[D].长安大学.
  [2]张文桂.基于深度学习的车辆检测方法研究[D].华南理工大学,2016.
  [3]张向清.基于深度学习方法的复杂场景下车辆目标检测[J].计算机应用研究,2018,35(4):1270-1273.
  作者简介:张向清(1991-),男,陕西榆林人,硕士,信息与通信工程专业。
转载注明来源:https://www.xzbu.com/1/view-15146632.htm