您好, 访客   登录/注册

基于RetinaNet的精细化车辆型号识别研究

来源:用户上传      作者:

  摘要:在当下的智能交通领域车辆目标识别的许多方法中,基于深度学习的视觉识别方法具有卓越的效果。通过对主流的one-step与two-step模型结构及特点的分析,提出了一套基于RetinaNet深度学习的车辆检测识别系统,使用ResNet101获取图像特征,基于Focal Loss损失函数构建精细化车辆型号识别模型,利用Stanford Car DataSet数据集进行训练,并使用实际场景中的图像进行测试。实验结果表明,该系统具有良好的用户界面,优越的性能,较高的识别准确度,解决了复杂交通场景下多型号车辆识别的问题。
  关键词:深度学习;RetinaNet;ResNet;Stanford Car DataSet
  中图分类号:TP368.1 文献标识码:A 文章编号:1007-9416(2019)11-0072-02
  1 研究内容
  1.1 Focal Loss
  在分类过程中,由于简单易分的负样本,简称易分样本,占有大部分数量,使得训练过程不能充分专注于有类别样本的信息;并且简单易分负样本数量过多会掩盖了其他有类别样本。对于two-stage检测算法而言,第一个步骤产生合适的候选区域后,可以通过难分样本挖掘(Hard Negative Mining,OHEM)控制难分样本占据的比例以解决上述提及的样本数量不平衡的问题。 对于one-stage检测算法而言,尽管可以采用同样的OHEM策略控制正负样本,但OHEM方法忽略了易分样本的数量,只专注于控制难分样本比例,所以存在效率低下的不足。因此,针对类别不均衡的问题,Focal Loss损失函数应运而生,该函数基于标准交叉熵损失,加入了调制系数,通过减少易分样本的权重使模型在训练时专注于难分样本,解决了难分样本挖掘存在的缺陷。
  1.2 RetinaNet
  RetinaNet是一个基于深度残差网络的one-stage detector,加入了focal loss来解决类别不平衡的问题。RetinaNet由一个卷积提取结构,一个特征金字塔网络,一个分类子网络和一个框图子网络组成。
  卷积提取结构负责在整个输入图像上计算卷积特征,ResNet卷积网络采用深度残差思想,核心是通过跳过特定层的方式有效解决了梯度消失或者梯度爆炸的问题,加深了网络的叠加层数,使得超深度网络的构建成为可能,同时也避免了额外参数的增加,保证了模型的体积。特征金字塔网络根据图像样本低层特征的语义信息少、目标位置准确,高层特征的语义信息多、目标位置粗略的特点,通过自上而下,自下而上,横向连接等多种方式将不同层的特征图进行融合,使小目标易于识别。
  分类子网络在特征金字塔输出上执行卷积对象分类,框图子网络执行卷积边界框回归。Focal Loss主要应用于子网络部分,使模型专注于高难度分类样本,解决了正负样本不平衡问题,大大提高了识别率。
  1.3 基于优化RetinaNet的车辆识别系统
  本文所选用数据集为Stanford Car Dataset,包含196种车辆共16,185张图片,车辆每个型号按50-50划分为含8144张图片的训练集和含8041张图片的验证集,非常适合精细化型号识别的场景。本文使用Anaconda开发环境,Python3.6语言,深度学习框架Keras构建模型,在计算机配置为Ubuntu16.04,CUDA10.0,cuDNN7.4,NVIDIA Tesla P100*2的系统下进行模型训练,模型收敛曲线如图1所示。
  为了方便用户使用和考虑到多终端设备,使用PyQt开发了考虑到用户易用性和多终端设备部署的需要,本文使用PyQt开发了用户良好的界面,选择待检测图片后调用后端深度学习模型进行识别,输出带目标检测框图和车辆具体型号文本标签的识别结果图。运行效果如图2所示。
  2 结语
  本文将深度学习模型引入智能交通领域下的车辆型号检测识别中,在训练新模型时,通过ResNet101特征提取结构达到了识别速度和识别率的最佳平衡,实验结果表明,本文提出的基于优化RetinaNet车辆精细化识别与检测系统具有良好的可用性和准确度。本文研究也为后续车辆快速定位、信息检测等具体的应用奠定了基础,但目前单型号下数据集大小依旧不够,今后将对现有数据集进行扩充,并改进模型结构,改善识别效果。
  参考文獻
  [1] Lowe D G. Object recognition from local scale-invariant features[C]//iccv.1999, 99(2):1150-1157.
  [2] Krizhevsky A, Sutskever I,Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems.2012:1097-1105.
转载注明来源:https://www.xzbu.com/8/view-15115982.htm