基于计算机视觉的夜间交通流量统计算法研究
来源:用户上传
作者:王洪昌 王鹏 焦博文 于奕轩 王玉林
文章编号:10069798(2022)02005506;DOI:10.13306/j.10069798.2022.02.009
摘要:对夜晚环境中传统交通流量统计出现的实时性、鲁棒性及准确性不高的问题,提出了一种基于改进的YOLOv5s交通流量统计算法。采用残差网络的连接结构对YOLOv5s算法中的Focus层进行改进。将改进后的YOLOv5s算法与DeepSORT跟踪算法、统计模块搭建高效的交通流量统计框架。采集实际路况的夜间场景视频来对该框架的准确性进行验证。实验结果表明,该算法平均准确率达到92.9%,较改进前提升3.0%,平均检测速度可以达到33.4Hz,准确率及实时性都能满足交通流量统计要求。该算法框架可有效地提供夜间交通流量数据,为智能交通发展提供一定的技术支持。
关键词:计算机视觉;交通流量统计;YOLOv5s;DeepSORT;智能交通
中图分类号:TP391.41;TP393.021文献标识码:A
智能交通技术是融合多学科内容的前沿学科[1],交通流量统计[2]是智能交通技术的重要环节和数据来源,开展这方面的研究具有重要意义。目前,交通流量统计算法分为目标检测、目标跟踪和目标统计三个模块。目标检测[3]是获取交通流信息的第一步,准确的目标检测算法可以大大提高跟踪模块的性能。传统的目标检测方法易受到天气和光线等外界因素的影响,进而对目标跟踪的准确性造成影响。采用基于深度学习[4]的目标检测方法,可以对道路中的车辆进行精准识别,利用获取的车辆种类和位置信息进一步跟踪和计数。J.REDMON等人[5]提出以卷积神经网络为基础的YOLO目标检测算法,实现了对图像目标的检测和分类,目前已经由YOLOv1发展到YOLOv5[69];张文龙等人[10]在JDE跟踪算法的基础上添加AFN模块,使用EfficientNetv2替换YOLOv5的特征提取网络,提高了算法实时跟踪速度和检测能力;赖见辉等人[11]采用基于深度学习的YOLOv3方法,建立卡尔曼滤波、匈牙利分配和透视投影变换的交通流量计数模式,车流量计数精度在95%左右;刘磊等人[12]采用YOLO网络与MeanShift跟踪算法结合的车流量统计方法,此方法具有较强的鲁棒性。虽然科研工作者对交通流量统计方法做了一定研究,但缺少在夜晚交通环境下的算法和性能测试,夜间场景中目标识别准确率低一直是交通流量统计的一个难点。针对夜晚交通工况,本文提出了一种新的交通流量统计算法框架(res-YOLOv5strafficflowstatisticalframework,RY-TFSF)。该算法借鉴残差网络[13]的思想,改进了YOLOv5s[14]中的Focus模块,将改进后的YOLOv5s检测算法与DeepSORT跟踪算法、统计模块融合,搭建成新的交通流量统计算法框架。与传统的交通流量统计框架相比,该框架在保证实时性的同时,提高了准确率。该研究在交通流量统计领域应用前景广阔。
1目标检测
1.1YOLOv5s网络结构
深度学习中以YOLO为代表的基于回归检测方法表现出了更好的性能。其中,最新的YOLOv5算法较前几代YOLO算法在灵活性和速度上得到了极大的改进,可满足交通流量统计领域对实时性的要求。YOLOv5目标检测网络结构共有四种,按照网络结构规模排序小到大依次为YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x,四种网络结构的残差组件和卷积核的个数依次增加[15]。YOLOv5s网络是YOLOv5系列中深度和特征图宽度最小的网络结构,YOLOv5s网络架构如图1所示。
该网络包括Input、Backbone、Neck和Prediction四个部分,其中,Input为图片输入模块,要求输入图像大小为640×640,对于不满足该尺寸的输入图片,可将图片自适应的缩放到640×640像素大小。Backbone的作用是对图像进行降采样,减小图片的宽和高,而通道数增加,可提取不同层次的语义信息。YOLOv5s中使用CSPDarknet53结构,使用Focus结构作为基准网。Neck位于主干网络和网络头部的中间位置,它可以对特征提取的多样性及鲁棒性进行优化。Prediction包含分类和回归两个分支,用来完成目标检测结果的输出。
1.2Res-YOLOv5sFocus层的改进
在主干网络的卷积层前有一个Focus层[16]用来丰富输入图像信息,YOLOv5s中的Focus层如图2所示。
在YOLOv5s的Focus层中,将输入图像在行与列上分别取奇数像素与偶数像素,在3个通道上产生4个图像块,并将所有图像块沿通道方向进行拼接,使原本3通道的图像变为12通道,并且图像尺寸变为原来的一半。这种Focus结构在下采样的过程中,将宽与高上的信息变换到了通道方向,为后续的特征提取保存了较完整的图片下采样信息。-
为更好提取目标的图像特征,增强目标检测算法对目标的识别能力,本文对YOLOv5s模型中的Focus层做出了结构上的改进,改进后的Focus层如图3所示。基于Focus结构上增加了一条通路,该通路直接输入图像进行卷积,再将两条通路进行拼接后,经过一次32通道3×3的卷积,即可得到改进Focus模块的输出。此结构能在YOLOv5s/Focus层优势的基础上,更多的保留原始图像信息,并且将两条通路结合,丰富输入图像信息,使后续卷积层可以获得更好的特征提取效果。-
1.3激活函数
本文采用LeakyReLU激活函数对卷积层得到的运算结果进行非线性激活[1718],传统的ReLU激活函数虽然具有较快的计算速度与收敛速度。但当输入值为负时,会因为其0输出导致神经元无法更新参数。
而相较于传统的ReLU函数,LeakyReLU函数在输入的负半区间引入了Leaky值,避免了输入为负值时,0的导数引发神经元无法更新参数的问题。ReLU和LeakyReLU激活函数如图4所示。
转载注明来源:https://www.xzbu.com/1/view-15426965.htm