基于计算机视觉的夜间交通流量统计算法研究

> 中国论文网 >
政治论文 >
基于计算机视觉的夜间交通流量统计算法研究

基于计算机视觉的夜间交通流量统计算法研究

来源:用户上传作者:王洪昌　王鹏　焦博文　于奕轩　王玉林

　　文章编号：10069798（2022）02005506;DOI：10.13306/j.10069798.2022.02.009
　　摘要：对夜晚环境中传统交通流量统计出现的实时性、鲁棒性及准确性不高的问题，提出了一种基于改进的YOLOv5s交通流量统计算法。采用残差网络的连接结构对YOLOv5s算法中的Focus层进行改进。将改进后的YOLOv5s算法与DeepSORT跟踪算法、统计模块搭建高效的交通流量统计框架。采集实际路况的夜间场景视频来对该框架的准确性进行验证。实验结果表明，该算法平均准确率达到92.9%，较改进前提升3.0%，平均检测速度可以达到33.4Hz，准确率及实时性都能满足交通流量统计要求。该算法框架可有效地提供夜间交通流量数据，为智能交通发展提供一定的技术支持。
　　关键词：计算机视觉;交通流量统计;YOLOv5s;DeepSORT;智能交通
　　中图分类号：TP391.41;TP393.021文献标识码：A
　　智能交通技术是融合多学科内容的前沿学科[1]，交通流量统计[2]是智能交通技术的重要环节和数据来源，开展这方面的研究具有重要意义。目前，交通流量统计算法分为目标检测、目标跟踪和目标统计三个模块。目标检测[3]是获取交通流信息的第一步，准确的目标检测算法可以大大提高跟踪模块的性能。传统的目标检测方法易受到天气和光线等外界因素的影响，进而对目标跟踪的准确性造成影响。采用基于深度学习[4]的目标检测方法，可以对道路中的车辆进行精准识别，利用获取的车辆种类和位置信息进一步跟踪和计数。J.REDMON等人[5]提出以卷积神经网络为基础的YOLO目标检测算法，实现了对图像目标的检测和分类，目前已经由YOLOv1发展到YOLOv5[69];张文龙等人[10]在JDE跟踪算法的基础上添加AFN模块，使用EfficientNetv2替换YOLOv5的特征提取网络，提高了算法实时跟踪速度和检测能力;赖见辉等人[11]采用基于深度学习的YOLOv3方法，建立卡尔曼滤波、匈牙利分配和透视投影变换的交通流量计数模式，车流量计数精度在95%左右;刘磊等人[12]采用YOLO网络与MeanShift跟踪算法结合的车流量统计方法，此方法具有较强的鲁棒性。虽然科研工作者对交通流量统计方法做了一定研究，但缺少在夜晚交通环境下的算法和性能测试，夜间场景中目标识别准确率低一直是交通流量统计的一个难点。针对夜晚交通工况，本文提出了一种新的交通流量统计算法框架（res-YOLOv5strafficflowstatisticalframework，RY-TFSF）。该算法借鉴残差网络[13]的思想，改进了YOLOv5s[14]中的Focus模块，将改进后的YOLOv5s检测算法与DeepSORT跟踪算法、统计模块融合，搭建成新的交通流量统计算法框架。与传统的交通流量统计框架相比，该框架在保证实时性的同时，提高了准确率。该研究在交通流量统计领域应用前景广阔。
　　1目标检测
　　1.1YOLOv5s网络结构
　　深度学习中以YOLO为代表的基于回归检测方法表现出了更好的性能。其中，最新的YOLOv5算法较前几代YOLO算法在灵活性和速度上得到了极大的改进，可满足交通流量统计领域对实时性的要求。YOLOv5目标检测网络结构共有四种，按照网络结构规模排序小到大依次为YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x，四种网络结构的残差组件和卷积核的个数依次增加[15]。YOLOv5s网络是YOLOv5系列中深度和特征图宽度最小的网络结构，YOLOv5s网络架构如图1所示。
　　该网络包括Input、Backbone、Neck和Prediction四个部分，其中，Input为图片输入模块，要求输入图像大小为640×640，对于不满足该尺寸的输入图片，可将图片自适应的缩放到640×640像素大小。Backbone的作用是对图像进行降采样，减小图片的宽和高，而通道数增加，可提取不同层次的语义信息。YOLOv5s中使用CSPDarknet53结构，使用Focus结构作为基准网。Neck位于主干网络和网络头部的中间位置，它可以对特征提取的多样性及鲁棒性进行优化。Prediction包含分类和回归两个分支，用来完成目标检测结果的输出。
　　1.2Res-YOLOv5sFocus层的改进
　　在主干网络的卷积层前有一个Focus层[16]用来丰富输入图像信息，YOLOv5s中的Focus层如图2所示。
　　在YOLOv5s的Focus层中，将输入图像在行与列上分别取奇数像素与偶数像素，在3个通道上产生4个图像块，并将所有图像块沿通道方向进行拼接，使原本3通道的图像变为12通道，并且图像尺寸变为原来的一半。这种Focus结构在下采样的过程中，将宽与高上的信息变换到了通道方向，为后续的特征提取保存了较完整的图片下采样信息。-
　　为更好提取目标的图像特征，增强目标检测算法对目标的识别能力，本文对YOLOv5s模型中的Focus层做出了结构上的改进，改进后的Focus层如图3所示。基于Focus结构上增加了一条通路，该通路直接输入图像进行卷积，再将两条通路进行拼接后，经过一次32通道3×3的卷积，即可得到改进Focus模块的输出。此结构能在YOLOv5s/Focus层优势的基础上，更多的保留原始图像信息，并且将两条通路结合，丰富输入图像信息，使后续卷积层可以获得更好的特征提取效果。-
　　1.3激活函数
　　本文采用LeakyReLU激活函数对卷积层得到的运算结果进行非线性激活[1718]，传统的ReLU激活函数虽然具有较快的计算速度与收敛速度。但当输入值为负时，会因为其0输出导致神经元无法更新参数。
　　而相较于传统的ReLU函数，LeakyReLU函数在输入的负半区间引入了Leaky值，避免了输入为负值时，0的导数引发神经元无法更新参数的问题。ReLU和LeakyReLU激活函数如图4所示。

转载注明来源:https://www.xzbu.com/1/view-15426965.htm

查看更多→

基于计算机视觉的夜间交通流量统计算法研究

相关文章