基于图卷积神经网络的交通流量预测
来源:用户上传
作者:
摘要:交通预测在智能交通中有着重要的意义和应用,本文提出一种用于交通预测的图卷积神经网络,使用图卷积对城市道路网络进行建模,利用GCN捕获图的拓扑结构,处理时空交通预测任务。将该方法应用到真实的数据集中,通过对车流量的预测和车速的预测实验表明,该方法优于目前其它预测方法。
关键词:图卷积;GCN;拓扑结构;车流量
0引言
城市交通拥堵现象日益严重,不仅浪费了出行时间,加剧了城市环境污染,更使得城市交通事故频发,影响交通运行,长此以往,造成恶性循环。因此,实现对城市路网交通流的有效预测,能够有效预判城市交通现状,进而合理进行调度,解决城市交通堵塞问题。现有的解决城市交通流预测问题的方法主要有两种:
(1)基于传统的统计学预测模型。该方法主要通过车流量、速度、密度之间的关系进行建模,将交通流数据进行回归以及优化参数。实现交通数据的拟合预测,主要包括历史均值法、自回归滑动平均法等。但是由于交通场景的复杂性,该预测模型较难得到准确地预测结果。Kumer等人采用ARIMA模型,将预测的车流量用数学模型的形式表现出来,但这一方法只适用于线性数据。而交通流数据是非线性的复杂的:Kumar提出了基于Kalman滤波技术的交通流预测模型,克服了SARIMA模型依赖于大量数据进行开发的缺陷。
(2)基于数据驱动的预测模型。该模型通过数据的规律来推测其变化趋势。以此来进行交通流预测。这种方法不需要考虑交通场景的动态特性,只需要根据历史的交通流数据作为预测值,但该方法预测准确性较低,不能很好地适应时间特征。Zhang等人设计了基于残差卷积单元的ST-ResNet来对城市人流量进行预测,这种方法虽然提取了流量数据的时空特征,但将输入限制为标准的2维或3维网格数据,因而不能用于图结构的高速路网上的交通预测问题。Seo等人提出了图卷积循环网络(GCRN),但在特定设置下很难确定循环网络和图卷积的最佳组合。Yu等人提出了一个带有门控机制的图卷积网络,并应用于交通量预测问题。Li等人在人体动作识别任务中引入图卷积,提出多种划分策略将节点的邻域划分为不同子集,通过控制子集的个数,保证不同节点可以共享卷积核权重。谱图方法通过图拉普拉斯矩阵将网格数据上的卷积操作推广到图结构数据上。但这些模型都没有考虑交通数据在时间维度上的周期性和趋势性等多种固有特性。
综合以上分析可知,交通流流量预测还存在一些不足。为此,本文提出一种新的预测模型——图卷积神经网络(Graph Convolutional Network,GCN),GCN能够直接利用图结构信息提取局部特征,处理任意连接的不规则数据来完成交通预测任务,因为数据可以用交通路网的图结构(Graph)来描述。
1 图卷积神经网络预测模型
1.1 图卷积神经网络描述
图卷积神经网络是一种对图数据进行深度学习的方法,研究的对象是图数据,研究的模型是卷积神经网络。其是一种数据格式,可以用于表示社交网络、通信网络、蛋白分子网络等。图中的节点表示网络中的个体,连边表示个体之间的连接关系。许多机器学习任务,例如社团发现、链路预测等都需要用到图结构数据。因此图卷积神经网络的出现为这些问题解决提供了新的思路。
1.2 图卷积神经网络预测模型
交通网络的本质是一个图结构,并且每个节点都可以看作是图上的信号。因此,为了充分利用交通网络的拓扑特性,本文使用谱图方法将卷积操作推广到图结构数据,将数据视为图上的信号,然后直接在图上对图信号进行处理,来捕获空间中有意义的模式和特征,谱图方法将图转化为代数形式,分析图的拓扑属性。
在谱图分析中,图由对应的拉普拉斯矩阵表示,图的拉普拉斯矩阵表示为:
2 实验结果与分析
为了验证本文模型的性能,本文在两个真实的数据集上进行实验,将路网交通速度作为模型的输入参数,通过对比实验以及对实验结果进行分析,验证该模型的可行性。
2.1 数据集介绍
评估T-GCN模型在实际数据集(SZ-taxidataset)上的预测性能后,说明数据集与交通速度有关。在不损失概括性的前提下,实验部分使用了交通速度作为交通信息。
数据集SZ-taxi为2015年1月1日至1月31日深圳出租车轨迹。选择罗湖区156条主要道路作为研究区域,实验数据主要包括两部分:一个是一个156*156的邻接矩阵,描述了道路之间的空间关系,每一行表示一条道路,矩阵中的值表示道路之间的连接性:另一个是特征矩阵,描述了每条道路上的速度随时间的变化,每一行代表一条路,每一列是不同时段道路上的交通速度。每15min计算一次每条路上的车速。
2.2 实验参数设置
本文基于Tensorflow框架实现GCN模型,主要设计的参数有:批量大小、隐藏层数和训练周期。其中隐藏层数的不同对预测结果的准确性有很大的影响,通过实验不断调整隐藏层数来选取最优值,当批量大小为64、训练周期为1000、隐藏层数为32时为最佳组合。
2.3 基准方法
本文将GCN模型在S-taxi数据集上进行训练,并与以下基准方法进行了比较:
ARIMA:自回归平均滑动法。将观测到的时间序列拟合为参数模型,预测未来的交通数据。
HA:历史均值法。将历史的交通信息作为输入预測未来的交通数据。
LSTM:长短时记忆网络。由遗忘门、输入门、输出门组成的一种特殊的RNN模型。
本文采用平均绝对误差(MAE)、均方误差(RMSE)和准确性(ACC)3个评价指标来验证模型(RMSE、MAE都是进行测量预测误差的,数值越大表示预测效果越差,数值越小表示预测效果越好:准确性表示预测准确精度)。具体的计算公式为:
2.4 实验结果及分析
将GCN模型在S-taxi数据集上进行训练,并与3个基准方法进行了比较。本文选用总数据集的80%作为训练数据集的输入,20%作为测试数据集的输入。
交通预测对比试验数据见表1.从表中可以看出,传统的预测模型由于自身建模能力的不足,导致预测效果和真实的数据有很大的差别。GCN的RMSE、MAE比ARIMA数值低,ACC提高了47.84%;GCN的RMSE、MAE比HA数值低,ACC提高了22.59%;GCN的RMSE、MAE比LSTM数值低,ACC提高了12.07%。
一天中的交通预测结果与真实值的比较,如图3所示。从图中可以看出,该模型在一天当中的预测结果与数据真实值较为接近。说明GCN模型可以通过训练获得最佳的预测性能。
3 结束语
本文提出一种新的图卷积神经网络模型。在真实的数据集上对路网交通速度进行预测,该模型采用拓扑图结构的形式作为模型的输入,解决了传统卷积神经网络不能输入非规则数据的问题。实验结果表明,本文提出的模型预测准确度相对优于现有的预测模型,具有较高的鲁棒性。未来将优化图卷积模型,进一步提高模型的预测准确性。
转载注明来源:https://www.xzbu.com/8/view-15125489.htm