基于SARIMA 模型的交通事故数预测
作者 : 未知

  摘 要:文章主要研究季节时间序列模型在宁夏月交通事故时间序列预测中的应用,并分析模型的准确性和实用性。文章分析宁夏2007年1月至2014年8月的月交通事故数,剔除时间趋势和季节性后使原序列平稳并建立季节时间序列模型。结果表明,SARIMA(1,0,1)(0,0,1)12模型能很好地拟合月交通事故数,用该模型进行短期交通事故数量的预测,发现其仍然呈增长趋势。预测结果的准确性较高,可为宁夏交通政策的制定提供一定的参考。
  关键词:SARIMA 模型;交通事故;预测
  1引言
  随着宁夏经济建设迅速发展,机车保有量急剧升高,由此引起交通事故频发,已经成为不容忽视的社会问题。由于道路交通事故的发生是一个随机事件,且具有不可避免性,在样本数据比较少并且表现为严重的非平稳时,获得准确的预测结果并不容易。在众多预测方法中,时间序列模型中的ARIMA模型及其扩展模型――SARIMA(seasonal ARIMA model)模型,能够将非平稳的时间序列转化为平稳的时间序列,并且预测精度较高。目前,时间序列模型被广泛地运用于经济领域,利用交通事故数据建立时间序列模型并进行短期预测的研究较少。
  本文利用宁夏2007年1月至2014年8月的月交通事故数建立SARIMA模型,进行短期交通事故数量的预测。
  2模型
  ARIMA 模型又称Box-Jenkins模型,该模型是由美国统计学家G.E.P.Box 和英国统计学家G.M.Jenkins 在20 世纪70 年代创建的一类随机差分自回归移动平均模型,其中AR为自回归过程,MA为移动平均过程。该模型的一般形式为ARIMA(p,d,q),其中p为自回归项数,q为移动平均项数,d为差分次数。该方法将预测对象随时间推移而形成的数据序列视为一个随机时间序列,用一定的数学模型来近似地拟合这个序列,然后根据序列的过去值及现在值来预测其未来值。
  将ARIMA 模型和随机季节模型(stochastic seasonal model)组合成为季节性差分自回归移动平均模型――SARIMA模型。该模型的一般形式为SARIMA(p,d,q)(P,D,Q)S,其中P是季节自回归阶数,Q是季节移动平均阶数,D为季节差分次数,对于月度数据,s为12。相对于一般时间序列模型,SARIMA模型考虑时间序列中的周期性和季节性,一般用于既有季节效应又有长期周期效应的时间序列的预测。
  3模型建立与分析
  SARIMA模型的建立过程可以分为四步:数据预处理;模型识别与定阶;模型诊断与检验;模型预测。
  3.1数据预处理
  将宁夏的月交通事故进行对数化处理,消除原始数据的异方差。处理过的时间序列作12阶季节差分后进行单位根检验,其检验Z统计量的值为-11.855小于5% 置信水平的Z值-2.908,说明该序列的波动性已经基本消除,成为平稳的时间序列。
  3.2模型识别与定阶
  根据平稳时间序列的自相关函数和偏自相关函数的统计特性,选取显著性高的模型SARIMA(0,0,2)(0,0,1)12,SARIMA(1,0,0)(0,0,1)12,SARIMA(1,0,1)(0,0,1)12,SARIMA(0,0,1)(1,0,0)12和SARIMA(1,0,1)(1,0,0)12进行参数的比选(表1)。采用赤池信息量AIC(Akaike information Criterion)准则和贝叶斯信息量BIC(Bayesian Information Criterions)准则选取最佳SARIMA模型,AIC和BIC的值越小,模型的拟合度越好。综合比较,SARIMA(1,0,1)(0,0,1)12模型拟合程度最高。
  3.3模型诊断与检验
  对SARIMA(1,0,1)(0,0,1)12模型的残差序列进行白噪声检验,判断该模型的合适性。其残差序列的检验值为0.8016远大于判定值0.05,说明该模型的残差序列为白噪声序列,残差序列中有用的信息已被提取完,模型拟合程度很好。
  3.4模型预测
  利用SARIMA(1,0,1)(0,0,1)12模型对宁夏2007年1月至2014年8月的月交通事故数进行了拟合,并对其2008年2月至2015年12月的月交通事故数进行预测。结果(图1)表明:预测值与实际值的变化趋势非常接近,模型预测结果准确。
  4结论
  宁夏的月交通事故数表现出明显的周期性和季度性的变化。对将周期性和季节性剔除后的平稳时间序列进行建模后,发现SARIMA(1,0,1)(0,0,1)12模型能比较好的拟合宁夏的月交通事故数。预测2008年2月至2015年12月的交通事故数,发现宁夏的月交通事故数仍然呈现增长趋势,需要进一步提高交通管理水平。SARIMA 模型考虑了时间序列的周期性和季度性变化,有较高的预测精度。但由于数据规模的限制,随着预测时间的延长,预测误差会逐渐增大,预测精度也会下降。
  参考文献
  [1] 陈学华.宁夏交通事故规律分析及预防对策研究[D].西安:长安大学,2006.
  [2] 张辉,刘嘉�j,柳湘月.交通流的季节ARIMA模型与预报[J].天津大学学报,2005,38(9).
  [3] 张丽,牛惠芳.基于SARIMA模型的居民消费价格指数预测分析[J].数理统计与管理,2013,32(1):1-6.