您好, 访客   登录/注册

基于SARIMA模型的月径流量预测

来源:用户上传      作者:贺依韬 马腾

  摘  要:径流量预测是水文学研究的重要方向之一,开展径流预测,对于区域水资源的综合开发利用、合理配置、高效管理具有重要的指导作用。径流序列可以视为典型的时间序列,SARIMA模型是一种常用的时间序列模型,能够间接考虑其他相关随机变量的变化,建模高效、便捷。该文在某水文站30年历史月径流量分析的基础上,建立SARIMA模型对该水文站未来18个月的径流量进行预测,预测结果的确定性系数为0.8594,预测精度较高,对于该区域的水文工作的开展具有重要的现实意义。
  关键词:径流预测  时间序列  SARIMA模型  模型评价
  中图分类号:TV214    文献标识码:A 文章编号:1672-3791(2020)02(c)-0042-03
  数据驱动模型不以水文过程作为模型建立的基础,而是着重于数据关系的分析,建模方便高效,预测精度高。常见的数据驱动模型有多元回归分析、时间序列分析、神经网络等。其中多元回归分析预报因子选择困难,对预测精度影响较大,神经网络需要数据量大,预测结果不稳定。时间序列模型通过少量数据就可做出精确的短期预测,因而被广泛应用,其中SARIMA模型是一种考虑到序列周期变化的时间序列建模方法。某一观测或统计数值按其发生的时间先后顺序形成的数列称为时间序列[1]。水文观测值按期观测时间形成的数列是一种典型的时间序列[2]。
  该文在水文时间序列分析的基础上建立SARIMA模型对某水文站历史月径流量进行拟合,选择最优模型对未来一段时间的月径流量进行预测,以期为该地区水文工作提供参考。
  1  研究方法
  对于平稳时间序列[4],一般可对其建立自回归滑动平均ARMA(p,q)模型,它是自回归AR(p)模型和移动平均MA(q)模型的组合,其模型的基本形式如式(1)。
  yt=c+1yt-1+2yt-2+...+pyt-p+et+θ1et-1+θ2et-2+…+θqet-p    (1)
  式(1)中,yt为时间序列第t时刻的观察值;yt-1,yt-2,…,yt-p为时序yt的滞后序列;et,et-1,et-2,…,et-q为模型在第t期,第t-1期,…,第t-q期的误差;1,2,…,p,θ1,θ2,…,θq为待估计参数;c为常数项。
  ARIMA(p,d,q)模型是ARMA模型的变换形式,其中d表示原始序列经过d次差分后转化为平稳时间序列。某些时间序列中,存在明显的周期性变化,这些周期是由于季节性变化(包括季度、月度等变化)或一些外部因素引起的,这类序列称为季节性序列。对时间序列经过有限次差分和季节差分,将随机误差的长久影响变成暂时影响,将其转化为平稳时间序列,在此基础上建立季节性差分自回归滑动平均SARIMA(p,d,q)×(P,D,Q)s模型。
  考虑到水文站月径流量的影响因素众多,流域下垫面条件复杂,建立过程驱动模型所需数据较多,因此在其径流特性分析的基础上考虑对其建立时间序列模型并对其径流量进行预测。
  2  实例分析
  该文收集了某水文站1987年1月到2018年6月共计378个月的径流量资料,使用1987年1月到2016年12月共30年360个月的流量数据作为训练数据,使用2017年1月到2018年6月共18个月的流量数据作为校验数据,通过对训练数据进行分析处理并建立SARIMA模型。最终把预测值和期望值进行比较并评定预测精度。
  2.1 实验数据预处理
  原始数据存在明显的以12個月为周期的波动性并且不同时刻波动浮动差异较明显,不满足时间序列建模的必要条件。所以,考虑对原始数据进行对数一阶12次差分变化,以减小原始数据的波动性和趋势性。绘制变换后序列的自相关和偏相关图,从自相关图和偏自相关图观察该序列近似为一个平稳过程且为非白噪声序列,满足时间序列建模的要求。
  2.2 模型识别和参数估计
  根据自相关图和偏相关图的拖尾性和截尾性进行初步的模式识别。在初步识别的基础上,建立可能的模型,通过最小二乘法估计其模型参数并计算统计量P值如表1所示,P值越小表示模型参数越显著,其中红色标出的参数的P值不显著为零(一般当P值小于0.05则认为该参数显著),其中模型6,8的所有参数都显著。在所有参数都显著的模型中,根据AIC值和SBC值进行模型优选,AIC和SBC值越小代表模型的效果越优良。
  在模型6、8中,模型8的AIC值和SBC值均最小,所以模型8为所求的最优模型,其模型表达式为:
  yt=0.5208yt-1+0.4625yt-2-0.8253yt-12-0.9994et-2-0.9155et-24 (2)
  2.3 模型检验
  对模型拟合值残差进行白噪声检验,残差序列的自相关系数和偏自相关系数基本都在二倍置信区间内,通过计算残差序列的P值全部大于0.05,没有拒绝假设性实验,相关系数与基本与零没有显著差异,该序列可被看作是白噪声序列,说明模型拟合效果较好,信息提取较充分。
  2.4 模型预测
  模型建立完毕后,将训练数据输入模型。除个别峰值处整体拟合效果比较理想,对2017年1月到2018年6月的径流量进行动态预测,预测结果见图1。
  2.5 预测精度评定
  对水文预报方案的有效性评定采用下列确定性系数dy进行。dy越大,方案的有效性越高。
  (3)
  (4)
  (5)
  式中,Se为预报的均方差;σy为预报要素值的均方差;yi为实测值;y为预报值;为实测系列的均值;n为实测系列的点据数。评定方案的有效性时按表4中标准进行。预报方案有效性达到甲(dy>0.90)、乙(dy处于0.70~0.90时)两个等级时,方案可被用于作业预报;方案等级为丙等(dy处于0.5~0.69时)时,只可用作参考性预报;方案有效性低于丙等时不能用于作业预报,只能做参考性评估。
  计算此次预测的确定性系数,得dy=0.8594,预报方案的有效性为乙等,说明该次预报效果较好,可用于作业预报。
  3  结语
  该文在对某水文站30年历年逐月径流量序列分析的基础上,建立了SARIMA模型对历史径流量进行拟合。利用建立的最优模型预测了2017年1月到2018年6月共18个月的径流量。预测结果表明SARIMA模型在该水文站的月径流量预测上有较好的效果,预测的确定性系数为0.8594,预报方案的有效性为乙等,可以用于作业预报。
  参考文献
  [1] 李达.基于时间序列分析方法的油田产量预测与应用[D].兰州理工大学,2018.
  [2] 程扬,王伟,王晓青.水文时间序列预测模型研究进展[J].人民珠江,2019,40(7):18-23.
  [3] 雷昌宁.基于SARIMA和SVR混合模型的黑河径流量预测分析[D].兰州大学,2018.
  [4] 龙天玮.平稳水文时间序列的极小值分布[D].重庆交通大学,2017.
转载注明来源:https://www.xzbu.com/8/view-15192497.htm