您好, 访客   登录/注册

基于 ARIMAX 的开封“7・20”特大暴雨城市内涝预报研究

来源:用户上传      作者:喻谦花 冯峰 罗福生 霍继超 冯跃华 张鹏飞

  摘要:针对暴雨引发的城市内涝问题,将多元时间序列ARIMAX 模型应用于内涝预报,考虑到积水变化过程是一个时间序列,其主要受到降水过程的影响,用该模型可更好地描述降水量与积水深度之间的关系,更精准地预测城市内涝积水深度及变化过程。将开封市12个内涝监测站数据进行筛选和分析,对数据进行预处理、时间序列平稳性和白噪声检验,通过绘制降水量与积水深度的自相关系数和偏自相关系数图,判断其是否拖尾,同时对时间序列进行差分操作,选用相应的 ARIMAX 模型。利用贝叶斯信息准则( BIC)确定模型阶数,确定了12个内涝点对应的 ARIMAX 模型的最终形式。为了检验模型的精度,将基于12个内涝点建立的 ARIMAX 模型M行内涝预测,并计算预测值与实际内涝积水过程的 MAE(平均绝对误差)、MSE(均方误差)、RSME(机器学习误差)。将开封市“7・20”特大暴雨的降水过程作为输入时间序列,进行内涝积水预测,并与实测值进行对比,认为2 h 以内、50 cm 以下积水深度的预报效果较好。通过“7・20”特大暴雨的实例验证认为构建的城市内涝 ARIMAX 预报模型适用性较强,进行更多的样本学习训练会取得更精准的预报结果。
  关键词:城市内涝;ARIMAX 模型;积水预报;开封市
  中图分类号:TV122+.1 文献标志码:A doi:10.3969/j.issn.1000-1379.2022.10.008
  引用格式:喻谦花,冯峰,罗福生,等.基于 ARIMAX 的开封“7・20”特大暴雨城市内涝预报研究[J].人民黄河,2022,44(10):40-45,50.
  Research on Urban Waterlogging Forecast of“July 20”Rainstorm in Kaifeng City Based on ARIMAX
  YU Qianhua1,FENG Feng2,3,LUO Fusheng4,HUO Jichao1,FENG Yuehua4,ZHANG Pengfei2,3
  (1.Kaifeng Key Laboratory of Meteorological Disaster Prevention and Mitigation,Kaifeng 475004,China;2.Yellow River Conservancy Technical Institute ,Kaifeng 475004,China;3.Henan Engineering Technology Center forWater Resources Conservation and Utilization in the Middle and Lower Reaches of the Yellow River,Kaifeng 475004,China;4.Eastern Henan Water Conservancy Administration Bureau ,Kaifeng 475004,China)
  Abstract:For urban waterlogging caused by heavy rain forecast issue ,multivariate time series ARIMAX model is applied to waterlogging forecast,considering the water change process is time series ,it is mainly influenced by precipitation process ,use the model can better de? scribe the relationship between the precipitation and accumulated water,can be more effective ,more accurate to predict urban waterlogging water depth and the change process.Using the monitoring data of 12 stations in Kaifeng to screen and analyze ,pre?process the data,test the stationarity of time series and white noise ,through mapping the autocorrelation coefficient of precipitation and water depth and partial autocor?relation coefficient diagram to determine its tail and truncation the difference for the time series of operation to choose the correspondingARIMAXmodel.Bayesian information criterion ( BIC ) was used to determine the model order,and the final form of ARIMAX model corre?sponding to 12 waterlogging stations was determined.In order to test the accuracy of the model the ARIMAX model established by 12 water?logging stations was used to predict waterlogging,and MAE ( mean absolute error),MSE ( mean square error) and RSME ( machine learning error) between the predicted value and the actual waterlogging process were calculated.Taking the precipitation process of the“ July 20”heavy rain in Kaifeng as the input time series the prediction of water logging was carried out and compared with the measured value.Itwasbelieved that the prediction effect of water depth within 3 hours and below 50 cm was better.Through the example of the“ July 20”rainstormit is verified that the constructed ARIMAX forecast model of urban waterlogging has strong applicability.More sample learning and trainingwill obtain more accurate forecast results providing data basis and scientific basis for the development of waterlogging warning plan and emer?gency and disaster reduction plan for the city in response to the rainstorm.

nlc202212201214



  Key words:urban waterlogging;ARIMAX model;waterlogging forecast;Kaifeng City
  2021年7月20日,河南省遭遇极端强降雨。7月18日8时至20日15时30分,郑州荥阳、巩义的7个雨量站降雨量超600 mm ,最大点雨量718.5 mm [1]。极端强降雨引起河南多地出现严重城市内涝,防汛形势十分严峻[2]。城市内涝威胁城市居民生命财产和出行安全,造成了巨大经损失[3-4]。近年来聚焦于城市内涝的研究主要集中在内涝引发的灾害、形成的原因、治理的措施等方面[5-9]。对于城市内涝模拟和预报研究,栾震宇等[10]基于 MIKE FLOOD 平台将 MIKE URBAN 和 MIKE 21模型耦合,建立城市内涝模型,对湖南省新化县典型区域的排涝情景进行模拟,表明该模型适用于城市内涝风险评估管理;曾照洋等[11]将 SWMM 一维管网模型及 LISFLOOD-FP 二维水动力模型进行耦合,对东莞市典型区域进行暴雨内涝模拟,实现了研究区暴雨内涝淹没范围与淹没水深的模拟;陆敏博等[12]以苏州市相城区为例,采用 Mike 模型建立排水防涝系统耦合模型,同时考虑平原河网地区城市排水防涝特征,将恒定均匀流推理公式法、水量平衡法与数学模型法相结合,评估多种情景下的雨水系统排水能力和内涝风险。虽然取得了较多成果,但大部分研究是在水动力模型基础上模拟运行的,没有建立契合区域特点的数学模型进行模拟预报[13-15]。ARIMA( Auto-Regressive Integrated Moving Average )模型全称为自回归积分滑动平均模型,其基本思路是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。ARI?MAX 模型能更好地表达系统中多元时间序列的变化规律,建立了除其自身的变化规律外,含有多个输入变量的很多时间序列模型[16]。左其亭等[17]以塔里木河流域为典型实例,将 ARIMAX 运用到了水资源动态承载力预测中,通过构建径流与气温、降水等气象因子的 ARIMAX 动态回归预测模型,分析计算 RCP8.5、RCP4.5和 RCP2.6三种气候情景下塔里木河流域未来不同水平年水资源动态承载力。将 ARIMAX 应用到城市内涝预报中,一方面城市内涝除有其自身的变化规律外,还会受到其他多个时间序列的影响,比如降水时间序列,适用于 ARIMAX 模型的构建条件;另一方面,通过样本数量积累和动态更新训练,可建立更加精准的 ARIMAX 计量模型。相对其他方法,ARIMAX 模型能够更快实现内涝预报准确率的提高,从而有效增强城市管理和防洪避灾能力。
  1 ARIMAX 模型及构建过程
  暴雨产生的城市内涝积水,除了积水深度是时间序列外,还受到降水时间序列的影响,因此将降水过程也作为城市内涝积水的研究范围。应用多元时间序列 ARIMAX 模型,建立较为完整的预报内涝积水深度计量模型,更好地描述降水量与积水深度之间的关系,从
  而有效预测城市内涝积水深度及其变化过程[18]。
  1.1 ARIMAX 模型
  ARIMAX 模型的构造思路:假设响应序列(因变量序列)yt和输入变量序列(即自变量序列) x 1 t 、x2 t 、…、xkt均为平稳序列,先构建响应序列和输入变量序列的回归模型,如式(1)所示。
  式中:Φi ( B)为第i个输入变量的自回归系数多项式;Θi ( B)为第i个输入变量的移动平均系数多项式;μ为常数项;li 为第i个输入变量xit的延迟阶数;εt 为回归残差序列[19]。
  因为响应序列yt和输入变量序列 x 1 t 、x2 t 、…、xkt均为平稳序列,平稳序列的线性组合仍然是平稳的,所以残差序列εt 为平稳序列,如式(2)所示。
  使用 ARIMA 模型继续提取残差序列εt 中的相关信息,最终得到动态回归模型,称为 ARIMAX 模型,如式(3)所示。
  式中:Ψi ( B)为残差序列自回归系数多项式;Yi ( B)为残差序列移动平均系数多项式;at 为零均值白噪声序列。
  动态回归模型的建立是基于响应序列与自变量序列存在长期均衡关系的假设而实现的,并不是所有的序列都可以建立动态回归模型,只有存在长期均衡关
  系的序列才适合建立动态回归模型。
  1.2 模型建立过程
  第1步:对响应序列yt和输入变量序列 x 1 t 、x2 t 、…、xkt进行平稳性检验。
  第2步:对经过适当变换及差分后平稳的输入序列 x 1 t 、x2 t 、…、xkt运用 ARIMA 模型,产生白噪声序列,如式(4)所示。
  第3步:对经过适当变换及差分后平稳的响应序列yt运用 ARIMA 模型,产生残差白噪声序列,如式(5)所示。
  第4步:为了确定 ARIMAX模型结构,考察序列与ε的互相关系数(20),如式(6)所示。
  第5步:考察残差序列ε,若残差序列的白噪声检验为非白噪声序列,则对残差序列构造合适的ARIMA模型,如式(7)所示。
  2 研究区域及数据来源
  2.1 研究区域背景
  2.1研究区域背景
  开封市位于黄河下游,河南省中东部,东经113°51'51"-115°15'42",北纬34°11'43"-35°11'43",总面积6444km2,主城区面积546km2[21]。境内河流众多,分属黄河和淮河两大水系。属暖温带大陆性季风气候区,年均气温为15.2℃,年均降水量为627.5mm,降水集中在夏季7-8月。区域内地势平坦,土壤多为黏土、壤土和沙土,发生降雨时不能将雨水有效就地下渗利用,遇到暴雨,市内易形成多个内涝积水点,严重影响城市的防洪安全和居民出行。因此,开展城市暴雨内涝预报研究显得非常迫切和必要。

nlc202212201214



  2.2 开封“7・20”特大暴雨降水过程
  开封市主城区内共有7个气象站,分布于主城区4个区内。其中:龙亭区面积最大,有3个气象站;顺河区有2个,鼓楼区和禹王台区各有1个。将7个气象站编号为A~G,其中A站为国家气象站,B~G站为区域加密气象站。国家气象站数据2021年综合传输质量为99.88%,区域站为99.22%,各站数据可用率均为100%。
  根据开封气象站监测数据,2021年7月20日0时至22日8时7个气象站逐小时降水过程如图1所示。最大降水强度出现在7月20日22时,A站达到103.4mm/h;最大3h累计降水量也出现在A站,为157.0mm;最大48h累计降水量仍出现在A站,为354.7mm,该值已达到开封年平均降水量627.5mm的56.5%。7个站的平均56h累计降水量为345.1mm。根据7个气象站覆盖的范围和泰森多边形构造原理,将开封主城区研究区域剖分为7个多边形,每个多边形中包含1个气象站和1~4个内涝监测站,每个内涝积水点到相应气象站的距离最近。其中G站距离内涝监测站较远,无最近关联站,因此未参与模型确定。
  2.3 开封“7・20”内涝数据来源
  根据开封市城区内易发生内涝积水的位置,选择了12个内涝自动监测站作为研究对象,在城市的东、西、南、北4个方向均选择不少于2个监测站,并在编号中数字后进行方位标注,与气象站的对应关系见表1。
  3 城市暴雨内涝预报模型确定及精度检验
  使用2018―2020年汛期(5―9月)开封市主城区气象站逐小时降雨量数据和内涝监测站积水深度数据,对市区出现的积水个例与同期降水强度进行相关统计分析,对数据进行收集和整理。
  3.1 数据预处理
  为去除数据中的异常值且保证道路积水是由降雨导致的,通过滑动窗口法对积水数据做以下预处理:
  (1)若当前时段 t 没有降雨,t-1时段没有积水,而当前时段有积水的,将积水数据计为0。
  (2)当前时段 t 没有降雨,积水深度为 a,t-1时段没有降雨,积水深度为 b,若 b>a,则令 b=a。
  (3)若 t-1时段没有降雨,积水深度<3 cm,t 时段没有降雨,积水深度<3 cm ,则令 t 时段积水深度为0。
  3.2 时间序列平稳性检验
  城市内涝积水深度预报是一个多元时间序列分析问题,采用 ARIMAX 模型实现积水点位的积水深度预报。ARIMAX 模型只适用于平稳型数据序列,需要对预处理的数据序列进行时间平稳性检验以及白噪声检验。在一个自回归过程中,如果滞后项系数为1,就称为单位根。当单位根存在时,自变量和因变量之间的关系具有欺骗性,因为残差序列的任何误差都不会随着样本量增大而衰减,也就是说模型中的残差影响是永久的。这种回归又称作伪回归。如果单位根存在,那么这个过程就是一个随机漫步( Random Walk)[18]。
  时间序列模型平稳性检验常用的方法是 ADF 检验( Augmented Dickey-Fuller test),也称单位根检验。 ADF 检验就是判断序列是否存在单位根:如果序列平稳,就不存在单位根;否则,就会存在单位根。ADF 检验的 H0假设就是存在单位根,如果得到的显著性检验统计量小于3个置信度(10%,5%,1%),则对应90%、95、99%的把握拒绝原假设。对选择的开封市主城区 A、B、…、F 气象站降水时间序列和12个内涝监测站的积水时间序列进行 ADF 检验,结果都满足平稳性要求,见表2。
  3.3 白噪声检验
  通过对降水和内涝时间序列进行白噪声检验,计算的 P 值均远小于α(0.05),即拒绝原假设,序列为非白噪声。
  3.4 模型确定与定阶
  绘制开封12个内涝点的积水深度与对应降水量的自相关系数和偏自相关系数图(见表3)。可以看出,所有内涝点二者皆拖尾,对时间序列进行差分操作后,初步选用模型为 ARIMAX( p ,0,q)。下一步需确定模型参数 p 和 q 的值,通常使用贝叶斯信息准则( BIC)确定模型阶数。设定 p 值范围为0、1、2、3,q 值范围为0、1、2、3、4、5,对其进行组合,分别计算其 BIC。选择 BIC 最小的 p 和 q 为模型的阶数,为12个内车 ARIMAX 模型的最终形式,见表3。对模型预测的结果进行白噪声检验以确认建模效果,设定滞后阶数为1、6、12的白噪声检验结果表明,该模型在3种情况下的 P 值均远小于0.05,说明预测模型拟合效果较好。确定 ARIMAX( p ,d,q)中的参数后,利用 Python 中Py? flux 软件包,输入时间序列以及 p、d、q 参数值后即可自动生成模型。
  3.5 模型精度和预测检验
  为了检验模型的精度,将基于12个内涝点建立的 ARIMAX 模型进行内涝预测,并计算预测值与实际内涝积水过程的 MAE (平均绝对误差)、MSE (均方误差)、RSME (机器学习误差)。MAE 又叫平均绝对离差,是所有单个观测值与算术平均值的偏差的绝对值的平均值;MSE 是反映估计量与被估计量之间差异程度的一种度量,其可避免误差相互抵消的问题,能准确反映实际预测误差的大小;RMSE 为均方根误差,能够衡量观测值与真实值之间的偏差,常作为衡量机器学习模型预测结果的标准[19]。利用2018―2020年开封主城区暴雨数据对模型进行训练,12个内涝点预测的3种误差值见表4。其中选择了4个典型点的降水及内涝实测过程与模型预测过程进行对比,如图2所示。
  4 基于“7・20”特大暴雨的内涝预测结果分析
  将开封“7・20”特大暴雨的降水过程自7月20日20:00开始至7月21日20:00结束共计24 h ,作为时间序列输入到12个内涝监测站的 ARIMAX 模型进行预报,并对比12个内涝监测站的实测数据(见表5)。

nlc202212201214



  根据表5的对比结果,1 h 预测误差为1~10 cm ,平均绝对误差4.3 cm;2 h 预测误差为0~11 cm ,平均绝对误差4.8 cm;3 h 后平均绝对误差明显增大,超过15 cm 。积水深度在20 cm 以内时误差较小,50 cm 以上误差较大。降水2 h 内12个站内涝预报效果较好;随着降雨持续6 h 后,积水深度的预测值出现了一些偏差;到12 h 后,排涝泵站的启动及其他应急预案的处理和干预,预测值与实测值的偏差较大。总体认为短期内涝预报效果不错,在12个站中,7-S、9-S 两个站的预报效果较好,这两个站均位于老城区。
  对产生误差的原因进行分析,认为“7・20”特大暴雨形成机理极为复杂,预测难度超出目前我国在线运行的气象模型的预测能力。在本次预测过程中,1~2 h 降水预测以每6 min 观测的雷达加密观测数据为基础,应用光流法外推技术实现短时临近降水预测。据评估,20日20时0~2 h 降水量级预测平均准确率为80.5%,误差相对较小。3~12 h 降水预测使用20日8时气象数值模式预测结果,暴雨预测准确率不足20%,预报误差还会随时间延长逐渐增大,严重制约了积水深度预报精度。在积涝中后期,积水深度还受到增设排涝泵站等设备及其他人为干预影响,不能真实反映实际积涝水平。另一方面,建模初期可用样本数量有限,后续随着可用样本数量积累,动态更新训练模型,会得到更精准的预报结果。
  5 结论
  城市内涝积水深度预报是一个比较复杂、影响因素较多的问题,受到下垫面、排水管网、地形等众多因素的影响,而过量降水是导致城市内涝的主要原因。为了精准地对降雨后内涝进行预报,引入了 ARIMXA 模型,将降水作为时间序列输入,构建开封市12个内涝监测站的 ARIMAX 模型。利用2018―2020年汛期(5―9月)开封市自动气象站逐小时降雨量和12个内涝监测站逐小时积水深度数据,将出现的积水个例与同期降水强度进行相关统计分析,让模型经过学习训练提高其精度。以“7・20”特大暴雨过程为例,检验模型预报能力。经验证,在开封12个内涝监测站采用 ARIMAX 模型预测积水深度的思路是可行的,预报精度2 h 内效果较好,在6 h 内也是可以接受的。后续研究中一方面将建立基于临界降水的暴雨积涝预警模型,利用视频监控数据、积涝点监控数据对暴雨积涝预警模型进行动态智能订正,提高城市内涝预测预报的准确性;另一方面,通过与站点环境(下垫面、排水管网、地形等)相似类比方法,建立其他区域的积水深度预测模型,为城市内涝预报提供新的思路,并为城市防洪减灾、构建预警系统等提供新方向。
  参考文献:
  [1] 央视网.特大暴雨!河南32座大中型水库超限[EB/OL].(2021-07-20)[2021-08-22].https:/www.thepaper.cn/ne? wsDetail forward 13664935.
  [2] 大河报.郑州特大暴雨造成直接经济损失532亿元[EB/OL].(2021-08-02)[2021-08-22].https:/news.sina.cn/kx/2021-08-02/detail-ikqcfncc0496637.d.html.
  [3] 河南省人民政府.河南省人民政府关于实施四水同治加快推进新时代水利现代化的意见[J].河南省人民政府公报,2018(20):3-7.
  [4] 孔锋.透视变化环境下的中国城市暴雨内涝灾害:形势、原因与政策建议[J].水利水电技术,2019,50(10):42-52.
  [5] 张建云,王银堂,贺瑞敏,等.中国城市洪涝问题及成因分析[J].水科学进展,2016,27(4):485-491.
  [6] 黄国如.城市雨洪模型及应用[M].北京:中国水利水电出版社,2013:69-72.
  [7] SCHELFAUT K,PANNEMANS B,CRAATS V D I,et al.BringingFlood Resilience into Practice:The Freeman Project [J].En ? vironmental Science &Polocy,2011,14(7):825-833.
  [8] ZHANG L,CHEN X H ,QIAN H S.Diagnosis of Resilience toFlood Hazard in Lower Reaches of the Beijing River [J]. Journal of Hydraulic Engineering,2011,42(9):1129-1134.
  [9] LIU D ,CHEN X H ,NAKATO T.Resilience Assessment of Water Resources System [J].Water Resources Management,2012,26(13):3743-3755.
  [10] 栾震宇,金秋,赵思远,等.基于 MIKE FLOOD 耦合模型的城市内涝模拟[J].水资源保护,2021,37(2):81-88.
  [11] 曾照洋,王兆礼,吴旭树,等.基于 SWMM 和 LISFLOOD模型的暴雨内涝模拟研究[J].水力发电学报,2017,36(5):68-77.
  [12] 敏博,王欢,魏清福,等.平原河网城市雨水系统排水能力及内涝风险评估浅析[J].水电能源科学,2020,38(8):66-68,73.
  [13] 陈嘉雷,陈文杰,黄国如.基于情景模拟与多源数据的城市内涝风险评估[J].水电能源科学2021,39(6):55-59.
  [14] 王俊佳,王川涛,曾胜.基于情景模拟的城市排水能力及内涝风险评估[J].中国给水排水,2020,36(17):115-120.
  [15] 杨帆,许亮,韩晶.佛山市短历时强降雨与潮位组合的内涝风险分析[J].人民珠江,2020,41(4):15-20.
  [16] 汪远征,徐雅静.多元平稳时间序列 ARIMAX 模型的应用[J].统计与决策,2007(18):132-135.
  [17] 左其亭,张修宇.气候变化下水资源动态承载力研究[J].水利学报,2015,46(4):387-395.
  [18] 王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005:86-96.
  [19] 陈聪聪.基于 ARIMA 模型和 ARIMAX 模型的山东省GDP 的预测与分析[D].济南:山东大学,2016:23-27.
  [20] GUO Jianping,HE Jianmin.Co?integration Analysis with Struc?tural Changes Between Consumption and Economic Growth in China [J].Journal of Southeast University (English Edition ),2006,22(2):238-241.
  [21] 冯峰,靳晓颖,刘翠,等.基于相对差异函数的海绵城市弹性评价[J].水利水运工程学报,2021(1):53-61.
  【责任编辑 许立新】

nlc202212201214




转载注明来源:https://www.xzbu.com/1/view-15443536.htm

相关文章