基于ARIMA模型的西安市空气质量指数的分析与预测
来源:用户上传
作者:
摘要:近年来,伴随着城市高速发展,我国众多城市面临着严重的空气质量问题。掌握空气质量的变化发展趋势对于控制空气污染和指导生产生活有着重要的意义。本文利用2017年1月1日至2019年10月24日的西安市空气质量指数(AQI)历史数据,基于ARIMA加法模型对西安市空气质量指数进行分析并做出短期预测。
关键词:ARIMA模型;空气质量指数;预测
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2019)35-0262-02
目前,我国大气污染的形势日益严峻,北方地区的雾霾天气日趋增多。西安属于典型的内陆城市,正处于城市高速发展期,但是在经济建设和城市建设的同时,环境问题日益突出,加之本身地形特征不利于污染物扩散,东北方向外来污染的输入和气象等因素,进一步使得城市中的污染物浓度增高,大气污染问题严重,污染程度在全国各大城市中居于前列。因此,了解西安市空气质量的现状并对空气质量的发展趋势进行预测,这对预警和及时采取有效的措施进行治理有着重要的意义。
空气质量指数是定量描述空气状况的数值,它是将常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式。目前对空气质量指数的预测多采用神经网络模型,灰色模型以及时间序列模型。吴慧静(2019)利用遗传算法改进的神经网络对许昌市AQI进行预测[1];常恬君(2019)对上海市2013-2017年逐日空气质量指数进行分析,在此基础上建立了Prophet-随机森林优化模型[2]。本文利用2017年1月1日至2019年10月24日的西安市空气质量指数历史数据,基于ARIMA加法模型对西安市空气质量指数进行分析并对2019年10月25日至30日空气质量指数进行预测。
1 ARIMA加法模型
ARIMA加法模型是指序列中季节效应和其他效应之间是加法关系,即:
季节加法模型实际上就是通过趋势差分、季节差分将序列转化为平稳序列,再对其进行拟合。它的模型结构如下:
2 西安市空气质量指数特征的统计分析
本文对2017年1月1日至2019年10月24日的西安市空气质量指数(AQI)进行分析,其时序图如图1所示。
由图1可以看出,西安市的空气质量指数数据呈明显的周期性波动特征,统计2017-2019年各月空气质量指数的平均值,绘制折线图见图2。近三年西安市空气质量数据波动趋势较一致,具有明显的周期性,2019年空气质量明显优于往年。由图3可以直观看到,西安市AQI具有明显季节性,冬季污染程度最为严重,春季次之,夏秋AQI优良比例较高。
3 西安市空气质量指数的预测
3.1序列的预处理
3.1.1平稳性检验
由前述分析,西安市空气质量指数序列具有以年为周期的季节效应,因此需要提取其周期信息。对该序列进行步长为365的季节差分消除季节性的影响,差分后时序图见图4.
从图4可以看出,该序列始终在一个常数值附近随机波动,无明显趋势或周期,波动稳定,因而可以初步认定序列是平稳的。为了进一步确认序列的平稳性,使用ADF检验。检验结果见表1,类型二和类型三各种延迟模型的τ统计量的P值都小于显著性水平0.05,所以该序列平稳。
3.1.2纯随机性检验
由于平稳序列通常具有短期相关性,这里构造延迟6期和12期的Q统计量,如表2。
由表2可知,在各延迟阶数下Q检验统计量的P值都很小,所以可以确定该序列属于非白噪声序列。平稳性检验和纯随机性检验显示该序列为平稳非白噪声序列,可以使用ARMA模型拟合差分后的序列。下面考察该序列的自相关图和偏自相关图的特征,对模型定阶。
3.2模型识别
从图5可以看出,差分后序列的偏自相关图显示除了1-2阶的相关系数在2倍标准差范围之外,其他阶数的偏自相关系数都在2倍标准差范围内波动,可以将其看成是2阶截尾。从而将模型初步认定为:AR(2).
3.3参数估计
由最小二乘法对参数进行估计,对西安市AQI序列建立的模型为:
(1-0.794111B+0.220975B2)▽365Xt=εt
3.4模型检验
对所拟合模型,分别进行残差白噪声检验和参数检验,模型残差相关图见图6,模型检验结果见表3。
从图6可以看出,模型的自相关函数值均在二倍标准差范围内,Q统计量的P值都远远大于0.05,检验结果见表3。
LB统计量的P值都大于显著性水平0.05,可以认为残差序列为白噪声序列,模型信息提取比较充分。参数的显著性检验显示两参数均显著非零,因此说明ARIMA(2,(0,365),0)模型对该序列拟合良好。
3.5預测
下面对2019年10月25日-30日西安市空气质量指数的预测值与实际值进行比较,对比结果见表4。
由表4可知,未来三天的预测相对误差在20%左右,这说明用ARIMA(2,(0,365),0)对西安市空气质量指数进行模拟是适合的,并且预测的精度相对较高。
4 结束语
本文利用ARIMA模型对西安市空气质量指数进行分析预测。从预测结果来看,相对误差在20%左右,说明了该模型的拟合程度较好,预测精度较为满意。这些说明该模型能较好地反映西安市空气质量状况的发展规律。
从预测结果来看,未来六日AQI呈持续增加趋势。利用时间序列模型对空气质量进行预测,根据序列自身的变化规律进行建模,方法简便可行,避免了因影响因素考虑不周全造成的预测结果不稳定,具有一定的参考价值。
参考文献:
[1]吴慧静,赫晓慧.基于GA-BP神经网络的空气质量指数预测研究[J].安徽师范大学学报:自然科学版,2019(4).
[2]常恬君,过仲阳,徐丽丽.基于Prophet-随机森林优化模型的空气质量指数规模预测[J].环境污染与防治,2019(7).
[3]刘杰.北京大气污染物时空变化规律及评价预测模型研究[D].北京科技大学,2015.
[4]易丹辉,王燕.应用时间序列分析[M].中国人民大学出版社,2019.
【通联编辑:唐一东】
收稿日期:2019-08-20
作者简介:袁芳(1985-),女,陕西富平人,讲师,硕士,主要研究方向为数据分析。
转载注明来源:https://www.xzbu.com/8/view-15123247.htm