您好, 访客   登录/注册

基于多元线性回归方程安顺市四季AQI预报模型的建立与效果评估

来源:用户上传      作者:曹青 吴哲红 陈贞宏 徐良军

  摘要:对安顺市2015―2019年包括日平均气温、平均相对湿度、平均本站气压、日照时数等18个地面气象观测要素和污染累积基础(前一日AQI值)与当日AQI作相关性分析,选用强相关因子建立四季多元性逐步回归模型,运用等级评分、准确率、标准化平均误差(NME)等6种参数对4个模型预报效果进行评估。得出以下主要结论:四季AQI与气象要素值均表现出明显相关关系,春、夏季预报效果优于秋、冬季,四季AQI预报模型均可以满足实际运用需求。
  关键词:AQI;相关性;多元线性回归;效果评估
  中图分类号:X513文献标识码:A
  Abstract:Correlation analysis was conducted for 18 meteorological observation elements,including daily average temperature,average relative humidity,average atmospheric pressure,sunshine duration,and pollution accumulation basis(AQI of the previous day)and AQI of the current day in Anshun from 2015 to 2019,and a multiple linear regression model was established with strong correlation factors.Six parameters,such as grade score,accuracy and normalization mean error(NME),were used to evaluate the prediction effects of the four models.The main conclusions are as follows:AQI in four seasons shows obvious correlation with meteorological element values,the forecast effect of spring and summer is better than that of autumn and winter,and the forecast model of AQI in four seasons can meet the practical application requirements.
  Keywords:AQI;correlation;multiple linear regression;effect assessment
  安顺市作为中国优秀旅游城市,空气环境质量是影响旅游发展关键因素之一[1]。通过对空气质量与气象条件的关系研究,可以依据对有关气象要素的预报在一定程度掌握空气质量发展趋势[2]。
  国内外学者开展了许多相关研究,对各类模型进行对比分析,叶斯琪等[3]阐述了统计模型在城市空气质量预报中的应用优势,结果表明:多元回归模型平均准确率在4种模型中最高;宋丹等[4]运用多元线性逐步回归和BP神经网络方法,对贵阳市2015―2016年AQI建立模型,结果表明回归模型优于BP神经网络与CUACE模式;Shams等[5]使用2015年每日空气污染指数和气象要素建立空气污染指数多元回归预测模型,显示与非线性模型相比,多元逐步回归模型预测AQI的效果较好;Gogikar[6]对在印度阿格拉地区2011―2015年建立的PM2.5预报模型,得出多元线性回归优于其他两种模型的结论。
  本文对安顺市2015―2019年每日地面气象要素与当日空气质量指数(AQI)作相关性分析,建立多元线性逐步回归模型,并检验模型预报准确率,对模型预报效果进行评估。
  1 数据来源与分析
  1.1 数据采集
  日气象观测数据来自安顺国家基本气象观测站,该站为集成式新型自动气象站,在每日气象观测要素值中选出连续性较好且对气象条件具有代表性的因子共18个,分为8类,其中平均气温、日最高气温、日最低气温作为气温类代表因子,平均湿球温度、平均相对湿度、平均露点温度、平均水汽压作为湿度类代表因子,平均风速、最大风速、最大风速的风向(正北向记为1,顺时针每30°记为1个整数,以最接近方向记为整数1到12)表征风要素,平均本站气压、日最高本站气压、日最低本站气压、平均海平面气压表征气压要素,降水量、平均总云量、最小能见度、日照时数则各自表征降水情况、云量、能见度和日照辐射情况。
  每日AQI值由安顺市4个国控空气监测站点6种大气污染物(SO2、NO2、O3、CO、PM2.5、PM10)每日24小时浓度均值计算得出。
  1.2 数据分析方法
  1.2.1 相关性分析
  相关分析主要是研究两个变量间线性相关程度的强弱,即密切程度。本文主要使用了Pearson与Spearman系数,Pearson系数主要用于定距变量(间隔变量)间相关分析,计算公式(1)如下:
  Spearman系数主要用于定序变量间相关分析,计算公式如下:
  1.2.2 多元线性回归方程
  在线性回归中,如果有多个自变量与因变量呈线性关系,则称为多元线性回归分析,多元线性回归的数学模型为:
  其中ε表示由于随机误差或其他因素的变化引起的y的线性变化部分,其余部分表示由于x的变化引起的y的变化部分。根据相关数据求得线性方程后,再对方程进行F、t检验。
  1.2.3 模型效果评估
  等级评分用于衡量对空气质量等级预报准确率:
转载注明来源:https://www.xzbu.com/1/view-15423390.htm

相关文章