您好, 访客   登录/注册

基于深度LSTM神经网络的大气可降水量估算模型

来源:用户上传      作者:

  摘要:基于深度长短期记忆(LSTM)神经网络,分别利用地面气象多要素(气温、气压、露点温度、相对湿度、水汽压、小时降水量)和单要素(水汽压)建立怀化地区GPS大气可降水量估算模型LSTM5和LSTM1,并对模型精度进行分析。结果表明,利用地面气象要素建立的2种大气可降水量深度LSTM模型有较好的估算精度,决定系数均大于0.94,均方根误差均值小于1.158 1 mm,平均绝对误差均值小于0.709 9 mm,平均绝对百分比误差均值小于4.54%,较基于水汽压的可降水量线性拟合或二次多项式拟合模型的估算精度提升了70%以上,且LSTM1模型精度略优于LSTM5模型;模型估算精度与大气可降水量条件相关,当可降水量较低或较高时,模型估算结果更为理想;同时模型估算精度与观测站海拔呈现正相关,观测站海拔越高LSTM模型精度越高。
  关键词:LSTM;GPS/MET;大气可降水量;估算模型;怀化地区
  中图分类号:TP183         文献标识码:A
  文章编号:0439-8114(2020)02-0161-05
  DOI:10.14088/j.cnki.issn0439-8114.2020.02.036           开放科学(资源服务)标识码(OSID):
  Estimation model of precipitable water vapor based on deep LSTM neural network
  LUO Yu1,LUO Lin-yan2,FAN Jia-zhi1,DUAN Si-ru1,GAO Wen-juan1
  (1.China Meteorological Training Center Hunan Branch,Changsha 410125,China;
  2.Hunan Provincial Meteorological Information Center,Changsha 410118,China)
  Abstract: Based on deep long short term memory(LSTM) neural network, the estimation models (LSTM5 and LSTM1) of precipitable water vapor (PWV) in Huaihua distinct are proposed by using multi(air temperature, air pressure, dew point temperature, relative humidity, water vapor pressure and hourly precipitation) and single factor(water vapor pressure) separately, besides the estimation precision of the models are analyzed. As the result shown, the LSTM models have high estimation precision, whose coefficients of determination are both greater than 0.94, mean values of root square error, mean absolute error and mean absolute percentage error are below 1.158 1 mm, 0.709 9 mm and 4.54% respectively. The precision of LSTM models improves more than 70% compared to linear estimation model or quadratic polynomial estimation based on water vapor pressure, and the precision of LSTM1 model slightly better than that of LSTM5. The distribution of estimation errors relates to PWV value, which is first increased and then decreased along with the increasing of PWV. Furthermore, there is negative correlation between the estimation precision of the models and altitude of the stations.
  Key words: LSTM; GPS/MET; atmospheric precipitable water vapor; estimation model; Huaihua area
  水汽在大氣中含量虽少,却影响着能量传输、辐射平衡和成云致雨等大气物理化学过程,是大气的重要组成部分,是天气变化和气候演变的主要驱动力,也是影响灾害性天气形成和发展的关键性因子[1]。实际应用中,一般采用大气可降水量(Precipitable water vapor,PWV),即单位面积大气柱内水汽量来表示大气水汽含量[2]。但大气水汽变化迅速,时空分布较为复杂,作为国内气象部门常规探测手段的无线电探空限于站网分布和观测时次,资料时空分辨率较低[3]。利用全球导航卫星系统(GPS)进行大气水汽探测技术的出现弥补了常规探测手段的不足,其探测精度达毫米级,可提供全天候、高分辨率的水汽信息[4-6]。基于GPS反演的可降水量可以反映特定区域水汽流入、流出情况,因此广泛应用于气象数据融合、数值预报和降水研究及预报等方面[7-9]。湖南省气象局与湖南省国土资源厅合作建设GPS/MET探测网,截至2015年共71个站点建成并投入业务运行,为湖南省天气预报、气候预测及气象防灾减灾提供更高时空分辨率的水汽场。但相较于湖南省近22万km2土地面积,观测站数量仍相对较少,大多数地区无法直接探测得到大气可降水量,因此有必要利用站网密度更大、时间序列更长的地面气象资料估算大气可降水量。国内外相关研究表明,地面气象要素与可降水量之间存在明显相关性,可利用地面气象要素对可降水量进行估算[10-12]。但相关研究一般利用水汽压与可降水量进行线性拟合或二次多项式建模,未考虑地面气象要素与可降水量时间序列上的相关性。20世纪80—90年代,循环神经网络(RNN)能以很高的效率对序列的非线性特征进行学习,而作为RNN变体之一的长短期记忆神经网络(LSTM)因可有效解决简单RNN的梯度爆炸或消失问题,使其在气象相关时间序列建模和预测方面得到广泛应用[13-16]。本研究基于深度LSTM神经网络模型,利用湖南省怀化市地面气象数据对GPS可降水量进行建模,以改进地面气象要素估算大气可降水量精度。   1  资料与方法
  1.1  资料选取
  本研究选用湖南怀化地区沅陵、溆浦、靖州和通道4个GPS/MET观测站逐小时资料和地面气象观测逐小时资料(观测站位置、海报高度等信息如表1所示),数据时间为2017年1月1日至2017年12月31日。怀化地处湘中丘陵向云贵高原的过渡地带,属中亚热带季风气候区,四季分明,雨量充沛,且雨热同步,对农作物生长有利。但受地形影响,地域差异和垂直差异明显,旱涝等自然灾害时有发生。所有数据均由全国综合气象信息共享平台(CIMISS)上获取。考虑到地域性差异,在GPS/MET站探测得到天顶总延迟(ZTD)的基础上,采用本地化的静力延迟模型[5]和加权平均温度模型[6]反演4个观测站的GPS可降水量。
  根据大气科学相关知识,对GPS可降水量与各地面气象要素[气温(T)、气压(P)、露点温度(DP)、相对湿度(RH)、水汽压(VAP)和小时降水量(OHP)]进行相关性检验,并计算相关系数如表2所示。由表2可知,除气压外,可降水量与气温、露点温度、相对湿度、水汽压和小时降水量均呈正相关,除与相对湿度和小时降水量相关系数小于0.3,其余相关系数均大于0.6。考虑到相关研究[7-9]表明降水与可降水量存在时间上的关联性,初步确定特征向量Xt=[x , x ,…,x ]T,其中x ~x 分别为T、P、DP、VAP和OHP,t为某一特定时刻。考虑时间窗为48 h,即利用过去47 h和当前时刻的特征向量序列X={x(t-47), x(t-46),…,x(t)}作为输入,建模当前时刻的可降水量Y={y(t)}。
  1.2  长短期记忆神经网络(LSTM)
  与简单RNN相比,LSTM能够捕获任意长度时间序列的自回归结构,其在序列建模任务中取得了广泛的成功[17-19]。LSTM单元结构如图1所示,it,ft和ot分别为输入门、输出门和遗忘门3种门控,ct为单元间激活向量,ht为存储了t时刻及之前时刻有用信息的隐状态向量,其计算公式依次为式(1)~式(5)。
  it=?滓(∑Wx ixt+∑Wh ixt-1+∑Wc ixt-1+bi)  (1)
  ft=?滓(∑Wx fxt+∑Wh fxt-1+∑Wc fxt-1+bf)  (2)
  ot=?滓(∑Wx oxt+∑Wh oxt-1+∑Wc oxt-1+bo)  (3)
  ct=ftct-1+ittanh(∑Wx cxt+∑Wh cxt-1+bc) (4)
  ht=ottanh(ct)  (5)
  式中,xt为t时刻输入向量,W为权重矩阵,b为对映权重偏执项,σ为sigmoid函数。
  1.3  数据预处理
  地面气象要素由国家级气象观测站获取,且已经过审核,因此数据质量及连续性得到保障;GPS/MET数据由于供电、网络等故障影响,存在少量缺测,利用地面水汽压线性拟合得到GPS可降水量[8]进行补缺,形成4个观测站各8 760个时次的观测资料时间序列。相关研究表明[20,21],气象数据(尤其降水量)时间序列多为存在较明显周期和趋势的非平稳序列,而平稳时间序列相对更容易分析建模。因此,采用一阶差分方法对4个观测站的时间序列数据平稳化。若不对数据进行标准化处理可能导致计算负担增大,甚至模型无法收敛等问题。因此,采用Z-SCORE方法对各特征向量进行标准化处理,使处理后的特征向量分布于(0,1)区间。
  1.4  大气可降水量建模
  沅陵、溆浦、靖州和通道4个观测站数据按9∶1的比例,将数据前90%用作训练集,后10%用作测试集。采用决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)对模型估算值和真实值偏离程度进行度量,其计算公式如下:
  式中,PWVto和PWVtm分別为t时刻可降水量实测值和模型估算值, 为可降水量实测平均值。
  用于估算大气可降水量的4层LSTM模型结构如图2所示。分别采用温度、气压、露点温度、水汽压及小时降水量5个特征和水汽压1个特征作为输入层的输入向量(相应LSTM模型分别简称LSTM5和LSTM1),各层节点数分别为20、15、20和1。LSTM层激活函数为tanh,Dense层激活函数为linear,各层节点丢弃率设为0.2,以降低节点间的相互依赖性从而避免过拟合。模型选择均方差损失函数获取模型输出误差,模型优化方法采用均方根RMSProp算法,学习率为0.001,训练迭代次数为50。研究基于Windows操作系统,结合Python语言和Keras深度学习框架中的Sequential模型进行。
  2  结果与分析
  利用地面气象要素基于深度LSTM神经网络对怀化地区4个观测站的GPS可降水量估算建模进行训练,并利用测试集对模型精度进行检验,结果如表3和图3(以LSTM1模型为例)所示。由表3可知,沅陵、溆浦、靖州和通道4个观测站的深度LSTM可降水量估算模型决定系数均大于0.94,LSTM5模型RMSE均值为1.158 1 mm,MAE均值为0.709 9 mm,MAPE均值为4.54%;LSTM1模型RMSE均值为1.130 3 mm,MAE均值为0.670 7 mm,MAPE均值为4.23%。相较于基于水汽压的可降水量线性拟合或二次多项式拟合模型5 mm的RMSE的估算精度[8,10-12],LSTM模型精度提升了70%以上,且R2、MAE和MAPE指标均得到大幅改进。LSTM1模型精度略优于LSTM5模型,可能是由于LSTM5模型选用的5个特征因子间存在一定相关性造成的信息冗余影响模型精度。由图3可知,除个别时次外,可降水量LSTM模型估算值均能较好反映实际观测值,且对可降水量的转折性变化有较好体现,进而反映可降水量变化趋势。对比4个观测站LSTM模型估算可降水量精度,可见其与测站海拔高度呈现正相关,海拔最高的通道站(表1)其大气可降水量估算RMSE仅为0.847 9 mm,为4个观测站最小。其原因可能是大气水汽分布随海拔呈指数衰减,低海拔地区水汽更为充沛且变化迅速,增加了模型的训练难度。   3  小结
  本研究首先利用相关性检验分析了大气可降水量与地面气象要素的关系,同时结合时间上的关联性筛选估算可降水量的特征因子;针对气象数据的非平稳序列特性,采取一阶差分方法提升序列平稳性,并对数据进行标准化处理;在此基础上构建了4层的深度LSTM模型,按时间顺序划分训练集和测试集,利用训练集对深度LSTM模型进行训练后使用测试集评估大气可降水量的估算精度。
  1)基于怀化地区4个观测站的地面气象要素,对大气可降水量建立的深度LSTM模型,其决定系数均大于0.94,利用气温、气压、露点温度、相对湿度、水汽压和小时降水量作为特征因子建立的LSTM5模型RMSE均值为1.158 1 mm,MAE均值为0.709 9 mm,MAPE均值为4.54%;单独利用水汽压作为特征因子建立的LSTM1模型RMSE均值为1.130 3 mm,MAE均值为0.670 7 mm,MAPE均值为4.23%。较基于水汽压的可降水量线性拟合或二次多项式拟合模型的估算精度提升了70%以上。LSTM1模型精度略优于LSTM5模型,产生该结果的原因可能是特征因子间存在一定相关性造成信息冗余进而影响模型精度。
  2)利用基于深度LSTM的大气可降水量模型对怀化地区4个观测站的PWV进行估算,结果显示估算误差分布与大气可降水量条件相关,误差较大的样本多出现在15~25 mm区间,估算模型的精度随大气可降水量的增加呈先降低后升高的趋势,当可降水量较低或较高时,模型估算结果更为理想。
  3)基于深度LSTM的大气可降水量估算模型精度与观测站海拔呈正相关,观测站海拔越高LSTM模型精度越高,其原因可能是低海拔地区水汽更为充沛且变化迅速,增加了模型的训练难度,进而降低了模型精度。
  参考文献:
  [1] BRAUN J,ROCKEN C,WARE R. Validation of line-of-sight water vapor measurements with GPS[J].Radio science,2001,36:259-472.
  [2] 李国平,黄丁发,郭  洁,等.地基GPS气象学[M].北京:科学出版社,2010.148-150.
  [3] WANG H,HE J,WEI M,et al. Synthesis analysis of one severe convection precipitation event in Jiangsu using ground-gased GPS technology[J].Atmosphere,2015,6:908-927.
  [4] BEVIS M,BUSINGER S,HERRING T A,et al. GPS meteorology:Remote sensing of atmosphere water vapor using the global positioning system[J].Journal of geophysical research,1992,97(D14):15787-15801.
  [5] 罗  宇,罗林艳,范嘉智,等.天顶静力延迟模型对GPS可降水量反演的影响分析及改进[J].测绘工程,2018,27(8):13-17.
  [6] 罗  宇,罗林艳,吕冠儒.加权平均温度模型对GPS水汽反演的影响[J].测绘科学,2018,43(9):6-9,15.
  [7] PRIEGO E,SECO A,JONES J,et al. Heavy rain analysis based on GNSS water vapour content in the Spanish Mediterranean area[J].Meteorological application,2016,23:640-649.
  [8] 羅林艳,罗  宇,段思汝,等.郴州地区GPS可降水量精度及其变化特征[J].湖北农业科学,2018,57(11):14-18.
  [9] 杨璐瑛,刘  畅,杨成芳,等.不同天气系统影响下强降雨过程GPS可降水量变化特征对比[J].干旱气象,2018,36(3):475-482.
  [10] 杨景梅,邱金桓.用地面湿度参量计算我国整层大气可降水量及有效水汽含量方法的研究[J].大气科学,2002(1):9-22.
  [11] 李  超,魏合理,刘厚通,等.整层大气水汽含量与地面水汽压相关性的统计研究[J].武汉大学学报(信息科学版),2008,33(11):1170-1173.
  [12] 李  颖,张俊东,罗  鹏.大气可降水量估算模型研究[J].气象与环境科学,2013,36(2):21-25.
  [13] HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J].Neural computation,1997,9(8):1735-1780.
  [14] ZHENG D Y,HU W S,WANG J,et al. Research on regional zenith tropospheric delay based on neural network technology[J].Survey review,2014,343(47):286-295.
  [15] DING M. A neural network model for predicting weighted mean temperature[J].Journal of geodesy,2018.doi:10.1007/s 00190-018-1114-6.   [16] WANG H,WEI M,ZHOU S H. A feasibility study for the construction of an atmospheric precipitable water vapor model based on the neural network technology[J].Desalination and water treatment,2014,52(37-39):7412-7421.
  [17] QING X,NIU Y. Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM[J].Energy,2018,148:461-468.
  [18] 徐堯强,方乐恒,赵冬华,等.基于LSTM神经网络的用电量预测[J].电力大数据,2017,20(8):25-29.
  [19] ZHANG D,KABUKA M R. Combining weather condition data to predict traffic flow:A GRU-based deep learning approach[J].IET intelligent transport systems,2018,12(7):578-585.
  [20] ADIB A,KALAEE M M K,SHOUSHTARI M M,et al. Using of gene expression programming and climatic data for forecasting flow discharge by considering trend, normality,and stationarity analysis[J].Arabian journal of geosciences,2017,10(9):208.
  [21] 许家琦,李颜伶,舒  红.中国东北地区气象数据的空间平稳性检验[J].华中师范大学学报(自然科学版),2014,48(2):279-283.
  收稿日期:2019-10-18
  基金项目:湖南省气象局面上科研项目(XQKJ19B053)
  作者简介:罗  宇(1984-),男,四川巴中人,高级工程师,主要从事大气遥感与探测研究,(电话)18075183271(电子信箱)mariachi41@qq.com。
转载注明来源:https://www.xzbu.com/8/view-15192524.htm