您好, 访客   登录/注册

唐山市雷暴潜势预报研究

来源:用户上传      作者:

  摘要:利用2015—2017年6—8月的552个探空样本,结合唐山市气象局为中心、半径50 km范围内的闪电定位资料,应用动态聚类方法将唐山市区及周边的雷暴情况分为3类(分别记为1类、2类、3类),并应用雷达回波与闪电叠加资料验证了该分类的可靠性;用逐步选择法和逐步回归法探空样本中的对流参数进行筛选,将筛选出的与雷暴有密切关系的对流参数作为预报因子做主成分分析,给出预报因子与雷暴关系的相应解释,最后应用Bayes判别分析与Logistic回归判别雷暴潜势预报方法建立模型进行雷暴预报,得出预报方程,并在Logistic回归判别法中给出3类的预报概率,发现这2种方法对唐山市区雷暴的预报准确率都到达了70%以上,对唐山市区雷暴的预报有一定的参考作用。
  关键词:雷暴;对流参数;动态聚类;Bayes判别;Logistic回归判别;唐山市
  中图分类号:P456.8 文献标识码:A
  文章编号:0439-8114(2020)07-0131-05
  DOI:10.14088/j.cnki.issn0439-8114.2020.07.027
  Abstract:Combining the 552 radio sound observations during June and August from 2015 to 2017 with the lightning location information within a range of 50 km around Tangshan,this article applies dynamic clustering method to classify thunderstorm occurance in Tangshan district into three categories (as category 1,2,3). The reliability of the categories is verified with overlay of lightning location information onto radar echo PPI. Ten convective parameters associated with each radio sound observation are filtrated by the means of gradual selection and stepwise regression method. The convective parameters,which are closely related to thunderstorms,are selected as the forecasting parameters and are used for principal component analysis so that an explanation on the relationship between the factors and thunderstorm is given. Finally for the potential prediction of thunderstorms,Bayes discriminant and Logistic regression discriminant are deployed to establish prediction models and Logistic regression discriminant can also provide the probability of the three categories. The results show that the forecast accuracy of the methods mentioned above are better than 70 percent and might be used as a reference in the specified district.
  Key words: thunderstorm; convective parameters; dynamic clustering; Bayes discriminant; Logistic regression discriminant; Tangshan city
  雷暴是强对流天气的一种,是发生频率较高的灾害性天气之一,加强对雷暴天气的分析与研究,提高雷暴天气的监测预报能力,对防灾减灾有十分重要的意义。为此,国内外学者对雷暴形成机制和预报方法进行了许多研究。陈艳等[1]指出对流有效位能对强对流天气发生有较好地指示作用;赵秀英等[2]和高守亭等[3]也分别把与动力、热力相关的风暴强度指数和里查逊数应用于强对流发生机制的研究;郝莹等[4]做了关于判别分析法和指标叠加法应用于雷暴潜势预报方面的研究;郑传烈[5]将独立参数条件概率法应用于雷暴的预报;Agostino[6]利用探空资料以及闪电定位资料对神经网络进行了训练,并利用神经网络法对雷暴发生以及闪电密度进行了预报。本研究分析K指數等10个对流参数,应用Bayes判别分析法和Logistic回归判别法进行雷暴潜势预报。
  1 资料来源
  应用2015—2017年乐亭站的探空资料,将研究时间限定在每年的6—8月。乐亭站每天进行两次探空,获取探空资料时间为8:00和20:00,给出每天两次的大气状况。闪电定位资料和雷达资料分别由唐山市气象局闪电定位系统和西外环观测站雷达站提供。以唐山市气象局为中心,在50 km半径范围内每次探空后12 h内发生闪电与该次探空资料进行配对,作为一个完整的样本进行分析。3年的完整样本总数为552个。   2 雷暴发生条件及对流参数介绍
  雷暴发生的基本条件是层结的不稳定、较好的低空水汽条件和适当的触发因子。理论和实践都证明不稳定的层结有利于强对流天气的发生[7],条件性对称不稳定对雷暴的产生起了重要作用[8]。低层存在丰富的湿空气,是雷暴产生的一个有利条件[9],湿度的铅直分布影响层结的稳定度。适当的触发因子,在大气层结不稳定、低空水汽丰富等条件适合的情况下,一旦有切变、冷锋、强对流天气区等触发因子入侵启动,非常有利于雷暴天气的发生。
  选取了10个对流参数做分析,分别为K指数(K index,KI)、强天气威胁指数(Sweat index)、抬升指数(Lifted index,LI)、沙氏指数(Showalter index,SI)、对流有效位能(Convective available potential energy,CAPE)、粗里查逊数(Bulk Richardson number,BRN)、抬升凝结高度层温度(Temperature of the lifted condensation level,TOTLCL)、平均混合层潜热(Mean mixed layer potential temperature,MMLPT)、平均混合层混合比(Mean mixed layer mixing ratio ,MMLMR)、累积可降水量(Precipitable water for entire sounding,PWFES)。
  SI、Sweat index、LI、CAPE属于稳定度指标,MMLPR和PWFES代表水汽指标,KI属于热力指标,BRN、MMLPT、TOTLC属于热力动力综合指标即触发因子指标。经过对10个因子的筛选分析表明,主要是KI、SI、CAPE、BRN、PWFES这5个因子对雷暴有较好的预报意义。SI表示气层的不稳定程度,负值越大,气层越不稳定。CAPE为在自由对流高度之上,气块可从正浮力做功而获得的能量,表示大气浮力不稳定能量的大小,和SI反映单层的浮力不同,CAPE是气块浮力能的垂直积分量,更能反映大气整体结构特征[10] 。PWFES代表了一定时间一定体积大气内的含水量。KI在反映气层不稳定程度的同时考虑了中低层的水汽条件。试验表明,强对流可以发生在弱的垂直风切变结合强的位势不稳定或相反环境中,即垂直风切变和位势不稳定存在着某种平衡关系。Weisman等[11]引入了BRN,包含动力和热力参数,反映了强风暴发生时动能和热力能量之间的平衡关系,对强对流预测是一个较好的物理量。
  3 依据探空资料的雷暴分类及验证
  首先以欧氏距离为基础,对探空样本进行动态聚类。两个样本间的欧氏距离D的计算公式为:
  研究将552个探空样本分3类:唐山市区(此处定义唐山市为唐山市气象局为中心、50 km半径范围内)发生100次以上闪电的样本被划分为第1类,市区闪电少于100次但市区周边发生闪电的样本为第2类,市区内无闪电发生的样本为第3类。明显符合此条件的样本分别为2015年7月8日的第1次探空、2016年6月25日的第2次探空和2017年7月7日的第2次探空。因此,本研究动态聚类计算中,选取的初始凝聚点分别为2015年7月8日的第1次探空、2016年6月25日的第2次探空和2017年7月7日的第2次探空。分类结果显示,该分类与初始凝聚点所属类别基本吻合。计算机随机选择初始凝聚点进行分类结果与人工选择初始凝聚点的结果无本质差异。因此,预报就按3类考虑,第1类代表探空后12 h内唐山市区有雷暴发生,第2类代表探空后12 h内唐山市区周边(郊区或县市)有雷暴发生,第3类代表探空后12 h内唐山市区及周边无雷暴发生。将第1类至第3类值分别取值为1、2、3,将探空样本与该时段的雷暴类别值(即1、2、3)组成一个完整的样本对探空后12 h内的雷暴情况进行分析。
  利用雷达回波与闪电叠加资料对上述分类进行了验证(图1和图2)。图1为2017年8月14日4:27的雷达回波与该样本时段(0:00—12:00)内发生闪电叠加,图2为7月22日11:42的雷达回波与该样本时段(0:00—12:00)内发生闪电的叠加(其中黑色正号为正地闪,黑色负号为负地闪)。由图1可见,8月14日4:27强雷达回波出现在唐山市区,同时在该样本时段内唐山市区发生了雷暴,并伴随大量闪电产生,符合第1类情况。由图2可知,7月22日11:42在唐山市区周边出现强雷达回波,同时在该样本时段内唐山市区周边发生了雷暴,伴随大量闪电,并在唐山市區出现了少量闪电,符合第2类情况。大量实例表明,该分类与雷达回波和闪电叠加资料的对应达90%,即一个样本时段(12 h)内在唐山市区或唐山市区周边出现强雷达回波的同时在该区域发生雷暴,并伴随大量闪电。因此通过雷达回波和闪电叠加资料证明了该分类的可靠性。
  4 利用Bayes判别分析法做预报
  4.1 方法介绍
  判别分析是在已知研究对象分为若干类并已取得各类的一批已知样本数据的基础上,根据某些准则建立判别函数,再将要进行分类样本的相应值带入判别函数,然后对未知类型的样本进行判别分类[12]。Bayes方法的基本思想是利用对判别影响较大的先验概率来判断样本属于哪一类。
  4.2 因子筛选
  判别分析模型中随机向量的维数不宜太高(即预报因子的个数不宜太多),维数太高,方差阵可能是病态或接近病态,从而导致计算逆矩阵时会有较大误差,使参数估计不正确、误判概率增大,因此选择逐步选择法对预报因子进行筛选,将对模型的判别能力贡献达不到留在模型中的标准因子剔除掉,逐步选择法对因子的增减采用了F检验法,原则为设置阈值[Fin]、[Fout],拟合模型,当模型中因子系数的F统计量小于[Fout],将该因子剔除出模型,当因子系数的F统计量大于[Fin]时,将该因子选入模型,再次拟合模型,依上述方法继续筛选因子直至无因子入选模型,停止筛选。将552个完整样本利用逐步选择法进行筛选后,其中KI、SI、CAPE、BRN、 PWFES入选模型,并通过F检验发现5个预报因子对模型贡献均为极显著。利用这5个预报因子,以Bayes判别分析法建立雷暴预报方程。   4.3 预报
  利用2015年和2016年2年的368个完整样本建立如下预报方程:
  [L1=-3.664 32+0.035 96X1+0.002 76X2+][0.000 352 0X3+0.000 015 3X4+0.110 06X5];
  [L2=-7.016 14+0.081 66X1+0.006 24X2+][0.000 557 7X3+0.000 136 6X4+0.118 56X5];
  [L3=-8.051 33+0.083 47X1+0.003 06X2+][0.000 743 9X3+0.000 085 51X4+0.129 94X5];
  式中,L1至L3分別为第1至第3类的预报函数,[X1]至[X5]分别代表KI、SI、CAPE、BRN、PWFES,利用上述预报方程对2017年184个探空样本做预报,能够直接给出探空样本所属的类别,表1给出3类各自所包含的样本数及预报情况。可见1类包含15个样本,2类包含73个样本,3类包含96个样本,对1类的预报准确个数为13个,预报准确率为86.7%,对2类的预报准确个数为46个,预报准确率为63.0%,对3类的预报准确个数为85个,预报准确率为88.5%,整体的预报准确率为78.3%。总体来说,该方法对唐山市区及周边雷暴情况的预报有较好的指示作用,具有一定的应用价值。
  5 利用Logistic回归判别法做预报
  5.1 方法介绍
  Bayes判别分析法无法给出样品属于哪一类的概率,只能给出是或否,即在雷暴的预报上无法给出发生雷暴的可能性有多大[12],因此再次尝试利用Logistic回归判别法做预报,给出雷暴的预报概率。
  该方法首先利用已知样本建立Logistic回归模型:
  式中,L1至L3分别为第1至第3类的预报概率,[a]为截距项,[X]为预报因子,[b]为预报因子系数。利用已知样本建立的回归模型对未知样本做预报,得出样本属于各类的概率。
  5.2 因子筛选
  将对流参数利用逐步回归法(该方法原理与逐步选择法基本相同)进行筛选后,其中 KI、CAPE、PWFES入选模型,下面利用这3个预报因子,通过Logistic回归判别法建立预报模型进行雷暴预报。
  5.3 预报
  利用2015年和2016年2年的368个完整样本建立如下模型:
  采用Score检验,发现3个因子的Pr和chisq值都很小,说明预报因子对模型的影响非常显著,同时模型Akaike信息量和Schwarz信息量都很小,说明该模型拟合较好,式中[X1]至[X3]分别代表KI、CAPE、PWFES,L1至L3分别为第1至第3类的预报概率。
  利用该模型对2017年184个探空样本进行预报,由于该方法可以给出每类的概率,3类概率相加为100%,所以规定3类中发生概率最高的一类为该样本时段的雷暴情况,以2016年7月18日第二次观测为例,当天的实际情况为在唐山市区发生雷暴,模型给出第1类概率为39%,第2类和第3类的概率分别为31%和30%,由于唐山市区发生雷暴(第1类)的概率最大,所以判定当天唐山市区有雷暴发生,与事实吻合。该方法对2017年唐山市区雷暴预报准确率为76.2%,误报率为23.5%,对唐山市区周边雷暴预报准确率为72.0%,误报率为18.3%。由于该方法可以给出雷暴发生的概率,并且对唐山市区雷暴预报准确率达到70%以上,表明该方法对唐山市区雷暴的预报是可行的。
  6 预报因子的主成分分析
  随机变量的主成分是它们的少量线性组合,这些线性组合尽可能刻划全部随机变量的特性,设随机向量X的协方差阵为[∑],[∑]特征值从小到大排列,这些特征值对应彼此正交单位特征向量,这些特征向量与X的内积就是主成分。
  由于Bayes判别分析法中入选模型的预报因子分别为KI、SI、CAPE、BRN、PWFES,包含了Logistic回归判别法模型中入选的预报因子,因此对这5个预报因子做主成分分析,得到预报因子的5个主成分,其样本协方差特征值分别为7 917 610.68、944 882.23、7 032.75、535.32、105.59,前2个主成分特征值的方差贡献率已经达到了99%,因此完全可以采用前2个主成分对预报因子与雷暴之间的关系做出解释。前2个主成分分别为:
  [PRIN1=0.000 314X1-0.000 261X2+0.049 082X3+][0.998 795X4+0.000 177X5];
  [PRIN2=0.005 442X1+0.005 935X2+0.998 75X3-][0.049 084X4+0.004 871X5];
  式中,PRIN1和PRIN2分别为第一主成分和第二主成分,[X1]、[X2]、[X3]、[X4]、[X5]分别为KI、SI、CAPE、BRN、PWFES,由第一主成分可见除SI前的系数为负外,其他几个预报因子前的系数都为正,这表明除SI与雷暴呈负相关外(SI表示气层的不稳定程度,负值越大,气层越不稳定),其他几个预报因子与雷暴呈正相关,并且系数的绝对值越大表明该预报因子对雷暴的影响越强。由第二主成分可见,CAPE和BRN前的系数最大,CAPE能反映大气整体结构特征,而BRN能够对强对流做很好的预测,该主成分说明他们之间存在反差,即存在相互的反向影响。
  7 结论
  利用2015—2017年6—8月的552个探空样本,以唐山市气象局为中心、半径50 km范围内的闪电定位资料,应用动态聚类方法将唐山市区及周边的雷暴情况分为3类(分别记为1类、2类、3类),并应用雷达回波与闪电叠加资料验证了该分类的可靠性。   用逐步选择法和逐步回归法对10个对流参数(每个探空样本包含10个对流参数)进行筛选,将筛选出的与雷暴有密切关系的对流参数作为预报因子做主成分分析,给出预报因子与雷暴的关系,最后应用Bayes判别分析与Logistic回归判别雷暴潜势预报方法建立模型进行雷暴预报,得出预报方程,并在Logistic回归判别法中给出3类的预报概率,发现2种方法对唐山市区雷暴的预报准确率都到达了70%以上,对唐山市区雷暴的预报有较好的指导作用。
  参考文献:
  [1] 陈 艳,寿绍文,宿海良. CAPE等环境参数在华北罕见秋季大暴雨中的应用[J]. 气象,2005,31(10):56-61.
  [2] 赵秀英,吴宝俊. 风暴强度指数SSI[J]. 气象,2005,26(5):55-56.
  [3] 高守亭,孙淑清. 应用里查逊数判别中尺度波动的不稳定[J]. 大气科学,1986(10):171-182.
  [4] 郝 莹,姚叶青,陈 焱,等. 基于对流参数的雷暴潜势预报研究[J]. 气象,2007,33(1):51-56.
  [5] 郑传烈. 用独立参数条件概率法做汕头机场雷暴预报[J]. 广东气象,2000(增刊1):38-39.
  [6] AGOSTINO M. Sounding-derived indices for neural network based short-termthunderstorm and rainfall forecasts[J]. Atmospheric research,2007,83(2-4):349-365.
  [7] 朱乾根,林錦瑞,寿绍文. 天气学原理和方法[M]. 北京:气象出版社,1983.310-318.
  [8] COLAN B R. Thunderstorms above frontal surfaces in environments without positive cape. PartⅠ: Aclimatology[J]. Mon Wea Rev,1990,118:1103-1121.
  [9] MILLER R C. Notes on analysis and severe storm forecasting procedures of the air force global weather central[R]. Air Weather Service,Scott AFB,IL,1972.
  [10] 李耀东,刘健文,高守亭. 动力和能量参数在强对流天气预报中的应用研究[J]. 气象学报,2004,62(4):402-409.
  [11] WEISMAN M L,KLEMP J B. The structure and classificatin of nu2 merically simuiated convective storms indirectionally varying wind shears[J]. Won Wea Rev,1984,112:2479-2489.
  [12] 黄 燕,吴 平,等. Sas统计分析及应用[M]. 北京:机械工业出版社,2006.293-336.
转载注明来源:https://www.xzbu.com/8/view-15281775.htm