对数正态分布贝叶斯更新方法比较研究
来源:用户上传
作者:
摘 要设备可靠性数据是PSA定量化分析的基础,对于可靠性数据,一般分为通用数据和电厂的特定数据。由于两种数据在应用中均存在一定的缺陷,现在通用的做法是将通用数据作为先验数据,然后结合电厂的特定数据贝叶斯更新得到后验分布在PSA模型中使用。在操作实践中,发现对数正态分布的通用数据,在进行后期的贝叶斯拟合时存在一定的困难。在工程实践上,一般将其转化为Gamma或Beta分布再进行处理,并形成了几种成熟的解决方案。本文对对数正态分布转化为Gamma分布的几种方法做了比较研究,并简述其差异和特性。
关键词贝叶斯方法;PSA;Gamma分布;Beta分布;对数正态分布
0 前言
随着PSA技术在核电厂广泛的推广,PSA的应用也逐渐地深入,这就对作为PSA技术基础的可靠性数据工作提出了更高的要求。现阶段,国内各个电厂一级PSA模型基本已开发完毕,随着电厂运行时间的积累,势必伴随着电厂的变更改造和设备可靠性数据的更新。电厂的变更改造是对模型结构的修改,而设备可靠性数据的更新即是对模型中数据的修改,通过这一过程,保证模型反映电厂实际,这也就是所谓的living PSA。PSA技术发展至今,针对数据的处理方法基本上有三种思路。第一种是采用国际上已发布的同型电厂通用数据,现在主流的就是美系的NUREG-6928、法系的EPS-900数据源,此外我国国家核安全局在国内机组运行数据统计的基础上,于2016年发布了我们自己的通用数据;第二种是使用核电厂自己的运行数据做经典估计。对于第一种方法,同型电厂与自身电厂不可避免的存在差异,所以直接使用通用数据并不能完全反映特定电厂的所有特征。对于第二种方法,由于在最初阶段电厂的运行时间并不长,并且核电厂设备的可靠性一般较高,所以收集到的可靠性数据较少,往往是没有数据,使用经典估计存在着困难。最好的方法就是将第一种与第二种方法结合起来,这也就是在可靠性数据处理中最常用的贝叶斯方法。在这种方法中,将通用数据作为先验数据,将电厂收集到数据作为特定数据,然后应用贝叶斯公式进行拟合,使得到的后验数据同时包括了两方面的特征。
使用贝叶斯方法时需将数据的先验分布通过贝叶斯定理转化为后验分布。在贝叶斯处理中,存在一种共轭分布的现象,就是对于既定的样本数据的分布,存在一种先验分布函数,使得后验分布函数和先验分布函数同属于一个分布族。对于运行失效来说,这个分布是Gamma分布,对于需求失效而言,为Beta分布。对于Gamma和Beta分布,其通过贝叶斯转化之后仍为Gamma和Beta分布,可以说处理起来是非常方便的。但很多的数据源,如法国EDF、EPRI的数据,假设失效率的先验分布是对数正态分布,对于这样的数据,在贝叶斯转化时存在一定困难。
本文在总结贝叶斯处理方法和原理的基础上,对对数正态分布的先验数据贝叶斯拟合的几种主要方法做比较研究,并分析其优劣。
1 可靠性数据的三种典型分布
由定义可以看出,部件运行失效的概率服从泊松分布,λ是泊松分布的参数。而泊松分布的共轭分布是Gamma分布,所以对于运行失效率,常以Gamma分布来表示。
由定义可以看出,需求失效概率p服从二项分布,而二项分布的共轭分布是Beta分布,所以需求失效常以Beta分布来表示。
此外,在可靠性和维修性方面,随机变量的对数可能符合正态分布,对此情况在可靠性数据的统计分析中也常应用对数正态分布。
1.1 Gamma分布
Gamma分布因其概率密度函数很像Gamma函数定义中积分号内的被积部分而得名。对于X服从形状参数为α,尺度参数为β的Gamma分布,我们记为:
因其在数学上处理方便,且有两个参数α,β的调节,适应范围很广,所以工程上常常将运行失效率的分布假设为Gamma分布,如美国所做的柴油发电机可靠性分析、IAEA-TE CDOC -478中收集的瑞典可靠性数据[1]。在意义上,Gamma分布可看作是泊松分布参数(单位时间内随机事件发生率)的概率分布,且泊松分布的共轭分布即为Gamma分布。
1.2 Beta分布
1.3 对数正态分布
对数正态分布有如下特点。
对数正態分布是自变量取对数时,其故障密度函数符合正态分布的一种偏态性概率分布。它的故障率基本属于递增型的,但递增的速度是变化的,先快后慢然后趋于平缓。对数变换可将较大的数缩小为较小的数,且越大的数缩小的越多,这一特性可以使较为分散的数据通过对数变换相对的集中起来,所以常把跨几个数量级的数据用对数分布去拟合。在机械零件及材料的疲劳寿命中,对数正态分布应用的较多。在核电厂设备可靠性参数、共因参数方面,对数正态分布同样有着大量的应用。
2 贝叶斯方法
Bayes方法在20个世纪50年代提出,用于解决复杂系统的可靠性评估问题,在处理小样本数据时具有明显优势,在武器和航天等领域取得很好的评估效果和经济效益。经过半个多世纪的发展,Bayes小样本理论已经形成了比较成熟的研究体系。
Bayes方法同经典的统计理论的区别是所求参数的本身被看成随机变量,如单元的寿命,求得的后验分布为参数的概率分布区间。Bayes方法利用了先验分布,不需要很大的样本也可以得到较好的概率估计值。相比经典方法而言,Bayes方法的优势在于能够充分利用各类先验信息,包括可靠性试验数据、历史数据、专家信息和仿真试验信息等,降低了经典方法对现场试验样本容量的依赖程度,使得在相同评估精度要求条件下,现场样本容量可以相对减少。需要强调的是,Bayes方法不是少用信息,而是充分运用产品试验过程中的各类信息(可靠性试验数据、历史数据、专家信息和仿真信息等),因而在实际工程可以得到较好的应用[2]。
连续分布的贝叶斯公式是可靠性数据分析中经常用到的,因为对于部件的运行失效率λ和需求失效率γ(这里统一用θ表示)而言,在其可能的区间里,其分布显然是连续的。设{x1,…,xn}代表一个样本,它服从一个具有似然函数L、连续参数θ和先验密度g(θ)的一个分布。那么,θ的后验分布密度为: 对于对数正态分布作为先验分布的情况,如果直接进行贝叶斯估计,需要进行烦琐的数值积分,且得到的后验分布不一定是正态分布,这样会对今后进行PSA定量化的不确定性分析带来困难[2]。在工程上,对于对数正态分布的情况,一般的解决方法是将其转化为Gamma分布和Beta分布,由于在设备可靠性较高的情况下,Beta分布可近似看作Gamma分布处理,所以本文着重讨论对数正态分布转化为Gamma分布的情形。
3 对数正态分布为先验分布的贝叶斯处理
工程上,如果先验分布是对数正态分布,一般将其转化为Gamma分布,然后进行贝叶斯处理。这一转化过程,采用的是一种数学上的近似,在实践领域也有了多種成熟的方法。
3.1 转化方法
1)EF值转化法:在这种方法中,令转化前后的mean值和EF值相等。
由于先验分布的mean值和EF值已知,所以问题转化为已知Gamma分布的mean值和EF值,求取α和β。
Gamma分布均值mean,误差因子EF,由于mean已知,只需通过EF求取出α,即可确定β。这里我们可以选用查表的方法,也可以选用数值计算对α的数值进行搜索。
清华大学就EF值转化法进行过成功应用,并且已经在大亚湾核电厂的数据处理中进行了实践[3]。
2)95%分位点转化法:在转化过程中,使这两种分布在两个关键点(均值和95%分位点)上重合,找到满足上述条件的Gamma分布参数α,β,即完成了将先验分布的对数正态分布转换为Gamma分布的工作。
在具体转化时,同样已知均值mean和EF,利用对数正态分布的函数关系,求出其x0.95,利用参考文献[4]中与α的关系曲线,可以求得α值。再根据已知的mean关系,即可得出Gamma分布。同方法1),也可以利用数值计算的方法完成对α的搜索。
在国内,机械科学研究院与秦山核电压水堆电厂即秦山一二期与方家山电厂的数据处理采用该种方法。
3)方差转化法:这种方法是令转化前后的均值和方差相等。由已知LN分布的均值和EF值,可以方便地求出其方差。再利用Gamma分布均值mean,可以顺利地求出α和β。通过三种方法的比较,可以看到此种方法最为简便。在实际应用中,秦山三期重水堆采用的是该种方法。
3.2 三种转化方法的比较
1)三种方法的准确性分析
假设一均值mean=0.5,误差因子EF=3的对数正态分布,当累计失效次数为2,累计运行小时数为2500时,得到如下后验分布图像。
由图1可以看出,当失效数据较小时,三种转化方法差异不大,与LN分布经数值积分后的贝叶斯转化结果也无明显偏差。
假设对数正态分布的均值和误差因子不变,当累计失效次数为6,累计运行小时数为4500时,得到如下图像。
由图2可知,当失效数据较大时,EF值转化法与LN经数值积分后的结果最为接近,95%分位点法次之,总体上这两种方法差异不大,而方差转化法的误差偏大。
2)LN分布EF值与Gamma分布α值相关性比较
设先验数据的分布类型为对数正态分布,其先验均值为0.5,利用EF值转化法,可得EF关于α的关系曲线如图3所示。
由图3可以观察到,当EF值较小时,α值是关于EF值的减函数,随着EF值的增大,α值的变化有一个相对平缓的区间,此时的α相对于EF的变化敏感性不强。随着EF值继续增大,α值有一个迅速增大的过程,从形态上来看,呈现出指数增长的特征。
4 结论
在针对核电厂小样本失效概率分析的情况下,贝叶斯方法有着其明显的优越性,所以在核电厂PSA分析中有着广泛的应用。但是当先验分布为对数正态分布的情况,在求取后验分布时又面临着数学上的困难。为此工程上形成了三种行之有效的解决方案。经过对三种方法进行对比,发现EF值转化法较为复杂,但所得结果准确性较高;95%分位点法次之;方差转化法最为简单,但形成的偏差也最大。此外,研究发现,LN分布的EF值与转化后Gamma分布的α值并不呈单调关系,前部随着EF值增大会有一个递减的过程,且当EF值增大超过一定数值后,α将会呈现一个指数增大的过程。
参考文献
[1]马静娴,闫国奎,刘志军.用贝叶斯方法处理核电站PSA分析中的设备可靠性数据[J].2004年全国机械可靠性学术交流会论文集.
[2]刘方亮.核电厂小样本数据Bayes处理方法应用研究[D].清华大学硕士学位论文,2010年.
[3]茆定远,薛大知.核电站PSA分析中可靠性数据处理的贝叶斯方法,核动力工程Vol.21.No.5 Oct.2000.
[4]Some Properties of Distributions Useful in the Study of Rare Events,IEEE Transaction on Reliability Vol.R-31,No.1,APRIL 1982.
转载注明来源:https://www.xzbu.com/8/view-15231093.htm