您好, 访客   登录/注册

基于 Transformer 的多特征融合的航空发动机剩余使用寿命预测

来源:用户上传      作者:马依琳 陶慧玲 董启文 王晔

  摘要:发动机作为飞机的核心部件,对飞机运行起着至关重要的作用.对航空发动机做准确的剩余使用寿命预测,能够提前进行维护诊断,预防重大事故的发生,节约维护成本.针对现有的方法缺乏对不同时间步长的考虑以及不同传感器和操作条件之间关系的研究,提出了一种基于 Transformer 的多编码器特征输出融合的航空发动机剩余使用寿命预测方法.该方法选取两个不同时间长度的输入数据,使用排列熵对传感器之间的关系进行分析,并将操作条件数据独立提取特征.在广泛使用的航空发动机 CMAPSS (Commercial Modular Aero-Propulsion System Simulation)数据集上进行了实验验证.实验结果表明,该方法优于现有的先进预测方法,可有效提高预测精度.
  关键词:深度学习; 剩余使用寿命; 航空发动机; Transformer
  中图分类号: TP399 文献标志码: A DOI:10.3969/j.issn.1000-5641.2022.05.018
  Prediction of remaining useful life of aeroengines based on the Transformer with multi-feature fusion
  MA Yilin, TAOHuiling, DONG Qiwen, WANG Ye
  (School of Data Science and Engineering, East China Normal University, Shanghai 200062, China)
  Abstract: As the core components of aircraft, engines play a vital role during flight. Accurate prediction of the remaining useful life of the aeroengine can help prognostics and health management, thus preventing major accidents and saving maintenance costs. In view of the lack of consideration of different time steps and the relationship between different sensors and operating conditions in existing methods, a remaining useful life prediction method based on the Transformer was proposed, which fuses multi-feature outputs from different encoder layers. This method selects two input data with different time steps, analyzes the relationship between the sensors using permutation entropy, and extracts features independently from the operating condition data. The experimental results on the public aeroengine dataset CMAPSS (Commercial Modular Aero-Propulsion System Simulation) show that the proposed method is superior to other advanced remaining useful life prediction methods.
  Keywords: deep learning; remaining useful life; aeroengine; Transformer
  0 引言
  S着在线购物的日益普及,我国物流行业蓬勃发展.航空物流作为现代物流的重要组成部分,具有高时效性的显著特点,能够满足人们对物流速度更高的需求.在近两年全球疫情形势下,航空物流更是表现出了其重要的战略作用.我国航空物流的体量较大,2020年我国航空货邮周转量完成了240.2亿吨公里,规模稳居全球第二[1].但相比发达国家,我国航空物流发展的起点较晚,存在前期投入高、运营成本高等问题.根据国际咨询机构 Armstrong & Associates 估算的数据,2019年中国物流费用约占 GDP 的14.50%,相比美国8.00%的占比,仍有很大的发展潜力[2].在复杂多变的国际形势下,如何降低航空物流的成本,提高服务质量,保障国内国际双循环,是我国航空物流下一阶段发展的挑战[1].
  确保飞机安全运行是整个运输流程中首要保证的环节,一旦飞机发生意外事故,不仅会造成巨大的财产损失,更会造成不可挽回的人员伤亡,后果不堪设想.对飞机进行维护和修理的费用在航空公司运营成本中占据了很大部分,单机单次检修的成本高达100万元至800万元[3].发动机作为飞机最核心的部件,它的可靠性和安全性在飞机整体运行中起着至关重要的作用.由于航空发动机的结构十分复杂,零部件众多,又经常处于高温、高压、高速旋转的高负荷工作环境,不可避免地会出现性能退化或故障的情况.有资料显示[4],航空发动机的维修成本占飞机总维修成本的1/3以上.
  传统的发动机维修方式可以分为基于故障的维修和基于时间的维修[4].基于故障的维修是指当故障发生以后,对特定的故障零部件进行维修或更换,这种事后的维修方式无法对未来可能发生的故障起到预防的作用.基于时间的维修是指根据发动机制造商所提供的维修时间表,定期地对发动机进行检查和修理,是一种预防性维修方式.但是定期维修没有考虑到发动机的个体差异,无法对每个发动机制定科学合理的维修时间间隔,过度维修会加重维修成本负担,而缺乏维护则会导致严重的事故发生.如何在降低维修成本的同时,确保航空发动机的安全性和可靠性,是航空发动机发展中所遇到的难题.

nlc202210091018



  故障预测和健康管理(Prognostics and Health Management, PHM)是美国等航空发达国家所提出的一种健康管理技术[5],旨在推动维修保障模式改革,提高发动机的安全性和经济性.其中,剩余使用寿命(Remaining Useful Life, RUL)预测是指根据设备当前的健康状态、工作环境和传感器监测信息等,结合物理模型、历史数据,对未来故障发生的时间进行预测,估计设备的剩余使用寿命,是故障预测技术中最具挑战性和最核心的部分.根据所预测发动机的剩余使用寿命,可以合理地制订飞行计划和检修计划,及时地发现隐蔽的故障,预防事故的发生,进行健康管理.
  目前,国内外对 RUL 预测的研究大致分为3类:基于物理模型的方法、数据驱动的方法和两者混合的方法.基于物理模型的方法是指根据发动机的失效机理或损伤法则、设备的结构特点以及专家经验等多方面因素, 对研究对象构建相应的物理模型, 该物理模型能够具体地解释产品退化规律, 如 Paris 等[6]针对机械材料疲劳裂纹扩展问题而建立的 Paris-Erdogan 模型,经过不断的改进和更新,得到了广泛的应用[7-9].虽然基于物理模型的方法准确性较高,但它对研究对象的先验知识要求非常高,而且对于航空发动机这类结构特别复杂的设备,通常难以构建准确、全面的物理失效模型,适用性较低.
  数据驱动的方法是指对大量的监测数据直接建模,从数据中得到设备的潜在退化规律,从而预测设备的 RUL.数据驱动的方法不要求研究者具备大量关于设备运行原理的先验知识,而且从数据中更能发现一些难以人工发现的、比较隐蔽的故障特征.因此,数据驱动的方法在航空发动机 RUL 预测问题中被广泛研究.根据所使用的算法不同,数据驱动的方法又可以细分为基于统计分析的方法、基于传统机器学习的方法和基于深度学习的方法.基于统计分析的方法将传感器数据拟合为某一用来模拟产品退化过程的随机过程模型,如基于维纳过程的模型[10-11]、基于伽马过程的模型[12]和基于逆高斯过程的模型[13]等,以此估计产品的剩余使用寿命.此类方法通常对产品的退化过程做了一定的限制和假定,在实际过程中很难被保证,从而限制了其实用性和可靠性.与之相比,机器学习的方法不对设备的退化过程做任何前提假设,直接建立从输入数据到 RUL 的映射模型,对发动机这类复杂设备来说,此类方法更具有实用意义.一些早期的研究使用了传统机器学习的方法,如 Nieto 等[14]实现了基于混合粒子群优化支持向量机参数的模型对发动机 RUL 进行预测、Khelif等[15]使用支持向量回w拟合RUL.传统机器学习方法只能以标量的形式独立地处理时序数据,在特征处理方面具有一定的局限性;而基于深度学习的方法不需要进行繁琐的特征工程,且更适合处理大量的、高维度的数据.因此,基于深度学习的方法在航空发动机 RUL 预测问题上具有更广阔的应用前景,受到了更多的关注.
  循环神经网络(Recurrent Neural Network, RNN)和卷积神经网络(Convolutional Neural Network, CNN)是在 RUL 预测中最常使用的两种深度学习神经网络.由于 RNN 存在梯度消失和梯度爆炸的问题,其变体长短期记忆网络(Long Short Term Memory, LSTM)和门控循环单元(Gated Recurrent Unit, GRU)通过门控制单位对其做了改进,得到了更广泛的应用,例如: Shuai 等[16]提出了基于 LSTM 的 RUL 估计方法,并在3个广泛使用的公开数据集上进行了验证; Ren 等[17]使用多尺度全连接 GRU 网络对轴承的 RUL 进行了预测; Wang 等[18]提出了基于双向长短期记忆(Bidirectional Long Short Term Memory, BiLSTM)的方法,实现了 RUL 预测; Hu 等[19]等提出的双向递归神经网络(Deep Bidirectional Recurrent Neural Network, DBRNN)集成方法,构建了几种不同的 DBRNN, 将得到的一系列 RUL 值重新封装,从而得到最终的结果; Li 等[20]首先利用主成分分析(Principal Component Analysis, PCA)对传感器数据进行降维,然后利用 LSTM 对提取的时间序列数据进行预测,建立 RUL 预测模型; Li 等[21]提出的基于深度卷积神经网络(Deep Convolutional Neural Network, DCNN)的 RUL 预测模型,沿时间维度进行卷积运算; Li 等[22]采用时间卷积网络 (Temporal Convolutional Network, TCN)来估计 RUL; Zeng 等[23]提出了一种新的深度注意力残差神经网络模型用于 RUL 预测; Abderrezek等[24]提出了卷积自动编码器 (Convolutional Auto-Encoder, CAE)和BiLSTM网络混合的模型来预测 RUL; Remadna等[25]提出的使用 CNN 提取空间特征和BiLSTM网络提取时间特征的混合 RUL 预测模型.
  然而,基于 RNN 的方法由于本身结构的限制,无法充分利用并行计算,存在运行效率低的问题.基于 CNN 的模型在处理时序特征上视野受卷积核大小的限制,存在无法捕获远距离特征的问题. Transformer 模型是由 Vaswani 等[26]提出的一种基于自我注意力机制的网络,该模型既能有效处理随时间变化的长期依赖关系,又能通过并行计算提高运行效率,在自然语言处理等领域取得了巨大的成功.最近,已有学者将 Transformer 模型应用到 RUL 预测问题上,例如: Mo 等[27]将 Transformer 编码器作为模型的主干,并使用1个门卷积单元合并每个时间步局部上下文的信息,实现了 RUL 的预测; Zhang 等[28]使用完全基于自注意力的编码器解码器结构,提出了由传感器特征和时间步长特征作为输入的双编码器 Transformer 结构,取得了不错的预测结果.

nlc202210091018



  以上研究中,缺乏对输入数据时间步长选取的考虑,以及对操作条件和传感器之间、传感器与传感器之间的影响关系的研究.针对现存的问题,本文提出了一种基于 Transformer 的多编码器特征输出融合的模型,主要工作有以下3个方面.
  (1)选取2个不同时间长度作为输入,利用 Transformer 模型的并行计算能力,分别输入2个编码器层进行独立的训练,将这2个编码器层的输出结果进行融合,增强短时间序列特征信息的同时,保留长期依赖关系.
  (2)通过添加排列熵嵌入层,将能够反映信号单调性和变化趋势的排列熵信息融合到传感器数据,使模型能更好地捕捉不同传感器之间的关系信息.
  (3)将操作条件和传感器数据分离,使其各自作为独立的输入通过不同的编码器层训练,避免操作条件和传感器数据之间的干扰,提升模型的预测精度.
  本文将所提出的模型在航空发动机 CMAPSS (Commercial Modular Aero-Propulsion System Simulation)数据集上进行了验证,且与目前先进的模型相比,得到了更好的预测效果,体现了本文方法的有效性.本文的后续结构:第1章介绍所提模型的具体结构和理论基础;第2章描述实验细节,展示实验结果,并进行结果分析以及消融研究;第3章对全文工作进行总结,并展望未来工作的方向.
  1 RUL 预测模型搭建
  1.1 模型总体架构
  本文基于 Transformer 的Y构,提出了多编码器特征输出融合的模型,其具体架构如图1所示.由图1可知,模型主要分为多编码器层和解码器层2个部分.多编码器层可以同时对不同的输入分别进行特征提取,包括2个不同时间步长的编码器层、传感器排列熵编码器层以及操作条件编码器层.各个编码器层的输出经过融合后,作为解码器层的输入,通过解码器层对来自不同方面的特征进行提取后,通过前馈全连接网络输出 RUL 的预测值.
  1.2 双时间步长编码器层
  发动机当前的状态信息,由当前时间点的传感器信号和过去一定时间点的信号得到.本文采用滑动时间窗口方法对时间序列数据进行分割,图2展示了采样过程.
  如何选取滑动窗口的时间长度,对预测结果起到很关键的作用.如果时间长度过长,距离当前时间点过久的信息可能会成为无用信息甚至是干扰信息,混淆模型的预测结果;如果时间长度太短,又会造成信息的丢失,影响预测结果.现有的研究通常尝试不同的时间步长作为输入,最终选取效果最好的1个时间步长作为模型的输入.
  Transformer 模型相较于传统的 RNN、CNN 等深度学习模型,具有可并行计算的优点,随着计算力的发展,可以在一定程度上牺牲内存换取更好的实验结果.利用 Transformer 模型的并行性,本文创新性地提出了选取2个不同时间步长的输入,分别独立地进行特征提取,一方面保留了长时间序列的特征信息,另一方面又能更集中高效地处理短时间序列的特征信息,最终将2个编码器层的特征输出
  本文所使用的多个编码器层的结构相似,具体如图3所示.从图3可以看到,每个编码器层由多个结构相同的子编码器层堆叠而成;每个子编码器层包括多头自注意力层和前馈全连接层,并且都应用了残差连接以及标准归一化操作,以防止梯度消失,加速模型收敛.
  由于输入数据具有时序性,而 Transformer 的自注意力机制无法直接捕捉到输入的顺序.因此,在原始数据进入双时间步长编码器层前,需要先通过1个位置编码层,对其添加相对位置信息,使模型能更好地捕捉到时序特征.本文采用 Transformer 中最常用的位置编码模式,即正弦位置编码和余弦位置编码[26].相应计算公式为
  公式(1)中: t 表示时间点; d 表示传感器的维度;2i 表示偶数位传感器,用正弦函数(sin)来编码;2i +1表示奇数位传感器,用余弦函数(cos)来编码.
  自注意力机制是 Transformer 模型中的核心部分.将上一层的输出矩阵 X 分别与3个权重矩阵Wq、Wk和Wv 相乘后得到对应的3个向量,分别为查询向量 Q、键向量 K 和内容向量 V.对应公式为
  通过计算 Q 和 K 的点积获得关联矩阵,经过Softmax函数激活后得到每个位置对应的权重,最后再将此权重叠加到 V 得到自注意力输出.具体公式为
  其中^Dk 是键向量维度的平方根,作为缩放因子用来缓解梯度消失问题.
  本文所提的模型中,多头自注意力层采用了多头注意力机制,即计算了多组 Q、K、V, 再将多组注意力输出拼接后作为最终输出,以均衡同一种注意力机制可能产生的偏差,从而提升模型效果.相应计算公式为
  公式(4)中: W 表示多头注意力权重矩阵; hi 指第i个自注意力输出; H 为注意力头数.
  1.3 传感器排列熵编码器层
  通过对时间步长数据进行转置,得到传感器排列熵编码层的输入,传感器排列熵编码器层将沿着传感器的维度进行特征提取.然而,由于传感器之间的位置关系不明确,模型不能够有效获取不同传感器之间的位置信息.二阶排列熵是一种能够反映信号的单调性和变化趋势的非线性动力学参数[29],能够放大时间序列的微弱变化,度量时间序列的复杂性,从而有效地反映不同传感器的特征.在输入编码器层之前,本文添加了排列熵编码层,先对输入数据进行了排列熵编码处理,以此注入传感器之间的关系,使编码器层能更好地学习到不同传感器之间的影响.
  假设第i个传感器的测量序列为{si (1), si (2), ・・・,si (t)},采用相空间对其进行重构,并取嵌入维数为2, 得到相空间重构矩阵其中τ表示延迟时间.将矩阵中的每一行看作1个重构向量,对其进行升序排列,得到索引的2种排列方式;统计对应排列方式出现的概率并记为p1和p2;最后使用公式

nlc202210091018



  求得该传感器的排列熵.
  计算得到每个传感器的二阶排列熵后,对其进行线性映射以适应输入矩阵的大小;在排列熵编码器层对输入矩阵进行编码,添加排列熵信息.添加公式为
  公式(7)中: X 表示输入矩阵; S 表示传感器二阶排列熵向量; We 表示排列熵权重矩阵.
  1.4 操作条件编码器层
  操作条件是指现实环境和运行条件数据与传感器信号数据之间的相关性较弱,现有的研究通常将操作条件数据和传感器信号数据混为一谈.编码器层中自注意力机制会计算不同传感器之间的相关性,假如操作器数据也在其中,会加重模型的计算负担,却不能得到一个合理有效的结果.本文将操作器数据和传感器信号数据分离,并行地作为另一个编码器层的输入提取特征,在减少对传感器信号数据干扰的同时,不浪费操作条件中所包含的特征信息,从而提升模型的预测效果.
  在多个编码器层完成特征提取后,需要进行特征融合;特征融合层将各个编码器层输出的结果连接后,通过线性映射作为多编码器层融合的输出 O .相应公式为
  公式(8)中: Ot1、Ot2、Os、Oc分别对应时间步长1编码器层、时间步长2编码器层、传感器排列熵编码器层和操作条件编码器层的特征输出结果; Wo 表示特征融合权重矩阵.
  1.5 解码器层
  解码器层和图3中编码器层的结构类似,由多个子解码器层组成,每个子解码器层包括2个多头自注意力层和1个前馈全连接层.相地,每个层都进行了残差连接和标准归一化:第一个多头自注意力层添加了掩码操作,即将QKT 向量点乘1个同样大小的上三角掩码,避免模型提前观察到未来时间点的数据;第二个多头注意力层为编码器解码器注意力层,将前一层的输出作为查询向量,将解码器层的输出作为键向量和内容向量进行计算;最终,依次通过展开层和全连接层输出所预测的 RUL, 得到最终结果.
  2 实验分析
  2.1 数据集介绍
  CMAPSS 数据集是由美国国家航空航天局(National Aeronautics and Space Administration, NASA)阿姆斯研究中心,在其开发的航空推进系统仿真平台 CMAPSS 上,对涡扇发动机的关键部件退化过程进行大量仿真实验所得到并公开的1组数据[30],在航空发动机 RUL 预测问题上被广泛使用.图4展示了 CMAPSS 中涡扇发动机仿真模型的结构图.其中,Fan 表示发动机风扇,LPC (Low Pressure Compressor)表示低压压气机,HPC (High Pressure Compressor)表示高压压气机,Combustor 表示燃烧室,N1表示风机轴,N2表示核心轴,LPT (Low Pressure Turbine)表示低压涡轮,HPT (High Pressure Turbine)表示高压涡轮,Nozzle 表示喷嘴.
  CMPASS 数据集共包含4个子数据集,分别仿真了在不同工作状况和不同的故障模式下涡扇发动机的传感器数据.本文选取包含同一种工作状况的数据集1和数据集3对本文模型进行验证:数据集1模拟了高压压气机性能退化这一故障;数据集3模拟了高压压气机性能退化和风扇退化这2种故障模式.每个子数据集包括训练集和测试集:训练集包括100台发动机从某一时刻开始到完全失效这一时段内每个飞行循环的操作条件数据和传感器数据;测试集包括另100台发动机在某段时间内每个飞行循环的操作条件数据和传感器数据,并给出了对应的剩余使用寿命.数据集1和数据集3都用飞行循环作为衡量单位.其中,操作条件数据包括飞行高度、马赫数和油门解算器角度这3个发动机工作环境参数;而传感器数据则记录了21个传感器测量值,每个传感器的详细描述详见表1.由于本文采用的 CMAPSS 数据集是由NASA 提供的公共数据集,因此,本文描述传感器数据时,遵照了该数据集的官方设置,所使用的单位是航空动力学领域的常用单位.
  2.2 数据预处理
  2.2.1 数据归一化
  从表1可以看到,各个传感器的数值单位不一致.为了增强不同传感器数据之间的比较性,提高模型的收敛速度和精度,本文先对传感器数据做了缩放处理.在对比了标准归一化和最大C最小归一化后,本文选择效果更好的最大C最小归一化方法.计算过程为
  公式(9)中: xi 表示当前时间点的值; xi(m)ax 和 xi(m)in 分别指当前传感器在所有时间点内的最大值和最小值; x 表示归一化计算后所得到的数据.
  2.2.2 传感器选择
  通过观察发现,在21个传感器的数据中,传感器1、5、6、10、16、18、19的监测数据一直保持恒定.因此,应该剔除这些无法反映发动机退化信息的数据,只留下剩余的14个有价值的传感器数据作为模型的输入.图5展示了数据集1中发动机的传感器数据.其横坐标为飞行循环,纵坐标为归一化后的传感器数据(x ).
  2.2.3 排列熵计算
  根据公式(6), 取延迟时间τ=5,计算得到14个传感器的排列熵值,得到熵值如表2所示.将计算所得的排列熵作为传感器二阶排列熵向量添加到排列熵编码器层.
  2.2.4 RUL 标签设置
  有研究显示[31],分段线性退化模型能较好地处理 CMAPSS 数据集的 RUL 预测问题.该模型假设发动机在运行初期属于正常状态,各项传感器的数据较为平稳,因此,认为在这段时间里 RUL 值均等于1个根据经验设定的 RUL 最大值.当发动机运行一段时间后,发动机进入退化状态,RUL 随着运行时长线性递减,如图6所示.图6中,横坐标为实际飞行循环数;纵坐标为设置的 RUL 标签,表示剩余飞行循环数.本文采取分段线性退化模型对训练集中的数据设置 RUL 标签,并根据预测效果,将 RUL 标签最大值设定为125个飞行循环.

nlc202210091018



  2.2.5 评价指标
  为了验证模型预测结果的有效性和准确性,本文使用了2个常用的指标来进行评价:均方根误差(Root Mean Square Error, RMSE), 本文用 RRMSE 表示;预测分数(Score), 本文用Sscore表示.这二者都是值越小,表示预测的效果越好. RRMSE 是回归问题中常用的指标,其计算公式为
  公式(10)中: N 表示样本数量; j 表示样本j 的预测 RUL 值; Lj表示样本j 的 RUL 真实值.
  Sscore是 NASA 针对此公开研究问题提供的官方评价指标.在 RUL 预测值小于真实 RUL 时,意味着预测的发动机故障时间超前于真实的故障时间,根据这个测试结果所做出的维修决策偏向于保守,比较安全,Sscore的值较小;而当 RUL 预测值大于真实值时,可能会导致意外的事故或危险发生,后果更为严重,此时Sscore的值更高.其具体的计算公式为
  公式(11)中: N 表示样本数量; j 表示样本j 的预测 RUL 值; Lj表示样本j 的真实 RUL 值.
  2.3 模型超参数设置
  在模型训练中,为了更充分地利用训练集的数据,本文采用了滑动窗口步长为1对训练集中的数据进行分割,比较了不同时间长度的预测效果后.对数据集1, 选取20个和30个飞行循环的时间长度作为双时间长度编码器的输入;对数据集3, 选取20个和40个飞行循环的时间长度作为双时间长度编码器的输入.表3描述和记录了模型中其他重要超参数的设置.
  2.4 实验结果分析
  使用表3中的最优参数,将模型在数据集1和数据集3中进行训练和预测.在训练过程中,将训练集中90%的样本数据作为训练样本,在剩下10%的样本数据上进行验证;以均方误差(Mean Square Error, MSE)作为损失函数,使用 Adam 算法优化模型权值;最后在测试集中进行测试,得到最终的结果.表4展示了本文模型中所得到的 RRMSE 以及与其他模型的对比;表5展示了本文模型所得到的Sscore以及与其他模型的对比. RRMSE 和Sscore的值越低,代表模型的预测精度越高,效果越好.表4、表5中,字体加粗显示的结果代表所有方法中最好的成绩,下划线显示的结果代表所有方法中
  从表4和表5中的对比结果可以看出,本文模型在数据集1上取得了优于其他先进模型的效果,RRMSE 和Sscore这2个评价指标都得到了最好的结果:对于 Mo 等[27]提出的 GCU-Transformer 模型,由于其原文并未提供Sscore指标的结果,因此,本文只比较了在 RRMSE 上的成绩,可以看到本文模型在 RRMSE 上取得了2%的降低;相较于 Zhang 等[28]提出的 DAST 模型,本文模型的 RRMSE 下降了3.4%;本文模型的Sscore相较于 Li 等[22]提出的 TCN 模型结果下降了13%.
  对于数据集3, 从 RRMSE 来看,本文模型略高于 Zeng 等[23]所提出的 DARNN 模型,但在Sscore指标上大幅度地超过了 DARNN 的结果,效果提升了35%;与 DAST 模型相比,本文模型Sscore分数略高,但在 RRMSE 分数上取得了很大的下降,效果提升了5.6%.如前所述,与数据集1相比,数据集3包含更多的故障模式,因此,数据集3的情况更为复杂些,对于 RUL 预测任务而言更具考验.相比 DARNN 模型和 DAST 模型在其中一个指标上取得了最佳效果,而另一指标效果不佳的情r,本文模型在这2个指标上都取得了第二的效果.由此可见,本文模型稳定性较好,可以实现整体性能和安全性的均衡.
  综合来看,相比现有的先进模型,本文模型在2个评价指标上都取得了不错的结果,且在2个数据集上都得到了验证,显示出了本文模型的可靠程度较高.
  2.5 消融研究
  本文采用 DAST 模型[28]作为基准模型. DAST 模型是由传感器特征和时间步长特征作为输入的双编码器 Transformer 结构,得益于自注意力机制,它能够有效处理长时间序列数据.本文所提出的模型对其做了3方面的改进工作:一是使用双时间步长编码器输入;二是添加排列熵编码层;三是独立拆分操作条件输入.在数据集1上进行消融实验,以研究每一部分工作对整体预测结果的影响.表6所示数据显示了消融实验的结果,验证了每一模块的有效性.
  3 结论
  本文提出了一种新的基于 Transformer 的多编码器特征输出融合的 RUL 预测模型:使用2个不同步长的编码器层分别进行特征提取,保留长短时间序列中不同的信号特征;采用二阶排列熵对传感器进行位置编码,使模型能更好地捕捉到不同传感器之间的影响关系,并将操作条件数据与传感器数据分离;使用独立的编码器进行训练.利用 Transformer 模型可并行计算的优势,将多个不同的编码器层的输出进行融合后,通过解码器层得到最终的 RUL 结果.通过在广泛使用的航空发动机 CMAPSS 数据集上进行的实验,结果表明,本文模型的预测效果优于现有的其他先进算法,验证了本文模型能够有效提高航空发动机 RUL 预测的精度.
  在未来的工作中,可以继续以下3方面的研究,以期进一步提升预测效果:第一,可以研究更优化的标签设置方法;第二,可以探索数据中存在的不平衡问题;第三,可以尝试利用无监督数据进行预训练来提升模型性能.
  [参考文献 ]
  [1]任治潞.从“重客轻货”到“客货并重”―《“十四五”航空物流发展专项规划》解读[J].大飞机, 2022(2):56-60.
  [2]邹建军.新发展格局下我国航空物流建设发展策略思考[J].民航管理, 2020(12):16-22.

nlc202210091018



  [3]李小, 徐启明.大运行理念下飞机维修成本精益管理[J].民航管理, 2021(10):58-63.
  [4]周俊.数据驱动的航空发动机剩余使用寿命预测方法研究[D].南京:南京航空航天大学, 2017.
  [5]蔡光耀, 高晶, 苗学问.航空发动机健康管理系统发展现状及其指标体系研究[J].测控技术, 2016, 35(4):1-5.
  [6] PARIS P C, ERDOGAN F. A critical analysis of crack propagation laws [J]. Journal of Basic Engineering, 1963, 85(4):528-533.
  [7] ZHAO F, TIAN Z, ZENG Y. Uncertainty quantification in gear remaining useful life prediction through an integrated prognosticsmethod [J]. IEEE Transactions on Reliability, 2013, 62(1):146-159.
  [8] LEI Y, LI N, GONTARZ S, et al. A model-based method for remaining useful life prediction of machinery [J]. IEEE Transactions onReliability, 2016, 65(3):1314-1326.
  [9] SUN J, ZUO H, WANG W, et al. Prognostics uncertainty reduction by fusing on-line monitoring data based on a state-space-baseddegradation model [J]. Mechanical Systems and Signal Processing, 2014, 45(2):396-407.
  [10] HUANG Z, XU Z, WANG W, et al. Remaining useful life prediction for a nonlinear heterogeneous wiener process model with anadaptive drift [J]. IEEE Transactions on Reliability, 2015, 64(2):687-700.
  [11]朱磊, 左洪福, 蔡景.基于Wiener过程的民用航空发动机性能可靠性预测[J].航空动力学报, 2013, 28(5):1006-1012.
  [12] WANG H K, HUANG H Z, LI Y F, et al. Condition-based maintenance with scheduling threshold and maintenance threshold [J].IEEE Transactions on Reliability, 2016, 65(2):513-524.
  [13] PENG W, LI Y F, YANG Y J, et al. Bivariate analysis of incomplete degradation observations based on inverse gaussian processes andcopulas [J]. IEEE Transactions on Reliability, 2016, 65(2):624-639.
  [14] GARC?A NIETO P J, GARC?A-GONZALO E, S?NCHEZ LASHERAS F, et al. Hybrid PSO CSVM-based method for forecasting of theremaining useful life for aircraft engines and evaluation of its reliability [J]. Reliability Engineering and System Safety, 2015, 138:219-231.
  [15]KHELIF R, CHEBEL-MORELLO B, MALINOWSKI S, et al. Direct remaining useful life estimation based on support vectorregression [J]. IEEE Transactions on Industrial Electronics, 2017, 64(3):2276-2285.
  [16] ZHENG S, RISTOVSKI K, FARAHAT A, et al. Long short-term memory network for remaining useful life estimation [C]//2017IEEE International Conference on Prognostics and Health Management (ICPHM). IEEE, 2017:88-95. DOI:10.1109/ICPHM.2017.7998311.
  [17] REN L, CHENG X J, WANG X K, et al. Multi-scale dense gate recurrent unit networks for bearing remaining useful life prediction[J]. Future Generation Computer Systems, 2019, 94:601-609.

nlc202210091018



  [18] WANG J J, WEN G L, YANG S P, et al. Remaining useful life estimation in prognostics using deep bidirectional LSTM neuralnetwork [C]//2018 Prognostics and System Health Management Conference (PHM-Chongqing). IEEE, 2018:1037-1042. DOI:10.1109/PHM-Chongqing.2018.00184.
  [19] HU K, CHENG Y W, WU J, et al. Deep bidirectional recurrent neural networks ensemble for remaining useful life prediction ofaircraft engine [J]. IEEE Transactions on Cybernetics. IEEE, 2021. DOI:10.1109/TCYB.2021.3124838.
  [20] LI H, LI Y, WANG Z J, et al. Remaining useful life prediction of aero-engine based on PCA-LSTM [C]//20217th InternationalConference on Condition Monitoring of Machinery in Non-Stationary Operations (CMMNO). IEEE, 2021:63-66.
  [21] LI X, DING Q, SUN J Q. Remaining useful life estimation in prognostics using deep convolution neural networks [J]. ReliabilityEngineering and System Safety, 2018, 172:1-11.
  [22] LI R Z, CHU Z T, JIN W K, et al. Temporal convolutional network based regression approach for estimation of remaining usefullife [C]//2021 IEEE International Conference on Prognostics and Health Management (ICPHM). IEEE, 2021. DOI:10.1109/ICPHM51084.2021.9486528.
  [23] ZENG F C, LI Y M, JIANG Y H, et al. A deep attention residual neural network-based remaining useful life prediction of machinery[J]. Measurement, 2021, 181:109642.
  [24] ABDERREZEK S, BOUROUIS A. Convolutional autoencoder and bidirectional long short-term memory to estimate remaining usefullife for condition based maintenance [C]//2021 International Conference on Networking and Advanced Systems (ICNAS). IEEE, 2021. DOI:10.1109/ICNAS53565.2021.9628958.
  [25] REMADNA I, TERRISSA S L, ZEMOURI R, et al. Leveraging the power of the combination of CNN and bi-directional LSTMnetworks for aircraft engine RUL estimation [C]//2020 Prognostics and Health Management Conference (PHM-Besan?on). IEEE, 2020:116-121. DOI:10.1109/PHM-Besancon49106.2020.00025.
  [26] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the 31st International Conference onNeural Information Processing Systems. New York: Curran Associates Inc., 2017:6000-6010.
  [27] MO Y, WU Q, LI X, et al. Remaining useful life estimation via transformer encoder enhanced by a gated convolutional unit [J].Journal of Intelligent Manufacturing, 2021, 32(7):1997-2006.
  [28] ZHANG Z Z, SONG W, LI Q Q. Dual-aspect self-attention based on transformer for remaining useful life prediction [J]. IEEETransactions on Instrumentation and Measurement, 2022, 71:2505711. DOI:10.1109/TIM.2022.3160561.
  [29] LIU L, WANG S, LIU D, et al. Entropy-based sensor selection for condition monitoring and prognostics of aircraft engine [J].Microelectronics Reliability, 2015, 55(9/10):2092-2096.
  [30] SAXENA A, GOEBEL K, SIMON D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation [C]//2008International Conference on Prognostics and Health Management. IEEE, 2008. DOI:10.1109/PHM.2008.4711414.
  [31] ZHAO Z Q, LIANG B, WANG X Q, et al. Remaining useful life prediction of aircraft engine based on degradation pattern learning[J]. Reliability Engineering and System Safety, 2017, 164:74-83.
  (任编辑:李艺)

nlc202210091018




转载注明来源:https://www.xzbu.com/1/view-15440630.htm

相关文章