基于循环神经网络的抽油杆柱寿命预测新方法
来源:用户上传
作者:
摘要:当前抽油杆柱易发生异常甚至发生抽油杆脱断,因此预测抽油杆柱的剩余寿命变得越来越重要。而当前传统的抽油杆柱剩余寿命预测方法效率低,准确度差,计算模型较为复杂。基于此,本文借助循环神经网络方法,训练建立一套油井杆柱寿命预测的神经网络新方法。结果表明:对于抽油杆柱可以通过循环神经网络(RNN)准确预测抽油杆柱剩余寿命。
关键词:抽油杆柱;寿命预测;循环神经网络
中图分类号:TP183 文献标识码:A
文章编号:1009-3044(2019)35-0178-05
全国油田的生产油井中约有80%是使用有杆抽油机生产,75%的产油量是有杆抽油机采出的,而每年新增加抽油杆达到几千万米,可见抽油杆在石油开采中占有着相当重要的地位[1]。抽油杆断脱所造成的井下作业工作量在油田开发后期及含水率90%以上的时期占相当大的比重,作业成本快速上升,严重影响油田的经济效益。在国外,有杆泵抽油机是油田的主要采油设备,其不但使用数量大,用电量大,而且系统效率低,节电潜力巨大,虽然也有很多节能型抽油机用于油田,也确实起到了一定的节能效果,但由于多方面原因,大部分节能机不能很好地适应油田的生产,因此在世界各油田机采井采油中,机采井抽油杆的断裂损伤问题都不同程度地存在。这是一个世界范围内需要急需解決的困难课题。因此加大技术投入和过程强化管理,减少抽油杆断脱的发生,已成为改善井下作业质量的必由之路。通过抽油杆柱寿命预测可以有效且及时杜绝抽油杆断脱对油田采油生产过程的影响,对于减少抽油杆断脱而带来的维修费用和减少对油田生产效益影响具有重要意义[2]。
传统抽油杆寿命的预测方法分两种:一是基于断裂力学的疲劳裂纹扩展剩余寿命预测方法[3],研究了杆柱裂纹扩散速率随时间的变化规律。二是基于疲劳累积损伤理论的杆管柱疲劳寿命的预测方法[4],分析了杆柱在井下的交变应力状态,得出了杆柱疲劳裂纹扩展与时间的变化关系。抽油杆柱使用寿命的预测与估算多数是针对某一具体失效形式、对给定缺陷尺寸下的寿命计算,所得到的寿命多是一确定值。但是影响抽油杆柱剩余寿命的各种因素都具有随机的内在不确定性,是服从某种统计分布规律的,所以抽油杆柱的使用寿命是一个随机变量。因此,除了考核抽油杆柱的静强度、疲劳强度等指标外,还必须通过影响抽油杆柱的相关机械和生产参数的综合评定对抽油杆柱的寿命进行预测。当前抽油杆寿命的预测方法有模糊数学[5]、人工神经网络[6]等方法
人工神经网络寿命预测方法是近年来兴起的新方法[7],其中包括卷积神经网络、循环神经网络(RNN)等方法。卷积神经网络人工神经网络在长时间的序列数据上构建模型,对数据时间前后相关性关系的记忆与分析能力较差[8]。RNN方法能记忆发生在数据序列,有助于系统基于当前数据点上下游的信息判断工况,目前在文本识别、交通、医学、金融等领域得到广泛应用。
本文采用循环神经网络,建立了基于循环神经网络的抽油杆柱寿命预测方法,提高了有杆泵抽油杆柱寿命预测的准确度。
1 模型内容及研究过程
1.1循环神经网络
RNN是一种强大的用于处理和预测序列数据的神经网络模型,已被成功应用于多领域工作,尤其是当数据中存在着时间依赖性的时候[9]。
标准的RNN传播过程为,给定n维输入序列x1,x2,…,xn,m维网络的隐层状态序列h1,h2,…,hm,k维输出序列y1,y2,…,yk,迭代公式如下[10]:
其中,Whx、Whh、Wyh为权值矩阵;bh、by为基底;ti为隐层的输入,si为输出单元的输入,同为k维变量;e(x)、g(x)为预定义的非线性向量值函数。
RNN之所以称为循环神经网络,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。它的结构如下所示:
t一1、t、t+1表示时间序列。X表示输入的样本。S表示样本在时间t处的记忆,W表示输入的权重,U表示此刻输入的样本的权重,V表示输出的样本权重。通过当前时刻和上一时刻的输出结果来预测下一时刻的输出,进而得到寿命预测结果。
1.2模型搭建
1.2.1特征数据选择
根据油田数据采集情况,分析各类油井监测数据和抽油杆柱异常之间的相关性,最终确定3种与抽油杆柱寿命相关性强的特征参数:载荷、电流和冲次[11,12]。数据的类型为按时间序列数据展开的矩阵,符合循环神经网络训练所具备的输入特征要求。
1.2.2模型的选择和建立
将杆柱异常的发生趋势预测以数据变化趋势问题进行处理,建立基于RNN的抽油杆柱寿命预测模型。其结构如下图所示:
(1)原始数据处理。原始数据经常存在缺失或停机无采集数据的现象。若将这些值抛弃掉,会严重影响寿命预测的结果。为了达到较好的建模效果,需要对缺失值进行处理。本文采用缺失点前一刻数值填充的方法进行缺失值处理,保证时间序列数据的稳定性。
(2)归一化标准化处理。不同参数往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比陛。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比。本文采用最大最小值归一化标准化方式,去除数据量纲,提高模型训练速度。归一化方式为离差法(最大值一最小值法),其公式为:
其中max(x)、min(x)分别为数据x的最大值和最小值,x为归一化后的数值。
(3)特征参数的处理。经过前两步处理之后得到了标准的特征参数,将多参数按时间排序,形成了RNN识别的特征参数,将特征参数制作成数据集并拆分为训练集和测试集。 (4)预测模型的搭建。根据实际应用数据情况,通过正交实验确定网络模型的神经元数量、网络结构、优化器的选择、损失函数等参数,搭建最优的神经网络预测模型,保证模型预测结果最佳。
1.3应用
1.3.1数据分析
根据油田数据采集情况,选择某井故障前100天的数据实际生产数据,参数是油井运行参数,在油井出现故障前会有相应的变化趋势,在发生杆断的之前,由于抽油杆柱的腐蚀、偏磨、裂缝等问题会引起载荷差、电流和冲次不同程度的变化。其中载荷差会随时间不断增大[14],电流和冲次也会有不同程度的增加[11,12]。其中部分参数如下表1。其中可以看到:从2017.7.22-2017.8.20,三种特征参数数值均有不同程度的增加,这也就表示当前抽油杆柱处于带病作业的状态,特征参数根据时间变化,到达一定程度之后即会发生抽油杆柱断脱的故障。
在2017/8/20 2:22行的数据是空缺值,因为数据变化过程是缓变的,故应该采用缺失点上下条数据填充的方法,使用前一刻数值填充将其填充完整,不会对整个序列产生过大影响,填充后的表格如下表2:
通过数据填充和归一化标准化处理,得到了制作数据集所需标准数据。将数据组制作为RNN数据集,并按照一定比例拆分为训练数据集和测试集。
1.3.2数据的准备与处理
1)根据3种特征参数,对4800组油田采集数据进行归一化处理并制作RNN训练数据集和测试数据集。
归一化后的数据如下表:
2)使用上文的最大一最小值归一化方式将数据进行归一化处理,统一量纲。将归一化标准化后的4800组特征参数按3:1比例划分为训练参数集和测试参数集,其中3600组作为训练样本集和1200组测试样本集。按时间序列矩阵输入循环神经网络。
1.3.3误差分析
本文可计算出与变量本身相同的单位产生误差的均方根误差(RMSE),均方根误差的越小,说明预测结果与实际结果相符的程度越高,既RMSE可作为评价模型预测效果的重要指标。在RNN训练之前进行正交实验对比网络模型的最优组合,实验结果入下表:
由表4可知:在训练轮数为30次,损失函数和优化器组合为Mae+Adam时模型的RMSE最低为:0.550,训练损失为:0.0009。随着训练次数的减少,模型拟合不理想;训练次数增加,模型会过拟合。因此取30次训练次数,能得到较好的预测模型。
1.3.4模型训练
根据上述最优参数组合搭建RNN网络模型,将训练参数集和测试参数集输入搭建的RNN,训练损失变化如下图所示:
其中横坐标为训练轮数(单位:次),纵坐标为训练误差变化,蓝色曲线为训练集损失变化情况,红色曲线为测试集损失变化情况,经过30轮训练后损失为0.0009,损失变化如下表5,达到了理想结果。
1.3.5结果分析
经过RNN模型计算出的训练过程RMSE为0.550,测试过程的RMSE为0.774,取得了理想的效果。预测结果如下图:
其中横坐标为测试样本编号(及为样本所处的时间位置),纵坐标为当前抽油杆柱的剩余寿命值,单位(天),直线为真实剩余寿命,波动曲线为预测的剩余寿命。上图可以表明,预测的剩余寿命和真实寿命拟合结果较好,成功预测了抽油杆柱的剩余寿命。通过输入到循环神经网络的某一组数据,可以通过已训练的寿命预测模型得到该时刻对应的抽油杆剩余寿命。真实值与预测值对比如表6。
从表5可以看出,真实值与预测值误差较小,达到了准确预测的效果。实时证明,通过循环神经网络对抽油杆柱寿命的预测的方法具有一定的可行性。
2 结论
1)本文提出的基于循环神经网络的抽油杆柱寿命预测新方法,训练结果表明,该方法取得了较好的模型收敛性,具有较好的寿命预测能力。
2)基于杆断井生产数据所建立的基于RNN的抽油杆柱寿命預测方法,开创性地建立一套具有普遍适用性的高精度油井杆断预测模型,从而在全油田范围内实现抽油杆断脱风险的超前管理,从而有效控制杆断发生,提高生产时率、降低维护成本。
3)应用抽油井杆柱寿命预测方法,可以避免因抽油杆超期使用造成的躺井,延长油井生产周期,经济效益较为显著。可以延长油井的开井时间,从而增加油井的产量,降低施工和修井的复杂性。
参考文献:
[1]李成彬.抽油杆表面裂纹仿真分析及剩余寿命预测[D].长江大学,2016.
[2]王海斌.抽油杆受力分析及优化管理[J].石油天然气学报,2005,27(1):122-123.
[3]骆竞唏,黄淑菊.D级抽油杆疲劳裂纹扩展期剩余寿命预测[J].石油机械,1995(12):27-31.
[4]张莉,唐立强,付德龙.基于损伤累积理论的多轴疲劳寿命预测方法[J].哈尔滨工业大学学报,2009(4):123-125.
[5]刘克格,阎楚良,张书明.模糊数学在疲劳寿命估算中的应用[J].航空学报,2006,27(2):227-231.
[6]周剑锋,顾伯勤.基于人工神经网络的机械密封寿命预测[J].流体机械,2006,34(3):19-23.
[7]苏亮.基于概率神经网络的焊接结构疲劳寿命分类与预测[D].长安大学,2012.
[8]黄有为,高燕.基于循环神经网络的金融数据预测系统[J].软件导刊,2019,18(01):28-33+226.
[9]杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机
[10]陈强,朱立新,夏德深.结合Canny算子的图像二值化[J].计算机辅助设计与图形学学报,2005,17(6):1302-1306.
[11]张海萌.浅析抽油杆断脱影响因素及预防措施[J].工程技术:文摘版,2016(3):00265-00265.
[12]王岩.运用电流判断抽油机井故障的研究[J].中国石油和化工标准与质量,2017,37(2):17-18.
[13]王家映.地球物理资料非线性反演方法讲座(五)人工神经网络反演法[J].工程地球物理学报,2008,5(3):255-265.
[14]董其宏,牛宗华,赵暑生.抽油杆断裂原因分析[J].内蒙古石油化工,2014(17):46-48.
【通联编辑:唐一东】
收稿日期:2019-08-20
作者简介:邴绍强(1974-),男,1996年获石油大学(华东)学士学位,2007年获石油大学(华东)硕士学位,现为胜利油田分公司信息化管理中心高级工程师,主要从事信息自动化应用工作。
转载注明来源:https://www.xzbu.com/8/view-15123270.htm