您好, 访客   登录/注册

工业物联网中基于机器学习方法的预测技术

来源:用户上传      作者:

  摘 要:随着传感器网络等技术在工业领域的不断拓展,工业物联网技术得到了长足发展。工业物联网及基于工业物联网的数据分析与预测是工业智能系统的基础。文中关注在工业互联网环境下,工业智能系统在训练阶段利用有监督的机器学习方法,将工艺参数以及环境参数作为输入,将生产过程关注的关键性能指标作为输出,从而对生产线复杂系统进行建模;在生产阶段利用训练阶段的系统模型及当前输入对关键性能指标进行预测。分别利用多元线性回归和非线性BP神经网络方法建模,并利用当前输入对输出结果进行预测,从而对关键性能指标进行预警及预处理操作。同时还利用真实的工业物联网数据进行了仿真和验证,证明了基于BP神经网络的预测方法性能优于线性预测技术。
  关键词:工业物联网;机器学习;神经网络;预测;工业智能;线性回归
  中图分类号:TP391.7 文献标识码:A 文章编号:2095-1302(2020)02-00-04
  0 引 言
  2015年5月中国政府发布了《中国制造2025》发展规划,将其作为我国推行制造业强国制造业立国战略的重要行动纲领。本轮工业技术革命通过制造业与信息技术行业的融合来推动,从而实现我国制造业产业能力的不断升级[1]。利用物联网技术,制造业可以将具备感知功能的生产设备通过私有网络或共有4G/5G公共网络接入互联网,实现生产制造实时数据信息的感知、传送及智能处理,与生产环节的实时监控与预警、生产资源优化配置及智能化管理[2]。
  各类应用带来的数据量呈指数级增长,传统人工设置假设前提并利用统计等方法来探索数据规律的方式已无法满足当下发展需求,同时数据量的爆发式增长也为机器学习方法的发展和大规模应用提供了有利的前提条件。在金融和互联网领域如用户信用状况评价、计算广告、智能推荐、机器翻译、自然语言识别乃至无人驾驶领域都取得了突破性进展。麦肯锡全球研究院报告中也认为基于海量传感器数据的机器学习将主导未来工业领域的革命性创新[3-4]。
  工业互联网技术伴随我国工业化信息化的融合取得了长足的发展。虽然针对不同客体物联网应用各不相同,但从数据及信息采集、通信传输、处理与有效使用等方面来看,可以大致将物联网分为四层,即感知层、传输层、数据层及应用层[2]。其中数据层实现数据的汇聚、管理及分析处理等相关工作,考虑到工业互联网数据实时性要求高、数据量大、数据结构复杂且异构等特点,研究对数据进行有效加工的相关算法是工业智能系统的关键技术,也是工业国未来竞争力的重要体现。本文主要探索了学习方法在工业互联网系统预测技术中的应用。
  1 预测模型建模方法
  1.1 多元线性回归模型
  回归分析(Regression Analysis)[5]是由高尔顿(Galton)于19世纪末提出,其中最简便的分析方法—线性回归方法是通过最小二乘法对线性回归方程进行求解,从而得到一个或数个自变量同因变量之间的简单线性关系并进行建模的一种回归分析。单自变量的回归分析也被称为简单线性回归。但在具体应用中,某个因变量通常会受多个因素的影响,简单的单独变量的回归方法不足以解决问题,所以引入处理多个變量的多元线性回归方法,大于一个自变量的称为多元线性回归(Multivariate Linear Regression Modeling,MLRM)。多元线性回归模型的一般表达式如下:
  1.2 非线性BP神经网络模型
  随着生物学研究者对人类及动物神经系统的深入研究,通过神经网络来模拟人脑处理信息的机能越来越受到研究者的重视。对神经网络参数进行快速有效的训练成为神经网络技术的关键。误差反向传播(Back Propagation,BP)算法[6]于20世纪80年代被相关学者提出,推动了神经网络技术的成熟并带动了该技术在各个领域的广泛应用,使得人工神经网络成为机器学习领域的重要方法之一。通过反向传播算法,人工神经网络在利用历史数据进行训练和学习的过程中会自适应调整网络参数,使得经过训练的网络能够在尽可能最小化代价函数的意义上拟合训练数据,从历史数据中洞悉蕴含的统计规律,使得网络具备预测未知事件的可能性。同传统机器学习方法相比,神经网络方法在处理大规模数据及非线性问题上显示出了极大的优越性。虽然其当时也被称作多层感知器,但同现代的深度学习方法相比,它一般是具备一层隐藏层节点的浅层模型。
  反向传播神经网络通常具备输入层、隐层和输出层三层结构,其简单的拓扑结构如图1所示。
  图1所示为反向传播神经网络的学习过程,包括正向传播的代价函数计算过程和基于代价或误差结果的反向传播过程。前者数据通过输入层经隐层到达输出层,这一过程逐级对数据进行处理,并通过比较实际输出结果和期望结果进行误差计算。在反向过程中,对正向过程中计算得到的误差进行反向传播,从而自适应调整各神经元的加权值及阈值,以降低误差值并使其最小化。
  输入层同隐层间的加权值为vki,隐层同输出层之间的加权值为wjk,隐层传递函数为f1,输出层传递函数为f2。隐层节点与输出层节点的输出分别为:
  2 性能仿真
  本文采用一组7输入2输出的食品工业物联网数据进行仿真,输入为工业物联网传感器采集的性能指标,共7项,分别为温度、湿度、烘干时间、原件配比、各原料加工时间、环境及工业参数,输出值中的y1为产品的含水量,y2为营养含量。数据集规模为5 000条,分别用多元线性回归模型及BP神经网络模型对数据进行拟合与趋势分析,通过拟合的模型对数据进行预测检验,并用均方误差(MSE)对两种不同模型的性能进行评估(用3 725条数据进行模型学习,用1 225条数据进行验证)。
  3 结 语
  本文探讨了机器学习方法在工业互联网中的应用,并对多元线性回归模型和非线性BP神经网络模型进行了介绍,给出了以上两种模型在工业互联网关键性能指标输出预测技术中的应用。最后通过真实的生产环境数据对模型进行验证与线性方法和非线性方法均方误差性能的定量比较。经过分析与数据仿真验证得知非线性BP神经网络模型相对于线性多元回归性能能够得到明显改善。
  注:本文通讯作者为郑黎明。
  参 考 文 献
  [1]王喜文.中国制造2015:从工业大国到工业强国[J].物联网技术,2015,5(5):3-4.
  [2]刘云浩.物联网导论[M]. 2版. 北京:科学出版社,2013.
  [3] CONWAY D,WHITE J. Machine learning for hackers[M].O’Reilly Media,Inc.,2012.
  [4] DOMINGOS P. A few useful things to know about machine learning[J].Communications of the ACM,2012,55(10):78-87.
  [5]包研科.数据分析教程[M].北京:清华大学出版社,2011.
  [6] HECHT NIELSEN R. Theory of the back propagation neural network[C]// Neural Networks,1989. IJCNN.,International Joint Conference on. IEEE,1989:593-605.
  [7]晁虹.基于人工智能的计算机自动控制系统优化研究[J].物联网技术,2018,8(8):31-32.
  [8]张涛,宋建涛.基于马尔科夫模型和卷积神经网络的异常数据检测方法[J].物联网技术,2018,8(8):80-82.
  [9]王展鹏,吴红光,马蓓娇,等.基于机器学习的工业物联网入侵检测技术研究[J].智能物联技术,2018,1(2):13-17.
  [10]张溶芳,许丹丹,王元光,等.机器学习在物联网虚假用户识别中的应用[J].电信科学,2019(7):136-144.
转载注明来源:https://www.xzbu.com/8/view-15153421.htm