您好, 访客   登录/注册

基于深度学习的工业领域数据挖掘方法及应用

来源:用户上传      作者:

  摘要:本文介绍一种应用于工业领域数据挖掘的方法論,它提出了传统数据挖掘方法CRISP-DM需要在工业情境下关注的内容,同时举例说明深度学习在工业时序数据分类方面的应用并指出其发展方向及意义。
  关键词:数据挖掘方法;时序数据分类;深度学习
  中图分类号:TP311 文献标识码:A 文章编号:1007-9416(2019)11-0052-02
  0 引言
  时序数据是指一系列的数据点按照时间顺序进行排列或编号,通常情况下,这些数据点按照等时间间隔进行选取。时序数据的分类问题是数据挖掘中最重要的问题之一[1]。随着对工业设备状态监控、设备健康管理的需要以及传感器技术的发展,产生了庞大的数据量。从获得的数据发掘出有价值的信息或规律,并利用这些信息和规律进行分析和预测,这是时序数据进行数据挖掘的任务和意义。
  1 CRISP-DM数据挖掘方法论
  作为目前最为广泛使用的数据挖掘方法论,跨行业数据挖掘标准流程(cross-industry standard process for data mining,CRISP-DM)包含了六个阶段,如图1所示,表1是各阶段包含的内容。
  2 DMME(Data Mining Methodology in Engineering)数据挖掘方法论
  为了适应工业领域的应用,考虑工业情境下数据获取、处理以及其他特定的工程问题,Steffen Huber等人[3]提出了DMME(DM-Methodology in Engineering)方法作为CRISP-DM的拓展,DMME包含的过程如图2所示。相比CRISP-DM,该方法论多了技术理解、技术实现和技术落实过程,三个过程包含的具体内容如表2所示。技术理解过程将业务目标转化为技术目标并设计实验方案,技术实现步骤对实验方案进行测试和选择,技术落实步骤将生产过程的实时数据传递给评估过的模型。该方法能够很好地指导工业应用的开发工作,例如生产过程优化、机械设备零部件的监控以及预知性维护(predictive maintenance)。
  3 基于深度学习的时序数据分类
  数据挖掘任务可分为两大类,分别是预测任务和描述任务,常见的有聚类分析、预测建模、关联分析和异常检测[4]。机器学习是数据挖掘的一个重要手段。传统机器学习通过训练样本,尝试对未来数据行为或趋势进行预测。相关算法包括逻辑回归、隐马尔科夫方法、支持向量机、K近邻方法、贝叶斯方法以及决策树方法等。用于数据挖掘一般步骤如图3所示,其中数据预处理、特征提取和特征转换合称特征处理,合理的特征处理便于分类器的设计,有利于提高准确性。传统机器学习的预测所用的特征主要依靠人为设定。
  深度学习是建立深层结构模型的学习方法,它将原始的数据特征通过多步的特征转换得到一种特征表示,并进一步输入到预测函数得到最终结果[5]-[6],是一种端到端的学习方法,其数据挖掘流程如图4所示。所谓端到端学习是指在学习过程中不进行分模块或分阶段进行训练,直接优化任务的总体目标。在端到端学习中,一般不需要明确地给出不同模块或阶段的功能,中间过程不需要人为干预。典型的深度学习算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。对于时序数据分类问题,最新的研究方向主要有多层感知机(multilayer perceptron,MLP)和卷积神经网络(convolutional neural network,CNN)等。
  卷积神经网络一般是由卷积层、汇聚层和全连接层交叉堆叠而成的前馈神经网络,使用反向传播算法进行训练。卷积神经网络主要使用在图像和视频分析的各种任务上,并逐渐被运用到时序数据分类问题。如图5所示。
  4 结语
  本文对比了两种数据挖掘方法论(CRISP-DM方法和DMME方法),提出数据挖掘在工业领域实际应用所需要特别关注的内容。同时对比了两类基于机器学习的数据挖掘方法(传统机器学习方法和深度学习方法),指出传统的机器学习方法的不足,而深度学习的端到端的特性,避免了特征工程的繁琐工作。上述内容对生产企业进行数据挖掘软件的开发工作具有一定的指导作用。
  参考文献
  [1] Yang Q,Wu X.10 challenging problems in data mining research[J].International Journal of Information Technology & Decision Making,2006,05(04):597-604.
  [2] Wirth R,Hipp J.CRISP-DM:Towards a standard process model for data mining[C]//the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining,2000.
  [3] Steffen H,Hajo W,et al.DMME:Data mining methodology for engineering applications a holistic extension to the CRISP-DM model[J].Procedia CIRP,2019,79:403-408.
  [4] PANG-NINGTAN,MICHAELSTEINBACH,VIPINKUMAR.数据挖掘导论:完整版[M].人民邮电出版社,2011.
  [5] 邱锡鹏.神经网络与深度学习[EB/OL].[2019-11-06].https://nndl.github.io/.
  [6] Lecun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436.
转载注明来源:https://www.xzbu.com/8/view-15115983.htm