基于长短期记忆网络的工业空调启动时间预测
来源:用户上传
作者:
摘要:为了降低企业生产车间空调能耗,基于长短期记忆(LSTM)网络构建了一种工业空调启动时间预测模型。使用该模型对车间空调提前启动时间进行预测,并将预测结果应用于车间空调系统的启动控制,以达到节能目的;采用平均绝对百分误差(MAPE)对预测模型進行整体误差评估,实验结果表明:LSTM较好地解决了生产车间空调系统启动时间预测问题,相较于传统预测方法有着更小的MAPE。优化控制后的空调系统能够在保证车间生产环境达标的同时,降低空调系统约27.9%的能耗。
关键词:长短期记忆神经网络;空调启动时间;平均绝对百分误差;预测模型
DOI:10.11907/rjdk.192062 开放科学(资源服务)标识码(OSID):
中图分类号:TP301文献标识码:A 文章编号:1672-7800(2020)006-0048-05
0 引言
我国能源消耗占据世界能源消耗总量的23%,并且还在不断增长。国家对环境保护的要求愈来愈严格,能源价格的持续上涨导致生产成本不断提高,节能问题成为企业生产首先要考虑的问题。
随着人工智能浪潮的到来,许多学者将神经网络应用在节能预测领域。如Akanit等使用人工神经网络(Artificial Neural Network,ANN)预测基于自然灾害期间电能消耗的经济趋势,通过交叉检查的方法提高了预测模型的精度和性能;Rahman等提出以循环神经网络(Recurrent Neural Network,RNN)预测商业和住宅建筑的电力消耗,证明RNN模型在能耗预测方面潜力很大。
空调节能的优化控制问题一直是研究重点。现阶段比较流行的空调启动时间预测方法有回归分析预测法、时间序列预测法、神经网络预测法等。在这几种方法中,时间序列预测法和回归分析预测法被归为传统方法,神经网络预测法则被归为人工智能方法。陆景等提出一种空调系统提前关机时间的多元线性回归模型,对空调关机时间预测有着较高的精度;时斌等提出了一种空调器及其温度调节时间预测系统和方法,可以准确客观地预测出室内环境温度达到预设温度时空调的运行时间;范波等通过BPNN预测模型预测空调机组最佳启动时间,实验结果表明优化策略可以减少空调系统运行能耗。
传统预测方法在数据时序性和非线性方面不具备统筹兼顾能力,大多只应用于数据较为平稳的短期预测,如果数据波动性较大则模型预测性能很差。因此,本文采用长短期记忆神经网络(Long Short-Term Memory)建立预测模型,以解决随着学习层数的增加而造成的长期依赖问题。长短期记忆神经网络属于深度学习中的一种时间递归神经网络,它在处理未知时长延迟的时间序列方面有着较优秀的性能,适于分析和处理时间序列数据的内在联系。
1基于LsTn的空调启动时间预测模型
1.1 LSTM模型基本结构
LSTM是RNN中的一种特殊形式,1997年由Hochreiter&Schmidhuber等提出,目前在语言情感分类、图像分割、文本分类等领域得到广泛应用。
如图l所示,每一条带箭头的实线表示向量传输,实线的分合表示向量的复制与连接;加号和乘号表示Element-wise;σ和tanh分别表示Sigmoid函数与双曲正切函数。
LSTM共有3种门结构,分别为忘记门(forget gate)、输入门(input gate)和输出门(output gate)。在LSTM神经元结构中,令Xt=[x1,x2,x3,…,xt],其中xt为t时刻的神经元信号输入值;令Ht=[h1,h2,h3,…,ht],其中ht为t时刻输出值;令Ct=[c1,c2,c3,…,ct],其中ct为t时刻神经元状态。
如图2所示,LSTM结构顶部是一条记忆管道。在这条管道内,上个时刻神经元的细胞状态Ct-1与忘记门的输出进行数组元素依次相乘(Element-wise multiplication),该运算控制了Ct-1忘记记忆的多少。若忘记门的输出是一个接近于0的向量,则相乘后的结果会忘记部分以前的记忆。反之,若忘记门的输出是接近1的向量,则会保留大部分记忆。Ct-1与输入门的输出进行数组元素依次相加(Element-wise Summation),此操作会将旧记忆和新记忆合并。上述两步操作完成后,Ct-1会更新为新的细胞状态Ct-1。
1.1.1 忘记门
忘记门由简单的单层神经网络控制,决定了细胞状态应丢弃什么信息,图3为忘记门结构。此门的输人数据J.为当前LSTM块的输入,ht-1为上一个LSTM块的输出,b0为偏置向量。输人参数通过激活函数σ将此层的输出控制在[0,1]之间。
该过程计算公式如下:
ft=(Wf·[ht-1,xt]+b0)(1)
1.1.2 输入门
1.1.3 输出门
如图6所示,输出门同样具有与前两个门单元相似的输人参数Xt和ht-1,这两个参数经过σ激活后的结果Ot,与经过激活函数tanh的Ct进行乘运算,得到整个模型最终的输出值丸ht。该过程计算公式如下: LSTM在RNN的基础上增加了忘记门、输人门和输出门,以保证记住长期的状态。随着数据的输人,LSTM中的细胞会对输人信息进行判断,遗忘不符合规则的信息,保留符合规则的信息。依据此原理,LSTM可以解决长序列依赖问题,更好地对历史数据进行筛选,丢弃干扰无用的信息,从而更好地应用于工业空调的启动时间预测。
1.2 LSTM模型训练算法
LSTM的输人为:上一时刻网络的输出值Ht-1、前一时刻记忆细胞的状态Ct-1、当前时刻网络的输入值xt;LSTM的输出为:当前时刻网络的输出值ht、当前时刻记忆细胞的状态Ct。LSTM模型的训练采用基于时间展开的反向传播算法进行。LSTM的反向传播过程分为代价函数计算和误差反传两部分。LSTM计算每次训练的结果代价函数,并判断代价函数是否满足预先设定的要求,对于不满足要求的训练结果进行误差反传更新。
1.3 对比模型选取
选取随机森林(Random Forest,RF)和支持向量回归(Support Vector Regression,SVR)比较LSTM与这两种预测模型的差异。RF是决策树的集成算法,它通过将每棵决策树的结果集中起来决定最后预测的结果,在一定程度上减少了预测方差。在不进行降维的情况下,能够进行高维特征的输入样本处理。SVR是支持向量机(Support Vector Machine,SVM)在非线性系统回归估计问题上的应用模型,SVR主要通过核函数在高维空间中构造线性决策函数实现线性回归。
2 实验数据与预测性能指标
2.1 数据获取
本文实验数据来源为某企业动力能源管理系统,实验收集了N工厂某车间2014年1月至2019年1月这段时间工作日内的天气数据和系统运行数据,数据采集间隔为1日,原始数据约为1500条。以1300条样本为训练集,另外200条样本用作测试集,主要包含日期Td、生产任务量Np、每日预冷(热)时间Tp、车间人员密度Pd、空调制冷量Wr、室外温度Ot、相对湿度Oh、风速Ow、露點Od、天气情况Or等,数据样例见表1。
2.2 数据预处理
2.2.1 输入输出量确定
本文选取日期Td空调制冷量Wr、当日室外温度Ot、相对湿度Oh、风速Ow、露点Od、天气Or作为输入变量,以空调开机至温度达标所需时间(预冷/热时间Tp)为模型计算最终输出。
2.2.2 数据缺失处理
在数据采集过程中,由于存在许多不确定因素,数据缺失问题不可避免。如果采用不恰当的处理方式,相当于引入了大量噪声,会对数据造成污染。本文针对数据缺失的不同情形对应不同的处理方式:对于数据在连续3次及3次以内的缺失情况,采用3次样条插值法(cubic spline interpolation)进行缺失数据插值;对于数据在连续3次以上的缺失情况,采用直接删除这条数据,以减少模型训练过程中的噪声干扰。
3次样条插值原理如下:
对于给定n+1个数据点(xi,yi)(i=0,1,2,…,n),其中a=x012<…n=b,共有n个子区间,样条曲线S(x)在每段区间内满足下列条件:①在每段分区间[xi,xi+1](i=0,1,2,…,n-1),S(x)=S(x)都是一个3次多项式;②满足S(xi)=y(i=0,1,2,…,n);③在整个区间[a,b]上,函数S(x)的一阶导数S'(x)和二阶导数S''(x)都必须连续,也就是说S(x)曲线光滑。
例如在采集数据过程中,对于某一个时间片段xi=[9,10,14,15,16],获取对应的空调预冷时间yi=[28.2,31.10,39.21,33.12,43.14],在时间节点11,12,13处对应的空调制冷量连续缺失,利于上述方法进行3次样条插值。图7表示3次样条插值的插值效果。根据函数曲线便可获得缺失的数据,即图7中虚线对应的空调制冷量。
2.2.3 数据异常值处理
在数据收集过程中,发现某些传感器采集的数据明显存在问题,如预冷(热)时间存在负值情况。通过现场调研发现,这部分数据出现可能是个别温度传感器损坏所导致的。本文直接舍弃这部分数据,避免其对整体预测结果产生影响。
2.2.4 数据规范化处理
由于不同变量有着不同的评价指标,导致数据经常拥有不同的量纲和数量级,这种情况下,若直接采用原数据进行分析,则会放大高数值指标在整体预测中的影响。将数据进行规范化处理以解决数据间因量纲不同产生的影响,去除数据的量纲限制,把数据转化为无量纲的纯数值,以便于不同量级的数据能够进行比较。本文使用离差标准化(Min-max normalization又称Min-Max标准化)对数据进行处理。
Min-Max标准化是对原始数据xi={x1,x2,…,xn}的线性变换,使结果少,落到[0,1]区间。公式如下: 新序列为y1,y2,…,yn∈[0,1]且无量纲。
2.3 预测性能评估
回归预测评估指标众多,本文在模型训练阶段选取平均绝对离差(Mean Absolute Error,MAE)和标准误差(RootMean Squared Error,RMSE)两种评价标准,公式如下:
式中,m为样本个数,h(xi)为i时刻的实际值,yi为i时刻的预测值。
3 预测模型建立及空调启动策略
3.1 预测模型建立
模型建立过程:①选取2.2.1节确定的输入变量对数据进行预处理;②对经过预处理后的数据进行划分,构造输入样本集;③初始化模型参数,进行模型训练,判断代价函数是否满足要求,若不满足则进行误差反向传播更新,反复迭代到满足要求,输出LSTM模型;④对步骤③中输出的模型进行测试,输出预测结果并对结果进行分析。
LSTM预测流程如图8所示。
3.2 空调启动控制策略
传统空调启动策略采用固定的预冷(热)时间,各个班组依靠自身经验和当日天气环境设定空调提前启动时间,没有统一的标准。这样虽然满足了生产要求,但提前开启空调时间过长会造成能源浪费。
结合空调启动时间预测模型,提出一种基于LSTM的空调启动策略。首先根据预冷(热)时间Tp的历史数据找出最长预冷(热)时间ti,作为Z车间下一生产日空调提前开启时间的初始值;其次将初始值ti与LSTM模型的预测值tp进行比较,若tp≤ti,则提前tp分钟开启Z车间空调,否则再次进行迭代预测。
4 实验结果與分析
4.1 实验环境
本文实验硬件环境为:CPU i5-8400@2.80GHz,RAM16G;软件环境为:Microsoft Windows 10操作系统,Python版本为v3.6,采用Pycharm编写;选取ELU函数作为LSTM网络激活函数,选取Keras作为人工神经网络库。
4.2 实验结果与对比分析
选取1.3节两种模型作为对比对象,以空调开机到温度达标所用时间为度量,选取测试集中连续7天数据作为测试数据,对比3种模型的预测结果,如图9所示。在图9中,黑色点线为真实预冷时间;支持向量回归SVR预测结果为三角形标注的曲线;随机森林回归预測结果为正方形标注曲线;LSTM预测结果为菱形标注的曲线。
由图9可以看出,SVR和RF两种模型在前3个数据点的预测中都表现出较好的精度,与原始值相差较小。但随着时间的推移,SVR预测模型开始出现预测数据整体大于真实数据的情况,预测准确率下降。而RF预测模型相较于SVR有着更高的精度,但是在第6个数据点附近开始出现预测数据向下偏移的情况。相对于上述两种模型,LSTM整体上和原始数据有着较高的拟合准确度,没有较大的数据偏差。通过对比可以发现,随着时间序列的推移,LSTM模型的预测精度明显优于其它两种模型,预测能力较强,原因是因为LSTM预测模型引入了时间序列概念,在一定程度上解决了梯度消失问题。
分别计算3种模型的预测误差,详见表2。误差分析表明,LSTM在3种误差评测方式中都有最小的值,MAE为1.09、RMSE为1.88,MAPE为1.41,相交于传统的RF和SVR明显减小。
4.3 优化控制前后能耗对比
针对上述模型预测结果,结合当日空调运行数据,计算出该日空调系统使用LSTM模型进行优化控制后的各部分能耗值,并与传统空调启动控制策略下的能耗值进行对比,结果如图10所示。
由图10可以看出,采用LSTM预测模型预测空调启动时间后,空调主要部分能耗都有显著降低,优化后的总能耗比之前减少了约27.9%。
5 结语
本文通过对某企业生产车间空调的运行数据进行采集,使用长短时记忆循环神经网络建立空调启动时间预测模型,与随机森林、支持向量回归建立的预测模型进行比较分析,并对比使用预测算法控制前后的能耗情况。通过实验可知,基于长短期记忆网络建立的预测模型预测值在MAE、RMSE和MAPE三个方面都优于随机森林和支持向量回归,随着时间序列的增大,LSTM模型表现出明显优于另外两者的稳定性,并且经过优化控制的空调能耗显著降低,LSTM模型相比于传统模型有着更高的预测精度。将LSTM用于工业生产空调启动时间预测,有助于企业完成能源智能管控,达成节能目标。下一步将探寻LSTM网络参数优化,以进一步提升模型预测精度。
转载注明来源:https://www.xzbu.com/8/view-15281426.htm