基于历史数据的港区泥沙疏浚标高预测技术研究
来源:用户上传
作者:姚晨明 姚磊
摘要:港区的泥沙疏浚位置及标高数据对于疏浚工程和通航有着重要意义。由于历史疏浚数据具有较强的时间序列特征,本文建立了历史疏浚施工数据集的基础上,构建了基于长短期记忆网络的预测模型并进行训练和测试,实现了对疏浚位置及标高的预测达到96%以上的准确率,这表明基于历史数据的港区泥沙疏浚标高预测技术能够实现对现场疏浚数据的良好预测效果,这能为智能化的疏浚施工提供实用性的数据参考。
关键词:泥沙疏浚;历史疏浚数据;长短期记忆网络;船舶通航
中图分类号:U655文献标识码:A文章编号:1006―7973(2022)08-0122-03
航道的船舶适航水深的维护需要对口门浮泥进行清淤[1],但是这些浮泥受潮波流影响堆积位置是不断变化的,需要从清淤和适航水深两个方面入手[2],历史的疏浚数据包含了疏浚数据的变化特征,预测口门段清淤时机及清淤部位对于保证航道的通航能力,以合理调配清淤船舶和时段,节约工程成本有着重要的工程意义。
港口的疏浚数据特征具有一定的规律性[3],根据施工日报表的数据项,及现场施工的经验判断,对于主航道和回淤严重的口门区域会进行周期性疏浚[4],疏浚工作涉及接移管线的操作,船舶在相隔工作日期内不会有较大的位置变化,开挖标高也在一定的范围内变动,本研究的目标即根据历史清淤记录进行未来的疏浚地点预测及提醒。
1建模方法及数据准备
因疏浚工作的周期性及规律性,潮汐等水文环境、泥沙淤积也具有季节性和周期性,具有时序特征,因此采用时间序列模型进行数据预测,预测目标为经纬度和开挖标高。本研究选择擅长提取时序特征的长短期记忆网络LSTM(LongShortTermMemory)模型[5]进行预测任务。本技术的研究依托于盐城港滨海港区中电投煤炭码头疏浚工程,以施工日报表提取的数据作为数据集,利用前一天或几天的零点坐标、开挖标高数据预测下一个(当前)时刻的对应数据。采用时间序列模型,经纬度和开挖标高作为输入项,根据调研结果,本研究可获得的数据主要是施工日报表和相关CAD文件,因此本研究分析主要依托施工日报表、施工进度图来获取原始数据。考虑到需要根据历史的数据来预测当下时刻的值,因此可以将这个任务视作监督学习问题并对输入变量进行归一化处理。考虑历史数据表示上一个时间段的经纬度位置和开挖标高,所以在数据的使用方式上本研究用t-5,t-4,t-3,t-2,t-1,t次的施工数据通过模型进行特征分析和提取,然后对输出的t+1结果与其真实数据进行对比来分析误差。数据的分布形式如图1所示。
2数据清洗
由于初始数据中存在一些异常数据和缺失数据,因此需要进一步对数据进行清洗以确保数据的合理性。在选取全部施工日报字段后,获得2018年10月13日-2022年1月31日区间有效的数据共639条,因部分数据存在多零点坐标和开挖标高的情况,经过分析处理后形成1438条数据。对于异常值处理,异常值集中在施工时间、零点坐标、浚前标高、开挖标高字段,当出现多个值的情况,标点括号半角全角混用的问题,全部分割后再做处理。由于数据库端浚前标高、开挖标高录入多值情况,所以数据拆分为多独立值处理。对于缺失值处理,删除缺失值较多的数据,并清理冗余数据,这里采用KNN方法和中值插值方法对数据进行填充,对比后发现中值插值方法进行浚前标高和开挖标高的数据填充。剔除异常值以及填充缺失值之后,处理后的数据分布如图2所示,港池区域数据集中度符合预期,便可进行下一步的模型训练。
3模型的构建与验证
在网络结构方面,本文设计了一个三层的LSTM网络,如图3所示,其结构基于python的keras框架,分别由LSTM层,dropout层,dense层以及activation层依次构成。数据维度从初始的时序的240维度降维为最终的时刻的3维输出,也就是利用前15天经纬度坐标和开挖标高数据预测下一个(当前)时刻的对应数据。
模型搭建完后,对于网络的训练过程所涉及参数的调整,确定网络模型的激活函数为relu函数。每一层网络节点的舍弃率默认值设定为0.3。对于训练的误差计算方式使用均方误差(meansquarederror)。网络参数的迭代更新方式采用RMSprop(RootMeanSquarepropagation)算法。权衡实验环境的内存效率和内存容量后,本文设置模型训练的轮次数为1000,数据批次数为64。
接着进一步开始在数据集基础上对模型进行训练,由于训练时输入LSTM网络的数据维度关系到LSTM层的参数,本文以15个时间节点所对应的特征数据作为输入预测后续1个时间点。训练过程的中的损失函数值变化曲线如图4(a)所示,模型验证集的在1000轮次内达到收敛,训练集的函数值稳定在0.0008附近,这表明模型训练达到预期效果。
当模型训练采用经度、纬度、开挖标高3个维度数据作为输入时,对应的模型测试准确率为96.13%,这表明本研究提出的方法能够实现在历史疏浚数据上进行较高精度的疏浚标高参数的预测。在项目实际应用过程中,为达到更长时间的预测效果,当采用预测6个后续时刻坐标和标高方式来训练模型时,其预测值和真实值的误差值在0.0011附近,如图4(b)所示,实现了更长时刻的预测应用效果。此外,本文将预测数值在GIS系统中可视化显示,其效果如图5所示,实现了较好的应用效果。
4结语
本研究通过对疏浚数据收集和清洗做成数据集,构建了LSTM网络模型后,模型的训练误差降到了0.0008,这模型能够充分提取分析历史疏浚数据的时序特征,并在此基础上通过历史时刻的数据预测当前时刻的疏浚位置和标高,实现了96%的预测准确率,这对于港区疏浚施工参数预测有着较好的应用价值。
参考文献:
[1]王萍.黄骅港航道淤积预测及优化清淤研究[D].河北农业大学,2014.
[2]秦延中.航道疏浚工程的施工技术分析[J].中国水运,2019(12):81-82.DOI:10.13646/j.cnki.42-1395/u.2019.12.035.
[3]李珊.厦门港海沧港区港池统一维护方案探析[J].福建交通科技,2020(06):178-181.
[4]戴志军,朱文武,李为华,李九发.近期长江口北槽河道浮泥变化及影响因素研究[J].泥沙研究,2015(01):49-54+74.DOI:10.16239/j.cnki.0468-155x.2015.01.009.
[5]杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(S2):1-6+26.
nlc202209191014
转载注明来源:https://www.xzbu.com/2/view-15439851.htm