基于无人值守的综合网络管理系统模式设计
来源:用户上传
作者:宋晶晶
摘要:针对通信站点分散、自然条件恶劣、不适宜派驻人员值守的状况,提出了一种基于无人值守的综合网络管理系统模式。介绍了该系统的工作模式、软件功能、软件控制流程、软件运行的软硬件环境及其性能。重点阐述了软件的控制流程。实现了无人值守状态下设备远程通信状态监控、故障诊断定位及故障修复工作,有效缩减了人力资源及交通等成本,提高了效率。系统测试验证了其在实际工作中的可行性。
关键词:无人值守;综合网络管理系统;自动化;远程监控
中图分类号:TP393文献标志码:A文章编号:1008-1739(2022)11-54-4
综合网络管理系统作为一个实用的、集成的、可普及的集成管理工具,已被各企业普遍使用。但实际情况中,部分站点分布广且位于交通不发达地区,有些站点自然条件非常恶劣,派驻人员值守管理有很大困难,且随着企业通信岗位大幅缩减及劳动力成本的不断提高,很多站点处于无人或少人的状态。基于无人值守的综合网络管理系统,在无人值守的情况下,对设备及环境进行集中监控,对数据进行及时采集,以便及r了解现场的情况,并根据实际情况发送一些简单的控制命令,实现远程通信状态监控、故障诊断定位及故障修复工作[1],有效缩减了人力资源及交通等成本,提高了效率。
无人值守远程控制系统由远端综合站控软件和本地综合网管软件组成。远端综合站控软件提供无人值守及自动化管理能力[2],功能上等价于远端站智能代理;本地综合网管软件提供远程管控能力,功能上等价于管理员。无人值守的综合网络管理系统组成如图1所示。
系统设计坚持高可靠性、实时性、实用性、兼容性、模块化、可维护性、可扩展性和易升级的原则,兼顾经济性。
无人值守的远程控制网络管理系统主要包括设备自检、链路检测、故障诊断、预案管理及系统维护五大功能模块。各模块之间协作完成各项功能;各个模块作为多个可执行程序在后台自动启动运行[3]。当终端首次登录网管软件,并且通过安全验证,该软件会与自身各模块进行一次内部通信,检测模块是否已经正常启动并且运行正常。如果存在某个模块未正常启动或响应异常,则通过后台服务监控程序对该模块进行重启,并在事件栏打印相关信息,通告给操作人员。
远端综合站控设备自检模块为本地综合网管设备监测提供实时数据支撑[4];远端综合站控链路检测模块为本地综合网管链路监测提供实时链路质量数据;本地综合网管故障诊断调用远端综合站控故障诊断模块执行故障诊断;远端综合站控执行本地综合网管下发的预案;远端综合站控自动巡检为本地综合网管远程维护上报巡检结果。
2.1软件功能
(1)设备自检
设备自检包括特征参数的检测和诊断评估自身运行状态,各类设备对外提供信息输出接口,由综合网络管理系统软件汇集并上报。通过自检,可以获悉各设备是否运行正常,是否需要维护或技术支持。对于主备设备,可以进行“或”的操作,即有一台可以正常运行即可保障系统正常运行;对于上、下行串联设备,则进行“与”的操作,即有一台(套)设备工作异常,则无法保障系统正常运行。
(2)链路检测
综合网络管理软件定时检测链路的连通性、时延、丢包率和收发速率等质量信息,将链路测试结果收集,生成链路检测报告,上报综合网管链路监测模块,若有告警则上报综合网管拓扑监控模块。任务执行前,通信综合网管将链路测试结果收集,生成链路状态统计评估报告,评估通信链路对任务的支撑能力。当链路建立成功后,综合网管软件会向远端软件发送小包数据验证链路通信状况,若收发延迟稳定、无丢包情况,则判定通信正常;若收发延迟跳变或丢包率高,则判定通信链路不稳定;若发包无响应,则判定通信异常。
(3)故障诊断
故障诊断是由网管系统软件发起故障诊断命令,设备经过查询后将故障源信息上报网管系统。网管系统软件监控到设备故障或链路异常,向相关设备发起故障诊断指令,如果设备定位故障,则将故障源上报综合网管系统。设备进行故障判断,首先,以设备通断状态为基础,设备中断则判定设备不正常;其次,检测设备状态参数,如温度过高告警等,如果这些参数异常,则判定设备不正常,系统无法正常工作;最后,检测设备的性能参数,如累计加电时间,若累计加电时间超过了设备安全使用上限,则判定设备存在风险、系统运行存在风险。
(4)预案管理
预案管理功能预先录入需要修改的设备参数及参数值,通过执行预案完成对多类设备参数的统一、有序修改,从而达到一键更换远端站点设备配置的目的。预案管理功能包括预案生成、预案编辑、预案传输、预案解析和预案执行。预案管理功能的操作对象为预案文件,预案文件通过IP网传输,使用UDP协议。预案管理功能可以有效缩短远端站点执行不同任务时任务转换的时间,减少人员操作,提高系统容错率。
(5)系统维护
系统维护主要是针对系统内各设备和链路的状态,进行自动巡检,并生成巡检报告,上报本地综合网管软件。通过自动巡检报告可评估当前系统正常完成任务的可能性;可以预测设备失效率,提前进行设备维修和更换。巡检报告内容包括记录设备当前状态,以及周期内设备状态统计;记录主要链路当前状态,以及周期内主要链路状态统计。
nlc202207251657
转载注明来源:https://www.xzbu.com/1/view-15436572.htm