浅谈校园网网络运行状态监测
来源:用户上传
作者: 陈有拾
【摘要】完善的网络由多种软硬件组成,它们运行正常与否,决定了整个网络的服务质量。在网络运行过程中管理员需要时刻关注网络运行状态。在网络监测过程中,管理员应该将整个网络划分为不同的监测对象,采取有针对性的监测手段,这样可以缩小故障范围,提高监测效率。管理员应该在实际操作中,应该以最小的代价,搜集最有价值的网络状态信息。
【关键词】网络运行状态;网络管理软件;主动监测;被动监测
随着网络技术的发展,网络产品性能不断提升,价格不断下降,很多中小企业都建立了自己的企业网络,大学校园更是很早就建成了自己的校园网络并且功能在不断的丰富。网络的正常运行离不开管理人员对网络运行状态的实时监测,小型局域网网络状态发生改变时用户会立即察觉到,但如果是规模较大的网络发生故障,用户就很难察觉到。网络管理员作为网络用户的一员,如果没有有效的监测手段同样很难察觉到哪部分网络已出现故障。对于规模较大的校园网,对网络运行状态进行实时监测是快速发现问题,处理问题的有效手段,同时也能避免重大故障的出现。
一、校园网构成
(1)网络结构。校园网络通常分为三层结构:接入层、汇聚层和核心层。接入层为用户提供网络接入端口,主要用于接收来自用户的信息,是离用户最近的网络设备。接入层设备功能简单,一般使用二层交换机即可。该层设备出现故障影响的只是接入该设备的用户,损失较小。汇聚层位于接入层和核心层之间,连接多台接入层设备,提供各种安全策略和路由决策功能,数据处理运算能力强大,端口转发数据速率快,通常使用三层交换设备作为网络的汇聚层。汇聚层设备一旦出现故障,将造成大范围内的用户网络中断,甚至全网部分业务中断,损失较大。核心层在校园网络中的核心位置,负责高速转发全网的数据,要求数据转发能力强大,延时尽可能的小,同时具有苛刻的稳定性要求,一旦核心设备出现故障,将导致全网业务中断。(2)网络资源。完整的网络由硬件设备和网络服务两大部分组成,网络硬件设备是网络服务运行的基础,缺少网络设备,再好的网络服务也无法让用户享用,同样的,缺少网络服务,即使设备再高档也无法发挥作用。校园网在各种硬件设备的基础上,为用户提供多种服务,包括内部服务,如教学管理系统、人事管理系统、办公系统等,它们运行在各自的服务器上,这些系统同时处于安全设备的保护之下。
二、校园网监测内容及实现技术
1.监测设备通达情况。大规模的网络需要组建网络管理平台来管理,网络管理平台也叫网管工作站,主要功能是管理整个网络的设备及配置信息,同时还要监测整个网络的运行状态,而监测设备的通达情况是其中一项最基本的任务。很多厂商开发了针对自家网络产品的网络管理软件,笔者单位使用的是H3C公司的“H3C智能管理中心”,设备运行故障会导致该设备及该设备的下连设备出现设备不可达的现象发生,监测设备通达情况是网络管理软件最基本的功能,一旦出现异常便将故障以各种形式表现出来,如声音告警,屏幕上的色彩变化等,以最直观、最快速的形式通知管理员,一些网络管理软件更可以向指定管理员发送短信息和电子邮件,以达到告警目的。网络通达情况监测不仅简单检测某台设备是否可达,更要监测连接该设备的链路质量,一般通过测试数据传送延时和丢包率来计算,如果某条链路的延时或丢包率超出阈值,软件便会向管理员发送告警信息,让管理员及时了解情况,进行相关检查,以排除潜在故障。大多数网络管理软件在监测设备通达情况时,多采用主动监测方式,也叫轮询方式,即管理中心按照固定的时间间隔向指定设备发送指令,通过回应来判断指定设备是否可达。这中监测方式在小型网络中运行良好,但是在大型网络中,网络设备数量众多,多达几百上千台,主动监测方式的监测指令会占用较大链路带宽,从而降低线路的利用率,因此在大型网络中,可以采取分布式监测方法,将多个网管工作站放置在网络不同区域,有效降低网管中心的数据对链路的带宽占用。主动监测还有另外一点不足就是设备状态在时间间隔期间发生改变时,不会立即发出告警,直到下一次监测到该设备时才能发现故障,对于关键性业务来说,这是不能容忍的,因此网管软件还提供被动监测方式,即当设备状态发生改变时才发出告警信息,否则视为正常状态,这样既能将异常状态信息及时告知管理员,也节约了因主动监测所占用的不必要的带宽。但是要实现被动监测,前提是被监测设备能够运行SNMP代理程序,对于一些低端设备来说这是不具备的。
2.监测设备健康状态。如今很多设备都支持健康状态监测功能,常见的如电压、温度监测、状态指示灯等等,这些信息对设备管理帮助很大,当设备出现故障时,利用它们能够快速定位故障,较少管理员工作量。通过网络协议,设备还能将健康状态数据通过网络主动发送到控制中心,实现远程监测。很多网络设备厂商开发了自己的网络管理软件,比如H3C公司的“H3C智能管理中心”,可以对其品牌下的网络设备进行详尽的设备健康状态检查,包括CPU利用率,内存利用率等性能数据,还包括对硬件故障的监测,如电源、风扇等故障告警。校园网覆盖范围较广,楼宇间的距离也较远,很多网络设备离管理中心很远,管理员不可能逐个监测设备的健康状况,因此通过网络管理软件可以实时掌握各设备的健康状况,一旦有设备出现异常便能立即发现,减少了故障的查找时间,降低网络的业务中断时间。
3.监测业务运行状态。校园网的质量和网络资源的丰富与否常常通过网络上运行的业务体现出来,一旦某种业务中断,用户也就无法访问对应的资源。校园网大多拥有自己的服务器向全网用户提供服务,笔者所在学校就具有多台服务器提供服务,如DHCP服务器,DNS服务器,WEB服务器,邮件服务器和认证服务器等提供各种网络服务,某些关键性服务器如果出现故障,将导致整个网络业务中断,对服务器运行状态的监测也是每一位网络管理员肩负的重要职责。前文提及的Nagios软件提供了多种插件用于监测服务器的业务运行状态,比如常见的HTTP、SMTP、POP3、FTP等服务监测。这些插件可以透过上述协议来监测服务的响应时间、错误代码等关键性信息,方便系统管理员及时了解服务器运行状态。在监测服务器业务运行状态的同时,Nagios还对服务器自身的运行状态进行监测,监测项目包括服务器的CPU利用率、内存利用率和磁盘剩余空间等相关数据,并根据设置好的阈值进行告警处理。
4.监测链路流量状态。尽可能合理、高效的利用线路带宽是每个网络管理员不懈追求的目标。互联网诞生的初期,网络传输速率很慢,当时网络上传送的主要是字符数据,如浏览纯文本格式的WEB页面,发送纯文本内容的电子邮件。渐渐的,网页上出现了图片,人们发送邮件时还可以同时传送附件,再后来网络上开始出现了音频、视频等文件,到如今网络应用更是数不胜数,人们可以在线观看视频,在线游戏,在线购物,远程教育等等,如此大量的网络应用需要足够的带宽才能保证体验感受。各种网络应用的带宽的占用有很大区别,常见的网页浏览、即使通信等对带宽要求不高,而P2P下载、网络流媒体等应用则会占用大量带宽,如果对这部分应用不加以限制,势必耗尽带宽资源。管理员要随时了解带宽的使用情况,在不同时段为不同网络应用分配不同的带宽,以保证常见网络应用如网页浏览、收发邮件的正常运行。所幸的是,市场上有多种软件和硬件产品用来监测和管理链路流量,如监测流量的软件MRTG,用于流量管理流控产品。
通过文中提及的监测内容,网络管理员可以总体了解整个网络的运行状况,而某些具体细节如关键设备的端口发送、接收错误数据包的数量等信息还需要更进一步的监测。管理员在工作中要不断积累经验,通过软件提示的信息对故障进行分析判断,进而解决问题。网络运行状态是每个管理员都关注的焦点,如何准确、及时的搜集到这些状态信息对于网络故障的排除起着决定性的作用。网络管理员应充分利用相关的网络管理工具,了解它们的功能、优缺点,进而利用它们针对性的执行某项特定任务。随着软件技术的发展,会出现更多、更有效的监测技术,减轻管理员的负担,提高工作效率。对于网络管理员来说,如何合理搭配使用多种网络管理软件来监测网络是需要不断学习的课题。
转载注明来源:https://www.xzbu.com/2/view-608375.htm