您好, 访客   登录/注册

网络类设备双机热备环境测试方法研究

来源:用户上传      作者:

  摘要:随着计算机网络的快速发展,企业的信息化程度越来越高,企业之间,企业总部与分支机构的网络传输日益重要。如何实现在公共网络环境下安全、高效和可靠传输数据是通讯行业发展的重要课题之一。因此,一般部署关键节点的网络类设备的可靠性至关重要。为了保障网络类设备能够连续不间断地进行工作,要求其具有较高的稳定性和可靠性,为此一般环境中网络类设备都会采用一种双机热备技术。本文重点介绍网络类设备在热备环境中的应用场景,通过对该场景的分析,总结一套网络类设备针对双机热备环境适应的测试方法。
  关键词:可靠性传输;网络类设备;双机热备
  中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2020)08-0045-03
  0 引言
  目前网络类设备种类繁多,且与日俱增,但是网络类设备所涉及的环境和场景类的测试工作是由测试执行人员根据个人的技术水平和理解,搭建测试环境来进行功能和业务测试覆盖,可能会存在:协议和技术分析的不够深入,测试方法不够精准,测试需求有待更新、覆盖不够全面等问题,需要有新的需求分析和测试方法来支撑测试开展。
  在当前的组网应用中,用户对网络可靠性的要求越来越高,对于一些重要的业务入口或接入点(比如企业的Internet接入点、银行的数据库服务器等)如何保证网络的不间断传输,成为急需解决的一个问题。于是,业界推出了传统备份组网方案来避免此风险,该方案在接入点部署多台设备形成备份,实现一台设备故障后自动切换到另一台正常工作的设备,保障部署在关键节点的设备的可靠性和稳定性,即双机热备技术[1]。
  1 双机热备概述
  双机热备可以从两个层面去理解:一个是广义的双机热备,它是一种解决方案,用來解决网络中的单点故障问题,它通过数据同步和流量切换两个技术来实现;一个是狭义的双机热备,它是设备支持的一个功能模块(只实现了数据同步),可以使用对应的Web页签来配置。本文描述的是广义的双机热备。
  双机热备解决方案根据组网情况有两种工作模式:主备模式和负载分担模式。在这两种模式中,设备的角色根据是否承担流量来决定:有流量经过的设备即为主设备,无流量经过的设备即为备份设备。
  2 网络类设备双机热备工作原理
  环境部署如图1所示,其网络类设备在该热备环境中的工作原理如下:(1)加电启动时,两设备均为备机态;(2)启动后,根据本地web页面配置主备机。主机处于工作状态,能够处理用户业务数据。备机处于准备状态不工作,主备机通过心跳路径,周期性地发出检测数据包,实时查询主机是否工作正常;(3)如果备机在规定的时间内没有收到来自主机的检测包后,会认为主机可能出现故障,则备机主动切换为主机,代替主机处理用户业务数据。
  3 现有技术存在的问题
  现有的热备环境测试可能存在的问题有:(1)协议和技术的场景覆盖不全面,比如协议和技术发展拓宽了知识面,用户使用场景和需求有变化;(2)每个协议或技术为一个场景,协议的叠加组合及简化环境设备等方面需要进一步分析和整理;(3)协议和技术是从技术本身出发,而不是从用户需求和场景出发,需要根据用户类型和场景分析和固化为用户场景类的测试环境;(4)协议和技术都是按照环境测试覆盖,根据网络类设备的处理方式,只有参与处理的协议才需要如此,另外的丢弃类和透传类报文可以简化环境。
  4 热备技术应关注问题
  测试网络类设备在热备环境中的场景,首先要分析双机热备组网应用及切换模式,从根本出发,分析测试需要关注点[2]。
  4.1 双机热备普通组网应用
  两台设备,一般是同型号设备,部署双机热备模式。双机热备普通组网如图2所示。
  4.2 双机热备典型组网应用
  双机热备典型组网应用包含以下几种:
  (1)路由模式+主备模式。双机热备典型组网(路由模式+主备模式),是通过VRRP协议实现流量切换。这个需求可以通过在两台服务器上配置VRRP备份组1和备份组2(备份组1用来监控下行链路,备份组2用来监控上行链路),并使能数据同步功能来实现。如图3所示。
  (2)路由模式+负载分担模式。双机热备典型组网(路由模式+负载分担模式)是通过在4台路由器和2台服务器上配置OSPF协议,并在两台服务器上使能数据同步功能来实现。如图4所示。
  (3)透明模式+负载分担模式。双机热备典型组网(透明模式+负载分担模式)是通过在两台路由器上配置VRRP备份组1和备份组2(备份组1和备份组2进行负载分担,共同监控下行链路),并在两台服务器上使能数据同步功能来实现。如图5所示。
  4.3 双机热备切换模式
  双机热备技术的切换一般分为手动切换和故障切换,即计划性切换(即人为切换)和非计划性切换(即故障切换)。搭建热备环境主要是为了保障设备可靠性,大部分都是因为出现故障切换。
  设备工作不正常的情况如下:(1)硬件模块不正常,比如网口、fpga等;(2)软件模块不正常,比如相关模块、网络模块等;(3)环境指标不正常,比如温度、cpu、内存等;(4)设备本身故障,突然断电,网络中断等[3]。
  一般情况下的双机切换时间为1~5min,而快速切换的时间为3~5s。用户应根据自己的需求及业务特点来选择相关的切换服务,因此测试切换过程中需关注切换时长。
  5 测试技术关注点
  5.1 测试场景关注
  为了充分测试的热备环境适应性,因此需要考虑以上分析到的所有组网应用,覆盖所有场景。同时测试以上场景的过程中要关注关键数据。
  5.2 测试数据关注
  5.2.1 网络参数测试包括ARP、STP等信息
  (1)ARP信息需关注:网络设备要能学习到被测设备内网主机的ARP信息;被测设备要能学习到内网主机的ARP信息;内网主机学习到网关的ARP信息。(2)STP信息需关注:交换机关闭STP后,模拟环路数据,在热备环境中设备自身可以处理环路;开启STP,验证热备工作情况,再关闭后能恢复正常。
  5.2.2 数据同步测试
  两台设备选取主机的条件,主机数据如何准确无误的传递给备机,同步机制。
  5.2.3 开机启动测试
  主、备机同时开机,同时启动(主机工作,还是备机工作),只主机开机,只备机开机。
  5.2.4 监控管理测试
  被测设备状态灯监控(设备有状态灯条件下),主机工作时,状态灯显示颜色,备机工作时,状态灯显示颜色。
  5.2.5 运行状态切换测试
  主、备机切换时间测试,主、备机各类故障切换测试,主机正常,备机故障(备机内口掉线、外,口掉线、关机、相关进程挂起),备机正常,主机故障(主机内口掉线、外口掉线、关机、相关进程挂起),主机正常,拔掉心跳线,确认主、备机工作情况,主机异常,备机正常,拔掉心跳线,确认主、备机工作情况。
  6 结语
  测试网络类设备在各种网络环境时,一是环境本身组网测试,二是设备所处用户场景测试,两者必需相结合。且双机热备环境测试,不单只测试热备部署,大部分的实际使用场景是热备和负载同步部署,因此需要根据用户环境特点从热备和负载两方面分析考虑测试用例。
  参考文献
  [1] 赵婷.基于Oracle Data Guard的双机热备策略的设计与实现[J].三峡大学学报(自然科学版),2010(6):90-91.
  [2] 文丽.浅谈双机热备份技术在血站的应用[J].内江科技,2013(11):86-87.
  [3] 向军.基于Remus的双机热备份优化机制研究[D].武汉:华中科技大学,2013.
转载注明来源:https://www.xzbu.com/8/view-15321497.htm