您好, 访客   登录/注册

基于光通信的思科交换机CPU死机解决方案

来源:用户上传      作者:

  摘 要:供电企业中广泛使用ATM思科交换机CPU,但是该交换机在使用的过程中经常会出现无冗余死机的现象,进而导致整个通信系统崩溃,甚至可能造成不可估量的损失。前期通常使用的双CPU设置不仅耗费大量的系统预算,更是治标不治本,每次死机后仍需维护人员进行手动修复,本文针对以上情况,对CPU死机的现象和影响进行了研究和探索,提出人工呼吸法和自动接入法两种自动化解决思科交换机CPU死机的问题,在一定程度上解决了CPU死机带来的危害,并为更加实用的方法提出了一定的借鉴性。
  关键词:光纤通信;思科交换机;CPU死机
  通常交换机组采用环形或是星形的网络结构,典型的传输速率为155Mb/s。虽然思科交换机被广泛使用,但是思科系列的交换机也存在着明显的问题,CPU死机是最为常见,也是对系统运行影响较大的危害之一,本文对思科交换机CPU死机进行分析并给出解决方案。
  一、思科交换机使用简介
  在ATM光通信网络中,总服务器以及各变电站的服务器中均需要使用交换机,但是在总服务器端的核心交换机涉及到更大的光传输带宽,因此需要使用性能更强的思科8540交换机,而在各个分支服务器端,考虑到在工程项目中的资金投入问题,则选用性价比更高的思科8510交换机。由此可见,主端的思科8540交换机的性能和状态对整个网络都有着直接的影响,一旦8540交换机出现重大故障,则整个系统则在短时间内会陷入瘫痪,CPU死机带来的直接影响就是系统崩溃,为维护人员和用户都会带来巨大损失。
  最为简单的做法是为8540交换机配置有额外的CPU芯片,这样在主CPU死机无法工作的情况下,可以及时启用备用CPU芯片以防止整个系统崩溃,双CPU在一定程度上解决了CPU死机的情况,但是首先双CPU也不能彻底解决死机情况,因为即使是两个CPU也可能出现同时死机的情况,还有就是成本问题,8540交换机CPU价格比较贵,双CPU系统大大增加了系统预算,因此,找到单CPU情况下的系统恢复方法,才是正确的解决思路。
  二、思科交换机CPU死机问题解决措施
  2.1 自动接入法
  自动接入法是对交换机CPU的状态进行实时监控,一旦CPU陷入死机状态,则进行报警并自行对交换机进行重启。这需要对交换机设备添加一个监视和重启的装置,装置主要由两部分组成,分别为判断电路部分和延迟电路部分。
  2.1.1 判断电路
  监视电路通常是选择对光网络中的传输信号进行检测,一旦被检测的信号被检测出不正常,则表示交换机CPU出现死机现象。通常ATM光通信传送网络中有以下几类信号在进行传输:1)调度自动化信号、调度电源网管、信号机传输电话等,为数字和模拟的混合信号,传输速率为64kb/s;2)调度数据网、传输视频、采集电路信息等信号,传输速率为2Mb/s;3)接入供电所的电路信号,传输的典型速率为155Mb/s。
  针对上述几种出现在光传输网络中的信号,选取一种或几种具有鲜明特征的信号来作为被监视的信号。通常一个电路输出信号不可能在一段时间内保持全“1”或是全“0”,对一段电路信号进行监视,若在设定的时间长度内输出结果为某一固定值,则表示信道通路中已经没有信号传输。对上述中的每种信号进行监视,并且对每段电路的不同状态设置一个值,例如若该段信号正常,则输出“0”,若该段电路不正常则输出“1”,若所有信道段的输出均为“1”则表示系统出现故障,此时对CPU状态发出报警信息,系统自动掉电并重新上电,系统自动重新启动则消除了CPU死机后系统瘫痪带来的影响。
  2.1.2 延时电路
  上文所述的报警信息被判断电路识别之后,判断电路会输出一个控制信号,控制信号会进入延时电路,对其进行控制。控制信号进入延时电路部分后,执行电源会在短时间内断开后重新加电,此时双向可控硅SCN没有触发信号,控制级处于分离的状态,继电器也处于断开的状态,这种状态下8540交换机处于未加电的状态,同时电源会向电池充电;充电动作完成后,电池两端的电压差满足双向二极管在出现逆转时,使其导通,并且电流在流过二极管时会向可控硅控制级放电。放电过程中,则继电器闭合,交换机重新处于充电状态。
  2.2 人工呼叫法
  变电站通信全部中断后,电网监控或是调度员应当及时电话通知维护人员,而维护人员接到电话通知后,应当对视频监控是否工作正常进行查看,这个查看过程同样依赖电网监控或是调度员的查看。此时若视频监控处于正常工作状态中,则表示并非是CPU死机导致的故障,这时则需要电网监控或是调度员对其他部分的工作状态进行检查;若是视频监控全部中断,则可以判定是思科交换机CPU发出报警信号。在判定是CPU发出死机报警信号后,维护人员需要拨打特定的8540号码,启动电源复位装置动作。人工拨号后,二线接收器在拨通后会做出摘记动作,继电器启动、闭合,延迟电路被触发工作,继电器处于闭合状态,完成以上动作后维护人员可以挂机,继电器释放后电路重新加电,电路恢复正常工作状态,整个流程也是断电后加电的过程。电源的延迟重启,工作原理与自动接入法相同,在此不做赘述。
  三、总结
  对上文进行总结后可以得出共有三种方法可以解决思科交换机CPU死机的问题,分别为双CPU配置,自动接入法和人工呼吸法。其中双CPU配置使额外配备一个交换机CPU,在主CPU死机后启用副CPU。后面两种方法的本质都是对电路进行监控,一旦CPU死机故障发生,自动或是人工地使系统掉电后重新加电,短时间内重新启动系统。第一种方法的弊端是费用过高,但是系统结构简单易行,便于安装和操作,后面的两种方法是额外装置或是人工费用较低,但是系统结构较为复杂,需要在多处对系统信号以及状态进行监控和处理。对于有条件的地方可以采用配备副CPU的方法,减少系统冗余,便于维护和保障,而资金较为紧缺的地方则可以选用后两种方式配置系统,解决CPU死机的问题。
  参考文献
  [1] 李帅. 光通信系统中思科交换机CPU死机的解决方案[J]. 科技传播,2013(2):60-61.
转载注明来源:https://www.xzbu.com/8/view-11251561.htm