您好, 访客   登录/注册

利用存储系统修复服务器系统故障对策

来源:用户上传      作者:

  摘要:当今是信息化时代,也是网络技术发展迅速的时代,互联网已经渗透进了人们的生活。在当前人们的工作中,计算机的使用尤其重要,而企业发展进行正常业务运行的前提就是保证服务器能够正常运转,一旦发生服务器系统出现紧急故障的情况,就会导致计算机的系统不能进行正常的运转,几乎所有的业务都会随之停止,严重影响公司的经济利益并且会造成其他一系列不良的后果。因此,在服务器出现障碍时,要及时对服务器系统进行修复,如何在最短的时间内将服务器系统恢复正常应用,并能够正常进行业务,将企业的损失降到最小,是尤其重要的。利用存储系统能够加快修复服务器系统的故障,本篇文章对存储系统恢复企业的服务器系统出现的紧急故障进行了相应的分析与讨论。
  关键词:网络技术;服务器;存储系统;故障分析;运转正常
  随着科技的迅速发展,计算机已经成为了工作生活中必不可少的辅助性工具,人们的工作几乎都离不开计算机的使用。而在计算机的使用过程中,一切程序的运用都需要服务器来支撑维持,保证程序的正常使用和计算机的正常运作。但服务器一旦出现故障,就会造成很大的麻烦。将崩溃的操作系统迅速安全地恢复正常使用是非常重要的,利用存储系统来恢复崩溃的服务器系统和操作系统,使业务数据库能够正常运行使用,是一种安全可行并且所用的时间最少的恢复方法。本篇文章针对利用存储系统恢复服务器系统的方式进行研究,并发现使用这种方法的优点。
  1 设备参数及工作环境
  研究企业日常运营所使用的服务器是 IBMX460,安装有IBMserverraid-8iRAID卡,并做了RAID5,操作系统是windows2000server,数据库系统是 SQL2000,数据库中有整个企业人员的信息以及企业的运营流程。存储系统是爱数 PX1200,该存储系统基于CDP 持续数据保护技术,支持 Windows平台下的 SQLServ-er 及支持完整的RAID 级别的实时复制。IBM 服务器和爱数存储系统在本单位局域网中同处于一个VLAN 中,同一个网段。IBM 服务器的IP是 192.168.0.27(以下称为27 服务器),爱数存储系统的 IP 是 192.168.0.253,网关都是192.168.0.254。
  2 故障原因分析
  在解决之前,先试着到一处工作用电脑进行登录,发现服务器系统登录登录不上去,并且 ping27 服务器和网络链路都是通的,又在此情况下检查了几个其他工作地点的电脑登录,都是同样的问题状况。因此,维护人员判断网络链路没有问题,推测是 27 服务器出现了故障,检查发现服务器处于关机状态。估计是由于停电的原因,再加上 UPS 出问题不能为 27 服务器供电。先打开 27 服务器,尝试几次都进不去,推测是停电导致系统文件造成损坏,不能进入系统。
  3 利用存储系统恢复
  企业以前购买了爱数存储系统 PX1200,在启用 PX1200 后,用它备份了 27 服务器的操作系统及应用系统,并对 SQL 数据库作了实时备份。由于 27 服务器中运行的是企业经营中的重要业务,所以在备份完成后,没有对完成的备份进行验证,也不确定是否成功将服务器系统彻底恢复。经过一系列的分析,针对这次服务器系统出现故障的状况,调试人员决定用爱数存储系统 PX1200 来恢复操作系统,用这种方式来验证 PX1200 能否安全地将服务器系统进行恢复,并且在最短的时间内恢复数据库,过程中没有任何损失,降低本次服务器系统故障造成的不好的影响,并且减少企业在这次服务器系统故障过程中造成的损失。
  4 应用数据库的恢复
  由于没有在系统进行备份的过程中加载企业人员的信息数据库,所以在本次修复服务器系统后应将公司人员的信息数据库加上去。加上数据库的过程很简明,将 SQL2000 的企业管理器打开,点击数据库这一项,选择所有要进行的任务附加应用数据库就完成了这个过程。这只一系列的动作完成后,测试相应的应用系统,结果是系统完全能够正常运行,并且之前最后一步中存入的数据库也保存完好,服务系系统完全得到修复。这次利用存储系统进行服务器系统修复的过程只用了 30 分钟,并且服务器系统完全可以正常运行。利用存储系统进行服务器修复能够减少修复的时间,并且具有安全、稳定、高效率的优点,在实际应用中有着重要的意义。
  5 维护人员遇到修复情况的处理手段
  当企业的服务器系统在出现突发性故障时,这种紧急情况下维护人员更不能慌乱。要保持清醒、冷静的头脑,判断可能导致故障发生的具体位置,从最初的判断开始一点一点地摸清发生故障的位置,并根据身边能够利用的资源对这次故障采取最有效的解决办法,尽量在最短的时间内将服务器系统修复完成,并保证系统能够正常稳定地使用。运营维护人员还必须将所有设备的资料、信息和驱动盘保管好,保证其安全性。维护人员也要定期检查服务器系统的运行状态,检查设备的功能和状态是否良好,保证设备配置参数正常,一旦发现任何故障或情况都要及时进行维修处理,防止设备运营过程中出现更大的故障,导致产生更大的损失。
  6 结论
  在这次服务器系统的实际修复过程中,利用存储系统能够将其很快地进行修复,并且过程安全,修复后的服务器系统也相对来说特别稳定,没有对企业造成严重的损失,也没有过多地影响企业的正常运作。利用存储系统来恢复服务器系统故障是一个非常可行并具有一定实际意义的修复手段,对服务器系统恢复中的应用有着重要的作用和意义。
  随着科技的迅速发展,计算机已经成为了工作生活中必不可少的辅助性工具,人们的工作几乎都离不开计算机的使用。而在计算机的使用过程中,一切程序的运用都需要服务器来支撑维持,保证程序的正常使用和计算机的正常运作。但服务器一旦出现故障,就會造成很大的麻烦。将崩溃的操作系统迅速安全地恢复正常使用是非常重要的,利用存储系统来恢复崩溃的服务器系统和操作系统,使业务数据库能够正常运行使用,是一种安全可行并且所用的时间最少的恢复方法。本篇文章针对利用存储系统恢复服务器系统的方式进行研究,并发现使用这种方法的优点。
  参考文献
  [1] 移动云存储系统的关键问题与技术方案[J]. 沈海灵.  福建电脑. 2017(08)
  [2] 数据中心存储系统故障解决策略[J]. 段晨.  计算机与网络. 2018(21)
  [3] 基于故障树分析法故障辅助处理系统的探讨[J]. 魏常丽,樊海峰.  铁道通信信号. 2016(06)
  (作者单位:浪潮电子信息产业股份有限公司)
转载注明来源:https://www.xzbu.com/1/view-14726700.htm