您好, 访客   登录/注册

集中监测业务系统运行

来源:用户上传      作者: 王淑江

  小张是一名企业网络管理员,随着企业的壮大,需要管理的服务器也越来越多。因此,小张常常来不及完全融会贯通一套业务系统,又要开始规划、部署一套新的业务系统,管理工作越来越繁重。有什么方法让他脱离苦海,腾出更多时间来研究业务流程和学习新知识呢?
  
  集中监控的需求
  
  由于管理效率低下,人工管理模式已无法胜任对众多服务器的管理。小张的要求是对服务器进行集中且有效的管理,包括:监控服务器运行状态,甚至监控到每个服务的运行状态;为网络管理员提供发生问题的原因和历史出现问题记录;预测可能发生的问题,同时支持非微软公司的软件产品。实际上,微软公司已经提供了一套能够完成该功能的企业级管理产品Microsoft Operations Manager 2005(以下简称MOM)。
  MOM可以提供被动式监控和主动式监控两种模式。被动式监控可以监查企业中所有受管理服务器,但只有在事件触发时才会执行监控功能。主动式监控指通过定义好的Script脚本主动检查企业未来环境中的服务器或者代理管理的服务器系统中重要服务的状态。例如,Active Directory数据库日志是否正常,在指定时间是否执行了备份,服务是否可用,磁盘空间是否足够使用等等。
  作为管理员的小张尤其想监控安装了Microsoft SQL Server 2000的数据库服务器的状态,通过监控数据库的状态,即可得知当前业务系统运行状况。
  
  安装MOM
  
  MOM服务器端运行的操作系统平台必须是Windows Server 2003或2000,并且已经被加入到Active Directory中,安装了SQL Server 2000数据库和Reporting Services服务或者安装SQL Server 2005数据库。MOM提供的Web控制台服务基于IIS服务,因此MOM管理服务器中必须安装IIS服务。之后,MOM的安装十分简单,根据安装向导提示即可完成。
  完成MOM服务器部署后,要为需要监控的目标计算机安装代理程序。代理程序安装在目标计算机中,MOM服务器通过代理程序和服务器之间交互。启动“管理员控制台”,选择“管理员控制台”选项,单击“安装代理”超链接,启动“安装/卸载代理向导”,根据向导提示即可完成目标计算机代理的安装。
  小张需要监控SQLServer服务器的系统状态,从微软的MOM网站上下载最新的Microsoft SQL Server管理包并安装到MOM管理服务器。SQL Server 监控组件是MOM核心组件之一,它可以实时地监控SQL Server的运行状态、磁盘空间、死锁、堵塞、DBCC异常、备份与恢复状态等SQLServer异常信息,可以将监控到的行为及时地反馈给网络管理员,确保在事故没有发生之前即可有效地监控和防止数据库可能发生的异常行为,保证SQLServer数据库的正常运行。
  小张部署完成SQLServer监控组件后,兴奋地打开MOM操作员控制台。他在控制台左侧的列表中,选择“图示”视图,打开“全部:图示视图”下的“图示”选项,惊奇地发现安装MOM代理的SQLServer服务器出现“严重错误(红色‘X’)”警报信息,安装Active Directory服务的服务器出现“警告(黄色的‘!’)”信息,Microsoft SQL Server 2000数据库和MicrosoftWindows Server同样出现“严重错误(红色‘X’)”警报信息。
  由于Microsoft SQL Server 2000运行在Windows Server 2003服务器之上,因此小张首先选择数据库服务器(book\sql),右击该服务器,在弹出的快捷菜单中选择“视图”选项,在弹出的级联菜单中选择“警告”命令,启动“警报”窗口,竟然发现在数据库服务器上存在2条“严重错误”和4条“警告”信息。
  小张单击第一条“严重错误”消息,在“警报详细信息”窗口中显示MSSQLSERVER服务没有运行。规则(已启用)区域显示该信息是由“Microsoft SQL Server\SQL Server 2000\状态监视和服务发现\SQL Server 服务可用性”时间规则触发。可以这样理解,由于SQL Server 服务可用性规则监测到了SQL数据库服务器上的MSSQLSERVER服务异常停止,而发出严重警告信息。
  小张单击第二条“严重错误”消息,显示SQLSERVER代理服务没有运行。
  小张再次查看其他的错误信息和警告信息,显示“由于服务控制管理器发出了‘停止’请求,SQL Server 将终止运行”以及“SQL-DMO没有连接该服务器对象,请参阅与此警报相关联的事件,查看出现此问题的计算机”,说明错误和警告信息的出现是因为数据库服务和数据库代理服务引起的,只要启动该服务即可解决遇到的问题。
  小张打开“任务”面板,展开“Microsoft SQL Server 2000”下的“SQL Server 2000”,选择“启动SQL服务”任务,启动“欢迎使用启动任务向导”,根据提示完成SQL服务器中SQLServer服务的启动,并按照同样的方法完成SQLServer代理服务的启动。
  SQL服务器中的SQLServer服务和SQLServer代理服务启动后,小张查看服务器的状态还是显示和原来一样的错误信息。小张突然想起来,应该将处理错误的过程记录到MOM中,以后其他同事如果遇到类似的问题,直接调用历史记录就可以看到该服务器以前出现的所有故障情况。在“警报”列表中,右击其中的一条错误信息,在弹出的快捷菜单中选择“设置警报解决状态”选项,在弹出的级联菜单中选择“已解决”命令,打开“解决警报”对话框。在“文本框”中输入解决问题的方法以及处理过程即可。按照同样的方法,可处理其他的错误信息。
  当MOM监测到的所有错误和警告信息解决之后,在“图示”视图中数据库服务器和Microsoft SQL Server 2000数据库状态将更新为正常状态。小张看到这张图后,长长地舒了口气,这表示运行SQLServer的服务器正常,数据库服务也运行正常,更关键的是他不需要每天到每台服务器上查看大量的日志,从MOM提供图示中即可发现哪些服务器出现问题,同时MOM给出可以参考的技术资料以及解决方案,让管理员更好地维护管理服务器。
  
  实现远程管理
  
  小张突然想到一个问题,从MOM监测状况来看,MOM确实达到了自动监测的目的,但是有一个基本的问题,那就是作为管理员的他不可能始终呆在计算机旁边。当MOM监控到预定义的事件或者警报后,能否通过邮件或者短信的方式,在第一时间通知他,提高网络故障的响应时间。其实在MOM中,已经提供电子邮件、发送HTTP页面以及与第三方工具(例如短信)等通知模式。
  首先需要创建一个操作员,然后将创建的操作员绑定到通知组中。打开“管理员控制台”。打开“管理员/通知/操作员”选项,创建一个新的操作员,指定该操作员使用的电子邮件地址。
  MOM部署完成后,默认已经创建了4个通知组,分别为Network Administrator组、Operations Manager组、Operations Manager通知测试组、数据库管理员组。在默认的组中,没有关联任何操作员,即默认情况下当监测到警报或者事件出现时,不会向任何通知组发送通知。只有将创建的操作员关联到相应的通知组后,指定的管理员才能够接收到通知。选择一个通知组,打开“属性”对话框,将创建的操作员从“可用操作员”列表中添加到“组操作员”列表中,确定即可完成接收电子邮件操作员的设置。按照这种方法设置完成后,小张即可接收到MOM监测的通知并及时发送给他。
  部署MOM之后,小张可以轻松地监控和管理企业中的服务器,再也不需要在每台服务器之间来回奔波。


转载注明来源:https://www.xzbu.com/8/view-1088291.htm