农村商业银行应用系统日志管理现状分析及改进设计
来源:用户上传
作者:李法杰
通过近几年的建设和发展,农村商业银行的信息科技治理水平不断提升,IT系统不断推陈出新,应用系统数量不断增加,与此同时,系统间关系变得愈加复杂,系统运维压力也日渐增加。作为运维工作中问题分析和故障诊断的重要工具,日志记录是否全面,关键信息检索是否方便往往直接影响故障和问题的诊断效率,进而影响运维的整体水平。本文通过对农商银行日志管理现状分析,借鉴同业及互联网行业领先实践,提出通过制定全行统一的系统日志技术标准和建设统一日志管理平台,有效解决运行维护管理中存在的问题,为进一步实现端到端应用级监控奠定数据基础。
一、日志管理现状分析
日志文件是由系统或者应用程序产生的用于记录系统和应用程序的操作事件和各种服务的启动、运行、关闭等信息。商业银行信息系统数量庞大,以山东农村商业银行为例,截至目前,已建成包括核心业务平台、信贷管理系统、经营决策系统等各类应用系统超过一百多套,覆盖业务处理、运维管理、经营管理等各领域。由于银行信息系统建设一般采用多家厂商共同建设的模式,各技术厂商引入自身的日志技术标准或规范,内容和质量参差不齐,相互无法统一,造成后续日志使用时格式混乱、无法阅读等问题。
(一)数据质量与标准
应用系统日志技术标准是对日志数据的分类、内容、格式等进行定义,在遵守行业相关应用安全规范、集成规范、数据标准等基础上对日志文件的记录、存储和使用提供标准化规范。目前,农村商业银行日志数据质量与标准上普遍存在以下问题。
日志数据标准不统一。普遍缺少统一的日志数据标准,大部分应用虽有各自的数据标准或规范,但规范内容不完善、不统一。
日志分类不完整。大部分应用均对日志内容进行了分类,运维工作中使用最多的是应用日志,但各大多数应用并未明确区分应用日志与系统日志。
日志内容不完整。大部分应用的日志标准均未对日志内容进行清晰定义,不仅关键业务要素未记录,服务调用请求信息也未记录。
日志格式不一致。大部分应用均对日志格式进行了定义,但各应用系统间日志的格式各异,不利于不同应用的运维人员阅读或者交由日志工具进行数据抽取和识别。
流水号规范缺失。部分关键应用已经使用了流水号,但该流水号并非全局使用,仅仅起到在该应用内部标识事务唯一性的作用,且只在其直接上、下游系统间传递。既没实现全应用的使用统一,也无法实现全应用的事务关联,不能支撑全行交易端到端交易链路的还原。
(二)日志数据存储
各应用系统日志普遍采取本地存储的方式,日志存储在各自的应用服务器或数据库服务器上,缺少集中统一的存储设备。日志数据留存周期、归档转储等缺少统一的规划,对于时间跨度较长的问题,在分析处理时,日志数据往往已被清理,存在日志缺失的风险。
二、统一日志管理平台应用架构设计
针对当前农村商业银行应用系统日志管理中存在的问题,在统一各应用系统日志标准的基础上,构建全行级的统一日志管理平台,实现行内各应用系统分散日志的集中存储和数据积累,采用全局流水号机制实现跨系统交易日志关联和交易路径还原,在此基础上实现基于日志数据的相关应用和服务,是农村商业银行应用系统日志管理的未来转型方向。日志管理平台作为全行级基础性平台,一方面要满足支持故障定位分析和运维优化的需要,另一方面要为监控、营销等系统提供数据支持。其应用架构设计如图1。
(一)服务层。作为统一日志管理平台的前台界面和服务接口,是用户访问或外系统调用的入口。服务层主要完成以下功能:
1.检索与统计。用户可通过检索条件检索日志内容,用于分析故障原因。检索方式包括关键字检索、范围与条件检索和组合检索,检索结果可以通过数据明细和图表的形式有序展现。
2.日志浏览与数据管理。日志管理平台提供在线浏览和离线浏览日志管理平台的日志文件两种方式。
3.交易端到端分析。全局流水号的引入使得平台支持对交易流水数据进行实时的关联分析,直观展示交易链路,辅助维护人员准确定位故障,包括端到端链路还原、耗时分析、接口报文分析和错误日志分析。
4.交易统计分析。丰富的日志数据支持交易关系分析、应用关系分析、交易量与交易性能关联分析,为维护人员运维优化提供信息参考,为管理者提供决策依据。
5.数据服务。为数据消费应用提供服务接口,包含交易明细数据存取和指标告警数据存取。
6.用户与数据安全。对不同用户进行访问控制和敏感数据遮盖,包含用户管理和权限管理。
7.系统管理。对日志管理平台进行配置和维护,包含代理管理、采集管理、安装与部署、配置与管理和系统监控。
(二)应用逻辑层。是统一日志管理平台的核心,它是前台展现的业务逻辑部分。包含:
1.全文日志检索。将前台检索要素和统计指标转换为检索统计语句,对检索和统计结果进行处理后返回前台,包含日志检索和日志统计;
2.交易明细处理。对交易明细数据进行加工处理,支持服务层交易端到端分析和交易统计分析。包含耗时计算、报文字典计算、交易链路还原和统计/关联分析;
3.权限与安全。对权限管理、访问控制和敏感数据遮盖形成支持,包含功能权限控制、数据权限控制、敏感数据遮盖和用户认证。
(三)日志数据存储层。存储层是统一日志管理平台的基础。存储层接收并存储收集层发送的日志数据,包含:
1.分布式全量日志存储。提供分布式文件存储需要的管理功能,支撑展现层的日志在线浏览和离线浏览。主要功能包括:日志入库、日志输出和分布式文件管理等;
2.日志索引。负责近期日志数据的索引和检索,同时提供近期日志数据统计分析功能。支撑界面层的故障定位和处理层的全文日志检索。主要功能包括:索引建立和索引数据管理等;
3.历史数据存储。负责历史日志数据的存储和统计分析。数据来源于在线检索子系统和海量日志文件存储子系统的批量导入。主要功能包括:数据导入、数据提取;
(四)收集层。收集层是统一日志管理平台獲取日志文件的关键环节,是日志数据分发重要的组成部分。它接收代理层上送的日志数据,经过解析和格式转换等加工过程,分发给分布式全量日志存储和日志索引。主要功能包括:日志接收、日志解析、格式转换、日志分发、集群控制、通讯协议等。
(五)代理层。日志采集代理是统一日志管理平台获取日志文件的入口,日志采集功能是统一日志管理平台重要的组成部分。它的主要作用是将被接入系统日志增量数据传输给统一日志管理平台。日志采集代理的主要能力为日志侦听、日志读取、日志传输和采集控制等。
三、结束语
本文在分析农村商业银行应用系统日志管理现状的基础上,提出了基于全局流水号的方式解决各应用系统日志无法以交易为主线进行关联,无法支撑交易端到端分析的问题,在日志存储上,统一日志平台采用分布式存储技术解决现有日志只能分散在各应用、存在存储空间上限、长期存储成本不经济等问题,能够较好解决当前农村商业银行应用系统日志管理中存在问题。
转载注明来源:https://www.xzbu.com/8/view-15169418.htm