您好, 访客   登录/注册

ATM机交易异常的特征参数描述

来源:用户上传      作者:王嫔

  摘 要:本文主要研究了基于拓扑网络结构图的ATM系统的故障应对机制问题,采用回归分析法以及聚类分析法,构建CPU载荷(和响应时间、交易量成正比)以及预测的交易量作为两个新的特征参数。构建成功率和响应时间的中心聚类模型,挑选出分行侧网络出现故障及数据中心后端处理系统应用进程异常数据点;运用箱线图得出响应时间正常范围的阈值,建立后端CPU负荷模型;最后利用滑动时间窗口模型剔除时间窗口过小的异常数据点,指出了某年1~4月的10次异常情况。
  关键词:回归分析;聚类分析;滑动时间窗口;时间序列模型;朴素贝叶斯分类器
  1 问题背景
  银行的ATM应用系统包括前端和后端两个部分。银行总行数据中心监控系统通过汇总统计每家分行的业务量、交易成功率、交易响应时间,来做出数据分析,从而捕捉整个前端和后端整体应用系统运行情况以及时发现异常或故障。
  常见的故障场景包括但不限于如下情形:1)分行侧网络传输节点故障,前端交易异常,导致业务量陡降;2)分行侧参数数据变更或者配置错误,前端交易异常,影响交易成功率指标;3)数据中心后端处理系统异常(如操作系统CPU负荷过大),影响交易响应时间指标;4)数据中心后端处理系统应用进程异常,导致交易失败或响应缓慢。
  本文根据某商业银行ATM应用系统某分行的交易统计数据,建立模型对ATM机交易状的特征参数进行了选择、提取和分析。
  2 问题分析
  要求确定特征参数,通过观察和分析数据,发现在选择特征参数时,不能够只是简单的选择题中所给交易量,成功率,响应时间单一分析,还应该寻找他们与时间之间的关系或彼此之间的关系。通过分析后,得出综合的特征参数。
  3 基于业务量的回归模型
  通过分析,结合图中与生活中的实际情况,一月份由于过年,交易量整月增加。二、三、四月的总交易量大致相同。因而将二、三、四月共同分析,一月单独分析。同时因为工作日和非工作日交易量差异量较大,所以将工作日与非工作日分开处理。
  ● 00:00~06:00
  首先分别分析二、三、四月工作日00:00~06:00交易量与时间的关系,通过观察两者之间的散点图,可猜测两者成二次或三次曲线模型。
  经过拟合发现,三次曲线模型的R2更大,拟合度更好,因此选择三次曲线模型。
  由此可以写出三次曲线方程为:
  y=-9.931×10-7x3+0.002x2-0.689x+84.758
  同理可得,二、三、四月非工作日00:00~06:00交易量也满足三次曲线模型。由此可以写出三次曲线方程为:
  y=-1.219×10-6x3+0.002x2-0.764x+93.781
  ● 06:00~12:00
  由此可以写出三次曲线方程为:
  y=-1.065×10-5x3+12.560x-4170.905
  同理可得,二、三、四月非工作日06:00-12:00交易量也满足三次曲线模型为:
  y=-9.884×10-6x3+11.946x-4022.602
  ● 12:00~00:00
  最后,分別分析二、三、四月工作日12:00~00:00交易量与时间的关系,通过观察两者之间的散点图,可猜测两者成二次或三次曲线模型。
  由此可以写出二次曲线方程为:
  y=-0.005x2+8.874x-2982.018
  同理可得,二、三、四月非工作日00:00~24:00交易量也满足二次曲线模型为:
  y=-0.004x2+7.759x-2530.101
  4 模型检验
  综合上述情况,当时间为x交易量为y且为工作日时时,满足如下关系:
  y=-9.931×10-7x3+0.002x2-0.689x+84.758, 00:00-06:00-1.065×10-5x3+12.560x-4170.905,06:00-12:00-0.005x2+8.874x-2982.018,12:00-24:00
  当时间为x交易量为y且为非工作日时时,满足如下关系:
  y=-1.219×10-6x3+0.002x2-0.764x+93.781, 00:00-06:00-9.884×10-6x3+11.946x-4022.602,06:00-12:00-0.004x2+7.759x-2530.101,12:00-24:00
  一月份交易量随时间的变化形式和二、三、四月相似,交易量整体增加。可类比二、三、四月写出相关函数,并筛选出异常点。
  通过对数据的分析,在所有的131013组数据中,有67组异常数据符合该点处交易量陡降的特征,属于第1种异常的情况。如每天的凌晨时段,同时也应该排除一些极为离散的异常值。
  在对排除过的异常数据做进一步分析后,选取随时间连续下降的几段交易量,作为告警指标。一、二、三、四月中因交易量异常而告警的情况如下:
  1月23日19:32~19:36
  1月25日16:58~17:03
  5 模型的评价
  (1)由于综合应用多种方法提取特征,所以模型具有代表性,结合所给的数据发现,能够较好的反应ATM系统交易特征。
  (2)数据处理规范。建模时按照科学的方法对数据进行了预处理,使的模型更加精准。
  同时也可以应用于研究经济方面的股票的波浪变化问题以及一些期货公司所遇到的财务困境问题。在基于时间窗口的情况下,可以对相关数据进行挖掘来建立模型,对可能发生的问题进行告警。
  参考文献:
  [1]刘畅.城市商业银行ATM监控管理系统的设计与开发.电子科技大学,2012.
  [2]蒋良孝.朴素贝叶斯分类器及其改进算法研究.武汉:中国地质大学,2009.
  [3]段晶.朴素贝叶斯分类及其应用研究.大连海事大学,2011.
  [4]卓金武,周英.量化投资:数据挖掘技术与实践(MATLAB版).电子工业出版社,2015.
  作者简历:王嫔(1982-),女,汉族,湖南浏阳人,现为川庆钻探工程有限公司长庆钻井总公司信息与档案管理中心计算机应用工程师,研究方向:软件开发与维护。
转载注明来源:https://www.xzbu.com/1/view-15018309.htm