商业银行客户分类新体系探索
来源:用户上传
作者: 孟钊兰 邵洪选
摘要:商业银行客户分类体系是其业务经营的重要内容。采用何种方法对客户进行分类一直是实践中讨论的问题。运用多元统计的因子一聚类分析方法,从风险要素和价值要素两个维度来重新设置银行信贷客户分类的方法,有利于探讨银行的信贷客户分类的新思路和有效途径,为银行信贷管理和风险控制提供科学的方法支持。
关键词:因子一聚类分析;银行客户分类;信贷管理
文章编号:1003-4625(2008)03-0065-05
中图分类号:F832.3
文献标识码:A
一、引言
商业银行的客户分类是其客户关系管理的重要内容,也是其风险管理的重要环节。国外先进银行的客户区分研究表明,在银行客户中,16%的客户为银行创造了105%的利润贡献,56%的客户创造了18%的利润贡献,而另有28%的客户则给银行带来22%的净亏损。不同性质的客户给银行所带来的价值差异是十分明显的,银行可通过识别、区分这种差异,指导其更合理地配置市场销售、服务和管理资源,以较少的投入获取更大的收益。同时,银行的内部评级法要求风险贷款分类的第一步是客户分类,要做好客户分类,首先要采用各项指标进行客户分组。客户分组越细,风险评级的准确性越高。可见,银行赢利性和安全性目标的实现一定程度上依赖其客户分类体系的科学性和艺术性。
商业银行作为经营货币的特殊企业,必须实现安全性、流动性和盈利性三者的统一,只能在确保安全性和流动性的情况下追求利润最大化。商业银行这种特殊的企业性质决定其客户分类体系要从风险和价值两个维度来考核,并实现两个维度的统一。其中,风险维度对应安全性和流动性目标,价值维度对应盈利性目标,两者都可采用相关要素(指标)来构建模型。因此,本文将采用多元统计方法从风险和价值两个维度来探索商业银行客户分类体系。
二、文献综述
目前,我国商业银行客户分类的研究主要是围绕内部评级法来展开的,模型一般限于风险因素,目的在于银行的风险控制和管理。以王春峰为代表的部分学者分别运用线性多元判别法、LOGIT法、遗传规划模型、神经网络模型、决策树模型对商业银行的信用风险评估作了系列研究,并对以上算法的信用风险预测能力进行了对比分析。肖北溟指出其中部分方法存在评级指标和权重的确定缺乏客观依据和不能给出贷款违约概率等应用问题,采用因子一聚类的分析方法构建了我国商业银行的信用评级模型,使评级模型直接与违约概率挂钩,模型的实用性和度量风险的准确性得到改进。
另外,其他客户分类研究往往出于客户关系管理,主要集中于价值因素分析。吴开军指出客户分类的依据就是客户价值,它可以通过不同的指标形式反映出来,从而产生不同的分类方法;韩景元认为将客户终身价值作为客户细分的标准和依据是比较科学的。其实,这些文献除了集中于价值因素分析外,专门针对银行客户分类的研究很少。而周春光提出我国商业银行应在内部评级法的基础上引入价值因素,重构客户分类体系,对银行客户分类的特殊性有了很高的认识。Ⅲ但是,他只探讨了分类新体系的准则,并没有进一步具体介绍分类的方法。因此,有必要探讨新的方法,将客户价值分析导入银行客户分类系统,作为信贷管理控制的新维度加以创新和设计。
同时,新的客户分类体系将考虑两个维度的多个指标(要素),加上这些指标之间有一定的相关性,势必增加分析问题的复杂性。多元统计中因子分析能够将多个指标提取出少数相互无关的公共因子,达到降维的效果,解决了指标反映客户信息重叠与遗漏的问题;而聚类分析可以在计算因子得分的基础上进行分类。因此,因子一聚类分析方法可以作为新的客户分类方法。王建民和王传旭曾介绍过基于主成分一聚类分析方法的客户分类的算法,并未进行实证分析。虽然这里采用的方法与其相似,但是因子分析可以进行因子旋转,对经济意义解释能力强,避免了主成分在具体应用中可能出现的无法解释经济意义的问题。下面就以主成分一聚类分析方法为基础,探讨银行的客户分类。
三、模型描述
(一)构建模型的整体思路
为了构建全面充分反映银行客户特点的新分类体系,应具体考虑两个维度,即从环境风险、行业风险、竞争能力、信贷记录、财务指标、客户当前价值和潜在价值七个方面进行考察。其中,财务指标和当前价值属于定量分析的内容,其他则属于定性分析的内容。以往的经验表明,银行客户分类是在对定量指标构建统计模型的基础上,再通过定性分析进行调整而确定。因而,财务指标和客户当前价值指标是获得初始分类的关键,也是银行客户分类新体系的核心内容。其他方面则依赖相关人员的经验进行主观判断为主。本文研究的主要是定量分析方法,采用贷款企业财务指标及其当前价值指标,通过因子分析和聚类分析,构建风险与价值评价统一的定量模型。构建模型的具体步骤是:(1)以商业银行贷款数据资料中的财务指标为基础,整理出对应的当前价值指标,构建指标体系。(2)对选取指标的原始数据进行因子分析,计算公共因子,并通过旋转明确其经济意义。(3)计算因子得分,进一步做聚类分析,得出分类
(4)因子旋转。因子分析在银行具体应用中,可能出现所提取的公共因子的经济含义不十分明确或难以界定的问题,这时可根据因子载荷矩阵的不惟一性,对因子载荷矩阵实行旋转即用一个正交矩阵右乘A(相当于其对应坐标系的一次旋转),使旋转后的因子载荷矩阵结构简化,便于对公共因子进行经济解释。因而,经过旋转后,公共因子对x1的贡献h21并不改变,没有减弱原问题的信息量,反而增强解释能力。
(5)计算因子得分。因子模型公式(1)是将指标表示为公共因子的线性组合,由于公共因子能反映原始指标的相关关系,用公共因子代表原始指标时,更有利于描述银行客户的特征,因而往往需要反过来将公共因子表示为指标的线性组合,即
计算综合得分的同时,为了了解银行客户样本在各个公共因子上相对实力,需要进一步对各个因子得分进行排序和对比,也为分类后各类的性质分析做准备。
3、系统聚类分析
聚类分析的对象是经过综合因子得分计算得到的新数据Z,在此基础上采用系统聚类分析方法进行分类。
(1)对样本分类(Q一型聚类分析)距离的定义
聚类分析的依据是各指标的相似性,而对相似性测度一般用距离。如果把银行n个样本(经综合因子得分计算后)看成一维空间上的n个点,则两个样品间相似程度可用一维空间中的两点的距离来度量。令dij表示样本i与样本Xj的距离,这里分析采用欧氏距离,则中所有客户综合得分的平均值,则
中所有客户得分的平均值,则各个客户类别的综合得分为Z=(Z(1),Z(2),……Z(C))。
从而,我们可以根据每个客户类别的综合得分情况,结合因子分析中对各个类别内的客户特点的认识,将银行的信贷客户划分为低风险高收益客户、低风险低收益客户、高风险高收益客户、高风险低收益客户、中等风险中收益等类别,并根据每个客户的综合得分情况,将该客户归入其所应在的客户类别。初步为银行的信贷管理和风险控制提供了科学的分类体系。
四、应用实例
在银行的具体应用中,上述模型算法可借助现代统计软件SAS或SPSS来实现。下面就采用某银行的52个客户样本,采用前面选取的14个指标,借助SPSSl2.0来说明实现客户分类的过程及经济意义。其中,实证分析的原始数据资料是从该银行的信息系统中随机抽取整理而得,并通过游程检验(Nonparametric test),表明这些指标能够有效反映银行客户的风险和价值信息,可以进一步做因子一聚类统计分析。
(一)因子分析
1、KMO检验和巴特利特球形检验。样本指标的KMO指标为0.744,偏相关性一般,仍属于适合进行因子分析范围;巴特利特球度检验的Chi-Square统计值为439.406,相伴概率为0.000,若以0.05为显著性水平,则相伴概率小于显著性水平,适宜做因子分析。
2、选取公共因子。根据所选指标的相关矩阵,SPSS软件得到的因子特征根以及贡献率和累计贡献率如表1。
由输出结果可知,前5个公共因子的累计方差贡献率达79.122%(经验值为大于75%-85%),基本包含了原始数据的信息,这说明用这5个公共因子代表原来14个指标评价银行信贷客户的风险和价值情况有充分的把握。从而可以提取前五个共因子。
3、因子旋转及公共因子经济意义。为得到经济意义更明确的公共因子,对因子载荷矩阵进行旋转,得到新的因子载荷矩阵:
经过正交旋转的公共因子的经济意义比较明确,公共因子1主要反映了净资产收益率、总资产报酬率、销售利润率和总资产周转率四个指标信息,可以称为客户盈利能力因子;公共因子2主要反映了总资产报酬率、应收账款周转率、存货周转率和银行利润贡献率(为正关系)四项指标的信息,可称为客户经营效率和利润贡献因子;公共因子3主要反映了销售增长率和利润增长率两项指标的信息,可称为客户成长力因子;公共因子4主要反映了资产负债率、银行利润贡献率(为负关系)和客户接触成本三项指标的信息,可称为客户贷款成本因子;公共因子5主要反映了速动比率和利息保障倍数两项指标,可称为客户偿息能力因子。
4、因子得分。SPSS有自动计算因子得分矩阵的功能,容易得到各个因子得分;而因子综合得分要按公式(3)来计算,具体形式如下:
客户评价综合因子得分=(37.331×公共因子1得分+16.323×公共因子2得分+9.735x公共因子3得分+8.971×公共因子4得分+6.762x公共因子5得分)/79.122
得出各因子得分后,为了进一步对客户特点做出判断,分别对其进行排序并对比分析,这里把排序结果放在后面结合分类结果一起讨论。同时,综合因子得分为下一步的聚类分析的原始数据,这样构建模型能实现两个维度的统一。
(二)聚类分析
1、分类结果。聚类分析以客户评价综合因子得分为基础,综合考虑建模样本风险和价值的各个要素,采用spss按前面所介绍的方法得到的聚类分析-结果为:在52个样本中,第一类有12个,综合得分分布在-0.8 -0.38之内;第二类有29个,综合得分分布在-0.33至0.15之内;第三类有8个,综合得分分布在0.22至0.85之内;第四类有2个,得分分别为1.39和1.42;第五类只有1个,得分为1.99。
2、各个类别的综合得分。由于采用一维的综合因子得分作为分类的原始数据,根据聚类得分定义可知,各个类别的聚类得分就等于该类内各样本的综合因子得分的算术平均值,容易得到如下结果:第一类的综合得分为-0.57167,第二类的综合得分为一0.08,第三类的综合得分为0.57375,第四类的综合得分为1.405,第五类的综合得分为1.99。矩阵形式为Z=(-0.57167,-0.08,0.57375,1.405,1.99)。
3、各个类别性质的讨论。得出各个类别的综合得分后,完全可以对各个客户分类的风险和价值的综合评价作出判断,标准是得分越高的类别则为优。但不可以具体界定各个类别的明确属性,因为这里的客户分类涉及了风险和价值两个维度,其中不单独考虑某个维度的强弱程度,而是直接作综合判断。因而,这里结合前面所计算的因子得分排序对各个类别的性质作进一步的讨论。
从各个因子得分的升序排名来看,第一类客户分类的盈利能力因子分布在1-17位,经营效率和利润贡献因子、成长力因子、客户贷款成本因子和偿息能力绝大多数分布在35位以下,得分相对最小,属于高风险低收益类型;其他各类可相似的得出结论,依次属于中等风险低收益、中等风险中等收益、中等风险高收益和低风险高收益类型。从而,银行可以从新的维度去采取相应的信贷政策和管理手段。
五、结束语
本文基于因子一聚类分析的方法来研究银行信贷客户分类问题,模型描述部分在于介绍原理,实证部分在于介绍怎样借助现代统计软件来应用。在分析过程中,对于所选取指标并没有做具体的定义或界定,主要是因为这些指标在银行的现行实践中已有明确界定和充分的统计数据,这不影响模型的应用;同时,由于这里主要在于说明思路,对距离定义的选取和系统聚类方法的选取只采取常用形式,没有一一介绍其他的形式,其实其他的形式也是相似的,各银行可根据其实际特点来套用。至于样本数量要求,一般在50个样本以上去建模是比较显著的,而多数银行网点都能达到此要求。实际上,该模型只对银行可以直接获得的量化指标分析,对定性变量没有深入探讨,至于怎样进行定性数据加载和整理有待研究,但作为银行客户初始分类是比较有效的方法。
转载注明来源:https://www.xzbu.com/3/view-1417068.htm