基于决策树的供应链金融模式信用风险评估
来源:用户上传
作者:
内容提要:供应链金融作为一个全新的金融服务模式,在有效解决中小企业融资难和供应链失衡问题的同时,促进商业银行核心竞争力的提升,是对传统中小企业信贷模式的重大突破,其运行需要一套能重新审定中小企业信贷风险的有效方法来与之配套。因此,本文结合供应链金融的特点,建立基于决策树的供应链金融模式信用风险评估体系,对商业银行从供应链角度评估小企业信用有所帮助。
关键词:供应链金融 小企业 决策树 信用评估
中图分类号: F120.4 文献标识码: A 文章编号:1006-1770(2010)04-038-04
一、引言
作为国际产业组织主流模式的供应链生产模式正在逐渐取代纵向一体化生产模式。但该模式在提升企业效率、节约企业成本的同时,深受处在供应链上游或下游的中小企业资金瓶颈带来的“木桶短边”效应的影响。渐次浮出水面的供应链金融,能有效缓解中小企业融资压力,降低供应链整体融资成本,成为一项令人瞩目的金融创新。
融资难一直是制约中小企业发展的主要瓶颈。我国中小企业由于自身信用基础较差、财务信息的透明度较低、可抵押资产少、法律法规体系不健全、政府扶持体系和社会促进体系还未真正建立等原因,很难得到银行的授信。而供应链金融模式则较好地解决了这一问题。供应链金融最大的特点就是以供应链中的大核心企业为出发点,为供应链提供金融支持。一方面,将资金有效注入处于相对弱势的上下游配套中小企业,解决中小企业融资难和供应链失衡的问题;另一方面,将银行信用融入上下游企业的购销行为,增强其商业信用,促进中小企业与核心企业长期战略协同关系的建立,提升供应链的竞争能力。
所谓供应链金融(Supply-Chain-Finance,SCF),是银行面向物流行业的运营过程,围绕核心企业,管理上下游中小企业的资金流和物流,变把握单个企业的不可控风险为供应链企业整体的可控风险,通过立体获取各类信息的方法,将风险控制在最低的金融服务。简单地说,就是银行将核心企业和上下游企业联系在一起,联合提供灵活的金融产品和服务的一种融资模式。供应链金融并非某一单一的业务或产品,它改变了过去银行等金融机构对单一企业主体的授信模式,围绕某“1”家核心企业,从原材料采购到制成中间产品及最终产品,最后由销售网络把产品送到消费者手中这一供应链链条,将供应商、制造商、分销商、零售商直到最终用户连成一个整体,全方位地为链条上的“N”个企业提供融资服务,通过相关企业的职能分工与合作,实现整个供应链的不断增值。因此,它也被称为“1+N”模式 。
供应链金融作为一个全新的金融服务模式,能够为商业银行的战略结构调整及核心竞争力的提升奠定基础,有助于构筑商业银行、企业和商品供应链互利共存、持续发展的产业生态,具有保证资金运行相对安全、提升资金运行效率、培养优质客户等强大的经营优势。这种崭新业务模式是对传统中小企业信贷模式的重大突破,需要一套有效的方法来配合重新审定中小企业的信贷风险。因此,本文在对现有中小企业评级模型和供应链金融模式研究的基础上,结合数据挖掘中的决策树技术,建立基于决策树的供应链金融模式信用评估体系,供商业银行对中小企业的信贷决策参考。
二、决策树
决策树方法是数据挖掘及数据分析中广泛应用的技术,是一种对海量数据集进行分类的非常有效方法,具有清晰直观、易于解释的优点。通过构造决策树模型,提取有价值的分类规则,帮助决策者做出准确的预测已经在很多领域得到应用。
所谓数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量、不完全、有噪声、模糊、随机的数据中获取有效、新颖、潜在有用、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”隐含在其中的潜在有用的信息和知识的过程。在商业上,特指按照既定的业务目标对大量的企业数据进行探索,揭示其中的规律性并进一步将之模型化的先进、有效的方法。
决策树的基本思想是把训练集按一定的分割原则一分为二,两个子集按分割原则再一分为二,如此重复,直到合适的程度,最后的子集称为叶子,叶子被整体地认为属于同一信用级别。对一个待评估的申请者,根据其信用指标从决策树的根节点沿着某个分枝往下走,最后到达哪个叶子节点,则该叶子节点的类别就为该申请者的类别。建立决策树的关键问题是:分割方法;分割程度,即何时子集可以认为是叶子;叶子的信用级别。图1是一个典型的例子:
如上所示决策树是一个类似于流程图的树结构,其中,每个内部节点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表类或类分布。应用决策树对未知的样本进行分类,在决策树上测试样本的属性值。路径由根到存放该样本预测的叶节点。
三、基于决策树的供应链金融模式信用风险评估备选指标集的构建
(一)备选指标的选取原则
备选指标的选取对于评估结果至关重要。本文在选取供应链金融模式信用风险评估备选指标时,结合供应链金融模式本身的特点及我国中小企业的特点及风险特征,以简便、实用为目的,主要遵循如下原则:
1.突出供应链模式本身的特点。对于“1+N”模式的供应链,商业银行提供金融服务的关键在于寻找一个大的核心企业,以核心企业为出发点,为供应链提供金融支持。供应链金融创新亮点在于抓住大型优质企业稳定的供应链,围绕供应链上下游经营规范、资信良好、有稳定销售渠道和回款资金来源的企业进行产品设计,借助大型核心企业对中小供应商的深入了解,选择资质良好的上下游企业作为商业银行的融资对象。其核心是从整个产业链角度开展综合授信,并将针对单个企业的风险管理变为产业链风险管理。所以对中小企业信用的评定应不局限于对中小企业本身进行,更多的是从供应链角度出发,分析该贷款企业和核心企业的业务关系。
2.弱化对财务指标的依赖。由于我国中小企业大多未上市,财务报表不同于大型企业,未经审计,一般来说, 中小企业提供的各种信息可信度较差,尤其是企业的财务数据, 对工商、税务、海关、商业银行等部门提供的财务报表往往不一致, 有时和真实情况差别较大。大多无法真实反映企业的财务状况。因此,本文在选取指标时尽量减少财务数据的使用。
3.增加对中小企业经营主责任人的考察。与大企业相比,中小企业的企业主对企业的经营与发展起着至关重要的作用,同大企业相比小企业的信用状况更加依赖于经营者的素质和资信,主要经营者对企业的发展起关键作用,因此本文在选取指标时更加注重经营者的素质和资信及企业的发展潜力 。
(二)备选指标集的构建
根据备选指标的选取原则,确定如下备选指标集:
四、基于决策树的供应链金融模式信用风险评估模型的构建
将决策树预测应用于供应链金融模式信用评估问题中,基本思路是:根据已知的样本与原始信用评价状态,运用决策树发现贷款人信用状态与其某些特征属性之间的关系,进而通过对小企业这些属性的具体观察值,对其信用状况进行预测。
(一)信息增益的计算
在树的每个节点上使用信息增益度量选择测试属性,这种度量称为属性选择度量或分裂的优良性度量。选择具有最高信息增益的属性作为当前节点的测试属性。该属性是给定集合中具有最高区分度的属性。这种信息理论方法使得对一个对象分类所需的期望测试数目达到最小,并确保找到一棵简单的树。
S表示整个训练样本全集,共有s个样本。
A表示属性,A={a1, a2,…,av },Saj表示它们在A上具有值aj的样本数。
C表示类别,C={C1 , C2 ,…, CM },Si 为训练样本类别为Ci的样本数。
可用属性A将S划分为v个子集{S1 ,S2 ,…., Sv},Sij 是Sj 中类Ci 的样本数。
X表示数据样本,由一个n维特征向量,X={x1 ,x2 ,…,xm }来描述其n个属性(A1 ,A2 ,…,Am )的具体取值。
P表示概率值,pi是任意样本属于Ci 的概率,pi=si /s。pij 表示Sj中的样本属于类Ci的概率,pij=sij /saj 。
(1)
(2)
(3)
得Gain(A)=I-E(A) (4)
采用决策树算法计算每个属性的信息增益,将具有最高信息增益的属性选作给定集合S 的测试属性,创建一个节点,并以该属性标记,对属性的每个取值创建分枝,并根据该节点属性的每个取值划分样本。
在实际情况中,将“逾期天数”>90天(即拖欠银行90天以上的本金及利息)的记录标识为“高风险贷款”;将60天<“逾期天数”<=90天(即拖欠银行60天到90天的本金及利息)的记录标识为“中等风险贷款”;将30天<“逾期天数”<=60天(即拖欠银行30天到60天的本金及利息)的记录标识为“较低风险贷款”;将“逾期天数”<=30天(即拖欠银行30天以下的本金及利息)的记录标识为“低风险贷款”。即相对应把小企业客户的信用划分为4 个类{ C1 =“高风险”, C2 =“中等风险”, C3=“较低风险”, C4=“低风险”},抽取预处理后的4000份原始记录,4 个类分别有213、457、2478、852 条记录。使用公式(1)-(4)计算每个属性的信息增益。
以属性“核心企业信用等级”为例,计算该属性的信息增益:
将训练样本数据求出 S i(i=1,2,3 ,4),Saj(j=1,2,3,4),Sij (i=1,2,3,4, j=1,2,3,4),如表所示:
I=1.4861
得E(核心企业信用等级)=1.3402
得Gain(核心企业信用等级)=0.1459
同理得出Gain(核心企业行业地位)=0.1321,Gain(盈利能力)=0.1009,Gain(偿债能力)=0.1386,Gain(行业环境)=0.0907,Gain(行业增长性)=0.0602,Gain(交易时间)=0.1431,Gain(交易频率)=0.1302,Gain(与核心企业合作关系)=0.1404,Gain(价格稳定性)=0.1103,Gain(变现能力)=0.1256,Gain(易损坏程度)=0.1423,Gain(应收账款平均账期长短)=0.0987,Gain(购买方退货情况)=0.0823,Gain(应收账款坏账率)=0.0789,Gain(管理层的道德品质及社会声誉)=0.0968,Gain(管理层的信用水平)=0.1258,Gain(管理者的能力)=0.0605,Gain(经营者从事管理年限长短)=0.0021,Gain(总资产周转水平)=0.0056,Gain(净资产收益水平)= 0.0098,Gain(总资产增长水平)=0.0203。
属性的信息增益代表该属性对分类的贡献大小,其含义是从每个属性“获得的信息量”,各个属性的重要程度可以通过信息增益得到。
在此,通过建立一个函数,能够得到各个属性的影响决策权重。函数关系中的因变量为各个属性对决策的影响程度,影响程度越大,y值就越大,自变量为影响供应链小企业信用状况的属性的信息增益。为方便衡量,把y的值映射到0-100之间,同样,相应的各属性的信息增益取值也映射到0-100 之间。即:
其中,c1 为核心企业信用等级的信息增益;c2为核心企业行业地位的信息增益;c3为盈利能力的信息增益;c4为偿债能力的信息增益;c5为行业环境的信息增益;c6为行业增长性的信息增益;c7为交易时间的信息增益;c8为交易频率的信息增益;c9为与核心企业合作关系的信息增益;c10为价格稳定性的信息增益;c11为变现能力的信息增益; c12为易损坏程度的信息增益;c13为应收账款平均账期长短的信息增益;c14为购买方退货情况的信息增益;c15为应收账款坏账率的信息增益;c16为管理层的道德品质及社会声誉的信息增益;c17为管理层的信用水平的信息增益;c18为管理者的能力的信息增益;c19为经营者从事管理年限长短的信息增益; c20为总资产周转水平的信息增益; c21为净资产收益水平的信息增益;c22为总资产增长水平的信息增益。解此方程组得Y={7,6,4,6,4,2,7,6,6,5,6,6,4,4,3,4,6,2,0,0,0,0},为各个属性影响决策程度值。
通过以上的信息增益计算方法,得到了决策树第一层各属性的信息增益,选择本层信息增益值最大的属性作为决策树的根节点,即“核心企业信用等级”这个属性作为根节点。
(二)基于决策树的信用风险预测评估模型
选择根节点后,根据根节点属性的取值,将整体样本分为不同组,对于每个组,再循环如上介绍的信息增益值计算过程,选取决策树第二层的节点,如此循环,依次计算各层剩余属性的信息增益,获得决策树各层的结点。
上述计算各个属性影响决策的程度值,描述的是该属性在决策中的重要程度,也就是得到了第一层次的属性对决策的影响权重。第二层次的影响权重就是要计算属性的各个取值对决策的影响权重。
求解属性的各个取值对决策的影响程度的根本思想是,首先将整体样本按照因变量的分类,即按照高风险、中等风险、较低风险、低风险分成四类,然后分别求解四个分类出现不良贷款的比例。将这个比例作为对应每个属性取值中四类客户数的权重,将权重与客户数相乘,再除以对应这个属性的客户总数,得到该属性该取值对决策的影响权重。某个属性的某取值对决策的影响权重公式如下:
变量xi1 ,xi2 ,xi3 ,xi4 分别代表“高风险”、“中等风险”、“较低风险”、“低风险”在决策树中某个属性取值为i时的客户数;w1 ,w2 ,w3 ,w4 代表上述四个分类出现不良贷款的比例。
计算出了属个属性的某取值对决策的影响权重,在结合各个属性的影响决策权重,就可以确定最终的权重系数。
五、结论
本文在借鉴大量有关国内外中小企业信用评级以及供应链绩效评价相关资料的基础上,针对供应链金融的自身特点,构建出基于决策树的供应链金融模式下中小企业信用评级模型。一方面有效解决中小企业融资难和供应链失衡问题的同时,促进商业银行的核心竞争力的提升;另一方面也为银行评价中小企业的信用风险提供了有效解决方法,真正地做到对供应链上小企业客户进行客观的评价,从而达到加强信贷能力减少不良贷款产生的目的。
参考文献:
1.胡跃飞,黄少卿. 供应链金融:背景、创新与概念界定.信用风险模型综述[J].财经问题研究.2009年.第8期.76-82
2. Hartley― Urquhart,Roland .Managing the Finance Supply Chain[J].Supply Chain Management Review.2006.9
3.蒋秀英. 数据挖掘技术的应用研究[J].《商场现代化》.2008年.第10期
4. JIAWEI HAN MICHELINE KAMBER.范明,孟小峰.数据挖掘概念与技术[M].第2版.机械工业出版社.2007-3-1
5.韩慧,毛锋,王文渊.数据挖掘中决策树算法的最新进展[J].计算机应用研究.2004年.第12期
6.康书生,鲍静海,史娜,李纯杰. 中小企业信用评级模型的构建[J].河北大学.2007.2.26-33
作者简介:
王 琪 中国建设银行风险管理部
转载注明来源:https://www.xzbu.com/3/view-1407454.htm