您好, 访客   登录/注册

基于BP神经网络的P2P信贷个人信用评价模型研究

来源:用户上传      作者:

  摘 要
  P2P信贷在中国处于起步阶段,该信贷模式拥有众多的优点,但还面临许多问题,尤其是巨大的信贷安全隐患,本文以人人贷网站的用户数据为例,运用BP神经网络来创建个人信用评价模型。在本实验中,针对P2P信贷的特点,运用本文提出的新权值调整方法来提高BP神经网络的训练效率,实验结果表明比传统算法具有更快的收敛速度和更高的识别率。
  【关键词】BP神经网络 P2P信贷 个人信用评价模型
  P2P信贷最早在2005年起源于英国,很快传入到中国,2006年在中国诞生了第一家P2P信贷公司。在中国P2P信贷公司数量增长迅猛,并快速地建立了网络平台。但由于监管和法律法规的滞后性,会给出借人带来极大的经济风险,因此,对P2P信贷的个人信用评估模型的研究是极其重要的。P2P信贷个人信用评估模型可以帮助出借方衡量贷款方的信用等级,得出的评估等级可以作为是否出借的重要指标之一。
  2011年面向银行业机构,中国银行业监督管理委员会发布“人人贷”风险提示,提示中说明P2P信贷服务存在大量的潜在风险,对银行业、金融机构提出要求,需要采取有效措施,做好风险预警。因此,在P2P实践中,对贷款人的信用做出真实、客观的评价具有极为重要的现实意义。
  1 研究综述
  在我国,P2P信贷处于起步阶段,对P2P个人信用评价问题的研究为数不多,还没有引起国内学者的足够关注。从现有的文献来看,在传统金融领域,姜明辉、袁旭川在神经网络个人信用评估模型的训练过程中使用粒子群(PSO)算法进行模型的性能优化,实证结果表明,基于PSO算法的神经网络模型较单一BP神经网络模型对于检测样本的分类预测精度更高,且优化后的神经网络模型稳健性与适用性都更好。向晖、杨胜刚提出一种基于多分类器组合的个人信用评估模型,模型综合利用了多元判别分析、logistic回归、神经网络、支持向量机等多种评估模型的结果,采用加权投票的方法进行组合输出结果。该组合模型的测试结果表明,其能有效提高预测精度。
  经过研读传统金融个人信用评估相关文献后发现,传统金融领域比较注重预测精度的提升,而在新兴的P2P信贷领域,每日新增用户量巨大,显然只注重精度的BP神经网络模型已经不适合P2P信贷领域,在P2P信贷迅猛发展的环境下,对P2P信贷网站的个人信用进行精确高效地评价是势在必行的。
  为此,本文采用BP神经网络模型,力求通过应用该模型的原理和方法建立个人信用评价模型,针对P2P信贷的特点,对个人用户的信用做出高效的评价。
  2 基于BP神经网络的评价模型
  2.1 BP神经网络模型的基本原理
  BP神经网络模型是一种用来模拟人们如何接收信息,并对接收的信息进行处理得到输出结果的系统模型。它用“神经元”作为信息处理的最小单元,全部接收到的信息,都经过若干这样的神经元进行处理。一个神经元处理后得到的输出,又作为另外一些神经元的输入以对这些信息进行处理。经过这样的处理机制对信息进行处理后,最终产生输出结果。
  BP神经网络模型引入了信号的正向传播和误差的反向传播机制。在正向传播中,输入层传入的数据,逐一在各隐含层处理,经过多个隐含层的处理后,最终到达输出层,综合得到一个输出结果;如果结果不符合预期,则通过反向传播机制,将得到的结果与期望结果之间的误差作为调整信号进行反向传播,从而对所得到的输入信息的权值进行调整。这样根据误差信号来调整各个隐含层的处理结果,最终得到符合预期的输出结果。这一过程也叫做学习过程。
  2.2 个人信用评价模型
  根据BP神经网络的基本原理,利用BP神经网络模型来进行P2P信贷个人信用评价,其过程可用如下简单的例子来描述。
  假如仅对A、B两名贷款客户进行评价,在最简单的情况下,若仅考虑其工作状况,如果认为“有工作”的客户,其信用为“好”,否则则认为其信用为“坏”。利用人工神经网络模型对其进行评价,输入为客户有无工作两种简单的情形。在这种情形下,神经网络模型产生输出原理极为简单:无论输入客户的工作状况如何,随机输出其信用为“好”或者“坏”;但如果输出结果与实际相应用户的信用好坏有出入,则系统调整产生该输出结果的权值。对大量的训练数据集,经如此学习训练后,如果输出结果的错误率达到可接受的程度,训练过程结束,就可利用训练结果来对未知的客户的信用进行评价。
  BP算法有很多的优点,如推导过程严谨、通用性较强等,这使其在现实中得到广泛应用,但它也存在自身的限制与不足,归纳起来主要有下列问题:收敛速度慢,需要较长的训练时间等等。这些问题,严重制约着BP神经网络模型的实际应用。如何针对实际问题,克服上述缺陷,成为研究中的一个重要问题。因此,本文针对P2P信贷的特点,提出一种新的权值调整公式,以提高传统BP算法的训练效率。
  3 一种基于附加动量法和弹性梯度下降法的权值调整方法
  3.1 附加动量法
  在权值调整这一过程,传统的BP神经网络没有考虑到前一次的权值调整情况,这样会使训练过程发生震荡,很难得到全局最优。为了减小训练过程中的震荡问题,可以通过引入一个动量项来反映权值的积累。BP神经网络权值调整和误差项对权值的梯度与前一次权值调整量都有联系。那么权值调整公式为公式(1)
  ΔW(t+1)=(1-mc)ηδx+mcΔW(t) (1)
  其中ΔW(t)为权值的变化量,t为训练次数,动量系数用mc表示,η为学习速率,δ为误差项,x为输入量,就是误差项对权值的梯度,很明显附加动量法是考虑了权值变化历史对权值调整的影响,其中动量系数mc∈(0,1)。通过引入一个动量项,运用权值调整历史数据来调整权值。
  3.2 弹性梯度下降法
  弹性梯度下降法是由德国的Martin Riedmiller和Heinrich Braun提出来的。权值的调整量跟变化量△t有关,梯度只和权值的调整方向有关。这可有效地改善网络的训练速度。其中权值的调整量的大小与更新值的关系为:   (2)
  则相应的t+1时刻权值调整公式为:
  ΔW(t+1)=ΔW(t)+W(t) (3)
  更新值的调整规则为:
  (4)
  其中,0<β<1<α。
  3.3 一种改进的权值调整方法
  通过进一步的理论和实验分析得出,附加动量法将前一次的调整经验加入到权值的调整过程中来,弹性梯度下降法师考虑的是连续两次的调整方向与权值调整的关系。两种方法都是使用权值调整的历史数据来优化权值的调整,所以笔者将两种方法有机地结合起来,将公式(1)代入公式(2),分情况讨论之后得到公式(5)。本文将附加动量和弹性梯度下降两种方法有机地结合起来,提出了一种新的BP神经网络权值调整方式,如式(5)。其中,t+1时刻的权值的调整公式为:
  (5)
  其中为权值的变化量,t为训练次数,动量系数用mc表示。
  当迭代梯度方向相同,则权值的更新值增加,并且权值的调整方向不变。更新值的调整公式为:
  α×(1-mc)×Δ(t-1)+mc×Δ(t-1) (6)
  其中,mc∈(0,1)。
  当迭代梯度方向相反,则权值的更新值增加,并且权值的调整方向不变。更新值的调整公式为:
  (7)
  其中,0<β<1,。
  4 实验分析
  4.1 实验数据预处理
  本文数据来源于人人贷(http://www.renrendai.com),获取了1376条信用记录,剔除无效记录后,得到990条信用记录,每条信用记录包括12个评价指标,和1个信用状况指标,在990条信用记录中,随机抽取了690条作为训练样本集,剩下的300天作为测试样本集。690个训练样本集采用分层抽样的方法选取,通过归一化处理将网络的输入数据限制在[-1,1]区间内。
  4.2 实验结果
  根据图1所示,传统的BP网络学习过程中存在训练过程前期大幅震荡的问题,在迭代254次之后达到预设精度。改进的BP神经网络在训练过程中存在小幅震荡,在69次迭代之后达到预设精度
  根据表1、2可以看出,第一类错判率是将好客户错判成坏客户的比率,第二类错判率是指将坏客户错判为好客户的比率。不难理解第二类错判对银行造成的损失会比较大。
  训练样本中第二类错判率比第一类错判率要高,但在对测试样本的分类中,第二类错判率都比第一类错判率要低,分析原因可能是好客户类型数据比较多,信息比较杂,导致其训练样本中噪声数据也比较多,所以神经网络对测试样本中好客户的判别率也相对较低。
  实验结果表明改进的BP神经网络相比于传统BP神经网络在训练效率上提高明显;在预测精度上也有所提高;改善了传统BP神经网络的收敛缓慢和训练过程精度大幅震荡的问题。
  5 结论
  P2P信贷是民间借贷业务中风险很大的品种,极容易发生违约风险。利用BP神经网络的非线性处理能力和模式识别能力,通过对已有网站借贷数据的学习,可生成具有预测能力的个人信用评价模型。本文针对P2P信贷用户数量和每日新增用户都很巨大的特点,利用本文提出的权值学习方法改进的BP神经网络对用户数据进行预测,实验结果表明,利用本文提出的改进的权值调整方法比传统方法具有更快的收敛速度和更高的正确率。
  参考文献
  [1]朱毅峰,孙亚南,精炼决策树模型在个人信用评估中的应用[J].统计教育,2008 (01):5-7.
  作者单位
  云南财经大学信息学院 云南省昆明市 650221
转载注明来源:https://www.xzbu.com/1/view-11778383.htm