您好, 访客   登录/注册

基于LS-SVM的IT企业信用评估研究

来源:用户上传      作者:冯璐 周勇

  摘 要:建IT企业信用评价模型,采用LS-SVM方法对企业风险进行量化研究.研究结果表明,LS-SVM可以刻画IT企业违约与否的线性特征,并可将二次规划问题转化为线性规划问题,降低计算的复杂程度,是企业信用评级的有效工具.
  关键词:LS-SVM;信用评估;信用风险;IT企业
  [ 中图分类号 ]F275.5 [ 文献标志码 ] A
  
  Research on IT Enterprise Credit Evaluation based on LS-SVM
  FENG Lu,ZHOU Yong
  (College of Xinjiang University of Finance and Economics Statistics and data sciences,Urumqi 830012,China)
  Abstract:This paper constructs the credit evaluation model of IT enterprise,and uses LS-SVM method to quantify the enterprise risk.The results show that LS-SVM can characterize the linear feature of default or non-default,and can transform quadratic programming problem into linear programming problem,reduce the complexity of calculation,and is an effective tool for enterprise credit rating.
  Key words:least squares support vector machine;credit assessment;credit risk;
  IT enterprise
  国务院于2015年提出的《国务院关于积极推进“互联网+”行动的指导意见》鼓励市场主体利用互联网进行技术创新,由此互联网发展的如火如荼,作为利用互联网发展的代表性行业IT行业也进入了高速发展时期.IT行业不仅是新业态、新动能的重要体现,也是我国创新发展战略中重要的一环.IT企业的产品多以软件产品为主,其企业的不动产占比较少,财务建设具有滞后性[1],开发项目受客户关系影响较大[2],人力资本需货币激励与非货币激励并重[3-4]等特点,难以被纳入信贷机构现有的信用评级体系,导致IT企业在融资过程中难以得到客观评价的信用评估报告,使得其在直接融资过程中被拒绝,不利于IT企业高质量的发展.信用评估缺失还会使信贷相关行业坏账和呆账的风险增大,信用风险凸显.学者对于IT企业信用评估问题采取的多是logistic算法[5-6],对于IT企业特点来说,其形成的信用评估模型难以满足IT企业信用评估的要求.本文结合LS-SVM算法[7],构建IT企业信用评估模型.
  1 IT企业特征及发展现状
  IT企业即信息技术产业,是运用信息手段和技术,收集、整理、储存、传递信息情报,提供信息服务,并提供相应的信息手段、信息技术等服务的产业.IT企业作为一种特殊的高科技产业,有以下几个基本特点:产品更新周期快,风险较高,收益也较高.IT企业是随着科技的发展而发展起来的新兴产业,现代科技产品为了获得市场的先机与消费者的青睐,更新换代的速度令人咋舌,因此IT企业产品的更新周期也比较快.IT企业的风险来自于前期设备和人才的引用,因而IT企业也属于资本较密集的一种产业.IT企业最核心的竞争力为其所生产的各类科技软件或者产品,这类产品往往综合了IT企业人才的知识转移量,但是在这个过程中,由于产品在市场推进过程中受不确定因素的影响较大,因此风险性较大;其经营领域涉及面较为广泛;经营业务多样,产品多为私人定制类型,业务受客户资源的影响.
  随着科技的发展,数字时代的来临,IT企业数量和质量的提升尤为显著,特别是当代工业互联网的发展,大大促进了IT企业与其他企业的联系,这两类企业融合成了不可分割的整体,呈现出了全新的产业面貌.中国的IT产业发展指数(ITII)由2014年的61.5分提高到2018年的76.3分,由第二梯队末位提升至第二梯队中游水平,并于2018年首次超越英国和韩国位列第四位.2018年中国IT产业发展迅速,在产业结构上优化改进也有了长足的进步,核心竞争力随着产品的优质有了长足的进步,大幅度提升了本土IT企业的创新发展力.随着互联网产业的快速发展以及产业方式的转变,IT产业走上了高速平稳发展的道路,产业融合提升最为显著,融合指数由50.1分升至76.5分,证明我国IT企业核心竞争力得到认可.当前我国IT产业的发展已经形成了品牌效应,走上了国际化发展道路.
  2 IT企业信用评价指标体系及评价模型
  2.1 建立IT企业信用评价体系
  选取锐思金融数据库若干家IT企业的财务信息,从中抽取11个财务指标作为判断企业信用评级的依据.IT企业指标体系见表1.
  2.2 构建IT企业信用评价模型
  将IT企业的信用数据指标作为分类数据点,采用LS-SVM分类器确定一个由这些数据点构成的超平面.如果用[X]表示数据点,用[Y]表示类别([Y]可以取1或者-1,分别代表两个不同的类),一个线性分类器的学习目标便是要在n维的数据空间中找到一个超平面,这个超平面的方程可以表示为:
  [WT×X+B=0]. (1)

nlc202211251449



  式(1)中,[WT]中的[T]代表转置. 在超平面确定的情况下,(1)式表示点[X]距离超平面的远近.通过观察[WT×X+B]的符号与类别标记[Y]的符号是否一致,可判断分类是否正确.用表示类别的[YWT×X+B]的正负性来判定或表示分类的正确性.函数间隔[γ∧]为:
  [γ∧=YWT×X+B=YfX] . (2)
  超平面[(W,B)]是关于[T]中所有样本点[(Xi,Yi)]的函数间隔最小值.其中,[X]是特征,[Y]是结果标签,[i]表示第[i]个样本.超平面[(W,B)]关于训练数据集T的函数间隔为:
  [γ∧=miniγ∧] . (3)
  对法向量[W]加约束条件,引出真正定义点到超平面的距离――几何间隔的概念:
  [X=X0+γ∧×WW] . (4)
  如果令函数间隔[γ∧]等于1,则有[γ∧=1W],目标函数转化成[max1W,s.t.YiWT×X+B≥1].为了求[1W]的最大值,转化为[12W2]的最小值,可以使目标等价为:
  [min12W2,s.t.YiWT×Xi+B≥1,i=1,2……n ]. (5)
  由于这个问题的特殊结构,还可以通过拉格朗日对偶性变换到对偶变量的优化问题,即通过求解与原问题等价的对偶问题得到原始问题的最优解,进而推广到非线性分类问题,因此得到新的函数解析式 :
  [LW,B,a=12W2-i=1nαiYiWT×X+B-1] . (6)
   [θW,B,a=maxαi≥0LW,B,α]. (7)
  (1)让[α]固定,让 [L]关于 [W]和 [B] 最小化.分别对[W]以及[B]求偏导数,并令两者的偏导数等于零.
   [?L?W=0?W=i=1nαiYiXi?L?B=0?i=1nαiYi=0]. (8)
  将得到的结果带入公式(6),可以得到
  [LW,B,a=i=1nαi-12i,j=1nαiαjYiYjXTiXj] . (9)
  (2)求对[α]的极大,即是关于对偶问题的最优化问题.从上面的式子得到:
   [Maxi=1nαi-12i,j=1nαiαjYiYjXTiXjs.t.αi≥0,i=1,2……ni=1nαiYi=0]. (10)
  即可求出[αi].根已有的公式可以得到两个参数[W,B]的值,最终可以得到分类平面和分类决策函数.利用SMO算法求解对偶问题中的拉格朗日乘子[α].为了使模型在线性不可分条件下也可使用,引入松弛变量[ξi],在原来的目标函数后面加上一项,使得总和也要最小:[min12W2+Cξi].其中,C是一个参数,用于控制目标函数中两项之间的权重,得到的目标函数:

nlc202211251449



  [Maxi=1nαi-12i,j=1nαiαjYiYjXTiXjs.t.0≤αi≤C,i=1,2……ni=1nαiYi=0]. (11)
  将IT行业的财务数据作为数据点带入 X中,将企业是否违约得到分类类别[Y]带入到公式(11)中对参数 [α]求解,将结果代入公式(6)中,即可得到分类平面中两个参数,从而完成对分类平面的求解.
  3 IT企业LS-SVM模型描述及实证分析
  3.1 数据预处理描述性统计分析
  根据从锐思金融数据库收集到的财务指标信息,计算出若干家IT企业11个指标的平均值及方差,见表2.从该表中可以看到,IT企业的流动比率较高,符合流动资产较多的事实;IT企业流动资产率也处于较高的水平,解释了其与其他行业企业的不同之处.
  3.2 支持向量机计算结果与分析
  使用matlab软件将数据设定种子得到80%的训练集和20%的测试集,用训练集分类预测,对测试集的准确性进行评估,衡量测试集的准确率.
  用confusionmat函数直接产生混淆矩阵,用混淆矩阵的每一列代表预测类别,行表示真实归属类别、预测违约和不违约类别下的企业数目.图1为可信企业识别率和违约企业识别率.从图1中可以看出,LS-SVM模型可以较好地拟合企业识别率曲线图.
  3.3 绘制ROC曲线
  AUC等于1时为最理想的检查指标.从图2可知,AUC值为0.774 04,ROC图的含义是将可信企业判定为可信企业的概率大于可信企业判定为违约企业的概率作为1,并依次累加,最终除以可信与违约企业的总数,说明得到的超平面可以比较准确地反映出分类的情况.
  4 结 论
  构建了一个基于LS-SVM的IT企业二分类平面评价模型,用于企业信用评级,确定企业信用等级.实证结果表明,构建的二分类模型可以较好地对客户的财务信息予以区分,达到了较好的分类效果.该模型可以适用于IT行业信用等级的划分,为IT行业信用等级提供较好的参考.
  参考文献
  [1]邓超.大数据时代下IT企业财务管理的新发展[J].中国市场,2021(33):195-196.
  [2]欧阳泉.基于战略角度的IT企业项目管理系统的构建[J].科技创新导报,2020,17(18):125-126.
  [3]李正卫,戴丽华,王飞绒,郭东杰.领导积极幽默如何影响员工创造力:来自浙江IT企业的实证研究[J].浙江大学学报:人文社会科学版,2021,51(05):183-196.
  [4]盛婷婷.IT企I人才流失问题研究――以D公司为例[J].中外企业家,2019(20):84.
  [5]王飞,赵文英,董莹.改进的Logistic模型在中国城镇化水平预测中的应用[J].牡丹江师范学院学报:自然科学版,2022,(01):13-15.
  [6]宋大华,宋大全,章慧鸣.Logistic方程混沌周期点与精度研究[J].牡丹江师范学院学报:自然科学版,2020(01):22-26.
  [7]Suykens J A K,Vandewalle J.Least squares support vector machine classifiers[J].Neural processing letters,1999,9(3): 293-300.
  编辑:琳莉

nlc202211251449




转载注明来源:https://www.xzbu.com/1/view-15442555.htm

相关文章