主成分分析法与因子分析法的辨析
来源:用户上传
作者: 易跃明 梁戈夫
【摘要】 主成分分析作为多元统计分析的重要方法之一,可以在不丢失主要信息的情况下简化数据,以解决多指标分析评价中指标数量过多,以及指标之间信息重叠等问题,在财务评价中被很多研究者使用。但大多数研究者在使用主成分分析方法时,经常将主成分分析和因子分析相混淆,笔者通过对主成分分析的原理以及通过SPSS实现主成分分析的介绍,让研究者能够更好的运用主成分分析。
【关键词】 主成分分析;财务诊断;多元统计模型
企业财务诊断起源于美国。二次世界大战之后,随着科学技术的发展和市场竞争,企业为了生存和发展不得不关注自身存在的财务问题,在自身得不到解决的情况下,又不得不求助于社会的管理专家。财务诊断作为企业诊断的重要组成部分,也是企业财务管理的重要环节。财务诊断是一种改进企业财务管理的先进的、科学的方法,它克服了企业财务分析的一般化、公式化等弱点,它是财务分析的深化和发展,而且比财务分析更具有科学性、广泛性和实用性。通过财务诊断,管理者能够找到企业财务管理中存在的问题,为管理决策提供可行性建议。
这方面的研究大体上分为定性和定量分析两个方面。其中的定量研究又主要分为一元分析和多元分析两种。由于单个指标容易被操纵和粉饰,只使用单一变量进行判别分析时,得出的结论难免有失偏颇。加之不同的指标具有不同的预测能力,同时使用多个单变量模型时,有可能得出不同的结论,尤其是各指标之间出现此大彼小、此高彼低的现象时,使得对企业真实财务状况的判断带来困难。正是由于以上原因,多元分析模型的研究开始兴起。
一、问题提出
主成分分析作为多元统计分析的重要方法之一,利用降维技术在不丢失主要信息的情况下简化数据,以解决多指标分析评价中指标数量过多,以及指标之间信息重叠等问题,因此在财务评价中被很多研究者使用。但大多数研究者在使用主成分分析方法时,经常将主成分分析和因子分析相混淆,通过流行甚广的SPSS软件调用主成分分析结果时,常常误用成因子分析的结果。如《中央财经大学学报》2004年第4期发表的《以主成分分析法构建企业财务危机预警模型》(以下简称《刘文》)就是这种情况。是什么原因造成这些错误呢?
经过仔细分析、比较发现,出错的主要原因在于,有些使用者对主成分分析的原理认识不透彻,对怎样用SPSS软件得出主成分分析结果掌握不全面。主要错误有:一是主成分模型的错误求解;二是错误地对因子载荷矩阵进行旋转;三是错误地将因子得分系数作为主成分模型的系数。
二、主成分分析原理,主成分分析与因子分析的区别,以及主成分分析SPSS实现
(一)主成分分析原理
主成分分析由Pearson(1901)首先使用,以后经Hotelling (1933)、Rao(1964)、Cooley&lohnes(1971)、Gnanadesikan (1977)、
Kshirsagar(1972)、Morrison (1976)和Mardia、Kent&Bibby (1979)
发展和成熟起来。主成分分析旨在利用降维的思想,把多变量转化为少数几个综合变量。主成分分析的原理是,将原来的P个变量做线性变化,转化为P个新变量,新变量之间相互独立,将新变量按方差大小排序,方差越大所包含的原始数据的信息就越多,方差最大者对应的变量称为第一主成分,依次排出第二主成分、第三主成分……
(二)主成分分析和因子分析的比较
首先,主成分分析中不需要有假设,因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。
其次,因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成各个变量的线性组合。在因子分析中,因子个数需要分析者指定,而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。
第三,主成分按模型因变量方差最大化原则来排列主成分,而因子分析是通过模型系数方差最大化来确定因子。主成分分析与因子分析的方差最大化方向不同,直接导致主成分值、因子得分值、综合评价值和应用侧重上不同。
第四,主成分分析和因子分析运用SPSS软件进行分析的过程有所区别,但主成分分析和因子分析很类似,因子分析可以看作是主成分分析的推广和发展,在SPSS实现过程中,主成分分析的结果常常通过初始因子分析的结果推算。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。
不过,在因子分析中所采用的协方差矩阵的对角元素不再是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。因子分析可以使用旋转技术帮助解释因子,因子分析中因子不是唯一的,可以通过不同的旋转方法得到不同的因子。主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是唯一的。
第五,主成分分析和因子分析在最后的综合评价中,综合评分计算方法的原理是一样的,但由于因子分析对因子载荷矩阵做了旋转,同一组样本数据用两种不同方法计算的特征值和提取的因子和主成分不一样,各部分的影响权重不同,可能会造成最终评价结果的差异。
(三)主成分分析的SPSS实现步骤
1.原始指标数据的标准化采集p维随机向量n 个样品,n>p,构造样本阵,对样本阵元进行标准化变换,得标准化阵Z。 (一般由计算机自动完成)
2.在“Analyze”菜单中选择“Data Reduction…factor”,把变量选入“variables”栏。
3.“Extraction”按钮:选择主成分法为系数矩阵计算方法,确定以相关系数阵(Correlation Matrix)为分析对象。
4.确定主成分个数m, 根据SPSS软件中表“Total Variance Explained(总方差解释)”的主成分方差累计贡献率≥85%,结合表“Component Matrix(初始因子载荷阵)” 中变量不出现丢失确定提取的主成分个数m。
5.主成分Fi表达式:将SPSS软件中表“Component Matrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分Fi的变量系数向量(在“transform→compute”中进行计算),由此写出主成分Fi表达式。
F1=μ11Z1+μ12Z2+L+μ1pZp
F2=μ21Z1+μ22Z2+L+μ2pZp
L
Fp=μp1Z1+μp2Z2+L+μppZp
6.主成分Fi命名,用SPSS软件中表“Component Matrix”中的第i列中系数绝对值大的对应变量对Fi命名(有时命名清晰性低)。
7.主成分与综合主成分(评价)值。
综合主成分(评价)公式:
三、《刘文》正确的主成分分析
《刘文》的财务诊断方法主要是,将选取的样本分成估计样本和测试样本两部分,其中。对估计样本分ST和非ST两类样本公司运用主成分分析建立主成分模型,计算综合评分,并分别做区间估计,将测试样本的财务数据带入前模型,计算综合评分,并以前面所做的区间估计来判断其财务状况。《刘文》中50组估计样本的ST公司置信上限为:-0.225,非ST公司置信下限为:0.215。对32组预测样本的财务比率指标进行标准化处理后,计算其综合评价值进行判别,结果在ST公司中,有六家公司判断失误,误判率为18.75%;在非ST公司中,有三家公司判断失误,误判率为9.37%。
经过仔细验算,发现《刘文》在分析中将SPSS的因子分析结果当成了主成分分析结果,将因子分析的初始载荷系数阵错用成主成分模型系数。为便于比较,下文中将正确主成分分析提取的主成分记作Fi',正确主成分分析计算的综合评价值记作:F综合',《刘文》中计算的综合评价值记作:F综合。
由于主成分分析无旋转过程,在SPSS实现中称其为初始因子分析。笔者根据《刘文》给出的SPSS软件分析结果表1、表2,按“Component Matrix”中的第i列向量除以第i个特征根的开根计算第i个主成分变量系数向量,得表3。
主成分模型表示为:
F1'=0.448Z1+0.341Z2+0.129Z3-0.025Z4+0.515Z5+0.484Z6+0.166Z7
+0.242Z8+0.283Z9
F2'=0.426Z1+0.553Z2+0.114Z3-0.114Z4-0.355Z5-0.382Z6-0.296Z7
+0.302Z8-0.188Z9
F3'=0.028Z1+0.23Z2+0.569Z3+0.449Z4+0.072Z5+0.043Z6+0.121Z7
-0.494Z8-0.393Z9
F4'=-0.103Z1+0.439Z2-0.409Z3+0.418Z4-0.163Z5-0.299Z6
+0.236Z7+0.406Z8+0.511Z9
F5'=-0.01Z1+0.033Z2-0.399Z3+0.734Z4+0.118Z5+0.12Z6
-0.494Z7+0.161Z8-0.042Z9
F6'=0.099Z1+0.134Z2-0.448Z3+0.236Z4-0.152Z5-0.055Z6+0.752Z7
+0.169Z8-0.309Z9
F7'=-0.206Z1-0.26Z2+0.295Z3-0.096Z4+0.133Z5+0.209Z6
-0.061Z7+0.615Z8-0.592Z9
与《刘文》的主成分分析模型比较,第一主成分得分值为原模型的1.59分之一,第二主成分的得分为原模型的1.16分之一,第三主成分得分为原模型的1.05分之一,第四主成分得分为原模型的1.01分之一,第五主成分得分为原模型的1.01倍,第六主成分得分为原模型的1.06倍,第七主成分得分为原模型的1.26倍。各主成分的影响权重发生了变化,正确主成分分析的综合评价得分与《刘文》中的综合评价得分相比;
F综合'- F综合=-0.59α1F1'-0.16α2F2'-0.05α3F3'-0.01α4F4'
+0.01α5F5'+0.06α6F6'+0.21α7F7'
=-0.1652F1'-0.024F2'-0.007F3'-0.001F4'+0.001F5'
+0.006F6'+0.015F7'
≈-0.1652F1'
根据上式,第一主成分绝对值大的企业受影响大,绝对值小的企业受影响小。第一主成分F'1主要由现金比率、主营业务利润率、BEP指标解释,故第一主成分表示的是企业的短期偿债能力、主营业务盈利能力和资产盈利能力。
《刘文》中对公司财务状况分ST和非ST 两类进行评价,证券交易所股票上市规则明确了上市公司出现以下情况之一的,为财务状况异常(会被特别处理为ST)。主要情况为:最近两个会计年度审计结果显示的净利润均为负值;最近一个会计年度审计结果显示其股东权益低于注册资本,即每股净资产低于股票面值;注册会计师对最近一个会计年度的财务报告出具无法表示意见或否定意见的审计报告;连续两个会计年度亏损;中国证监会或证券交易所认定为状况异常的其他情形。按规则分析通常ST公司的短期偿债能力、主营业务盈利能力和资产盈利能力相对较差,F'1值大多为负,所以,短期偿债能力、主营业务盈利能力和资产盈利能力弱的ST企业,在正确分析后综合评分会增加。非ST公司的短期偿债能力、主营业务盈利能力和资产盈利能力较强,F'1值大多为正,所以,短期偿债能力、主营业务盈利能力和资产盈利能力强的非ST企业,在正确分析后,综合评分会降低。换言之,重新计算后,样本公司的综合得分更集中了,综合得分的波动缩小了。
《刘文》中诊断出现误判是因为测试样本中ST公司综合评分值超过上限-0.225,非ST公司的综合评分值低于下限0.215。正确进行主成分分析后,由于ST公司的综合评分增加,而使得计算的置信上限右移,比原上限-0.225大;非ST公司由于综合评分减少,而使得计算的置信下限左移,比原下限0.215要小。由此可见,正确进行主成分分析后,误判率会降低。
四、结论
因子分析和主成分分析是常用的多元统计分析方法,它们都具有降维的功效,可以在不丢失主要信息的情况下简化数据,所以在多指标综合评价中用来简化指标,同时对筛选出来的指标赋权,因此在很多财务分析评价中常常被用到。但在使用主成分分析方法时,许多研究者很少注意或者没有意识到两者的差别,所以有时会分不清楚自己使用的到底是什么方法。在运用SPSS软件进行数据处理时,往往分不清因子分析和主成分分析,常常将因子分析的结果误用为主成分的结果。
通过本文的研究,发现将因子分析的结果误用为主成分分析的结果时,最后的综合评价值的离散程度会加大,从而导致分类评价中判断误差的增大。因此在运用主成分分析时,要从原理上将主成分分析与因子分析区分清楚,在运用SPSS进行数据处理时,会正确区分主成分分析的结果和因子分析的结果。因子分析可以直接从SPSS软件的数据处理中得出分析结果,包括从因子得分矩阵得出因子分析模型,以及软件可以将提取的因子作为变量保存,并计算各因子得分。主成分模型的系数不能直接从SPSS中运行得到,而只能得到因子载荷,我们可将初始因子载荷系数(注意,非旋转后的因子载荷系数)除以相应因子的特征根的平方根,以求出主成分模型的系数,按模型手工计算主成分得分,最后再进行综合评价。
总之,主成分分析作为主要的多元统计分析方法,在很多方面都有非常广泛的运用,在运用主成分分析方法时,除了要将主成分分析和因子分析区分清楚,还要注意主成分分析常常是作为一种探索性的技术,在分析者进行多元数据分析之前使用,以便让自己对数据有一个大致的了解。主成分分析一般和判别分析、回归分析一起结合使用,它能解决回归分析中共线性的问题,以达到提高回归分析预测精度的效果。●
【参考文献】
[1] 林海明,张文霖.主成分分析与因子分析的异同和SPSS软件[J].统计研究,2005(3):65-69.
[2] 刘红霞,张心林.以主成分分析法构建企业财务危机预警模型[J].中央财经大学学报,2004(4):70-75.
[3] 张爱民,祝春山,许丹健.上市公司财务失败的主成分预测模型及其实证研究[J].金融研究,2001(3):10-25.
[4] 王钊.主成分分析法在财务预警中运用的实证研究[J].财会通讯,2006(12):63-64.
[5] 王文博,陈秀芝.多指标综合评价中主成分分析和因子分析方法的比较[J].统计与信息论坛,2006(5):19-22.
[6] 刘令,毛定祥.因子今析方法在上市公司综合财务分析与评价中的应用[J].系统工程,1997(6):11-16.
[7] 张淑香.基于主成分分析法的上市公司财务评价[J].山西焦煤科技,2009(6):37-43.
[8] 尹子民,王春蕊.基于因子分析建立上市公司财务战略模型[J].中国管理信息化,2008(3):64-67.
[9]王斌.我国上市公司多维财务指标的因子分析[J].中国管理信息化,2009(6):36-39.
[10] 徐凤菊.企业财务评价指标体系的改进[J].中南财经大学学报,1999(4):112-113.
[11] 夏新平,宋光耀.财务评价模型的集成分析方法[J].华中理工大学学报・社会科学版,1999(1):90-93.
转载注明来源:https://www.xzbu.com/3/view-769696.htm