您好, 访客   登录/注册

因子分析法在县域经济发展水平综合评价中的应用

来源:用户上传      作者: 孔令强 王光玲

   [摘要] 本文介绍了因子分析法的基本原理和主要步骤,并成功应用因子分析法对江苏省52个县进行了经济发展水平综合分析与评价,克服了传统多指标综合评价方法在处理指标高度相关和权重设置方面存在的缺陷。
  [关键词] 因子分析;县域经济;综合评价
  [中图分类号] F127[文献标识码] A[文章编号] 1006-5024(2006)08-0128-03
  [作者简介] 孔令强,河海大学商学院博士研究生,研究方向为技术经济和管理;
   王光玲,济南大学管理学院副教授,河海大学商学院博士研究生,研究方向为技术经济和管理。(江苏 南京 210098)
  
  为了全面、客观、系统地评价和分析地区之间经济发展水平,往往需要采用多指标综合评价方法。而传统的多指标综合评价方法具有以下两个问题:(1)传统方法对于指标权重的设置往往带有一定的主观随意性。使用Delphi法或AHP法虽然相对比较科学,但是在专家组成员的选择、专家数的多少以及专家打分等方面仍然存在主观干扰因素。(2)多指标大样本无疑可以为综合评价提供丰富的信息,但在一定程度上也增加了评价工作的复杂性。每一个指标都在不同的角度和层面反映评价目标的某一信息,而各个指标之间往往存在一定的相关关系,反映的信息将产生重叠,导致统计分析失真。而因子分析法则能有效地克服多指标综合评价方法所存在的问题,对地区间的经济发展水平做出科学的评价。本文拟就江苏省52个县(包括县级市)为例,介绍因子分析法在县域经济发展水平综合评价中的应用。
  
  一、因子分析法的基本原理
  
  因子分析(Factor Analysis)是近些年来颇为流行的多元变量统计方法。它是用较少个数的公共因子的线性函数和特定因子之和来表达原来观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。当这几个公共因子(或综合因子)的累计方差和(即贡献率)达到85%或95%以上时,就说明这几个公共因子集中反映了研究问题的大部分信息,而彼此之间又不相关,信息不重叠。因子分析法的应用主要有两个方面:(1)寻求基本结构,简化观测系统,减少变量维数;(2)对指标或样本进行分类。
  因子分析的一般模型为:
  其中,x1,x2,…,xm为实测变量;αij(i=1,2,…,m,j=1,2,…,n)为因子荷载,即实测变量xi与公共因子Fj的相关系数,反映了实测变量xi对公共因子Fj的依赖程度和实测变量在公共因子FJ上的重要性;Fj(j=1,2,…,n)为公共因子;εi(i=1,2,…,m)为特殊因子。
  
  二、因子分析法的主要步骤
  
  1.根据数据源建立指标体系;
  2.根据公式x*ij=(xij-xj)/σji=1,2,…,m 其中xj=∑xij,σ2j=(xij-xj)2,对指标向量的数据进行标准化处理,组成矩阵X;
  3.计算样本相关矩阵R,
  因子分析适宜性检验;
  4.计算相关矩阵的特征值λi和特征向量αi,i=1,2,…,n;
  5.确定公共因子个数k,称为第k个公共因子的方差贡献率,记为βk,称为前k个公共因子的累计方差贡献率。选取公共因子的原则是:当前k个公共因子的累计方差贡献率超过85%或95%时,取前k个公共因子代替原来的m个指标
  6.求因子载荷αi= ,计算因子载荷矩阵A
  7. 为了使提取的公共因子更易于解释和具有命名清晰性,对矩阵A进行最大方差旋转(Varimax),得矩阵B,再计算各公共因子得分,Fi=αixi=1,2,…,k;
  8.按因子得分Fi及方差贡献率的大小,计算综合得分F=β1F1+β2F2+…+βkFk,再根据综合得分进行排序。
  
  三、县域经济发展水平综合评价案例分析
  
  本文以江苏省所辖52个县(包括县级市)为样本,各项数据来源于江苏省统计局官方网站――江苏省统计信息网(www.jssb.gov.cn)发布的《江苏统计年鉴―2005》电子版。整个计算求解过程使用统计分析软件SPSS 11.0 for WIN-DOWS。
  1.指标体系的确立。选取指标共11项:
  (1)X1――地区生产总值(亿元);
  (2)X2――人均地区生产总值(元/人);
  (3)X3――地方财政一般预算收入(亿元);
  (4)X4――城镇固定资产投资(亿元);
  (5)X5――规模以上工业企业利税总额(亿元);
  (6)X6――社会消费品零售总额(亿元);
  (7)X7――出口总额(万美元);
  (8)X8――实际利用外商直接投资(亿美元);
  (9)X9――在岗职工平均工资(元/人);
  (10)X10――农村居民人均纯收入(元/人);
  (11)X11――居民人均储蓄存款(元/人)。
  2.确定相关系数矩阵R并进行因子分析适宜性检验。由于样本数目庞大,限于篇幅,原始数据表省略。使用SPSS软件无须预先对指标向量进行标准化处理,直接通过软件计算得相关系数矩阵R。初步从相关系数矩阵R可以看出,11个指标之间存在很强的相关性,说明11个指标反映的经济信息存在很大的重叠,因此变量个数可以通过因子分析法精简和分类,使最终评价结果更加科学。
  本文采用KMO统计量和Bartlett's球型检验进行因子分析适宜性检验。KMO统计量用于探察变量间的偏相关性,它比较的各变量的简单相关和偏相关的大小,取值范围在0~1之间。如果各变量间存在内在联系,则由于计算偏相关时控制其他因素就会同时控制潜在变量,导致偏相关系数远远小于简单相关系数,此时KMO接近于1,说明变量间共同因素越多,做因子分析效果就较好。一般认为当KMO大于0.9时效果最佳,0.8~0.9效果好,0.7~0.8时效果一般,0.6~0.5时效果差,0.5以下不适合做主成分分析。本文KMO统计量为0.852,表明做因子分析效果好。Bartlett's球形检验用于检验相关矩阵是否是单位阵,即各变量是否各自独立。显著性概率小于0.01拒绝相关阵是单位阵的零假设,说明各变量不相互独立。本文Bartlett's球形检验的显著性概率为0.000,因此拒绝相关矩阵是单位阵的零假设,检验通过。检验结果见表1。
  
  3.计算相关矩阵R的特征值λi、方差贡献率并提取公共因子。相关矩阵R的特征值λi、方差贡献率计算结果如表2。
  本文以主成分方法作为公共因子的提取方法,选定公共因子的提取原则为:累计贡献率大于95%。由表2看,公共因子有3个,其方差累积贡献率已达95.081%,而且这3个公共因子互不相关的,克服了原指标多重共线性的影响。所以只要选择前3个公共因子,其所代表的信息量已能比较充分地解释并提供原始数据所能表达的信息。此外,由表3可以观察到各观测变量的共同度在[0.889,0.985]之间,说明各观测变量均能被这3个公共因子所解释,所以,选择这3个公共因子的信息已能比较充分地反映和代表各个样本区域经济发展水平。
  4.求因子荷载矩阵,确定公共因子。如果初步得出的因子荷载矩阵结构不够简单,各公共因子的典型代表变量不是很突出,容易使公共因子的意义含糊不清,不便于对公共因子进行解释。为此必须对因子荷载矩阵实行旋转,使因子荷载矩阵中的因子荷载的平方值向0和1两个方向分化,即各变量在某公共因子上有高额荷载,而在其它公共因子上只要较小的荷载。最常用的旋转方式是最大方差旋转法(Varimax),采用该方法对因子荷载矩阵A进行旋转得到矩阵B,见表4。
  从旋转后的因子荷载矩阵B可以进行以下分析:地区生产总值(X1)、地方财政一般预算收入(X3)、城镇固定资产投资(X4)、规模以上工业企业利税总额(X5)和社会消费品零售总额(X6)在公共因子F1上有高荷载,这5个指标反映了地区经济发展的总量规模,因此可以把F1称为经济总量因子;在岗职工平均工资(X9)、农村居民人均纯收入(X10)、居民人均储蓄存款(X11)和人均地区生产总值(X2)在公共因子F2上具有高荷载,这4个指标主要反映了地区人均收入状况,可以将F2命名为人均收入因子;出口总额(X7)和实际利用外商直接投资(X8)在公共因子F3上具有高荷载,这2个指标主要反映了地区外贸经济和吸引外资水平,可以把F3称为外向经济因子。公共因子具体情况如表5所示:
  
  5.计算江苏省十强县公共因子得分及综合得分
  
  将进入到2005年国家统计局公布的全国百强县名单中属于江苏的城市单独列出来,并按照在百强县名单中的先后位置重新排序得到的结果,和在本文计算得出的排名表中的次序是基本一致的。这充分说明把因子分析法运用到多指标经济综合发展水平评价中是成功的。
  
  参考文献:
  [1]Richard A Johnson, Dean W Wichern,著.陆璇,译.实用多元统计分析[M].北京:清华大学出版社,2001.
  [2]苏金明等.统计软件SPSS for Windows实用指南[M].北京:电子工业出版社,2000.
  [3]马庆国.管理统计[M].北京:科技出版社,2002.
  [4]游家兴.如何正确运用因子分析法进行综合评价[J].统计教育,2003,(5).
  [5]唐红梅.用因子分析法对西部地区的人口素质进行分析[J].运筹与管理,2005,(4).
  [责任编辑:昱文]
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文


转载注明来源:https://www.xzbu.com/2/view-478125.htm