您好, 访客   登录/注册

两种多元统计方法比较

来源:用户上传      作者: 段 端

  主成分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛,可以解决经济、教育、科技、社会等领域中的综合评价问题。主成分分析采用降维的思想,将研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。本文就此对主成分分析和因子分析的异同进行比较,并在SPSS和DPS软件上如何实现给予说明。
  
  一、主成分分析与因子分析的异同点
  
  两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数;4、合成方法一致:都没有考虑原始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。
  两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、实际意义:主成分没有实际意义;公因子有实际意义;4、应用:主成分侧重信息贡献、影响力综合评价;因子分析侧重成因清晰性的综合评价。
  
  二、SPSS上的实现
  
  1、主成分分析在SPSS上的实现
  (1)将原始数据无量纲化。传统主成分分析进行无量纲化处理的方法是“中心标准化”,这在SPSS中通过Analyse-Descriptive Statistics-Descriptive中Save standardized values as variables执行。但是,该方法把各指标的方差化为1,这就消除了各指标变异程度上的差异,进而从丢失一部分信息的数据中提取主成分是不可取的。可以采用“均值化”或“初始化”的方法进行处理。(2)Analyse-Data Reduction-Factor Analysis,弹出Factor Analysis对话框。(3)Descriptives:Correlation Matrix框中选Coefficients,Statistics框中选Initial solution。(4)Extraction:Method框中选Principal components;Analyze框中选Correlation matrix;Display框中选Unrotated factor solution;Extract框中选Eigenvalues over,数值为0;Maxium Iteration for convergence中默认值为25。(5)结果显示在Output中:提取“Total Variance Explained”中主成分的累计贡献率大于等于85%的主成分个数;“Component Matrix”中第i个主成分的列向量除以相应特征根的平方根后就得到这个主成分的变量系数向量,可以利用“Transform-compute”来实现。(6)写出主成分表达式及主成分命名:利用(5)中的结果写出主成分表达式,Fi=x1×a1i+x2×a2i+……+xp×api,其中x1、x2、……、xp是无量纲化处理后的向量,a1i、a2i……、api是第i个主成分的变量系数向量;根据“Component Matrix”中第i列中系数绝对值大的对应变量对Fi命名。(7)写出综合主成分:
  
  其中为第i主成分的贡献率。可利用“Transform-compute”来实现。
  2、因子分析在SPSS上的实现。(1)―(4)步同主成分分析;(5)Rotation:Method框中选Varimax(方差最大法);Display框中选Rotated solution;Maxium Iteration for convergence中默认值为25。(6)Scores:选中Save as variables;Method框中选Regression;选中Display factor score coefficient matrix。(7)结果显示在Output中:提取“Total Variance Explained”中特征值累计贡献率大于等于85%的因子个数;“Rotated Component Matix”为因子载荷阵B。(8)求因子得分函数并对因子命名:因子得分函数为,Zi=x1×bi1+x2×bi2+……xp×bip,其中bi1、bi2、……bip为Output中“Component Score Coefficient Matrix”的第i列向量;将因子载荷阵B中的第i列绝对值大的对应变量归为一类,并命名。(9)求综合因子得分值: ,其中vi/p,为Output中“Total Variance Explained”中的“Rotation Sum of Squared Loadings”栏下的“% of Variance”列。(10)对综合因子得分进行排序。
  由以上可以看出,在用SPSS实现主成分分析和因子分析时,是从因子旋转开始有所不同的,主成分分析不用进行因子旋转,也不用计算因子得分,而因子分析通过进行因子旋转,使得公因子上有较大的载荷,因子的意义更加明显。
  
  三、运用DPS分析的简单介绍
  
  在DPS上进行主成分分析和因子分析更加简便、快捷。进入DPS界面,选中进行分析的数据,从工具栏中选择多元分析―多因素分析―主成分分析/因子分析,就可以直接显示出结果。相比较SPSS而言,DPS分析减少了很多步骤,例如关于提取出的主成分和因子的系数向量,不必再进行运算,直接给出最后结果,关于原始变量的均值化、初始化可以直接运用菜单一步生成,不必手工操作,而且,DPS软件是汉化版,操作简便直观。


转载注明来源:https://www.xzbu.com/2/view-413678.htm