您好, 访客   登录/注册

线性回归模型异方差的诊断与修正

来源:用户上传      作者: 张振强 韦兰英

  摘要:文章通过实际案例分析,介绍了回归模型异方差性的诊断与修正的几种方法,并给出了如何结合EVIEWS软件实现异方差性的检验与消除的方法和程序。
  关键词:计量经济学;线性回归模型;异方差;EVIEWS软件
  
  经典线性回归模型Y=f(x)+u的一个重要假设就是回归方程的随机误差项u的方差为常数。但是由于现实经济活动的错综复杂性,一些经济现象的变动和同方差的假定经常是相悖的。尤其是当使用截面数据时,通常会遇到同方差性不满足的情况,即随机误差项出现异方差。
  异方差的存在给用OLS估计得到的模型带来以下不良后果:参数估计量非有效;解释变量的显著检验失效;估计与预测精度降低,造成回归模型不能使用。因此,在实际建模中,用OLS方法得到具体模型形式后,并不能马上将其应用于现实经济问题的分析及预测中,必须首先诊断此模型是否存在异方差性,只有进行异方差诊断和修正,并在所有必要的检验都通过之后,才能转入模型的应用。
  在计量经济分析过程中,对回归模型异方差性的检验与修正的方法有很多种,本文仅介绍几种常用且能基于EVIEWS软件实现的方法。
  
  一、EVIEWS软件简介
  
  EVIEWS是美国QMS公司研制的在windows下专门从事数据分析、回归分析和预测的工具,通常称为计量经济学软件包,是当今世界上最流行的计量经济学软件之一。
  EVIEWS(Econometrics Views)的本意是对社会经济关系与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、运用模型进行预测、求解模型和运用模型。EVIEWS是完成上述任务得力的必不可少的工具。EVIEWS拥有数据处理、作图、统计分析、建模分析、预测和模拟6大类功能,可应用于科学计算中的数据分析与评估、财务分析、宏观经济分析与预测、模拟、销售预测和成本分析等。正是由于EVIEWS等计量经济学软件包的出现,使计量经济学取得了长足的进步,发展成为实用与严谨的经济学科。
  EVIEWS具有现代Windows软件可视化操作的优良性。可以使用鼠标对菜单和对话框进行操作,也可以通过主窗口上方的命令窗口输入命令。本文将通过实例介绍EVIEWS在异方差性的检验与修正上的应用。
  
  二、实例分析
  
  分析中国2004年各地区城镇居民平均每人全年家庭可支配收入(x,元)与交通和通讯支出(y,元)的关系,以预测随着收入的增加,人们对交通、通讯的需求。中国城镇居民平均每人全年家庭可支配收入(x,元)与交通和通讯支出(y,元)如表1所示。
  由表1可以看出,随着人均家庭可支配收入的增加,人均交通和通讯支出也表现出增加的趋势,而且增加的速度加快。不同收入家庭的交通和通讯支出表现出很大的差异。例如,广东人均家庭可支配收入为14953.39元/年,人均交通和通讯支出为967.13元/年;上海人均家庭可支配收入为18501.66元/年,人均交通和通讯支出为900.12元/年。这就很难保证同方差的假定。
  (一)用OLS方法估计参数
  设模型为yt=bo+b1xt+ut,运用EVIEWS软件操作过程如下:首先建立工作文件,输入样本数据,然后在主窗口命令行输入命令“LS ycx”,回车,即可得回归结果如表2所示。
   t=348.2365+0.035262xt
  (13.37372) (13.96414)①
  R2=0.870534,s.e.=40.69252,
  F=194.9973
  (二)异方差性诊断
  1、Goldfeld-Quanadt检验
  检验的操作步骤:
  先将解释变量x从小到大(或从大到小)排列,再删去正中心的c个样本值,将剩余的n-c个样本值划分为容量都是 的两个子样本,使其分别包含x的较小值和较大值。
  对两个子样本分别用OLS拟合回归方程并分别求出残差平方和RSS1和RSS2。
  计算两个子样本方差:δ12= ;δ22= ;(其中k为解释变量的个数)。
  计算F值:F= = ,且F服从Fα( -k-1, -k-1)分布。
  判断:若F>Fα,则随机误差项存在异方差性;若F≤Fα,则不存在异方差性。
  EVIEWS软件实现:该例中,样本数据个数n=31,c= 为了使两个样本的容量相同,从中间去掉9个数据(即取c=9)。在主窗口命令行输入命令:
  SORTX
  SMPL111
  LS YCX回车,得结果:RSS1
  =3880.507
  接着,输入命令:SMPL2131
  LSYCX回车,即得:RSS2=30192.9
  计算出F=30192.9 /3880.507=7.78。
  取α=0.05时,查F分布表得F0.05(9,9)=3.18,而F=7.78>F0.05(9,9)=3.18,所以模型①存在(递增的)异方差性。
  2、Glejser检验
  检验的操作步骤:根据样本数据用OLS估计回归模型并求残差et;分别建立|et|对解释变量的各种回归方程;检验每个回归方程参数的显著性。若其参数显著地不为零,即认为存在异方差性。
  EVIEWS软件实现:
  在主窗口命令行输入以下命令:
  LSycx
  GENRE=ABS(RESID)
  GENRXT=X^2
  LSecxt 回车,得回归模型:
   t=-2.576121+2.75E-0.7x2t
  t=(-0.366939)(5.024229),
  R2=0.465368
  接着输入命令:
  GENRsqrt=sqr(x)
  LSecsqrx回车,得回归模型:
   t=-115.0179+1.436779
  t=(-3.79398)(4.714942),
  R2=0.433933
  再输入命令:
  GENR chux=1/x
  LS e c chux回车,得回归模:
   t=111.7659-792225.9
  t=(5.402113)(-4.203765),
  R2=0.378638
  上述模型回归系数均显著不为零,即认为模型①存在异方差性。
  3、White检验
  检验的操作步骤:
  用OLS估计模型,并计算出相应的残差平方e2t,对于一元线性回归模型,作辅助回归模型e2t=a0+a1xt+a2x2t+vt;
  计算统计量nR2,其中n为样本容量,R2为辅助回归函数中的未调整的可决系数。
  在H0:a1=a2=0的原假设下,nR2渐进地服从x2α(2)。若nR2>x2α(2),则拒绝H0,接受H1,表明回归模型中参数至少有一个显著地不为零,即随机误差项存在异方差性。反之,则认为不存在异方差性。
  EVIEWS软件实现:在方程窗口中依次点击:View/Residual Test/White Heteroskedasticity.此时可以选择在辅助回归模型中是否包含交叉项(Cross terms),该例为一元回归模型,辅助回归模型中无交叉项,应选No Cross terms。执行之后得辅助回归模型的估计结果见表3:

  
  取显著水平α=0.05,由于nR2=16.02746>x20.05(2)=5.99,所以可以模型①认为存在异方差性。
  (三)异方差的修正
  当通过检验,探明模型中存在异方差后,要设法消除其影响,将异方差模型转化为同方差模型,对其作OLS估计后,再变换回原模型。常用的方法有加权最小二乘法(WLS)、模型变换法等。
  1、WLS估计法
  加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差的模型,然后采用普通最小二乘法估计其参数.以一元线性回归模型yt=b0+b1xt+ut为例,如果在检验过程中已经知道var(ut)=E(ut)2=δt2=δ2f(xt)即随机误差项的方差与解释变量xt之间存在相关性,那么可以用 去除原模型,使之变成如下形式的新模型 = +b1 + 。在该模型中,存在var( )=E( )2= δt2=δ2即同方差性。于是可以用普通最小二乘法估计其参数,得到关于参数b0、b1是无偏的、有效的估计量。这就是加权最小二乘法,在这里权就是 。该例EVIEWS软件操作如下:在OLS对话框中输入“ycx”,回车,然后单击方程窗口中Estimate/Options,并在权数对话框中输入权数,上例权数为1/x2,单击“OK”,得WLS的回归结果如下:
   t=265.4487+0.044342xt②
  (7.291038)(10.44355)
  R2=0.974542
  为了分析异方差的修正情况,还需要对模型②进行White检验,以判断模型是否存在异方差性,在方程窗口中单击View/Residual Test/White Heteroskedasticity。结果如表4所示:
  
  取显著水平α=0.05,由于nR2=1.467261<x20.05(2)=5.99,所以可以认为模型②已不存在异方差性。
  2、对数变换法
  在一元回归模型yt=b0+b1xt+ut中,变量yt,xt,分别用lnyt,lnxt,取代,对lnyt=b0 +b1lnxt+ut进行回归,通常可以降低异方差性的影响。原因是:对数变换能使测定变量值的尺度缩小;经过对数变换后的线性模型,其残差et表示为相对误差,而相对误差往往具有较小的误差。该例EVIEWS软件操作为:
  先用GENR生成lnx和lny序列,然后用OLS方法求lny对lnx的回归。即输入以下命令:
  GENR lnx=log(x)
  GENR lny=log(y)
  LSlnyclnx 回车,即得结果如下:
  ln t=1.418438+0.558324lnxt③
  (4.314453)(15.57151)
  R2=0.893175S.E.=0.049437
  再次利用White检验判断以上模型③是否存在异方差性,在方程窗口中单击View/Residual Test/White Heteroskedasticity,结果如表5所示:
  
  由于nR2=5.895475<x20.05(2)=5.99,所以模型③已不存在异方差性。
  经过修正后不存在异方差性的模型能更好地对年人均家庭可支配收入和人均交通和通讯支出关系进行讨论、预测、政策评价。
  
  参考文献:
  1、易丹辉.数据分析与EVIEWS应用[M].中国统计出版社,2002.
  2、李子奈.计量经济学[M].高等教育出版社,2000.
  3、王明舰.经济计量分析[M].中国社会科学出版社,1998.
  4、尹光霞.多元线性回归模型中的异方差性问题[J].湖北大学学报,2003(6).
  5、黄朗辉.中国价格及城镇居民家庭收支调查统计年鉴[M].中国统计出版社,2005.
  *本文为南宁师范高等专科学校科研经费资助项目,合同编号:南专科研自然字(2008)第04号。
  (作者单位:南宁师范高等专科学校。其中,张振强为南昌大学经管学院数量经济学在读硕士)
  
  注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”


转载注明来源:https://www.xzbu.com/2/view-429926.htm