您好, 访客   登录/注册

多样本尺度参数的非参数检验

来源:用户上传      作者:

  摘 要:当总体不是正态时,对它们的尺度参数进行检验,通常采用非参数检验的方法。本文就多样本尺度参数非参数检验的不同的方法及其原理进行了归纳整理,并通过实例对这些检验的功效进行了比较。
  关键词:位置参数;尺度参数
  尺度参数主要用来描述总体概率分布的离散程度,常用的方差,标准差,平均差等都是关于尺度的参数。对于多个独立正态总体的尺度参数检验,常用的有最大F比检验,最大方差检验,Bartlett检验,levene检验等。然而当样本数据不足以支持总体正态假定时,对总体尺度参数的检验就需要用非参数方法来解决:
  设有 k ( k 2 )个独立总体 X i ~ Fx i-θ iσ i , i=1,2,…,k ,其中 F· 為连续性分布函数。对这k个总体进行尺度参数检验,不妨假定检验的零假设 H 0:σ 1=σ 2=…=σ k ,备择假设 H 1:σ 1,σ 2,…,σ k 不全相等。检验对总体的分布类型没有要求,但检验前一般需假定总体位置参数(均值或中位数)相等,即 θ 1=θ 2=……=θ 。如果不等,则估计出这 k 个总体共同中位数 θ ,将样本经过平移使位置参数相等后再进行检验。
  1 多总体尺度参数检验的非参数检验方法
  1.1 Ansari-Bradley 检验
  检验原理:对位置参数相同的合样本编秩,最大和最小的样本秩为1,第二大和第二小的样本秩为2,依次进行直到每个观测值都有秩。[1]若有来自 k 个总体的样本,总样本量为 N N=∑k i=1n i ,合样本中位数为 N+12 , X i1,X i2,…,X in i.表示其中大小为 n i 的第 i 个样本,用 R ij.表示样本 X ij.在合样本中的秩,若样本 X i 的秩和 ∑jR ij.比较小,说明其样本点距最值两端较近比较分散,否则就会比较集中。若每组样本的秩和差别不大,则不拒绝零假设。令 A- i=1n i∑ n i.j=1N+12 - R ij-N+12 ,则 k 样本的检验统计量 B=N 3-4N48N-1∑k i=1n i A- i-N+24.2 。在零假设下, B 近似服从自由度为 k-1 的 χ 2 分布,若 B χ 2 1-αk-1 ,则在显著水平 α 下拒绝零假设。
  1.2 Kruskal-Wallis 检验
  检验原理:检验前提总体分布是连续的,虽然类型未知但分布类型是相似的,。把多个样本混合起来求秩,按不同样本组分别求秩和。如果有相同的观测值时即出现打结的情形,则用平均秩法确定秩。[2]设有k个总体,n个样本,每组样本数 n 1,n 2,…,n k ,即 n=n 1+n 2+…+n k , R ij.为样本 X ij.的秩, i=1,2,…,k , j=1,2,…,n i ,则第i组的样本的平均秩 R- i=R in i , R i=∑ n i.j=1R ij, i=1,2,…,k 合样本秩的平均值为 R-=n+12, 在零假设成立的条件下,每组样本的秩均值应该与合样本的秩均值很接近,即 ER- i=n+12 ,如果相差很远,则可以拒绝零假设。当SSB的值太大就拒绝零假设,检验的统计量 H=SSBMST=12nn+1∑k i=1R 2 1n i-3n+1 ,其中 SSB=∑k i=1n i R- i-R-.2 为各处理间平方和, SST=∑k i=1∑ n i.j=1.R ij-R-.2 为合样本各秩的总平方,其总均方为 MST=SSTn-1 。在零假设下 H 服从自由度为 k-1 的 χ 2 分布,拒绝域 H χ 2 k-11-α 。
  1.3 Fligner-Killeen 检验
  检验原理:假定有 k 个来自不同总体的样本,它们的位置参数相同,因为具有大的尺度参数的总体,其样本值一般会倾向于远离这 k 个总体共同中位数 θ 。[3]由此角度出发,将样本值到共同的中位数的距离 V ij=X ij-θ 进行排序,其中 X i1,X i2,…,X in i.表示大小为 n i 的第 i 个样本, i=1,2,…,k,j=1,2,…,n i 。再用 R ′ ij.表示在合样本中的 V ij.秩, K=12NN+1∑k i=1n i R- ′ i-N+12.2 作为检验的统计量,这里 R- ′ i=1n i∑ n i.j=1R ′ ij.。在零假设下,统计量 K 有 Kruskal-Wallis 分布,对于太大的 K ,应拒绝零假设。[4]   1.4 平方秩检验
  检验原理:平方秩检验无需考虑总体的位置参数,把每个总体的样本与其平均数计算绝对离差后混合排序编秩,总体 X i 的平方秩的和 T x=∑m i=1R xi.2 越小,则说明样本离中心越接近,分散程度越低。[4]具体做法如下:设有个 k 总体的样本,样本总容量为 N ,记 X- i=1n i∑ n ijX ij.为各总体样本的均值,于是所有样本的 N 个绝对离差 X ij-X- i , i=1,2,…,k,j=1,2,…,n i 混合排序得到 N 个秩,不妨用 R ij.表示这些秩的平方, T i=∑ n i.j=1R ij.
  i=1,2,…,k ,表示相对于第 i 个总体样本的平方秩的和。在零假设下,检验统计量 T=N - 1∑k i=1T 2 i/n i- ∑k i=1T i.2/N∑k i=1∑ n i.j=1R 2 ij- ∑k i=1T i.2/N ,漸进服从自由度为 k-1 的 χ 2 分布。
  2 尺度参数非参数检验方法的实例分析
  三个单位的管理人员年度管理表现评分如下:
  在显著水平 0.05 下,这三个单位的管理表现评分的方差有无显著差异?
  采用四种方法,借助于软件SPSS24对此三样本的尺度参数进行检验,结果如下表所示:
  通过这四种检验方法得出的 P 值都明显大于 0.05 ,表明这四种方法对本例数据检验结论一致:在显著水平 α 下不能拒绝零假设,即三个单位的管理表现评分的方差无显著差异。
  从检验原理上来看,Ansari-Bradley检验性,Kruskal-Wallis检验,平方秩检验都是渐进服从 χ 2 分布。由于检验过程中都使用到了Wlicoxon秩和检验统计量,所以Fligner-Killeen检验和平方秩检验,二者检验结果比较相近。然而当大样本时,有研究表明这四个检验的统计量都渐进正态分布,所以它们的检验结果大致相同。[5]
  参考文献:
  [1]吴喜之,赵博娟.非参数统计(第三版)[M].北京:中国统计出版社,2012-11,第三版.
  [2]薛留根.应用非参数统计[M].北京:科学出版社,2013-7,第一版.
  [3]王静龙,梁小筠.非参数统计分析[M].北京:高等教育出版社,2006-4,第一版.
  [4]王星,褚挺进.非参数统计[M].北京:清华大学出版社,2014-9,第二版.
  [5]陈希孺,方兆本,李国英,陶波.非参数统计[M].北京:中国科学技术大学出版社,2012-4,第一版.
转载注明来源:https://www.xzbu.com/1/view-14741637.htm