您好, 访客   登录/注册

基于R的《数理统计学》课程教学改革初探

来源:用户上传      作者:

  摘要:《数理统计学》课程一直是大学理工、经管、医学统计等学科教学的核心课程之一。本文基于近年在国际上非常流行的开源软件R,探究R在《数理统计》课程教学改革中新的应用,改革中发现学生基于R的计算对问题理解的更透彻,更容易产生学习《数理统计》课程的兴趣,我们试图结合求常用分布分位数及其概率计算为例及应该注意的问题等来探讨《数理统计学》课程教学改革,从而为该课程与国际接轨,提高教学效果并为实现教学目标服务。
  关键词:教学改革;分位数;概率;R软件
  中图分类号:G642.0     文献标志码:A     文章编号:1674-9324(2019)19-0077-02
   一、数理统计学发展过程简述及R软件简介
  数理统计学英文名称Mathematical Satistics,原中国科学院院士陈希孺[1]先生在其著作《数理统计学简史》一书中详细说明了数理统计学的产生、发展过程。数理统计学起源于17世纪到现在400年的发展,生命力依然强盛,随着计算机软件的广泛应用,数理统计学这门课程更是青春焕发,为越来越多的行业、研究机构、大专院校所重视。专门的统计软件有很多比如著名的统计软件SAS、SPSS、STATA等,但是这些软件都是商业化软件,正版软件比较昂贵,而盗版软件又会受到知识产权保护的限制,而完全开源品质高尚的R软件更适合在大学中教学及研究中使用,R语言起源于1980年美国著名的贝尔实验室用于数据统计的S语言,随后新西兰奥克兰大学Robert Gentleman和Ross Ihaka[2]及其R核心团队成功开发出来开源软件R,并在全世界开始流行,上个世纪90年代后期开始传入我国并在大专院校、研究机构开始使用,并且范围逐步广大。
  R软件的安装非常方便,可以按照网站可以提示很方便的进行安装,如果在结合安装Rstudio[3]使用效果会更好。
  二、R软件在教学中应用以常用分布分位数及其概率为例进行探讨
  依据最新的全国研究生入学考试数学大纲[4]规定在数理统计学教学中明确要求:正态分布、卡方分布、t分布、F分布及其分位数[5]是必须掌握的内容,如果不借助软件计算这些分布分位数或已知这些分布的分位数求其概率就会非常困难,而且即使记住这些常用分布的分位数也同非常困难,这就阻碍了同学们对数理统计学教学内容的学习,但是所有这些难点对于基于R软件却变得非常容易解决,而且更容易激发同学们的学习兴趣,从而为提高教学效果打下基础,为今后的科学研究和实际应用创造良好的氛围。在一个已经安装好R软件的电脑上,我们发现当已知分位点或分位数时我们借助R软件可以方便地求出小于该分位数或分位点的概率值,其应用函数是P+分布名称缩写,那么如何基于R进行计算呢?我们以常用分布为例加以说明。
  1.基于R可以快速求所有正态分布所有分位数的概率。①若X服从标准正态分布,则X小于1.96的概率如何计算?计算积分值对于普通学生来说非常困难和不方便,所以大家可以查询分布表,而R软件可以轻松完成,函数模式是P+正态分布名称缩写即可,R软件中公式格式及计算结果如下:pnorm(1.96,0,1)[1]0.9750021。当然,你可以把1.96换成任何实数,这样就可以求出所有标准正态分布的分位数概率了。②进一步,若X服从均值为2,方差为9的正态分布,则X小于5的概率如何计算?R软件中公式格式及计算结果如下:pnorm(5,2,3)[1]0.8413447,2是数学期望,9是方差,标准差是3。③再进一步,若X服从均值为μ,标准差为σ的正态分布,根据相关定理可以转换为标准正态分布来计算,见①;当然也可以根据②的形式直接计算,R软件中公式格式如下:pnorm(x,μ,σ)。这样,就可以快速求出所有所有正态分布所有分位数的概率。
  2.与第一点相同基于R你可以快速求所有卡方分布所有分位数的概率。以中心化的卡方分布为例加以说明,若X服从自由度是3卡方分布,求X小于5的概率如何计算?R软件中公式格式如下:pchisq(5,3)[1]0.8282029。对于中心化的卡方分布自由度可以是任何正整数,这样就可以快速求所有卡方分布所有分位数的概率。
  3.基于R对于t分布、F分布同样可以快速求所有分位数的概率。这里我们仅以具体分位数的R软件中公式格式为例给出这样可以帮助学生们理解。对于随机变量服从t分布分位数的概率,当自由度为3时,求X小于5的概率如何计算?R软件中公式格式如下:pt(5,3)[1]0.9923038。这样基于R任何分位数、任何自由度的t分布概率都可以快速求出。
  其他分布的计算大家仿照例题即可完成任务。这样就解决了前三个问题的逆问题。
  三、其他问题说明
  在上面内容中我们所说的分位数x都是指的下分位数,即当随机变量X服从某种分布时,X小于等于x的概率为p的x的具体值,当然也可以求X大于x的概率为中的x值,这时称为分布的上分位数。因为P(X>x)=1-P(X≤x),所以對于上分位数及其概率用R软件照样可以方便地快速计算,大家可以尝试运用这里不再举例。
  四、结语
  以上,我们以求常用分布分位数及其概率计算为例基于R软件进行了详细的分析,这些内容可以使得同学们快速地理解掌握数理统计学中关于分位数及其概率的知识内容。
  总之,随着R软件在全世界范围内的快速流行和应用,各种教学改革[6,7]以及基于R软件的各种教学改革日益提上日程,这不仅仅表现在计算具体问题上的快速方便,而且为今后学习更高深的知识及科学研究打下坚实的基础,同样,基于R的新的教材编写在不久的将来也会快速流行,这对于帮助同学们理解数理统计学知识及教学效果的提高都是十分有益的。
  参考文献:
  [1]陈希孺.数理统计学简史[M].长沙:湖南教育出版社(第一版),2002,(7).
  [2]https://www.r-project.org/.
  [3]https://www.rstudio.com/.
  [4]教育部考试中心.全国硕士研究生招生考试数学考试大纲[M].北京:高等教育出版社,2017,(9).
  [5]刘喜波,等.概率论与数理统计.北京:中国商业出版社(第一版),2014,(1).
  [6]崔玉杰,刘喜波.R和Python软件在《概率论与数理统计》教学中应用初探[J].教育教学论坛,2017,(3):192-193.
  [7]李昌兴,史克岗.“数学实验”和“数学建模”课程教学改革的实践与研究[J].工程数学学报,2003,(08):107-110.
转载注明来源:https://www.xzbu.com/9/view-14827521.htm