您好, 访客   登录/注册

属性数据分析教学改革初探

来源:用户上传      作者:

  【摘要】课程以案例为抓手,以数据分析和统计软件为两翼,形成“统计分析-软件操作-结果解读”三位一体的教学体系,实行对比式、启发式、互动式、点评式的课程教学模式,旨在提高学生的统计分析能力和创新能力,为后续参加统计类大赛和本科毕业设计打下坚实基础。
  【关键词】教学方法;教学内容;属性数据;统计分析能力;统计软件
  【基金项目】上海第二工业大学校重点课程建设(A01GY18F014-02)。
  一、引言
  随着大数据时代、智能化时代的到来,只要掌握好数据分析的理论和技术,就能够从数据中挖掘出所蕴藏的统计规律,就能够给人们的生活与工作带来极大的便利。统计学依据数据的计量尺度可分为定距型数据(interval scale)、定序型数据(ordinal scale)、定类型数据(nominal scale)与定比型数据(ratio scale),定距数据和定比数据统称为定量数据(quantitative data),定类数据与定序数据又统称为定性数据或者属性数据(categorical data)。因此,绝大部分数据集里都含有属性数据,也就是说,数据分析基本上离不开对属性数据的分析,属性数据分析得好坏直接影响到对问题的分析和结果的解读。
  但是,在属性数据分析的教学中,存在学生对课程重要性的认知不够,理论与实践结合不紧密,统计软件应用不够,课程教学活动中学生的参与度不够等一些问题,以至于学生没能把知识转化为能力,没能把能力转化为技能,影响了统计人才的培养,也影响了创新能力的培养。故,课程教学中需要抓住基本思想、基本方法、基本步骤的讲解,突出属性数据分析的理论与方法的介绍,突出属性数据与定量数据的联系与区别,注重对案例的分析,注重对统计软件的分析与操作,使学生能够构建起自己的知识体系,以便达到知识融会贯通,方法灵活运用。
  二、属性数据分析的教学改革
  結合统计学科和本校应用统计学专业学生的特点,在属性数据分析的教学改革中提出了以下几点想法,旨在提高学生应用统计知识解决实际问题的能力和统计素养。
  (一)构建合理的教学体系,注重对比式教学
  第一,本课程遵循由浅入深,由定性到定量,层层递进的分析模式,分别从低维到高维,从描述性分析到数据建模,从描述性统计到推断性统计三个维度进行阐述,使其形成一个统一有机的整体。
  第二,属性数据与定量数据是两大数据类型,它们的统计分析之间既有相似之处又有区别。因此,课程中采用对比式的讲授方式。譬如,在讲述一维属性数据的描述性分析(表1)过程中,属性数据可以类似于定量数据,首先将其数值化,但是需要注意的是这个数值仅仅代表的是一个类别,并不具有实际的含义。其次,类比于定量数据,一维数据可以采用数值法、图表法进行描述性分析,而在数值法的描述性分析中需要强调的是属性数据不能用均值、方差等来刻画,因为属性数据的数值不具有实际意义,而定量数据的数值具有实际的意义,其就有实际的含义,就可用均值、方差等来描述。再者,定类和定序的数值化还有一定的区别,定序的数值可以代表大小关系,所以可用中位数刻画,而定类的数值只代表类别,不能用中位数刻画。进而,在理解是否具有实际意义的基础上,给出了属性数据离散程度的三种刻画方式——离异比率、熵、GS指数,这是与定量数据完全不同的,需要学生额外注意的。图表法的讲述也是如此,要特别关注属性数据的特别之处——帕累托图,这也是寻找重要影响因素的一种手段。因此,通过这样对比式的学习,既复习了定量数据的内容,又加强了对属性数据的学习与巩固,还可避免在实际应用中混淆,从而提高学生的归纳能力、统计分析能力和实践能力。
  第三,属性数据分析的内容繁多,又是一个统一的整体,需要学生自己归纳,总结,建立起每个章节的思维导图。通过反复几章思维导图的训练,学生在学习过程中不再只是单独地训练技能,而是积极地构建自己的知识体系,形成独立的思考能力。
  (二)以问题为导向,进行案例式教学设计
  属性数据分析课程的理论部分逻辑性强,公式复杂繁多,抽象而难以理解。通过板书可以加强学生对重要结论和重要思想的理解;通过案例教学,可以激发学生学习统计的兴趣,启发学生思考,从而巩固学生的理论基础和提高解决实际问题的能力。譬如,在讲述高维列联表独立性检验时,考虑大学专业录取是否存在性别歧视这样一个贴近身边的问题。这是一个高维(性别*专业*录取)列联表的问题,分层和压缩是处理高维问题的两个常用手段,压缩后发现录取时存在明显的性别歧视。这个结论对吗?可以引导学生去分析。按照专业分层后发现,录取时并不存在性别歧视,那如何解释这一现象?如何解释暗含在这里面的原因?这就需要教师逐步启发学生思考。通过启发、思考,完成对这一现象原因的阐述,从而例证了条件独立性检验和独立性检验的联系和区别,并且还可以将这一类现象进行归纳总结,进而给出辛普森悖论可能发生的条件。除此以外,本课程还结合我校参加统计类大赛的问卷数据,在相应的章节中结合所学知识完成案例的分析,最后形成一个统计大赛的实例分析。总而言之,通过案例教学可以让学生理论结合实际,更加直接、更加通俗易懂地理解相关理论和分析思路。
  (三)多种教学手段交叉运用,注重统计素养培养
  本课程在教学过程中采用启发式、互动式、点评式、对比式等多种教学手段,充分调动学生的积极性,完成教学内容和案例分析。通过启发式教学,可以引导学生思考,培养学生的分析能力和独立创新能力;通过互动式教学,可以增强学生的学习兴趣;通过点评式教学,可以让学生学会用批判的眼光看待问题,更加全面地分析问题;通过对比式教学,可以促使学生建立自己的思维导图,构建自己的知识体系,以便更加灵活地掌握数据分析的思想和内容。
  (四)加强软件实践操作,注重统计分析能力培养
  时代在不断前进,社会在不断进步,企业对人才的要求也在不断提升,软件应用能力更是社会所看重的一项重要指标。大数据时代,海量的科学数据,其分析必须借助计算机软件来实现。常用的统计软件有SPSS、SAS、R、Eviews、Stata、Python、Excel、Matlab等,其中,SPSS界面化的操作,上手快,操作简单,对于初学者非常合适;R软件是近年来流行的一款统计软件,因其开源性受到广大统计研究者的欢迎,公司职位招聘中也要求熟练应用R软件。因此,本门课程着重讲述SPSS和R这两款常用的统计软件,数值计算方面则介绍Matlab的相关函数,旨在让学生可以熟练运用SPSS软件和R软件的相关操作及命令,完成数据分析的任务。除此之外,还要培养学生结合实际案例背景进行统计分析的能力,而不是单纯为了用统计方法而用统计方法,提高学生对软件结果的解读能力,从而提高学生分析解决问题的能力、实践能力与就业能力。   (五)以项目和论文为抓手,注重创新能力培养
  市级、校级创新项目和统计类大赛的设置为提高本科生的统计素养提供了一个很好的平台。通过参加项目和比赛,学生可以提高分析问题和解决实际问题的能力、与人沟通的能力、团队合作能力,丰富统计分析的经历,为将来毕业找工作提供一块敲门砖。另外,从统计类大赛的论文、科研论文入手,通过对这些论文的分析、解读、提问、总结,可以巩固课上所学的知识,使学生熟悉论文写作的基本格式,锻炼提出问题、思考问题、分析问题、解决问题的能力,提高撰写报告、论文的能力,为后续本科毕业设计打下良好的基础。
  三、结论
  属性数据分析作为统计专业重要的基础课之一,需要在教学内容、教学手段、教学方法等方面不断改进,故本课程提出了“统计分析-统计软件-结果解读”三位一体的教学体系,运用启发式、互动式、点评式、对比式的教学手段,理论和实践相结合的教学方法,注重统计软件操作,进而提高学生分析问题和解决问题的能力,从创新、实践、理论、素养等全方位多维度培养学生的综合实力,使学生能够应对社会发展所带来的挑战,成为国家所需要的应用型人才。
  【参考文献】
  [1]王静龙,粱小筠,王黎明.属性数据分析[M].北京:高等教育出版社,2013.
  [2]陈华舟,石凯,唐国强,等.“数据分析”课程理论与实践相结合的教学改革思路[J].时代教育,2017(17):44-45.
  [3]李军,朱永伟,孙玉利.基于案例教学的课程改革探索[J].課程教育研究,2016(09):33-34.
  [4]史希来.属性数据分析引论[M].北京:北京大学出版社,2006.
  [5]张学新.大数据时代本科应用统计学专业课程改革探索[J].阴山学刊,2016,30(03):143-146.
  [6]薛薇.基于R的统计分析与数据挖掘[M].北京:中国人民大学出版社,2014.
  [7]Alan Agresti.An introduction to categorical data analysis[M].2nd edition.America: Wiley InterScience, 2007.
  [8]薛薇.SPSS统计分析方法及应用[M].第三版.北京:电子工业出版社,2013.
转载注明来源:https://www.xzbu.com/9/view-14685993.htm