基于成果展示的数据分析实验课程改革探索
来源:用户上传
作者:
摘 要:文章从数据分析实验课程设置的必要性出发,针对当前数据分析实验课程现状,分析数据分析实验教学存在的问题,提出了基于成果展示(Poster)的数据分析实验课程改革策略。
关键词:数据分析;实验课程;成果展示;课程改革
中图分类号:G642.3 文献标识码:A 文章编号:1002-4107(2020)04-0035-02
数据爆炸与信息高速发展时代,计算机学科面临的一个重要问题就是如何从海量的、结构化或非结构化的数据中挖掘出人类需要的知识,这些知识用以帮助人们做出合理的决策。数据分析这门课正是继概率与数理统计等课程之后,数据挖掘课程等深度分析之前的基本的数据处理与分析的课程[1-2]。数据分析理论课程的主要目标是使学生学会如何收集数据,预处理数据,处理数据,获取知识。数据分析课程理论性比较强,统计学知识占据很大比例,学生学起来比较吃力。因此,课程一般设有实践环节(实验课),使学生能够学以致用,更好地理解理论知识。然而,同传统的实验课一样,数据分析实验课程不可避免地遇到了一些教学上的问题,如实验步骤按部就班、学生积极性不高等。
通过几年的对数据分析理论课与实验课的教学研究,笔者总结了现有实验课教学存在的不足,提出了基于成果展示,即Poster(海报)的实验课程改革研究方案。
一、数据分析实验课程设置的必要性
数据分析这门课程既包含了一些常用的高级的统计学方法,又囊括了一些基本的简单的数据挖掘的方法。数据分析与经济学、管理学、医学、天文学、生物学、工学、社会学等其他学科紧密相连。随着网络的迅速发展,来自网络上的数据量大大增加,社会迫切需要具有数据分析能力与经验的人才。中国传媒大学自2015年开设大数据专业至今,开设了数据分析等相关课程。通过这几年的教学探索,笔者总结了一点心得体会。数据分析理论课程必须讲解经典常用的理论与方法,这些方法大多需要公式的推导,比较枯燥。而数据分析的实验课程需要应用各学科的实际数据进行编程分析,让学生真正体会到数据分析理论的作用,这样才能使学生具备一定的数据分析能力,毕业后可以直接面对工作中的问题。
(一)有助于培养大学生的科研素质
数据分析实验课程是将数据分析理论应用于实践的一门课程。毫不夸张地说,如果没有实验课程,学生就不能真正地理解数据分析的方法,就不能很好地从事未来的数据相关的工作。通过实验课程,学生可以提高两方面的能力:(1)发现问题的能力;(2)恰当运用理论方法解决实际问题的能力。在实验当中,通过数据采集,数据整理,数据分析等过程,培养学生一丝不苟的严谨的科学精神。
(二)有利于培养学生的实践能力
数据分析的实践必须依附于统计软件与工具箱,如Excel, SPSS, SAS, Matlab,等。这些软件虽然不难,但也需要从头学起,而且要想熟练掌握一个软件或语言,必须反复练习。数据分析实验课程不仅让学生学会了运用数据分析理论的同时,也锻炼了学生学习与应用软件的能力。
时代需要数据分析的人才。计算机的出现,网络的发展,使得当今社会的数据量呈爆炸式增长,如经济领域、金融领域、人口统计、医学领域和社会学等民生领域。怎样从这些庞大的数据当中选取我们需要的信息一直是科学家努力探索的事情。作为一名大学生,不仅需要掌握统计与挖掘的基础理论知识,还需要通过数据分析实验课锻炼理论与实际相结合的能力。
二、数据分析实验课程现状分析
数据分析实验课程不同于其他的计算机类实验课程。如C语言的实验课,教师布置一项题目,学生自行编码,实验过程中教师的主要任务是帮助学生找出编码中的错误。数据分析的实验课程一般由教师给定一个题目,学生进行数据收集,预处理,数据分析,最终获得结论。这其中的每一个环节都可能产生学生解决不了的问题,因此,实验课程应采取小班制,或者辅以研究生助手。如题目为采用matlab软件进行判别分析蠓虫问题[3]。数据收集:是直接在matlab中输入还是由其他文件导入?如果是输入数据,必须确定在输入无误的情况下才可以进行下一步,否则出错。数据预处理:数据本身是否需要归一化?归一化与不归一化的结果有何区别?数据分析:到底是采用总体协方差矩阵相同还是不相同的方法进行判别?不同的方法产生的结果是否相同?该如何解释每一种方法下的结果?获取知识:如果不同方法的结论不一致,该怎样抉择?不同的数据是否应考虑不同的方法?这些都是在实验过程中学生可能碰到的问题。通过对这些问题的思考与解答,学生了解到数据分析理论与应用的紧密性。
数据分析实验课可选的软件很多,如SPSS[4], SAS, Matlab, 等等。本人选用了SPSS与Matlab两种。SPSS是经典的统计分析软件,它具有大量成熟的统计分析方法,完善的数据定义操作管理,开放的数据接口以及灵活的统计表格与图形,很多著名公司都采用這个软件,掌握SPSS使学生能够更从容地面对未来的工作。Matlab是基于C的一个高级编程工具,它是一套高性能的数值计算和可视化的软件,集矩阵计算、数值分析、信号处理和图形显示于一体,软件本身有很多内置函数可以直接调用,也可以方便编写自己想要的程序代码,对于研究型的题目比较适合。采用这两个软件既可以使学生能够应对未来的就业问题,也可以提高他们的科研水平,为研究生阶段的学习打下基础。
三、数据分析实验课程存在的问题
目前有很多优秀的数据分析软件,可以为数据分析的实验提供准确快速的答案,尽管如此,数据分析的实践课程还是具有一定的问题与困难[5-6]。 (一)理论知识与实际问题结合困难
学生在数据分析理论课程上学到很多公式定理,怎样应用于实际问题中是首要问题。一般数据分析的实验题目通常都是教师提出,用给定的方法解决某一个问题。而实际问题需要学生自己面对并提出解决方案。比如,医学上,有一种病症X是一种常见疾病,目前有5种药物可以对其进行治疗,不同的药物对不同的病人有不同的疗效,新入职的医生不具备依据一定的经验来判断的能力,怎样训练一个决策支持系统是可以利用历史数据分析得到的。因此,理论与实际问题之间的关系是需要在实验课上把握好的。
(二)实验结果难以解释
数据分析面临的数据多种多样,很多学生由于预处理方法不同,采用的分析方法也不同,导致结果可能与给定的结果不一样,甚至相反。这就需要我们探究每一种方法的理论依据。由结果解释原因本身就是一个数据分析的过程,也是提高学生能力的一个过程。
(三)教学形式单一
一般的实验课程包括以下环节:教师给出题目,学生根据问题选取方法解决,给出报告,教师进行批改讲解等。许多计算机类的课程均采取这样的形式。这种传统的课程环节对学生来说比较沉闷,他们觉得没有成就感,大大削弱了他们的积极性。每次实验都采取相同的流程,学生一般属于应付式的思想,没有探索精神。
四、数据分析实验课程改革策略
针对以上讨论的数据分析实验课程的现状与问题,笔者总结出几点改革建议。
1.每个题目的考核办法除了报告之外,最主要是绘出一个Poster,即海报。Poster是报告的主要内容的精炼,将所有重要的结论展示在一张纸上,有图有表,有分析。让学生以合适的大小打印出来,答辩时展出Poster进行本题目的讲解。这种能看得到成果的方法既可以提高学生的自信,也可以增加趣味性,提高学生参与的积极性。通过讲解与Poster的结合,其他学生一下可以比较出自己的优势与不足,在以后的实验课中予以改进。Poster一般是会议的一项内容,主要陈述参会者的主要贡献,在这里采用这样的方法亦可以让学生提前演练参与会议的流程。
2.在理论课的讲解中,每一个算法后面都加入该算法的实际應用问题,如本算法的局限性是什么,优势是什么,在解决什么问题时比较有效。这样,在实验课中,教师提出问题之后,让学生迅速回想都有哪些方法可以解决这个问题。在讨论确定了可选用的方法之后再进行实验操作,这样从源头避免了一些问题的产生。
3.实验过程中将学生分组进行讨论。学生2—3人一组,编程时自己独立实现,结果运行成功之后讨论结果的有效性与正确性,最后由教师讲解。让学生先讨论的办法可以节省教师逐一解答的时间,提高课堂效率,也促进了学生之间的相互交流,培养团队意识。
科学的进步与发展,不仅要求大学生不断提高自身的能力,同样要求教师提高教学质量。作为计算机相关专业的核心课程,数据分析的作用是至关重要的,而数据分析实验课程是数据分析课程重要的组成部分,怎样上好实验课程是笔者一直学习探索的问题。本文通过分析数据分析实验课程的现状与问题,提出了几点建议,并运用于实际授课过程,取得了不错的效果。当今社会,信息技术人才与统计应用人才排名位列就业需求榜的前列,具有统计知识与计算机知识的复合型应用人才在未来具有巨大的发展潜力。因此,学好数据分析理论课与实验课等相关的课程对当代大学生的未来发展具有重要意义。
参考文献:
[1]赵卫东,赵洪博.基于项目沉浸式的数据分析类课程教学研究[J].计算机教育,2017,(6).
[2]张蕾,魏立斐.大数据时代下“数据分析”课程的探索[J].教育教学论坛,2015,(25).
[3]吴礼斌,李伯年.MATLAB数据分析方法:第2版[M].北京:机械工业出版社,2017:115.
[4]薛薇.基于SPSS的数据分析方法:第3版[M].北京:中国人民大学出版社,2016:1.
[5]张慧.信息管理专业数据分析课程实验教学研究[J].计算机时代,2015,(10).
[6]李玉峰,汪洁明,贺玲,等.实验设计与数据分析教学的紧要性[J].当代教育理论与实践,2016,(5).
转载注明来源:https://www.xzbu.com/1/view-15230272.htm