基于MOOC数据挖掘的学习行为与成效研究
来源:用户上传
作者:
摘 要:MOOC的出现推动了教育平台的发展,为不同人群提供了门类众多的在线学习资源。在学习过程中产生了学习时长、播放天数以及学习章节数等相关数据。本文根据MOOC相关学习数据,利用K-Mean聚类的方法对不同人群学习行为进行聚类,探讨了学习行为与学习成效的关系,以期为MOOC教育和发展提供有益参考。
关键词:MOOC;数据挖掘;学习行为;学习成效
Abstract:The emergence of MOOC promotes the development of education platform and provides a wide range of online learning resources for different groups of people.In the process of learning,relevant data such as learning time,playing days and learning chapters are generated.Based on MOOC related learning data,this paper uses K-Mean clustering method to cluster learning behavior of different groups,and explores the relationship between learning behavior and learning effectiveness,in order to provide useful reference for MOOC education and development.
Key words:MOOC;data mining;Learning Behavior;Learning effectiveness
随着网络技术的发展,教育发展过程中逐步引入慕课新形式,受到各类学校的欢迎。该教学模式能够更好地实现学习和学习者的自由化,能够有效满足不同阶段、不同人群的学习需求。在学习过程中产生了学習时长、播放天数以及学习章节数等相关数据,根据慕课的数据分析能够进行有效的学习研究,得出学习过程与成效之间的关系,据此继续加强个性化学习方式的设计。
为了做好慕课当中的数据分析,本文主要以某MOOC平台中的慕课数据作为基础,进行数据的分析,广泛涉及了十个不同的科目、二百堂课的学习状况,将所有数据整合起来,形成三十多万个数据样本,其中,每条样本显示了一名学生在一门课程中的学习情况,其中,学习情况包括了课程的内容、学生的信息、学习目标、学习频率和学习效果。本文将对主要针对学生学习行为数据进行学习成效探究分析,以期为MOOC学习和发展提供有益参考价值。
1 K-MEAN聚类算法
K-MEAN算法是典型的距离聚类算法,基本原则是两个对象距离越近相似度越高,然后可以把距离较近的划分一个簇,簇内需要距离保持最小,不同簇间保持距离最大,其基本流程如图1所示。
如图1所示,首先选取K个质心,然后计算各个数据样本到该质心的距离,然后将其归到最近的质心类,再计算新类的质心,判断其是否小于或等于原质心指定阈值,如果满足,则结束,否则重复上述步骤,即可进行较好的聚类。
2 用户学习画像分析
本文选取了某MOOC平台的用户学习的天数(Learning Days-LD)、播放时长(Play Time-PT)、章节数(Chapter Number-CN)、发帖数(Post Number-PN)等特征,利用K-MEAN进行聚类分析,分析结果如下表所示。
由上表可知,根据LD、PT、CN、PN四个特征,把学习人群大概分为Cluster1-4,共四类。Cluster1:LD、PT、CN和PN指标均较少,属于MOOC体验者;Cluster2:有一个明显特征与其他类不同,即PN均值高于其他类,属于积极好问者;Cluster3:各项指标处于中等水平,表现良好,属于积极探索者;Cluster4:学习时长、播放时长、学习章节数处于较高水平,属于MOOC学霸用户。
3 学习行为与学习成效分析
根据上述聚类结果,本文分别对上述四类用户的学习成效进行了统计分析,分析结果如图2所示。
由图2可知,第一类用户学习效果较差,成绩均值以及获得证书数量均较少;第二类用户为积极好问型用户学习成效明显高于第一类;第三类用户为积极谭索型用户学习成效较好;第四类终极学霸型用户,学习成效最佳,成绩均值以及获得证书情况明显高于其他用户。
4 分析结果讨论
4.1 学习者的情况与行为的关系
首先,当学习者进行主动形成时,在慕课上的活跃天数、学习数量、完成程度和论文或意见发表次数都比较高,但是在被动的人里,其完成程度比较高,比主动的人更高。其他类型的人则在各项数据上都比较低,数据表明,当形成主动学习的习惯之后,他们能够按照自己的学习需要进行高频率的课程参与,相反,其他类型的人则较少参与到课程的学习中,其中,学习上较为被动的人则会根据学习需要进行针对性学习,为了达到任务要求而参与到学习当中。
4.2 学习目的的不同与行为的关系
在调查的过程中,主要将学习群体分为以下几种情况,一种是入学考试、一种是工作需要、还有的是纯粹为了提升自我,另外还有一种是为了培养自己的兴趣。按照数据分析的结果来看,在准备入学考试的人群在各项指标上都比其他人群高,工作需要的人在完成程度上也比较高,而其他两种人群虽然也在学习中呈现出很大的热情,但是在学习数量、频率上没有硬性要求,这说明他们在学习频率上没有要求,而是按照自己的空闲时间确定自己的学习时间,具备一定的随意性,缺乏计划性。 4.3 学习人群的信息与行为的关系
在学习群体的信息调查中,不仅对其职业的调查,还对其年龄进行调查,并做出详细的分析,将这一群体中的年龄划分为三个阶段:三十五岁以下、三十五岁到五十五岁、五十五岁以上。从结果的分析中可以看出,所有数据的增长与年龄的增加成正比,这就说明年纪稍长的人群在学习过程中更加规律,具备更好的计划性,这一结果可以在学习过程中以弹幕的形式告知学习群体,增加他们学习的热情,不断提升他们学习的频率。
4.4 学习过程与学习结果的关系
在进行数据分析的过程中发现,学习过程中的活跃程度、意见等发表频率、学习数量等都和学习结果成正比,其中,学习数量与学习结果的相关程度最低,学习程度与其关系最高。
5 结语
本文以MOOC数据进行学习行为与学习成效的探讨分析。根据学习天数、章节数、发帖数以及播放时长,对MOOC用户进行了聚類分析,利用K-MEAN聚类算法将其聚为四类用户,并探讨相应的学习行为与学习成效的关系。在未来,随着个性化学习理念的深入,慕课学习将更大范围地应用在各个学习群体当中,因此,需要慕课根据不同时期的数据分析进行课程调节,为学习群体设定最恰当的模式,也可以设置系统评价机制,搜集建议,做好革新,做好课程设置工作。
参考文献:
[1]陈兰岚,宋海虹.基于MOOC数据挖掘的学习行为和学习成效分析[J].教育教学论坛,2019,(6):50-51.
[2]陈若航,常朵.基于数据挖掘的MOOC学习行为与学习效果研究[J].太原城市职业技术学院学报,2017,(12):178.
[3]张大胤.基于互联网环境下学习行为的数据挖掘研究——以MOOC学习行为研究为例[D].广西师范大学,2018,(12):10-11.
[4]王洪岩.MOOC中的学习行为挖掘研究[D].山东大学,2016,(10):5.
基金项目:重庆师范大学涉外商贸学院科研项目(数据挖掘在MOOC用户行为分析中的应用研究)-ZGKY2018008;重庆师范大学涉外商贸学院科研项目(基于教育大数据的学生学习行为分析研究)-ZGKY2018003
作者简介:林麒麟(1989-),男,河南信阳人,硕士,主要研究方向:数据挖掘与人工智能;李川(1982-),男,重庆人,硕士,实验师,主要从事教育信息化、数据挖掘、计算机应用等研究;俸世洲(1981-),男,四川广汉人,硕士,讲师,主要研究方向:数据挖掘与深度学习。
转载注明来源:https://www.xzbu.com/1/view-15112645.htm