基于大数据在高职院校教学中的应用研究
来源:用户上传
作者:
摘要:本文介绍了当前情况的数据挖掘技术和研究现状,论述了关联规则、时序模式等相关算法,分析了数据挖掘技术在高职教育教学中的相关应用及未来的发展趋势,探讨了在大数据时代数据挖掘技术面临的挑战。
关键词:大数据;高职教学;关联规则;时序模式
中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2020)01-0024-02
随着国内高等职业院校招生人数和院校数量的增加,目前全国高职院校近2700所,今年又扩招职业院校学生100万,这种形势下给学校教育教学管理工作带来严峻考验,传统的教学管理手段已逐渐不能适应社会的发展,但是,原有这些教学教务信息会成为高职院校丰富的信息资源,随着大数据时代的到来,学校面對这些大量的数据信息时并未完全进行隐含信息的挖掘和分析,而依然采用传统的甚至还采用纸质的管理方法,这在当前的大数据时代,在当前尤其需要大量高级职业技术人才的时代背景下,这种教学管理模式显然已经落伍。
目前大数据环境下数据挖掘技术日渐成熟,高职院校已开始将数据挖掘的相关技术应用于教育教学管理之中,即对教学中产生的数据库或数据仓库中的数据信息进行提取、分析、建模等工作,从分析结果中找出教育教学的日常规律,并指导教学,甚至也可以为学生今后的就业提供有力的指导和帮助。
1 大数据与挖掘技术的现状
大数据时代缺少不了数据挖掘技术,它是汇聚了多个学科的交叉性学科,即从庞大的数据库或数据仓库中,将未知、隐含或具备潜在价值的信息进行提取和分析的过程。1995年,加拿大蒙特利尔市召开的第一届知识发现和数据挖掘国际学术会议上提到数据挖掘技术,即数据挖掘的整个过程,主要包括:分类、聚类、模式挖掘和规则提取等环节,之后技术领域专家逐渐地形成了一整套的理论基础[1]。经实践研究发现数据挖掘技术可以独立的身份存在于处理大数据的整个系统之中,与其他模块之间相辅相成、协调发展。
自上述事件以后,大数据中数据挖掘技术的研究和应用受到业界的高度重视。与此同时,在教育信息化也搭乘了大数据的快车得到广泛的应用。利用数据挖掘分析学习者特征、状态或者行为,利用得到精准分析结果帮助学习者修正自己的学习行为,改变学习方法,对教师而言,根据分析结果合理设置课程,进行学习评价,提高教学质量,有效进行教学管理。
2 课堂教学中主要的挖掘技术
数据挖掘所牵涉的领域方向比较广,下面主要介绍挖掘技术中的关联方法和时序模式方法。
2.1 关联方法
关联方法是从数据库中提取知识的一类重要方法,若两个或多个数据项的取值之间重复出现且概率较高时,就可以建立起这些数据项之间的关联方法。其形式如下:X→Y(a,b)其中X、Y为不相交的两个项目集合,其含义为在交互中X项目集的发生将会导致Y项目集的发生,则认为X和Y之间存在某种关联关系,此时,我们认为X项目集为关联规则中的支持度,Y项目集为关联规则中的信任度。关联规则算法就是从交互数据库中找出满足用户需求a(大于最小支持度)和b(大于最小信任度)的关联方法[2]。
a.设I ={I1,I2,...Im}是的属性集,称为项,给定一个存储教学数据的数据库D,其中每个记录T是项对应的数据集合,满足T包含于I,每个记录都有一个标示符,称为TID,X是I的子集,如果XT,则称T包含X;如果X的元素个数为K,则可以称为X为K-项集(K-Intemset)。
b.如果项集XI,YI,并且X∩Y=,则形如X→Y的蕴含式称为关联规则,其中,X是规则的前项集,Y是规则的后项集,它表示包含X项集的因子T也很有可能会包含Y项集。如果包含X的因子有c%也包含Y,那么规则X→Y的置信度为c%;如果D中有s%的因子包含X∪Y,那么规则X→Y的支持度为s%,其计算表达式分别为:
在大型数据库中通过支持度a和信任度b两个关联值进行提取数据项,删除那些无意义的关联数据项,而信任度是衡量设置规则的可能性。
例如:如既能正确回答课堂提问又能及时有效的做好课堂笔记的学生占全班学生的百分比,这种学生通常学习成绩都较优秀。
2.2 时序模式方法
时序模式是主要与时间有密切关联的方法,强调时间前后的影响,通过时间序列找出重复发生概率较高的数据项的模式方法。即按时间先后顺序查看时间数据项数据库,从中找出另一个或多个相似的时序数据项[3]。
3 关联规则的具体应用
以创新学院为例,教师在讲授,学生在被动的接受知识和技能,其过程中以学生点名册,学生平时成绩表为辅助,对学生进行监督和较粗略的评分,而没有就过程中产生的问题进行后续个性化的智能分析与精准反馈服务。在创新学院每学期近1.6万学时,每个班级,每节课的学生课堂信息反馈都会所变化,从中找出学校在过程中反应的客观规律,而挖掘技术的数据依据是通过记录学生点名表,平时成绩表进行分析,通过监测打开网络资源的时间点、停顿资源上的时间长度,回答问题正确率等判断学生处于学习状态的认真程度和对知识的掌握程序,进而可以定制个人学习行为报告,为后续的专业课学习预测提供技术上的支持[4]。
3.1 数据的采集与处理过程
大数据是面向过程、多种类型的数据集合,其中网络资源类数据和学生行为数据占主要部分,只有采集到常态化海量的学生每次学习过程中数据,才能为此建立模型,进而客观理性的学情分析和学业水平评估。而数据采集可以使用“电子数据”和“纸质数据”相结合的办法,电子数据可以是“点击网络资源的时间”、“停留在资源的时间”以及电子版作业和实验完成率和正确率等,同时还可以通过监控确认学生课堂玩手机、听耳机现象的时间和瞌睡时长。而纸质数据依然采用传统的办法进行[5]。如图1所示。
3.2 精准的数据带来精准的教学 常规的表格数据,如:学生平时成绩和期末考试成绩统计等说明的情况比较粗略,不能完全反应学生学习整体过程情况,更不能精准反应学生出现的具体问题,也就不能真正掌握学生行为动态,学生日常学习过程的行为数据是海量的,离散的,需要专业人员根据实际需要建立数据模型,再由专业挖掘人员进行提取、清洗、转換等,进行全面精准科学的分析,生成对学生学习、教师等有价值的行为报告,为每个学生提供精确指导。
一所院校的这些称不上是大数据,那么如果将100所,甚至更多职业院校的类似数据聚集在一起,进行数据挖掘和智能分析,从中找出课堂教学中反映的问题,从而更有效的指导学生学习。
3.3 大数据使进教学改革和教学形式的多样化
随着大数据、智能化时代的到来,类似资源不断为学生推送个性的学习资源,从这些资源中可以完成听课、练习、实验等众多环节,而无需只依赖于课堂教学。这样为学习创造更高效的学习和自由的学习环境。
同时,充分利用上述提供的大数据平台,学生的表现、优势和劣势在数据平台中展示,帮助教师精准诊断每个学生的精准学习需求和知识空缺,并提供针对性的指导,营造支持性的学习环境,引导并帮助学生自适应的学习、智能交互学习,让学生不断从中认知自己。
4 结语
关联规则的支持度和信任度是分析学习过程潜在的规律和关联项,主要关注学习特点、行为倾向,利用建立的模型和分析报告更加精准的反应学生状态信息,以学生为中心,使精准的个性化教育成为可能,学习能力是有差异的,对于强者需要进一步的激励与提升,对于弱者课后需要建立个性化的辅导答疑,教师在借助大数据的情况下,主动开展一些个性化的教学,包括录制一些理论知识的讲解视频或实操过程的视频,推送给不同层次的学生,指导他们自主学习。
参考文献
[1] 刘铭,吕丹.大数据时代下数据挖掘技术的应用[J].科技导报,2018,36(9):1-2.
[2] 杨光.教育大数据应用“获”与“惑”[N].中国信息化周报,2019- 10-14(008).
[3] 冯黎.关联规则分析技术在高职院校教务管理中的应用研究[D].兰州:兰州大学,2009.
[4] 陈桂香.大数据对我国高校教育管理的影响及对策研究[D].武汉:武汉大学,2017.
[5].孙秋年,饶元.基于关联分析的网络数据可视化技术研究综述[J].计算机科学,2015(S1):484-488.
转载注明来源:https://www.xzbu.com/8/view-15176301.htm