网络课程学习行为数据采集分析研究现状
来源:用户上传
作者:杨蕴昊
摘要:本文对学习网络课程的行为进行分类,并分别就学习行为数据采集及挖掘分析方法现状进行了梳理与总结,为完善网络课程学习行为数据采集模型提供理论依据。
关键词:网络课程学习;行为数据采集分析
中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2019)06-0237-02
近年来,随着信息技术的飞速发展和互联网技术的全面普及,大量用户行为数据随之产生,由此,大数据概念应运而生。结合互联网技术教学的网络教育和大数据,驱动教育向个性化、智能化方向发展已成为必然趋势。如何针对网络课程学习构建有效的行为数据采集模型,以此追踪和收集的行为信息,更准确地分析学习者学习风格和学习偏好,优化教学资源配置,支撑各类学习者更好地学习网络课程,成为了网络学习领域中非常有价值的研究课题。
一、网络课程学习行为
网络学习行为数据的采集模型主要关注两方面:实际操作行为和知识内化的过程。实际操作行为主要体现为学习网络课程时的显性操作,是其进行学习时的外部直接表现。根据目前我院网络课程中学习者的实际操作进行归类,大概可分为:媒体操作、记录操作和共享操作。通过记录这些学习时的简单操作,可以了解学习者在何时何地发生了什么样的学习行为,为评价学习效果奠定基础。知识内化的过程主要指进行知识加工理解的过程。目前我们的网络课程中,可以通过留言反馈、学习评价等行为进行此方面数据的采集与分析,挖掘学习者的个性特征,了解学习效果。目前,我们需要的网络课程学习行为数据采集与学习平台数据采集略有差异,需要有针对性地进行追踪并分析。
媒体操作:网络课程中核心的多媒体资源就是教学视频,记录分析视频学习动作的行为数据就显得尤为重要。这些操作,又可以大概归为视频快进、快退、拖动、暂停、静音等动作以及视频观看时长这两种类型。记录视频中的学习动作发生的位置与频率,可以帮助教师了解视频中哪些内容是学生需要多学、难学的。针对观看时长的数据进行分析,则可以了解到学生看视频注意力集中的规律,进而能更有效地对教学视频进行碎片化,适应学习偏好。
记录操作:在网络课程的学习过程中会产生大量文本性质的浏览记录,浏览的页面、点击的次数、访问持续时间、学习动作顺序等,记录下这些学习动作,有助于了解学生的学习风格习惯,优化教学设计。
共享操作:目前主要指记录离线下载资源,以及将某个学习页面收藏到收藏夹中的内容与次数。
留言反馈:目前我们的网络课程可针对单个知识点或整门课程进行留言反馈,在这两个模块收集到的评论、讨论、提问、解答、总结等文本信息是了解学习偏好的重要基础数据。我们需要将这些数据整合分析,进而做到更好地进行个性化服务。
学习评价:在网络课程设计中,增加了视频节点测试、知识点练习等,记录这些节点测试的正确率和错误率、完成测试的时间、通过测试的次数等数据,并进行深入分析,得到学习者的学习模式,也可以结合学习者的操作记录为过程性评价提供有力的数据支持。
二、网络数据采集分析方法
在采集媒体操作数据方面,东北大学的李帅为了能够分析出观看视频时的暂停信息,采用K-means的聚类算法,对学生在观看视频时选择暂停的位置进行了聚类。通过暂停的位置分析了暂停的原因,进而获得了需要设置不同视频清晰度和学生学习难点位置的学习行为需求信息。目前对于记录操作的采集模型有很多。如较早的有胡运安基于SCORM规范设计的学习行为采集模型,利用后台数据库储存,使用SOAP消息处理、XML数据封装技术完成数据传输。但是他的系统设计仅跟踪了学习行为,对体现学习者个性的学习行为分析未作更深入的研究。王巧玲在Web服务的环境下,初步设计实现了网络学习行为采集和集成(EBCI),采集的对象包括:访问的页面、访问开始时间、访问持续时间、IP地址、访问次数、访问页面的引用页等。EBCI以服务器端的Web日志中采集Cookie记录的学习行为作为数据源,不依赖平台与厂商,利用XML语言作为基础实现了数据共享,但该技术主要是针对跨平台数据的收集共享。黄克斌分四个模块提出了网络学习行为模型,并设计了一个智能化网络学习行为分析系统结构。具体到其中之一的数据采集模块中时,他使用了异步和同步两种采集方式,来分别进行静态和动态数据的采集,但只是针对学习行为进行了智能化地分析,没有提出完善有效的模型系统。张玉芳针对在多用户、多Web站点的网络访问环境下,提出了超文本传送协议(HTTP)请求与数据清理过滤的采集方法,引入网络嗅探的方式采集数据,并过滤了大量传统方法无法过滤的请求记录,有效地抽取出反映用户显式点击的页面请求,為下一步的数据挖掘提供了更加准确的数据源。李帅等以本校资源共享课平台为实例,基于Web日志的数据挖掘,获得有用的信息。但是服务器日志中储存的数据大而庞杂,难以针对某项学习行为获得完整的数据文件,因此作者采用客户端采集行为数据的方式,将脚本语言嵌套在服务器端,采集学习行为数据对MOOC教学起到了较大的帮助。在留言反馈的采集模型方面,夏天以论坛中的公共网络舆情数据采集为例,利用聚焦网络爬虫技术,通过限定爬行方向,引入页面继承,实现互联网数据的深度定向采集。采集到的数据包括用户发布的话题、评论以及涉及的图片等隐性行为。但是研究采用的爬虫技术只适用于评论类行为,不能采集到总结反思等隐性行为。收集学习评价的学习行为数据时,魏德生通过对网络学习行为的分析,依据档案袋评价的启示,以安全性和稳定性都较好的Tomcat作为服务器,以SqlServer2000为后台数据库,设计了学习行为数据自动记录和结果统计展示的监控系统。该系统可以自动记录测试情况,并进行深入地数据挖掘。马潇同样采取了Web日志挖掘的技术收集数据,引入层次分析法,对学习态度、学习方法、学习过程三个一级指标设置权重,从而对网络学习者进行综合评价。但是他只给出了评价信息自动采集的设计思路,没有具体实现。元帅将在线学习行为分析评价模型分为采集、统计、分析三个模块,采用基于Web服务和Web日志,使用不同的数据库支撑的方法进行采集和统计。同时,通过设置评价指标的权重和加权平均法分析学习结果、采用非量化评价和分类数据挖掘进行学习方式评价。此外,还有一些研究对知识内化过程的采集和挖掘进行了综合设计。我们在建设网络课程学习行为数据模型时也做部分参考。刘均等较早地提出了一种面向个性化网络学习的学习者个性挖掘方法,通过分析样本学习者个性特征与学习行为模式,挖掘出关联规则,进而推理之后的行为模式,动态地获取其个性特征。这个方法已经基于CMI示范系统进行了验证,实现了学习个性的自动获取。王志梅等文章中提到了E-learner档案模型的建立,该模型使用Agent监控学习行为数据,通过不同特征的学习行为来评估学习特征,构建电子档案袋系统供定制分享。吕莉也提出使用Web服务技术及移动Agent技术采集网络学习行为。廖竞等结合基于Web服务和Web日志挖掘的数据采集与分析方法,在服务器或网关上使用netmate进行数据流捕获,处理并输出为文本,然后使用文本挖掘的成熟算法进行处理,得到网络学习者学习的特点、偏好等学习规律,帮助教育者进行教育学分析,从而有效指导网络学习和教学的建设。这个基于数据流获取的网络学习行为数据采集与分析的方案系统具有较强的灵活性和实用性。陈红珍在网络学习行为相关研究的论文中设计了一种采集方法:采用点击流数据仓库技术对学习行为进行采集挖掘,来更好地了解学习者的个性和状态。点击流数据仓库是指把日志里记录的大量点击行为的数据再加工,形成面向分析的、体系化的、综合的数据仓库(DW)。DW可以在描绘学习者行为视图和存储大量历史数据的基础上,进行学习行为分析。
三、总结
网络课程在面向全社会学习者的同时也产生了海量的数据,建议在采集、提炼这些庞杂的教育数据时,针对不同种类的数据使用不同的采集方法。对于媒体操作,可以使用K-means聚类算法对数据库中的对象集合分割,再挖掘数据中的信息;针对操作记录主流的采集技术有Web服务、Web日志挖掘、Agent等;留言反馈的数据采集可以使用聚焦网络爬虫技术;收集学习评价的学习行为数据时,可以使用网络学习行为自动监控系统中的技术统计挖掘数据。综合多种手段,以期能更好地追踪和收集学习者行为信息,更准确地分析学习者学习风格和学习偏好,从而优化资源配置,适应混合式教学需要,配合建立多元化学习评价,提供个性化服务,最终提高教学质量,满足各类学习行为的需要。
参考文献:
[1]王巧玲.基于Web服务的网络学习行为采集与集成初步设计与实现[D].华中师范大学硕士学位论文,2007.
[2]魏德生,杨雪.网络学习行为自动监控系统的设计与实现,教育信息化,2006,(1).
[3]廖竞,张晖.一种灵活的网络学习行为数据采集与分析系统,信息与电脑,2011,(1).
转载注明来源:https://www.xzbu.com/9/view-15168931.htm