基于校园大数据的学生画像系统应用研究

作者:未知

  摘  要: 随着我国教育事业的蓬勃发展,各高校都在经历着从数字校园到智慧校园的信息化形态升级,开始将大数据技术运用到教学管理、资源优化等工作上,旨在提高教师和行政人员的工作效率,同时也更加全面、具体地开展学生的培养工作,更好地服务于学生。因此,基于校园大数据的学生画像系统应运而生,为精准教学管理、提高教育质量开创了新的方法。本文提出了基于校园大数据的学生画像系统,介绍了该系统的数据来源与实现技术,验证了该系统的实用场景。
  关键词: 学生画像;画像系统;校园大数据;大数据技术;数据分析
  中图分类号: TP393    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.08.012
  本文著录格式:冯广,何雅萱,贺敏慧. 基于校园大数据的学生画像系统应用研究[J]. 软件,2020,41(08):40-42
  【Abstract】: With the vigorous development of education cause in our country, various universities are experiencing wisdom from digital campus to campus information form of upgrade, began to big data technologies into teaching management, resource optimization, etc, to improve the working efficiency of the teachers and administrators, but also a more comprehensive, specifically the cultivation of students’ work, better service to students. Therefore, the student portrait system based on campus big data emerges as The Times require, creating a new method for accurate teaching management and improving education quality. This paper proposes a student portrait system based on campus big data, introduces the data source and implementation technology of the system, and verifies the practical scenario of the system.
  【Key words】: Student portraits; Portrait system; Campus big data; Big data technology; Data analysis
  0  引言
  在校園学生管理和大数据的时代背景下,校园大数据开始流行,各高校都开始运用人工智能和大数据等新兴技术来提高教学质量、优化资源管理和教学管理等,将大数据技术应用在校园的信息化建设已经成为一种趋势[1]。众所周知,随着网络的不断发展,学生的日常学习和生活会产生数量繁多且趋于复杂的数据,如何有序高效地管理这些数据,并从中得到有用的数据进行分析成为当下最需要解决的问题。
  学生画像系统建立在海量学生的学习生活数据的基础上,以学生为主体,通过对学生个人特征以及其学习习惯和生活行为进行数据挖掘,从学生的特征出发, 赋予学生画像标签,分析不同学生的行为习惯之间的差异,为学校智能化管理提供理论依据[2]。因此,本文提出基于校园大数据的学生画像系统,以学生学习生活特征为主体,从画像的角度挖掘学生差异,并分析学生学习生活习惯是否正常。
  1  主要数据来源及技术框架
  1.1  主要数据来源
  以某高校学生学习生活行为作为主要研究对象,搭建大数据平台,对学生画像进行分析,得到每个学生画像对应的个性标签。由于学生的各项原始数据量庞大且相对比较分散,需要经过筛选才能应用到实际中,本文对原始数据进行剔除或者补充操作等相关数据预处理(包括数据的修复和剔除以及数据的归一化处理等)后,形成相关数据集。表1为学生的学习生活数据来源,数据大致分为五部分:一卡通系统数据、学习数据、图书馆数据、门禁系统数据、校园Wi-Fi系统数据。大数据平台可根据这几部分的数据对每个学生进行行为画像,从多个方面来分析每个学生的日常生活轨迹,实时获取各学生的学习生活动态,为学生提供更加个性化的服务,使校园生活变得更加丰富多彩。
  1.2  技术架构
  任何系统都不是孤立的,它和周围环境在相互作用下可以按特定关系组成较高一级的系统。为保证本系统的有序性与层次性,本文将系统层次结构划分为4层:(服务)应用层、平台层、采集层、数据源。系统层次之间,各依自己的职能,实现系统的目标计划,保证系统有序高效的进行运转。如图1所示。
  (1)数据源:数据源大致包括一卡通系统数据、学习数据、图书馆数据、门禁系统数据、校园Wi-Fi系统数据、门禁系统数据。
  (2)采集层:本文采用ETL工具实现对各数据源的采集,配合基于Flume的实时流数据采集,采用Kafaka实现实时流调度处理,为实现大数据实时计算与分析作准备。同时,对采集的数据源进行数据清洗与处理,解决数据缺失、数据重复、数据错误等问题,最后将数据提取并传送到大数据CDH平台。   (3)平台层:本文采用CDH平台对大数据的存储、备份、查询以及运算提供服务,承担数据管理的核心功能。在CDH平台上安装Hadoop组件,快速搭建能够稳定运行的数据计算框架。本文CDH平台中,采用HDFS分布式文件系统,利用Hive分布式存储技术,实现对大数据仓库平台中的数据分类存储。最后根据某高校的需求,对大数据仓库平台中的数据进行分析与挖掘处理,通过sqoop导出至MySQL数据库。
  (4)(服务)应用层:提供统一的应用操作界面和信息展示窗口,是系统直接面向操作用户的部分,将所有收集分析的数据结果以客观的形式呈现在界面上,供学校师生查看,老师能实时关注学生的近期状态,及时发现问题,对同学采取一对一帮助,而同学也能过通过此界面进一步了解自己的生活学习状态,及时调整,让自己的生活变得更加的积极向上。
  1.3  学生个性标签
  学生群体基数很大,需要运用大数据技术收集和掌握学生信息,对学生数据进行处理,从而根据收集到的学生信息行为构建全方位的学生画像。标签提取来源于各个数据源系统,数据通过ETL 抽取后,经过数据清洗、提取,制定学生标签维度,并将标签应用于大数据平台中。学生的标签维度如图2所示。基于一卡通系统数据、学习数据、图书馆数据等数据源,构建立体式学生画像,形成集数据汇聚、标签管理、标签库、服务策略、场景输出于一体的学生标签管理体系,在学生行为存在异常时及时预警,从而保证学生的安全。
  学生标签体系分为数据采集层、标签库层与应用层。通过数据的归一化处理,并结合学生标签维度及标签体系的生命周期给学生标注标签,形成学生画像。学生标签体系如图3所示。数据采集层包括一卡通系统数据、学习数据、图书馆数据、门禁系统数据、校园Wi-Fi系统数据、门禁系统数据。数据预处理后放入CDH平台。标签库层包括学生的基本属性以及其他行为两大块。基本属性为学生的详细个人信息,即姓名、学号、宿舍号等。其他行为为学生的日常活动轨迹,即三餐消費、进出图书馆情况、上网时长等。两大块相辅相成,当某学生行为出现异常时,管理人员可根据基本属性板块快速了解异常学生的个人信息,做出应对措施。应用层包含综合画像分析、标签查询、标签反馈等功能。可对标签进行成果查询展示,可以展示个体、群体、分类群体的画像,也可以查询展示具备某一共同特征的自定义群体画像。
  2  学生画像系统在某高校的应用场景
  某高校的学生画像系统主要是依据大数据平台搭建前端服务应用,通过后端业务和平台整合,充分考虑系统建设的前瞻性和可扩展性,构建智能服务外部应用一体化服务平台。基于校园大数据,根据学生多维度画像,多方位描述学生的行为特征,为服务决策提供数据支撑,为学生更好地提供差异化服务。
  校园大数据是教育大数据的一个子集,是师生生活、教学、科研、管理和服务过程中产生的各类数据,以及各类校务管理的状态数据,具有数据种类繁多的特点,其中蕴含极大信息价值,充分发挥其作用是实现学校战略目标不可或缺的一部分。某高校通过采集一卡通系统数据、学习数据、图书馆数据、门禁系统数据、校园Wi-Fi系统数据、门禁系统数据,对学生个人以及群体画像,对全校整体状态进行分析,如图4所示。
  根据收集到的数据,某高校根据学生的消费情况、图书馆图书借阅情况、学业成绩情况等完善学校管理,在不改变现有校园信息系统建设模式,最大限度利用现有信息系统等基础设施的前提下,为校园的教育、教学创新提供数据分析支持。与此同时,本系统还能通过数据分析得出危险预警,让老师即使发现学生的不良情况,如心理危机、学业困难、身体疾病等。如图5所示。
  3  结束语
  总而言之,大数据带来的巨大价值正在逐渐地被人们认可,基于校园大数据的学生画像系统的应用对学校与学生都起到了积极作用,学校通过此系统能更好更快速地进行学生工作的组织与管理,学生也能通过此系统更全面的了解自己。大数据与校园管理的结合日渐成熟与普及,通过大数据技术的不断创新与发展,以及对数据的全面感知、收集、分析与共享,我相信基于校园大数据的学生画像系统一定会会成为学生管理的全新方法,是学生工作与管理得到最优化,让人们充分利用数据资源,挖掘数据价值,为校园管理智能化的发展提供有力支撑。
  参考文献
  [1] Big data: The next frontier for innovation, competition, and productivity[R]. USA: McKinsey and Company, 2011.
  [2] HU Q Q, Analysis of behavior characteristics based on students’ personal data [D]. Central China Normal University, 2019.
  [3] DATA CENTER FILE SYSTEM DEBUTS ON GOOGLE CLOUD[J]. Worldwide Videotex Update, 2019, 38(1).
  [4] GE L H, GUO H, etc. Research overview of big data industry [J]. Journal of North China University of Water Resources and Electric Power (Social Science Edition), 2019, 35(03): 1-8.
  [5] The Analysis and Application of the C4. 5 Algorithm in Decision Tree Technology[J]. Zhao Hong Yan. Advanced Materials Research. 2012 (457).   [6] Predicting distresses using deep learning of text segments in annual reports[J]. Rastin Matin, Casper Hansen, Christian Hansen, Pia M?lgaard. Expert Systems With Applications. 2019.
  [7] A profile of physical activity, sedentary behaviors, sleep, and dietary habits of Saudi college female students[J]. Hana Alzamil, Manan Alhakbany, Nora Alfadda, Sarah Almu-sallam, Hazzaa Al-Hazzaa. Journal of Family and Community Medicine. 2019 (1)
  [8] Adolescent digital profiles: A process-based typology of highly engaged internet users[J]. Eleni C. Tzavela, Chry-ssoula Karakitsou, Eva Halapi, Artemis K. Tsitsika. Com-puters in Human Behavior. 2017.
  [9] HUBERMAN B A. Sociology of science: big data deserve a bigger audience[J]. Nature, 2012, 482(7385): 308.
  [10] GOLDSTON D. Data wrangling[J]. Nature, 2008, 455. (7209): 15.
  [11] SONG I Y, ZHU Y. Big data and data science: opportunities and challenges of iSchools[J]. Journal of Data and Infor-mation Science, 2017, 2(3): 1-18.
  [12] ZAKI A M, THEODOULIDIS B, SHAPIRA P, et al. The Role of Big Data to Facilitate Redistributed Manufacturing Using a Co-creation Lens: Patterns from Consumer Goods[J]. The soth CIRP Conference on Manufacturing Systems, 2017, 63: 680-685.
  [13] ISMAIL M, IBRAHIM M M, SANUSI Z M, et al. Data mining in electronic commerce: benefits and challenges[J]. International Journal of Communications Networkand Sys-tem Sciences, 2015, 8(12): 501-509. http://dx.doi.org/10. 4236/ijcns. 2015. 812045.
  [14] IBM. The 5 V’s of big data[EB/OL]. (2016-09-17) [2018-12- 21]. https://www.ibm.com/blogs/Watson-health/the-5-vs-of- big-data/.
  [15] Yesheng Cui, Sami Kara, Ka C. Chan. Manufacturing big data ecosystem: A systematic literature review[J]. Robotics and Computer-Integrated Manufacturing, 2020, 62.
转载注明来源:https://www.xzbu.com/8/view-15321859.htm

服务推荐