您好, 访客   登录/注册

学生成绩分析系统的设计

来源:用户上传      作者: 孙琳

  摘 要 本系统对用户需求做了较详细的分析,根据当前成绩管理的具体情况,介绍了数据挖掘相关知识,详细分析比较了数据挖掘技术的有关内容,选取决策树方法应用到学生成绩分析系统,对决策树算法进行了详细的介绍,并对其在成绩管理中的作用进行了阐述。
  关键词 学生成绩分析;数据挖掘;决策树
  中图分类号TP31 文献标识码A 文章编号 1674-6708(2012)58-0187-02
  1功能需求分析
  经过对系统的需求分析,学生成绩分析系统希望实现从数据采集到数据分析等一系列功能:包括学生信息管理、教师信息管理、成绩信息管理、课程信息管理、班级信息管理、学生成绩分析等各个功能模块。以下对几个主要功能模块做出描述:
  1)学生信息管理模块:包括学生的一些基本情况信息,它是进行成绩管理、统计报表生成的前提;2)教师信息管理模块:教师信息管理模块:包括教师的个人基本情况,在校期间的授课情况、科研情况、每学年考核情况等;3)成绩信息管理模块:学期课程结束后,各个教师可以在规定时间内录入自己所授课程的成绩,这样学生就可以查到自己各个学期的课程成绩并打印成绩单;4)课程信息管理模块:对课程基本信息的管理,课程的添加、删除、修改,以及课程学分、课程类型的更改;5)班级信息管理模块:完成学校班级信息的添加、删除、修改功能;6)学生成绩分析模块: 主要是对学生成绩信息作相关分析。
  2 系统业务流程
  3 学生成绩分析模块的实现
  本系统中采用将数据挖掘技术应用于对学生成绩的分析中,采用数据挖掘分类技术中的决策树方法中的ID3算法,对本文中学生系统中的学生基础课课程成绩这一数据进行挖掘,得到判定属性,建立合适的规则,用以正确预测学生今后合适的专业发展方向。通过采用数据挖掘技术进行分析、预测,可以更好的促进我们的教学。
  在学生成绩分析模块中的数据挖掘流程具体说明如下:
  1)确定数据挖掘对象及目标:通过学生各个学期基础课成绩,建立今后专业发展方向的预测模型,挖掘出今后适合选择哪些专业选修课以便在该专业发展方向上更好的学习;2)模型的选定:比较了各种决策树算法后决定采用著名的决策树ID3算法进行分类;3)数据采集:所得数据是通过前面在学生系统中的学生成绩查询模块中的成绩数据库中获得,教师在教学过程中输入学生成绩,可以查询到学生所修的所有基础课成绩,并将这些成绩作为本次成绩分析的数据;4)数据预处理:由于ID3算法不能处理连续值属性,而学生成绩数据值是连续的,因此首先必须对这些数据进行预处理,即对这些数据进行离散化。预处理也是数据挖掘过程中非常重要的一个步骤。因此,本系统中必须采用数据规范化和离散化技术对数据进行预处理,采用公式(1)把原始成绩映射到60分到100分之间,使之成为规范数据。
  上述公式中,原始数据的值使用V来表示,而经过规范处理后的数据值使用V’来表示。
  得到规范数据后,我们还必须对这些数据进一步处理,即对他们进行离散化,离散化后的成绩值分为3个区间:[60分,平均分],[平均分,优秀],[优秀,100分]
  5)数据挖掘:使用数据挖掘分类技术中的决策树方法中的ID3算法对前面经过预处理所得到的数据进行挖掘。
  由于测试属性的选择是通过计算每个属性的信息增益,从而找出信息增益值最大的值来作为测试属性的方法,因此,通过以下公式来计算本系统中各个属性的信息增益:
  设S是一个包含了n个数据样本的集合,类别属性可以取m个不同的值,则对于m个不同的类别C i (i=1,2,…,m),假设ni 为是类别C i中的样本个数,那么,要对于一个给定数据样本进行分类的信息量为:
  其中,pi =ni/n是任意数据样本对象属于类别Ci的概率。
  设一个属性A可以取k个不同的值{a1,a2…ak },利用属性A可以作为判定属性将样本集合S划分为k个子集{S1,S2,…,Sk },其中Sj 包含了样本集合S中属性A取aj 值的数据样本子集;设nij为子集sj中属于Ci类别的样本数,那么,利用属性A划分该样本集合的信息嫡可以按以下公式计算:
  对于一个给定的子集Sj,有:
  其中,Pij =nij/n是sj中样本属于Ci类的概率
  通过以上公式,我们可以选择属性A作为当前分支节点来对样本集进行划分,信息增益计算公式如下:
  (5)
  通过以上公式计算每个属性的信息增益。选择具有最高信息增益的属性作为给定样本集合S的测试属性。
  4 结论
  目前,数据挖掘技术已在各行各业有着广泛的应用,但将该技术应用到我们教育领域中的例子还比较少,而且目前在许多高校中对学生成绩信息的处理仅仅是做一些查询或者简单统计等处理,比如利用EXCEL等软件工具分析学生的平均分、最高分等简单信息。而最近几年高校不断扩招,学生人数大幅增加,高校中所积累的数据越来越多,因此,利用一种技术来有效利用这些数据更好的服务教学和管理极为迫切。数据挖掘是一种决策支持过程,它从大量的数据中提取隐含的、潜在的、以前未知的有用信息或模式,主要基于人工智能、机器学习、统计学、数据库等技术。
  
  参考文献
  [1]魏萍萍,王翠茹,王保义,等.数据挖掘技术及其在高校教学系统中的应用[J].计算机工程,2003,29(11):87-89.
  [2]刘同明,等.数据挖掘技术及其应用[M].北京:国防工业出版社,2001:2-8.
  [3]冯子华,程立生,郑中兵.课程考核试卷质量分析的EXCEL实现[M].高等农业教育,2004,3:53-55.
  [4]R.Feldman,H.Hirsh.Maehine Learning andDataMining.Methods and Applications. minding associations in collections of text,1998:301-306.
  [5]Vipin Kumar,Mahesh V.Joshi,Eui-Hong Sam Han,et al.HighPerformance Data Mining[M],Lecture Notes in Computer Science,2003,8:63-88.


转载注明来源:https://www.xzbu.com/8/view-46625.htm