“双一流” 学科背景下基于统计检验的试卷分析及评价
来源:用户上传
作者:
【摘 要】随着“双一流”建设的不断推进,高校教学质量得到了广泛的关注。为了方便高校教师了解教学状况,提高教学水平。本文以某高校大一年级高等数学期中考试成绩为例,在对样本数据完成信度和效度检验后,引入关联分析模型,应用关联分析Apriori算法得出知识点之间的一系列关联规则,并按照关联规则提升度进行排序,给出了强度最高的前10条关联规则,据此结合试卷分析的结论对教学活动提出了相应建议。以期以此为例,为探索更加科学有效的试卷分析方法贡献绵薄之力。
【关键词】试卷分析;关联分析;信度和效度;Apriori算法
中图分类号: TP311.13;O13-4;G642 文献标识码: A 文章编号: 2095-2457(2019)27-0094-002
DOI:10.19694/j.cnki.issn2095-2457.2019.27.040
1 课题研究背景及意义
随着高等教育的普及和教学改革的推进,教学质量成为人们越来越关注的问题。试卷分析作为教育测量学一个重要部分,引起了广泛关注。目前,国内试卷分析实践的理论基础仍以经典教育测量理论为主[1]。其中,应用SPSS软件对试卷的信度、效度、区分度和难度进行分析评价的方法最为普遍。陈琪琪(2017)[2]张晓凤(2017)[3]张慧(2017)[4]等均应用SPSS对具体学科试卷的“四度”进行试卷质量的定量分析并指导教学实践。然而,这种分析不足以全面判断考生对知识的掌握程度,难以起到促进教学质量提高的作用。
为了挖掘试卷分析中的隐藏信息,本文将关联分析应用到高校试卷分析中来,来发现试卷中许多潜在的有价值的关联信息,以达到为教师提供有价值的教学参考依据,帮助教学部门进行决策的目的。本文以某高校大一年级高等数学期中考试试卷为例,首先对样本质量进行分析,分别通过了信度、效度检验后,利用关联分析的方法对试卷数据进行分析,揭示学科主要知识点之间的关系,为教师教学和学生学习提供方法依据。
2 案例分析
2.1 数据预处理
2.1.1 数据收集
本文选取某大学大一年级的高等数学下期中考试试卷及学生成绩,收集了三个平行班级的一套高等数学试卷共109份试卷,章节主要集中于高等数学第 8-11 章。三个班的学生均为同一教师进行教学,所教学的教案教法一致,使得实验结果具有具有较高的可信度。数据包括学生的卷面总分和各题得分,数据完整、准确。
2.1.2 数据处理
由于试卷分析的数据存在着杂乱性、重合性、缺失值以及连续性等问题,我们对原始数据进行了预处理。对于杂乱性和重合性问题,我们对试卷各题的知识点进行了归纳与整合。
本次调查中有三个样本缺失值较为严重,考虑样本总数比較大,我们选择了直接删除,因此真实样本总数为106。由于关联性分析要求数据是离散的,因此,我们对数据进行离散处理。规则如下:本文通过知识点得分的及格率来考量学生对知识点的掌握情况,根据学生在该知识点上的得分是否超出总分的60%来判定学生是否掌握该知识点,若超出60%,记为1,否则记为0. 对于某些单独构成一个知识点的选择题和填空题,由于其没有步骤分得分的情况,因此将得分的情况记为1,未得分的情况记为0。
2.2 试卷分析
在进行数据分析之前,我们要保证数据的有效性,排除一些干扰因素,以确保后期结果的可靠。为了保证试卷的有效性,我们对问卷的信度与效度指标进行了测量:
信度是衡量数据有效性的重要标准。试卷信度是评价衡量试卷质量的一项重要指标。信度是指试卷的稳定性和可靠性程度。本文中,我们采用最广泛、可操作性强的计算信度的方法—克龙巴赫系数法,得分如下:
在我国一般大规模标准化考试要求信度在0.9以上,一般的课程考试的信度要求达到0.5~0.7之间。本次考试试卷题数为20,那么试卷的信度可以求得为0.588,可以认为试卷信度较好,符合国家标准。
效度是一个测试试卷准确性和有效性的数量指标。一般来说,它表示考生掌握知识点的水平,反映了测量到的与所要测量的二者之间的符合程度。效标是检验考试效度的一个参照标准,通常用公认的比较客观的一次同类标准考试成绩来表示两者之间的相关系数,即为效标关联效度。效标关联效度可用“积差相关法”求得。其公式取下:
其中,Ai与Bi分别是第i个学生在A题与B题上的得分,A与B分别是两个题目得分的平均分,SA和SB分别是两题得分的标准差,N为试题数目。测试过程中,效度越接近1,试卷有效性越高,表示测试结果符合测试目的。经过计算,R12,R13,R23均符合试卷效度要求。
经过以上一系列数据处理和试卷质量的分析,可以看出,该试卷总体还是适宜用来做试卷分析的,下面就将采用关联算法,对知识点之间的关联规则进行挖掘。
首先设定支持度的最小阈值为0.05,最小置信度为0.6,其他参数不进行设定,暂取默认值,利用R软件运用Apriori算法将第一个关联规则记为rules1。结果现实,rules1中包含5070条规则,若将如此大量的关联规则全部输出是没有意义的,并且通过观察可以发现,关联规则的先后顺序与可以表示其关联性的三个参数,即支持度,置信度和提升度的取值并无明显联系。因此,我们选择采用强制控制来减少关联规则。最常用的方法是通过提高支持度或者置信度的值来实现。
本文考虑将支持度和置信度同时提高来实现规则强化,经过不断调试,最终确定在最小支持度为0.5,最小置信度为0.64,仅剩288条规则。但是二百多条对于分析来说还是无法得出有效信息。此时可以关注提升度,提升度是筛选关联规则最可靠的指标。因此我们对关联规则按照提升度排序,可得到强度最高的前几条关联规则如下:
以上表显示的关联规则为例进行分析,可得出以下结论:积分次序、微分方程、方向导数,切线方程等学的好的话,一定是对偏导的知识把握的很好,这些规则的置信度都在0.9左右,说明要能灵活掌握微积分的知识,首先要理解透彻偏导数。微分方程与偏导、重积分之间的关联也很强,很直观的表现出微分方程与微积分之间的紧密关联,这与我们平时的认知也是符合的。我们还可以发现,二次积分和多重积分之间并没有太大的关联,所以在教学过程中,应该做好这两种积分的区分。
3 结语
教师在试卷讲评中,往往是依据错误率高的题目进行讲解,并且依据自身经验进行扩展性题型讲解,这样的讲解方式十分主观,学生的学习效果往往会依据教师自身教学水平而决定。但通过提供关联分析方法,使教师能够依据试卷所反馈的学生答题情况,分析该类学生各题之间的关联性,从而了解到前测知识点与后测知识点之间的相互影响,能够得出可能影响这些学生答题情况的前障知识点及相应题型,做到有针对性教学,从而提高教学质量。
【参考文献】
[1]黄颖,林端宜.试卷分析研究现状综述[J].西北医学教育.2005,13(1):39-40.
[2]陈琪琪.基于SPSS的物理试卷分析与评价[J].物理通报.2017,12:103-106.
[3]张晓凤.基于SPSS的英语专业期末试卷分析—以上海某大学外语学院2014级期末试卷为例[J].英语广场.2017,11:106-108.
[4]张慧,张雅琼,林基艳.C语言程序设计试卷分析对教学改革的启示.
转载注明来源:https://www.xzbu.com/8/view-15031288.htm