您好, 访客   登录/注册

STEM教育质量评价指标体系构建

来源:用户上传      作者:

   摘要:STEM教育因其融合多学科知识、培养创新精神和实践能力的特点受到广大研究者和实践者的关注。当前国外真正聚焦到STEM教育质量评价并具有较强可操作性的研究较少,而国内少量相关研究主要是介绍国外STEM教育评价的研究进展。严重缺乏成熟可行且适用于我国STEM教育发展的评价工具,很大程度上制约了我国STEM教育的可持续发展。经过德尔菲法两轮专家意见征询以及层次分析法确定评价指标权重后构建的STEM教育教学质量评价工具,既综合考虑了STEM的本质特征、已有STEM教育评价工具及指标维度,又直接聚焦于课堂教学,最终包含课堂环境、课程结构、教学内容以及学生表现4个一级指标和22个二级指标。该指标体系形式与我国教育教学中教师所用的教研表、评课表等类似,有助于教师更好地理解与使用;且经过初步试用,具有较高的信度,能够比较全面地评价STEM教育中的各方面要素,有助于促进STEM教育的健康有序发展。
   关键词:STEM教育;质量评价;指标体系;德尔菲法;层次分析法
   中图分类号:G434   文献标识码:A    文章编号:1009-5195(2020)02-0048-09  doi10.3969/j.issn.1009-5195.2020.02.006
   *基金项目:北京市教育科学“十三五”规划2016年度重点课题“STEM教育视角下中小学科学教学模式创新实践研究”(CADA16038)。
   作者简介:李艳燕,博士,教授,博士生导师,北京师范大学智慧学习研究院(北京 100875);董笑男(通讯作者),硕士,北大附中天津东丽湖学校(天津 300309);李新,硕士,北京师范大学互联网教育智能技术及应用国家工程实验室(北京 100875);张媛,硕士,国网大学国家电网公司高级培训中心(北京  100192)。
  一、引言
  科学技术与教育教学的深度融合促进了多样化学习需求的快速增长,传统教学模式与组织形式已无法满足创造性与个性化的学习需求。STEM教育作为具有跨学科性、真实情境性、基于项目式学习等特征的新型教育模式,对培养学生的创新能力与核心素养,满足学生的个性化学习需求等具有重要价值(余胜泉等,2015)。STEM教育实践环节中,如何科学有效地评价STEM教育的教学效果已经成为领域的研究重点。文献分析发现,已有部分学者基于STEM教育系统及其特征等开发了STEM教育评价工具。如Lin等(2015)基于计算机理论模型以协同问题解决矩阵开发了评价学生协作问题解决能力的STEM评价系统;Bicer等(2017)将STEM教育中科学与数学相结合,设计了评价高中生在STEM课堂中科学与数学成就的STEM教育评价指标体系。然而,这些研究大多只关注STEM课堂中的学生表现或教师教学等单一方面,缺乏对师生以及教学效果的整体评价。STEM教育评价作为促进STEM教育健康有序发展的关键,具有多元化、多角度、过程性、全方位等特征。开发适合我国STEM教育发展、符合国内教学目标与教学理念的STEM教育评价工具,是当前我国STEM教育研究领域亟待解决的问题。本研究基于国内外STEM教育评价工具、指标体系以及本质特征等,利用德尔菲法与层次分析法构建STEM教育质量评价体系,期望能为STEM教育评价提供支持,促进我国STEM教育的科学发展。
  二、STEM教育评价综述
  1.国外STEM教育评价工具
  评价工具与维度指标是评价STEM教育的关键。Kier等(2014)在职业意识背景下通过文献分析、指标初选、量表测试、结构分析、验证性因素分析以及生成量表6个步骤开发了用来评价中学生STEM职业兴趣的STEM-CIS评价工具。Milner等(2014)采用5点李克特量表开发了评价学生STEM兴趣以及自我效能感的测试工具。Harwell等(2015)在借鉴已有评价工具的基础上,针对4~8年级的学生,开发了包含科学、数学、工程三大领域的7个课程模块,用来评价STEM课程对学生学习概念影响的评价工具。实践证明该评价工具可以为学校STEM课程开展提供借鉴意义。Corlu(2013)以STEM社区、STEM教育以及STEM评估因素为基础,采用形成性、总结性、真实性和自我调节四种评价方式,开发了用来评价STEM教学实践的高校STEM课程评价工具。研究发现该课程评价结果能够有效促进STEM课程的高质量发展以及STEM教师的专业成长。此外,Lee等(2013)以5点李克特量表的形式开发了用来评價学生STEM概念发展情况的STEM教育评价工具——COSA(Conceptions of Science Assessment),该评价工具的评价维度包括前概念、学习影响、问题解决、批判性判断等。Eddy等(2015)开发的帮助教师促进学生主动学习的STEM课堂观察工具——主动学习评价量表(Practical Observation Rubric To Assess Active Learning,PORTAAL),包含教学实践、逻辑、责任、减少负荷四个维度的21个观察要点,可用于评价25节STEM课程。
  系统梳理国外STEM教育评价工具(见表1),可以发现其主要评价对象聚焦在课堂、教师以及学生三方面,评价方法主要包括课堂观察和问卷调查,评价内容可以概括为课程内容和教师教学两方面。从研究方向和研究成果来看,国外在STEM教育评价方面开发了较多的评价工具,评价内容也相对全面。其中UTOP(UTeach Observation Protocol)评价工具由美国国家自然科学基金会组织开发,是面向STEM教师培养、提升教师专业发展而开发的课堂观察工具,关注教师是否考虑学生的前概念、教学设计,以及学生的学习投入,被广泛应用于STEM教育评价(Gee,2008)。该评价体系包含27个评分要点,从教学实践角度出发,涉及环境、课程、效果和内容四个方面,具有较高的借鉴价值(Walkington et al.,2018)。但是UTOP工具是基于美国教育教学特征而开发的,主要适用于数学和自然科学两门学科的教师,对课堂教学氛围以及学生间的互动关注较少,在缺乏普适性的同时也忽略了对学生的关注与评价。   2.国内STEM教育评价工具
  与国外STEM教育评价研究相比,我国学者围绕STEM教育的研究大多聚焦在STEM教学活动的设计、实践以及教师专业发展等方面。关于STEM教育评价方面的研究,相关研究也仅是在介绍国外STEM教育评价的研究进展(曾宁等,2018)。从近两年仅有的少数研究来看,樊雅琴等(2018)将小学生参与度划分为认知参与度、情感参与度、行为参与度以及社交参与度四个维度,基于此来开发STEM学生参与度评价工具,并将年龄、性别等作为评价要素,根据评价结果提出项目式STEM教学中学生参与度的提高策略。吴忭等(2018)提出了利用认知网络分析法对STEM教育开展评价的新思路。综上可以看出,近年来我国虽然围绕STEM教育理论、模式、应用实践等进行了大量的探讨,但是针对STEM教育评价的研究相对较少,而且仅有的相关研究大多数都在介绍美国、芬兰等发达国家的STEM教育评价的实践进展,缺乏成熟可行且适用于我国STEM教育发展的评价工具,这在很大程度上制约了我国STEM教育的可持续发展,因此亟待研发能够满足我国STEM教育发展需求的评价工具,推进我国STEM教育的健康有序发展。
  三、STEM教育质量评价指标体系的设计与完善
  1.评价指标体系设计
  STEM教育质量评价指标的初步构建主要包括两个步骤:一是对STEM教育本质特征进行分析,二是基于STEM教育特征以及对国内外STEM教育评价工具的比较分析初步确定STEM教育质量评价指标体系。
  (1)STEM教育特征分析
  STEM教育是一种以真实问题解决为任务驱动、立足学习过程、多技术交叉融合的跨学科教育,以培养具有全面科学素养和创新实践能力的人才为根本目标(秦瑾若等,2017)。余胜泉等(2015)将STEM教育的特征概括为跨学科、趣味性、体验性、情境性、协作性、设计性、艺术性、实证性、技术增强性9个核心特征。本研究综合余胜泉等的观点,认为STEM教育具有跨学科性、真实情境性、基于项目的学习以及协作交流四个特征。
  跨学科性。跨学科性是STEM教育区别于传统教育的最大特征,是指教师不再将重点放在某个特定学科或者关注学科界限,而是将重心放在特定问题上,强调利用科学、技术、工程或数学等学科相互关联的知识解决问题,实现跨越学科界限、从多学科知识综合应用的角度提高学生解决实际问题能力的教育目标(余胜泉等,2015)。STEM的跨学科属性倡导学生在多学科交叉中开展学习,不再仅关注某一个学科内部的知识,而是强调不同学科之间的联系及其相互影响。这样不仅能够提高学生各方面的素质与能力,同时也有利于避免教育教学中的重复性与单一性。
  真实情境性。STEM教育强调知识是学习者通过与学习环境、生活案例相互建构的产物,而非来自教师等外部资源的灌输,因此STEM教育的真实情境性主要体现在通过技术手段再现生活场景中的实际问题与真实案例来激发学生的学习兴趣,刺激其回忆与之匹配的先前知识,在此基础上建立新的知识体系。这有助于培养学生将所学知识进行情境化应用的能力,帮助学生理解和辨识不同情境的知识表现,进而根据所学知识与背景信息发现问题本质并灵活解决现实问题。可以说,STEM教育的真实情境性不仅能使学生获得知识,还能进一步掌握知识的社会性、情境性以及迁移运用的能力,进而培养其创新精神与动手能力。
  基于项目的学习。基于项目的学习(PBL)是较为典型的STEM教学模式,广泛应用于STEM教学中。项目式学习活动一般包括问题提出、项目设计、工作计划、作品展示以及反馈评价等环节,具体包括内容、活动、情境以及结果,在真实生活情境中让学生积极探索、决策,提升学生的综合能力与科学素养。具体来看,基于项目的教学模式通常以问题提出为出发点,在此基础上强调组建学习小组,进行合作探究,小组内确定学习目标与小组分工,在协作探究中完成学习任务(李王伟等,2018),具有开放性、实践性、可行性等特点。
  协作交流。协作交流包括“协作”和“对话”两个要素,“协作”是指学习者共同完成学习任务,“对话”是指学习者间的言语交流。STEM教育强调群体间的交流、协作以及共同完成知识建构的学习任务。STEM教育中涉及到的学习任务往往来自真实情境,大多数任务需要同伴或老师的协助才能完成,因此在任务完成过程中,学生以小组为单位,共同分析问题、收集资料、讨论交流、展示成果等,强调学生间的协作交流,评价环节也着重考虑小组成员的共同表現和小组间的协作情况,而不是个人表现(余胜泉等,2015)。
  (2)初步确定STEM教育质量评价指标
  在STEM教育实际开展过程中,需要将形成性评价和总结性评价相结合,制定全面完备的评价工具,将学生的表现外显为操作化的评价指标,从而对STEM课堂、教师、学生等进行全面评价。本研究主要参照UTOP评价工具的环境、课程、内容评价维度,并在此基础上从课堂环境、课程结构、教学内容以及执行效果四个方面进行评价。由于UTOP评价工具在普适性和关注学生成长等方面存在一定的局限性,因此本研究构建的STEM教育评价工具在借鉴UTOP评价工具优势的基础上,兼顾了我国STEM教育的基本特征。其中跨学科性强调不同学科知识的交叉应用,全面提升学生的综合素质,因此在教学内容指标下强调了对课程内容相关性、交互性等跨学科属性的评价;真实情境性强调STEM教育知识体系来源于生活并应用于生活,因此在课程结构维度下突出课程探索、课程资源等二级指标,关注教师是否能够基于生活实际情况提出探索性问题,以及教师是否能够利用视频、音频、模型等工具展示生活化的教学内容;基于项目的学习强调问题意识与小组间的协作,因此特意设计了执行效果这一维度,具体包括明确问题、明确方案、创建模型、交流结果等二级指标,完全匹配基于项目的学习基本理念;协作交流强调学生间的合作探究精神,因此在执行效果中强调考察学生的协作精神与交互性,并鼓励小组进行展示汇报。基于此,本研究初步设计了包含课堂环境、课程结构、教学内容以及执行效果4个一级指标维度以及28个二级指标的STEM教育质量评价指标体系(见表2)。   2.评价指标体系修订
  为了验证评价指标的科学性以及可行性,研究采用德尔菲法,编制了专家意见征询表,将维度重要性划分为5个级别,选取20位STEM教育研究专家,采用发送邮件的方式进行意见征询。意见征询的专家分为三类:第一类,STEM教育标准研究专家,从理论研究的视角修订评价指标体系;第二类,STEM教育教学研究专家,从教育教学的视角修订评价指标体系;第三类,STEM教育实践专家,从教学应用的视角修订评价指标体系。20位最终提供意见的研究专家,既有来自高校和科研机构的教授,也有来自一线教学的高级教师。
  (1)第一轮专家意见征询
  第一轮专家意见征询的目的是征求专家对评价指标划分、语言表述的意见,并对重要性进行打分。为了确保专家咨询结果的可靠性,研究首先采用专家权威程度系数Cr对专家评分的可靠性进行分析,Cr的值取决于专家熟悉程度系数值Cs和所有判断系数和Ca,当Cr>0.7时,说明信度较高。本研究Cr=0.825(Cr≥0.7)表明第一轮专家咨询结果的可信度较高。专家们对于评价指标体系的反馈意见可以概括为“修改指标名称”“修改指标表述”“增加/删除指标”“指标从属领域变更”四大类。具体修改情况为:删除“A1课堂参与”,该指标与“课堂互动”重复;“A3课堂对话”改为“课堂指引”,突出教师的指导性;删除“A4学生专注”,该指标不应在课堂环境维度下。“B1课程顺序”改为“课程结构”,表述更加准确;“B2重点突出”移动到教学内容维度,增加“课程设计”;“B6课程反思”改为“课程总结”,反思通过课堂观察不易测量。“C1意义”改为“教学意义”,表述更加准确;“C2水平流畅性”改为“教学表达”,表述更加专业;“C3准确性”改为“教学准确”,表述更加准确;增加“重点突出”指标;“C7交互性”改为“跨学科性”;删除“C4评价”“C5抽象”“C6相关性”“C8社会影响”。“D1确定问题”改为“明确问题”,表述更加准确;“D2限定条件”改为“寻找限定条件”。与此同时,对各指标的具体表述进行了较为仔细的修改,使具体表述更加准确且通俗易懂。
  (2)第二轮专家意见征询
  第二轮专家意见征询的步骤与第一轮相同,继续对第一轮修订后的评价指标体系征询专家意见。第二轮只有5位专家提出修改意见,主要集中在指标的描述上,建议指標表述更加清晰,避免指标之间的重复。主要对“D执行效果”这一指标进行了重点修改,将其改为“学生表现”;并将“D1确定问题”改为“问题理解”,含义更加广泛;将“D2限定条件”改为“活动探究”,更加有助于师生理解其含义;“D3明确方案”改为“方案设计”,表述更加准确;“D4创建模型”改为“模型创建”;“D6交流结果”改为“结果交流”,统一表述;“D7修改与再设计”改为“迭代设计”,表述更加准确专业。此外还对各指标的具体描述进行了修改,使其更加准确简洁。
  3.评价指标体系解读
  经过两轮德尔菲法,指标项平均值逐渐变大,变异系数逐渐缩小,表明指标项逐渐趋于合理,专家意见达成一致。在指标内容层面,第一轮德尔菲法专家咨询后,对指标的结构、维度和具体表述进行了调整与修改,形成了比较科学、标准的评价指标框架。在第一轮数据回收及专家意见的基础上,第二轮专家咨询数据均已达到标准水平,仅对少部分指标的描述、顺序进行了调整与修改,以提升指标的准确性、科学性。综上所述,经过两轮的德尔菲法专家咨询后,本研究最终构建了包含4个一级指标、22个二级指标的STEM教育评价工具(见表3)。与国外STEM教育评价工具相比,本研究构建的STEM教育质量评价工具直接聚焦于课堂教学,涵盖课堂物理环境、课程体系、教学内容以及学生表现四个方面,能够比较全面地评价STEM教育的课堂情况。此外,各级指标的设计以及指标项的说明等形式与我国教育教学中教师所用教研表、评课表等类似,有助于教师更好地理解与使用该评价工具。
  课堂
  环境\&A1空间布局\&STEM课堂物理环境舒适,座位布局能够满足学生STEM协作学习及实践需求,具有合理性\&A2 STEM设备\&STEM课堂中含有各类科学、技术、工程、数学类教具、仪器等教学设备,能够满足学生开展STEM活动需求\&A3教学引导\&STEM课堂中,教师通过分析学生的对话与表现,能够引导学生进行积极深入地思考与讨论\&A4课堂管理\&教师能够根据学生学习表现与效果,合理把控课堂进程,调整课堂内容,创建良好的课堂环境\&A5公平性\&在STEM课堂中,教师对每个学生提供均等的学习机会\&B
  课程
  结构\&B1课程目标\&STEM课程目标包含科学知识、科学探究、科学态度以及科学、技术、社会与环境目标,能够促进学生的STEM知识、STEM素养以及培养学生解决实际生活中问题的能力\&B2课程内容\&STEM课程内容明确,能够培养学生的STEM兴趣与技能,学生有清晰的学习目标和学习成果\&B3课程资源\&视频、音频、模型、工具等课程资源丰富,学生能够充分利用课程资源进行学习\&B4课程评价\&教师能够根据学生的课堂表现与理解程度,合理对课程内容进行评价与调整\&B5课程总结\&教师能够在课程结束时,总结学生的课堂表现与学习成果,培养学生的创造性意识与提高学生的学习兴趣\&C
  教学
  内容\&C1教学价值\&STEM教学内容能够培养与提高学生的科学、技术、工程、数学思维与素养,具有教学价值与意义,符合学生的认知发展水平\&C2教学准确性\&STEM教师对STEM概念的理解以及展示内容具有准确性与科学性,对学生探究的指导有效且流畅\&C3内容跨学科性\&STEM教学内容不仅仅局限于单一学科,注重学科之间的联系,全面培养学生的STEM素养,具有跨学科性\&C4重点突出\&有限的课堂时间内,教师能够突出重要的STEM教学内容,教学重点突出\&C5内容连贯性\&提问、测试、任务、作业等内容与教学目标紧密结合,具有连贯性\&D   学生
  表现\&D1问题理解\&学生能够在教师的指导下或协作学习中进行积极思考与讨论,明确要解决的问题\&D2活动探究\&学生能够积极思考或参与到小组活动中,根据探究问题寻找限定条件\&D3方案设计\&学生能够通过思考与协作学习寻找解决问题的方案,并确定最佳方案\&D4模型创建\&学生能够在教师预留的探究时间内,积极思考创建模型\&D5测试与检验\&学生能够利用以往的知识与经验收集信息与数据,开展多次试验\&D6结果交流\&学生能够将协作学习的成果进行展示与汇报,教师进行评价与总结\&D7迭代设计\&学生能够根据教师意见、反馈,进行交流与迭代设计,完善设计方案\&]
  (1)课堂环境
  课堂环境包含空间布局、STEM设备、教学引导、课堂管理、公平性5个二级指标。新兴的学习技术和智能学习环境正逐渐融入STEM教育,基于项目的学习注重学习空间的建设。因此,本研究将空间布局、STEM设备作为评价课堂环境的重要指标。教师的教学引导、课堂有效管理以及是否为每位学生提供均等的学习机会,均会对课堂环境产生影响。
  (2)课程结构
  课程结构包含课程目标、课程内容、课程资源、课程评价、课程总结5个二级指标。所谓课程结构,就是课程实施活动顺利开展的依据,是课程各部分的协调与组织。在此维度下设立的评价指标能够评价教师对课程目标的确定是否符合STEM教育培养目标,课程内容是否符合学生的认知发展,以及教学资源是否应用得当等。
  (3)教学内容
  教学内容包含教学价值、教学准确性、内容跨学科性、重点突出、内容连贯性5个二级指标。该维度重点评价教师的教学表现,其中教学价值是STEM教学内容的基本要求,而教学准确性则体现了STEM教师的专业素养,是评价STEM教师的重要指标。内容跨学科性、连贯性体现了STEM教师是否具有清晰的思路,以及对教学内容的掌握情况和教学严谨性。重点突出是衡量教师能否在有限的时间内,突出教学内容的重点部分,评价教师对教学内容的整體把握。
  (4)学生表现
  学生表现包含问题理解、活动探究、方案设计、模型创建、测试与检验、结果交流、迭代设计7个二级指标。学生表现是指学生在STEM课堂中的学习投入与情感体验等。该维度下的指标项是对学生STEM活动表现的综合评价,从协作学习中的表现到最终的成果展示均是对学生进行表现型评价,以更好地掌握学生的学习情况,为教师提供教学参考。
  本研究在具体操作中将评价指标采用等级量表的形式划分为A、B、C、D、E、F 6个评价等级,分别对应100分、80分、60分、40分、20分、0分。A等级表示完全符合指标评价标准;B等级表示符合指标评价标准;C等级表示较为符合指标评价标准;D等级表示一般符合评价评价标准;E等级表示不太符合指标评价标准;F等级表示完全不符合指标评价标准。评价者在进行评价时,只需根据指标项符合程度评定等级打分,之后根据等级值折合成分数,实行二次量化。
  四、STEM教育质量评价指标体系权重计算
  经过两轮专家意见征询,评价指标体系最终由4个一级指标、22个二级指标以及具体说明构成。为了增加指标体系的可操作性,需要对指标权重进行计算。本研究利用层次分析法设计了AHP问卷,并采用群体决策的方式判断指标权重,以避免指标权重的局限性与片面性。本研究以“在 STEM 研究领域中,理论与实践经验丰富且研究时长为3年及以上”为标准,在德尔菲法专家咨询名单中选取10位STEM教学经验丰富、拥有丰硕研究成果的专家参加层次分析法决策,共回收9份有效问卷,问卷回收率为90%。
  1.指标权重值计算
  针对回收后问卷,计算一级指标的相对重要程度。为了有效得出各级指标的相对权重值,本研究采用层次分析法软件Yaahp 进行分析,通过一致性检验后,可得出各项评价指标最终权重值。表4为其中一位专家的相对重要程度的判断矩阵。分析判断矩阵能够确定专家打分的一致性,将判断矩阵的赋值进行2次归一化处理,最终将得到一级指标的初始权重值。
  2.指标一致性检验
  研究采用指标的一致性CI值来检验评分结果是否具有一致性。在进行数据分析时,各专家的评分一致性均低于0.1,说明专家判断结果具有内部一致性,结果科学可行。研究使用 Yaahp层次分析软件进行处理分析,不一致矩阵通过“判断矩阵一致性自动调整”功能来实现。本研究在分析9位专家判断矩阵一致性时,采用分别求出9个判断矩阵的权重,再根据结果进行加权平均的方式进行处理,这种方法可以保存专家的原始意见,最终得出各个指标的权重值,其中一级指标的权重值如表5所示,二级指标的权重值文中不再呈现。
  3.指标权重的确定
  根据上述步骤,研究获得了评价工具的一级指标、二级指标单层次的权重值。为了计算二级指标相对于总目标的权重,需要根据一级指标、二级指标相应权重计算各项指标的组合权重,最终计算结果如表6所示。
  五、STEM教育质量评价指标体系试用
  为更好地验证评价工具的有效性和可信性,本研究邀请两位 STEM 教育专家对北京市某小学二年级的两堂 STEM 课进行试评,评价等级 A、B、C、D、E、F分别赋值 6、5、4、3、2、1,通过 Cronabach α系数检验评价工具可信度。在第一堂课 K1中,Cronabach α系数值为 0.8350>0.8,第二堂课K2中,Cronabach α系数值为 0.7240>0.6,说明在两堂课的评价中,两位评价者评分可信度较高。因此,本研究构建的STEM教育质量评价指标体系各指标内部一致性较好,信度较高,评价结果具有较高的可信度。   在试用指标体系的同时,研究也收集了教师的反馈意见。从整体的评价维度来说,两位教师一致认为该评价工具维度完整,能够比较全面系统地评价 STEM 教育质量,各二级维度的具体指标内容也比较全面,对于师生的评价比较丰富,符合 STEM 教育的特征。从具体评价指标来说,教师 A 认为有些评价指标在课堂观察中难以判定,比如“课程总结”,不是通过一节 STEM课就能观测到的,建议对评价指标标准等级进行细化;教师 B 认为,虽然评价指标较为全面,但仍有部分反应STEM教学特色与特点的指标没有囊括,建议在评价工具中补充“加分项”以及“评语栏”,评分者可以全面地表达自己的意见,凸显每堂STEM课的特点。同时,教师可以在评价STEM课堂的基础上,衍生出学生自评、小组互评等工具,也可将评价工具与学生学习单结合,开展多样化评价。从工具整体性上来说,教师 B 认为该评价工具建立在STEM教学课堂基础之上,评价工具较为完善,能够对STEM课堂的发展水平,尤其是教师的教与学生的学进行观察与量化。
  六、总结
  本研究通过对国内外STEM教育评价工具的系统综述,在分析STEM教育特征、评价方式、评价工具的基础上,初步构建了STEM教育质量评价工具,并运用德尔菲法、层次分析法对指标的合理性、科学性进行优化,最终形成一套可行的STEM教育质量评价工具。该评价工具包含课堂环境、课程结构、教学内容、学生表现4个一级维度以及22个二级评价指标和指标项说明。从一级指标的权重来看,其权重顺序很好地反映了指标维度的重要程度,与理论意义与实践操作都较为契合。在各个二级分类指标中,内容跨学科性、重点突出、模型创建、教学准确性、课程内容排在指标项前5位,而这5项基本内容正是STEM课堂教学的关键因素,也是进行STEM教育评价时最为关注的几个方面,同时更是STEM教师应该具备的专业素养以及学生STEM活动的中心环节。
  整体来看,该评价工具能够较为全面地评价STEM教育中的各方面要素,同时也填补了我国STEM教育在评价方面的研究缺失,对我国STEM教育的科学评价具有重要的参考价值。但同时,本研究也存在一些不足。在初步应用评价工具时,选择的评价样本过少,评价课程单一、专家数量有限、未能开展大量的STEM教育评價,其信效度也只是从内容以及评分者角度分析的,需要进一步地研究与验证。接下来,为了更好地验证评价工具的信效度,本研究将评价工具应用于STEM课堂教学中进行课堂观察评价,实现对评价指标体系的迭代优化,最终形成完整、成熟的STEM教育评价指标体系。
  参考文献:
  [1]樊雅琴,周东岱,杨君辉等(2018).项目式STEM教学中学生参与度测量研究[J].现代教育技术,28(1):121-126.
  [2]李王伟,徐晓东(2018).作为一种学习方式存在的STEAM教育:路径何为[J].电化教育研究, 39(9):28-36.
  [3]秦瑾若,傅钢善(2017).STEM教育:基于真实问题情景的跨学科式教育[J].中国电化教育, (4):67-74.
  [4]吴忭,王戈,盛海曦(2018).认知网络分析法:STEM教育中的学习评价新思路[J].远程教育杂志, 36(6):3-10.
  [5]余胜泉,胡翔(2015).STEM教育理念与跨学科整合模式[J].开放教育研究, 21(4):13-22.
  [6]曾宁,张宝辉,王群利(2018).近十年国内外STEM教育研究的对比分析——基于内容分析法[J].现代远距离教育, (5):27-38.
  [7]Bicer, A., Capraro, R. M., & Capraro, M. M. (2017). Integrated STEM Assessment Model.[J]. Eurasia Journal of Mathematics Science & Technology Education, 13(7):3959-3968.
  [8]Corlu, M. S.(2013) . Insights into STEM Education Praxis: An Assessment Scheme for Course Syllabi[J]. Educational Sciences: Theory and Practice, 13(4):1-9.
  [9]Eddy, S. L., Converse, M., & Wenderoth, M. P.(2015).Portaal: A Classroom Observation Tool Assessing Evidence-Based Teaching Practices for Active Learning in Large Science, Technology, Engineering, and Mathematics Classes[J]. CBE Life Sciences Education, 14(2):14-23.
  [10]Gee, J. P.(2008). A Sociocultural Perspective on Opportunity to Learn[M]// Assessment, Equity, and Opportunity to Learn: Cambridge University Press: 76-108.
  [11]Harwell, M., Moreno, M., & Phillips, A., et al.(2015). A Study of STEM Assessments in Engineering, Science, and Mathematics for Elementary and Middle School Students[J]. School Science and Mathematics,115(2):66-74.   [12]Kier, M. W., Blanchard, M. R., & Osborne, J. W., et al.(2014). The Development of the STEM Career Interest Survey (STEM-CIS)[J]. Research in Science Education, 44(3):461-481.
  [13]Lee, M. H., Lin, T. J., & Tsai, C. C.(2013). Proving or Improving Science Learning? Understanding High School Students’ Conceptions of Science Assessment in Taiwan[J]. Science Education, 97(2):244-270.
  [14]Lin, K. Y., Yu, K. C., & Hsiao, H. S., et al.(2015). Design of an Assessment System for Collaborative Problem Solving in STEM Education[J]. Journal of Computers in Education, 2(3):301-322.
  [15]Milner, D. I., Horan, J. J., & Tracey, T. J. G. (2014). Development and Evaluation of STEM Interest and Self-Efficacy Tests[J]. Journal of Career Assessment,22(4): 642-653.
  [16]Walkington, C., & Marder, M.(2018). Using the UTeach Observation Protocol (UTOP) to Understand the Quality of Mathematics Instruction[J]. Mathematics Education, (2):1-13.
  收稿日期 2019-12-25 責任编辑 汪燕
转载注明来源:https://www.xzbu.com/1/view-15152232.htm