
绪论 什么是增值评价
中共中央、国务院印发的《深化新时代教育评价改革总体方案》(中发〔2020〕19号)提出的教育评价改革的主要原则中包括“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。本书就探讨一下增值评价。
1.从教学评价谈起
在学校教育中,增值评价是一种教学评价。而对教学评价,教育学者通常这样界定:
教学评价是指在教学过程中依据课程和教学目标以及教学原理,运用科学的方法考查(量性记述或质性记述)教师教学和学生学习的种种变化,根据这些变化对照教学目标和原理,做出价值判断,进而调整、优化教学进程,促进学生达成教学目标的教学实践活动。
按这个界定,教学评价可以说是达成教学目标的关键环节,由教学评价带来的学生和教师的反馈,促使学生改进自己的学习、教师调整自己的教学,从而完成教学目标。通过完成某学科课程标准要求的每一个单元、每一个模块教学目标,来落实课程标准的总的教学目标(课程目标),可以促进学生本学科核心素养的形成和提高,从而达到本学科课程标准提出的学科核心素养要求。如果达成了所有学科的课程目标,本学段要求的各学科核心素养就形成了。这个时候学校教学就完成了对学生所做的立德树人的工作——学生具有了国家、社会所要求的学科核心素养,成长为合格的毕业生。既然教学评价是学生达成教学目标的关键,那么教学评价也必然是落实教学政策要求、推进教学(课程)改革的关键。许多学者在分析新世纪课程(教学)改革时也都认可这一点。充分理解教学评价,是搞好教学评价的前提条件。如何正确认识和实施教学评价,也是新课程实施中每一位教师应该关注的重要问题。应该说,推动基础教育课程改革深入发展的着力点就是教学评价。教学评价对课程的实施起着重要的导向作用,对质量起着监督作用。评价的功能、评价的目标体系和评价的方法都直接影响着课程培养目标的实现,影响着课程功能的转向与落实。因此,人们对教学评价乃至教育评价研究、教育评价理论非常重视,探索新课程的评价内容和评价方法已成为课程改革的重要工作之一。
2.增值评价是什么
教学评价应注重多途径收集信息,准确反映学生学习的结果及过程,激励学生有效地学习,帮助教师改进教学。进行评价时,既要关注学生的学习结果,更要关注学生的学习过程,强化评价的诊断和发展功能。评价应注重评价目标的全面性和评价手段的多样化,实现形成性评价和终结性评价相结合、定性评价和定量评价相结合,从而进行发展性评价。评价中非常重要的一点就是对学校的教育教学工作进行客观、公平、科学、准确的评价。特别是按照2017年版普通高中各学科课程标准中“评价”的需要,“教学评价要充分注意落实教育的公平公正,在教学评价中就是要注重学生在不同起点上的提高,这一点延伸到学生所在的学校,对学校的教学评价也应该注重学校在不同起点上的提高”,要做到这样的评价就需要运用增值评价。
中共中央、国务院在《深化新时代教育评价改革总体方案》中提出的教育评价改革的主要原则包括了“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性”。这个原则有利于“完善立德树人体制机制,扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾”。而在教育评价改革的实施举措中提及的“开展学生各年级学习情况全过程纵向评价”就是增值评价的一个功能。在一定程度上,增值评价也能够协助进行“德智体美劳全要素横向评价”。
在我国当下教学评价的实践中,对学校和教师的评价多是终结性评价,大多以学生的测验成绩(即测验或考试的得分)为标准进行。虽然原始的或未经调整的成绩是重要指标,但这些成绩并未能有效地反映出学校在提升学生成绩方面所做的努力。这些成绩所得的结果往往只能反映就读学校学生的特质,而未能反映学校在提升学生成绩方面所得到的效益,即学生的增值。因此,这种单一的评价方法反映的信息并不客观准确,也缺乏公平,已受到各方的批评。为更加科学和准确地评价学校和教师的效能,教育评价领域迫切需要一种新的评价方法。近年来,教育界一直提倡对学生进行发展性评价,但用什么方法进行发展性评价则是一个需要解决的问题。人们认为增值评价就是进行发展性评价的一种方法,而且对学生的增值进行评价本身就具有公正评价每一所学校和每一个学生的努力的思想在其中,这将有助于教育公平的实现,有助于促进义务教育阶段学校的均衡发展。
一位研究者认为:
从当前常见的做法来看,增值评价是指追踪学生在不同时间点上的学业成绩,利用一定的统计分析方法对学业成绩变化情况进行分析,并注意剥离掉学生性别、家庭背景等先赋因素,以及教师学历、班级规模、班级条件等短时间无法改变的外部因素对学生成绩的影响。增值评价与传统评价的区别主要体现在两方面:一是“增加值”,即联系学生的先前基础和最终结果分析学生成绩的变化情况,而不仅仅关注学生的最终成绩,实现“不比基础比进步”;二是“净效应”,即剔除教育中学生、教师和学校无法改变的因素,仅评价其在可以改变的方面做出的努力,实现“不比背景比努力”。
增值评价体现了发展性的理念,具有如下优势。第一,有助于激活后进学生、教师和学校的积极性。增值评价可以更好地呈现学生进步情况,使其不至于在长期的落后状况中自怨自艾、懈怠放弃。第二,有助于提高前端学生、教师和学校的危机意识。增值评价也可以激活这部分学生、教师和学校的潜能,让他们开展良性竞争,百尺竿头,更进一步。第三,通过对低效能学生、教师和学校的问题剖析,以及对高效能学生、教师和学校的经验挖掘,可以为学、教、管等提供更为有效的策略。更本质的是,通过实施增值评价,可以逐渐改变人们对教育的关注点,从过分关注结果转向更关注过程,从过分关注条件转向更关注培养,树立起内生的教育发展观和科学的教育质量观。
增值评价的使用者认为:
增值评价以起点定终点,考虑学生基础水平对学生学业成绩的影响,以发展的眼光看待学生学业表现,对学生成长是一种激励,也有利于进一步地诊断和精准教学,挖掘高增长水平学生的学习方式方法,从而不断完善教育教学。
一所学校的使用者采用了多元的视角:
视角一:从评价内涵看。通过查阅文献资料,我们发现,学者们对增值性评价的内涵有两种观点。一种认为增值是增学生学业成绩进步之值,即“成绩说”;另一种认为增值是增学生全面发展之值,即“全面说”。我们认同“全面说”,视增值性评价为一种有别于传统评价模式的多元化的评价方式,它充分考虑到学生的知识、智力、情感、能力、实践以及所处情境等因素的不同,表达的是学生从学校教育中要获得发展、有所成长,强调的是在已有的基础上有所发展和成长。
视角二:从评价内容看。我们追求的是改变传统的学科学业评价中仅仅以作业的对错、考试成绩的高低为指标的片面评价方式,增加学科学习行为、学习态度、学习责任感、自主学习能力等多样化的学业素养,包括学科成绩、知识体系、学科能力和学习态度。因此,所增的“值”,是关联核心素养的值,是基于学业而又超越学业,促进学生全面发展的整体观照。
视角三:从评价过程看。我们对学生在学校学习所得的“增值”进行评定,不是以学生的某次成绩对学生进行终结性评价,而是跟踪学生在一段时期内学业成就的增幅或进步情况,即学生在一段时间内学习的“进步”就是他的“增值”,以此来评价学生学业发展。
视角四:从评价主体看。我们的评价不仅包括教师和家长,更是把学生卷入到学业评价中,使每个学生成为自己学业评价的主人,这样就实现了评价由过去的被动向主动的转变。
总之,增值性评价是尊重学生个体差异,基于学业又超越学业的发展性评价,其实质是引导学生将自己的现在与过去比,使他们在进步与成功的体验中增强学习的自信,满怀希望地主动发展。
虽然以上关于增值评价的表述有宏观、中观和微观,界定的视角也不完全一致,但作为概念,它们共同的核心是增加值或者是增值,其基础是假定学校能为其学生成绩增加“价值”,测试增值的基本思路是测量学生经过一段时间学习后的进步程度。为了测量进步,需要在一个时间段(例如一个学期、一个学年或者一个学段)的开始和结束时刻测量基线和结果。由于学生的成长,我们预期学生都会有进步或者改善,平均成绩也会有所提高。因此所谓“增值”指的是,在学生可预期的正常成长之外,由教育所带来的额外价值。增值评价要考察的是某一学校的学生在特定时间内是否比其他学校的学生取得了相对更大或更小的进步,那些学生进步超过预期的学校其办学效能更高。在学校内部自我评价的背景下,增值评价的目的是为教师提供学生有意义、有效、准确的相对进步的证据。教师可以使用这些测量结果来了解和反思自己的专业教育实践活动。
我们尽可能简化地描述一下增值评价的算法模型,为的是能够通俗直观地了解“增值”的意义。要得到这个增加值,最关键的技术性工作在于由基线测试预测学生在新的测试中有哪些自然而然的提高,然后才能依据新的测试成绩得到学生的成绩增值。怎样进行预测呢?预测的基础是学生的基线测试成绩,新的测试(增值测试)成绩是学生在基线测试后学习过一段时间后获得的测试成绩,能不能用增值测试的成绩减去基线测试的成绩作为学生成绩的增值呢?显然不能,因为基线测试和增值测试既不是标准测试,又不是关于同样内容的(等值的)测试,甚至不是同一学科的测试,这两个成绩实际上是不能进行比较的。因此通常的做法是在基线测试成绩的基础上运用某种算法模型,利用统计方法估计出在增值测试的时候学生自然发展能得到什么成绩,以此作为学生的预测成绩,增值测试成绩与预测成绩的差(叫作“残差”)就是学生学习的增值。这个预测的成绩越精确,得出的增值成绩也就越可靠。统计预测总是有误差的,怎样最大限度地降低误差,就是增值算法改进的方向。在增值评价的实践发展中,常用的算法模型有简单回归模型、多层线性模型、增长百分等级模型等。目前,各种算法模型正在进行着改进和完善,新的计算模型也不断涌现出来。
3.学习背景分析
在探讨学生成绩的增值时,如前面引述的,一种观点要求“剥离掉学生性别、家庭背景等先赋因素,以及教师学历、班级规模、班级条件等短时间无法改变的外部因素对学生成绩的影响”;还有观点认为增值“追求的是改变传统的学科学业评价中仅仅以作业的对错、考试成绩的高低为指标的片面评价方式,增加学科学习行为、学习态度、学习责任感、自主学习能力等多样化的学业素养,包括学科成绩、知识体系、学科能力和学习态度”。而无论哪种观点,都必须同时考虑影响学生学习的某些外部以及内外结合的因素,所以进行增值评价基线测试(起点测试)的同时还需要做学习背景分析。这一分析通常是以问卷调查的形式进行的,因此,在基线测试之后就能得到这样一些数据分析:基线测试结果分析、学生背景问卷分析、学业成绩相关因素分析(这些学习背景因素指的就是对学生的学习有影响的因素,这种影响意在指明这些学习背景因素与学生的学习成就,即测试成绩是相关的,因此在进行基线测试时做学习背景因素调查,除了要进行学业成绩相关因素的分析外,还可以进一步对学习背景因素与学业成绩的相关关系进行分析,得出每个学习背景因素对学生学业成绩的解释率,从而通过改进学生的某些学习背景因素,促进学生全面发展。为此提供的报告称为“起点成绩的差异报告”,其对各个学习背景因素和学生学业成绩的相关性以及相对可解释性的分析,为发展学生各个学科核心素养提供了思路)。这几项分析综合起来就是增值评价的起点分析,为后来的增值分析打下基础。
综上所述,进行增值评价需要进行一次基线测试(基线测试分学科进行,例如初中有数学、语文、英语三个学科测试和认知测试,高中要加上科学学科测试。有的地方为了保证测试题的质量,减少了考试的次数。例如,高中的基线测试就利用中考成绩,初中的基线测试利用初一年级区市县等统一的期末考试成绩),同时进行学习背景问卷调查,由此得出学生学业成绩的起点分析,呈现给教育行政部门和学校的相关文件就叫作“增值评价的起点报告”。经过一段时间的教学之后(这个时间段由教育行政部门或者学校按照自己的教学需要选定,但至少要间隔一个学年),进行的第二次增值评价测试,就叫作增值测试。测试参加者应该是参加过基线测试的同一批学生。一般的增值测试就利用全域统一的下一个学年的学年测试,初中最终的增值测试可以利用中考成绩,高中的增值测试则可利用高中学业水平测试或高考成绩,结合起点分析的结果就可以进行增值分析。增值分析一般包括哪些内容呢?
以某市高中为例进行考察。其基线测试采用学生的中考成绩,增值测试采用学生的高考成绩,其中市级、校级相关数据皆为该市市属高中学生中、高考成绩匹配成功的数据,增值计算模型为“百分等级成长模型”,则增值分析的内容包括以下几个方面。
基本情况分析:主要通过从不同角度分析数据,从而对本市各校不同学科的基本情况进行分析;
高考不同分数线等级情况分析:主要是将不同分数线等级的学生人数百分比进行分类分析;
中考与高考不同分数线等级学生追踪分析:详细分析两次考试中不同分数线等级下学生的变化情况;
本市各校增值情况分析:主要呈现本市各校的增值结果;
本市各校不同性别学生增值情况分析:按照性别将学生分类,呈现出不同性别学生的增值表现的差异;
本市各校不同等级潜力生变化及增值分析:通过不同分数线对本校学生进行分类,分析本校学生两次考试的变化情况及增值情况;
本市及各校细分等级增值情况分析:将本校学生根据成绩高低排列,分为十个等级(总分为二十等级),对比这十个等级(二十等级)下学生的增值情况;
本市各校学生增值情况分析:以学生个体为准,呈现不同增值表现情况下的学生分布情况;
本市各校各科增值情况概览:主要汇总呈现本市各校的增值结果。
呈现给教育行政部门或者学校的增值分析的文件叫作某年某地某类学校“增值分析报告”,或者某年某地某类学校“教育发展报告”。
完成以上步骤和整体设计方案的过程就是增值评价的过程,具体流程如下图所示。

增值评价的流程
从形式上来看,按照上图所示流程进行的教学评价就叫作增值评价。下面就这一流程及其所涉及的内容进行理论阐述和实践思考。