首先我们来看学生成绩评估。学生成绩评估对于教学的作用,不仅仅在于教学评价。每一节课后的行为测验是确保学生掌握单节课目标的重要手段,同时也为教师进行教学方案的评价提供依据。同时它还有另一个作用,即可以诊断学习困难,这样教师可以基于诊断测验的结果,给予个别学生有关前提技能的补救教学。
对于学生成绩评估的方法,加涅提出了目标参照评估与常模参照评估两种。目标参照评估,对于教师进行形成性教学评价具有重要的意义。所谓目标参照评估,就是指通过编制各种测验或通过其他的评估方法,直接测量课程目标中所描述的各种行为表现目标是否实现,以此来评估学生的学习。
在教学设计中我们提到了教学目标精确化的方法,就是通过“五成分目标法”写出行为表现目标,这些行为表现目标恰恰就是进行目标参照评估的基础。那么究竟如何来进行目标参照的评估呢?
首先,加涅指出评估方式的设计可以呈现多种形式,比如说各种文字或是口头测验,抑或是学生的学习成果,比如说写出的一篇文章,设计的一幅作品等。
其次,是如何判断评估的有效性问题。目标参照评估需要以教学设计中行为表现目标为参照,也就是说评估是否有效,关键是看评估中所要求的行为与目标中所描述的行为是否是一致。如果“是”,则测验是有效的。当然,这里就有一个前提,那就是目标本身陈述的有效性,即行为表现目标是否反映了单元或课时的目的。①
最后,加涅提出了在进行目标参照评估中应该注意的一些问题。①
第一,将行为目标转变为测验时,对于目标描述中的性能动词与行为动词要特别注意,必须尽量使测验与目标的意图保持一致。比如说在目标描述中是这样陈述的:“要求不查看资料的参考资料,陈述辛亥革命的意义。”这样就只能通过口头提问或是书面的形式要求学生回答该问题,而不能设计多项选择题要求选择哪些选项说明了辛亥革命的意义。当然如果对于本身目标描述动词就含糊不清,则需要首先对目标陈述进行修改。由此可见,教学目标的精确化对于目标检测的重要性。
第二,应该避免改变目标中的其他成分。在进行目标描述的时候,我们前面提到过目标表述中的五成分,即①情境;②所进行的学习的类型;③行为表现的对象;④可观察的行为;⑤适用于行为表现的工具,限制或特殊条件。也就是说,测验中除了要与性能动词与行为动词保持一致外,其他成分也是一样。这样主要是为了避免测验测量的是学生尚未学习过的能力。比如说目标是要求“通过打字,在半个小时内生成一封书信。”由目标可以看出,其要求学生获得两种学习结果,一是动作技能;二是智慧技能。学习者必须在限制条件下,自己构思一封书信并打出来。如果在测验中给定一封书信要学生打出来,抑或是要求学生手写一封书信,这样都违背了原目标的意图。
第四,要说明的一点就是关于目标参照评估的标准。因为目标参照需要以目标描述为基础,而目标描述中一个显著的特点就是,每一个目标描述中都通过性能动词,将目标进行了学习结果类型的划分。所以对于目标参照评估的标准则通过每一类学习结果的类型来论述。
(1)言语信息。
关于言语信息,其主要意图在于评估学生对于某些特点的历史事件、某一现象、某种事物知道多少,学生从教师的讲课、课本以及学习材料中到底获得了多少陈述性知识。所以,一般只要目标中对于言语信息的表述较为清晰,评估相对来说比较容易。评估言语信息通过一些测试题来进行,比如说:根据所学知识,至少陈述辛亥革命的三点意义;说出氧气的物理形式和化学性质;说出世界上使用最广和使用人数最多的语言是什么等。
(2)智慧技能。
辨别,对辨别的评定,只要求学习者能够辨认有无差异即可,测评中不要做过多的要求。一般只要学生根据刺激作出相同或是不同的反应即可。比如说“呈现五个词,其中四个属于同一类,在一分钟之内通过圈出那个不同的词将其区分出来。”
具体概念,对于具体概念的掌握并不要求像定义性概念要求严格,检验具体概念是否获得,关键是看能否能将表示具体概念的事物识别出来。比如前文提到的一个具体概念的目标“用投影仪呈现一组细胞图,通过用笔圈出以识别细胞壁。”测验则可以画一个细胞图,要求学生标出细胞壁的位置。
定义性概念,在进行定义性概念的评估时要尤其注意不能简单地以能陈述某一概念的具体内容是什么作为定义性概念已经掌握的标准。因为学习者能够陈述概念是什么,并不意味着其就掌握理解了该概念,可能其对于概念只是将其当做言语信息进行了简单的记忆而已。比如说目标要求是掌握“指数函数的概念”,检测是一般并不是要求学生描述什么是指数函数,而是要求学习者归类。一般测验可以这样进行:给出y=x2,y=3*,y=logx3,y=9x-4,y=5x3,y=(14)*;(),挑选出所有的指数函数,将其填入后面的括号里。
对于规则的测验,一般只要目标描述得足够清楚,是很容易设计测试项目的。比如说“给出三个直角三角形任意两条边的长度,通过说出第三边的长度,演示勾股定理的规则。”对于这样的目标表述,则极易设计出这样的题目。
而对于一般要多少个测试项目才能判别学习者掌握或是未掌握规则这样的问题,加涅指出,常规做法,对于一个算术规则的学习情况进行测验,10到20个项目即可,并要注意测试要具有变式,以便促进保持和迁移。
高级规则,相对而言高级规则的测验比较复杂,因为高级规则中涉及多个规则的综合运用能力。比如说“给出某处的景观,要求通过综合运用比喻、拟人、夸张、排比等修辞手法,以书面的形式生成一篇描写这处景物的文章。”对于这样的目标,测验项目自然就是要求学生完成一篇写景的文章。但是如何判定学生是否已经达到了目标,则需要从多方面进行评判。不仅仅在于学生的文章中是否使用了比喻、拟人等修辞手法,还在于使用得是否恰当。同时对于文章的评判,还将包括是否有错别字、是否语句通顺、标点符号是否使用正确、意境是否优美等。
(3)认知策略。
相对于其他学习类型,认知策略的测验可能最为困难。因为认知策略总是与其他学习情况联系在一起,很难直接测得学习者是否获得了这种策略。比如说“呈现十个英语单词,要求学生采用联想记忆法,在3分钟之内记住这些内容”。对于这样的目标,当测验时设计十个英语单词,要求学生记忆,但是却很难判断学习者究竟是通过什么方法记住的,很有可能其是通过机械记忆,抑或是他以前就认识这其中的某些单词。所以,加涅指出,为了检验学习者所使用的策略,可以要求学习者进行“出声的思维”,也就是要求学习者说出他们是如何记忆的,如果其采用了联想记忆法,那么说出他们联想到了什么。同时,另外一个需要注意的是,最好设计中能够确保这些单词是学习者不太熟悉的新单词。
(4)动作技能。
动作技能的评估可以说是最精确的,通常采用的方法是进行行为对照,即根据动作的精确度和速度来判定学习者动作技能的获得情况。对于“给学生一个圆规和一把没有刻度的直尺,要求学生执行尺规作图,画出已知线段的垂直平分线”。这样的要求,就可以根据学生作图的准确度和时间长短来判断学习者对该技能掌握的熟练程度。再比如说跳绳,可以通过一分钟学习者跳绳的个数来判断其对跳绳掌握的程度,以及是否需要进一步练习。
(5)态度。
态度主要是通过对影响个人的行为选择表现出来,但是却又不可通过一次的行为选择判断学习者已经获得了某种态度,所以态度很难通过测量来评估。一般只能通过观察,根据个体在某一给定的情境中以某种方式作出反应的次数比例,来评估其是指向还是背离某种态度。比如说在评估学生是否具有“爱护环境”的态度时,教师可以通过观察学生对于在马路上或是教室里,在无人监督的情况下,作出把果皮纸屑等垃圾放进垃圾箱的选择的次数来进行评估。也就是通过记录某一个时间段学习者行为表现来判断学生们是否获得了这一态度。
以上就是关于目标参照评估的标准,与目标参照评估相对的另外一种评估是常模参照测量。这样的测量的目的并不是为了检测目标是否达到,而是通过测验产生的分数把学生产生的成绩进行比较,这种比较可以是学生与学生之间,也可以是班级与班级之间,甚至是同年级的学校之间,这样的测量一般称为常模参照测量。通常用于评估学生在较大范围内学习内容掌握情况,比如说某一单元或是一个学期的课程,这种测量是总结性评价的重要手段。
一般学校所进行的期中考试或是期末考试等都属于常模参照测验,它们是对整体能力的评估,而不是具体的目标,要求学生在同一时间内运用所学习到的各种习得性能力,像智慧技能、认知策略、言语信息等。总之,其是为了检测学生对于各种知识技能的整合能力,为了进行相同基本内学习效果的比较。
讲完学生成绩测量,我们再来看教学方案评价。前面我们提到在评价中涉及形成性评价与总结性评价。教学方案的形成性评价,是对正在开发中的教程或方案予以效果检验,其目的在于提供可行性和有效性的依据,以便及时作出修改和改进。而总结性评价是对已经开发出来的教程或方案的效果进行评价。
对于教学方案的形成性评价首先要指出的是其主要针对的是单节课或是单元课程的教学设计。另外要指出的是,它有两个目的,一是检验方案的可行性;二是评估方案的有效性。“如果通过评价发现某节课的设计方案是不可行的,或是达不到课程的目标,则需要修改这节课,或是替换课题的部分内容,以便克服揭示出的缺陷。另外也可能不得不重备这节课或是完全放弃这节课。”①
针对方案的可行性,加涅举了这样一个例子。比如说科学课的设计中需要使用一种特殊的生存在水质澄清的池塘里的生物,如果不采取精心的保护措施,将这种生物移植到普通水中,存活的时间不超过两个小时。这样就为课程教学的实际可行性带来了挑战,教师必须舍弃该部分的设计,或是通过设计其他的活动来修改这部分的教学。
针对有效性,主要是观察、问卷或是随堂测验检查学生的学习业绩,用以评估每个学生是否达到了教学目标所规定的要求。比如说在设计高一数学函数这一单元的教学时,通过随堂测验以及学生作业情况发现某些学生对于函数的奇偶性掌握程度并不理想,尤其是在奇偶性的求证上。那么原先单元设计中的计划就必须修改,教师需要考虑附加一节课进行教学补救。
这里需要强调的是,对于教师来说,一般需要做的是加涅所说的形成性评价,检验单节课或单元课程设计的可行性与效果。而对于总结性评价中涉及两个教程比较的问题,一般是教学产品开发人员所做的事情,因为这其中涉及变量控制的问题,这里不做介绍,感兴趣的读者可以参考加涅的原著《教学设计原理》。当然,教师也可以通过期末测试等手段了解学期教学目标是否达到。