首页 -> 2008年第1期

基于工作单的科学探究能力评价研究

作者:董秀红 罗国忠




  一、引言
  
  新课程提倡科学探究,并强调以多种方式来评价学生的科学探究能力。然而,迄今为止,我国仍然只采用被国际公认为低效的纸笔测验来评价学生的科学探究能力。在国际上,工作单是评价科学探究能力的主流方式,即让一群学生各自动手探究,同时把探究过程和结果写在一个单子上,然后评分者对单子中的内容进行延时评价。国际研究表明,工作单能可靠、有效地评价学生的科学探究能力,因此,工作单备受国际科学教育界的青睐。本研究以基本要素分析(Primary Trait Analysis,PTA)为理论依据,在这些国际项目的基础上,构建一个优化的工作单评价体系,并研究初三学生在这种评价方式中的探究表现水平及特点。
  
  二、方法
  
  1.被试
  被试选自贵州省10个中学,每个中学各一个初三完整班,共612人,这些学生在初中阶段做过两三次比较完整的科学探究。
  2.过程
  (1)构建工作单的评价体系
  以PTA为理论依据,在国际评价项目的基础上,构建工作单(见表1)和评分标准(见表2)。探究内容为“单摆的周期与单摆的长度、质量有什么关系”,学生之前未探究过该内容。
  猜想假设、制订计划和概括结论三个探究要素的最高分值各为3分,每一个探究要素的关键成分最高分值1分,每一关键成分分为完全、部分、错误三个等级,其分值分别为1分、0.5分、0分。进行实验是科学探究的核心要素,因此,该要素最高分值为6分,每个关键成分最高分值2分,其完全、部分、错误三个等级的分值分别为2分、1分、0分。
  
  3.实测及评分
  把每个学校的学生分成两组,分别安排在本校两个实验室。学生单人单桌,独立完成探究,探究时间为45分钟。每个实验室由两个物理老师负责巡视,负责排除临时出现的器材故障,以及回答学生不清楚的问题,但不能提示如何做。
  评分前,两个评分教师对探究任务亲自动手做一次,了解可能的数据范围、误差的来源及范围等。然后,随机抽学生的5张工作单进行预评,找出两个评分者的差异,讨论之后再随机抽5张工作单进行预评,评分者信度达到0.81,表明评分教师基本达成了共识。实评时,两个教师各自评分,互不干扰。
  
  三、结果与分析
  
  1.猜想假设
  对于猜想假设,不适当的问题主要有两方面:①复杂水平低。本探究的问题是“单摆的周期与单摆的长度、质量有什么关系”,而不是“单摆的周期与单摆的长度、质量是否有关系”。前者属于趋向聚焦类型问题,要探究这种类型的问题,需要多次改变自变量;后者属于区别聚焦类型问题,要探究这种类型的问题,只需要改变一次自变量。很显然,区别聚焦类型问题的复杂性低于趋向聚焦类型问题。从学生的假设来看,接近一半的学生假设类似于“单摆的周期与单摆的长短有关系、质量有关系”等,这些假设属于区别聚焦类型假设,其复杂水平低于趋向聚焦类型假设。②假设不合理或部分不合理。例如,较多学生的假设类似于“单摆摆长越长、质量越大,摆动周期越大”。对于这个探究内容,初中物理没有关联知识,但在5分钟预操作中可以大幅度改变摆长,即使有误差,也不难得出“摆长越长,摆动周期越大”的定性结论;但是,质量难以大幅度改变,再加上误差,较难在5分钟内得出正确结论,以致很多学生受“摆长越长,摆动周期越大”影响,得出“质量越大,摆动周期越大”的假设。
  2.设计方案
  对于制订计划,不适当或错误表现在几个方面:①不控制相关变量。例如,“用细绳拴住小球,挂在铁架台下,让它摆动;分别增加细绳长度、小球质量,让它摆动,测它的摆动周期”,接近一半学生没有提到摆角及其控制。②空白或模糊。例如,“先吊好小球在铁架台上,然后测量细绳长度、单摆与竖直方向的夹角、摆动的时间、摆动的次数,最后算出单摆周期,这样进行多次条件不同的实验,以作对照”。从这些模糊的表述中,看不出这些学生如何操纵自变量、控制相关变量、测量因变量的。
  3.进行实验
  对于实验,评分者无法观察到操作和测量过程,只能通过表格中的数据来判断学生对自变量的操纵和测量、相关变量控制、因变量的测量等方面的适当性。只用学生表格中的数据来判断学生的实验过程,会有一些判断失真,从而导致两个评分者的不一致。例如,尽管一些学生获得的一些实验数据不适当,但他们也会把全部数据记录在表格中,但在概括结论时可能会把某些数据排除,保留某些数据。因此,需要结合后面的概括结论步骤来判断,概括结论步骤要求学生在工作单中“说明你用了哪些数据来得出这个结论”,以便评分者判断学生究竟用了哪些数据。结果发现,一些学生提供的数据很清晰,如“用了第一和第三次实验的数据”,这时两个评分者的判断没有歧义;但是,一些学生并没有提供数据,或提供的数据比较笼统、模糊,如“用了表格中的数据”,这时评分者需要分析学生表格中的数据,会出现一些歧义。
  自变量的操纵和测量,不适当或错误表现在几方面:①自变量的起始点不适当。例如,单摆长度过短,导致摆动周期太小,使得计数摆动次数困难,容易出现误差。②自变量改变次数不够,只改变一次。③自变量变化间隔过小。由于误差不可避免,单摆长度改变间隔过小,再加上实验次数少,使得测出的摆动周期不变,甚至出现相反趋势。
  4.概括结论
  对于概括结论,不适当或错误表现在几方面:①没有提供支持结论的数据;②提供的数据模糊;③结论合理,但与数据不一致;④结论不合理,但与数据比较一致;⑤结论不合理,也与数据不一致;⑥结论过于简略、模糊;⑦重复描述数据,没有概括出一般性结论。其中,一些实验数据误差大,难以归纳出一般结论,但其中另一些数据并不太大,数据之间的关系已显端倪,但这些学生还是没有把其关系概括出来,对结果与结论不加区别,直接把结果当成结论。
  
  四、讨论及结论
  
  研究发现,运用工作单能够有效评价学生的科学探究能力。评分者无法从工作单“观察”到学生的操作细节,而是通过学生记录在工作单中的文字叙述、数据来进行间接推断。尽管工作单损失了一些探究信息,但保留了大部分探究信息;一些学生的文字能力较差,还有一些学生没有提供支持结论的数据,这可能会导致评分者产生一些歧义,但总的来说评分者信度较高,这些都说明运用工作单能可靠有效地评价学生的科学探究能力。这些发现表明,科学探究能力是一种具有复杂结构的高层次能力,不仅与探究任务的情境有关,也与学生的背景因素有关。很显然,对于这种复杂能力的测评,纯化情境、要素分离的纸笔测验是难以完成的。
  (责任编辑 关燕云)