首页 -> 2006年第12期

试卷质量的统计分析与评价

作者:李竹宁




  考试是教学过程中的重要环节,是检测教学质量、衡量教学效果的重要手段,也是检验和评定学生对知识和技能的掌握情况的重要方法。考试成绩的定量分析是教学过程中的一个不可忽视的环节,是评价考试质量的最重要、最有效的方法。利用试卷中包含的信息对考试进行分析,可以发现学生错误的集中点,帮助教师改进今后的教学,改进考试设计,减少考试设计中的主观随意性,对今后的命题具有指导意义。通过定量分析,获取有关试题质量的各项指标,以判断考试的有效性,发现教学过程中的薄弱环节及存在的问题,并有针对性地改进,对教师教学质量的提高是非常必要的。特别是在全面推行学分制管理,提倡教考分离的今天,试卷分析具有更重要的意义。
  考试质量评价指标包括对考试整体进行量化分析的指标(如成绩分布的正态性检验、考试的信度分析、考试的效度分析等)和对考试题目的质量分析指标(如试题难度分析、试题区分度分析等)。
  
  一、考试成绩频数分布的正态性检验
  
  正态性检验是试卷评价中一个不可缺少的指标。学生学习成绩的分布在外界条件相同情况下,因受智力影响较大,通常呈正态分布。当考试成绩分布呈正态分布时,测试效果符合自然分布规律,因此,认为试卷编制得比较成功,试题质量较好。测试学生总体学习成绩分布可以对试题质量进行粗略的评价。
  
  1.用偏态系数来研究考试成绩的分布
  正态性检验通常利用偏态系数来测定。偏态系数是用来反映频数分布偏态方向和程度的指标,偏度系数值应在O附近,当出题难度掌握不当,形成偏态分布后该值将明显偏大或偏小。
  偏态系数的计算方法有很多种,矩法(method ofmoment)就是其中比较常用的一种,它不仅可以测定频数分布的偏态方向,还可以测定分布的偏斜程度。
  偏态系数的计算公式为: 。式中:X为各组平均分数,fi为各组的频数,6为标准差。6值应介于0与±3之间;当d>O时,说明频数分布呈右偏,即正偏,且α值越大正偏的程度愈大,说明学生的考试成绩差者居多,而优良者较少,说明试卷命题偏难;当α<O时,说明频数分布呈左偏,即负偏,且α值越小负偏的程度愈大,说明学生的考试成绩优良者居多,成绩差的较少,试卷命题偏易;而当α=0时,说明频数分布不发生偏态,即分布是对称的,说明试卷的难易程度与学生的学习能力相适应,考试成绩正常。
  以某校3个班某一科期末成绩为例(见表1数据),计算得偏态系数仅=0.35,频数分布呈轻微右偏。
  
  2.用峰度系数来研究考试成绩的分布
  峰度系数也是检验成绩分布正态性的一个指标。峰度是指分布图形的尖峭程度,它通常与标准正态分布相比较,若分布的形状比标准正态分布更尖更陡,则称为尖峰分布;若分布的形状比标准正态分布更平更缓,则称为平峰分布。峰度系数是用来反映频数分布峰度方向和程度的指标,偏度系数值应在3附近,当出题难度掌握不当,则该值将明显偏大或偏小。
  峰度系数也可通过矩法(method of moment)计算。峰度系数的计算公式为:
  。式中:X为各组平均分数,fi为各组的频数,仅为标准差。当p>3时,成绩分布呈尖峰分布,说明试题中同等难度的项目较多,梯度偏小,呈这种分布的试题几乎不能将不同程度的学生区分开,分数分布过于集中;当p<3时,成绩分布呈平峰分布,说明试题中各种难度的项目比例接近,梯度较大,呈这种分布的试题区分度较高,但分数之间的差异偏大;而当p=3时,说明频数分布峰值适中,各种难度的项目比例合理。 根据前例计算峰度系数p为2.64,频数分布呈轻微平峰分布。
  
  3.用X2拟合优度来测定总体分布
  试卷命题的难易、教学水平的高低以及学生理解能力的强弱,都影响着学生考试成绩的分布。因此,需要对试卷实际分布是否服从理论分布来进行检验。这可由总体的X2拟合优度检验来证明。其基本步骤如下:
  (1)建立假设。原假设H0:观测数据的频数分布与正态分布没有显著差异;备选假设H1:观测数据的频数分布与正态分布有显著差异。
  
  
  
  二、试题质量分析
  试题作为考试的一个重要方面,它的质量的好坏直接影响着考试的质量,所以试题分析是保证考试质量的先决条件。试题分析是批判地审视试题的过程,它的目的是为了挑选最佳试题从而生成高质量的试卷。其中以试题的难度和区分度作为评价试题质量的主要指标。
  
  1.试题难度的测定
  试题难度是反映题目难易程度的量化指标,有时也称作试题难度系数,是反映试题质量的重要指标之一。某一题目的难度系数通常用该题目的答对率或平均得分率表示。试题越难(试题难度值越小),说明能够正确解答该题的学生越少,或该题的得分率越低。试题难度对考试成绩分布具有重要的影响。如果难度接近0的题目数量比例较大,得低分的学生就较多,成绩分布将会相对集中在低分段,分布呈正偏态;如果难度接近1的题目数量比例过大,得高分的学生较多,成绩分布将集中于高分段,分布呈负偏态;当试卷中中等难度试题题目数量比例过多时,成绩分布呈陡峭峰形态。
  当试题是主观题(答对得分、答错不得分)时,难度用答对题目的人数与参加考试总人数的比值表示;当试题使用连续分数计分时,难度应用参加考试的全体学生在该题的平均得分与该题满分的比值表示。试题难度系数的计算公式为: 。式中:Xi表示第i道题的平均分值,Mi表示第i道题的满分值。
  同样计算上例,得试卷难度分析结果:
  表2试卷难度分析表 试卷的难度系数为:P=∑MiPi/∑Mi=0.6707 试卷难度系数一般在0到1之间,以0.5~0.6为最佳,1)20.3~0.7为难度适宜;低于0.15~0.3太难,高于0.7~0.85太易。从表中计算中可以看出,这份试卷题目的难易程度基本适中。
  
  2.试题区分度的测定
  试题区分度(D)是指考试题目对学业水平不同的学生区分程度或鉴别能力,是判断试题质量的另一个指标。某一道试题使学业水平、实际能力较高的学生得高分,而学业水平、实际能力较低的学生得低分,则认为该题目有好的区分度。区分度高的试题,能将不同水平的考生区分开来;区分度低的试题,则对考生水平不能很好地鉴别,水平高和水平低的考生得分差不多。试题只有具备良好的区分度,考试才会有一定的效度。
  试题区分度计算最常用的计算方法是极端分组法(用该方法计算的试题区分度又称试题鉴别指

[2]