首页 -> 2006年第12期

试卷质量的统计分析与评价

作者:李竹宁

数)。该方法是通过比较两个极端效标组(高分组和低分组)在同一试题上反应的差异来估计试题区分度的。具体做法是:将学生考试的成绩由高到低的顺序依次排序,然后取其上端一部分为高分组,取其下端一部分为低分组。计算公式为:Di=(Hi-Li)/Mi。式中:Hi表示高分组第i道题的平均分值,Li表示低分组第i道题的平均分值,Mi表示第i道题的满分值。
  计算上例,得试卷区分度分析结果:
  
  测量结果的评价一般采用根据美国测量学家伊·贝尔(Ebel,L.)提出的评价标准,从上表看,各试题基本在良好以上,试卷总的区分度为良好。
  
  3.考试信度的测定
  对考试整体质量的评估首先必须考查考试结果的稳定性程度,即考试的信度。由于任何考试结果都会因考试误差的客观存在而受到或多或少的影响,因此百分之百可信的考试几乎无法得到。一项考试的信度就是这项考试的一组成绩和对同一组实施等价考试所得的成绩相比较它们的一致性程度。考试信度是考试客观性及考试结果准确性的一种反映,是推测考试可信与否的最重要量化指标。
  考试信度计算一般采用克伦巴赫(Cronbach)α系数法:α=(k/k-1)×(1-∑Si2/S2)。式中:k为试i题个数,Si为考生对第i题得分的标准差,S考生总分的标准差。各试题得分标准差越小,总分标准差越大,信度就越高。一般考试的信度要求达到0.5以上。
  由前例得试卷信度分析结果:
  
  经计算考试信度值d为0.54,说明试卷信度一般,今后还要从这方面加强。
  
  4.考试效度分析
  效度是指考试结果能否准确地表明所要测量的特征或功能的程度,也称有效性。本文采用效标关联估计法,以考生各科(一般选三门课程)平均成绩做效标,计算参考成绩和考试成绩的相关系数并将该值作为考试效度值。该值一般应在0.40~0.70之间,小于0.40应视为无效考试。
  选择3个班三门课的平均成绩作为参考成绩。设,
  
  Yi为第i个考生的参考成绩。
  经计算此次考试的效度R为0.62,比较理想。所以采用本方法对课程进行考试效度测试,效度测量结果是合理的和有效的。
  
  三、各班成绩差异显著性检验
  
  在试卷分析时,有时还需要检验一个教师所任平行班的某门课程考试成绩是否有显著性差异,或由不同教师所任平行班的某门课程的成绩是否有显著性差异。这类问题可由假设检验和方差分析来检验。
  ONE-WAY方差分析是检验同一因素不同水平(即不同分类状况)平均值的差异一种统计方法,当F值进入显著性水平时,从理论上认为在不同水平上,它们的均值有显著性差异。
  利用EXCEL中的数据分析工具对前例的3个班的成绩进行方差分析,设定显著水平α=0.05,得到计算结果:
  因F>FI临界值,故拒绝原假设,可以认为3个班考试成绩有显著差异,再通过两两检验得出2110612班与另外两个班的成绩均存在明显差异,其平均成绩低是由于其班级水平较低造成的(从前面所取的参考成绩来看此班也与另外两班存在相同差异)。
  通过对试卷中试题及学生成绩情况的分析,一方面可以得到教学情况和学生学习情况的反馈,另一方面,通过对分析结果作客观、详细和真实的分析、记载,使试卷试题具有较高的信度,从而使教学考核和教学质量越来越高。
  (参考文献本刊略)
  (责任编辑 关燕云)

[1]