首页 -> 2008年第3期

从考试效度论语言测试

作者:林宗豪 缪肖强 王妮娜




  [摘 要]要检测教育的效果,离不开对被教育者的评价,其中最重要的一环就是采用语言测试的方法来检测教育的效果。而检测一份测试卷质量的关键要素便是语言测试的信度和效度。本文阐述语言测试的效度及其分类、效度的评估法、信度与效度这对矛盾的处理方法,以期保证语言测试的科学、客观、准确、公正。
  [关键词]语言测试 效度 信度
  
  (一)导言
  
  语言测试的效度(包括表面效度(face validity)、内容效度(content validity)、结构效度(construct validity)和效标关联效度(criterion related validity)),是指测试在何种程度上考察了它想要考察的内容。举例来说,如果考试者很熟悉考试题目,那么测试的效度就降低了。而语言测试的最终目的是检测考生的语言能力,这涉及到考试的结构效度(construct validity),所以要对受试者的语言能力作出科学的测量,效度乃是最重要的依据,对语言测试效度研究意义就在于此。本文将着重分析语言测试中效度的评估方法以及信度与效度这对矛盾的处理方法作述评。
  
  (二)效度的评估法
  
  测试的效度,是指测试的准确程度,换言之是指测试卷是否测量了它所要测量的东西,是否达到了它所预定的测试目的。下面我们着重论述效度的定量分析法中的公式测定法。公式测定法是指用教育统计公式来测定测试的效度。测试效度的求法,即是求两次测试成绩的相关系数。一般求出的相关系数大于0.7为最好,小于0.4时的效度就差。效度差,说明学生掌握的知识与试题所涉及的内容相关性差,试题的准确性也差。具体计算公式如下:
  
  公式中r指考试预测效度;Xi指第一次考试分数;X指第一次考试分数的平均值;Yi指第二次考试分数;Ē指第二次考试分数的平均值;n指参加考试的学生总数; 指第一次考试分数的标准差; 指第二次考试分数的标准差。注意Xi,Yi 应从高到低排列起来。除此以外,还有区分法,篇幅所限恕不详述。
  
  (三)信度与效度矛盾的处理
  
  既然语言测试的信度和效度互相矛盾,那么迄今的实际的语言测试对它们又是如何处理的呢?答案是积极平衡。具体做法如下:
  探索用信度高的形式考效度高的内容的道路,研究提高受测试的具体行为的外推性的途径。当然,更长远的解决办法得靠与语言测试相关的内容科学与手段科学的向前发展。简言之,信度与效度矛盾的最终解决,也就是语言测试科学与语言测试艺术矛盾的最终统一。
  
  (四)结语
  
  本文阐述语言测试效度及其分类并对效度进行评估,然后阐述信度和效度这对矛盾体的处理方法。其实效度这个概念涉及面很广,与著名语言测试学家Bachman在其专著Language Testing in Practice中提到的其他五个元素信度(reliability),真实性(authenticity),相互作用性(interactiveness),后效作用(impact)和适用性(practicality) 以及试题难度(item difficulty)和试题区分度(item discrimination)等因素都有关系。这些所有关系形成的综合网络才能对一份试卷的质量作出科学、客观、准确、公正的评价。所以在保证效度的同时,一定还要顾及信度及其他要素。这有待于进一步地探索和总结,从而成就语言测试科学与语言测试艺术矛盾的最终统一。
  
  参考文献:
  [1]Lyle F.Bachman and Adrian S.Palmer Language Testing in Practice[M].上海:上海外语教育出版社,1999.
  [2]李筱菊.语言测试科学和艺术[M].长沙:湖南教育出版社,1997.
  [3]陈坚林.现代英语教学组织与管理[M].上海:上海外语教育出版社,2000.
  [4]邹申.英语语言测试——理论与操作[M].上海:上海外语教育出版社,1998.
  [5]胡壮麟.语言学教程[M].北京:北京大学出版社,2001.
  [6]刘润清,韩宝成.语言测试和它的方法(修订版)[M].北京:外语教学与研究出版社,1991.
  [7]王晓军.西部英语测试实证研究&SPSS操作[M].银川:宁夏人民出版社,2006.
  [8]刘忠见.语言测试的信度与效度[J].煤炭高等教育,2002,(1):73-74.
  [9]陈纪梁,陶伟.浅论语言测试的信度[J].山东师大外国语学院学报,2000,(4):30-32.
  
  注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
  


本文为全文原貌 请先安装PDF浏览器  原版全文