首页 -> 2006年第3期

关于我国语文试题评价的评价

作者:唐建新




  现阶段我国对语文试题的评价基本上是这样一种状态:高考语文试题的评价以群众性评价为主,供专家反思,多少起到了广开言路、自然匡正的作用;中考语文试题的评价则以专家性评价为主,基层仍然跟着感觉走;小学语文试题还基本上处在无评价、无理性追求的阶段。
  具体说来,我国语文试题的评价现状有以下缺失:
  1.没有自己的评价术语。虽然社会迫切需要考试评价,学校教育却非常忌讳考试评价,对考试的评价始终比较随意。由于语文内容的特性,任何人都可以根据自己的感觉对语文试题指手画脚,没有学过中文专业的人,一点不知道语文学科性质的人,都可以从自己的感觉出发,使用自己喜欢的术语对语文试题进行评价。至今,就连“信度”“效度”“难度”“区分度”等概念都还没有普及,更不用说更专门的评价术语了。
  2.没有试题的全局观念。2004年的语文中考评价报告陆续问世,但是,零敲碎打的多,分门别类的多,而对一份试卷进行整体评价的少。没有全局观念,还表现在只评价自己的或者自己周边的试题,对其他地方的试题,或许因为没有时间或许因为比较陌生,涉及较少。由于分别评说,每一部分都在求全,自然就“求全责备”,全然忘了抓大放小的道理。
  3.没有评价的可行性检验。评价中提出了很多理想化的要求,如中考要尝试进行面试,口语交际最好不要采取纸笔形式,能够开卷的尽量开卷,等等。在人口不断激增,高中优质教学资源远远满足不了老百姓要求的情况下,这样做将调动多少人力物力财力,将占用多少时间,这是需要冷静思考的问题。
  4.没有试题评价的评价。当一种行政行为只剩下一种声音而没有不同的声音时,它离停滞和僵化就不远了。中考语文测试代表的是政府行为,而对测试的评价又没有来自群众的声音,一些专家的即兴的言说就成了中考语文试题的定论,而不同专家的意见却很不一致,譬如,一些专家在引进外国语文试题时欣赏某些试题之首的温馨提示语,甚至小天使之类的小插画,认为它们可以缓解学生的紧张心理,体现了以人为本,而另一些专家则把它们作为干扰学生考试的典型事例在全国会议上严厉批评。对这样的情况,基层的命题者没有申辩的地方,没有讨论的平台,其结果是我国的语文试题的命制水平难以稳定提升。
  造成以上状况的原因有以下几点:
  1.基础研究的薄弱。我国的语文教育同其他学科的基础研究一样,还非常薄弱。这表现在对语文是什么,初中阶段应该完成哪些量化的语文内容的积累,高中阶段有哪些具体的可以操作和检测的教学任务等问题,至今没有能够取得共识。也就是说,考试的内容是一笔糊涂账。其次是考试技术及手段的研究,似乎从来没有引起重视。同样是考查一个字或一个词的掌握,有多少种方式,哪些方式的有效性高,哪些比较高,哪些不那么高,没有人能够说清楚,更不用说对文章的阅读理解能力以及批评鉴赏能力的检测,有多少种方式供命题人员选择,这些方式分别适应哪些阅读对象等问题了。在国家没有投入足够的人力财力和时间的情况下,任何单位和个人都难以进行这一极其浩繁的艰苦的基础性研究,长此以往,语文考试水平的提高自然非常缓慢,试题命制的随意性、模仿性将在相当长时间内继续。
  2.学科及考试性质的双重性。学科性质的双重性,使得试题命制时很难把握。工具性是一个比喻的说法,没有正面下定义,没有确定的内涵与外延,这自然就使试题命制者难以把握学科试题的内涵特征及外部边界;人文性有无所不包之嫌,很难划出语文与其他人文学科的明确界限,使得语文自身的学科特点不容易凸显。考试,尤其是中考,要兼顾毕业与升学两方面的要求,也就是要体现水平考试和选拔考试双重功能。实践中这是无法兼顾的,教育行政部门为了宣示义务教育的政绩,要求的合格率越来越高,而高中优质教学资源的有限性使得升学竞争越来越激烈,要求的区分度越来越高。2004年国家级课改实验区的测试,要求以水平测试的名义进行,难度值必须达到0.75,即人均得分率在75%。实践中又有多少能够达到呢?
  3.评价机构的缺失。作为有十多亿人口的大国,语文考试的需求量自然非常巨大,中小学的语文教育与考试涉及千家万户、方方面面,应该有全国性的国家机构进行母语教育的考试研究,也应该有类似的母语教育考试评价机构,肩负起对各地各类语文试题的评价工作。