首页 -> 2007年第4期
完形测试的心理语言学基础与命题原则
作者:薛 荣
C测试的优点是易于命题,每个空的正确答案只有一个,易于评阅。它的缺点是读起来不像传统的完形测试那样流畅,影响对文章内容的理解,而正确的答案也很容易从上下文中找到(Hughes,l989:71)。
Brown,H.D.(2004)在他的新著Language Assessment:Principles and Classroom Practices一书中又介绍了一种新的完形测试——删词完形测试(Cloze-elide procedure)。这种测试形式的做法是在一篇短文中插入一些不符合上下文的多余的词,要求考生识别这些多余的词,并把它们划去,例如:
The recognition that one’s now feelings of happiness and unhappiness can under coexist much like love and hate in a close then relationship may offer valuable clues on how to lead a happier with life.It suggests,for example,that changing or avoiding my things that make you miserable may well make you less miserable ever but probably no happier.
在这个例子当中,“now,under,then,with,my,ever”都是多余的词(intrusive words),是应该删除的。对这种完形测试持批评态度的人认为这种形式并不能测试考生的校对能力(proof-reading skill),而是测试考生的阅读速度。这种测试形式有两个明显的缺陷,首先插入的词汇和插入词的间隔都没有多少道理(rational)。其次阅读速度快、效率高的读者并不一定擅长于找出多余的词(Brown,H.D.,2004:204)。
三、完形测试的命题原则与方法
1.语料的长度、难度与文体应该与考生的语言水平一致
语料的选择是完形测试设计中的一个相当重要的环节。标准的完形测试形式一般是一篇长约300~400个词的语料(通常是短文或文章的段落)。语料的选择在一定程度上决定了完形测试的难度,语料太难或太易都会降低试题的效度,使测试达不到预期的目的。一般说来,语料的难度除了与文章的语体、文章所表达的内容以及涉及的背景知识等因素有关以外,还与语料中所用的词汇有很大的关系。实践证明,语料中的实义词词汇密度(1exical density)越大,专业技术性词语越多,则难度越大。因此,在设计完形测试的试题时应根据测试对象的水平、测试的目的和所采用的变体形式,从词汇的角度宏观地调控语料的选择。为了能够考查考生的语言综合运用能力,完形测试所选的短文必须在语言和内容两个方面都适合。
2.删词间隔的长短要符合命题原则
删词间隔的长短是完形测试设计时应注意的一个重要问题。标准的完形测试形式一般按“固定比率法”(fixed ratio method)来删词,即按每隔5至10个词的方法,将其中的一些词删除,切断该语料的语言结构模式,然后要求受试者在限定的时间内通过上下文或根据剩余文字还原出文中所删除的词,来达到恢复其语言结构模式的目的。通常在首句和尾句都不删除,以便将受试者引入语境,英国语言测试专家H.S Madsen(1983)指出:“最常见的间隔是每隔7个词删去一个,除非短文非常容易,否则每5个词删去一个的方法提供的语境不充分,而每10个词删去一个效果似乎又不太好。”Heaton(1988)认为,删词的间隔越长,所需的语料也越长。他还提出了一个计算公式:语料的长度=删词的间隔×40。
如果采用每隔7个词删除一个词的方法,语料的长度大概为280~300词,即7×40=280。如果采用每隔12个词删除一个词的方法,语料的长度大概为480~500词,即12×40=480。
在设计具体的完形测试时,要决定删词间隔长短,不仅要考虑测试的对象和语料的难度等因素,而且还要考虑所采取的完形测试是何种形式。就同一测试对象、同一难度的语料而言,若采用标准的完形测试形式,则删词间隔不能太短,因为这种变体形式难度较大;若采用多项选择式完形测试的变体形式,则删词的间隔应短一些,以便增加试题的难度。
3.正确的可以接受的答案
设计还原词时,一般应尽量避免还原词为人名、地名、日期、数字或较偏的专业技术性词语。此外,不同的完形测试变体形式,因其测试的重点有所不同,在还原词的设计上也有它们各自不同的特点。例如,标准的完形测试或意向删词型(rational cloze)的完形测试的还原词应尽可能控制在受试者的“积极词汇”的范围内,而多项选择式完形测试的还原词必须是那些便于根据测试对象编制“干扰项”的词,否则若“干扰项”起不到干扰的作用,测试也就失去了信度和效度。
四、完形测试的评分方法
完形测试的评分方法一般有两种,原词评分法(the exact word method)和“合意词评分法”(acceptable word method)。原词评分法意味着考生只有填写原文所用的词才可以得分,同义词评分法只要求考生填上一个符合上下文且词义合适的词就可以得分。这两种方法都各有其利弊,如果采用第一种方法,评分过程客观迅速,无须评分员作出判断,因为答案是惟一的。但是这种方法对那些具有创造性的学生却不公平,他们可以根据自己掌握的词汇填上一个与原词同义的词甚至比原词更为贴切的词,但却不能得分。例如:
Joe is a freshman and he( 1 )having all the problems that most( 2 )have.As a matter of fact,his( 3 )started before he even left home.(Key:1.is,2.freshmen,3.problems)
如果采用原词评分法,第三个空的惟一正确答案是“problems”。其实根据上下文,其他的一些词,如“difficulties”,“worries”,“troubles”也是完全可以接受的。这样对那些正确理解上下文,并且能够填上上述三个词的那些学生来说是不公平的(何国伟,1995)。
“合意词评分法”的优点是具有灵活性,对每个考生来说是公平的。但如果采用“合意词评分法”,也会带来一些问题,这样完形测试的评分过程就会十分复杂。每个空都需要事先设计好可以供选择的若干个正确选项,还需要经过严格训练的评分员来评阅。另外一个问题是很难判断哪些选项是可以接受的,哪些选项是不能够接受的,因为一个可以接受的答案可能会影响另一个词的可接受性(acceptability)。另外一种不常使用的评分方法是由D.K.Darnell创造的,叫完形测试预测法(clozentropy)(Harrison,l983:115)。这种评分方法的第一步是让英语为母语的人先做完形测试试题,然后把母语使用者所填的词按使用频率排列。第二步是把试题让英语作为外语的考生来做,在评分时,根据母语使用者所填词的频率来确定每个答案应得的分数。这是一种非常准确的评分方法,但它只适用于研究目的,在实际考试尤其是在大规模考试中是不实用的,因为很难找到足够的母语使用者去确定每个空的用词频率。
(参考文献本刊略)
(责任编辑 张茂林)
[1]