麦克法登的主要思想:离散选择分析
      
          离散选择分析早期又称“定性反应模型(QualitativeResponseModels) ”。
      “离散”是指不连续,在数学上有专门定义。用林行止的话来说,就是“面面俱到”
      一个个的点。这里,“离散选择”指有限选择,当备选择集为有限集时,这种选择
      就是离散选择。传统微观经济学说是假定人们的消费选择是连续的,它所研究的往
      往是可量化的指标,如价格,数量等。在现实生活中,消费者面对的不一定是数量
      指标。在大部分的研究调查中,人们经济行为都是定性的而不能够量化,如就业还
      是不就业,受教育还是不受教育等等,这些就是离散选择分析中最基本的二项分布
      模型。其模型假设一个人要在两项事物中选择其一,而要选择哪一种必须看事物的
      性质而定。假设我们知道每一个人之特性的资料和他们的选择,我们自然要想知道,
      研究者是否能够建立一个方程式,用以预测不在原来样本中之个人的选择。例如,
      假设我们要建立一个模型,用来预测个人对某个城市公债之发行的表决。我们可能
      会预料个人的收入可能是投票表决的决定因素。高收入者可能会比低收入者更容易
      投票赞成发行地方公债。虽然我们可以预料收入和投票行为之间的直接关系,但我
      们还没有足够的资料十分准确地预料每个人的投票决定。一种可能的做法是预测某
      一收入阶层的个人投票赞成的可能性。定性选择模型的目的就是要决定具有某些特
      质的个人将会选择某一项事物的概率。例如,一个适当的模型及其估计结果使我们
      可以预测:收入1 万元的个人投票赞成发行公债的概率是06。更一般地说,我们想
      要建立具有某些特质的个人和他所做的选择之概率的关系。
      
          有人把这种定性选择模型应用于大学生是否住校或走读选择的预测中。它就是
      根据个人的特质和学校的特质来预测大学生住校的可能性。其结果表明,距离校园
      越远住校的概率越大; 而不管距离远近, 家庭收入越高住校的概率越高。在没有金
      钱限制的情况下,住校学生的百分比增加住校的概率也增加。最后,男生住校的概
      率要高于女生,但不显著。根据这个模型我们就可以用来进行预测。假设我们要预
      测某位学生,其家庭收入为6000,并且愿意住校。我们要假设他就读一家离家不远
      的学校,其中有50% 的学生住校。要预测他住校的可能性,我们可以根据所给出的
      模型计算出学生住校可能性的概率。我们可能还想知道,学生家庭和学校的距离增
      加后,学生住校之概率的变动。这些概率也就会表明,学生家庭离学校的距离多少
      学生会选择住校。也就是说,如果我们想要预测个人的选择,则当预测的概率大于
      50% 时,我们会预测肯定的结果,即学生选择住校;而如果预测的概率小于50% 时,
      我们就会预测否定的结果,即学生选择不住校。
      
          不过,在许多行为的选择中,并非仅是肯定或否定,而且有许多场合个人所面
      对的可能是3 种以上的选择。例如,一个人可以投票赞成,投票反对,或根本就不
      去投票。还有,如从事什么职业, 在什么地区居住,旅行时使用什么交通工具等。
      这些选择的变量不仅是离散的, 而且是多种选择的。例如,交通工具只能有公共汽
      车,小巴,轮船,火车,飞机,汽车,自行车等几种,可以将它们分别用有限几个
      数字0 ,1 ……7 来表示。而且在每一种离散选择的情况下,所有选择都是互相排
      斥的。这不同于像价格这种变量。某商品的价格可以是,比如说1 ~10之间的任何
      数据。所以价格这种变量或选择就是连续的。
      
          有学者应用这种离散选择的复式模型来研究个人在职业上的成就。其目的就是
      要依据一个人的种族、性别、教育程度以及经历来预测他会进入哪一职业阶层的相
      对概率,职业分成5 个阶层:专门职业、白领、工匠、蓝领和粗工,其模型样本选
      择了1000多个观察值,每个观察值都是在职人员。其研究结果表明,一个人的教育
      程度越高,就越有可能从事高收入的工作。这是一般人所料想到的,即教育可能使
      人提升社会地位。惟一的例外是,教育越多进入蓝领工作比做粗工不容易。工作经
      验在各行业之间并无多大影响力,并表示蓝领工人工作经验少而专门职业人员经验
      多。对于性别差异之估计结果也十分明显,即在其他条件不变的情况下,女性较容
      易进入较低收入职业集团的工作。而对于种族的情况来说,黑人较容易进入较低收
      入的职位,即黑人较容易从事不理想的工作。而且职业歧视在白领阶层中较为普遍,
      而不是像一般人所想像的那样,歧视只在工匠阶层中才有。这些结果为预测人们的
      职业选择提供了一定的依据。最近离散选择分析应用还常见于生物计量学和医学。
      例如生物的生和灭等就是简单的单一变量二项选择问题。
      
          麦克法登对离散选择分析的贡献是他将经济理论与计量经济学方法结合并发明
      处理离散变量的新方法。可以看到, 以效用最大化的经济学理论为基础, 他的方法
      使研究者可以估计并预测个人做出有限选择中某种选择的概率。
      
      
      
          假定有一个总体, 我们要研究他们在有限选择中的决策行为。如研究一个城市
      中人们搭乘某种交通工具的概率。基本的假定是, 人们所做出的选择将使他们的效
      用最大化。首先从总体中随机选取样本, 并记录他们的特性( 如年龄, 性别, 收入
      等),可供他们搭乘的交通工具, 他们实际选择乘坐的交通工具等数据。麦克法登的
      创新之处是, 他认为人们从乘某种交通工具中获得的效用可以表示为由乘客的特性
      ,某种特定交通工具,备选择的其他交通工具, 以及其他一些未观察到的变量等等所
      有这些因素所决定的一个随机变量。而人们最终选择某种交通工具的概率, 就决定
      于由上述各种因素决定的乘坐某种交通工具的效用大于乘坐其他交通工具的效用的
      概率。在一些外生的假定之下, 这个概率可以被估算出来。麦克法登称他自己的这
      个方法为“条件逻辑斯悌模型(conditionallogitmodel) ”。根据选择变量的性质
      ,离散选择分析有单一选择的二项分布模型和多项选择的多项分布模型。其中多项分
      布模型最具有应用价值。该模型又可分为几种: 多项选择, 顺序选择(orderedchoice),
      多变量二项选择等。多项选择如上面介绍的多种交通工具的选择。顺序选择模型指
      备择选择是可以排序的。如生育小孩的数目,一星期逛街的次数等。多变量二项选
      择模型指备择选择本身又是一个单一选择问题。如跨期的劳动就业问题,它涉及在
      不同时间劳动者就业选择。事实上,如果考虑时间因素,模型可以扩展为动态离散
      选择分析。在实际应用中,多项分布模型有多种用于计算和估计的函数形式。其中
      最方便和实用的是“多项逻辑斯悌模型[multinominallogit(MNL)model ]”。这
      个模型的适应性来自它的“无关选择的独立性(IIA) ”假定:任意两个备择选择被
      选中的概率之比与其他备择选择无关。这个假定在现实中很难得到满足。但麦克法
      登的研究发现,即使如此,运用多项逻辑斯悌模型进行分析的结果还是稳定的。另
      一方面,在满足无关选择的独立性假定的条件下,在面临选择性样本时,用MNL 模
      型使用这些样本数据对参数进行估计,估计结果也是无偏的。这也是这一方法被广
      泛应用的原因之一。因为,多数研究面临的是选择性样本。麦克法登自己发展出了
      检验无关选择的独立性假定的方法。由于无关选择的独立性假定过于严格,麦克法
      登发展了一些扩展模型,这些扩展模型对无关选择的独立性假定的要求要宽松一些。
      其中包括“广义极值模型(GEV) ”和它的一个特例“嵌套式多项逻辑斯悌模型”以
      及“混合逻辑斯悌模型”。在应用方面,“嵌套式多项逻辑斯悌模型”可以方便地
      应用于那些离散选择成科层结构的问题中。例如,在居住选择决策中,首先必须选
      择是买房还是租房;如果租房,是直接从房主处租还是做二房东;最后是选择地点、
      楼层等。在这个例子中,各种决策之间是有优先次序的,即选择具有科层结构。
      “混合逻辑斯悌模型”则适应于更广泛的情形。与“多项逻辑斯悌型”对应的是
      “多项概率单位模型(Multinomialprobitmodel)”,该模型适应于残差相关的情况。
      麦克法登的贡献还包括针对这些模型发明适用的计算方法。如用“矩模拟法”估计
      多项概率单位模型等。
      
      
应天故事汇(gsh.yzqz.cn)

下一章 回目录