将科学仅仅看作是现代神话,这常常被认为是聪明的说法。
犹太人有他们的亚当和夏娃,苏美尔人有他们的马尔杜克(Marduk)和吉尔伽美什(Gilgamesh),希腊人有他们的宙斯(Zeus)和奥林匹斯山诸神(Olympians),古斯堪的纳维亚人有他们的忠烈祠。所谓进化,某些时髦人说,不过是古代诸神和史诗英雄的现代表达法,既不好、也不坏,既不更真实,也不更虚假。有一种流行的沙龙哲学,叫做“文化相对论”,它以其极端的方式坚持认为,科学并不比部落神话更接近真理:科学只不过是我们现代西方部落偏爱的神话而已。有一次,我被一位人类学家同事激怒,我直率地表达了以下观点:假设有一个部落,那里的人都相信月亮是一只旧葫芦,被人抛上天去,挂在比树梢高不了多少的地方,难道你果真认为,我们的科学真理——月亮距我们大约38万公里,它的直径是地球的四分之一——不比部落的神话更正确些?“是的,”这位人类学家说,“我们所受的文化教育以科学方式去看待世界,而他们所受的文化教育以另一种方式看待世界。两种方式谈不上谁对谁错。”如果把一名文化相对主义者放到千米高空,你就能看到一个伪君子了。飞机是根据科学原理建造出来的。飞机可以飞上蓝天,把你从空中送到你想去的地方。根据神话传说所载建造的飞行器则不行。比如,模拟货物崇拜者的说法制造的飞船,或是像伊卡罗斯(Icarus)那样用蜡粘上一对翅膀,是飞不上天的*。假设你乘飞机去参加一个人类学家或文学评论家的国际会议,你之所以能抵达目的地,之所以不会中途坠落,是由于许多受过科学教育的工程师们做出了正确的设计;西方科学家,根据月亮在约40万公里外的轨道上绕地球运行,利用西方设计的计算机和火箭,已经成功地将人送上了月球表面。部落科学家认为月亮只不过是在树梢之上,却永远只能在睡梦里摸到它。
我在公开场合作报告的时候,总有听众明确地提出一些与那位人类学家同事同样思路的事情,而且常常能得到一些人点头赞同,引起一阵低声议论。毫无疑问,点头的人感觉良好,心胸宽大,没有种族歧视。一个更可信、更能引人赞同的说法是:“从根本上说,你对进化论的信任成了信仰,所以,你一点不比相信有伊甸园的人好。”每一个部落都有关于自身起源的神话传说,这是他们的关于宇宙、生命和人类的故事。在我们现代社会里,至少在受过教育的阶层中存在一种观点,认为科学确实提供了与此相应的东西。科学甚至可能被描写成一种宗教。我曾经摘要公布过一宗案例,把科学列为宗教教育班的适用科目(在英国,学校的教学大纲把宗教教育列为必修课,这与美国不同。在美国,为避免冒犯各种各样互不相容的信仰中的任何一种,禁止学校将宗教教育列为必修课)。科学与宗教都自称能回答关于人类起源、生命本质,以及宇宙等深刻问题。但是,它们的相似之处也就到此为止了。科学信念有证据,并且能得出答案。神话传说和宗教信仰却没有证据,也得不出答案。
在所有有关人类起源的神话传说中,犹太人关于伊甸园的故事对我们的文化影响最大,以至它的名字被用来给一个有关我们祖先的重要科学理论命名——“非洲夏娃”理论。我把本章献给非洲夏娃,部分原因是因为它使我能进一步发挥“DNA之河”这一比喻;同时,也因为我想让她作为一种科学假说,与传说中伊甸园的女家长形成对比。如果我能成功,你就会发现事实比神话更有趣味,也许甚至更富诗意、更能感人。我们从纯理论开始演练,其中的关系很快就会清楚。
你有父母2人,祖父母4人,曾祖父母8人等等。每上溯一代,你的祖先数目就多1倍。上溯g代,那么祖先的数目就是2的g次方,即2g。只是,不等我们离开座椅,我们很快就会发现,这是不可能的。为了说服我们自己明白这一点,我们必须走一小段回头路,比方说,追溯到耶稣的时代,那是大约整整2000年前。如果我们做一个保守的假设:每100年产生4代人(也就是说人们平均在25岁时生育下一代),那么2000年共有80代人。实际的数字可能更大(因为直至今日,许多妇女在非常年轻时就开始生育了),但这只是假设性的推算,不必考虑得这么细。2自乘80次是一个巨大的数字:1后面跟24个0,即1亿亿亿。就是说,你有1亿亿亿个与耶稣同时代的祖先,我也有那么多祖先!但是,在那个时代,全世界的总人口仅仅是我们刚算出的祖先人数的一个可以忽略不计的零头而已。
显然,我们在某个地方出了差错。但是,错在哪儿呢?我们的计算正确无误。错就错在假设每上溯一代祖先数目增加一倍上。事实上,我们忘记了表亲之间的通婚。我原来假设,我们每个人都有8位曾祖。但是嫡表兄妹婚配所生的孩子,只有6位曾祖。这是因为,就嫡表兄妹而言,一人的祖父母是另一人的外祖父母,而这共同的祖父母(外祖父母)就是他们孩子的曾祖父母兼外曾祖父母。
你也许会问:“那又怎样呢?”人们偶有表亲联姻的情况,达尔文的妻子埃玛·伟奇伍德(Emma
Wedgwood),就是达尔文的嫡表妹,但这种情况肯定不刽良多,不至于造成很大差异吧?不,它会的。因为我们所说的表亲之间通婚,还包括三代、五代、十六代以至更远的远亲之间的通婚。如果你把表亲关系算得那么遥远,每一个婚姻就都成为表亲之间的婚姻了。有时,你会听到有人夸口说自己是女王的远亲,这是在自我吹嘘。因为,追根究底,通过多得难以追溯的途径,我们大家都是女王的远亲,也是其他每一个人的远亲。皇族和贵族唯一与众不同的是:他们的家系可以明确地追溯上去。正如十四世霍姆伯爵(Earl
of Home)在回答政敌针对他的头衔所作的嘲讽时说:“我猜,威尔逊先生,您碰巧会想到,自己是十四世威尔逊。”综上所述,我们互相之间的亲属关系要比我们通常所意识到的近得多,我们祖先的实际人数比我们通过简单计算得到的数字要少得多。一次,为了使一个女学生按照这一思路推理,我要她估猜,她和我两人最近的共同祖先生活在多久以前?她盯着我的脸,毫不犹豫地用缓慢的土音答道:“在类人猿时代。”出于直觉的迅速反应,可以原谅,却百分之百地错了。它意味着分隔的时间数以百万年计。实际上,她和我最近的共同祖先,很可能就生活在二三百年之内,在威廉一世(1066~1087)之后很久。而且,我们之间肯定具有多重亲属关系。
导致我们错误地多算祖先人数的那个世系模式,是一棵不断分杈,从分杈上再分杈的树。将它调过头来,是一棵同样错误的子系模式树。一个典型的人有2个子女,4个孙子孙女,8个曾孙曾孙女……,经过几个世纪之后,后裔的数目就会多到不可思议。一种远为真实的世系模式是流动的基因之河,我们已在第一章中作过介绍。在河流的两岸之间,基因有如永远滚滚而下的水流,在时间中流淌。基因纵横交错,沿时间之河而下,水流打着漩涡时分时合。
沿着河流每隔一定距离取一桶水。桶中的一对对分子,在顺流而下的过程中曾问歇地成为伴侣,以后还会再次成为伴侣。它们过去也曾经被远远地隔离,将来还会再被远远隔离。要追寻它们接触的地点极其困难,但是我们可以确信无疑地肯定有接触——确信无疑地肯定,如果两个基因在某一点没有接触,那末,无论是向上游还是下游,沿基因之河不用走很远,它们又会再次相遇。
你可能不知道,你就是自己丈夫的表亲。其实从统计角度看,你不必追溯到太久远的祖辈,就很可能会找到与丈夫在血统上的连接点。再换一个方向,让我们面向未来。显然,你有很好的机会与丈夫(或妻子)共有后代。然而,这里有一个更惊人的想法。下次你同一大群人在一起的时候,比方说,出席音乐会,或观看足球比赛,你看看周围的听众或观众,想想如下的假设:假设你有后代生活在遥远的将来,这个音乐会上或许就有人与你同是这些未来后代的祖先,你可能还跟他们握过手呢。一般说来,孩子的祖父母与外祖父母都知道他们是这些孩子的共同祖先。不管他们是否合得来,这一层关系必定会给他们带来亲情感。他们可能互相瞧着对方说道:“唷,我并不大喜欢他,但他的DNA混和了我的DNA,存在于我们共同的孙辈体内。可以预期,在我们死后很久,我们还会有许多共同的后代。这当然在我们之间形成了一种联系。”我的意思是,如果你有幸在遥远未来拥有后代,在音乐厅里的陌生人中,就很可能有人是你后代的共同祖先。你可以环视观众席,推测哪一位命中注定会与你共有后代,哪一位不会。不管你是谁,无论你是什么肤色,什么性别,都可能和我同是未来某人的祖先。你的DNA也许注定会与我的DNA混合在一起。敬礼!现在,假设我们乘坐时间机器回到过去的岁月,也许回到了罗马圆形剧场中的人群中,或者回到了更早的乌尔国集市上,甚至更古老的地方。环视人群,就像看待现代音乐厅的听众那样。你可以把这些已逝去很久的人分为两类,而且只有两类:一类是你的祖先,另一类不是你的祖先。这是再明显不过的,但由此我们得出了一个非凡的真理。如果时间机器能够把你带回足够久远的过去,你可以把所遇到的人分成两类:1995年存活的每一个人的祖先,或者不是1995年存活的人的祖先。决无介于两者之间的人。跨出你的时间机器,你所看到的每一个人或者是全人类的祖先,或者不是任何人的祖先。
这是一个十分吸引人,又很容易证明的想法。你需要做的事,只是把想象中的时间机器往回开,开到甚至是荒唐可笑的久远以前,比如,3.5亿年前,那时我们的祖先还是有肺的总鳍鱼,刚从水中爬出来变成两栖动物。如果某一条鱼是我的祖先,却不是你的祖先,那将是不可思议的。如果确实如此,便意味着在从鱼到两栖动物、爬行动物、哺乳动物、灵长类、猿、原始人的进化过程中,你的世系与我的世系互相独立,也没有互相参照,而结果我们却如此相似,以至于我们可以交谈,如果我们是一男一女,还可以互为配偶。
这些事实在你我之间是真实的,在任何两个人之间也是真实的。
我们已经证明,只要返回到足够久远的过去,我们遇到的每一个人要么是我们所有人的祖先,要么不是我们任何人的祖先。但是多久才算是足够久远呢?很明显,我们不需要回到总鳍鱼的时代,那是归谬法,但是我们到底需要追溯到多久的过去,才能见到1995年存活着的人的共同祖先呢?这个问题难得多,是我下一步将要转入的问题之一。这个问题光拍脑袋是答不出的。我们需要真实的信息,以及来自特定事实方面的计量。
可敬的英国遗传学家和数学家罗纳德·费希尔爵士(SirRonald
Fisher),被认为是达尔文在20世纪最杰出的继承人和现代统计学之父。他在1930年曾经讲过这样一段话:仅仅由于地理上的和其他一些对于不同种族之间婚配的障碍……才避免了全人类在最近的1000年间逐渐拥有同一个祖先。对同一个民族的成员来说,500年前差不多都是一家了。能够保留2000年的只有不同人种间的差异,这些……也许有的确实极其久远,但这只发生于个别的群体间长期鲜有血缘混杂的情况下。
用我们基因之河比喻的说法,费希尔实际上是利用了这样一个事实:一个在地理上统一的种族,其所有成员的基因沿着同一条河顺流而下。但是,涉及到他那些具体的数字——500年,2000年,不同种族分离的年代,费希尔就不得不进行一些猜测了。在他所处的时代,还没有相关的事实可资利用。到今天,随着分子生物学的革命,资料之丰富已使人无所适从。正是分子生物学,给予了我们具有超凡至力的非洲夏娃。
数据河并不是迄今使用过的唯一比喻手法。将我们每个人体内的DNA比喻为一本家庭版的《圣经》,是很吸引人的。DNA是一篇非常长的经文,如我们在第一章所说,它是用4个字母写成的。这些字母是从我们祖先那里,而且只能从我们祖先那里一丝不苟地复制下来。即使从极远的祖先至今,仍然异常精确。将不同的民族所保留的经文作比较,重建他们的亲戚关系,回溯到他们共同的祖先,这应该是可能的。远亲之间的经文之间会有较多词不相同。他们的DNA有更长时间异化——比如挪威土著居民与澳大利亚土著居民。学者们使用各种不同版本的文本做这件事情。不幸的是,在DNA档案中,存在着一个意外的障碍,那就是性。
性是档案保管员的恶梦。祖传的经文不是被完好无损地保留下来,仅仅偶有不可避免的错误;而是被性大肆介入,并且销毁了证据。公牛闯入磁器店,都比不上性对DNA档案的践踏。在《圣经》研究中没有这样的东西。诚然,一个追寻源头,比如《雅歌》的起源的学者意识到,最初的《雅歌》与现在的不一样。现在这个《雅歌》有些古怪而且不连贯的章节,提示人们它其实是几首诗的片断(而且只是其中色情的部分)凑在一起的。它含有差错——突变,特别是翻译错误。
“Take us the foxes, the little foxes,thatspoil the vines。”(把狐狸抓来,那些小狐狸,它们毁了葡萄藤)是误译。尽管终生的反复诵读使之有了令人难以忘怀的感染力,但是,它仍然不能与那正确的译文相提并论:“Catch
for us the fruitbats,the little fruit bats……。”(把狐蝠抓来,那些小狐幅……)。
看哪,冬天逝去,雨过天晴。鲜花开放在大地上;百鸟欢唱时刻来临,田园中又闻乌龟声。
这首诗何其令人陶醉!因此我真的不情愿煞风景地指出,这里也有一个无可置疑的变异。像现今的译文那样,在“乌龟”(turtle)后面加上dove,改成“斑鸠”,固然正确,却很呆板,听起来韵律被破坏了。然而,当文章既不是成千上万份地印刷出来,也不是刻蚀在高保真度的计算机光盘上,而是由老朽的抄写员从稀有而易碎的莎草纸文稿传抄再传抄,那么,这些就已经是我们所能企盼的最小差错,属于不可避免的轻微退化。
但是,现在引人了性(我的意思不是把性引入《雅歌》),我所说的性的作用是,将一份文件撕去一半,而且随机地撕成一片片,然后与另一份文件的乱得不相上下的一半混合。这听起来难以置信,甚至是野蛮的破坏,但确实是在生殖细胞形成时所发生的。例如,当一个男人制造一个精子细胞时,父亲遗传给他的染色体与母亲遗传给他的染色体就结成一对一对,而且其中很多都改变了位置。
一个孩子的染色体,实际上是他祖代染色体无法复原地混杂、拼凑而成的大杂烩,而且一直回溯到远祖都是如此。原想要的古代经文,它的字母,可能还有单词,也许能够原封不动地代代相传。然而章、页、甚至于段,却被无情而有效地撕碎后重新粘贴到一起;这种破坏可以说是非常无情,以至从跟踪历史踪迹的角度来看几乎一无用处。凡涉及世系,性总是一个巨大的障碍。
只要性确实没有牵涉进来,我们就能利用DNA档案来重现历史。我想到两个非常重要的例子。一个就是非洲夏娃,我下面会讲到她。另一个例子,是重现更久远的祖先——着眼于各个物种之间的亲缘关系,而不是物种内的亲缘关系。我们在前一章中已经看到,有性繁殖只发生在物种之内。当一个亲本物种建立了一个子代物种时,基因之河就分成两条支流。等到它们分岔时间足够长,远离它作为档案管理员的障碍之时,每条支流中的有性繁殖实际上有助于重建物种问的世系和亲缘关系。只是在涉及物种内部的亲缘关系时,性才把证据搞乱。对于种间的亲缘关系来说,性只有助益:它倾向于自动地确保每一个体都是整个物种的优良遗传样本。
在搅拌均匀的河水中,你从哪里打一桶水都一样,哪一桶水对那条河的水都具有代表性。
为了画出物种的系谱,事实上已对取自不同物种典型样本的DNA文本进行过逐字的比较,并且很成功。根据一个有影响的学派的说法,甚至能够在分岔的地方标出日期。这种机会来自尚有争议的“分子钟”概念,该假说认为:基因文本任一区域内每百万年发生突变的速率是恒定的。我们很快就要回到关于分于钟的假说上来。
在我们的基因中,描述一种称为细胞色素C的蛋白质的“段落”共有339个字母。马与我们的亲缘关系相当远,人类细胞色素C与马的细胞色素C有12个字母的改变。猴子是我们相当近的亲戚,人类细胞色素C与猴子的细胞色素C只差一个字母。驴是马的近亲,马与驴的细胞色素C也仅有一字之差。此外,猪与马的亲缘关系稍远,它们的细胞色素C之间有3个字母不同。人与酵母的细胞色素C之间有45个字母的差别,而猪与酵母之间,也同样是45个字母的差别。这两组数字的相同并不令人奇怪。沿着人类的基因之河溯流而上,就会发现,人与猪的基因之河汇合的时间,要比它们一起与酵母的基因之河汇合的时间近得多。但是,在这些数字当中也有一个小小的污点。马与酵母的细胞色素C相差46个而不是45个字母。这并不意味着对酵母来说,猪比马的亲缘关系更近些。它们同为脊椎动物,并且,实际上,还同为兽类,与酵母的亲疏程度是完全一样的。或许,在与猪的最近的共同祖先之后,在演变到马的世系中,不知不觉地出现了一个额外的变化。这并不重要。总体说来,各对生物之间细胞色素C字母差异的数目,与前述进化树分杈的想法所推断的情况十分吻合。
前面提到的分子钟学说认为,一个基因文本每百万年的变化速率是大体固定的。关于区分马与酵母的46个细胞色素C字母变异,一般认为,其中大约一半是发生在从它们共同祖先到现代马的进化过程中,大约另一半发生在从它们共同祖先到现代酵母的进化过程中(显然,这两条进化途径经历的时间是完全相同的)。最初,这种假设似乎令人惊讶。毕竟,它们的共同祖先很可能更像酵母,而不那么像马。自从著名的日本遗传学家木材元(MotooKimura)率先表示支持之后,对于该假设的一种调整,即基因文本中的大部分可以自由改变,而不影响基因文本的含义,已经逐渐被接受。
在一句句子中采用不同字体就是一个很好的比拟。
“马是一种哺乳动物”。“酵母是一种真菌。”尽管在这两个句子里,每个词都采用了不同的字体,但它们的意义却十分明晰。数百万年间,分子时钟滴嗒滴嗒地送走了相当于毫无意义的字体变化的那些东西。由自然选择决定的变化和描述马与酵母之间差异的变化——也就是句子在意义上的变化,则是冰山的尖顶。
有些分子的时钟速率较另一些分子快。但细胞色素C的进化相当缓慢:大约每2500万年有一个字母变化。这或许是因为,细胞色素C对生物生存极其重要,其作用主要取决于它的具体形状。
在这种形状至关重要的分子里发生的大多数变化,是自然选择所不能容忍的。其他一些蛋白质,如血纤维蛋白肽,虽然也很重要,却有多种能同样起作用的形式。血纤维蛋白肽能使血液凝固,你可以改变它们大部分的细微结构,却不会损害它们的凝血能力。这些蛋白质的突变速率为每60万年左右发生一次变化,比细胞色素C快40多倍。因此,血纤维蛋白肽可以用来再现比较晚近的世系,比如在哺乳动物范围内,但是,却不能用它们来再现古老的世系。不同的蛋白质有几百种,每一种都有自己特有的变异速率,因此,每一种都可以独立地用于重建系谱。它们产生出的都是几乎一模一样的系谱。顺便说一句,这就很好地证明(如果需要证据的话)了进化论是正确的。
我们已经认识到,性的混杂搞乱了历史记录,并由此展开了我们的讨论。我们已经找出两条途径,可以避开性的干扰。前面就其中之一进行了详细讨论。我们的讨论基于这样一个事实,即:性不会把不同物种的基因混合在一起,这就为我们提供了这样的可能性:利用DNA序列来重建我们远祖的系谱,这些远祖生活在我们成为人类之前很久。但是,我们已经同意,如果我们回到足够久远的过去,那么无论怎么说,我们全人类肯定都是同一个体的后裔。
我们还曾企图找出,最近到什么时候,我们仍然可以宣称与其他所有的人是同一血统。为了找到答案,我们不得不转而求助于另一类DNA证据。由此,非洲夏娃走进了我们的故事。
非洲夏娃有时也称为线粒体夏娃。线粒体是微小的菱形小体,成千上万地充满我们的每个细胞。它们内部基本上是空的,但具有复杂的膜结构。这些膜的面积,比你从线粒体外表所能想象的要大得多,而且很有用。这些膜是一座化学工厂(更确切他说是一座发电厂)的生产线。受到精确控制的链式反应沿着这些膜进行,这个链式反应的步骤,比任何人类化工厂里的反应步骤都要多。结果,源自食物分子的能量在控制之下一步步地被释放出来,并且以可再利用的形式储存下来,以便往后不论体内什么地方需要,随时都可以用于燃烧。若没有线粒体,我们一秒钟内就会死去。
这就是线粒体的功能,然而我们在这里更关心的是线粒体是从哪儿来的。原来,在久远的进化历程中,它们曾经是细菌。这一杰出的理论是由阿默斯特市马萨诸塞州立大学可敬的林恩。马古利斯(Lynn
Margulis)首先提出的。这一理论最初曾被视为异端邪说,当时只有少数人对它发生了兴趣,现在已经被广泛接受,可以说是大获全胜了。在20亿年前,线粒体的远祖是独立生活的细菌。后来,它们与其他种类的细菌在较大的细胞里“定居”。所形成的(“原核”)细菌群落又变成大的(“真核”)细胞。我们每一个人都是数以百万亿计的互相依存的真核细胞群落。每一个这样的细胞,又是由数千个被驯化的完全封闭在细胞里的细菌组成的群落。它们在细胞里面就像细菌一样地增殖。据计算,如果一个人身体里所有的线粒体首尾相连排成一列,那它将不是绕地球一圈,而是能绕上2000圈。一只动物或一株植物,就是一个由相互作用的不同层次的小群落聚合而成的巨大群落,正如一片雨林。拿雨林来说,它本身就是一个云集了大约上千万种生物的群落,而每一物种的每一成员本身又是一个群落,它又有许许多多由被驯化的细菌组成的群落。马古利斯博士关于起源的学说——细胞好似封闭的细菌乐园——决非伊甸园的故事所能与之相比,它更令人激动、令人兴奋、令人振作。它还有另一个优势,那就是它几乎可以肯定是真实的。
如同大多数生物学家一样,我现在也设想马古利斯学说是正确的,在这一章里我提到它,只是为了继续探讨一个特别的含意:线粒体有它们自己的DNA,同其他细菌一样,仅存在于一个单环染色体内。现在我们就这一点进行探讨。线粒体DNA不参与任何性的混合,不与躯体的主“核”DNA混合,也不与其他线粒体DNA混合。像很多细菌一样,线粒体只通过分裂来增殖。每当一个线粒体分裂为两个子线粒体的时候,每一个子线粒体得到与原有染色体一模一样的“拷贝”。从我们系谱学者的观点来看,现在你该看到它的妙处了。我们发现,在我们担心普通的DNA文本每一代都被性搅乱证据,混淆了来自父系和来自母系的贡献的所在,线粒体DNA却有幸独善其身。
我们仅仅从母亲那里得到线粒体。精子大小,只能容纳少数的线粒体;它们所能产生的能量,只够在精子游向卵子时提供精子尾巴作动力;受精时,精子的头部被卵子吸收,而这些线粒怀则同精尾一道被抛弃了。相比较而言,卵子的个体巨大。在卵子庞大且充满液体的内部,包含着丰富的线粒体种质。这些线粒体种质进入子代的身体。因此,无论你是女性还是男性,你的线粒体全部都来自最初接种的你母亲的线粒体。无论你是男性还是女性,你的线粒体全部都来自你外祖母的线粒体。你的线粒体,无一是来自你父亲,无一是来自你祖父或外祖父,无一是来自你祖母。线粒体构成了对于往昔的独立记录,没有被主细胞核的DNA所沾染,而主细胞核DNA是均等地来自你4位祖父母中的每一位,你8位曾祖父母中的每一位,等等,依此往前类推。
线粒体DNA虽不受沾染,却不能避免突变,即复制中的随机差错。而且,它的变异率比我们“自己的”DNA要高。这是因为,就像所有的细菌一样,它不具备我们的细胞在千万年间逐步形成的精确的校对机制。在你我的线粒体DNA中会有几处差异,根据差异的数量,可以推测出你我的祖先是在多久以前分岔的,这里所说,不是所有的祖先,而是我们在女性一女性一女性……一线上的祖先。如果你的母亲是位纯种的澳大利亚土著居民,或者是一位纯种的中国人,或者卡拉哈里土著居民,那么,你我的线粒体DNA之间确实会有许多不同。至于你父亲是谁就无所谓了:他可以是一位英国侯爵,或者是一位苏族首领,对你的线粒体都没有影响。你所有的男性祖先也都一样。
因此,就有了一本单独的线粒体《次经》,它与主要的家庭圣经一起代代相传,并有一个很大的优点:只由母系往下传。这种观点并不是性别歧视,如果它由父系传下来,也丝毫不差。其优点在于完整性,在每一代都既不会被割裂,也不融合。作为DNA系谱学者,我们需要的是纯粹单一性别,而不是两个性别都有的世系。
如同姓氏一样,Y染色体只由父系传下来,从理论上来说也同样是适用的,但是它所包含的信息太少而派不上用处。把线粒体《次经》用于确定同一物种内共同祖先的年代是非常理想的。
一组研究人员曾与伯克利加州大学已故的阿伦.
威尔逊(ALlan WiLson)合作研究线粒体DNA。80年代,威尔逊和他的同事们曾从全世界抽样了135名妇女进行线粒体DNA序列调查。这些妇女中有澳大利亚土著人、新几内亚高地人、美洲土著人、欧洲人。
中国人,以及非洲多个民族的代表等。他们逐对研究了每个妇女与其他各个妇女线粒体DNA字母差异的数目。他们将这些数目输入计算机,要求计算机构建出它所能找到的最简便的家族树系。
“最简便的”在这里是指尽量排除假设性一致。这点需要作些解释。
回顾一下我们在前面进行的关于马、猪、酵母等的讨论,以及对细胞色素C字母序列的分析,你就会回忆起,马与猪之间只有3个字母不同,猪与酵母之间有45个字母不同,而马与酵母之间,这种不同的字母有46个。我们曾指出,从理论上讲,由于有比较近的共同祖先把马和猪互相联系在一起,所以它们各自与酵母的距离应该完全一样长。45与46的差异是一种畸变,在一个理想世界里不应存在。它或许是由于在马的进化过程中出现过一次额外的突变;或许是在猪的进化过程中出现过一次相反的突变。
这儿确实存在着一种荒谬的观点。在理论上可以设想,猪与酵母的关系要比它与马的关系近。在理论上,猪和马逐步形成如许相以之处(它们的细胞色素C文本只有3个字母不同,而它们的身体基本上是一模一样的哺乳动物模式),有可能是出于种种巧合。
我们之所以不相信这一观点,是由于猪和马相像的地方比猪和酵母相像的地方多得多。不可否认,在一个DNA字母上,猪与酵母更为接近,然而这被猪与马之间其他方面无数的相似之处压倒了。
理由是最简便。如果我们假设猪与马的关系近,我们只需接受一个因巧合形成的相似之处;如果我们假设猪与酵母的关系近,我们就必须假定一连串的相似之处都是互不相干地因巧合而形成的,其数量多到不现实的程度。
在马、猪和酵母的相互关系问题上,上述的简便理由是显而易见,无可置疑的。但是,人类不同种族的线粒体DNA相似程度极高,这是没有什么可怀疑的。“简便”的理由仍然存在,但只表现为微不足道的数量上的论据,而不是有力的、决定性的论据。从理论上说,计算机要做的工作是:列出全部有关135名妇女的可能的家族树,然后检验这一系列家族树,从中选出最“简单化”的一种,即因巧合而致的相似之处最少的一种。我们必须面对这样的事实:即使是最好的家族树,也可能迫使我们去接受一些小的巧合,就像我们被迫接受如下事实:从一个DNA字母的角度看,酵母距猪更近些,离马更远些。但是,至少在理论上,计算机应该能够轻易地完成这一任务,并向我们展示,在众多可能的家族树中,哪一棵是最“简便”的,也就是巧合最少的。
这只是在理论上。但在实际上存在着一个障碍。可能的家族树的数量,比你、我,或任何数学家所能想象到的要大得多。在马、猪和酵母一例中只有3种可能的家族树。显然正确的一种是[(猪、马)酵母],猪和马一起,被放置在内括弧里,而酵母则是无关联的“局外者”。另外两种理论上的家族树,是[(猪、酵母)马]和[(马、酵母)猪]。如果我们再加上第四种生物,比如就鱼,家族树的数目就会上升到15个。我不想一一列出所有这15种家族树,但是愿举出正确(最简便)的一个,即「(猪、马)鱿鱼]酵母。猪和马作为近亲又一次舒适地被放置在最内层的括弧里。下一个参加该俱乐部的是鱿鱼。跟酵母相比,它与猪/马世系拥有更为晚近的共同祖先。其他14个家族树中的任何一个,比如「(猪、鱿鱼)、(马、酵母)],肯定都不够简便。如果猪真是鱿鱼的近亲,马确实是酵母的近亲,那么,猪和马极不可能各自独立地发展了如此多的相似之处。
如果说3种生物有3种可能的家族树,4种生物有15种可能的家族树,那么135名妇女会构成多少种可能的家族树呢?答案将是一个大得可笑的数字,甚至没法把它写出来。假如用世界上最大、最快的计算机来列出所有的可能的家族树,直到世界末日,也还不能取得明显进展。
然而,这个问题还是有希望解决的。我们习惯于利用审慎的抽样方法来对付无法想象的巨大数字问题。虽然我们数不清亚马孙平原有多少昆虫,但是我们可以在森林中随机选取一些小地块,假设这些地块具有代表性,便可根据小地块抽样的数字推算出亚马孙平原昆虫总数。我们的计算机不可能检验有关135名妇女的所有可能的家族树,但是计算机可以从所有可能的家族树中进行随机抽样。如果你什么时候从100亿亿个可能的家族树中抽取一个样本,注意到若干最简便的样本都具有某些共同特性,你可以由此断定,在所有家族树中,大概最简便的家族树都有同样的特性。
这是人们迄今已经做过的事情。然而这并不一定表明它是解决问题的最佳方法。正如昆虫学家可能不同意用最典型的方法给巴西雨林抽样,DNA系谱学者也采用了各种不同的抽样方法。而且,遗憾的是,结果并非总是一致的。然而,由于他们的工作极有价值,我将把伯克利研究小组对人类线粒体DNA所做的最初分析的结论介绍给读者。他们的结论非常有趣,并且颇有争议。根据他们的分析,最简便的树系牢牢地扎根于非洲。这话的意思就是,一些非洲人与其他非洲人的关系比与全世界其他地方任何人的关系更远。世界上所有其他地方的人——欧洲人,美洲土著,澳大利亚土著,中国人,新几内亚人,因纽特人,以及所有其他人——构成了一群相对较为亲近的表亲。部分非洲人属于这一组近亲,但其他非洲人则不属这一组。根据这一分析,最简便的家族树看来是这样的:{某些非洲人「其他非洲人(再其他一些非洲人(再再其他一些非洲人和其他所有人))]}
。他们因此断言,我们所有人的母系远祖住在非洲,叫做“非洲夏娃”。我曾提到,这个论断是有争议的。其他一些科学家声称,可以找到同样简便的家族树,这些树系最外面的分支出现在非洲以外的地方。他们还认为,伯克利小组之所以得到这个结果,部分原因是出在查找可能家族树的计算机的指令上。
显然,查找指令无关紧要。也许大多数专家仍会把钱花在“线粒体夏娃是非洲人”上面,然而他们却不会有很大信心了。
对伯克利小组的第二个结论争议不大。不管线粒体夏娃居住在什么地方,他们都能估计出她生活的时间。由于已经知道了线粒体DNA的进化速度,因而你能给线粒体DNA趋异之树的每个分岔点标上一个大概的时间。联结所有女性的分岔点,即线粒体夏娃的诞生日是在15~25万年前。
不论线粒体夏娃是不是一个非洲人,“我们的祖先来自非洲”都无疑是正确的,要避免在这个意思上可能发生的混乱,这是很重要的。线粒体夏娃是所有现代人类最近的祖先。她是智人(Homo)sapiens)中的一员。在非洲和非洲以外的地方都曾经发现过早得多的人科直立人(Homo
erectus)化石。而比直立人更早的能人(Homo habilis)和各种南方古猿属(Australopithecus)化石(包括新近发现的400多万年前的南方古猿化石)则仅在非洲发现过。因此,如果我们是在过去25万年内迁徙世界各地的非洲人的后裔,那么这是非洲人的第二次大迁徙。有一批非洲人离开得更早,大约是在150万年以前,那时直立人迂回曲折地离开非洲,移居到中东和亚洲一些地方。非洲夏娃理论认为,并非不存在早期亚洲人,而是那些早期亚洲人没有留下后代。不论你怎样看待这个问题,如果回到200万年以前,我们都是非洲人。非洲夏娃理论还认为,即使回到仅仅几十万年前,现今存活的人类也都是非洲人。如果有新的证据支持,有可能从在非洲所有现代线粒体DNA追溯到一个非洲之外的母系祖先(比如说“亚洲夏娃”),同时又能赞同我们更古老的祖先仅发现于非洲。
此刻,我们假设伯克利研究小组是正确的,让我们研究一下他们的结论意味着什么,以及不意味什么。“夏娃”这个绰号已经产生了不幸的影响。一些热心人轻率地认为:她肯定是一个孤独寂寞的女人,是地球上唯一的女人,是最初的遗传瓶颈口,甚至是《创世纪》的一个证明!这完全是误解。“她是那个时代地球上唯一的女人”,“在她那个时代,人口比较少”,这两种说法都不正确。她的男女同伴也许既数量众多,而且生殖力旺盛。他们也许至今还有大量后代活在世上。但是因为他们与我们之间的联系在某一点上通过了一位男性,他们的线粒体的所有后代已经消失。同样,一个贵族姓氏(姓氏是与Y染色体联系在一起的,并且与线粒体的情形恰好相反,只由父子相传)可能消失,但这并不是说拥有这个姓氏的人就没有后代。他们或许会有数不清的后代,只不过不是通过父子相传,而是通过其他途径传下来。正确的说法仅能是:线粒体夏娃是离我们最晚近的一位纯粹母系的共同祖先,所有的现代人都是她的后代。必定有一名妇女能够符合这个结论。唯一的争论是关于她住在这里还是那里,是在此时还是彼时。她确实曾生活于某时、某地,这个事实是确定的。
这里还有第二种误解。这种误解更为普遍,甚至在从事线粒体DNA领域研究工作的领头科学家那里,我都曾经听到过。那就是相信“线粒体夏娃”是我们最晚近的共同祖先。这种误解的根源是对两个概念的混淆:一个是“最晚近的共同祖先”,另一个是“最晚近的纯粹母系的共同祖先”。“线粒体夏娃”是我们最晚近的纯粹母系的共同祖先,然而还有很多其他途径可以延续后代,不仅仅是纯粹母系这一条线。其他途径有成百万。让我们回到关于祖先数目的计算中来(让我们忘却表亲联姻的复杂情况,它曾是前面争论的焦点)。你虽然有8位曾祖父母、外曾祖父母,但其中只有一位是纯粹母系的。你虽然有16位高祖,但其中也只有一位是纯粹母系的。
即使允许表亲结婚减少了在某一代中祖先的数目,但是,与纯粹母系相比,确实还有更多、更多、更多成为祖先的途径。当我们沿着遗传之河经过遥远的古代溯流而上,可能会有许许多多夏娃,许许多多亚当。这是些焦点人物。生活在1995年的所有人可能都是她或他的后代。“线粒体夏娃”只是其中之一。没有什么特别理由可以认为线粒体夏娃是所有这些夏娃和亚当中离我们最近的一位。情况与此相反。她被规定了一个特别的途径:在遗传之河中,我们是由这个特定的途径成为她的后代。与纯粹母系途径相并行的可能途径,数目非常巨大,因此从数学上“线粒体夏娃”极其不可能是所有夏娃和亚当中距我们最近的一位。它是一条特殊的单行道(只经母系遗传)。如果又是最近的途径之一,那将是一个了不起的巧合。
再有一点也多少使人感到兴趣,那就是我们最晚近的共同祖先更有可能是一个“亚当”,而不是“夏娃”。一夫多妻比数男共一妻可能性更大,这是因为,仅从生理上说,男性能生育几百、甚至几千个孩子。在《吉尼斯世界纪录大全》中,这一纪录已超过1000,创造这纪录的是以实玛利。女性即使在理想条件下,最多也只能生育二三十个孩子。女性的子女数较男性更平均。少数男人的孩子可能多得荒唐可笑,但这就意味着另一些男人连一个孩子都没有。如果有一个人完全不能生育,这个人更可能是个男人而不是女人;而如果有一个人拥有大多的后裔,这个人也更可能是个男人。因此,人类最为晚近的共同祖先,很可能是一个亚当,而不是一个夏娃。举个极端的例子,谁更可能是今日全体摩洛哥人的祖先?是以实玛利,还是他的某个不幸的妻妾?,我们可以得出以下结论:第一,必定存在着一位我们可称为“线粒体夏娃”的女性,她是所有现代人最晚近的纯粹母系共同祖先。第二,必定还有一个称为“焦点祖先”的人,其性别尚不为人知,却是所有现代人通过任何遗传途径而来的最近的共同祖先。第三,虽然线粒体夏娃和“焦点祖先”有可能是同一个人,但很不可能。第四,“焦点祖先”更有可能是男性,而不是女性。第五,“线粒体夏娃”很可能生活在25万年前。第六,对于“线粒体夏娃”生活于何地,尚存争议,但是从已报道的观点看,人们仍倾向于非洲。只有第五条和第六条要靠科学证据来检验,前四条只需借助常理进行推断即可得出。
但是,我曾说过,祖先们掌握着解开生命之谜的钥匙。非洲夏娃的故事只是一个更壮丽、更古老的史诗限于人类这一局部的缩微。我们要再次求助于基因之河——我们的伊甸园之河这一比喻。
但是,我们会溯流而上穿越更为久远的时间跨度,比神话夏娃的几千年和非洲夏娃的几十万年,久远得不可同日而语。DNA之河沿着一条不间断的时间线路,途经我们的历代祖先,至少流了30亿年。
原注:我已不是第一次使用这个必胜的论据。我必须强调指出,这仅仅针对(见下页)与我那位旧葫芦同事持同样想法的人。还有一些人,尽管他们也令人不解地自称“文化相对论者”,但他们的观点完全不同,而且十分明智。对于他们,文化相对论仅意味着,如果你试图用自己的文化术语去诠释另一种文化的信念,你是不可能理解它的。你必须将某一文化的每个信念放在该种文化的其他各种信念背景下观察。我猜,这种理解才是文化相对论的本意。而我所批评的那种,是对文化相对主义的一种极端主义的曲解,虽然它颇能蛊惑人心。明智的文化相对论者应该努力与这种荒唐的文化相对论划清界限。 |