>>> 2008年第3期
“学而时习之”新解
作者:林 森
对于“时习之”中的“时”,不同时代有不同看法。今天,脑神经研究的结果解释说,“时”就是要中断一定时间,在学习的过程中有休息的时间,或者说是间隔一段时间进行复习。这样才能有效地复习和强化所学的知识,牢固地掌握知识。而只有真正地掌握了知识,才会有愉悦感,或成就感。
在2000多年前的时代,孔子提出这种教育原理不可能有实验科学的验证,而只是个人经验的总结和对学生教育个案的归纳分析。到了生理学或神经生理学的实验验证后,孔子的“学而时习之”得到了更多的科学验证。
美国麻省理工学院的大卫·福斯特和马休·威尔逊进行了一项实验。他们把小鼠置于一个1.5米长的跑道上来回奔跑,并将特殊的电极嵌入小鼠的头骨,记录大脑中海马区细胞的电流活动。海马区是老鼠和人的主管记忆和导航的区域。当小鼠跑完一圈后会得到一些食物奖励。而在小鼠吃完食物并进行下一次跑步时,会有短时间的休息。
表面上看这些小鼠在休息期间似乎并没有活动,只是有些坐立不安,或梳理毛皮,或安静不动,但是它们的大脑记录却暴露了不同的内容。在休息期间小鼠的海马区活动很活跃。电极记录显示,小鼠在跑道上跑动的过程中,它们的海马区的一些神经细胞以特定的顺序出现特定类型的电流活动。令人惊讶的是,小鼠在休息的时候,海马区相同的神经细胞会以与在跑道上奔跑时相反的顺序一遍又一遍地释放出电流,并逐渐加速。换句话说,休息时的小鼠的大脑是在“逆向回放”在此之前的经历,就像V—D光盘的回放或倒回一样。这种回放要进行数次,每次经历的时间约为几百毫秒。在这个极短的回放时间,小鼠的大脑回放了自己在跑道上从结束到开始的所有跑步过程,而且重复回放了好几次。
对于这种现象,研究人员的解释是,小鼠大脑的回放过程实际上就是在帮助它们巩固对所在地点、动作和行为的记忆,以增强学习的效果。
计算机记忆和人工智能
由于人和小鼠的大脑海马区执行的是相同的功能和任务,所以从小鼠的这种表现也可以推论出人可能也是以这种回放过去所学的东西的方式来学习和记忆。当人们面临一项新的学习任务时,在学习中断后,人的大脑会回放这个任务或事件的过程。同样,这种倒回播放也用于人工智能研究,以帮助计算机做出决定。因此,这个发现实际上是在深入解释学习的机理。
为什么我们学习新东西时会比较容易,原因在于要有多次学习中断。在学习中断的短暂期间让大脑有时间复习或重温所学的内容或信息。这就是学而时习之。但是,如果不让人的大脑对学习的内容进行回放,那么记忆的效果就不太好,因为记忆不牢。
许多学生考试时的一种现象从这里也可得到比较满意的解释。比如,“临阵磨枪,不快也光”是一些学生考试的法宝之一,但事实证明这样的学习效果并不好。原因在于,人在考试前数小时的死记硬背没有机会让大脑休息一下,因而不能让大脑以V-D的方式回放以进行复习,因而记忆不牢固,学习效果不好。
人只有在学习时段之间有数次的中断,大脑才会学得最好。因为在这些学习中断的时间内,人的大脑是在无意识地多次复习或复述新的信息(新学到的知识和内容)。随着时间的流逝就更容易把新的信息贮存到记忆中。
同时,人类大脑的这种回放机制也可以解释为什么在忙碌工作后需要休息。因为在我们闭目养神或半躺着望向天花板的时候,大脑正在对一天所学习或从事的工作的内容进行回放复习,以巩固其记忆。所以,不要把必要的休息当作偷懒,这是大脑学习机制的必要组成部分,有利于大脑学习新的东西。
大脑怎么做出好决策
小鼠大脑的这种回放功能也涉及另一个问题。长期以来,人和哺乳动物的认知存在着一种称为“暂时信用分配问题”,小鼠的记忆和行动有助于解释这个问题。
“暂时信用分配问题”是一个经典的两难决策理论,可以表述为:如果一只动物在获得奖赏(比如上面的小鼠完成跑步后可以吃到食物)之前必须完成一连串行为,那么它怎么知道哪一种行为最终是重要的(会受到奖赏)或是不重要的(不会受到奖赏)。当然,正好在奖赏之前完成的行为是容易证明为重要的,但是在执行最初的任务时如何判断呢?在一系列行为中哪一种是重要的呢?对此,人也像小鼠一样,最初的选择或决策只能像玩赌博游戏一样进行猜测。
“暂时信用分配问题”在计算机和人工智能领域非常重要,如果能通过机器向后检索,回放一系列事件并对那些接近终点的行为比在开始的行为分配更多的信任(结束时的行为得到奖赏会使记忆更深),就可以解决这个问题。
如果老鼠知道最后的行为做对了,也就会把这个信息输入大脑并贮存起来,让所有的动作成为最后的那种状态。
大脑的这种机制可以用简单的流程来示意。如果人们所做的事情程序是ABC,在结束时C得到认可,所以印象很深,认为C重要。而大脑在回放这些过程时与V—D机回放是一致的,顺序是CBA,所以对C的印象更深,也会认定C更为重要。这个原理也证实了记忆机理中一种普遍现象,小到一个单词或句子,大到一件事或一种知识体系,开头和结尾时的记忆最深。记忆时是结尾的东西(C),到大脑回放时顺序又成为开头,同样是C,即从ABC到CBA。同时也说明,学习时把大部头的内容掰碎了来记忆会更好。
两种记忆机理
动物或人的大脑对所做事件的复习和记忆如同V-D机一样,都是回放。但这只是记忆和认知的一种表现形式,而对人的认知和记忆的研究在此之前已有相当多的成果,比如涉及神经递质的释放与浓度,也就是涉及大脑奖励系统(奖励回路)的另一个方面。
过去的研究早就证明,人的大脑中的多巴胺化学分子(神经递质的一种)的释放是大脑奖励回路的一个重要组成部分。多巴胺这种神经递质能让人沉浸于愉悦的情绪中,并且刺激人们不断去从事和完成特定的行为。这种情况可以从正反两方面得到说明。
无论是运动员得金牌还是工程师完成一项设计得到奖励,抑或画家画完一幅画卖出了好价钱或得到人们的赞赏,都会刺激他们的大脑产生多巴胺,由此产生一种满足和欣快感,这种欣快感会激发他们再去从事新的任务或创作。而吸毒者也是因为毒品刺激了多巴胺的分泌增多,或毒品中的外源性多巴胺类物质增多才会让人产生愉悦感,并促使上瘾的人反复吸毒,以获得奖赏般的欣快感。
如果多巴胺机制结合现在新发现的人的大脑可能对新学习的知识或行为进行回放式的复习,那么就会产生一种新的学习机理。
福斯特和威尔逊提出一种假说,人的大脑中存在一个特殊的“价值区域”。在这里多巴胺的信号和大脑回放的信号可以共同起作用。如果多巴胺信号随时间推移而变弱,这意味着多巴胺在开始传递时比结束时的信号更强烈。于是就有可能产生下面的情况:
当大脑回放的信号在大脑的价值区域放完时,它可能与在刚开始时最强的多巴胺信号联系起来,而当大脑重放继续时,多巴胺信号则慢慢变弱。在这样的情况下,对于一种动物来说,靠近回放之初所做的行为将比回放到后面的行为更为重要,即在做一件事是ABC序列,但在大脑回放时却是CBA的序列,所以C会被认为更重要。
对巴甫洛夫学说的新解释
俄国生理学家伊万·巴甫洛夫早在20世纪初就提出了高级神经活动的条件反射学说。当狗看到牛排或嘴里有食物时,会分泌唾液。这种反应是本能固有的,巴甫洛夫称其为无条件刺激,把反射性的唾液分泌称为无条件反射。如果在给狗牛排的同时按响铃声,经过数次之后,即使不给狗食物而只按铃声,也会让狗流出唾液。这时,铃声就是条件刺激,而铃声引起的唾液分泌就是条件反射。如果把铃声换成灯光刺激也可以,只不过是要在给予牛排或食物的同时进行,并强化狗的记忆,时间一长,在狗的大脑中就形成了铃声或灯光也类似于食物的巩固联系,也即是条件刺激与无条件刺激配对呈现的结果,这样在狗的大脑中铃声或灯光也是奖励食物的信号,所以它们会流出唾液。
福斯特和威尔逊对小鼠实验的结果使得他们从另一个角度来解释巴甫洛夫的条件反射学说,即小鼠的大脑在进行回放并评价事物或程序的重要性时,可以从得到奖赏(食物)联想到这种行为的重要,就像狗的记忆从牛排可以回放到铃声。
小鼠在休息时回放所做的事情的方式与人可能是一样的,因为人与小鼠的海马回放功能是相似的。这种机理除了涉及空间学习外,也涉及其他类型的学习。因而可以认为,回放是处理多种信息的好方法。
(杨松摘自《百科知识》2006年第17期 插图:陈罡)
■责编:唐河