奖惩中枢与学习

3 提交 / 0个新回复
最新回复
奖惩中枢与学习

摘要:奖惩现象及实验揭示了:兴奋了奖赏中枢的思想、行为(神经通路)能被奖赏中枢强烈易化,而兴奋了惩罚中枢的思想、行为能被惩罚中枢强烈抑制。在此基础上,通过讨论奖惩中枢在学习中的作用得出:思想、行为的动力由奖惩中枢影响产生;奖惩中枢在思想、行为(神经兴奋)习惯的选择、形成过程中起着主要作用。
 
关键字:奖惩中枢;学习;奖惩刺激;习惯;期望;易化
 
 
1 前言
动机、需要、动力的神经生物学基础是什么?它们对学习有那些我们没有发现却是非常重要的影响呢?
压杆实验是指,在动物的某些区域埋藏电极让动物按压杠杆进行电刺激的实验。它是olds与milner于1954年发现的。实验中,在一些中枢埋藏的电极刺激使动物的压杆行为得以持续,这与动机、需要、动力使行为得以持续的现象有什么关系呢?,这说明了什么?这是将神经科学与心理学结合起来,解开动机、需要、动力本质之迷的桥梁!
我将这个实验结合一些心理学、神经科学的常识及日常经验(在结合的过程中利用了一个很重要的认识:人的任何思想、行为都是由相应的中枢控制的,因而我们可以根据思想、行为的特点来确定中枢及它的功能)进行讨论后得出,动机、需要、动力是由奖惩中枢产生的(虽然本文没针对它进行专门论述,但看了本文会自然产生这样的认识)。然后通过对奖惩中枢与学习的关系的讨论,得出了一些重要的结论。
由奖惩中枢、奖惩刺激对应中枢(在奖惩中枢之外)组成的系统称为奖惩系统。人的奖惩系统的发展变化,通过人对先天或后天的奖惩刺激的反应表现出来。奖惩系统的发展在人心理、行为的发展中处于核心地位,其它的学习发展是在它的影响下产生的。比如:本文提到的小孩模仿成人,只有当模仿成为奖赏刺激后,建立在模仿基础之上的学习才能顺利的发展,同时模仿后所获得的结果如果是奖赏,反过来又会强化模仿。今后对奖惩系统的研究会成为一个新的热点。
本文奖惩学习的理论是对行为主义学派的发展与完善,它能将其它心理学派的理论统一起来。比如,弗洛伊德的本我、自我、超我,它们代表人在一次思想、行为时,不同的奖惩刺激对思想、行为的影响。本我对应人对先天奖惩刺激的需要产生的动力,而自我、超我对应对后天奖惩刺激的需要产生的动力。又如特质论,既然特质由习惯组成,而习惯是奖惩学习获得的,那么特质也是在奖惩学习的过程中形成的。人能预期到理想、目标等的结果会带来奖赏刺激(当然不是行为主义学派所指的狭义的奖赏刺激),这种认识能解决阿尔波特的机能自立理论与其它心理学派的矛盾。
2 奖惩中枢结构与功能
心理学实验及日常经验告诉我们,奖惩刺激强烈的影响着儿童的思想、行为,当某一刺激或行为给儿童带来奖赏后,他便会希望(或渴求)再实现这一刺激或行为,而当某一刺激或行为给他带来惩罚后,他便会逃避这一刺激或行为(儿童思想、行为的动力是为了获得奖赏,逃避惩罚)。由于人的思想、行为总是由相应的神经中枢控制的,因而儿童因奖惩而对某一刺激、行为产生渴求或逃避的思想行为应由相应的神经中枢控制,我们把这样的中枢称为奖惩中枢。
实验发现在动物边缘系统的某些区域埋藏电极,进行压杆实验时,动物可产生渴求而反复按压杠杆进行自我刺激,而在另一些区域受刺激时,动物表现为面容苦痛、战栗等而产生逃避刺激的行为。由于这些刺激使动物产生了渴求或逃避的行为,因而可以认为它们直接或间接刺激了奖惩中枢。在这个实验中,刺激的是边缘系统的某些区域,因而我们可以推测人或动物的奖惩中枢或其相关区域可能部分位于边缘系统的某些区域。又有相关资料[1]提示,奖惩预期由眼窝前额皮质及杏仁核来实现,因而奖惩中枢或其相关区域可能也部分位于眼窝前额皮质的某些区域。
既然动物或人对兴奋了奖赏中枢的行为能产生渴求并可不断重复这一行为,那么这必然是奖赏中枢使与这一行为相对应的神经通路受到了较强的易化,从而使之处于易兴奋状态(表现为有重复这一行为的冲动),否则这一神经通路便不易被兴奋(行为不能产生)。因而我们不难得出兴奋了奖赏中枢的神经通路的兴奋能被奖赏中枢强化(易化),同理,兴奋了惩罚中枢的神经通路的兴奋能被惩罚中枢弱化(抑制),同时我们能根据日常生活中奖赏刺激、惩罚刺激的效果来推测:1、不同的奖惩刺激对奖惩中枢的兴奋能力不同。2、弱的奖赏刺激应能轻度的兴奋奖赏中枢,而弱的惩罚刺激应能轻度的兴奋惩罚中枢……,即某一强度的奖赏刺激能相应强度的兴奋奖赏中枢,某一强度的惩罚刺激能相应强度的兴奋惩罚中枢。
分析一个具体的奖惩学习的实例:一个儿童因多次玩水而被大人惩罚几次后,玩水这一行为便与惩罚中枢建立了一定的记忆联系。当他再看到水时,玩水这一行为便会受到抑制,这时他只看到水,没有被惩罚,为什么玩水这一行为仍被抑制了哪?这是因为他预期到玩水会受到惩罚,而使玩水被抑制,因而必然存在一个奖惩预期中枢来实现大脑的这一功能。
由于一对象如果没与奖惩刺激建立过联系,它便不会产生奖惩预期。而如果由它引起奖惩刺激后,再回忆这个对象就能产生奖惩预期,这说明对象与奖惩预期中枢建立了记忆联系,也就是说,奖惩中枢兴奋了,奖惩预期中枢必然会兴奋。而产生了奖惩预期却并不一定会产生奖惩刺激,也就是说奖惩预期中枢兴奋奖惩中枢不一定兴奋。(比如,如果一种一小孩从来没有吃过的水果,在他享受前后,他的奖惩中枢、奖惩预期中枢的反应情况)。
通过以上分析我们可以得出以下结论:1、奖惩预期中枢的兴奋强度与奖惩中枢的兴奋强度相对应。某一思想行为兴奋奖惩中枢或只兴奋相对应的奖惩预期中枢对这一思想行为的易化或抑制效果是相似的。2、它兴奋时奖惩中枢不一定兴奋,奖惩中枢兴奋时它一定兴奋。奖惩中枢只有受到奖惩刺激才能被兴奋,而奖惩预期中枢通过特殊的回忆就能被兴奋。3、根据奖惩中枢与奖惩预期中枢的功能,可认为奖惩预期中枢为奖惩中枢的组成部分。
再回到儿童玩水的事例,当儿童因玩水而被大人惩罚后,他再看到水时,通过回忆使奖惩预期中枢产生相应的兴奋(认识到玩水会带来惩罚),然后在奖惩预期中枢的影响下这一行为被抑制(整个学习过程既包括联合学习方式又包括认知学习方式)。
3 奖惩学习的机理
奖惩中枢因其特殊的神经联系和功能在高等动物和人的学习过程中发挥着关键作用,下面让我们来讨论奖惩中枢对学习的影响。
婴儿一出生就具有感受器、效应器、传入传出通路、皮质中枢、奖惩中枢等,以及奖惩中枢、皮质中枢、感受器、效应器……之间的特殊的神经联系,这些联系都是遗传决定的,人就是在这些基础之上通过刺激、学习而逐渐形成记忆、思维系统的。人类存在先天的奖赏刺激,比如对婴儿来说给婴儿吃、对婴儿进行爱抚等就是对婴儿的奖赏刺激,它们是婴儿一出生便具有的。先天的惩罚刺激有,打婴儿、使婴儿挨饿等。
当某些非奖赏刺激(如某人面容、声音等)刺激人时,与之对应的神经通路被刺激兴奋,而如果随后(或同时)奖赏中枢也处于兴奋状态(比如奖赏中枢被“吃饭”等奖赏刺激刺激兴奋)这些刺激便会与奖赏中枢建立相应的记忆联系,经过多次记忆联系后,当这种记忆联系达到一定程度,这些刺激就会成为后天奖赏刺激(因为当这些刺激再刺激这人时便会通过记忆的神经通路,较强的兴奋奖赏中枢)。新的惩罚刺激的学习机理相似。
在婴儿的新皮质应存在能分别反应人的身高、面部形状的两神经通路集合。当某人引起婴儿注意时,与这人的身高或面部形状相对应的神经通路中部分神经通路可能被兴奋。由于一般情况下,在辨认人的过程中,面部形状远比身高重要,以面部形状为标准的辨认(兴奋了与面部形状对应的部分神经过通路)往往能获得正确结果,而以身高为标准的辨认更多情况下获得错误结果。而在正确辨认人的情况下,成人一般会通过语言、行为等形式的奖赏刺激,易化、兴奋婴儿的奖赏中枢,从而使面部辨认方式较多的与奖赏中枢建立起记忆联系。同理,以人的身高为标准的辨认则较多的和惩罚中枢建立了联系(当然有时它也可与奖赏中枢建立联系)。当婴儿再辨认人时,他会回忆起成人的奖赏、惩罚(在正确或错误辨认后所获得的),从而对辨认产生奖惩预期,然后在奖惩预期中枢的作用下强烈易化以面部形状为标准的辨认方式而抑制以身高为标准的辨认方式,使以面部形状为标准的辨认方式得到选择。以后,在婴儿多次的辨认学习过程中,在奖惩中枢的参与下,以面部形状为标准的辨认方式不断被选择,从而不断得到记忆强化(每兴奋一次便被强化一次),而以身高为标准的辨认方式很少得到选择,也就很少得到记忆强化。那么,在婴儿最开始辨认人之前,即使以身高为标准的辨认方式远比以面部形状为标准的辨认方式更易得到选择(更易被兴奋),经过多次辨认学习后,在无奖惩中枢的参与下,以面部形状为标准的辨认方式应最终比以身高为标准的辨认方式更易得到选择(更易被兴奋)。
经过“无数”次辨认学习后,当婴儿再辨认人时,与面部形状为标准的辨认相对应的神经通路的被兴奋能力超过某一强度后,便可被“习惯性的”兴奋,而完成辨认,不再需要奖惩预期或其它特殊的易化方式。这时,以面部形状为标准的辨认方式便会成为辨认习惯。其它的有奖惩价值的神经兴奋习惯的学习与之类似。
上面论述的学习过程也可以这样简单描述:在小孩学习实现某一目的的过程中,奖惩中枢从能够产生的思想行为中,按出现的先后顺序选择出合适的思想行为,作为每次实现这一目的固定的思想行为,并在它的出现达到一定次数后成为习惯。所有学习获得的习惯都是这样产生的。
4 结语
通过前面的讨论可知,人想干什么是因为奖赏中枢的作用(预期到奖赏,动力是为了获得奖赏),而不想干什么是由于惩罚中枢的作用(预期到惩罚),也就是说人思想、行为的动力是奖惩中枢产生的。满足了人所想的(欲望)便能相应兴奋人的奖赏中枢,否则便会相应兴奋人的惩罚中枢。婴儿致所以有模仿成人的习惯与欲望,是因为在婴儿表达自己的欲望时,其行为如不模仿成人便无法得到奖赏刺激而难于使自己的欲望得到满足,而模仿成人则会使婴儿通过成人使自己的欲望得到满足,从而使“模仿成人”这种行为模式与奖赏中枢联系起来,那么由前文可知,这种联系经过多次重复后,婴儿便会形成模仿成人的习惯与欲望。对、错判断对记忆与行为的影响的学习,思维及行为习惯的形成等都是在奖惩中枢参与下选择记忆的结果。总之,奖惩中枢、海马中枢、新皮质、外界刺激之间的特殊关系决定了奖惩中枢在神经兴奋习惯(包括重要的基础性的神经兴奋习惯)的选择记忆方面起着主要作用,也就是说奖惩中枢在人的思想、行为习惯的选择、形成过程中起主要作用。