心理学笔记之学习与行为分析

条件作用(conditioning):事件与行为相互联系起来的方式。每一种条件作用都代表着有机体获得和使用其环境结构信息的一种不同方式。

一、 学习研究

1、什么是学习

学习(learning)是基于经验而导致行为或行为潜能发生相对一致的变化的过程。

(1)行为或行为潜能的变化

学习从你操作的进步中显而易见。

学习—表现差异(learning-performance distinction)——你学到的和你在外显行为中表达出来或做出来之间的差异。

(2)相对一致的变化

一旦学会了某种行为,行为或行为潜能的变化就必须在不同场合表现出相对一致性。

(3)基于经验的过程

学习只有通过体验才能发生。体验包括吸收信息和做出反应来影响环境。学习包含记忆影响的反应。学习获得的行为既不包括因有机体年龄增长而出现的自然成熟及大脑发育所带来的变化,也不包括因疾病和脑损伤而引起的变化。

2、行为主义与行为分析

华生(John Watson,1878-1958)还将心理学的首要目标定义为“预测和控制行为”。

斯金纳(Skinner,1904-1990):激进行为主义的立场,进化为每一物种都提供了一个行为库。《超越自由和尊严》:所有超出行为库的行为都可以被理解为简单的。

斯金纳:心理活动并不能产生行为。相反,它们都是环境刺激引起的行为样本。动物的行为可以完全通过环境事件得到解释——食物剥夺和运用食物进行强化。你不必理解任何有关其内部的心理状态——你只需要能让鸟儿在行为与奖赏之间形成联结的简单学习原则就可以了。

行为分析(behavior analysis):强调寻找学习和行为的环境决定因子的心理学领域。

行为分析家认为,人的本性可以通过将自然科学的方法和原则加以扩展而得到理解。其任务是去发现在具有可比性的情景下,所有动物物种包括人类,共同出现的学习的普遍规则。

通常假定,学习的基本过程在物种演化中被保留下来——在所有动物物种中,这些过程就其基本特性来说是具有可比性的。

行为分析寻求的是确定一些顺序性原则,它们是人们对其经验所做出的行为改变之基础。关心的焦点,仍然是行为与环境事件的关系,而不是行为与心理事件的关系。

行为分析寻求的是确定一些顺序性原则,它们是人们对其经验所做出的行为改变之基础。关心的焦点,仍然是行为与环境事件的关系,而不是行为与心理事件的关系。

二、经典条件作用:学习可预期的信号

经典条件作用(classical conditioning),一种由一个刺激或事件预示另一个刺激或事件之到来的基本学习方式。

1、巴甫洛夫的意外观察

经典条件作用的核心是反射性反应。反射(reflex)是一种无须学习的反应,它是由有机体生物学相关的特定刺激自然诱发地。任何能够自然诱发反射性行为的刺激,都叫无条件刺激(unconditioned stimulus , UCS),由无条件刺激诱发的行为,叫无条件反应(unconditioned response , UCR)。

与无条件刺激相匹配的中性刺激,称为条件刺激(conditioned stimulus , CS),因为它诱发UCR行为的力量是以它与UCS的联系为条件的。经过几次匹配之后,CS所引发出的反应,称为条件反应(conditioned response , CR)。

2、条件作用的过程

习得(acquisition),即CR首次被诱发出来并随着试验的重复而不断增强其频率的过程。

延迟条件作用,CS先出现并至少要持续到UCS的呈现。

在痕迹条件作用中,CS在UCS呈现之前即结束或被取消了。痕迹指的是有机体对UCS出现时已经不再呈现的CS的记忆。

在同时性条件作用中,CS和UCS是同时呈现的。

在倒摄条件作用情形下,CS出现在UCS之后。

通常,条件作用在CS和UCS之间间隔很短的延迟条件作用模式下最有效。不过,产生最佳条件作用的CS和UCS之间准确的时间间隔依赖于几个因素,包括CS的强度和被条件化的反应。

同时性条件作用的效果通常都很差,而倒摄条件作用则更差。

当CS(例如,声音)不再预示CS(食物)时,CR(唾液分泌)会随着时间的推移变得越来越弱,最终不再出现,消退过程(extinction)就发生了。经过一段休息或暂停后,无须再与UCS匹配,CR即可突然重现的现象,巴甫洛夫称之为自发恢复(spontaneous recovery)。

节省(savings)学习的一个例子:再次习得某一反应比初次习得该反应时所需的时间要少。

(1)刺激泛化

通常,一旦CR被一个特定的CS条件化了,与CS类似的刺激也能诱发CR。这种反应自动扩展到从未与最初的UCS匹配过的刺激上的现象,叫刺激泛化(stimulus generalization)。当对一系列在某一维度上差异逐渐增加的刺激所诱发的反应强度进行测量时,我们发现了泛化梯度。

泛化梯度的存在表明了经典条件作用在日常经验中的作用方式。刺激泛化通过最初特定经验拓展学习范围,从而建立相似的安全因素。借助这一特性,新的可比事件可以被认为具有同样的意义或行为价值。

(2)刺激辨别

刺激辨别(stimulus discrimination)就是生物体学会在某些维度上(例如,色调与音高)对与CS不同的刺激做出不同反应的过程。

有机体欲在环境中表现出最佳行为,就必须平衡泛化和辨别过程。经典条件作用提供了一种允许生物体对其环境结构做出有效反应的机制。

3、聚焦习得

(1)相倚:罗伯特·雷斯科拉,为使经典条件作用能够发生,除了CS与UCS相接近——出现的时间靠近以外,CS还必须可靠地预期UCS的出现。

(2)信息性

里昂·卡明,CS还必须具有信息性。

UCS的先前经验而使被试用第一个CS来降低第二个CS的信息性的能力,称做阻断(blocking)。实验组的老鼠对灯光不反应,这是因为灯光没有包含预言UOS出现的新信息;声音的效应阻断了灯光的效应。对于控制组的老鼠,灯光和声音二者同样具有信息性——老鼠对两个CS中无论哪一个都没有先前经验,因此每一个都不会降低另一个的信息性。

用信息性可以解释为什么当CS从许多呈现在环境中的其他刺激中突出出来时,条件作用形成得最快。刺激越强,与其他刺激对比越鲜明,越容易被注意到。如果你想要创造良好的条件作用,你应该或者是在不熟悉的情境中呈现一个强烈的新异刺激,或者是在一个新异的背景中呈现一个强烈的熟悉刺激。
从刺激信息的特性来看,外界输入的信息越强,越不确定,越难控制则越容易吸引人的注意。

中性刺激仅仅当它既有相倚性,又有信息性时,才能成为有效的CS。

4、经典条件作用的应用

(1) 情绪和偏好

恐惧条件作用。

(2)了解药物成瘾者的成因

巴甫洛夫(1927)和贝可夫指出,当个体预期到鸦片的药理学作用时,他对鸦片的耐药性就会提高。

西格尔:毒品的使用情境作为条件刺激物存在,个体通过阻止药物的常规效应而学会了保护自己。

机体对药物的对抗反应是无条件反应(UCR)。随着时间的推移,这种补偿反应就变成了条件反应。换言之,在与使用药物通常相联系的情境(CS)中,机体会对药物的预期效应做出生理准备(CR)。由于在那种情境下,有机体必须消耗一定量的药物克服补偿反应,才会开始出现“正”效应,因而抗药力便提高了。

(3)利用经典条件作用

学习过程能够影响机体的免疫能力。

罗伯特·阿德:习得联结本身就足以导致免疫系统的抑制,使实验组老鼠更易受到多种疾病的攻击。学习效应是如此强烈以至于在后来的研究中,一些老鼠仅仅是喝了糖精溶液便死掉了。

心理神经免疫学(psychoneuroimmunology):经典条件作用可以用来调节免疫系统的功能。

研究领域的目标之一就是发现一些技术,利用条件反射来替代大剂量的药物治疗。

服药真实的常现仪式可以作为CS,所以当它开始预言UCS——药物时——其行动本身即可诱发降低血压的反应。这样,安慰剂——无须给予有效物质便能再现服药仪式化情形——即能诱发有益的机体反应。

三、 作性条件作用:对行为结果的学习

1、效果律

学习是情境中的刺激和动物学会做出的反应之间建立的一种联想:刺激—反应联结。

S—R,联结学习是随着动物通过盲目的尝试错误体验到动作的结果之后,以一种机械的方式逐渐自动产生的。导致满意结果的行为出现的频率逐渐增加。桑代克将这种行为与结果之间的关系称为效果律(law of effect):跟随着满意结果的反应,以后出现的概率会越来越大,而跟随着不满意结果的反应,以后出现的概率会越来越小。

2、行为的实验分析

斯金纳:操作性条件作用(operant conditioning)

操作性行为(operant)指的是任何有机体自发的,而不是由特定刺激诱发的,能够按照它作用于环境可观察的结果来描述它的特点的行为。

行为将来出现的可能性可以通过操纵它们对环境作用的结果来增加或减少。操作性条件作用,作为行为产生的环境结果的函数,就可以矫正不同类型的操作性行为概率。在许多操作性行为实验中,测量的兴趣是动物在一段时间里能表现出多少次特定的行为。

3、强化相依

强化相倚(reinforcement contingency)是指某一反应和它产生的环境变化之间的一致性关系。

(1)阳性和阴性强化物

强化物(reinforcer)即与行为相倚的——随时间的推移能增加行为出现可能性的任何刺激。强化即在反应之后呈现强化物。

当某一行为之后伴随着喜爱刺激出现时,我们称这一事件为阳性强化(positive reinforcement)。当某一行为之后伴随着讨厌刺激的解除时,我们称这一事件为阴性强化(negative reinforcement)。

阳性强化和阴性强化都能增强在它们之前出现的行为反应的可能性。阳性强化通过继反应之后呈现令人喜爱的刺激而增强行为反应的频率。阴性强化则相反,它通过解除、减少或阻止反应之后出现讨厌刺激来增强行为反应的可能性。

若将强化消除,操作性消退(operant extinction)就会出现。因而,如果某一行为不再产生可预期的结果,那么它就会退回到操作性条件作用之前的水平——它就消失了。

(2)阳性和阴性惩罚

惩罚物(punisher)是在反应之后施加惩罚物,任何一种刺激——当它伴随在某一反应之后出现时——能降低该反应以后发生的概率。某一行为之后伴随着讨厌刺激物时,我们称这一事件为阳性惩罚(positive punishment)。

当某一行为之后伴随着喜爱刺激的去除时,我们称这一事件为阴性惩罚(negative punishment)。

阳性和阴性强化增加行为的概率;阳性和阴性惩罚降低行为的概率。

(3)辨别刺激与泛化

某些先于特定反应的刺激——辨别性刺激(discriminative stimuli)——通过强化或惩罚相结合便可以设定行为发生的背景。

斯金纳将辨别性刺激—行为—结果这一序列称为三项相倚(three-term contingency)。

辨别性刺激出现时操纵行为的结果,可以对行为进行强有力的控制。

有机体也会将反应泛化到类似于辨别性刺激的其他刺激中去。

4、强化物的特性

(1)条件性强化物

初级强化物(primary reinforcers)比如食物和水,其强化特性是由于生物学因素所决定的。其他的中性刺激渐渐与初级强化物联合在一起,作为条件性强化物(conditioned reinforcers)而对操作性反应起作用。条件性强化物可以充当强化本身的目标。

教师发现条件性强化物比初级强化物更有效且更易于使用,这是因为:a,在课堂情境中,可供使用的初级强化物非常少,而被教师所控制的任何刺激事件几乎都可以被用作条件性强化物;b,条件性强化物可以快速发放;c,条件性强化物可以随身携带;d,条件性强化物的强化效果可以更及时地看到,因为它仅依赖于接受强化物的知觉,而不是像初级强化物那样,依赖于生物学过程。

(2)高概率活动作为阳性强化物

普雷马克原则(Premack principle)是指,更有可能发生的活动可以用来强化不太可能发生的活动。强化物可以是有机体认为有价值的任何事件或活动。

5、强化程序表(schedules of reinforcement)

在现实生活或实验室里,强化物可以按照比率程序表——经过一定次数的反应,或者间隔程序表——第一次反应后经过一个指定的时间间隔,来实施。

每种情况下,既可以有不变的或固定的强化模式,也可以有不规则的或可变的(variable)强化模式,它们构成了强化程序表的四种主要类型。

部分强化效应(partial reinforcement effect):在部分强化程序表中获得的反应比那些在连续强化中获得的反应更能抵抗行为的消退。

(1)固定-比率(FR)程序表(fixed-ratio schedule)

每次反应后都伴有强化时,我们称这种程序表为FR-1程序表。

很多售货员都是由FR程序表强化的:他们必须卖出一定数量的货物,才能得到报酬。

(2)可变-比率(VR)程序表(variable-ratio schedule)

在可变—比率程序表,强化物之间的平均反应次数是预先确定了的。可弯-比率程序表产生的反应速率最高,抗消退能力最强,尤其是当VR值较大的时候。

赌博似乎就是受VR程序表控制的。

(3)固定—间隔(FI)程序表(fixed-interual schedule)

固定—间隔程序表中,强化物是在经过一个固定的时间间隔后,有机体第一次做出某反应时出现。

F1程序表中的反应速率表现为扇形模式。随着回报时间的临近,动物的反应越来越多。加热食物,在时限的最后一段时间里,经常查看食物的过程。按月支付薪水即是将你置于FI程序表中。

(4)可变—间隔(VI)程序表(variable-interual schedule)

在可变—间隔程序表中,平均时间间隔是预先确定了的。产生中等的但却很稳定的反应速率。

课上常有临时的、不规则的突然测验。

6、行为塑造

连续接近塑造法(shaping by successive approximations),对任何连续接近并最终与预期反应相匹配的行为进行强化。

要让塑造法起作用,你必须定义向着目标行为前进的各个行为成分,并运用差别强化来推进这一过程的每一步。

四、生物学与学习

学习的生物制约性(Biological constraints on learning)指的是物种的遗传天赋所带来的学习上的任何限制。这些约束可以是动物的感觉、行为和认知能力。

1、本能漂移

凯勒·不里兰和马瑞恩·不里兰(Keller Breland and Marion Breland)

即使动物学会了进行完美的操作反应,随着时间的推移,“习得的行为也会向着本能行为漂移”。他们称这种倾向为本能漂移(instinctual drift)。

并非学习的所有方面都受实验者的强化物控制。作为动物在环境中正常的、遗传编排中的反应,行为或者更易被改变,或者更难被改变。当目标反应与生物相关因素相一致时,反射作用就会非常有效。

2、味觉—厌恶学习(taste-aversion learning)

味觉厌恶仅仅通过CS(新异味道)与其后果(潜在的UOS结果——实际引发疾病的成份)的一次匹配即可形成。与非常脆弱的许多经典条件联结不同,味觉厌恶在一次经历后会永久保持。

老鼠有一种先天的将特定刺激与特定结果相联合的先天能力。这样,一些条件反射的实例,不仅依赖刺激与行为间的关系,而且依赖由遗传预先安排的有机体对待环境刺激的方式。

五、学习的认知影响

1、动物认知

(1)认知地图

爱德华·托尔曼开创了学习认知过程的研究先河。

先前曾走过迷津的老鼠拥有对认知地图(cognitive map)迷津整体布局的表征做反应,而不是通过尝试错误盲目地探索迷津的各个不同部分。表明:条件反射不仅涉及刺激情境之间或反应与强化物之间形成简单的联结,它包含着对全部行为背景的其他各方面的学习与表征。

空间认知地图的功能:动物运用空间记忆来认知和识别环境特征;动物运用空间记忆来发现环境中重要的目标物;动物运用空间记忆来设计他们在环境中的旅行路线。

(2)概念性行为

泛化的根基是由新获得的概念结构而引起的认知相似性。

鸽子能获得相同和不同的抽象概念。

2、观察学习

个体,仅仅是在观察到他人的行为被强化或被惩罚后,才在后来或者做出类似行为,或者抑制该行为,这就是观察学习(observational learning)。认知通常以期待的方式进入观察学习。

观察学习并非人类所特有。

阿尔波特·班杜拉(Albert Bandura):在下列情况下,所观察到的榜样行为最具影响力:观察到榜样的行为得到了强化的结果;榜样被看成是正面的、令人喜爱和尊敬的;榜样和观察者的相貌及特点具有可知觉的相似性;观察者因注意榜样的行为而得到了奖赏;榜样的行为可以看到并且很突出——榜样作为清晰的形象,从与其相竞争的人物背景中显现出来;榜样的行为是在观察者所能模仿的能力范围内。

脱敏,一种在看到暴力行为时情绪唤起和悲痛水平的降低。

对观察学习的分析,一方面证实了强化原则影响行为,另一方面也证实了人类有能力运用认知过程,借助替代奖赏和替代惩罚来改变行为。

作者: 张 俊

群而不党,和而不同,自由理性皆容纳。

发表评论

电子邮件地址不会被公开。