心理學筆記之學習與行為分析

條件作用(conditioning):事件與行為相互聯繫起來的方式。每一種條件作用都代表著有機體獲得和使用其環境結構信息的一種不同方式。

一、 學習研究

1、什麼是學習

學習(learning)是基於經驗而導致行為或行為潛能發生相對一致的變化的過程。

(1)行為或行為潛能的變化

學習從你操作的進步中顯而易見。

學習—表現差異(learning-performance distinction)——你學到的和你在外顯行為中表達出來或做出來之間的差異。

(2)相對一致的變化

一旦學會了某種行為,行為或行為潛能的變化就必須在不同場合表現出相對一致性。

(3)基於經驗的過程

學習只有通過體驗才能發生。體驗包括吸收信息和做出反應來影響環境。學習包含記憶影響的反應。學習獲得的行為既不包括因有機體年齡增長而出現的自然成熟及大腦發育所帶來的變化,也不包括因疾病和腦損傷而引起的變化。

2、行為主義與行為分析

華生(John Watson,1878-1958)還將心理學的首要目標定義為「預測和控制行為」。

斯金納(Skinner,1904-1990):激進行為主義的立場,進化為每一物種都提供了一個行為庫。《超越自由和尊嚴》:所有超出行為庫的行為都可以被理解為簡單的。

斯金納:心理活動並不能產生行為。相反,它們都是環境刺激引起的行為樣本。動物的行為可以完全通過環境事件得到解釋——食物剝奪和運用食物進行強化。你不必理解任何有關其內部的心理狀態——你只需要能讓鳥兒在行為與獎賞之間形成聯結的簡單學習原則就可以了。

行為分析(behavior analysis):強調尋找學習和行為的環境決定因子的心理學領域。

行為分析家認為,人的本性可以通過將自然科學的方法和原則加以擴展而得到理解。其任務是去發現在具有可比性的情景下,所有動物物種包括人類,共同出現的學習的普遍規則。

通常假定,學習的基本過程在物種演化中被保留下來——在所有動物物種中,這些過程就其基本特性來說是具有可比性的。

行為分析尋求的是確定一些順序性原則,它們是人們對其經驗所做出的行為改變之基礎。關心的焦點,仍然是行為與環境事件的關係,而不是行為與心理事件的關係。

行為分析尋求的是確定一些順序性原則,它們是人們對其經驗所做出的行為改變之基礎。關心的焦點,仍然是行為與環境事件的關係,而不是行為與心理事件的關係。

二、經典條件作用:學習可預期的信號

經典條件作用(classical conditioning),一種由一個刺激或事件預示另一個刺激或事件之到來的基本學習方式。

1、巴甫洛夫的意外觀察

經典條件作用的核心是反射性反應。反射(reflex)是一種無須學習的反應,它是由有機體生物學相關的特定刺激自然誘發地。任何能夠自然誘發反射性行為的刺激,都叫無條件刺激(unconditioned stimulus , UCS),由無條件刺激誘發的行為,叫無條件反應(unconditioned response , UCR)。

與無條件刺激相匹配的中性刺激,稱為條件刺激(conditioned stimulus , CS),因為它誘發UCR行為的力量是以它與UCS的聯繫為條件的。經過幾次匹配之後,CS所引發出的反應,稱為條件反應(conditioned response , CR)。

2、條件作用的過程

習得(acquisition),即CR首次被誘發出來並隨著試驗的重複而不斷增強其頻率的過程。

延遲條件作用,CS先出現並至少要持續到UCS的呈現。

在痕迹條件作用中,CS在UCS呈現之前即結束或被取消了。痕迹指的是有機體對UCS出現時已經不再呈現的CS的記憶。

在同時性條件作用中,CS和UCS是同時呈現的。

在倒攝條件作用情形下,CS出現在UCS之後。

通常,條件作用在CS和UCS之間間隔很短的延遲條件作用模式下最有效。不過,產生最佳條件作用的CS和UCS之間準確的時間間隔依賴於幾個因素,包括CS的強度和被條件化的反應。

同時性條件作用的效果通常都很差,而倒攝條件作用則更差。

當CS(例如,聲音)不再預示CS(食物)時,CR(唾液分泌)會隨著時間的推移變得越來越弱,最終不再出現,消退過程(extinction)就發生了。經過一段休息或暫停後,無須再與UCS匹配,CR即可突然重現的現象,巴甫洛夫稱之為自發恢復(spontaneous recovery)。

節省(savings)學習的一個例子:再次習得某一反應比初次習得該反應時所需的時間要少。

(1)刺激泛化

通常,一旦CR被一個特定的CS條件化了,與CS類似的刺激也能誘發CR。這種反應自動擴展到從未與最初的UCS匹配過的刺激上的現象,叫刺激泛化(stimulus generalization)。當對一系列在某一維度上差異逐漸增加的刺激所誘發的反應強度進行測量時,我們發現了泛化梯度。

泛化梯度的存在表明了經典條件作用在日常經驗中的作用方式。刺激泛化通過最初特定經驗拓展學習範圍,從而建立相似的安全因素。藉助這一特性,新的可比事件可以被認為具有同樣的意義或行為價值。

(2)刺激辨別

刺激辨別(stimulus discrimination)就是生物體學會在某些維度上(例如,色調與音高)對與CS不同的刺激做出不同反應的過程。

有機體欲在環境中表現出最佳行為,就必須平衡泛化和辨別過程。經典條件作用提供了一種允許生物體對其環境結構做出有效反應的機制。

3、聚焦習得

(1)相倚:羅伯特·雷斯科拉,為使經典條件作用能夠發生,除了CS與UCS相接近——出現的時間靠近以外,CS還必須可靠地預期UCS的出現。

(2)信息性

里昂·卡明,CS還必須具有信息性。

UCS的先前經驗而使被試用第一個CS來降低第二個CS的信息性的能力,稱做阻斷(blocking)。實驗組的老鼠對燈光不反應,這是因為燈光沒有包含預言UOS出現的新信息;聲音的效應阻斷了燈光的效應。對於控制組的老鼠,燈光和聲音二者同樣具有信息性——老鼠對兩個CS中無論哪一個都沒有先前經驗,因此每一個都不會降低另一個的信息性。

用信息性可以解釋為什麼當CS從許多呈現在環境中的其他刺激中突出出來時,條件作用形成得最快。刺激越強,與其他刺激對比越鮮明,越容易被注意到。如果你想要創造良好的條件作用,你應該或者是在不熟悉的情境中呈現一個強烈的新異刺激,或者是在一個新異的背景中呈現一個強烈的熟悉刺激。
從刺激信息的特性來看,外界輸入的信息越強,越不確定,越難控制則越容易吸引人的注意。

中性刺激僅僅當它既有相倚性,又有信息性時,才能成為有效的CS。

4、經典條件作用的應用

(1) 情緒和偏好

恐懼條件作用。

(2)了解藥物成癮者的成因

巴甫洛夫(1927)和貝可夫指出,當個體預期到鴉片的藥理學作用時,他對鴉片的耐藥性就會提高。

西格爾:毒品的使用情境作為條件刺激物存在,個體通過阻止藥物的常規效應而學會了保護自己。

機體對藥物的對抗反應是無條件反應(UCR)。隨著時間的推移,這種補償反應就變成了條件反應。換言之,在與使用藥物通常相聯繫的情境(CS)中,機體會對藥物的預期效應做出生理準備(CR)。由於在那種情境下,有機體必須消耗一定量的藥物克服補償反應,才會開始出現「正」效應,因而抗藥力便提高了。

(3)利用經典條件作用

學習過程能夠影響機體的免疫能力。

羅伯特·阿德:習得聯結本身就足以導致免疫系統的抑制,使實驗組老鼠更易受到多種疾病的攻擊。學習效應是如此強烈以至於在後來的研究中,一些老鼠僅僅是喝了糖精溶液便死掉了。

心理神經免疫學(psychoneuroimmunology):經典條件作用可以用來調節免疫系統的功能。

研究領域的目標之一就是發現一些技術,利用條件反射來替代大劑量的藥物治療。

服藥真實的常現儀式可以作為CS,所以當它開始預言UCS——藥物時——其行動本身即可誘發降低血壓的反應。這樣,安慰劑——無須給予有效物質便能再現服藥儀式化情形——即能誘發有益的機體反應。

三、 作性條件作用:對行為結果的學習

1、效果律

學習是情境中的刺激和動物學會做出的反應之間建立的一種聯想:刺激—反應聯結。

S—R,聯結學習是隨著動物通過盲目的嘗試錯誤體驗到動作的結果之後,以一種機械的方式逐漸自動產生的。導致滿意結果的行為出現的頻率逐漸增加。桑代克將這種行為與結果之間的關係稱為效果律(law of effect):跟隨著滿意結果的反應,以後出現的概率會越來越大,而跟隨著不滿意結果的反應,以後出現的概率會越來越小。

2、行為的實驗分析

斯金納:操作性條件作用(operant conditioning)

操作性行為(operant)指的是任何有機體自發的,而不是由特定刺激誘發的,能夠按照它作用於環境可觀察的結果來描述它的特點的行為。

行為將來出現的可能性可以通過操縱它們對環境作用的結果來增加或減少。操作性條件作用,作為行為產生的環境結果的函數,就可以矯正不同類型的操作性行為概率。在許多操作性行為實驗中,測量的興趣是動物在一段時間裡能表現出多少次特定的行為。

3、強化相依

強化相倚(reinforcement contingency)是指某一反應和它產生的環境變化之間的一致性關係。

(1)陽性和陰性強化物

強化物(reinforcer)即與行為相倚的——隨時間的推移能增加行為出現可能性的任何刺激。強化即在反應之後呈現強化物。

當某一行為之後伴隨著喜愛刺激出現時,我們稱這一事件為陽性強化(positive reinforcement)。當某一行為之後伴隨著討厭刺激的解除時,我們稱這一事件為陰性強化(negative reinforcement)。

陽性強化和陰性強化都能增強在它們之前出現的行為反應的可能性。陽性強化通過繼反應之後呈現令人喜愛的刺激而增強行為反應的頻率。陰性強化則相反,它通過解除、減少或阻止反應之後出現討厭刺激來增強行為反應的可能性。

若將強化消除,操作性消退(operant extinction)就會出現。因而,如果某一行為不再產生可預期的結果,那麼它就會退回到操作性條件作用之前的水平——它就消失了。

(2)陽性和陰性懲罰

懲罰物(punisher)是在反應之後施加懲罰物,任何一種刺激——當它伴隨在某一反應之後出現時——能降低該反應以後發生的概率。某一行為之後伴隨著討厭刺激物時,我們稱這一事件為陽性懲罰(positive punishment)。

當某一行為之後伴隨著喜愛刺激的去除時,我們稱這一事件為陰性懲罰(negative punishment)。

陽性和陰性強化增加行為的概率;陽性和陰性懲罰降低行為的概率。

(3)辨別刺激與泛化

某些先於特定反應的刺激——辨別性刺激(discriminative stimuli)——通過強化或懲罰相結合便可以設定行為發生的背景。

斯金納將辨別性刺激—行為—結果這一序列稱為三項相倚(three-term contingency)。

辨別性刺激出現時操縱行為的結果,可以對行為進行強有力的控制。

有機體也會將反應泛化到類似於辨別性刺激的其他刺激中去。

4、強化物的特性

(1)條件性強化物

初級強化物(primary reinforcers)比如食物和水,其強化特性是由於生物學因素所決定的。其他的中性刺激漸漸與初級強化物聯合在一起,作為條件性強化物(conditioned reinforcers)而對操作性反應起作用。條件性強化物可以充當強化本身的目標。

教師發現條件性強化物比初級強化物更有效且更易於使用,這是因為:a,在課堂情境中,可供使用的初級強化物非常少,而被教師所控制的任何刺激事件幾乎都可以被用作條件性強化物;b,條件性強化物可以快速發放;c,條件性強化物可以隨身攜帶;d,條件性強化物的強化效果可以更及時地看到,因為它僅依賴於接受強化物的知覺,而不是像初級強化物那樣,依賴於生物學過程。

(2)高概率活動作為陽性強化物

普雷馬克原則(Premack principle)是指,更有可能發生的活動可以用來強化不太可能發生的活動。強化物可以是有機體認為有價值的任何事件或活動。

5、強化程序表(schedules of reinforcement)

在現實生活或實驗室里,強化物可以按照比率程序表——經過一定次數的反應,或者間隔程序表——第一次反應後經過一個指定的時間間隔,來實施。

每種情況下,既可以有不變的或固定的強化模式,也可以有不規則的或可變的(variable)強化模式,它們構成了強化程序表的四種主要類型。

部分強化效應(partial reinforcement effect):在部分強化程序表中獲得的反應比那些在連續強化中獲得的反應更能抵抗行為的消退。

(1)固定-比率(FR)程序表(fixed-ratio schedule)

每次反應後都伴有強化時,我們稱這種程序表為FR-1程序表。

很多售貨員都是由FR程序表強化的:他們必須賣出一定數量的貨物,才能得到報酬。

(2)可變-比率(VR)程序表(variable-ratio schedule)

在可變—比率程序表,強化物之間的平均反應次數是預先確定了的。可彎-比率程序表產生的反應速率最高,抗消退能力最強,尤其是當VR值較大的時候。

賭博似乎就是受VR程序表控制的。

(3)固定—間隔(FI)程序表(fixed-interual schedule)

固定—間隔程序表中,強化物是在經過一個固定的時間間隔後,有機體第一次做出某反應時出現。

F1程序表中的反應速率表現為扇形模式。隨著回報時間的臨近,動物的反應越來越多。加熱食物,在時限的最後一段時間裡,經常查看食物的過程。按月支付薪水即是將你置於FI程序表中。

(4)可變—間隔(VI)程序表(variable-interual schedule)

在可變—間隔程序表中,平均時間間隔是預先確定了的。產生中等的但卻很穩定的反應速率。

課上常有臨時的、不規則的突然測驗。

6、行為塑造

連續接近塑造法(shaping by successive approximations),對任何連續接近並最終與預期反應相匹配的行為進行強化。

要讓塑造法起作用,你必須定義向著目標行為前進的各個行為成分,並運用差彆強化來推進這一過程的每一步。

四、生物學與學習

學習的生物制約性(Biological constraints on learning)指的是物種的遺傳天賦所帶來的學習上的任何限制。這些約束可以是動物的感覺、行為和認知能力。

1、本能漂移

凱勒·不里蘭和馬瑞恩·不里蘭(Keller Breland and Marion Breland)

即使動物學會了進行完美的操作反應,隨著時間的推移,「習得的行為也會向著本能行為漂移」。他們稱這種傾向為本能漂移(instinctual drift)。

並非學習的所有方面都受實驗者的強化物控制。作為動物在環境中正常的、遺傳編排中的反應,行為或者更易被改變,或者更難被改變。當目標反應與生物相關因素相一致時,反射作用就會非常有效。

2、味覺—厭惡學習(taste-aversion learning)

味覺厭惡僅僅通過CS(新異味道)與其後果(潛在的UOS結果——實際引發疾病的成份)的一次匹配即可形成。與非常脆弱的許多經典條件聯結不同,味覺厭惡在一次經歷後會永久保持。

老鼠有一種先天的將特定刺激與特定結果相聯合的先天能力。這樣,一些條件反射的實例,不僅依賴刺激與行為間的關係,而且依賴由遺傳預先安排的有機體對待環境刺激的方式。

五、學習的認知影響

1、動物認知

(1)認知地圖

愛德華·托爾曼開創了學習認知過程的研究先河。

先前曾走過迷津的老鼠擁有對認知地圖(cognitive map)迷津整體布局的表徵做反應,而不是通過嘗試錯誤盲目地探索迷津的各個不同部分。表明:條件反射不僅涉及刺激情境之間或反應與強化物之間形成簡單的聯結,它包含著對全部行為背景的其他各方面的學習與表徵。

空間認知地圖的功能:動物運用空間記憶來認知和識別環境特徵;動物運用空間記憶來發現環境中重要的目標物;動物運用空間記憶來設計他們在環境中的旅行路線。

(2)概念性行為

泛化的根基是由新獲得的概念結構而引起的認知相似性。

鴿子能獲得相同和不同的抽象概念。

2、觀察學習

個體,僅僅是在觀察到他人的行為被強化或被懲罰後,才在後來或者做出類似行為,或者抑制該行為,這就是觀察學習(observational learning)。認知通常以期待的方式進入觀察學習。

觀察學習並非人類所特有。

阿爾波特·班杜拉(Albert Bandura):在下列情況下,所觀察到的榜樣行為最具影響力:觀察到榜樣的行為得到了強化的結果;榜樣被看成是正面的、令人喜愛和尊敬的;榜樣和觀察者的相貌及特點具有可知覺的相似性;觀察者因注意榜樣的行為而得到了獎賞;榜樣的行為可以看到並且很突出——榜樣作為清晰的形象,從與其相競爭的人物背景中顯現出來;榜樣的行為是在觀察者所能模仿的能力範圍內。

脫敏,一種在看到暴力行為時情緒喚起和悲痛水平的降低。

對觀察學習的分析,一方面證實了強化原則影響行為,另一方面也證實了人類有能力運用認知過程,藉助替代獎賞和替代懲罰來改變行為。

作者: 張津東

群而不黨,和而不同,自由理性皆容納。

發表回復