You are on page 1of 17

Rozdział 8

Psy Pawłowa i reszta menażerii


W tym rozdziale:
► Zadzwonimy po Pawłowa.
► Nauczymy psa nowych sztuczek.
► Dokonamy powiązań i utrzymamy kondycję.
► Wzmocnimy zachowania i ukarzemy sprawcę.
► Będziemy walczyć z zanikiem.
► Ustalimy plan nagradzania.

Sortowcy należą do najbardziej przesądnych ludzi na świecie. Pod tym względem


p
ustępują jedynie miłośnikom hazardu. Kiedy w liceum grałem w baseball, jeden
z moich przyjaciół, miotacz w naszej drużynie, nosił wciąż ten sam podkoszulek i nie
prał go do chwili, w której przegrał mecz. Część zespołu życzyła mu porażki, byle
wreszcie wrzucił ten ciuch do pralki. Inni sportowcy noszą amulety, dokonują rytuałów
lub też powtarzają złożone czynności, aby tylko podtrzymać dobrą passę.

Kiedyś wierzyłem w kilka przesądów. Nie strzepywałem kijem piachu tylko z jednego buta.
Zawsze czyściłem oba, nawet jeżeli drugi tego nie wymagał. Kiedy zaś biegłem
po boisku, nie nadeptywałem na wyznaczoną kredą linię. Inni gracze nigdy nie
kwestionowali moich przesądów, ponieważ mieli własne, równie dziwne nawyki.

Gdy zacząłem studiować psychologię, zainteresowało mnie, skąd biorą się takie
zachowania. Kiedy nauczyłem się tego, że nadepnięcie na linię sprawi, iż gra będzie
szła kiepsko? W pewnej chwili musiałem na nią nastąpić i przegrać. Dostrzegłem związek
pomiędzy tym, co zrobiłem (nadepnąłem na linię), i wydarzeniem (kiepska gra), po czym
skojarzyłem zachowanie ze skutkiem (w tym przypadku negatywnym). Psychologowie
powiedzieliby, że jest to przykład przesądnego uczenia się.

Kiedy istnieje powiązanie pomiędzy tym, co robimy, a następującymi po tym


pozytywnymi lub negatywnymi konsekwencjami, w umyśle zachodzi specyficzny
proces nabywania wiedzy. Uczymy się wtedy, że kiedy zrobimy A, nastąpi zjawisko B,
którego konsekwencją jest C. Psychologowie behawioralni i specjaliści w dziedzinie
nabywania wiedzy traktują wszystkie przejawy uczenia się jako rodzaj warunkowania.
Charakteryzuje się ono tworzeniem powiązań między poszczególnymi zjawiskami.

W niniejszym rozdziale przedstawię specyficzny proces uczenia się. Otóż dochodzi


w nim do warunkowania klasycznego, polegającego na kojarzeniu są ze sobą dwóch
zjawisk, a także warunkowania instrumentalnego, czyli występowania ważnego zjawiska
po specyficznej reakcji, co sprawia, że ma ona większe (lub mniejsze) szanse na
powtórzenie się w przyszłości.
Część III: Myślenie, czucie i działanie

Zarówno warunkowanie klasyczne, jak i warunkowanie instrumentalne są de facto


formami nabywania wiedzy. W przypadku pierwszego typu warunkowania „uczymy
się” tego, że pomiędzy dwoma nieskojarzonymi wcześniej bodźcami pojawia się
związek. Dobrym przykładem jest wstręt względem określonego smaku. Sam kiedyś tego
doświadczyłem — zamówiłem koktajl krewetkowy, po którym zwymiotowałem. Od
tego czasu sama myśl o takim napoju wywołuje u mnie nudności. Nauczyłem się zatem,
że koktajl krewetkowy i problemy żołądkowe są dla mnie powiązane (skojarzone) oraz
że smak krewetek jest odrzucający, ponieważ kojarzy mi się z odruchem wymiotnym.

W przypadku warunkowania instrumentalnego podobny związek powstaje pomiędzy


określonym zachowaniem a jego konsekwencją. Przykładowo jeżeli zdarzyło Ci się
złowić rybę w jednym miejscu, najprawdopodobniej będziesz rozpoczynać łowienie
od tej właśnie lokalizacji. Innymi słowy, uczysz się, że konkretne zachowanie (łowienie
ryb) w konkretnym miejscu daje pożądany wynik, czyli nagrodę. Uzyskanie jej zwiększa
szansę na powtórzenie tego samego zachowania w analogicznej sytuacji.

Warunkowanie klasyczne mówi o więzi pomiędzy dwoma bodźcami. Warunkowanie


instrumentalne odnosi się do dwóch bodźców zwiększających (lub zmniejszających)
szansę na ponowne wystąpienie danego zachowania.

Nauka zachowania
Mogę śmiało założyć, że zdarzyło Ci się nieraz widzieć sytuację (lub nawet doświadczać
jej), w której dziecko zaczynało się dąsać, żądając czegoś od rodzica. Z pewnością
znasz wstyd odczuwany wówczas przez dorosłego, niechęć w spojrzeniu postronnych
obserwatorów i całkowity brak kontroli nad maluchem. Jedyny sposób na rozwiązanie
tego problemu to pójście dziecku na rękę i kupienie mu zabawki, danie słodyczy bądź
udzielenie pozwolenia.

Większość ludzi jest zgodna co do tego, że publiczne dąsy mające na celu osiągnięcie
określonego celu są zachowaniem wyuczonym. Faktycznie, idąc dziecku na rękę, rodzice
uczą je, że taka metoda przynosi pozytywny skutek. Konkretne zachowanie (krzyki,
płacz, tupanie etc.) daje bowiem pozytywny efekt, co sprawia, że maluch powtarza je,
gdy po raz kolejny chce coś otrzymać (warunkowanie instrumentalne). Co więcej,
dzieci obserwujące inne dziecko, które dzięki krzykowi i wymachiwaniu rękami dostaje
to, czego żąda, uczą się, że takie postępowanie pozwala osiągnąć cel (uczenie się przez
obserwację). Jeżeli zatem robienie sceny przynosi efekty, to dlaczego maluch miałby
zrezygnować z takiego zachowania?

Ponad sto lat temu grupa brytyjskich filozofów zastanawiała się nad podobnym
problemem, próbując zrozumieć naturę uczenia się. Zaobserwowali oni, że kiedy dwa
doświadczenia zachodzą w jednym czasie (zgodność czasowa) i miejscu (zgodność
przestrzenna), zostają ze sobą skojarzone. Innymi słowy, ludzie uczą się w takiej
sytuacji, że zdarzeniu A towarzyszy zdarzenie B. Drogi nie mogą obyć się bez korków,
hamburgery i frytki są przyjaciółmi na całe życie, a dąsy i nowe zabawki idą ramię w ramię.
Tak właśnie działają skojarzenia!
Rozdział 8: Psy Pawłowa i reszta menażerii 13
Publiczne „robienie scen” korzysta właśnie z prostego dostrzeżenia zależności. Dziecko
zauważa bowiem, że za każdym razem, kiedy jest z rodzicami w sklepie, okropne
zachowanie sprawia, iż dostaje nową zabawkę. Co gorsza, przynajmniej dla zmęczonego,
zestresowanego i niecierpliwego dorosłego częstotliwość takich wydarzeń też ma
znaczenie. Rodzic może sam nauczyć się tego, że uleganie dziecku jest dobrą metodą
na szybkie zakończenie nieprzyjemnej sytuacji. To zaś prowadzi do wzmocnienia
skojarzenia pomiędzy dąsami a kupowaniem zabawek.

Mam jednak dobre wieści. Wszystkich zachowań wyuczonych poprzez warunkowanie


można się oduczyć przy zastosowaniu tego samego mechanizmu.

Psia ślina
Niezbyt apetyczny tytuł, prawda?

Szczerze mówiąc, wolałbym raczej pójść do dentysty, niż prowadzić eksperymenty


nad ślinieniem się zwierząt. Na szczęście znalazł się pewien odważny człowiek, który tego
dokonał. Rosyjski psycholog Iwan Pawłow zdecydował się przeprowadzić badania
nad mechanizmem trawienia u psów. Szczególnie interesowało go, dlaczego obecność
pożywienia uaktywnia reakcję wytwarzania śliny. Wreszcie odkrył, że jest to proces
automatyczny.

Spróbuj tego samodzielnie. Pomyśl o czymś bardzo smacznym i sprawdź, czy


w Twoich ustach pojawi się ślina. Działa? W każdym razie powinno tak się stać,
ponieważ wytwarzanie śliny jest automatyczną reakcją na pojawienie się posiłku.
W ten sposób organizm przygotowuje się do jedzenia, jako że ślina pomaga
rozdrobnić pożywienie na możliwe do przyswojenia fragmenty.

Poniżej opiszę wnioski, jakie Pawłow wyciągnął ze swoich eksperymentów nad


naturalnymi reakcjami wywoływanymi przez skojarzenia. Przedstawię również jego
teorię warunkowania klasycznego. Pokażę ponadto, w jaki sposób można modyfikować
skojarzenia, aby zmieniać wyuczone reakcje warunkowe.

Bodźce i odruchy warunkowe


Pawłow skonstruował specjalne urządzenie służące do zbierania śliny bezpośrednio
z psich ślinianek, dzięki czemu był w stanie zmierzyć ilość tego płynu automatycznie
wytwarzaną przez zwierzę. Wyobraź sobie taką scenę. Pies przymocowany pasami
w klatce z rurką sterczącą z pyska i stojący obok naukowiec, skwapliwie liczący każdą
kroplę. Nawet w Hollywood trudno byłoby wymyślić tak ekscentryczny obrazek.

Uczony początkowo był zadowolony z wyników badań, ale pewnego dnia jego uwagę
zwróciło pewne dziwne zjawisko. Otóż psy zaczęły wytwarzać ślinę także w chwili, gdy
jedzenia nie było. Co się stało? Czyżby jakiś dodatkowy czynnik zaczął wywoływać ślinienie?

Pawłow, opierając się na wyjaśnieniu asocjanistycznym, uznał, że psy skojarzyły inny


bodziec z pożywieniem. Ale jaki?
Część lII: Myślenie, czucie i działanie

Badacz przeprowadził całą serię eksperymentów. Zamierzał sprawdzić, w jaki sposób psy
nauczyły się automatycznie tak kojarzyć inne bodźce zjedzeniem, że wywoływało to
reakcję ślinienia się. Typowy eksperyment wyglądał następująco:

1. Pawłów umieszczał psy w klatce. Podłączał rurki do ślinianek zwierząt.

2. Uruchamiał dzwonek i sprawdzał, czy psy wytwarzają ślinę. Okazało się, że nie.

3. Uruchamiał dzwonek, czekał kilka sekund i podawał psom jedzenie. Zwierzęta


zaczynały się ślinić.
4. Podawanie jedzenia poprzedzone dźwiękiem dzwonka było powtarzane w kilku
próbach.
5. Po przeprowadzeniu określonej liczby prób Pawłow tylko uruchamiał dzwonek.

6. Okazało się, że psy zaczynały się ślinić na sam znajomy dźwięk.

Warunkowanie to forma uczenia się wykorzystująca mechanizm kojarzenia. Odkrycie


Pawłowa jest znane jako warunkowanie klasyczne.
Po przeprowadzeniu eksperymentów badacz opisał cztery niezbędne elementy tego procesu:

✓ Bodziec bezwarunkowy (BB). Jedzenie dawane psom było bodźcem


bezwarunkowym. Wywoływał on reakcję bezwarunkową, czyli ślinienie.
☑ Odruch bezwarunkowy (OB). Psy Pawłowa automatycznie (odruchowo)
śliniły się, gdy widziały jedzenie. Nie musiały się tego uczyć ani być do tego
warunkowane. Pawłow nazwał tę reakcję odruchem bezwarunkowym, czyli
niewyuczonym. Nie wymaga on uczenia się. Jest automatyczny.
✓ Bodziec warunkowy (BW). Dzwonek w eksperymencie Pawłowa pełnił
funkcję bodźca warunkowego i w procesie warunkowania był kojarzony zjedzeniem.
Cel badania stanowiło doprowadzenie do sytuacji, w której sam bodziec warunkowy
wywoływałby pożądaną reakcję.
✓ Odruch warunkowy (OW). Kiedy BW wywołuje OB, reakcja ta nosi nazwę
odruchu warunkowego. W tabeli 8.1 przedstawiono tę zależność w postaci
symbolicznej.

Tabela 8.1. Warunkowanie klasyczne

Numer próby Bodziec


BB →0
BB → B
OB (jedzenie automatycznie
(jedzenie automatycznie wywołuje produkcję śliny)
wywołuje produkcję śliny)
1 BW + BB → OB (dzwonek + jedzenie
(dzwonek + produkcję śliny)
wywołuje produkcję
jedzenie wywołuje śliny)

2 (dzwonek
(dzwonek ++ jedzenie)
jedzenie)
-------------------------- BW + BB OB
→ ------------------------------------------------- ---------------------------------------------------
3 (dzwonek
(dzwonek ++ jedzenie)
jedzenie)
4-9
4-9_______ (dzwonek +
(dzwonek +jedzenie, powtórzonekilka
jedzenie,powtórzone kilkarazy)
razy)
10
10 BW→→OW
BW OW (sam dzwonekpowoduje
(samdzwonek powodujewydzielanie
wydzielanieśliny)
śliny)
Rozdział 8: Psy Pawłowa i reszta menażerii 133
Skazani na wyginięcie
Siła klasycznego warunkowania jest imponująca. Pomyśl tylko: właściwe skojarzenie
dwóch bodźców ma szansę sprawić, że sam BW może mieć identyczne działanie jak
naturalny BB. Kiedy jednak kojarzenie się zakończy i BW zacznie wywoływać pożądaną
reakcję, jego siła będzie stopniowo spadać. Jeżeli BW zostanie przedstawiony
odpowiednią liczbę razy bez BB, przestanie wywoływać OW.

To zjawisko nazywamy zanikiem. Może ono być sposobem eliminowania warunkowania


klasycznego. Na przykład psy Pawłowa nauczyły się ślinić na dźwięk dzwonka. Kiedy
jednak przez jakiś czas odgłosowi nie towarzyszyło pojawianie się pożywienia,
zwierzęta przestały wytwarzać ślinę na ów sygnał.

To jednak nie koniec!

Czasami dzieje się coś znacznie ciekawszego! Jeżeli BB pojawi się jakiś czas po zaniku,
może wywołać spontaniczny nawrót! Polega on na gwałtownym powrocie do sytuacji,
w której BW znowu jest w stanie spowodować OW. Można więc wykorzystać
warunkowanie klasyczne do nauczenia psa nowych sztuczek i odwrócić proces,
korzystając z efektu zaniku. Dzięki temu masz szansę stać się duszą towarzystwa
i olśniewać nowych przyjaciół sztuczkami z warunkowaniem, a także pomagać rodzicom
borykającym się z dziećmi, które robią sceny za każdym razem, gdy zobaczą w sklepie
coś, co bardzo chcą dostać. Zjawisko zaniku jest szczególnie przydatne w tym ostatnim
przypadku.

Poniżej przedstawiam krótki eksperyment. Możesz go przeprowadzić,


aby samodzielnie sprawdzić działanie warunkowania klasycznego.
1. Zgromadź wokół siebie grupę ludzi, na przykład rodzinę, przyjaciół czy
współpracowników. Rozdaj wszystkim kilka paczek cytrynowego napoju
w proszku (który jest bardzo kwaśny bez wody i cukru).

2. Poproś ich, aby zanurzyli palec w opakowaniu, a następnie polizali go (OB).


Popatrz, w jaki sposób zaczynają się ślinić. Jeżeli tak się nie dzieje, postaraj się
o ludzi, u których ten odruch występuje.

3. Wybierz jakiś BW (dzwonek, gwizdek, światło, cokolwiek). Połącz kilka


razy pojawianie się wybranego BW ze smakowaniem lemoniady w proszku
(BW → BB → OB).
4. Po dziesięciu lub dwudziestu takich powtórzeniach przeprowadź kolejne
kilka prób, podczas których będziesz prezentować wyłącznie BW, i poproś
uczestników, by sprawdzili, czy w ich ustach pojawia się ślina. Powinni
odpowiedzieć twierdząco. Tak właśnie działa warunkowanie klasyczne.

5. Jeżeli pozostali będą mieli ochotę, możesz też sprawdzić, jak działa zjawisko
zaniku i spontanicznego nawrotu.

Warto również wspomnieć o innym sposobie odwracania efektów warunkowania


klasycznego. Załóżmy, że udało Ci się przeprowadzić powyższe doświadczenie
i spowodować u badanych odruch ślinienia się na dźwięk dzwonka. Jeżeli chcesz
odwrócić efekt, wybierz jakiś inny BB wywołujący odmienną reakcję OB i skojarz
dzwonek (BW) z nowym OB. Działanie takie nosi nazwę przeciwwarunkowania.
134 Część III: Myślenie, czucie i działanie

Przeciwwarunkowanie działa szczególnie dobrze, gdy nowy BB wywołuje reakcję


niezwiązaną ze starym OW. Jeżeli dotychczasowym odruchem warunkowym było
ślinienie się, nowy może polegać na powodowaniu suchości w ustach. Nic mam pomysłu
na wywołanie tego efektu, może sprawdziłoby się jedzenie piachu?

Mogę zagwarantować, że jeżeli poprawnie wykorzystasz warunkowanie klasyczne


do połączenia jedzenia piachu z dźwiękiem dzwonka, bardzo ciężko będzie wywołać
dawny OW. czyli produkcję śliny, jeżeli, rzecz jasna, nie odwrócisz całego procesu.
Pamiętaj jednak, że badanym należy się przerwa, zaś jedzenie piasku sprawdza się
dość kiepsko w funkcji gry salonowej.

Generalizacja i dyskryminacja
Być może myślisz teraz: „Świetnie, potrafię nauczyć psa ślinić się na żądanie. Tylko co
z tego?".

Warunkowanie klasyczne jest bardzo ważnym zjawiskiem związanym z przetrwaniem.


Pomaga nam bowiem uczyć się wyłącznie przez skojarzenia i bez wysiłku, co może
być niezwykle przydatne. Po skojarzeniu BW z BB w taki sposób, że BW wywołuje OW,
możemy szybko rozszerzyć zakres tej zależności poprzez generalizację.

Do generalizacji dochodzi, gdy w odpowiedzi na bodziec bardzo podobny do BW,


nazwijmy go BW-2, pojawia się odruch OW, nawet jeżeli BW-2 nic był kojarzony
z pierwotnym OW. Na przykład możesz nauczyć się łączyć pewne wyrazy twarzy, takie
jak rozszerzenie nosa czy zmarszczenie brwi, z przemocą. W efekcie dostrzeżenie takiego
grymasu u rozmówcy (BW) będzie wywoływać strach (OW). Wcześniej jedynie groźby
słowne lub podniesiona pięść (BB) powodowały pojawienie się tego uczucia (OB).
Możesz więc zgeneralizować wyraz twarzy BW i odczuwać strach podczas bezpośredniego
i wyzywającego kontaktu wzrokowego (BW-2). Taka generalizacja nieraz uratuje Ci
skórę. Dzięki temu zjawisku lepiej adaptujemy się do otoczenia, ponieważ jesteśmy
w stanie szybciej się uczyć.

Niestety, generalizacja miewa także negatywne następstwa. Jeśli na przykład zaatakuje


mnie szary pitbull, mogę zacząć bać się wszystkich szarych psów, nawet jeżeli będą to
ratlerki. Przesadne warunkowanie szkodliwie wpłynie na moje zachowanie. Zacznę
bowiem unikać wszystkich psów, nawet jeżeli nie będą one stanowić dla mnie żadnego
zagrożenia.

Inny przykład to doświadczenia weteranów wojennych, którzy przeżyli zespół stresu


pourazowego. Jeżeli wybuchy lub strzały zaczęły wywoływać u nich silne reakcje,
niewykluczone, że identyczne odruchy będą występować na odgłos „strzału" tłumika
samochodowego czy innego hałasu. Może to być dość uciążliwe, zważywszy na fakt,
że w dużych miastach głośne dźwięki są czymś bardzo powszechnym.

Kiedy zaczynamy przesadzać z generalizacją, nie zachodzi proces dyskryminacji1,


czyli rozróżniania bodźców takich jak na przykład wystrzał z broni i trzask tłumika
w samochodzie. Ma on duże znaczenie. O skutecznej dyskryminacji można mówić

W nauce słowo „dyskryminacja oznacza rozróżnienie, nie ma jednak negatywnych konotacji,


jakie uzyskało w języku potocznym — przyp. tłum.
Rozdział 8: Psy Pawiowa i reszta menażerii

wtedy, gdy BW-2 (albo 3, 4 itd.) jest przedstawiany wystarczającą liczbę razy bez
wywoływania odruchu. Uczymy się wtedy, że OW powinien być spowodowany
wyłącznie przez BW, a nie BW-2.

Zasady warunkowania
Wydaje się to bardzo proste, prawda? Wystarczy połączyć kilka rzeczy i jedna zaczyna
zastępować drugą.

Chwileczkę! Owszem, sam mechanizm warunkowania jest prosty, ale aby było ono
skuteczne, należy przestrzegać pewnych zasad.

Skojarzenia powstają wyłącznie wtedy, gdy zastosujemy dwie opisane niżej reguły:

Współwystępowanie. Skojarzenia powstają, gdy dwa zjawiska występują razem.


Przykładowo zawsze jestem przygnębiony, gdy budzę się w poniedziałek i myślę,
że muszę iść do pracy. Budzenie się i praca są zatem w moim umyśle skojarzone
ze sobą.
Częstotliwość. Im częściej dane zjawiska występują razem, tym silniejsze
powstaje skojarzenie pomiędzy nimi.

Ciągłość, a więc następowanie zdarzeń po sobie, jest absolutnie niezbędne. Bez niego nie
dojdzie do warunkowania. Co by się stało, gdyby Pawłow włączał dźwięk dzwonka (BW)
po pokazaniu jedzenia (BB)? Co by było, gdyby ten odgłos pojawił się 15 minut
przed jedzeniem? BW musi wystąpić przed BB, aby mogło powstać skojarzenie.

Każde z powyższych pytań dotyczy warunkowania, które nie jest ani trochę skuteczne.
Gdyby Pawłow przedstawiał BB przed BW, co nosi nazwę warunkowania wstecznego,
psy nie wytworzyłyby skojarzenia lub byłoby ono bardzo słabe. Gdyby dźwięk pojawiał
się na długo przed jedzeniem (warunkowanie siadowe), również powstałoby bardzo słabe
skojarzenie, jeżeli w ogóle.

Najlepsze sposoby zapewniania silnego skojarzenia to:

✓ Przedstawienie BW tuż przed BB i utrzymywanie BW do chwili, w której pojawi


się OB. W ten sposób BWjest postrzegany jako związany z BB.
✓ Przeprowadzenie dużej liczby prób, w których BW i BB są często łączone.
Siła skojarzenia w prostej linii wynika właśnie z częstotliwości połączeń.
Wybranie silnych lub intensywnych BW. Jasne światło działa lepiej niż słabe.
Głośny dzwonek warunkuje łatwiej niż ledwie słyszalny. Jeżeli chcesz, aby BW
wywołał OW, musisz go dobrze wzmocnić.

Nie chcę Cię zwodzić, sugerując, że aby osiągnąć założony rezultat w procesie
warunkowania klasycznego, wystarczy często przedstawiać silny BW przed BB. Zasada
współwystępowania mówi o tym, że współwystępowanie dwóch bodźców powoduje
pojawienie się skojarzenia.

W sumie mogłoby to być takie proste, gdyby nie pewien wścibski student — Robert
Rescorla.
Część III.

Rescorla zakwestionował tezę, że współwystępowanie jest jedynym potrzebnym


czynnikiem. Być może wydawało mu się to zbyt proste, dlatego wprowadził swoją zasadę
spójności. Jego pomysł polegał na tym, że BW musi nie tylko występować wspólnie
z BB, ale także powinien pomagać go przewidywać. Jeżeli pojawienie się BW i BB
dzielą różne okresy (na przykład 1, 7, 2 i 12 minut), BW okaże się nie najlepszym
predyktorem BB. Podmiot warunkowania (człowiek lub zwierzę) nie będzie w stanie
przewidywać niczego po zetknięciu się z BW. Dlatego też BW musi pojawiać się
razem z BB, tak aby warunkowany mógł z wysokim prawdopodobieństwem
przewidywać, że wkrótce po wystąpieniu BW powinien pojawić się także BB.

Dodanie kolejnej zasady do teorii warunkowania jest sporym osiągnięciem jak


na studenta. Jednakże Bescorla na tym nie poprzestawał. Później wraz z innym
psychologiem, Allanem Wagnerem, znacznie wzbogacił teorię uczenia się.

Zgodnie z modelem Bescorli-Wagnera (1972), aby BW był jak najbardziej efektywny,


musi mieć charakter nieoczekiwany. Proces uczenia się zależy bowiem od elementu
zaskoczenia. Jeżeli spodziewamy się BB za każdym razem, gdy widzimy BW, nauczymy
się je kojarzyć, ale ostatecznie siła tego skojarzenia osiągnie kiedyś maksimum.
Początkowo będzie ona bardzo szybko rosnąć, po czym, gdy BW przestanie być czymś
nowym i uznamy go za bardziej przewidywalny, zacznie się stabilizować. Z tego
powodu siła skojarzenia zależy od zaskoczenia i tego, jak „nowy” jest BW.

Konkurencyjne teorie
— dlaczego warunkowanie działa?
W tym momencie na pewno potrafisz już przeprowadzać warunkowanie klasyczne.
Znasz też zasady pomagające zrobić to dobrze (jeżeli nie, wróć do poprzednich części tego
rozdziału). Bez wątpienia warunkowanie jest przydatne. Pozwala nam poznać otoczenie
w sposób pozwalający na większą adaptację i rozszerzenie zakresu naszych możliwości.
Czemujednak w ogóle ono działa? Dlaczego jesteśmy w stanie połączyć nowe bodźce
ze starymi?

Pawłow wierzył, że jednoczesne aktywowanie dwóch specyficznych obszarów


mózgu powoduje powstanie skojarzenia pomiędzy BW i BB. Aktywacja taka była
wynikiem powstania czegoś na kształt położonej pomiędzy dwoma punktami
„ścieżki”, przypominającej przewód telefoniczny łączący dwa niepołączone wcześniej
domy. Gdy wystąpi BW, BB otrzymuje „sygnał” biegnący przez nowe połączenie.

Clark Hull przedstawił alternatywne wyjaśnienie. Sądził bowiem, że skojarzenie


powstaje pomiędzy BW i OB, który zmienia się później w OW. Naukowcy są
najbardziej twórczy, gdy wymyślają teorie konkurujące ze sobą o tytuł idei najlepiej
wyjaśniającej wyniki eksperymentu. Ich pomysłowość jest konieczna do opracowania
kluczowego testu. Holland i Staub postanowili przetestować teorię Hulla. W tym celu
uwarunkowali szczury, korzystając z głośnych dźwięków i drobin żywności.

Zgodnie z założeniem Pawłowa zwierzęta nauczyły się łączyć dźwięk zjedzeniem.


Jednak Holland i Staub przeciwstawili teorię rosyjskiego badacza koncepcji Hulla
— próbowali sprawić, by pożywienie stało się niepożądanym BB. Aby osiągnąć taki efekt,
najpierw wywoływali skojarzenie pomiędzy głośnym dźwiękiem (BW) a jedzeniem (BB).
Następnie kładli szczury na obracającej się płycie gramofonowej w celu wywołania u nich
Rozdział 8: Psy Pawłowa i reszta menażerii 137

nudności. Na koniec ponownie włączali głośny dźwięk — zwierzęta już na niego nie
reagowały. W ten sposób udało się „osłabić” postrzeganą wartość pożywienia poprzez
skojarzenie go z uczuciem nudności.

Pawłow twierdził, że pierwotne połączenie istniało pomiędzy dźwiękiem i żywnością.


Hull uznał jednak, że zmniejszanie wartości BB nie wpłynie na reakcję szczurów, gdyż
kluczowe skojarzenie powstaje pomiędzy hałasem (BW) i jedzeniem (OB). Okazało
się, że nie miał racji. Według Hulla połączenie istniało między hałasem a odruchem
jedzenia. Obracanie szczurów na gramofonie i sprawianie w ten sposób, że pożywienie
stawało się mniej atrakcyjne, nie powinno zdaniem tego naukowca wpłynąć na reakcje
zwierząt. A jednak się mylił. Pomiędzy BW i BB musi istnieć jakieś połączenie, więc
bodźca bezwarunkowego nic można wyeliminować z pętli warunkowania.

Jak na razie teoria Pawłowa wciąż trzyma się mocno!

Nie jest to wyłącznie tradycja, lecz teoria mająca wartość predyktywną. Nie wyczerpuje
jednak tematu uczenia się. W rozdziale 9. znajdziesz inne przykłady, które umożliwią Ci
poznanie nowych informacji na temat nabywania wiedzy.

Badanie kotów Thorndike'a


Do warunkowania instrumentalnego dochodzi we wszystkich dziedzinach życia
— w domu, w pracy i w miejscach publicznych. Rodzice korzystają z nagród (które są
niczym innym jak właśnie warunkowaniem instrumentalnym), aby skłonić dzieci do
odrabiania lekcji lub wykonywania obowiązków domowych.

Oto przykład takiego warunkowania. Każdego miesiąca otrzymuję pensję na swoje


konto. Czy pracodawca płaci mi za to, że siedzę i nic nie robię? Oczywiście, że nie.
Dostaję pieniądze za wykonywanie obowiązków służbowych. Robię coś, coś się dzieje,
a następnie na moje konto wpływa określona suma. Czy pracowałbym, gdybym nie
dostawał za to pieniędzy? Raczej nie, i to z dwóch powodów.

Po pierwsze, znam ciekawsze zajęcia niż wolontariat (bank, który wystawił moją kartę
kredytową, też nie byłby z niego zadowolony). Po drugie, zgodnie z teorią warunkowania
instrumentalnego pracuję, ponieważ otrzymuję za to wynagrodzenie. To, co następuje
po wywiązaniu się z umowy, jest nagrodą, konsekwencją o charakterze pozytywnym.

Kiedy coś robię, na przykład wykonuję powierzone mi obowiązki, ma to swoje


konsekwencje. W przypadku pracy jest nimi zapłata. Co się dzieje później? Cóż,
kontynuuję pracę, co oznacza, że moja pensja ma na mnie wpływ. W pierwszych latach
XX wieku Edward Thorndike stworzył teorię opisującą wpływ konsekwencji na
zachowanie. Jest ona znana jako prawo efektu.

Thorndike postanowił sprawdzić tę teorię poprzez doświadczenia z kotami. Zbudował


w tym celu drewniane pudło z prętami oraz specjalnym mechanizmem do otwierania
drzwi. Następnie umieścił tam głodnego kota. Zamknął drzwi, po czym umieścił
nieco jedzenia na talerzu na zewnątrz pudełka. Pożywienie znajdowało się w polu
widzenia zwierzęcia, ale poza jego zasięgiem. Jedynym sposobem, w jaki kot mógł
dostać się dojedzenia, było otwarcie drzwi.
138 Część III: Myślenie, czucie i działanie

Wiemy, że Thorndike nie miał zamiaru wyręczać zwierzęcia — w końcu prowadził


eksperyment! Musiało ono samodzielnie dojść do tego, jak należy otworzyć drzwi. Nie
wiem, jakie masz doświadczenia, aleja nie przypominam sobie, żebym widział koty
otwierające drzwi. Co więc zrobi zwierzę? Jak postąpi nasz mały, bohaterski kot?
Czy otworzy drzwi i rzuci się najedzenie dotychczas pozostające poza jego zasięgiem,
czy spotka go ponury los w pułapce zbudowanej przez szalonego psychologa?

Tak czy inaczej, kot musiał samodzielnie znaleźć drogę, a Thorndike był cierpliwym
człowiekiem. Czekał i patrzył, patrzył i czekał. Kot chodził po pudełku, wysuwał łapę
przez szczebelki, miauczał, odbijał się od ścian i robił mnóstwo innych rzeczy. Później
stało się jednak coś bardzo ważnego. W pewnym momencie kot przypadkowo nacisnął
dźwignię otwierającą drzwi, które natychmiast stanęły otworem. Zwierzak ruszył jeść,
a potem wszyscy żyli długo i szczęśliwie.

Jakie wnioski wyciągnął Thorndike z tego eksperymentu?

Żadnych. Badanie było bowiem niekompletne.

Dlatego też znowu włożył biednego kota do pudełka. W sumie wszystko było
w porządku. Kot wiedział, że wystarczy nacisnąć dźwignię. Kiedy jednak trafił do
pudełka, zaczął się zachowywać tak, jak gdyby nigdy wcześniej nie otwierał drzwi;
chaotycznie próbował różnych rzeczy.

Nie musisz jednak obawiać się o kota, który ostatecznie przypadkowo otworzył
drzwiczki i dostał się dojedzenia. Thorndike przeprowadził tę próbę jeszcze wiele
razy i dokonał ważnej obserwacji. Czas, jaki zajmowało kotu otwarcie drzwi, był
za każdym razem krótszy. Dlaczego zwierzę działało coraz szybciej? Thorndike
zasugerował, że jedzenie pomogło kotu nauczyć się, iż istnieje związek pomiędzy
naciskaniem dźwigni a wychodzeniem na zewnątrz.

Sformułowane przez Thorndike’a prawo efektu mówi, że reakcja bardziej satysfakcjonująca


dla organizmu (na przykład zwierzęcia lub człowieka) będzie z większym
prawdopodobieństwem kojarzona z sytuacją następującą przed nią. Im większe
zadowolenie, tym silniejsza więź pomiędzy sytuacją i reakcją na nią.

Ogólnie rzecz biorąc, uzyskanie pożywienia pełniło w eksperymencie funkcję


nagrody za wydostanie się z pudełka. Otwarcie drzwi przypominało moją pracę,
a jedzenie stanowiło odpowiednik wypłaty.

Wróćmy do pytania o to, czy wypłata ma na mnie wpływ, czy też nie. Muszę
powiedzieć, że cały czas pracuję tak jak kot Thorndike’a, który próbował otwierać
pudełko, by dostać się dojedzenia. Z tego powodu konsekwencje mojego działania
skłaniają mnie do ponownego podejmowania trudu.

Biegające wzmocnione szczury


Kiedy skutek działania czy zjawiska zwiększa prawdopodobieństwo, że ponownie
wystąpi, konsekwencję taką nazywamy wzmocnieniem. Jest ono czymś w rodzaju
nagrody, a kiedy wiemy, że ją otrzymamy, często robimy coś, by stało się to ponownie.
Rozdział 8: Psy Pawłowa i reszta menażerii 139
Warunkowanie instrumentalne opiera się na wpływie, jaki wzmocnienia mają na
zachowanie.

B.F. Skinner, jeden z najsłynniejszych psychologów behawioralnych, kontynuował pracę


Thorndike’a, podobnie jak on prowadząc badania nad warunkowaniem instrumentalnym
przy wykorzystaniu zwierząt. Stworzył w tym celu pojemnik z umieszczoną w środku
dźwignią, zwany klatką Skinnera. Kiedy zwierzę nacisnęło dźwignię, z karmnika wypadało
do klatki trochę jedzenia. Skinner chciał sprawdzić, czy szczury będą w stanie nauczyć się
odpowiedniego działania w celu uzyskiwania pożywienia.

Zadanie było znacznie trudniejsze, niż mogłoby się wydawać. Szczury nic są bowiem
przyzwyczajone do naciskania dźwigni w celu otrzymywania jedzenia. Skinner musiał nieco
im w tym pomóc. Skorzystał więc z mechanizmu zwanego kształtowaniem, który polega
na nagradzaniu działań zbliżających do osiągnięcia celu. Skinner nagradzał zatem
szczury za działania niebędące oczekiwaną reakcją, ale powodujące zbliżanie się do niej.
Kształtowanie przebiegało stopniowo i w pewnym momencie zwierzęta zaczęły
naciskać dźwignię. Dzięki temu otrzymywały wzmocnienie w postaci jedzenia.

Po pewnym czasie szczury nauczyły się naciskać dźwignię, aby dostać pożywienie,
takjak koty Thorndike’a uruchamiały mechanizm otwierający drzwi. W obu przypadkach
działał zresztą ten sam schemat. Szczury uczyły się, ponieważ nagroda w postaci jedzenia
motywowała je, aby naciskać dźwignię.

Właściwy wzmacniacz
Koty Throndike'a i szczury Skinnera uczyły się, ponieważ otrzymywały w nagrodę coś
dojedzenia. Pożywienie jest bardzo silnym wzmocnieniem dla zwierząt, ale z pewnością
nie jedynym. Każda rzecz zwiększająca prawdopodobieństwo wystąpienia zachowania
może zostać wykorzystana jako wzmocnienie, niezależnie od tego, czy są to pieniądze,
jedzenie, spokój, czy odpoczynek.

Istnieją dwa podstawowe rodzaje wzmocnień:

✓ Pozytywne polega na wykorzystaniu czynnika sprawiającego, że dane zachowanie


wystąpi ponownie.
Negatywne pojawia się wtedy, gdy usunięcie nieprzyjemnego czynnika zwiększa

prawdopodobieństwo powtórzenia zachowania. Dobrym przykładem jest
sytuacja, w której uczeń przeszkadza w prowadzeniu lekcji, aby uniknąć pewnego
obowiązku (na przykład odpowiadania przy tablicy). Nauczyciel każę mu wyjść
za drzwi, wzmacniając tym samym niegrzeczne zachowanie (gdyż uczeń osiąga
swój cel). Według pedagoga wyrzucenie z klasy jest karą, podczas gdy dla ucznia
to skuteczny sposób unikania obowiązków.

Po raz kolejny u podłoża warunkowania instrumentalnego leży założenie, że zachowania


wzmacniane (pozytywnie lub negatywnie) mają większą szansę na powtórne pojawienie
się. Ale czy to dotyczy wszystkich wzmocnień? Czy każde z nich jest tak samo silne?
Czy szczury nauczyłyby się nowej reakcji, gdyby Skinner dawał im pięć dolarów
za każdym razem, gdy naciskały dźwignię?
140 Część III: Myślenie, czucie i działanie

Nie sądzę. Różnice pomiędzy wzmocnieniami istnieją i określają wpływ, jaki mają na nasze
reakcje. Nie wszystkie konsekwencje są traktowane jako istotnie wzmacniające.

Skuteczne są dwa rodzaje wzmocnień pozytywnych:

✓ Wzmocnienia pierwotne są nagrodami niewymagającymi kształtowania ani


wcześniejszego treningu. Przykłady: jedzenie, przyjemne doznania fizyczne. David
Premack w 1971 roku stworzył ciekawą koncepcję, według której aby najłatwiej
określić pierwotne wzmocnienia, wystarczy obserwować czynności, jakie najczęściej
wykonują poszczególni ludzie. Jeżeli ktoś spędza najwięcej czasu na oglądaniu
telewizji, jeździe na rowerze albo spaniu, to te właśnie zajęcia uznamy za
wzmocnienia pierwotne. Zasada Premacka mówi o tym, że bardzo prawdopodobne
reakcje mogą zostać wykorzystane do wzmocnienia reakcji mniej prawdopodobnych.
Przypomina to trochę obiecywanie dziecku lodów, aby zjadło warzywa. Jeżeli
maluch chce zjeść lody (bardzo prawdopodobna reakcja), wcześniej zje warzywa
(mało prawdopodobna reakcja).
Wzmocnienia wtórne nabierają cech wzmocnienia na drodze treningu
i uczenia się. Dzieje się tak dzięki kojarzeniu wtórnego wzmocnienia ze
wzmocnieniem pierwotnym w taki sam sposób jak w przypadku warunkowania
klasycznego (patrz sekcja „Bodźce i odruchy warunkowe” we wcześniejszej
części rozdziału).
Dobrym przykładem takiego warunkowania są finanse. Kiedy się rodzimy, nie
rozumiemy wartości pieniądza (chociaż u niektórych zdaje się to nie zmieniać
do końca życia). W miarę zdobywania doświadczenia uczymy się jednak kojarzyć
ten element z możliwością zdobywania pożądanych rzeczy, takich jak jedzenie,
ubrania, mieszkanie albo luksusowe samochody. Innymi słowy, pieniądze nabierają
dla nas znaczenia poprzez skojarzenie ich z wzmocnieniami pierwotnymi.
W niektórych placówkach, takich jak szkoły i szpitale, opiekunowie nagradzają
pożądane zachowania żetonami, które później można wymienić na jakieś
przedmioty. Takie żetony porównałbym zatem do lokalnej waluty, działającej
w mniejszym lub większym stopniu jak autentyczne pieniądze w gospodarce
wolnorynkowej.

Kiedy już określimy, co ktoś lub coś postrzega jako wzmocnienie, możemy zacząć
wpływać na zachowanie poprzez przyznawanie nagród za pożądane reakcje.

Wyobraź sobie kierowniczkę próbującą zmusić pracowników, aby wracali punktualnie


z przerwy na lunch. Co mogłaby zrobić w tym celu? Na początek musiałaby się
zorientować, co każdy pracownik (lub cała grupa) traktuje jako wzmocnienie. Następnie
powinna zacząć nagradzać każdego, kto wykazuje pożądaną reakcję, czyli w tym przypadku
wraca punktualnie z przerwy. Zachętą byłyby pieniądze, małe podarki lub naklejki
z uśmiechniętą buźką.

Oczywiście kierowniczka mogłaby stosować też wzmocnienia negatywne. Przykładowo


wysyłałaby na lunch osobę znaną z wiecznego narzekania (zwłaszcza na spóźnienia),
aby spóźnialscy byli na tyle zmęczeni jej marudzeniem, że wracaliby do swoich
obowiązków szybciej niż zwykle, czyli punktualnie.
Rozdział 8: Psy Pawłowa i reszta menażerii 141
Wróćmy jednak na chwilę do wzmocnień negatywnych. Wiem, że dla dużej części
ludzi jest to dość myląca koncepcja. W jaki sposób zabieranie czegoś lub usuwanie
niemiłego bodźca może zwiększyć szansę wystąpienia zachowania? Ale czy miałeś kiedyś
szczeniaczka, który piszczał w nocy, nie dając Ci zasnąć? Jeżeli przebywał w innym
pokoju lub w garażu, być może zdarzało się, że szedłeś tam, aby sprawdzić, co się dzieje.
W takiej sytuacji pies przestawał piszczeć, jednak zaczynał ponownie dziesięć minut
później, kiedy już prawie udało Ci się zasnąć.

Problem polega na tym, że to Twoje zachowanie znajduje się pod kontrolą wzmocnienia
negatywnego. Piski szczeniaka są niemiłym (i drażniącym) bodźcem. Kiedy idziesz do psa,
odgłos zanika, co sprawia, że będziesz musiał iść do zwierzaka za każdym razem, gdy
usłyszysz tamten dźwięk. Tak więc Twoje zachowanie (pójście do szczeniaka) jest
warunkowane wzmocnieniem negatywnym, zaś zwierzę zostajc wielokrotnie nagrodzone
wzmocnieniem pozytywnym za to, że piszczy!

Jak stosować kary?


Zarówno pozytywne, jak i negatywne wzmocnienia są skutkami, które mają dużą
szansę zwiększyć częstotliwość występowania zachowań. Istnieje jednak jeszcze jeden
typ konsekwencji, a mianowicie karanie. Kara to skutek zachowania zmniejszający
prawdopodobieństwo jego wystąpienia, nie zaś działanie potocznie traktowane jako kara.
Przykładowo jeżeli osoba, do której dzwonisz, za każdym razem wydaje się rozkojarzona
i odnosisz wrażenie, że Cię nie słucha, może to wywołać u Ciebie nieprzyjemne uczucia.
W efekcie będziesz rzadziej kontaktować się z tym człowiekiem.

Najprostszym rodzajem kary jest wprowadzenie czynnika nieprzyjemnego lub


odrzucającego.

Inny jej typ, kara negatywna, polega na usunięciu czynnika wzmacniającego, czyli na
przykład na odebraniu dziecku roweru. Podobnie jak w przypadku wzmocnień, kary
mogą być traktowane bardzo indywidualnie. Niewykluczone bowiem, że to, co jedna
osoba uważa za uciążliwe bądź karzące, na kimś innym nie zrobi żadnego wrażenia.

Cały czas wykorzystujemy kary, aby wpływać na zachowanie innych ludzi. Rodzice
karzą dzieci. Sądy karzą skazanych przestępców. Banki karzą ludzi za niespłacane
w terminie karty kredytowe. Czy jednak kary są skuteczne?

Kara może być niezwykle skutecznym sposobem ograniczania niepożądanych zachowań.


Należy jednak pamiętać o kilku zasadach:

✓ Kara powinna być jak najmniej intensywna, a jednocześnie musi pozwalać na


wywoływanie pożądanej reakcji. Nie może być również zbyt łagodna, ponieważ
podczas delikatnego zaostrzania jej osoba, w którą zostanie wymierzona,
zacznie się na nią uodparniać. Podobnie problematyczna jest kara intensywna.
Aby więc ta metoda była skuteczna przez dłuższy czas, należy stopniowo zwiększać
jej siłę, dostosowując ją do zachowania.
✓ Skuteczna kara musi nastąpić jak najszybciej po pojawieniu się niepożądanej reakcji.
Jeżeli poczekam trzy tygodnie, zanim ukarzę swoje dzieci za rozbicie lampy,
nie będą miały pojęcia, za co ponoszą konsekwencje. Wówczas moje działanie
nie przyniesie żadnego skutku.
2 Część III: Myślenie, czucie i działanie
13

✓ Kara powinna być również zdecydowana, stała i musi towarzyszyć jej wyjaśnienie,
dlaczego z niej korzystamy.

Każdy akt kary wiąże się z wieloma problemami natury etycznej. Dlatego też tę metodę
zawsze należy stosować ostrożnie.

Oczywiście wiele osób zadowala się stosowaniem kary cielesnej, polegającej na zadawaniu
bólu w celu zmiany zachowania. Takie działanie może jednak mieć kilka negatywnych
następstw:

✓ Lęk. Kiedy jesteśmy skutecznie karani, niekiedy wykształca się u nas zdolność
przewidywania przyszłej kary. Wówczas ze strachem oczekujemy jej nastąpienia.
To zaś może nam poważnie zaszkodzić — czasami prowadzi do apatii oraz
unikania innych ludzi.
✓ Agresja. Gdy pracowałem w aresztach oraz więzieniach, widziałem, jak ciężkie
warunki życia w zamknięciu sprawiają, że ludzie stają się coraz bardziej zagniewani,
coraz bardziej agresywni i coraz bardziej lękliwi. Kiedy więc wychodzą na wolność,
często są tak wypaczeni i przystosowani do przebywania tylko w zakładzie
karnym, że nie potrafią już skutecznie funkcjonować w świecie zewnętrznym.

Osoba wymierzająca karę może stać się unikanym (awersyjnym) BW. Przykładowo
dziecko będzie unikać rodzica, przez którego jest często karane. Wynika to z zasady
współwystępowania. Otóż dziecko zaczyna zauważać, że jest karane, kiedy w pobliżu
pojawia się dany rodzic. Sam pamiętam, jak mama groziła mi: „Poczekaj tylko, aż ojciec
wróci do domu!”.

Zarządzanie Wzmocnieniem
Czy kiedykolwiek zastanawiałeś się, dlaczego ludzie wracają do miejsc w rodzaju
Las Vegas czy Atlantic City, aby przekazać nieco swoich pieniędzy na fundusz rozwoju
kasyn? Ogólna zasada hazardu brzmi: największym wygranym jest zawsze kasyno.
Mimo to ludzie wciąż grają.

Dlaczego więc wracamy w pewne miejsca? Otóż kluczowe jest w tym przypadku zjawisko
zwane strategią wzmocnień, która pozwala określić, jakie reakcje powinny zostać
wzmocnione i kiedy należy je wzmacniać. Istnieją cztery główne strategie, z których
każda ma inne cechy:

✓ stała częstotliwość,

zmienna częstotliwość,
✓ stale opóźnienie,

zmienne opóźnienie.
Rozdział 8: Psy Pawłowa i reszta menażerii 143
Stałe nagrody
Najpopularniejszą formą wzmocnienia jest wzmocnienie ciągle, które polega na nagradzaniu
zachowania za każdym razem, kiedy ono nastąpi. Gdy tylko pociągnę za dźwignię
jednorękiego bandyty, wygrywam. A przynajmniej chciałbym!

Wzmocnienie ciągłe jest skuteczne w fazie kształtowania zachowania (patrz sekcja


„Biegające wzmocnione szczury" we wcześniejszej części rozdziału), czyli tego etapu
nabywania wiedzy, który nosi także nazwę fazyprzyswajania. Za każdym razem,
gdy uczę się nowego zachowania, potrzebuję na to czasu.

Niestety, takie wzmocnienie ma jedną wadę, a mianowicie bardzo szybko wygasa.


Jeżeli szef nagradza daną osobę za każdym razem, gdy przychodzi ona punktualnie
do pracy, to gdy tylko przestanie stosować tego rodzaju zachęty, ta zacznie się spóźniać.

Sporadyczne poklepywanie po plecach


Większość spotykanych wzmocnień występuje jednak sporadycznie i nieregularnie.
W końcu nie wygrywamy za każdym razem, gdy gramy w jednorękiego bandytę. B.F.
Skinner nie opracowywał takich maszyn.

Zrobił to jednak B.A. Loser, psycholog zajmujący się zachowaniem hazardzistów.


Mniej częste wzmocnienia tworzą wzmocnienie częściowe, które występuje w dwóch
odmianach, różniących się tym, jak bardzo przewidywalne są poszczególne wzmocnienia.

✓ Pierwszy rodzaj wzmocnień częściowych wyznacza strategia częstotliwości. Polega


ona na tym, że wzmocnienie pojawia się po wystąpieniu określonej liczby
pożądanych zachowań. Jeżeli rodzic chce zastosować tę strategię, może
przyznawać dziecku nagrody po uzyskaniu przez nie ustalonej liczby piątek
lub po określonej liczbie razy, kiedy dziecko posprząta swój pokój. Strategie
częstotliwości różnią się też w zależności od tego, czy nagrody pojawiają się po stałej,
czy zmiennej liczbie zachowań.
• Strategia stałej częstotliwości polega na tym, że nagroda pojawia się zawsze po tej
samej liczbie zachowań. Kiedy zdecyduję się więc nagradzać swoje dziecko za
każde dwie kolejne piątki, moje zachowanie nie zmienia się i nagradzam
pociechę za każdym razem, gdy dostanie dwie piątki.
• Strategia zmiennej częstotliwości wzmocnień zakłada przyznawanie nagród po
zróżnicowanej liczbie reakcji. Na przykład mogę nagrodzić dziecko, gdy
dostanie dwie piątki, ale następnym razem zrobię to, kiedy uzyska jedną,
trzy lub dopiero dziesięć takich ocen. Kluczem do sukcesu jest utrzymywanie
nagradzanego w niepewności. Podejście to doskonale pomaga zachować ciągłość
działania. Nagradzany nie wie bowiem, kiedy pojawi się kolejne wzmocnienie.
Z tego powodu zachowanie jest znacznie mniej zagrożone wygaśnięciem niż
w przypadku stosowania wzmocnienia ciągłego.

✓ Innym rodzajem częściowego wzmocnienia jest strategia opóźnienia, uzależniona


od tego, jak dużo czasu upływa pomiędzy poszczególnymi wzmocnieniami.

• Co miesiąc otrzymuję pieniądze. Moje zarobki są więc uzależnione od czasu.


Wypłata jest w tym przypadku przykładem strategii stałego opóźnienia
wzmocnień. Odstępy czasowe nie zmieniają się.
144 Część III: Myślenie, czucie i działanie

• Drugim typem strategii opóźnienia jest strategia zmiennego opóźnienia. Polega


ona na tym, że reakcje są wzmacniane w różnych okresach czasu. Przykładem
takiej sytuacji może być otrzymywanie jednej wypłaty po miesiącu, następnej
po dwóch dniach, kolejnej trzy tygodnie później itd. Taka strategia jest
niezwykle odporna na wygasanie z tego samego powodu, co strategia zmiennej
częstotliwości. Nagradzany nigdy nic wie, kiedy nastąpi wzmocnienie,
więc musi kontynuować działanie, aby się tego dowiedzieć.

Wzmocnienia o zmiennym opóźnieniu stanowią podstawę hazardu. Kasyna programują


swoje maszyny w taki sposób, by wypłacały wygrane w zmiennych interwałach. W efekcie
gracze przez długi czas wrzucają do nich monety, licząc na wielką sumę.

Nie można bowiem wygrać, jeżeli się nic gra. Tak więc gdy następnym razem stwierdzisz,
że musi Ci się poszczęścić, bo siedzisz przy tej samej maszynie od trzech dni (bez
kąpieli, snu i jedzenia), przypomnij sobie, co napisałem. Nigdy nic wiesz, kiedy automat
pozwoli wygrać. Nie denerwuj się też, gdy w końcu przerwiesz grę, a następna osoba
uzyska wielką sumę po jednej próbie.

Na tym w końcu polega hazard.

Moment, w którym pojawia się wzmocnienie, odgrywa bardzo istotną rolę. Badania
wykazały, że musi do niego dojść natychmiast albo w krótkim czasie po wystąpieniu
pożądanego działania. Jeżeli przerwa będzie zbyt długa, więź pomiędzy bodźcem
a reakcją zostanie utracona. Szczury Skinnera nigdy nic nauczyłyby się naciskania
dźwigni, gdyby zamiast natychmiastowo dostarczanej porcji pożywienia dostawały
bony do zrealizowania w szczurzych delikatesach.

Generalizacja pomaga
uniknąć mandatów
Czy widziałeś kiedyś kierowców zwalniających, gdy tylko zauważą policyjny patrol
drogówki? Prawdopodobnie dzieje się tak, ponieważ większość z nich dostała kiedyś
mandat. Co się zaś dzieje, gdy przy drodze stoją oddziały prewencji? Nic. Wszyscy je
ignorują. Czy to oznaka rażącego braku szacunku dla prawa? Nie. To przykład
kontroli bodźców, polegającej na tym, że reakcja może różnić się w zależności od tego,
jaki bodziec towarzyszył wzmocnieniu lub karze. Choć wszyscy policjanci mają prawo
wystawiać mandaty za zbyt szybką jazdę, większość z nas wie, żc oddziały prewencji
na ogół nie zatrzymują samochodów na szosach. Bodziec ma zatem zróżnicowany
wpływ na zachowanie ze względu na rozmaite konsekwencje. Wymierzenia kary
można bowiem spodziewać się wyłącznie po drogówce.

Gdy nauczymy się reakcji dzięki wzmocnieniu, możemy czasami automatycznie


ćją na inne rodzaje bodźców. Jeżeli rozszerzyłbym swoje doświadczenia
zgeneralizowa
z drogówką na wszystkich policjantów, zwalniałbym za każdym razem, gdy
widziałbym radiowóz. Albo gdy otrzymywałbym wzmocnienia po punktualnym
powrocie z przerwy, mógłbym zgeneralizować to zachowanie na punktualne
przychodzenie do pracy. Takie działanie pomaga przyspieszyć proces uczenia się.
Na ogół bowiem nie mamy czasu otrzymywać wzmocnienia za każde zachowanie.
Rozdział 8: Psy Pawłowa i reszta menażerii 145

Dyskryminacja
Czasami nadmiernie rozszerzamy wyuczone reakcje czy zachowania i stosujemy je
w sytuacjach, w których nie jest to potrzebne.

Oto skutek przesadnej generalizacji. Nadmierne rozszerzanie zdarza się także


psychoterapeutom. Kiedy specjalista w sytuacji towarzyskiej słyszy, że jakaś osoba
zaczyna opowiadać o problemach, jakie miała danego dnia, z jego ust wyrywa się
automatycznie: „Powiedz mi, jak się z tym czujesz?”. Taki psychoterapeuta jest
postrzegany jako świr. Z pewnością przydałby mu się urlop.

Zjawisko to często można zaobserwować w filmach. Były policjant, zobaczywszy


wnuka celującego do niego z pistoletu na wodę, strzela, by „wyeliminować zagrożenie”.
Mamy tu do czynienia z dyskryminacją polegającą na reagowaniu wyłącznie na jeden
z dwóch lub większej liczby specyficznych bodźców. Problem ten rozwiązuje się poprzez
zaprezentowanie obu bodźców i uwarunkowanie odpowiedzi na właściwy. Możemy
zasymulować sytuację napadu i wprowadzić do niej wnuczka z pistoletem na wodę.
Następnie nagrodzimy emerytowanego policjanta za wyeliminowanie przestępcy
(bodziec 1.), a nie dziecka (bodziec 2.). W ten sposób można nauczyć się odróżniania
prawdziwego niebezpieczeństwa od fikcyjnego zagrożenia.

You might also like