Klein Kap 5

Rikke Laursen Kognitionspsykologi Aarhus universitet
Klein (2019) – Kapitel 5
Abstract
Dette kapitel omhandler forholdet mellem adfærd og belønning. Kapitlet redegør indledningsvist for
centrale begreber som instrumental- og operant betingning, samt belønning (eng: reinforcement),
herunder en række underkategorier (primær-, sekundær-, positiv- og negativ belønning). Dernæst
sættes læseren ind i forskellige måder at belønne på (schedule of reinforcement), hvor tid og
tidsintervaller er omdrejningspunktet. Teksten fremhæver herefter undersøgelser som viser, at vi
præsterer bedre, hvis vores belønning øges ift. udgangspunktet, sammenlignet med hvis vi havde
modtaget den samme belønning fra start. Modsat præsterer vi dårligere, hvis belønningen reduceres
ift. Udgangspunktet. Derfor har belønningens størrelse også en betydning. Modificering af adfærd
er det sidste emne kapitlet redegør for. Ifølge teksten er belønning og ikke-belønning nemlig også et
vigtigt redskab i at ændre folks adfærd.
Begreber
Definition af reinforcement:
(skinner) En begivenhed er forstærkende/belønnende (eng: reinforcement) hvis den øger
sandsynligheden for, at den adfærd som gik forud for begivenheden, gentages.

Instrumental betingning:
Når omgivelserne indeholder en mulighed for en belønning. F.eks. Et barn får en belønning hver
gang det laver lektier. Barnets eneste mulighed for at få belønningen er ved at lave lektier.

Operant betingning:
Der er ingen begrænsning for den mængde belønning en person eller et dyr kan opnå. En organisme
er selv i kontrol over hyppigheden af respons, og derfor bestemmer det også mængden af belønning.
F.eks. sociale medier (stimuli) – vi kan selv tilgå det, og derfor også selv bestemme hvor meget vi
bruger det (og får belønning).
1
Resume
Dette kapitel kommer omkring en række forskellige begreber, undersøgelser og metoder som har
det tilfælles, at de omhandler belønning i relation til adfærd.
belønning
Skinner mener ikke, at stimuli fra omgivelserne faciliterer operent respondering, det giver blot
anledning til operant adfærd, ved at forelægge for individet at belønning er tilgængelig. I
forlængelse af dette fremsatte Skinner 2 former for belønning:
En primær belønning: Har instinktiv belønnende egenskaber. F.eks. mad.
Sekundær belønning: har udviklet sine belønnende egenskaber gennem dets association til primær
belønning. F.eks. penge

Skinner skelner yderligere mellem en positiv belønning og en negativ belønning:

Positiv belønning: Er en positiv belønning, som er tilføjet miljøet, som øger hyppigheden af den
adfærd som producerede den. F.eks. penge.
Negativ belønning:
Når man fjerner en ubehagelig stimulus. Dette kan også virke forstærkende. Bemærk at negativ
belønning og straf ikke er det samme. Straf vil undertrykke den adfærd som har forårsaget den.
Negativ belønning sker når en adfærd fjerner et ubehageligt event.
Teksten bruger følgende eksempel: En lærer står over en elev og kigger på, at eleven
laver en opgave færdig. Eleven opfatter lærerens tilstedeværelse som ubehagelig, og
skynder sig derfor med at blive færdig med opgaven -> eleven fjerner en behagelig
stimulus, dette kan virke belønnende.

2
Shaping:
Skinner udviklede en procedure som han kaldte shaping (eller successive approximation
procedure). Formålet med shaping er at øge hyppigheden i, at en operant betinget adfærd læres. Den
elementære tankegang bag shaping er, at adfærd ikke kun belønnes når et individ udviser den
ønskede adfærd, men også når individets adfærd, ved en tilfældighed, nærmer sig den ønskede
m.a.o. belønnes succesfulde tilnærmelser.

I et eksperiment ønskede nogle forskere at lære en rotte, at den blev belønnet, når den trykkede på
en knap, som udløste mad. For at lære rotten om den operant-betingede adfærd, brugte de shaping.
De delte den succesfulde adfærd op i steps. Første step var at få rotten til at spise det mad, som
allerede lå i lugen. Det næste step var at få rotten til at bevæge sig væk fra lugen. Enhver bevægelse
væk blev belønnet. Forskerne ønskede nu at få rotten til at trykke på den knap, som udløser maden.
Når rotten trykkede på knappen, blev den igen belønnet. Efterhånden om rottens succesfulde
sekvenser blev repeteret lærte rotten hele den ønskede adfærd.
Schedule of reinforcement
Skinner indførte fænomenet ’Tidsplan for belønning (eng: schdule of reinforcement)’. Dette
betyder, at vi ikke kun skal lære hvordan vi skal handle, for at opnå en belønning, men også hvor
ofte og/eller hvornår vi skal handle.
Belønning kan programmeres ved brug af 2 metoder:
1. Ratio schedule of reinforcement: Adfærd hvor der skal x antal af tilfælde respons til, for at
producere en belønning.
2. Interval schedule of reinforcement: Adfærd hvor en belønning afhænger af tid. Dette kan
være tidsintervaller hvor belønning bliver hhv. tilgængelig og utilgængelig – f.eks.
afhængigt af hvornår sidste belønning blev opnået.
3
Ratio schedule of reinforcement og Interval schedule of reinforcement opdeles yderligere I ‘fixed’

og ‘variable’:
Fixed-ratio schedules (FR)

A fixed-ratio (FR) tidsplan er et konstant nummer af tilfælde responser nødvendige for at producere
belønning. FR-2 betyder f.eks. at en belønning gives efter en 2x respons. FR-10 betyder at
belønning gives efter 10 respons osv. Jf. tidligere eksempel skal rotten altså trykke på knappen 10
gange for at få en belønning.
Denne form for belønning er også karakteriseret ved, at en belønning er efterfulgt af en pause.
Pausen efter en belønning kaldes postreinforcement pause. Efter pausen kræver en ny belønning
fortsat den rate der er sat – f.eks. FR-10. Jo højere FR-nummeret er, desto længere er den
efterfølgende pause. Hvis det tager rotten 50 tryk om en belønning, så vil pausen naturligt nok være
længere, end hvis ét tryk havde udløst en belønning.

Variable-ratio schedules (VR)
Dette er et gennemsnit af et tilfældigt udvalgt antal respons, som producerer en belønning. Antallet
af respons varierer således. Hvis et eksperiment har VR-20, så skal rotten i gennemsnit trykke på
knappen 20 gange for at opnå belønning. Første belønning kræver måske 10 tryk, mens den næste
kræver 30. Ligesom FR producerer VR tidsplan en konsistent responsrate, denne er ofte høj - dette
kan være med til at forklare, hvorfor nogle gambler.
Fixed-interval (FI)
Denne form for belønning er lidt mere kompliceret at forstå. En belønning afhænger her både af
mængden af tid, der er gået, og af en korrekt udvist adfærd. En belønning er kun tilgængelig efter
en specificeret periode af tid og den første tilfældige respons udvist efter intervallet er gået, bliver
belønnet. Herefter stopper responsen.
Et eksempel på dette er når en person venter på, at en kage skal sætte sig. Først når
tidsintervallet er gået, og husblas har sat ind, og kagen er sat, kommer belønningen.
Efter personen har taget kagen ud, stopper vedkommende med at respondere (han/hun
venter ikke længere på at kagen, og dermed heller ikke en belønning i forlængelse
heraf).

4
Variable-interval (VI)
Dette er en tidsplan, hvor der går en gennemsnitlig mængde tid mellem, at en forstrækning er
tilgængelig. Dog varierer hvert interval i længde.
Eksempel: et gennemsnitligt interval er 2 min = VI-2. Det betyder at rotten én gang skal vente 1
minut for at opnå belønning, mens det næste gang skal vente 3 minutter.
VI er karakteriseret ved at have en stabil respons rate. Længden på VI påvirker responsraten. Jo
længere det gennemsnitlige interval er mellem belønningerne, jo lavere er respons-raten. Der er
ingen pause efter belønningerne.
Styrken af betingning
2 faktorer, som spiller en vigtig rolle, i at bestemme styrken af en betingning (operant eller
instrumental) er:
 Jo længere tid der går før vi får belønningen, desto svagere bliver vores læring af den adfærd
som producerede belønningen. f.eks. Hvis rotten først får maden flere minutter efter den har
trykket på knappen, går der længere tid før den gør det igen.
 Jo større en belønning er, desto hurtigere lærer vi.

Mærkværdige fund
En undersøgelse viste, at hvis man ændrede belønningen under et forsøg - enten fra højt til lav, eller
fra lav til høj - så ændrede dyrenes adfærd sig også. De dyr som faldt i belønning, præsterede nu
dårligere, endda dårligere end dem som hele tiden havde fået en lav belønning. Det samme mønster
gjorde sig gældende omvendt.

Depression effect (kaldes også negative contrast)
Det faktum, at vi præsterer dårligere, end vi ellers ville have gjort for samme belønning, hvis vores
belønning bliver mindre.

Elation effect (kaldes også positive contrast)
Hvis vores belønning omvendt går fra at være lav til at være høj, så vil vi præstere bedre end vi
ellers havde gjort, hvis vi hele tiden havde modtaget en høj belønning.

5
Contingency mangement:
Skinner mente, at man, ved omarrangering af belønning og ikke-belønning, kunne påvirke folks
adfærd i en mere hensigtsmæssig retning.
Dette består af 3 stadier:

1. evaluering
2. beredskabsplan (eng: Contingency contracting)
3. implementering

Evaluering:
I dette stadie identificeres problemet og de situationer hvori det opstår. Subjektiv rapportering kan
ikke stå alene her, familie og venner er derfor en vigtig del af dette stadie. Direkte observationer er
også nødvendige. Dette er til for at identificere hvilken form for belønning eller ikke-belønning der
gives på nuværende tidspunkt.

Beredskabsplan:
i denne fase fastlægges hvordan den ønskede respons ser ud. Dette involverer at der skal træffes en
beslutning om hvornår en belønning skal gives, for at opnå den ønskede respons. Fordi en
adfærdsændring som ofte skyldes en tidligere upassende instrumental- eller operant adfærd, som
tidligere har været belønnet, så skal man i denne fase også udvise en afvisning af den tidligere
adfærd.
Det behøver ikke at være autoriteter som belønner den person som skal ændre adfærd, man kan
også facilitere selv-pålagt belønning, hvor man selv belønner sig selv, efter en handling i den rigtige
retning.

Implementation of the contingency mangement program:
Adfærden skal implementeres i hverdagen. En undersøgelse viste at passende respons blev øget og
udvist oftere som resultat af dette program. Disse programmer har vist sig at være særdeles
effektive.
6
Kritiske overvejelser
Artiklen ser en adfærdsændring om én isoleret faktor, som man kan påvirke og regulere, kun ved
brug af belønning. Det er en stor simplificering af adfærd. Artiklen tager ikke højde for sociale- og
personlighedsmæssige faktorer, som kan lægge til grund for en givent adfærd. Det vil derfor,
formentligt, være svært at ændre en adfærd alene ud fra belønning. For at forstå hvorfor et individ
handler som det gør, og derved forstå hvordan adfærden kan ændres, vil det med overvejende
sandsynlighed være væsentligt at analysere den uønskede adfærd ud fra flere perspektiver og med
flere faktorer i betragtning (f.eks. personlighed, historik med adfærdsændring osv.).
Perspektivering
Skinners metode, i at ændre på folk adfærd, ved brug af belønning og ikke-belønning tager
udgangspunkt i, at vores adfærd er bevidst – eller nærmere bestemt, noget vi kan identificere at vi
gør. Ifølge Wood (2007) kan vaner aktiveres direkte af cues i det eksterne miljø, uden vi
nødvendigvis er bevidste om det. Når vi gentagne gange associerer 2 ting med hinanden, så vil det
indkodes som mentale repræsentationer, som aktiveres, når vi møder en kontekst, som indeholder
begge elementer. F.eks. vil vi, når vi sætter os ind i en bil, automatisk tage sele på, fordi konteksten
’jeg sidder i en bil’ aktiverer den mentale association om at tage sele på. Handlingen sker ofte uden
at vi bemærker det. Wood (2007) hævder at vaner indeholder automatisk indlært viden, som
aktiveres, uden at der sker en bevidst mediering af vores mål og adfærd – derfor stemmer vores
adfærd ikke altid overens med vores mål. Fordi adfærd i nogle tilfælde aktiveres med begrænset
tankevirksomhed (og bevidsthed), så kan det være svært identificere jf. Skinners metode.
Spørgsmål
1. Hvad er forskellen på operant- og instrumental betingning?
2. Hvad er shaping?
3. Kom på et konkret eksempel på hvordan Skinners Contingency mangement fungerer i praksis.

Klein Kap 5

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Klein Kap 5

Uploaded by

Copyright:

Available Formats

Rikke Laursen Kognitionspsykologi Aarhus universitet

Klein (2019) – Kapitel 5

Ratio schedule of reinforcement og Interval schedule of reinforcement opdeles yderligere I ‘fixed’

Fixed-ratio schedules (FR)

Dette består af 3 stadier:

You might also like