You are on page 1of 4

- presentació

- explicar la teoria
- explicar un cas pràctic

El condicionament operant és un procés d'aprenentatge en el qual s'utilitzen


recompenses o càstigs per canviar el comportament. Es basa en la idea que
les accions que són recompensades o reforçades tenen més probabilitats de
repetir-se, mentre que les accions que són castigades tenen més probabilitats
de ser infreqüents.

El primer en investigar el condicionament operant va ser el psicòleg americà


Edward. L. Thorndike, amb el seu experiment dels gats. Consistia en posar
un gat dins d’una gàbia i posar-li menjar al davant de manera que els barrots
quedessin entremig dels dos. Al principi els gats feien coses de gats com
olorar, intentar apropar el menjar traient la pota per la gàbia… fins que
descobrien que si aixecaven una palanca la gàbia s’obria i podien sortir a
menjar. Cada cop els gats ho feien millor i sense pensar, fins que ho van
començar a fer fins i tot quan no hi havia menjar a fora. I d’aquesta van
aprendre com obrir la gàbia.

Amb aquest experiment, Thorndike va establir una relació entre la resposta i


l’estímul. Si l’estímul seguit d’una resposta és agradable, l’individu relacionarà
la resposta amb l’estímul i generarà la resposta en pròximes situacions
esperant l’estímul. D’aquesta manera, quan aquesta resposta estigui
integrada, es produirà encara que l'estímul no hi sigui al final. Paralel·lament,
amb un estímul desagradable, la resposta tendeix a repetir-se menys fins que
s’erradica. Per exemple, si a fora de la gàbia hi hagués una superfície
d’aigua, el gat deixaria d’obrir la porta, i quan estigui acostumat deixaria de
fer-ho fins i tot quan no hi hagi res a fora.

Thorndike també va establir tres lleis de l’aprenentatge a partir d’aquest


experiment:
1. llei de l’efecte, si la conseqüència d’una acció és positiva és més
probable que l’acció es repeteixi i s’aprengui.
2. llei de la disposició, segons aquesta llei, no es pot aprendre res fins
que no es vol.
3. llei de l’exercici, relacionada amb la llei de l’ús i el desús, on allò que
es deixa de fer s’oblida i allò que es fa constantment s’adquireix com a
coneixement nou.

per exemple, el gat sap que si obre la porta de la gàbia podrà menjar, llei
l’efecte, això el motiva a voler obrir-la, llei de la disposició, i finalment intenta
obrir-la fins que ho aconsegueix. Al final és un cicle, ja que el gat ja ha
experimentat la conseqüència i això fa que estigui més disposat a repetir la
conducta, així, cada cop està més motivat i repeteix l’acció més cops i acaba
aprenent a fer-ho.

L’altre gran autor del condicionalisme operant és el psicòleg americà Frederic


Skinner que explica els seus coneixements al seu llibre de 1938 "la conducta
dels organismes". En el llibre, apart de confirmar els coneixements de
Thorndike, també afegeix que hi ha dos tipus diferents de reforços:
1. reforç primari: té importància biològica per l’aprenent, per exemple en
el cas del gat, el menjar.
2. reforç secundari: és el que ajuda a aconseguir el reforç primari, per
exemple, un reforç secundari poden ser els diners, que són necessaris
per poder menjar, viure i subsistir.

Un experiment important que fa fer Skinner és el de la caixa on hi ha una


palanca i una rata, si la rata apreta la palanca se li dona menjar, això fa que
l’apreti més. El mateix experiment es va fer també amb coloms i es va obtenir
el mateix resultat.

Ara explico els quatre procediments que hi ha al condicionament: el reforç


positiu, el negatiu, entrenament d’omissió i el càstig.

El reforç positiu ajuda a que la resposta es repeteixi més, segons la dimensió


del reforç, el temps que hi ha entre aquest i la resposta i segons la disposició
de l’aprenent la resposta es repetirà més o menys. Per exemple, si en
l’experiment de la rata l’animal rep més menjar depenenT de la força amb
què apreta la palanca, l’apretarà més fort. Però si entre que apreta la palanca
i rep menjar passa molt de temps l’apretarà amb menys freqüència. I si ja
l’ha apretat molt i ja està plena no ho tornarà a fer ja que no estarà motivada
o disposada.

Després hi ha el reforç negatiu, que ve a ser el contrari. En aquest cas hi ha


dos tipus de condicionament, el de fugida i el d’evitació. En el primer
l’aprenent ha de generar una resposta per aturar l’estímul, per exemple, si en
l’experiment de la caixa de Skinner es posa un soroll desagradable fins que la
rata deixi de menjar, la rata associarà el soroll amb el fet que ja ha menjat
molt. L’altre tipus és el condicionament d’evitació, en què l'aprenent ha de
generar una resposta per tal que l’estímul no es repeteixi, en el cas de la rata,
en una altra situació, si la rata no s’acaba el menjar que rep apretant la
palanca comença a sonar el soroll, la rata sabrà que la pròxima vegada
s’haurà de menjar tot o sinó hi tornarà a haver el soroll.

El tercer tipus és el càstig negatiu o l’entrenament d’omissió, en què s’aplica


un estímul per evitar que una conducta es repeteixi, per exemple una persona
que ha comès un delicte paga una multa o va a la presò i així aprèn a no
tornar-ho a fer.

Finalment, hi ha el càstig, que es tracta de penalitzar una conducta


indesitjada amb un estímul indesitjat. L’exemple més fàcil és quan algú renya
a algú altre. La part dolenta del càstig és que només fa que s’eviti la conducta
o resposta indesitjada, però no ajuda a adquirir una conducta positiva. Hi ha
diferents variables que fan que un càstig sigui més o menys efectiu:
1. intensitat, com més intens és el càstig, més se suprimeix la conducta,
2. moment d’aplicació: un càstig que es posa immediatament després de
la conducta negativa és més efectiu
3. constància, si es deixa de castigar una conducta, aquesta té
possibilitats de repetir-se

Per exemple, si una persona va a la presò durant 10 anys, hi ha menys


probabilitat que deliqueixi de nou que si hi va per 5 anys. Però si passa molt
de temps entre el delicte i la presò, el criminal potser no relaciona el delicte
amb la presò. Igualment que si se’l fa pagar una multa una vegada si i una
vegada no, la vegada no es cobra la persona pensa que ja no tornarà a ser
castigada i molt probablement tornarà a repetir la conducta indesitjada.

Un altre aspecte important a tenir en compte són els programes de reforç, és


a dir com la forma d’aplicar el reforç afecta al manteniment de la conducta
adquirida mitjançant el condicionament. Els programes de reforç es divideixen
en dos depenent de si el reforç
És important per al camp de l'aprenentatge perquè ofereix una oportunitat per
comprendre l'adquisició i el manteniment d’informació, costums i accions. El
condicionament operant s'utilitza en l'educació i la criança per donar forma a
l'aprenentatge i el desenvolupament de les persones, recompensant el
comportament desitjat i descoratjant el comportament no desitjat amb càstig.
L'ús de reforços i càstigs es fa servir com una eina per configurar i modificar
el comportament.

per exemple, ensenyar a un dofí a fer un truc. En aquesta situació, el dofí rep
un reforç positiu quan salta amb èxit i rep un peix com a recompensa. En
reforçar el comportament desitjat, aquesta tècnica de reforç fa que sigui més
probable que el dofí repeteixi l'acció en el futur. Hi ha situacions on el reforç
es deixa de fer, és a dir es deixen de recompensar totes les bones conductes,
això fa que la persona o animal en aquest cas a qui s’aplica el
condicionament repeteixi la bona conducta degut a la desesperació i
frustració que comporta no rebre recompensa.

Un cas més proper a nosaltres seria el d’un estudiant estudia per a un


examen (comportament) i obté una bona qualificació (reforçament positiu),
és més probable que estudiï novament en el futur. D'altra banda, si un
estudiant no estudia per a un examen i rep una mala qualificació (càstig
positiu), és menys probable que eviti estudiar en el futur.

You might also like