You are on page 1of 23
Condicionamiento operante Las primeras investigaciones de Thorndite El conilicionamiena operate de Skinner La ley hisica del condicionamiemo de Skinner Condiciones imporninses para ef condicioneamiento operante eQué conductas pueden ser reforzadas Comparacién entre el condicionaniento clésice y ef condicionamienio operante Cont Nanuniieca de ios reforzadores Reforsadores primarios y secundarios Reforsamiento positive y refer Le diversidadl de consecuencias que los seres humanos encuentran reforzantes Factores que influyen sobre ta eficacia del reforzamiento Exquemas de reforzamiento Esguemas de proporcién: reforzar cierto rtimero de respuestas Esquemas de iniervato: reforzar la primera respuesta que se da tres un p enciales: refor ptos hasicos del condicionamiento operate samiento negative reriodo de tiempo Esguemas di Control del estinulo Generalizacidn del estimulo Discriminacién del estimulo Conivol del estimulo en ef aula Perspectivas contepordneas del condicionamien 1 ritmos de respuesta operant Eliminaciin de las conductas indeseables Extincidn de resy tay Presentacién de consecuencias deseables de manera no congruente El reforzamiiento de otras conductas El reforzamiento de conductas incomparibles Cuando ef reforsamienio no funciona Skinner y te educacin Resumen Cache persona buses una e compensa diferente. Cuando mi hijo Algjandry era un nifio y nece- sitaba dinero para comprar un capricho, hacia cosas ini aginables como. por ejemplo, cortar ¢! © limpiar fa bailera, Por ef contrario, los incentives econdmices apenas antmaban a mi hi spe jo def? a realizar tareas domésticas, wungue limpiabs y ordenabs con una rapide asombrosa esa 60 APRENDIZAJE HUMANO zona catasttéfica que él denominaba dormitorio, si eso le permitia invitar @ algin amigo @ pasar la noche, La convicctén de que las recompensas influyen sobre la conducta ha formado parte del pensa- miento de Jos psicélogos durante mas de 100 afios, y ha alcanzado um hugar destacaclo en las teorias conductistas del aprendizaje. En este capitulo examinaremos el trabajo de ios conduetistas, Edward Thorndike y B. F, Skinner, quienes destacaron la importancia de las recompensas (que Skinner deno- minaba reforzadores) en cl aprendizaje, Nos ocuparemos fundamentalmente del modelo de aprendiza- Je propuesto por Skinner, que él denominaba condicionamiento operame, Al comentar su trabajo, cO- menzaremos analizando los aspeetos basicos del condicionamiento operante, y veremos en qué se diferencia del modeio de condicionamiento clasico que hemos estudiado en el capitulo 3, A continua cidn, examinaremos algunos conceptos bisicos para comprender ef condicionamiento operante, tales como la extincién, ef modelado, el refuerze positive y et negative, y el refterzo continuo y el intermi- tente. Cuando revisemos el tema del control del estimulo, descubritemos que, aunque los reforzadores son estimulos que siguen a jas respuestas, los estimulos que las preceden también pueden influir, Hacia al final del capitulo. discutiremos en qué medida las perspectivas actuales del condicionamiento cli co difieren de las ideas de Skinner. A fo lango de todo este capitulo extraeremos constantemente est: tegias interesantes para la prictica educativa, si bien dejaremos el estudio sistematico de las implica ciones educativas de este modelo pars el capitulo 5, donde les prestaremos una atencién completa. LAS PRIMERAS INVESTIGACIONES DE THORNDIKE n 1898, Edward Thorndike presento ung teoria del aprendizaje que destacaba el papel de la ex- periencia para fortalecer debilitar las conexiones entre estimulos y respuestas, Esta perspectiva se denomina conexionismo!: En su primer experimento (su tesis doctoral). Thorndike colocé un gato dentro de un laberinto con puerta que solo se abria cuando se manipulaba adecuadamente une pa- lanca, Thomdike observé que el gato comenzaba realizando movimnientos aparentemente aleatorios para poder salir del laberinto: Hegaba un momento en que, por casualidad, pulsaba el mecanismo gue abria la puerta, La siguiente vez que volvia al laberinto, el gato empezaba a realizar de nuevo movimientos por ensayo y error, pero esta voz tardaba menos tiempo en salir. A fo largo de los en- sayos, aunque ef gato continuaba demostrando que su conducte se basaba en el ensayo y el error. rdaba cada vez. menos en salir del laberinto, A partir de estas observaciones, Thorndike lego a fa conclusidn de que ef aprendizai de una conducts estaba influide por la consecuencia de esa conducta (por ejemplo, escapar de wna situs cidin de confinamiento}, Podriamos resumir la fer det efecte de Thorndike de la siguiente ma Las respuesias «une situactén que estén seguidas de una satisfacetin se fortalecen: las respuestay que estén seguidas par algo desagradable se debiitan. un Thorndike, ef aprendizaje consiste en wna conducta de ensayo y error, cidn progresiva de aguellas conductas gue producen sitisfaccion, y la supeesion de otras canductas s+ no debe confine con fs perepectiva gems de conexionisme ilo Thorne, 1898, ihuido en paralelo} que comentaremos ene! Re | Ro Asociacion que se reauiere kc ie 1 K Ey 68 «—APRENDIZAIE HUMANG. Algunos tedricos han sugerido que tanto el condicionamiento chisico come el operante estan ba- sacios en fos mismos procesos de aprendizaje (véase Bower y Hiligard, 1981). Sin embargo, en la mayoria de fas’ situaciones, ambos modelos de condicionamiento tienen una utilidad diferente a la hora de explicar fendmenos de aprendizaje distintos, por fo que 1a mayoria twatdndolos como dos formas de aprendizaje distintas los psico CONCEPTOS BASICOS DEL CONDICIONAMIENTO OPERANTE Hay algunos conceptos esenciales para poder comprender e! condicionamiento operante comoj por ejemplo, el nivel operante de base, Ia conducta terminal, [a extincién, Ia conducta supersticio- modelado y el encadenamiento, Echemos un breve vistazo a cada uno de ellos. Nivel operante basico (linea base) Como hemos sefialado anteriormente, una conducta operante es uma respu tiene un efecto determinado sobre el entorno, EI nivel operante basico es la frecuencia de una conducta operante en ausencie de reforzamiento, En otras palabras, constituye la nea de base 0 frecuencia previa de esta respuesta. Las personas se diferencian respecto a jos niveles operantes ta voluntaria que de base que manifiestan para diferentes respuestas. Por ejemplo, para algunos estudiantes levan- tarse de su asiento es muy frecuente, mientras que para otros resulta excepeional, De manera si- milar, algunos estudiantes leon muy frecuentemente, mientras que otros apenas leen por propia iniciativa Conducta terminal La conducta ferminal constituye Ia forma y feecuencia de la respuesta deseada al finalizar el programa de reforzamienia que se ha planificado, Supangamos, por ejemplo, que un alumno de 2.° curso de ESO casi nunca permanece sentado mas de 5 minuios seguidos y que, cuando se sienta, io hace tan cansinamemte que su cabeza apenas sobre nifique modificar la condueta de este chico mediante el reforzamiento debe du le por encima de la mesa. Un profesor que pla Ficar ta con ig especi «terminal como «permanecer sentado y enguido durante un periodo de i) minutos». Cuando utilizamos el reforzamiento para modificar la condueta, resulta esencial que describe: mos tu conducta terminal de manera previa y en términos concretos. Especificar a forma exacta de ta conducta deseada (por ejemplo. sentarse erguido? y la frecuencis 6 duraciGn de fa conducta (por plo, durante un periody de 10 minutos) nos permitiré determinar de manera objetive si nuestro jer micnto ha resubtado efteaz. programa de refer Extincion En condicionamiento clasico, exmando un ests 2 del estimulo incandicionado. lo condicionado se presenta repetidamente en respuesta condicionada disminuye y puede Hegar a de parecer. esto as, extingue. En cl condicionamiente aperanic. it extineién tiene hugar cuando waa reghuysta ya no va s ar a ste frecuencia de base. Por cje enden a dist cada vex gue levantan tuida por un reforzador. Lina respuesta no reforzada disminuye y puede retor nplo. los payasos de la clase que faciosillos. Los slummos a qu: encwen ran con que Ya racias os 10 se inuir su conducta de g mano para participar en clase, probabfememte defen de intonta 0. Los estudiantes que siguen suspendiendo Tos eximenes aunque dediquen mucho tiempo a estudiar probabiemente dejen de estudiar Capitulo 4 m Condicionamiento operante er Tenemos que decir en este momento que durante fas etapas iniciales del proceso de extincién es probable que nos encontremes con un rerenienro temporal en la condueta que protendemos extin= uir, un fendmene que se conoce como estallide de ta extineién (L: Iwata y Wallace. 1999; MeGill, 1999), Es posible que tambjén encontremos un aumento de Ia va- riabilidad de las respuestas que dan los sujetos (Rachlin, 1991), Por ejemplo, los estudiantes que no rman y Iwata, 1995; Lerman, Finden bien en los exdmenes podrian intentar estudiar mis, 0 guiza estudiar de otra manera: pera si sus esfurerzos tudio termine por disminais ven fracasando, probablemente su conducta de cine cluso por desaparecer Si bie cesitamos tomar precau nos interest extinguir conduct uramnos de que las conductas clescubles se refuercen con § cuencia y que uo se extingan. Por ejemplo, si vemos que nuestros alumnos suspenden una y otra vez ios exdmenes a pesar de sus mayores usa del problema, Quiza solamente suspende un estudiante, y sea porque necesita que fe ayudemos a desurrollar téenivas de estudio més apropiadas, o quizas una ensehanza ms individualizada, Si son muchos los estudian- tes que suspenden el examen, quizis ei problema esté en ef propio examen o en la ensefianza que se 1s indeseables cohno las de lox graciosillos de la clase, ne- jones para ase; fuerzos. deberiamos analizar la ¢: ofiece en Ta clase. Conducta supersticiosa {Qué ocurre cuando el reforzamienio se oftece de manera aleatoria y no congruente con una conducta determinada? En una ocasién, Skinner dejé a ocho palomas en sus respectivas jaulas due rante tod Ia noche con el mecanisme de reforzamiento programado para ofrecer comida a interva- los regulares, sea cual fuere Ia respuesta de las palomas, Por la maiiana, seis de las palomas estaban actuando de una extrafia manera. Por ejemplo, una de ellas topaba con la cabeza contra una esqui- na de Ia jaula, mientras que otras dos mavian su cabeza y su cuerpo en movimienios pendulares rit micos (Skinner, 1948). Si el reforzamiento se administra de manera aleatoria, probablemente se refuerce cualquier res- puesta que ha ocurrido inmediatamente antes del mismo, con lo que el organismo aumentara esta respuesta, poniendo asi de manifiesto Jo que Skinner denominé conducta supersticiosa, Una for juctista de describir el aprendizaje de una conducta supersticiosa. es decir, que el onga~ nismo piensa que la respuesta y el refuerzo estén relacionadas, cuando én realidad no lo estan. Por gjemplo, un alumno podria vestirse siempre con su wersey de la suerten para hacer un examen. Las conductas supersticiosas aparecen en el aula, va sea cuando el reforzamiento no es con- gmuente con la conducta 0. también, cuando los alumnos no saben cual de sus respuestas ha sido la responsable del reforzamienta, Esto exige que los profesores se aseguren de que fos reforzadores gue se offecen en clase, como las alabanzas. fa atencién o las calificaciones, son congruentes con las conductas deseabiles. y que ias relaciones entre la respuesta y el reforzador estén especificadas con claridad ma no cont Modelade Para que podamos reforzar a alguien por mostrar una respuesta determinada, esa persona pri- mero debe realizar esa respuesta, Pero. a veces. el nivel hasico operante de esa persona para su 25- puesta es tan reducide que casi munca fa produce de manera voluntaria, Para enfrentarse @ este pro. lema. Skimmer ided un meétodo que denominé modelade, que también se conoce come ‘aproximaciones sucesivas. El modelado es una forma de ensefiar una conducta cuando ef nivel ope: tative basico de esa conduct uniques s mily exiguo, o cuando le conduct es diferente de respuesta de has este ef organismo, 68 © APRENDIZAJE HUMANO Para modelar una conducta determinada debemos comenzar por reforzs la primers respuesta que se parezca por poco que sea a la conducta deseada, y continuar haciéndolo haste que el orga nismo la produzca con mucha frecuencia. En ese momento, s6lo debemos reforzar aquella respues- ta que se parezca més a ta conducta que deseamos, hasta que consigamos que et organismo produzca sélo la respuesta que estamos buscando, En otras palabras, ef modelado es un proceso de reforz miento en el que se refuierzan sucesivamente aproximaciones cada vez mas'parecidas a a conducta terminal, hasts que es ésia la gue aparece. Por ejemplo, cuando yo le ensefié a mi paloma a picotear un disco brillante en Ia caja de Skinner, comencé reforzindola cada vez que se ponia de cara a la pared en Ia gue estaba el disco. Una vez que esta respuesta se producia con la suficiente frecuencia, empecé a reforzatla s6lo cuando acer- ba el pice 2 te pared, después silo cuando tocaba la pared con el pica y, después, slo cuando pi- caba a menos de 2 cm. del diseo, y asi sucesivamente. Una hora después, la paloma picaba feliz el disco y se comia las bolitas de comida que cafan cada vez que lo hacia. Cuenta Is leyenda que un grupo estudiantes modelé la conducta de uno de mis profesores ayu- dantes unos cuantos dias después de que hubiera dado una leccién sobre e! modelado, Cada vez que él profesor se acercaba a la puerta de le clase, todos los estudiantes aparentaban estar muy intere- sados en fo que decia, se sentaban en e! borde de sus asientos y tomaban notas enfebrecidamente Cada vez que se alejaba de la puerta, Jos estudiantes mostraban aburrimiento, se recostaban en sus asientos y miraban ansiosamente su reloj. Asi, a to largo de ta hora de clase fueron reforzando al profesor s6lo cuando ste se acercaba a ia puerta, hasta que al finalizar Ia clase, el profesor se des- cubrié explicando desde el marco de la puerta De una manera similar, los profesores modelan progresivamente diversas capacidades académi- cas y ciertas conductas de sus alumnos. Por ejemplo, a los niftos de preescolar se les enseiia a escri bir sus primeras letras en un papel con reny gute no se salga del rengion, A medida que fos niftos avenzan en las cursos de primaria, los renglo- ines se hacen mais estrechas, y los profesores se vuelven mas exigentes respecto a ta perfeccidin de la letra. Poco @ poco, muchos nifios comienzan a escribir bien apoyandose en una tinica linea, ¢ inelu- so en un papel en blanco. Los profesores también modelan Ia conducta sedentaria de sus alumnos, valorando que permanezcan sentados en sus asientos por periodos cada vez mas largos de tiempo. E cierto sentido, podemos considerar también las matemdticas como un conjunto modelado de habili- vlamente cuando los alunos ‘ya dominan capacidades mas basicas, como el conteo, el reconocimiento de niimers o la sums. De manera similar. Jos profesores pueden modelar inadvertidamente condhuctas indeseables. Por ejemplo, imaginemos a Margarita que suele mostrar respuestas molestas. tales como hablar cuando no le toca y molestar fisicamente a sus compafteros. Su profesor hraber criticado constantemente esa conduct en realidad ha estado prestando atenci6n a la nifia y. por fo tam, ha reforzado su conducts. El profesor decide climinar la conducts molests de jones; después se les alaba por hacer una letra bonita y -s abordan la realizacién de problemas complejos jor Pérez, se da cuenta de que Margarita mediante el procedimiento de i . este ¢s, utilizando le extincién, Desgeaciad. mente. aungue e! efor Pérez no tiene dificultades pa tra imposible pasar por alto conductas mi problematicas de Margarita, en realidad lo que esta hi Margarita sea nity molesta, y no silo un poco molesta, si quiere ser reforzsda, <1 ignorar las infraceiones pequefias, eneuen- de extingy las: est. insistiendo en que wir fas conductas molestas. Por lo tanto, en nd es mod Encadenamiento os argonismos también pueden aprender modelado, Por ejemplo, mientras visitibamos una ruta turistica en ef sur de Dakota hace muchos na 5 dena. de respucstas mediante el encia. 0 6 Capitulo 4 & Condicionamiento operante ry ufos, observé 2 un pollo jugar una version solitaria de abgisbobs: en cuanto el pollo escuchaba una af determinada. golpeaba pelots con una barra horizontal en taba un trozo de comida. Su enttenador probablemente habia ens céona de respuestas comenzando por reforzar la ditima respuesta de Ia secuencia (vorrer hacia li base). continuaris reforzando las tiltimas dos respuestas (correr a la tercera base y despags a la se- ganda base) y asi, progresivamente, hasta cons Este proceso se conoce como eneadenamiento’. De la misma manera que los pollos pucden aprender a jugar al béisbol. las personas pueden aprenller conduetas muy largas y complejas me- diante esta técnica, Por ejemplo, los estudiantes de una clase de tenis pueden aprender a sostener ka raqueta de cierta manera, mantener entonces sus pies separados mientras miran. hacia ka red. ade= car su posicién a Is velocidad y la trayectoria de la pelota, y mover la raqueta de manera aprepiae da para que impacte contra la pelota. De manera similar, los estudiantes pueden aprend: sus libros. permanecer callados en su mesa y formar una fila para salir a comer. Este tipo de accio- nes se adquieren con mas facifidad si se aprenden paso a paso, esto es, mediante eneadenaniiento iio al pollo esta compl areeos NATURALEZA DE LOS REFORZADORES Llevamos mucho sato hablando de cémo pueden utilizarse los reforzadores para modificar fa condueta, Ya va siendo hora de teferirnos a los propios reforzadores. Comenzaremos distinguiendo entre reforzadores primarios y seeundarios, y entre reforzamiento positivo y negativo (que contras- laremos con el castigo). Describiremos, luego, los diferentes tipos de reforzadores que pueden uti- lizar Jos profesores para modificar la conducta de sus alumnos Reforzadores primarios y secundarios ‘Un reforzador primario es aqué! que satisface una necesidad 0 deseo de caracter biolagico o innato. Algunos reforzadores primarios como [a comida, el agua, el oxigeno y e] calor, son esen- ciales para e} bienestar fisiolégico. Otros. como una pastilta de chocolate o un vaso de vino, no son esenciales, pero pueden fomentar una sensacién de bienestar. Inckuso. hay otros reforzadores pri- marios. como el afecto fisico, sas, que tienen un cardcter mas social, y que Jos seres humanos hemos Hegado a apreciar como una forma de desarrollar ia cohesién social y, por tanto, de manera indirecta, nuestras probabilidades de supervivencia (Harlow y Zit 9: 1s abrazos y las som 1959: Vollmer y Hackenberg, 2001). Puede que existan diferencias individuales respecto ai tipo de con secuencia que actia come reforzador primatio. Por ejemplo, el sexo puede ser muy reforzante para algunas personas pero no para otvas, mientras que una droga puede ser un reforzador primario para un adicto pare no necesariamente para una persona no adicta (Lejuez. Schaal y O"Donnefi, 1998) merman, (Cuando se ens a um palo a jugar al baloneesto. of entrenaor liza un encadenamienta hacia atrs: pero ew ofr ms iti rect ita un encadenumienta hacia delumte, reforzane ta prniera respuesta de Ie Sec respuestas subsecienses hast gue se refberza hr seeneneia completa, Li invest 70 APRENDIZAJE HUMANO Reforzadores primarios y secundarios. Un reforzador secundario, también conocido como un reforzador condicionado, es un es- timulo previemente neutro que ha Hegado a ser reforzante mediante su asociacidn repetida com otro reforzador (Wolfe, 1936). Algunos ejempios de reforzadores secundarios, que no satisfacen ninguna necesidad bioldgica o social, son las alabanzas, las buenas notas, el dinero y la sensacion de éxito’ {Cémo se convierten en reforzanies los reforzadores secundarios? Una primera explicacién se basaba en el condicionamiento clasica. Un estimulo neutro se asocia con un reforzador ya existen- te (El) que provoca cierta satisfaccién biolégica (RI). El estimulo neutro se convierte entonces en un EC (esto es, se convierte en un reforzador secundaria) que provoca la misma satisfaccién (RC) Por ejemplo, mi hija Tina aprendid muy pronto que podia utilizar el dinero (EC) para comprar dul- ) gue satisfacian su facets golosa. Cuanto mis a menudo se asocia un refarzadior secundario con otro reforzador, y cuanto mas fuerte es ese reforzador, mas poderoso puede fh forzador secundario (Bersh, 1951; D’Amato, 1955) Mas recientemente, algunos tefticos han propuesto que el reforzador secundario es eficaz en la medids en que proporcions informacién al organismo de que esté disponible un reforzador prima- o (Bower, McLean, Meachem, 1966: Green y Rachlin, 1977: Mazur, 1993: Perone y Baron, 1980), Esta explicacidn tiene un claro aroma cognitive: un ongenismo esti buscando informaeién sobre st eniorno y no simplemente respondiendo al mismo de manera auton La influencia relativa de los reforzadores primarios y secundasios en nuestras vidas probable- mente dependa en gran medids de cas come fa comi Ss circunstancias ccondmicas. Cuando has necesidades biokdg forzado- wios estrechamente asociados con ellos 2.0 el calor son eseasos, enton los adoptan un papel fundamen Fes primtarios, asi come los reforzadores secund sjempio. darios como fas alabanzas. tas ealificaciones 0 los sentimientos de éxito. los que desempelian un pe pel mis importante en of proceso de aprendizaje Sin embargo. nen fa existenets de un Fe Feforgantes: Ge ahi so elasfieacton ome relor eveuse Vollmer y Hackenberg, 2001), Capitulo 4 & Condicionamiente operante m Reforzamients positive y negative Junto a ba distin centre r en qué se diferencia de! cast sn enie reforzadiores primarios y secundarios, también podemos diferenciar forzamiente positive y negative, Examinemos ambas formas de reforzamiento y observemos Reforzamiente positive Todos fos reforzadores que hemos mencionade hasta este me mento son reforzadores positives ®) reforzamiente positive supone fa presentacidn de un estimulo después de la respuesta, La co- sida, una sonrisa, las alabanzas y el éxito son reforzadores positives, Reforzami nto negative En contraste con ¢] reforzamiento positive, el reforzan puesta medi Por eje jente negative incrementa une res inte la reriradu de un estimulo, generalmente de caricter aversive o desagradable’ mpio, cuando las ratas aprenden a presionar una palanca para que finalice un estimulo tivo que mento en fa conducta de presionar ta palanca, En muchos automéviles suena un fuerte zumbi- do si las Haves perman las gunas vee! lé climinacién de exe estimule av: vo es un reforzador wovocs UR itis jor; de mane ecen puestas cuando se abse Ta puerta del conduct fa que quitar wes de contacto es un reforzamiento negativo ya que el zumbido desaparece. Los nifios al- simulan un dolor de estémaga para librarse de alguna actividad académica que en- cuentran dificil y frustrante: esta conducta fes permite escapar de la tarea problematica, lo que fa- vorece su persistencia La eliminacién de la culpa o Ta ansiedad puede convertirse en un reforzador negative tremenda- mente poderoso. Es posible que un nifio confiese alguna falta cometid dias o, incluso, semanas an- tes, pata poder librarse de los sentimientos de culpabilidad. La ansiedad puede llevar a un estudiante a terminar pronto su tarea para poder eliminarla de su lista de cosas por hacer. Otro estudiante en- frentado a la misma tarea podria retrasarla hasta e! iltimo minuto, eliminando de esta manera, aun- que séle temporalmente, fa ansiedad que le produce enfrentarse a ella. No debemos olvidar que cl reforzamiento negative puede afectar también a la condueta de los profesores igual que @ Ja de los alumnos. Con frecuencia, los profesores actian para eliminar esti- mulos aversivos: por ejemplo, pueden recurrir a estrategias de disciplina de grupo como gritar a los alumnos 0 ponerles menos deberes, que eliminan ios estimulos desagradables a corto plazo aunque resultan plazo, Por ejemplo, si un profesor gtita a un alumno gue habla demas do en clase, y ese alumno deja de hablar, esta reforzando negativamente Ja conducta de gritar del profesor’, Pero si ei alumno desea Hamat la atencidn del profesor (un reforzador positive para él) uida voiverd « hablar como antes. enst Comparacién entre ef reforzamiento positive y cf negative con et castigo Tanto el reforzainiente positive como el negative incrementan las respuestas que les preceden. Sin embargo, e] castige tieade « diominuir esas respuestas, Analizaremos mds detalladamente los uc la palabra eneativos fe despise, No se at juicin de valor. sine que se refietesinaploment 72 APRENDIZAJE HUMANO amos a definir brev efectos del castigo en el capitulo 6, pero ahor ra com El castigo puede adoptar dos formas, « las que suele denominarse castigo I y eastigo II. El eas- tiga T supone Ia presentacidn de un estimulo, generalmente de tipo aversive, Las regafinas y los azotes son ejemplos de este tipo de castigo, El castigo TI supone la eliminacidn de un estimulo, ge- néralmente de tipo agradable. Un ejemplo podria ser la pérdida de privil las diferencias entre et reforzamiento positivo, el reforzamiento negativo, el castiga Ly el castigo II jente lo que es el castigo pa- rario con el reforzamiento ni tivo Naturaleze del estimule | Elestimulo 25 Agradable versiva Se presenta tras ' Relortamiento positive | Castigo | Ta respuesta (incrementa a respuesta) |-—_—(Gisminuye la respuesta) ot =} | | Se elimina ras | Castigo _Reforzamiento negativo | Geisminuye ls respuesta) | increments la respuesta) Figura 4.3 Refi reforzamiento negativo y castigo, Muchas personas utilizan erréneamente ef término reférzamiento negativo cuando en realidad estin refirigndose al castigo. Aunque ambos fendmenos pueden implicar estimulos aversivos, se di- ferencian en dos aspectos importantes. En primer lugar, como ya hemos observado, tienen efectos opuestos: el reforzamiento negativo incrementa ta frecuencia de una respuesta, mientras que el eas- tigo ta cisnsinupe. Una segunda diferencia se refiere al orden en que suceden las cosas. Durante el seforzamiemto negativo el estimulo aversivo cesa cuando se emite la respuesta, Sin embargo, con el castigo t, ef estimulo aversive empieza cuando se emite la respuesta, La figura 44 ilustra esta dife- rencia de manera gréfica. Le finalizacton de un ¢ versivo refuerza negativamente una res- puesta; el inicio de un estimule aversivo castiga una respuesta. ‘imulo La diversidad de consecuencias que los seres humanos encuentran reforzantes Cuando se utiliza el reforzamionto on la clase, los profesores se limitan a utilizar un paitado de reforzadores. Sin embargo, existe una amplia variedad de situaciones que pueden resultar reforzan- tes, Echemos un vistaze a las diversas posibilidades de que disponemos, Reforzadores materiales Un reforzador material o tangible es un objeto ou: bra ref iquiera: por ejemplo, la comida o los jw guctes. P: bi ulicemos este tipo de refor resultado, La comida, los juguetes y otros elementos simi alummos de aguellas cosas que deberian estar haciendo en traproducentes a largo plazo. dor les trac @ la mente solo consecueneias tat muchas personas, fa p: colures, in mayoris de os psicologes recomiendan que silo ero, al menos cn sit maciones adores come) altimo recurso, cuande ningdn otro reforzador ha dado wes sienden a dist por le tanto, pueden resultar cone a ateneibn de los Capitulo 4 @ Condicionamiente operante B io negatwo | Estimulo aversive | | & [Eimusemre Figura 44 Ef veto cestinaste aversive ofa respuesia vse Nérmnives de gud es lr que ocurre primera: el Reforzadoi s sociales J sto 0 un signo de tna persona hacia otra que transmite una inten- cién positiva, Las alubanzas, una sonrisa, una palmada en la espalda, un abrazo son reforzadores so- ciaies. El reforzamiento social es frecuente en ef aula y, ademvas, resulta muy eficaz. La atencion de} profesor. asi como su aprobacién y sus alabanzas, son poderosos reforzadores en el aula (Becker, ‘Madsen, Arnold y Thomas, 1967; Craft y otros, 1998; Drabman, 1976; Madsen, Becker y Thomas, 1968)’. La atencién y la aprobacién de los compaiieros también puede resultar muy eficaz (Bowers, Woods, Carlyon y Friman, 2000: Evans y Oswalt, 1968; Flood y otros, 2002}. Reforzadores de actividad Hablando en términos no conductistas, un reforzador de actividad supone una oportunidad para realizar una actividad favorita (una adivinanza répida: zqué palabra es la parte no conduetista de mi definicién y por qué?). David Premack (1959, 1963) descubrié que la gente suele realizar una a vidad si eso les permite poder hacer otra, Su principio de Premack se puede enanciar de la sic guiente manera: ie ; : | Cuando una respuesta de ata recuencia sie a una respuesta de baja frecuencia, incre- | mmeritaré Ia repeticion de la respuesta de baja frecuencia. Una respuesta de alta frecuencia chia, una respuests que un organismo disfruta hax ciendo, mientras gue una respuesta de baja frecuencia es aquélla ante la cual el organs firuta. Por io tanto, otra manera de enunciar e} principio de Premack es que los 0 rain as tareas menos preferidas para poder hacer después las mas preferidas, Por giempio, mi propic nivel operative bisico para fas tareas damésticas es extremadamente re- ducido. He descubierto que soy mas proclive a hacer esas tareas si me premio con Ia lectura de una novela de misterio © con una fiestecilla después de haberlas terminado. Algo similar se puede ha- en ef aula, Por ejemplo, se lativa facifidad quietos y presten atencion, si se les permite realizar sus conductas preferidas (por ejemplo, hablar ene 10 no dis- smos realize sde ensefiar con r los nifios pequefios que estén 74 APRENDIZAIE HUMANO con sus compaieros) silo después de que han permet periodo de tiempo (Homme, deBaca, Devine, Steinhorst y Rickert, 1963), Aunque los psicdlogos admiten que el principio de Premack Finciona, no se ponen de acuerdo ciona. Si usted esté interesado en explorar kas bases tediricas de este prine rd (1981) y ef de Timberlake y Allison (1974), ecido tranquilos y atentos durante un cierto cep la raz6n por la que fa cipio, revise el trabajo de Bower y Hil Retroalimentacién positiva A veces, los reforzadores materialistas y sociales mejoran la conducta en ef aula y faciliten el aprendizaje académico debido a que proporcionan retroalimentacién respecto a qué respuestas son deseables y cuiles no Jo son (Butler, 1987: Gagné y Driscoll, 1988). La retroalimentacion positiva resulta muy eficaz para producir cambios de condueta (Kladopoulos y MeComas, 2001; Lhyle y Kulhavy, 1987; Smith y Smoll, 1997) En una ocasién pasé media hora diaria durante varias semanas trabajando con Miguel, un niio de nueve afios con una discapacidad de aprendizaje que le producia dificultades para aprender a 2s- cribir, Durante las primeras tres semanas, ni Miguel ni yo pudimos ver ninguna mejoria, y es0 nos hacia sentirnos cada vez mis frustrados. Para proporcionar una retroalimentacién més conereta so- bre el resultado de nuestro trabajo, decid! plasmar en un gréfico la actuacién diaria de Miguel. Le expligué que iba a sefialar en un grafico el nimero de letras que habia podido recordar cada dia. Le dije que en cuanto hubiese legado al limite superior del grafico (lo cual indicaba que habia escrito correctamente veintiséis letras) durante tres dias seguidos, tendria un regalo especial Al principio de cada una de las siguientes sesiones de trabajo, yo evaluaba a Miguel y contibamos el niimero de letras que recordaba correctamente. Anotabamos los resultados, y Miguel practicaba con aquellas letras que habia olvidado. A partir de aque! momento los resultados empezaron a mejorar de tuna manera espectacular. Miguel no s6lo realizaba progresos notables, sino que también intentaba me~ Jorar el grafico det dia amterior. Dos semanas después, Miguel habia aleanzado el eriterio para obte- ner su regalo: habia escrito las 26 letras correctamente durante tres dias sueesivos. Lo mas probable es ue no fuera el regalo la clave de nuestro éxito, ya que Miguel no parecid preocuparse demasiado por haberlo perdido 24 horas después de haberlo ganado. Por ef contrario, sospecho que Ia retroalimenta- cién positiva de sus progresos fue ef auténtieo reforzador que le ayudé a aprender. La retroalimentacién tiende a mostrar su mayor eficacia cuando resalta lo que los alumnos han aprendido y lo que les falta para aprender. y cuando les proporciona una guia sobre como pueden su actucidn (Butler y Wine, 1995: Lhyle y Kulhavy, 1987). Bajo tales clreunstanctas, in- s0 la retroalimentacion negativa puede Hegar x mejorar la actividad (Barbera, Heward, Bradley y Miller. 1994), Ei caso es que resulta dificil interpretar estos resultados dentro de un marco estric- tamente conductista, Es mas. s¢ diria que los alumnos estin reflexionando sobre ef significado de ia retroalimentacign que reciben y utilizindota para adecuar su conducta fitura Reforzadores intrinsecos En ciertas si javiones, las personas realizan determinadas respuestas no tanto it de reforzadores externos, sino debido a lo ¢ ka presencia nlimientos internos ag audables que genera este tipo de respuestas. y que reciben el nombre de reforzadores intrinsecos. Fl sentimiento de triunfo que se produce al solucionar un rompecabez: tune cosa valiosa a su legitimo ducio, y cf sentimiento de alivio tras terminar una tarea especial mente dificil. son ejemplos de reforzadores intrinsecos. Aq mucho tiempo produciendo respuestas sin at dificil, el sentimiento de orgulle que sentimos al devolver las personas que continian dt cane = podamos abservar que reciben refuerzos externos pot sus esfuerzos, probablemente estén trabajando para obtener satisfacciones intiinsecas. Capitulo 4 Condicionamiente operante 6 Para muchos estudiantes. los auténticos reforzadores del aprendizaje son probablemente de ca- icter interno, tales came los sentimientos de triunfo, de habilidad. de dominio y de orgullo que pro- porciona su realizacién. Para esos estudiantes, otros reforzadores, que proporcionen reuoalimente cidn sobre fo bien hechas que esta sus tareas académicas, pueden constituir una ayuda fundamental Las calificaciones guiza sean reforzantes por la misma razon, ya qué reflejan una clevada dad. y por fo tanto una razin pata sentirse orgulloso. Desde ia perspectiva del profesor, la retroulimentacién positiva y ef reforzamicnto intrinseco que proporciona esta retroalimentacién son probablemente las formas mas deseables de reforzamiento en el aula, Sin embargo. recuérdese que la retroalimentacién pasitiva y los sentimicntos de éxito s6- lo aparee n cuando la ensefuunza se ha diseiado cuidadosamente para adaptarse it fas capacidades de los alumnos, y sdlo cuando éstos han aprendido a valorar el lagro académico. Cuando, por cua- Tesquiera razones, Jos alumnos no estin motivados hacia el éxito académico, entonees puede ser ne- cesario recurrir a otros reforzadores, como los sociales y Jos de actividad Siempre debe recordarse que lo que resulta reforzante para una persona puede no serle para otra. Como la belleza, e! reforzamiento esta en los ojos de cada uno. E incluso, para un mismo individuo. un reforzador puede dejar de serto en una situacién diferente. También existen otros factores que in- fluyen en Ia eficacia de los reforzadores, tal y como veremos a continuaciéon. ca FACTORES QUE INFLUYEN SOBRE LA EFICACIA DEL REFORZAMIENTO Existen diferentes factores que influyen en la eficacia del reforzamienta durante el condicio- namiento operante, tales como fa oportunidad de} momento, la magnitud y el atractivo. y la co- herencia, La oportunidad del momento [Al principio de este capitulo puse mucho énfasis en la importancia de que el reforzamiento se produjera de manera inmediata, En la mayoria de Jos casos, una demora importante en el reforza- miento conduce a una adquisicién més lenta de Jas respuestas (Hockman y Lipsitt, 1961; Lett, 1973, 1975; Terrell y Ware, 1961). Afortunadamente, en aquellas situaciones en las que el reforzamiento inmediato resulta imposible, suelen existir claves que seflalan que el reforzamiento Hegaré més ade- lante (Fowler y Baer, 1981; Perin, 1943). Por ejemplo, un profesor que desea reforzat Ia perseve- rancia de sus alunos durante una leccién especialmente dificil, podria deeir «come hemos traba- jado mucho esta mafana, después de comer vamos @ jugar a ese juego que tanto os gusta». De hecho. los niiios padrian llegar a trabajar mejor para conseguir un refuerzo demorado (esto es, re- trasar la gratificacion) cuando el periodo de espera se va aumentande un poco y cuando aprenden estrategias para soportar la espera, por ejemplo. realizar alguna actividad o diciéndose a si mismos ‘si espero un poco mas, conseguiré una galleta mas grande» (Binder, Dixon y Ghezzi, 2000; Dixon y Cummings, 2001: Freeland y Noell, 1999. Magnitud y atractivo Cuanto mayor y mas atractivo sca el reforzador, mas ripidamente se aprendera fa respuesta. ¥ més frecuentemente se producira (Atkinson. 1958: Siegel y Andrews. 1962). Por ejemplo. en un es- tadio entre 3 y 5 afios aprendieron de manera mis réipida Siege! y Andrews (1962), nifios 76 APRENDIZAJE HUMANO cuando se les reforzaba con regalos como dulces, monedas, pelotas y pequeiios juguetes, que cua do los reforzadores eran simples botones, De hecho, para los nifios mas mayores y para ios adultos. los reforzadores grandes aunque vengan con demora suelen ser més gratificantes que los pequehos aunque los obtengan de manera iamediats, por supuesto, siempre que sepan que al final obtendrin e508 reforzadores (Green y otros, 1994}, i Resulta muy interesante sefalar que lo que afecta a la conducts no es tanto fa magnitud absolu- ta del reforzador como su magnitud refativa en comparacién con la experiencia previa, Par ejeni- plo, en un estudio clisico de Crespi (1942), se utilizaron ratas que corrian por una pista para obte- ner al final un reforzador. Cuando las ratas que estaban acostumbrades @ obtener una pequefta cantidad de comida fueron reforzadas repentinamente con una cantidad mucho mayor, empezaron correr més répide que aquellas ratas que siempre habian recibido wna cantidad grande de comida, De manera similar, las rates acostumbradas a una gran cantidad de refwerzo que empiczan a recibir menos comida, corren mas lentamente que aquéllas que siempre han recibido una cantidad peque- fia de comida. Estos resultados se han replicado en otros estudios con ratas (McHale, Brooks y Wolach, 1982), si bien cuando se han aplicado a nifios no han podido ser repetides con tanta clari- dad (Fagen y Rovee, 1976: Lipsitt y Kaye, 1965). Estos cambios en la conducts que se observa cuando el refuerzo se aumenta o disminuye, suelen conocerse como efectos de contraste, Uno de estos efectos, al efecto de euforia, se produce al in- crementar la cantidad de refuerzo: la respuesta se hace mis ripida de Jo que seria si el reforzamiento siempre se hubiera proporcionado en ess misme cantidad. El efecto opuesto, llamado de depresién se produce cuando disminuye la cantidad de refuerzor el ritmo de respuesta se hace mas lento de fo que habria sido si el refuerzo siempre hubiera sido reducido. El efecto de depresién podria deberse par cialmemte a las emociones negativas asociadas con Ia reduccién del reforzamiento (Flaherty, 1985). Coherencia Uno de los Factores mas importantes que afectan tanto al ritmo de aprendizaje de ias respuestas como al ritmo con que éstas se extinguen, es ia cohereneia det reforzamiento (Staddon y Hig: 1991), Para ilustrar el papel que desempeiia este factor, considérese esta fantasia que cada semestre imagino respecto al puado de alumnos que no fan leido su libro de texto: [tos alunaas estan encerrados en una pequetia sala. El manual esté en una mexa corcant | [Cada vex que un estdianteabre ef bre, cae por un aguero del teco un taza de delciosa | | comila basura | Lo que aeabo de hacer en esencia es colocar a mis alumnos menos motivatdos en ef interior de ‘ii propia version de fa caja de Skinner, jla caja de Ormrod! Abora imaginese a veint rrados dentro de veinte uupo A: Fee i, Los otros diez constituyen jas de Ormrod. Diez de esos estudiantes. aleatoriamente cl p na porcion de comida basura cada vez que abren ef libro de texto y lo mira Tupo B: slo obtienen co- ida basura algunas veces. pero otras no. El grupo A esta recibiendo un reforzamignto continue: se refluerza cada una de las respuestas. termitence algunas respuestas se teflterzan y otfas no. Qué grupo aumentari con mis repidez sit conducta de amiento continuo. incr continua se adguieren mas rapidamente que las respues- grupo B estd recibiendo un reforzamiento leer el libro de texto? Por supuesto, fa respuesta es el grupo A. que tiene un refor Las respuestas que se refuerzan de m: tas que se refiuerzan de man a intermitemte Copitulc 4 ® Condicionamiente operante W Ahan alumnos spongamos que. tras unas cuantas horas en sus respectivas cajas de Ormrod, los veinte mpiezan a mostrar una elevade tasa de lectura del Hibro de texto, de man migcanismo de suministro de comida basura, ,Qué estudiantes setan los primesos en darse cuenta de que ya no estin siendo referzados? De nuevo la respuesta correcta esiel grupo A. A} haber side re- forzados por cada una de sus respuestas, se darim cuenta con mayor rdpidez de que ef refarzamien- to se ha detenido, de manera que su respuesta de lectura del libro se extinguiré rapidamente (a me~ mente reforzante), Por el contrario, jos estudiantes del grupo B s6lo han estado recibiendo reforzamiento por el 25% de sus puestas, de manera que estan acostumbrados a no recibir reforzamiento: esos estudiantes praba- blemente continuaran leyendo sus libros durante alyin tiempo antes de que se den cuenta de que ya no estin siendo reforzados. Por lo tanto, tas que se han reforzado de manera intermiten- te se extinguen de manera mas lenta que las respuestas que se har reforzado de manera continua. Los conductistas recomiendan reforzar de manera continua una respuesta hasta que se haya al- canzado ef nivel deseado y. a partir de alii, mantener esa respuesta mediante un reforzamiento in- cermitente que impida su extincidn, El reforzamiento intermitente puede seguir diversas esquemas de reforzamiento, cada uno de los cuales tiene un efecto diferente sobre la resistencia a le extine clon y sobre ta frecuencia y el patron de respuesta que esta siendo reforzado. Vamos a deseribir di- ferentes esquemas, asi como los patrones de respuesta vinculudos con cade une de ellos, a que apago el os, por supnesto, que hayan legado a encontrar esa conducta intrins ESQUEMAS DE REFORZAMIENTO En este apartado vamos a describir tres grupos diferentes de esquemas de reforzamiento inter- rmitenta: los esquemas de proporcién, on los que el reforzamiento se produce tras cierto nimers de respuestas, los esquemas de intervalo, en Ios que el reforzamiento se produce para la primera r puesta que se da tras determinado intervalo de tiempo. y esquemas diferenciales, en los que el re- forzamiento se asocia con un ritmo deierminado de respuestas, Esquemas de proporcién: reforzar cierto mimera de respuestas Un esquema de proporciér es aquél en que el reforzamiento se produce tras la emisién de cier- to mimero de respuestas. Ese mimero puede ser constante (un esquema de proporcién fijo) 0 variar enire uno y otto reforzamiento (un esquema de proporcién variable). Proporcién fija (PF) En un esquema de reforzamiento de proporeidn fija, ef reforzador se presenta una vez que se ha desencadenado determinado atimero de respuestas. Por ejemplo después de tres respuestas quema de proporcién 1:3) o tras cada 50 respuestas (esquema 1-50). Este esquema de reforzamien- to puede producir un ritmo de respuestas muy elevado durante un periodo indefinido de tiempo: por gjemplo, las palomas cuya ritmo de picoteo se mantiene de a picotear hasta diez veces por segundo (Fester y Skinner, 1957) Whitlock (1966) ha deserito Is utilizacién de una serie de esquemas de proporcién con un nite de seis aftos que no habia sido capaz de aprender Jas babilidades basicas necesarias para fa lector, En un primer momento se pidié al nifio que leyese fas, Cada ver que le sta manera, pueden th is palabras que se le presentaban en unas tarje~ ador ja correctamente una palabra. recihia una ficha de plastise come refor7 78 APRENDIZAJE HUMAN mediante un esquema de reforzamiento continuo, Cuando reunia una serie de tarros con 36 fichas. podia realizar diferentes actividades: por ejemplo, con dos tarros podia jugar, y con siete podia ver una pelicula de dibujos animados. Cuando Hlegé a ser capaz de leer con un nivel basico, se le refor- 26 con un esquema de proporcién fija 1:2: esto es, recibie una ficha por cada dos palabras que leia cortectamente. Mis adelante se le reforaé por cada cuatro palabras, después por cada pagina, mas adelante por cada historie completa, y al final por cada cuatro historias, Después de quince sasio nes de este tipo se suprimié e] reforzamiento y el nifio voivié a sus clases normales; tres meses des pués todavia mantenfa ef mismo nivel que sus compafieros (siempre me ha preocupado una cosa So- bre este estudio: debido a que se necesitaban tantas fichas para poder hacer una «compra», supongo que el nifio no pudo comprar mychas actividades. Me da la sensacién de que su éxito en le iectura fue el auténtico reforzadon). Se han Hlegado a utilizar esquemas de proporeidn que Hegan a 1:1.000, siempre y cuando se in- troduzcan paulatinamente (Fester y Skinner, 1957). De hecho, las proporciones mas elevadas sue- len producir ritmos de respuesta mas altos que las proporciones mas bajas (Collier, Hirsh y Hamlin, 1972; Stephens, Pear, Wray y Jackson, 1975), si bien se ha encontrado que bajo estas circunstancias Jos organismos tienden a mostrar una pausa post-reforzamiento (una disminucion temporal en su respuesta) después de que se haya reforzado una respuesta (Fester y Skinner, 1957) Proporcion variable (PV) Un reforzamiento con un esqueme de proporeién variable es aquél en que se presenta el refor- zamiento después de que sean emitidos un determinado nimero de respuestas, si bien dicho néme- ro varia de una ocasion a otra. Este tipo de esquema se define por ef minniero medio de respuestas que se necesitan para obtener un reforzamiento, Por ejemplo, en un esquema 1-5 PV, podria darse un primer reforzamiento después de cuatro respuestas, y luego otro despues de siete mas, otro des- pués de tres mds, ete. Como se puede observar, is ocurrencis del reforzamiento en un esquema PV es bastante impredecible. La venta buenos das, stars, teefonase | (female refuerza | | useictamo pare | | recurs | | mediante un coponumieas questo | | esquema de | eee ete | prepare ane, | ‘ue slo ke ests hes amos eninos ald tsteg pose sr | (Berm detdos SE Soamis variable inensas ‘| etaaes | (cea Capitulo 4 = Condicionamiente operante 9 Las maquinas tragaperras son un ejemplo de respuesta reforzada con un esquema de este tipo. Cuaitias més veces se inserta una moneda en Ia maquina. més veces vendri un refuerzo en forma de premios, pero ese premio no llega de manera predecible tras determinade niimero de monedas, ‘insertadas. imilar. las ventas telefnicas se refuerzan también mediante este tipo de es- ‘quema, Cuantas més Hamadas se realicen, mayor seré e} nlimero de ventas, si bien e] operador tele fonico nunca sabe en qué Hamada obtendra el reforzamiento, Margarita, una amiga que mi hija Tina tuvo en fa escuela pritmaria, era muy persistente cada vez que queria alguna cosa. y casi nunca obienia un no por respuesta. Una tarde en la que Tina y yo hae bbiamos ido a conar a un restaurante con Margarita y su madre, entendi por qué ba niita era tan per sistente, Las dos nifias engulleron ripidamente su comida y sali tomibamos café, Margarita volvié rapidamente a ta mesa para pedir algo a su madre: je manera st on a explorar, mientras sus madres «Mamd, ¢Mfe das dinero para un videojuego?» «Non. «Por favor, mand, «He dicho que no, Margarita». «Pero Tina tiene uno». (Yo miré ausente hacia el vacio). ' | «Now. «de lo pagaré en cuanto volvamos a casa» «No, Margarita, «jPorfal» (Margarita pone cara de desesperacién) | we aciierdo, aqui tienes el dinero» Le conducta de Margarita probablemente era un esquema de reforzamiento de proporcién va- rable; habia aprendido que e! que persevera, gana. Los esquemas de proporcién variable dan lugar a ritmos de respuesta mas elevados que los esquemas de proporeién fija. ¥ Jo que es mas, las respuestas reforzadas mediante un esquema PV son también mas resistentes a ta extincién. De hecho, las palomas que reciben esquemas PV muy altos pueden Iegar a gastar més energia en su respuesta de Ta que ganan con la comida (Swenson, 1980). Esquemas de intervalo: reforzar la primera respuesta que se da tras un periodo de tiempo Un esquema de intervato es aque! en el que ¢} reforzamiento esta asociade con Ja primera res- puesta que se emite después de que haya pasado un determinado periodo de tiempo. Ese intervalo puede ser constante (un esquema de intervalo fijo) o variar entre un reforzamiento y el siguiente (un esquema de intervalo variable}, Intervalo fije (IF) En un esquema de reforzamiento de intervalo fijo, ef refuerzo se asocia con la primera res- puesta gue se emite cuando ha pasado un determinado periodo de tiempo. Por ejemplo, el organis- ‘mo puede obtener un reforzamiento cuando emita una respuesta después de $ minutos. y sea cual sea la camtidad de respuestas gue haya emitido durante ese tiempe. Después del reforzamiento. 80 APRENDIZAJE HUMANO volver a reforzarse k comienze otro intervalo de 5 minutos, pasado cl ct se produzea. Un esquema de intervato fijo produce un nico patrin de'respuesta: tras el reforzamiento, el rit- mo de respuestas disminuye haste que se aproxinta el Fina! del perlodo, momento en el gue vuelve a incrementarse (Fester y S 1957; Shimoff, Catania y Matthews, 1981), Por ejemplo, cuando mi hija Tinalestabe en 5.° curso de primari¢ tenia que hacer un examen de deletreo todos los vier- nes. E1 profesor le daba la lista de palabras el lunes. de manera que tenian cuatro dias para estu- primera respuesta que in diarla, Alguna vez empezé el miércoles, pero lo normal era que esperase hasta el jueves por la no- che para empezar a estudiar. Si hubiese que plasmar graficamente la conducta de estudio de Tina, apareceria algo similar al grifico de la figura 4.5. Este pairin «festoneadon es caracteristico de las conductas ni tan resistentes a la extineién como las que producen los esquemas de proporcién fija y variable reforzadas mediante un esquema de intervalo fijo. Las respuestas no son tan frec Minutes estudiando Lu Ma Mi Ju Vi Sa Do tu Nia Mi ju Vi Sa Do Lu Me Mi Ju Vi Sa Dias de fa semana Figura 43. Las respuestas reforzadas mediante un esqueme ce intervalo fj muestnan un parr «festone Intervalo variable (FV) En un esquema de reforzamiento de intervalo variable, el reforzamiento se asocia con Ia priv mera respuesta que se emite después de que haya pasado un petiodo de tiempo determinado, si bien la longitud de ese intervato varia de una oc: si veforzado en la primera respuesta que da tras 5 minatos y, luego, en la primera respuesta después de 8 mimutos y, luego, en la primera respuesta después de 2 minutos, elediera, de manera que es una media de tiempo la que defin Por ejemplo. si usted tiene un amigo de agi bablemente siempre tenga la finea ocupada. Si usted tiene una necesidad ungente de contactar con probablemente continuaré marcando su ndimero de teléfono cada pocos minntos hasta que des- iente, Por ejemplo, el organismo puede ser ‘esquema. les ene: inta hablar por teiéfono, pro- cuel uc. De manera simitar, aquellos alumnos a quienes se ha dicho que siempre es posible que se tendoran a estudiar un poco todos los das. Ellos nunea sab exactamente qué dia obtendran ef fruto de su trabajo. Este patron de respuesta es sipico de fos es- quemas de intervaio vacia itmo de respuesta lento pero mane intervalo de tiempo medio hasta ef momento del reforzamiento, mas lento sent el ta (Catania y Reynolds, 1968). (Es nevesatie resalta prese no son recomendabl J capitulo 16, demasiads ansiedad interfiere en el aprendi sa no tienen en cuenta qu encuentren con un © amen sorpres pido, Cuanto nis large se: es un que por razones distintas, los ex como deseubriremos echo, los exiimenes sorpre- es. Ya que aumentan fs ansiedad de los alumnos y De las actividades extraescolares y las obligaciones familiares no si permiten que las tareas escotares se realicen el mismo dia en que se as! gnan} Capitulo 4 Condicionamiento operante at Asi pues, tanto respecto a Tos esquemas de proporcién como a Jos de intervalo, los de riable procucen respuiestas que se mantienen mas que los esquemas fijos. probablemente debide a lo impredeeible del reforzamiento, Con un esquen Ja préxima respuesta correcta obtenga an beneficio. Los esquemas variables también parecen con evar una mayor resisiencia a ts extineidn, precisa ‘Cuando se otilizan esqiemas de proporeién o de intervale para evit tincién de una res puesta previamente adguirida, e? mejor esquema que podemos usar depende del ritmo de respuesta deseada, En le mayoria de los casos, se recomienda una proporcién variable para ritmos muy ele- vados de respuesta. y un esquema de intervalo variable para un ritmo lento peto mantenido, De ma- cuando el reforzamiento continuo se sustituye por un reforzamiento intermitente, la pro~ porcién deberia ser pequefia (por ejemplo, 1:2 0 1:3), 0 el intervalo deheria ser breve. Aparte de que a proporcién o el intervato de tiempo pueden aumentarse progresivams engamos que proporeionar reforzamiente, na variable, siempre existe la posibilidad de que ente por su caricter impredecible nena idea nte hasta que las respuestas se produzcan sin que apenas Esquemas diferenciales: reforzar ritmos de respuesta Cuando se desea obtener un ritmo de respuesta determinado, lo mas apropiado es utilizar un es quoma de reforzamiento diferencial: el reforzamiento se obtiene cuando se produce un determi- nado nimero de respuestas durante un periode de tiempo especifico. Los investigadores han esta diado of efecto de diversos esquemas de este tipo, tales como los siguientes: + Reforzamiento de un ritmo diferencia! de muchas respuestas. + Reforzamiento de un ritmo diferencial de pocas respuestas, + Reforzamiento de la no acurrencia de esa respuesta (reforzamiento diferencial de otra conductas. Ritmo diferencial de muchas respuestas (RDM) Un esquema RDM proporciona refuuerzo sélo cuando se ha emitido un gran numero de res- puestas durante un determinado periodo de tiempo. Por ejemplo, recuérdese a Margarita, fa amiga de Tina que persistentemente pedia dinero su madre para comprar un videojuego. Margarita probe- blemente estaba siguiendo un esquemma RDM y no tanto un esquema de proporcién variable, va que en realidad pedia el dinero muchas veces de una vez para poder obtener reforzamiento. Con un es- quema de proporcién, el tiempo requerido para producir él niimero necesario de respuestas es irre- Jevante, pero ep un esquema RDM este periodo de tiempo resulta importante. Dado que este ¢s- quema exige que se prodazcan muchas respuestas durante un corto periodo de tiempo, ef patrén mas, commin es de una gran cantidad de respuestas. En teoria, estudiar para eximenes fijados de antemano seguiria un esquema RDM: cuanto mai se estudia, mayor es la probabilidad de obtener reforzamiento en ef momento del examen, Sin em- bargo, como ha sefialade Klein (1987), la mayoria de los estudiantes se enfrentan a fos examenes desde una perspectiva de esquema de intervalo fio, to que provoca un patrén de estudio del tipo «cdisfrotamos ahors, empollamas spuds Ritmo diferenciai de pocas respuestas (RDP) Un esquema R minado, durante el juerza la primera respuesta que sc emita tras un intervalo de tiempo deter~ 10 no ha producido ninguna respuesta, Esto podria sonar a

You might also like