You are on page 1of 65
~CONDICIONAMIENTO INSTRUMENTAL APETITIVO | Jaume Cruz Feliu Universidad Autonoma de Barcelona (i,] CONDIGIONAMENTO ~) INSTRUMENTAL APETT En el capitulo 3 de este volumen 5: cexplicado uno de los procedimientos més im- portantes de aprendizaje: el condicionamien- to clésico, Sin embargo, una gran parte de Ta conducta humana y animal se‘adapta me- jor a los principios de un segundo tipo 4 ‘prendizaje: el condicionamiento instramen- tal u operante. La solucién al problema de si existen uxio 0 dos procesos tinicos de aprendizaje no esti todavia resuelta, y en el capitulo 7 de este libro se analizun Tas mdltiples relaciones existentes entre el con- dicionamicnto clésico y el condicionamien- to instrumental. No obstante, dado que el condicionamiento instrumental constituye tuna técnica especifica, en este capitulo se explicard el tema del condicionamiento ins- trumental petitive, y en el capitulo 5 se describicé el condicionamiento instrumental aversivo. 1 precente capitulo se estructura de la si- guiente manera: 1) Tras una breve introduccién histérica, se describe el paradigma y las principales cla- Ses de contingencias del condicionamiento instrumental. 2) Se endlizan las variables que afectan all reforzamiento positivo y se discuten las prin- cipales teorfas actuales del reforzamiento 5) Se define e! procedimiento de éxtincién fas Variables que afectan a ¢s- teprocedimiento de eliminacién de condue- ta, asf como las teorfes que intentan dar cuenta de su funcionamiento. '4) Se explican los procesos de generali- ‘zaci6n y discriminacién como les piezas cla~ ve del control de estimulos. Los temas se han ordenado siguiendo un orden de complejidad creciente de los pro- cesos de aprendizaje implicados. Asf, se er pieza por los procedimientos de adquisici y climinacién de respuestis: reforzamiento positivo y extincién. Dichas técnicas estén bbasadas, fundamentalmente, en el control de Ia conducta por sus consecuencias. A conti- nuacién, se explican los procedimientos de control de estimulos, que afaden una mayor ‘complejidad al paradigma bésico del condi- clonamiento instrumental, al hacerse més relevante el papel de los estimulos que pre~ ceden a la respuesta operante, * del dualismo cartesiano ala ley del efecto de Thorn En este apartado se tratarén, de forzosamente muy breve, las influencias 195 ricas e histdricas que ban guiado las investi gaciones sobre el aprendizaje. Siguiendo e Eequera de obras como lus de Keller 0973 yy Rachlin (1976b) al tratac de bus énes del estudio de la conducta instr fal, retrocederemos en el tempo by fildsofo francés René Descartes (1596-1650). Dicho autor, en su obra De homine, expoi Ja teorfa de que existen dos clases de con~ ducta humana: la voluntaria y la involunta~ ria, La primera esté gobernada por la mente y no tiene entidad fisica, En cambio, la se- ‘gunda es descrita por Descartes en términos puramente mecénicos, lo cual supone un no- table avance para las concepciones de la Spocal E] dualismo car ercusiones para la psicotogta posterior por que: a) supuso la divisién del estudio de la conducta humana cn conducta volun- , estudiada por los filésofos dentro de inea de !a mente, y conducta involunt ria, estudiada por los fisislogos dentro de la linea del cuerpo; b) las ideas cartesianas sobre Ia conducta’ ani son puros atutématas, s6lo tienen movimien- ~ tuvieron una amplia vigencia, pricticamente hasta la aparicin de de la evolucién de Darwin, que facili interés por la psicologfa compara: ‘Centréndonos en Ja conducta voluntaria por su especial impoctancia para nuestro tema de dio, hay que decir que para Ia mayoria siguiendo el pensamiento carte- siano— esta conducta no era predecible ni controlable, y, por tanto, diffe ° Jia hacer otra cosa mejor que describir in- twospectivamente c6mo la sentfa cada sujcto. Tal como ha sefialado Keller (1973), tos ma~ yores avances en el estudio de la Conducta voluntaria se produjeron por: las explicacio- nes tedricas de los fil6sofos asociacioni hedonistas y por la observacién y posterior cexperimentacién de Ta conducta de ensayo y ano tuvo importantes reg os animales de autores 7 Los asociacionistas britfnicos Alexander in (1818-1903) y Hexbert Spencer (18201903) ofrecieron una explicacién tedrica de lo 1¢ ellos denomin fimientos espon- téneos. En sfntesis, sv argumentacién apun- ta que, la primera vez, estos movimientos se producen sin un antecedente concreto ie los provoque, como en el caso de las s reflejas. Una vez que haa sido eimitidos, «lgunos de estos mo condu 160 , lizaron Lloyd Morgan (1852-1936) y Bdwat \ Thorndike (1874-1949). Morgan (1890), por 3 producen un estado satisfactorio, ia con el movimiento que lo pro: dlujo, y, en el futuro, el recuerdo de placer hard’ més probable la aparicién de dicho movimiento. Alla argumentaciGn te6rica de Bain y Spen- cer Ie faltaban las pruebas empfricas de Ia observacién y el experimento, tareas que rea- ejemplo, en su libro Animal life and intel ‘gence, describe objetivamente cémo apren- Gi6 su pervo a abrie la jandfn levantando la aldabi Se trata de una descrip- ci6n detallada de la observaci6n de un ap dizaje por ensayo y error. Los primeros éxperimentos de laboratario sobre conducta voluntaria fueron realizados por Thorndike, y presentados como parte de su tesis doctoral en 1898. La idea iniciat Thorndike, influido por la teorfa de la evo- lucién de Darwin, era estudier inteligencia animal. Para ello, Thorndike disei6 cajas- problema (puzzle-box) para gatos, perros 0 pollos. En uno de sus clsicos expetimentos se encerraba un gato, privado de comida, en Ia caja-problema y fuera, a Ta vista del ani- mal, se dejaba un trozo de pescado. Fl ani- mal podfa escaparse de la caja-problema, por mplo, descortiendo un cerrojo. Fntre tas miitiples respuestas que un animal confina- do puede dar, éste terminaba realizando el movimiento correcto y salfa de la caja ‘Thorndike lo volvia a poner en Ja situacién experimental y media el tiempo que tardaba el animal en eseaparse en cada ensayo. De esta forma, encontrd tna correlaciGn tiva entre el tiempo que el gato tardaba en escapatse y el niimero de ensayos realizados con éxito. Es decir, el aumento del nimero de ensayos hacfa disminuit Ia latencia de la respuesta del animal «. Thomdike interprets los resultados de sus -xperimentos en funcidn del aprendizaje de una asociacién 0 conexidn entte tos estimu- Tos de la caja y el movimiento espeetfico de Ia respuesta de huida. Las consecuencias de la respuesta exitosa —escapir de lx ca el alimento— séto servian para verta del fortalecer la asociacién entre tos estfmulos Bela caja y dicho movimiento. Después de Gheenar diversas especies animales en dife estes eajas-problema, Thomdike formuld Tho de los principios més importantes del Sprendizajes la ley del efecto. Seg dicha ley *Pfablecida por Thorndike, en 1911, en su Sora Animal intelligence, i una respuesta gn presencia de una determinada sitvacién es seguida por un acontecimiento satisfacto- fo, la asoetactén entre la respuesta y la si- tuaciGn ge fortalece, Sila respuesta es seguida por un acontecimientoinsatisfactoro, a 0- Eiacién se debilita. Asi pues, segin Thorn- dike, las consecuencias de Ta respuesta no tstin implicadas en el aprendizaje de la as0- iaci6n, Las cofsecuencias, saisfactorias 0 esagradables, elo sirven para fortalever 0 Gebilitar la asoctacin entre la respuesta y 1a situacién estimlo Sin embargo, a pesar de que Thorndike ya se habia apresurado a defini estado satisfac- foro comp aquel en que el animal no hace nada para évitar, haciendo a menudo cosas para alcanzarlo y preservatlo, y estado in- Bifsfactorio como aquel en que el animal trata do evtar y abandona. Los primeros con- { ductistas —Watson (1914) y Guthrie (1935) (no admitieron fa ley del efecto porque pen- \(|sben que el aprendizaje por ensayo y error se puede explicar por simple conga, sin Tecurrir a terminos mentalistas como estados fatisfactorios e insatisfactorios. En cambio, Skinner (938) critica el aspecto tebrico de Talley del efecto y la reformula como la ley del reforzamiento, concedigndole una impor- tancia capital dentro del condicionami operante : 10 INSTRUMENTAL APETITIVO LONDICIONA ‘condicionamiento operante de Ski La contribucién de Thorndike empers @ ser plenamente reconocida unos treinta aiios después de la presentacin sis doc- toral, cuando Skinner la enmazo6 dentro de 2) uneerpo te6rico més emplio. En 1930, Skin- vo un trabajo sobre la conducta di comer de la rata blanca: «Duthe conditions of the elicitation of certain eating reflenes En este articulo se describia un método ex- perimental que, con ligeras modificaciones, ha llegado a ser la pieza basica de la investi- gacibn en condicionamiento operante, El mé- todo se basaba en: a) Un dispositivo para dar tuna bolita de comida a una rata, privada del slimento, una vez que el animal abria I puer- tade un comedero. b) Un mecanismo de re- gistro que provocaba el movimiento vertical de una pluina subre la superficie cubierta de papel de un cilindro que giraba lentamente Siempre que la rata abrfa la puerta del co- medero, En un. segundo experimento, Skinner (1932) modifies el aparato, que con el tiem po serfa conocidd como «caja de Skinner, Y estudié Ja forma en que una nueva respuesta arbitraria podia relacionarse con la obtencién de comida, Eligié la respuesta de apretar la palanca situada en una de las paredes de la ‘aja experimental. Cada vez que el animal presionaba con suficiente fuerza la palanca Eunos 10 g— cafa una bolita de comida en tun pequeio comedero situado debajo de !a palanca. Asimismo, cada accionamiento de Ja palanea producfa una marca vertical en el 20 acumulativo que hemos descrito an- mente, Skinner, durante su estancia co- mo becario en Harvard, realiz6 una serie de experimentos con ratas en dicha caja y pre~ sent6 los resultados obtenidos, de una for- mma sistemética, en st primer libro;’ The behavior of organisms (1938) ‘Una caja de Skinner y el registro acumu- tivo que lleva incorporado muestran muy ‘gréficamente emo aumenta la frecuencia de emisin de una conducta —presionar la lanca, por ejemplo— siempre que ¥: guida por la presentacién inmedieta de Comida. A este proceso se le llama condi- eionamiento operante; asf pues, el térmnino condicionamiento operante se refiere al cceso por el cual fa frecuencia de apa ’a conducta queda modificada p consecuencias. De est 3 lidad de aparicién de una respuesta oper te est determinada, fundamentalmente, pot sus efectos, és decir, los acontecimientos am- bientales que si el pasado. feron a dicha 1.2.3. El procedimiento de condicionamiento of La caja de Skinner resulta especialmente stil para el estudio de una respuesta que el sujefo posea en su repertorio. La ejecucién de una respuesta instrumental eprendida ya bia estudiado en corredores reetos (rut- ways), laberintos y cajas-problema como fas de Thorndike como veremos en el apartado 1.4, Sin embargo, todos estos aparatos reque- an que se retirara al sujeto experimental después de cada ensayo y se volviera a colo- car al iniciar el siguiente ensayo, La caja de mite estudiar la conducta de una ra Continua, con las ventajas adiciona- les de disponer de equipos de programacién estimulos y de registro de respuestas, 10 cus! facilita la replicacién del trabajo expe- rimental BL Jimienio de condicionamiento operante en una demastracidn esténdar en la caja de Skiriner, se Heva a cabo de fa si- aguiente manera: se escoge un animal —por ejemplo, una rata de tres meses-~y durante bona semana se pesa diariamente para obt + su peso promedio con comida ad libi- tu. Después, cada dfa se le administra una ci6n corta de alimento hasta que el animal Tiega al 80 por 100 de su peso, momento en el que ya puede iniciarse el procedimiento de condicionamiento, que tiene las siguien- tes fases: 2) Ses Skinner. Duraite estas se: la actividad que damos comida (EI) a.un perto, éste saliva (RD. Se trata, luego, de conseguir por asociacidn de estimilos que, por ejemplo, un sonido provoque la salivacién (RC). Sin em- bargo, en el condicionamiento instrumental aunque las respuestas se den siempre ante d terminados estimulos, no podemos identi car ningin estimulo antecedente que provoque respustas operantes (ales. como apretar la pafanca en una x moneda a uoa méquina de be fio, Las aplicaciones del con instrumental quedarfan enormemente redu- cidas si no se contara con alguna t6cnica pa~ ra instaurar aquellas tespuestas que un determinado organismo todavia no ejecuta. Bl moldeamiento (shaping) es el procedi- miento experimental més utilizado para 1» operantes que, de otra forana, no h bieran aparccido en el repertorio del sujeto, fo hubieran tardado mucho en hacerlo. El moldeamicnto se puede definir como la consecucién gradual de una conducta final fo comportamiento meta, que no existe en cl repertorio de respuestas de un organismo 0 que se emite con una baja probabilidad. Es- 10 se logra mediante el reforzaméento dife- 1 de aquellas conductas que suponen MENTAL. APETTIND OAMIENTO INSTRUMENTA. gonpic aproximaciones sucesivas a conducta ter- ‘Rina. Ast, por ejemplo, para iniciar el c dicionamiento de la respuesta de apretar la palanca, podemos esperar que la rata dé di- tha respuesta para reforzarla, o podemos ins- favrarla més répidamente, mediante un moldeamiento manual. En este segundo ca- fo, el experimentador suele empezar refo Zando'a la rata, con una bolita de-comida, cuando ésta mira en cireccién a la palance; Iuego, cuando se acerca a la misma; poste riormente, cuando Tevanta las patas delante- res por encima de la palanca y, por tiltimo, Cuando aprieta el manipulandum. Por tanto, ‘vemos que la primera respuesta reforzada se descarta pronto y, a continuecién, se van re- forzando otras que se parecen més 0 tienen més elementos comunes en cuanto a st to pograffa con la respuesta final que se desea éstablecer. En los manuales de précticas Taboretorio d2 Goma (1985) y Michael (1963) pueden encontrarse descripciones mas deta- Tladas de todo el procedimiento de condicio- namiento instrumental. En la definicién de motdeamiento ap cfa un técmino nuevo: teforzamiento diferen cial. Este procedimiento consiste en reforzar ‘unas respulestas —segxin unos criterios prees~ tablecidos en cuanto a su topogiafia, inten~ sidad 0 frecuencia— y en no reforzar otras respuestas similares. De esta forma, aprove- chando que las respuestas de una misma clase van cambiando, y gracias al reforzamiento Giferencial, se logra disminuir la variabili- dad conductual y se aumenta la probabilidad de emisién de respuestas que, por aproxima- ciones sucesivas, se acercan a la respuesta final que se querfa instaurar. El moldeamiento ha sido una técnica muy utilizada, tanto por los adiestradores de ani males en el circo como por los psicélogos yy demas profesionales de la ensefianza para establecer conductas operantes complejas en sus sujetos que, de otra forma, dificilmente hubieran podido lograr. Para moldear de una manera efectiva una conducta, es necesario seguir unos pasos que Sundel y Stone Sun- del (1975, trad., 1981, pp. 57-58) resumen ash: Especificar la respuesta o respuesta er — Especificar los reforzadores positivos que se suministrarén. — Especificar respuestas iniciales inter- medias. La respuesta inicial que se refuerce tiene que parecerse en algo a Ia conducta ter- minal, Con mucha més precisién, Penzo (0986) sefiala que la respuesta inicial es — Ge todas las que existen on el repertcrio del sujeto— la que tiene mas elementos comu- hes con la conducta terminal, al menos, en cuanto a la topografia. De esta forma ya no hay excusa para no abordar un moldeamien- to, porque se considere que no existe una res- puesta inicial semejante en algo a la respuesta final. Reforzar diferencialmente la respuesta jnicial hasta que ocurra de una manera con- sistente 0, como dirfames en términos mas funcionales, hasta que la respuesta deseada sea la que tenga una probebilidad mayor de presentarse — Cambiar cl eriterio de sefor uuna respuesta intermedia — Reforzar la respuesta intermedia hasta que ocurra también consistentemente. Ls respuestas intermedias se irén aproximando, ‘paso a paso, al comportsmiento final. Eleri {erio de reforzamiento se cambia a respues tas que cada vez. son més semejantes a la conducta terminal. — Cambiar el ctiterio de reforzamiento a a respuesta intermedia siguiente. — Reforzar esa respuesta hasta que tam- ign ocurra consistentemente, Estos dos tl- fimos pasos se repiten hasta lograr la conducta termina. smiento a Pese a sus numerosas aplicaciones pi cas, el moldeamiento presenta algunos nconvenientes en Ia investigacién bésica, En primer lugar, exige la presencia activa deli Nestigador durante toda la sesiéa experime: tal. En segundo lugar. —3 importante —, el condicionamiento de un ani nal en la caja de Skinner mediante el pro- Redioniento de moldcamiento manual depende Ge las respuestas del organisiig, ¥-de Ja ha- i tandarizacion del moldeamiento manual, mu. i la técnica del automoldeamien- to (autoshaping) 68)— es un Procedimiento iccidn especifica de la especie stimulo relevante, Asi, paloma de picotear un kinner se condiciona, Presentaciones periddicas dé administeacién del alimento iluminacién det asocia con un es Fespuesta de la disco en la caja comida y cada va precedida de una breve disco de respuesta, Conviei la presentacién de comida si iente de la respuesta que ejecuta 50 asociaciones ) con ta comida Tras unas 40 6 et animal picotea el di tomoldeamiento se ha conse a como reforzador ida. Asimismo, se ha lo- también utilizando focan un tablero iluminado y las ratas aprietan la palanca (Locusto, Te ¢ ¥ Gibbon, 1976), I de Conducta de'la Universi de Barcelona, Ferré (1985a) fancionamiento un procedimienta z para moldear I respuesta de apretar sf pues, el automoldea- ternativa experimen. le moldeamiento manual miento es una buena tal al procectimiento d Por aproximaciones sucesivi Fespuesta operante clegida dé © muy similar e los sujetos experi- dificil. Por tanto, a sados en estudiar ito en sf, el automoldeamien- S propias de su ny estandarizacién, apartado solo se ha descrita et o ser que estemos int to proporciona las ve moldeamiento como técnica pe spliesta operante. No se ha analizad ticamente, pues dicho procedi findamentalmente, en asoci nas de estimulos, aunqu Rachlin (1976b)— también se da una interac cién con pautas innatas de condu: ccontingencias instrume jiaciones pavlovia. tales. Para un mayor desarrollo del tema véanse los trabajos de Al. caraz (cap. 7 de esto manual), Bi Ferré (1985b), Hearst y cart y Gaman (1977), * del condicio Jenkins (1974), Lo: Terrace y Gibbon (1981) y Schwaits paratos y unidades de medida nty instrumental Para una mejor comprensién de los resul- fados. obtenidos en fos «1 aprendizaje instromental, puede result detenernos un momento en la descripeién de los principales aparetos y en la definicidn de las unidades de medida mn: han utilizada Ios este tema. Fa cuanto a los apa: experiments de is importantes que fos més utilizados en el estudio det aprendizaje instrumental, podemas cit tistintas t 1a de Thonike ( de Skinner: l corredar recto (ruin 0s dle Isherintos (raze) uzzle bax) y la caja iin el aparato utilizado, el aprendizaje se mide por unidade mo: el tiempo de carrera, Ia veloc carrera, 1a probabilidad de eleccién de res- Pucsta, la latencia de respuesta y la frecuen- ia 0 tasa de Ele Ilo. tremo y una e: un esta, Tedor recto (vid. fig. 1) es un pasi- ado, con una caja de salida en un ex- meta ciel otro. Alempezar fa se coloca en Ia caja de sali- da, luego se levanta la barrera qu pal del corredor y, tris eféctu do, el animal llega @ la caja meta algiin reforzador positiva, como agua 0.co- ida, a el correder recto, generalment a, es decir, to que tarda el ani- g 2 5 2 g B 5 3 Fi, le Corredoc tect, ll en Ty caja problema de Thorndike Ses a caja de salida, M, la caja de ral en atravesar el corredor principal y legar a la’caja meta. A efectos comparativos esta medida se puede transformar fécilmente en otra llamada velocidad de carrera, que se ob- tiene dividiendo la longitud recorrida por el tiempo de carrera. Entre las diferentes clases de laberin ‘uno de los més utilizados tn condicionamie to instrumental ha sido el laberinto en T (fig. 1), El laberinto en TT esté formado por tuna éaja de salida y un coredot ea forma * de’, con una caja meta en cada uno de los, bbrazos del corredor. En el experimento tipi- o se coloca comida en una caja meta y se deja vacta Ia otra. El investigador cuenia el ndmery de veces que cl animal elige el bra- 20 cortecto, midiendo asf el aprendizaje por lu probabilidad de eleccién de la respuesta ‘correcta Lacoja-problema de Thorndike (fig. 1) fue el aparato que utilizé este investigadot en sus trabajos experimentales. En ella se encerra- ba un animal privado de comida, un gato en Ja mayorfa de las ocasiones, y fuera, ala vista del animal, se dejaba un trozo de pescado. Segiin los casos, el animal podfa escaparse de la caja pisando una palanca, descorrien- do un cerrojo, tirando de una cuerda o ha- ciendo cualquier otra tarea mecénica. Cuando el animal lograba escaparse, tras consumit el reforzador positivo, era introducido de nuc- vo enla caja. Thorndike media et tiempo que tardaba el animal en escaparse en cada en: sayo, es decir, su latencia de respuesta. Los tres aparatos descritos anteriormente miden respuestas discretas y tienen Ia des- ventaja que, después de cada ensayo, el ex- perime: ha de manipular el sujeto. 167 perate para medir Tinua, conocido actualmente como caja de Skinner (vid. fig. 2). Este investigador en su artfculo «A case history in scientific methods (1956) explica, de una manera informal, c6- mo disefé a Jo largo de varios afios su ap: rato y c6mo encontré por serendipity variable dependiente muy adecuada para su medicidn y control: la frecuencia o tasa de respuesta En la actualidad existea c kinner adaptadas a diferentes especies anima siendo las mAs comunes las de ratas y palo- mas. En (oda ellas existe un manipulanduin una palanca para [as ratas 0 un disco para las palomas— que va conectado automtica- mente al mecanismo que distribuye el pondiente reforzador: gencralmente, holita de comida en el caso de las ratas, © el acceso durante 3 seg a un comedero que se introduce en la caja con una mezcla de grano muetto en el caso de las palomas. Ademés las respuestas operantes al manip tas instrumen otografia de una caja de Skinner. (Labs uedan anotadas automtican lum nente en el reg mulativo, El registro acu- mulativo (vid. fig. 3) consta de un papel que se desenrolla a una velocidad constante y dos plumillas. La plumilla A se desplaza s6lo horizontalmente y marca el paso del tiempo. La plumilla B se mueve hacia atri- ba cuando el organismo emite una respuesta operante —asf, en la figura 3 la primera respuesta ocurrié en b— y se desplaza hori- zontalmente cuando no se producen respues- tas; por ejemplo, entre b y c existe una pausa ga. Asimismo, la plamilla B seiala la administracién del reforzador con una rayi= fa ot La distancia vertical rec rida por esta plumilla indica el nimero de res puestas acumutadas que ha dado el organi mo experimental y Ia pendiente es el registro, rifico de la tas de respuesta del animal Para mas detalles sobre el funcionamiento def registro acumulativo puede consultarse Halland y Skinner (1961). Como ha si mente Bayés lel éxito de storio de Conducta, Universidad Autéooma €2 ‘Uaccelona.) Fig. 8 Registro acum se explicacién en elt: Skinner, fo mismo que en el caso de Pavlov, se debe'a su acertada eleccién de la unidad de medida conductual: la frecuencia de re puesta. La tasa o frecuencia de respuesta es un dato que: a) Puede ser observado, registrado y me- dido con facilidad, de forma fiable. 'b) Especifica claramente ta cantidad de conducta emitida (Honig, 1966). ¢) Es capaz de reflejar sutiles cambios a to fargo de periodos de tiempo dilatados. ‘d) Permite la comparacién conduetual en- * tre especies distintas (Skinner, 1956). Sin embargo, pese a estas indudables ven tajas, pensamos que, en algunos casos, ba si- do. un error que la_mayoria de los experimentos de condicionamiento instru- rental se hayan limitado a registrar Ia tas de respuesta como ‘nica unidad de medida TT Puma B - | Plurnilla A c. En algunos estudios otras unidades de medida —latencia 0 probabili- dad de eleccién— u otras propiedades de la respuesta —topograffa o intensidad— ran podido proporcionar una informacién més completa e interesante, pese a sit mayor dificultad de medici6n o registro, ies clases jonamiento instru erminada probabilidad ua cambio ¢ ambiente. Se da, por tanto, una correlaciGn centre la respuesta y su consecuencia, al igust que en el condicionamiento se produce una correlacién entre el EC y el ne que, en el futuro, una det ducta instrumental ocurriré con mayor petitive) Presentacién Recompensa Castigo r Escape Eliminacién | Omisién aes Fic, 4. Matti de tos evatto procedimientas principales de condiciowamienta instrumes P ples de menor probabilidad, s iin las que haya tenido en el pasado, De esta for- ma, podemos decir que la condueta operante o instrumental esi controlada, fondamental- mente, por sus consce; Para analizar las consecuencias de la con- ducta instruunental hay que recordar que, des- pués de la emisi6n de una respuesta operante, Se pueden tanto presentar como retirar dos estimulos: esttmulos positives 0 petitivos y estimulos negativos 0 aversivos. eniendo en cuenta fa naturaleza 2 aversiva de los estfmulos y las operaciones de presentacién 0 eliminacién de los mismos, nos elaborar una matriz.con los cuatro pales procedimientos de condici o instrimental (vid. fig. 4). E] entrenamiento de recompensa ya se ha descrito como el procedimiento experi- nental esténdar del condicionamiento ope ante dé Skinner en el apartado 1.2.1 fiere a todas aquellas situaciones en que laemisin de una r instru va seguida de Ia presenfaci6h de un estim lo positive. Asf, por ejemplo, un nifio se viste solo y recibe la aprobacién de sus pa- dres. Cuando la presentacién de un estimu- lo positive aumenta la probabiliad futura de einisién de la respuesta ala que sigue, el pro- cedimiento, técnicamente, se denomina re forzamiento positive. 170 EI procedimiento de castigo se refiere a to- das las situaciones en les que hay una corre- lacién positiva entre la la respuesta instrumental y la presentacién del estimulo aversivo. Asf, por ejemplo, cuan- do la rata apriefa la palanca y recibe una des. carga eléettica, 0 cuando un nifio cruza la calle sin mirar’y su madre le rific. La pre- de Jos estimulos aversivos corres- ye la probabilidad de que conductas en el futuro. sion se da enan se emitan El pro tirada contingente de un estimulo positivo, que-se hallaba en el entorno del organismo. Por ejemplo, cuando un nifio tira la sopa al suelo y sus padres le retiran cl pastel que (e- nfa a la vista. En este caso, se produce un segundo tipo de castigo por retirada de un estimulo positive, que también disminuiré la probabilidad de que la respuesta yuelva a ‘ocutrir. A veces este procedimiento se com~ bina con otra técnica: el reforzamicnto dife- rencial de otras conductas, que consiste en reforzar cualquier respuesta excepto la que produce la retirada del estimulo positivo. En el procedimiento de escape y evtacién, la respuesta instrumental elimina 9 previene Ia presentacién de un estfimulo aversivo in- condicionado (BAI). En el caso del escape, dicho estfmulo est presente y la emisiéa de CONDICIONAMIENTO INSTRUMENTAL APETITIVO, ol la respuesta instrumental lo elimina. Asf, cuando un perro recibe una descarga en una pala y se escapa ée ella Ievantando dicha pa- ta, realiza un comportamiento de escape. En el procedimiento de evitacién, el EAL aco: tumbra a ir precedido de un estimulo aversi- vo condicionado (EAC), que sirve como sefial de aviso para dar la respuesta instru- mental adecuada y evitar la administracién del EAI. En el ejemplo amerior, si la des- carga fuera precedida sistemdticamente por vuna luz, legaria un momento en que el pe- ro levantarfa la pata al encenderse la luz, con Jo cual evitarfa la presentacién de la descarga De los cuatro procedimientos descritos de condicionamiento instrumental hay dos de reforzamiento, que sirven para fortalecer las respuestas operantes: Ia recompensa y Ta evitacién, Los otros dos son de castigo y sirven para debilitar las conductas instrumen- tales: el castigo y la omisién. Asimismo, dos procedimientos se basan en estimulos positivos: el reforzamiento positivo o entre namiento de recompensa y la omisi6n. De ellos se hablard en el resto del capitulo, prin- cipalmente del reforzamiento positive. Los otros dos procedimientos —el castigo y la evitaci6n— se basan en estimulos aversivos y se describen en el capitulo 5 de este ma- ‘nual. Para un andlisis de las cuatro clases principales de condicionamiento instrumental en funcién de la contighidad, contingencia y correlacién, constltese Rachlin (1976a, irad., 1979, p. 249). Para una clasificacién completa de las contingencias instrumenta- Ies, tanto si las consecuencias de Ia conduc~ tas son contingentes ala emisién de una respuesta como a la ausencia de una res- puesta, véase Domjan y Burkhard (1982, pp. 117120). [2.] ANAUIsIS EXPERIMENTAL DE LA CONDUCTA INSTRUMENTAL: REFORZAMIENTO POSITIVO Los experimentos. de condicionamiento instrumental se disefian de manera que pue- da emitirse y medirse una conducta operan- te con facilidad. Esto implica seleccionar un sujeto, una respuesta y un reforzador, tal co- mo sefialan Domjan y Burkhard (1982). La cleccién que se haga de estas tres variables influird, enormemente, en los resultados que se obtengan en el correspondiente aprendi- zaje instrumental. Con esto se quiere sefia- lar que la generalizacién de los resultadcs obtenidos queda limitada en funcién de los parémetcos que se clijan de cada una de es- {as variables, En primer lugar, el aprendizaje est influ do por todas las caracterfsticas del organi mo elegido: su aparato sensorial, motor, su sistema nervioso... Ades dicho sujeto ex- perimental puede estar privado de alimento o saciado y puede tener experiencia en la si- tuacién de aprendizaje o ser experimental- mente ingenuo. Las variables del sujeto motivacién —definida operacionalmente en ‘érminos de privacién o saciedad— y expe- riencia previa se pueden considerar Tas més relevantes en el estudio del condicionamiento instrumental en animales. En los estudios de Cotton (1953), Cruz (1973, 1984), Fester y Skinner (1957) y Sidman y Stebbins (1954) se comprueba c6ino queda ufectada la eje~ ‘cucién por cl correspondiite nivel de pri- vaci6a 0 saciedad. En los trabajos de Harlow (1949) sobre conjuntos de aprendizaje y en Tos de Overmaier y Seligman (1967) y Se- Jigman y Maier (1967) sobre indefensién aprendida, se constata la infliiencia de la ex- periencia previa en un posterior aprendizaje. En segundo lugar, la constitucion fisica de un organismo delimita el rango de conduc- tas que éste puede realizar. Asi, por ejem- plo, las ratas no aprenden a tocar el piano. ‘Adems de esta limitaci6n, en el repertorio conductual de un sujeto hay respuestas que se aprenden mids lentamente o se deterioran, una Vez aprendidas, sunque el animal las pue- da cjecutar sin ninguna dificultad y el refor- zador se presente contingentemenie y con la adecuada contigilidad temporal. Thorndike, el iniciador de los trabajos experimentales so- bre condicionamiento instrumental, observ que los gatos aprendfan fécilmente a tirar de m1 una cadena, pulsar un bot6n o apretar una palanca para Salir de alguna de sus cajas. Sin embargo, Thorndike también fue cl primero fen sefialar que cuando los gatos habfan de Tamerse 0 rascarse —los gatos se rascan pa- ra quitarse el picor y se lamen para limpiar- se, muy frecuentemente— para salir de otra caja, que s6lo podia abrir el experimentador, el aprendizaje resultaba dificil y las respuestas instrumentals eran un simple vestigio 0 pa- rodia del lamerse o rascarse. En este tltimo caso, los pobres resultados obtenidos se pue- den explicar porque Ia respuesta requerida no gearda relacién con el reforzador que se administra ‘La importancia de la respuesta clegida en el condicionamiento instrumental se hizo mis evidente a partir del ya clisica estudio de Bre- land y Breland (1961), que Mamé la atencién sobre las pautas de respuesta espectficas de Ta especie. Los Breland —después de dedi- arse con éxito durante quince afios al adies- tramiento de animales de circo, con técnicas operantes— publicaron en 1961 ef artfculo «The misbehavior of organisms» en el que ex- plican algunos de sus fracasos con diferen- males. En todos los casos se comenzar el condicionamiento el animat aprendfa con ra- pidez. una respuesta recompensada positiva- mente, pero después, otra respuesta se cou la primera. Asf, por ejemplo, durante unos dias vn condo cogfa y transpor- a monedas de madera y las depositaba en una hucha en forma de cerdito. Sin embar- 0, al cabo de unas semanas, Tos cerdos al transportar la moneda la dejaban caer varias vyeees, la hocicaban, la tiraban al aire... Para asegurarse de que estos comportamientos no se debian a efectos de saciedad, los Breland aumentaron el nivel de privacién de tos ani- males, pero las conductas problematicas per sistieron. La conducta de fos cerdos de ‘bar en el suelo con el hocico podfa con se una reacciOn especifica de la es- pecie, que interferfa el aprendizaje de la condita instrumiental. !2n cambio, en ot ‘ocasiones, las reacciones especificas de la es pecie favorecen un aprendizaje apetitivo. Tal im, eel caso del automoldeamiento descrito en elapartsdo 13. Para autores como Seligman, las diferen- cias en el aprendizaje reflejarfan cl diferen- te grado de preparacién, para aprender las respuestas y las asociaciones requeridas se- ‘gn Ia historia evolutiva del animal. De esta forma, Seligman (1970) introdujo el concep- to de preparacién, tanto en el aprendizaje clésico como en el instrumental. Este con- cepio ha sido itil para despertar el interés por el estudio de nuevas respuestas y nue- vas situaciones de aprendiraje y advertir la importancia de fos factores evolutivos. ‘Sin embargo, el concepto de preparacién ha ayudado muy poco a disefiar investigacio- nes que aumenten nuestra comprensién de los mecanismos del aprendizaje y presenta varios punins débiles, tal como lian si do Cabrer, Daza y Ribes (1975), Domjan y Burkhard (1982, p. 140), Domjan y.Galef (0983, p. 154) y Rachlin (1976, trad., 1977, pp. 218-220). Finalmente, otra variable importante en la adquisicién y of mantenimiento de ta conduc- ta instrumental es el estfimulo que se presenta como consecuencia de la respltesta emitida En una serie de experimentos se han estu- diado catacteristicas de reforzamiento tales como su cantidad y su cualidad, En otzos mit- chos estudios se han investigado factores como Ia contigiidad o demora de su presen- tacién y la contingencia de reforzamiento im- plicada en su administracién, Debido a su importancia y al gran mimero de trabajos 50- bre el tema dedicaremos el préximo aparta- do ala deseripci6n de las variables de Tas qu depende la efectividad del reforzamiento po- sitio. 21. Pardime __ positive as revisar diferentes manvales de apren- dizaje como los de Davey 981), Kimble (1961), Mackintosh (974, 1983) y Taspy (975, 1982), podemos'considetar como pardmetros ms importantes del reforzamiento positive: g 3 5 2 al = 3 Ss 5 g § 8 19 magnitud del reforzador, la demora del re= forzamiento y Ia contin miento. 2.1.1. Magnitud del reforzador Como sefiala Kimble (1961), el concepto de magnitud del reforzador incluye dos pro- piedades diferentes de los reforzadores: Ia cantidad y la cualidad. Asf pues, !a magni- tud del reforzador puede cambiarse de mu- chas maneras: aumentando el nimero de bolitas que se dan a un animal, el tiempo de acceso al reforzador, la concentracién de una determinada sustancia utilizada como refor- zador —por ejemplo, sacarosa— 0, mAs drés- ticamente, presentando un estimulo diferente a los poderosos reforzadores positivos habi- tuales: comida y agua. En este sentido re- sultan interesantes los experimentos sobre reforzamiento sensorial, en los cuales, un pe~ quefio cambio en la estimvlacién sensorial, introdocido contingentemmente ala emisién de Ja respuesta instrumental, puede lograr la ad- quisicion de dicha respuesta. Véase la revi- sién de Kish (1966) Al analizar los efectos de la magnitud del reforzadot hay que sefialar que, en términos enerales, el aprendizaje instrumental esté1e- Tacionado positivamente con la cantidad de eforzamiento (Crespi, 1942; Gonzélez y Bit- terman, 1967; Logan, 1960). Dicha afirma- cién conviene matizatla, pues Tarpy (1982) recopila una serie de trabajos de etélogos en los cuales se observa que los animales tien- den a optimizar la relacion entre energia re~ cibida (magnitud del reforcamiento) y energia ‘consumida (esfuerzo de respuesta). Desde un unto de vista adaptativo, el animal no ha de gastar més energia de la que gana. Por * tanto, como concluye acertadamente Tarpy (1982, trad., 1986, p. 117), «lo importante no es simplemente ta magnitud de recompensa (energia ganada), sino la razin entre ener- ‘fa panada y encrgfa consumidar, 0, dicho deotro modo, «et principio de que el apren- Gizaje de respuestas se inerementa en fun- cién de la magnitud de recompensa es cierio sélo si el esfuerzo de ta respuestg Po invertido en sla se maniienea oe Otro aspecto a destecar en el anata ta magninud del reforeador es que sage tela adquisicién de una respuesta insta tal, se cambia la cantidad de reforeamiesty de una forma répica e importante, cohen van los correspondientes cambios en fae cucién. De esta manera aparece el ocr ie contraste desctto por Crespi (942), Be comprobé que, aumentando le eanidad ae ecompensa, 1a velocidad de carters de se grupo de ratas en un corredor recto erat Perior a la de un grupo control, enlgenato desde cl inicio del eoncicionamienw eon it cha cantidad de recomponsa alta efecto de Contraste positive). Asimismo, Crespi veri. fics que, dismimuyendo la cantidad de recone psa la velocidad de earrera de otro grupo de ratas resultaba inferior ala del grupo cone trol, entienado desde el principio del expe- rimento con dicha cantidad de recompensa baja (efecto de contraste negativo). Este chee to de contraste también se ha observado carn. biando la cuatidad del eforzador, la demora 0 el programa de reforzamient Finalmente, sefialemos que se pueden es- tudiar simulténeamente los efectos produci dos por cambios tanto en la canted como en la ciualidad del reforzador. Ast, en el ox, perimento de Hutt (0954) se entrené a unos Tatas a apretar la palanca en una calade Skane ner, utilizando como reforcador tna mezela semilfquida de leche, harina y agua, Median ten disefo factorial 3 x 3, se vais In cam, lidad y la cantidad del reforzador de tes maneras diferentes. En canto ala cuslided del reforzador, un grupo de ratas obtenta ty mezcla normal de lecke, harina y agua, Al segundo grupo se le dio el mismo teforsa- dor, pero afiadiéndole deido eftcg, yal forzador del tereer grupo se le aiadio sacarina. En cuanto a la cantidad del refer. zador, dentro de cada uno de los tes propos anteriores, se formaion tes‘subrupes fue recibieron, respectivernente reforzador: pequefi, 3 m y grande, 50.mg. Ea la Gig Je frecuencia media de rsp y el tiem: nstantese, Re: Normal Duteo is ta | ss po y se observa que tanto el idad como de la cantidad mento. de fa Sala. produjo una tasa de respuesta m cionamiento instrumental es ua pardmetro cequivalente al intervalo EC-EI en el condi cionamiento csico. En ambos casos, al avmentar la demora disminuye la ejecucién (vid. revisin de Tarpy y Sawabini, 1974), Aunque resulta evidente que el reforzador de 174 dad y cualidad del jprear ta palanca en grupos de mtas, nos qu dad y cualidad d Media Grande addr, (Poente: Hust, 1954.) a la zespuesta instrumental con la ima dilaci6a posible, para lograt su m4- ma efettividad, sin embargo, en la litera- tura experimental existen importantes discrepancias en cuanto a la demora que pue- tolerar un organismo, logrando atin, a pe- sar de es0, un adecuado nivel de aprendizaje. experimentos con ratas en Iaberintos en T, dicha demiora oscila entre 5 seg (Grice, 1948) y 2 seg (Wolfe, 1934). Pata explicar las discrepancias de los re~ sultados antes citados se han formulado dos hipste rma que Ia dismi- muicién en Ja ejecucién se debe. a respuestas La primera competitivas que se hay producido entre 1a Sal coneretn 06 c todas las respuestas ter don y Simmelhag, (1971). El modelo de Stad- ‘minales posibles, limitando la variabilidad jon y Simmelhag tiene la venaja de explicar, Conduetual en un momento determinado, ef on exit en algunos casos, cogduc- _funeidn de tas SEG! 1s predominantes en ten que han resultado dificiles de interpretar_—¢h Fperion? die la especie biolégica es- te ee tears del reforzamiento: las res- tina, puestas preparadas, las conducts adjuntivas, neste apartado, se han repasado Breve Bucstas Pisleamiento y, especialmente, In mente Jas pales teovfas sobre el refor- or atvcta supersticiosa. Todos estos fendme- Zamleno, positivo y se ha podido ver que conductuales tan dispares Genen en co- TABS ‘de ellas 3 suficiente para explicar Oo aa eeealaage Doman, y) ‘odor Ws ee doves conocidos. Sin emba- Burkhard (982) la administraci6n perié- 6 eOn0 achlin (9166, trad» 1977 Bore pacniento y que snuctas de las P- 46),

You might also like