P. 1
Condicionamiento_Operante

Condicionamiento_Operante

|Views: 254|Likes:
Published by skoria zozial

More info:

Published by: skoria zozial on Sep 26, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

10/19/2014

pdf

text

original

3.2.

CONDICIONAMIENTO OPERANTE (INSTRUMENTAL)

El condicionamiento operante es una expresión introducida por F. Keller y W. Shoenfeld (1950) en sustitución del término condicionamiento tipo R de Skinner, de acuerdo a estos autores existen algunos estímulos que tienen la propiedad de poder fortalecer las respuestas que las producen. Al fortalecimiento se le puede denominar Condicionamiento Operante y los estímulos pueden ser considerados como pertenecientes a una clase denominada estímulos reforzadores. El condicionamiento operante en términos genéricos se define como el proceso por el cual una conducta (operante) es alterada o modificada por las consecuencias que producen su propia ejecución. Este término también se utiliza como sinónimo de ciencia experimental de la conducta (Reynolds, 1968). La conducta operante “opera” o produce cambios en el medio ambiente (consecuencias). Estos cambios en el medio ambiente pueden ser la presentación o eliminación de estímulos; la eliminación o presentación de estímulos dan lugar a las consecuencias de la conducta. Las consecuencias de la conducta operante pueden ser reforzantes o aversivas. Si una consecuencia es reforzante, la conducta que la produjo tenderá a incrementar su probabilidad de ocurrencia futura; si la consecuencia es aversiva, la conducta que la produjo tenderá a decrementar su probabilidad de ocurrencia futura. Cuando a una conducta le sigue la presentación de un estímulo, se dice que la contingencia es positiva. El término positivo señala que luego de la emisión de la conducta se le ha sumado (+) un estímulo. Cuando a la conducta le sigue la eliminación de un estímulo, se dice que la contingencia es negativa, el término negativo señala que luego de la emisión de la conducta se le ha restado o quitado (-) un estímulo. CLASIFICACIÓN DE LOS ESTÍMULOS Los estímulos pueden ser reforzados o aversivos en virtud de su función o efecto que tenga sobre la conducta operante. Estímulos Reforzadores: Los estímulos reforzadores o reforzantes, son cualquier evento o estímulo que contingente a la emisión de una conducta produce un cambio (incremento) en la probabilidad futura de dicha conducta. Los reforzadores se pueden clasificar de manera muy diferente: 1) De acuerdo a su funcionalidad, en positivos y negativos (Skinner, 1953), 2) De acuerdo a su naturaleza en condicionados e incondicionados (Skinner, 1953), 3) De acuerdo a su uso en manipulables y consumibles (Bijou y Baer, 1966), 4) De acuerdo a su ubicación, en intrínsecos y extrínsecos (Tharp y Wetsel, 1969), y 5) De acuerdo a la intención del agente que los administra, en naturales y arbitrarios (Fester, 1967), etc. Para los fines del curso vamos a definir sólo la clasificación que hace Skinner de los reforzados. Skinner clasifica los reforzadores de acuerdo a dos criterios: según su naturaleza y según su funcionalidad.

a) Según su naturaleza: En virtud de que si las propiedades reforzantes del estímulo reforzador son innatas o
adquiridas, los reforzadores pueden ser incondicionados o primarios y condicionados o secundarios. Los Reforzadores Primarios.- Son aquellos cuyas propiedades reforzantes están determinadas por el valor que tienen para la supervivencia de la especie a la cual pertenece el organismo (historia filogenética), y no se deben a un proceso de condicionamiento. Por ejemplo: el agua, el alimento, la actividad sexual, el aire, un ruido fuerte, presión de un objeto agudo, etc. Los Reforzadores Secundarios.- Son aquellas cuyas propiedades reforzantes están basadas en la historia personal de cada organismo, debido a que han precedido o acompañado la presentación de un reforzador incondicionado. Por ejemplo: el dinero, las notas, la aprobación social, los regaños, etc.

b) Según su función: En dependencia de si las propiedades reforzantes están determinadas por la presentación de
estímulos o por la eliminación o evitación de estímulo contingente a la emisión de la conducta y pueden ser positivos o negativos. Reforzadores Positivos.- Son aquellos eventos o estímulos cuya presentación después de emitida una conducta incremente su futura probabilidad de ocurrencia. Ejemplo: el dinero, la comida, etc.

pellizcos en la cola del animal (Bradie y Beren. ruido. 1965). el reforzamiento se refiere a cualquiera de una amplia variedad de condiciones que pueden introducirse en una situación de aprendizaje para aumentar la probabilidad de ocurrencia de una determinada respuesta. 2) Si una conducta reduce su probabilidad como consecuencia de la presentación de ese estímulo (Séller y Schonfeld.. castigo positivo y castigo negativo. OPERACIÓ N E Estímulo Reforzador Estímulo Aversivo PRESENTACIÓN ELIMINACIÓN Reforzamiento Positivo (Incremento) Castigo Positivo (Decremento) Castigo Negativo (Decremento) Reforzamiento Negativo (Incremento) REFORZAMIENTO Es el procedimiento esencial para el establecimiento y fortalecimiento de una respuesta condicionada. sonidos fuertes (Azrin. luz a altas intensidades (Kaplan.I. Esta expresión fue introducida por Iván Pávlov (1927) y está implícita en todas las operaciones de condicionamiento descritas por él. esfuerzo manejando el vigor de la respuesta (Chung Shing-Ho. En el reforzamiento lo que se fortalece no es la respuesta que precede a la presentación del reforzador. Ejemplo: notas desaprobatorias. 1961). El término reforzamiento tiene dos significados distintos: uno fáctico y el otro teórico. ya que esta respuesta ha ocurrido y no se puede cambiar. 1958). golpes dados con la palanca (Skinner. 1967).Reforzadores Negativos.Son aquellos eventos o estímulos cuya eliminación incrementa la probabilidad de ocurrencia de la conducta que los elimina. reforzamiento negativo. MODALIDADES DEL CONDICIONAMIENTO OPERANTE. Se determina la consecuencia (reforzante o aversiva) en relación del efecto que dicha consecuencia tiene sobre la conducta que la produjo (incremento o decremento de su probabilidad de ocurrencia futura) ha dado lugar a cuatro modalidades básicas del condicionamiento operante: reforzamiento positivo. 1938). Hull lo iguala . ESTÍMULOS AVERSIVOS: Existen dos criterios para determinar si un estimulo es aversión o no: 1) Si fortalece la conducta que lo elimina y. 1956) estos son estímulos aversivos incondicionados y sirven de base a los estímulos aversivos condicionados. y también la presentación de un cierto tipo de estímulos en una relación temporal con una respuesta (Skinner) en donde un reforzador si sigue a una respuesta (condicionamiento operante). 1958). El significado teórico de reforzamiento varía considerablemente. sino la probabilidad futura de las respuestas que pertenecen a esa clase. 1965) sería mediante chorros de aire (Veiss y Laties. Existen dos clases de estímulos aversivos: condicionados e incondicionados. las modalidades de castigo (positivo o negativo) decrementan la probabilidad de ocurrencia de la conducta. 1950). y de si el estímulo que se presenta (+) o se elimina (-) es reforzador o aversivo. se ha investigado los efectos de los siguientes estímulos aversivos: choque eléctricos (Gibben. Estas condiciones pueden consistir en presentar un estímulo condicionado y a continuación. Las modalidades de reforzamiento (positivo o negativo) incrementa la probabilidad de ocurrencia de la conducta. reciben el nombre de reforzadores). regaños. En su sentido fáctico. tiempo fuera de reforzamiento positivo (Morse y Herroisten. después de un intervalo presentar un estímulo incondicionado (condicionamiento clásico) que es necesario para la formación de la respuesta condicionada (los estímulos incondicionados E. etc. En dependencia de si la contingencia (relación entre la respuesta y el estímulo) es positiva o negativa.

El reforzamiento negativo puede ser de dos clases: a) de evitación. El proceso conductual que se observa. Una definición teórica aceptable es la que señala que el reforzamiento es el “proceso mediador de aceptación de la acción (adiente o abiente) por retroalimentación. al estímulo reforzador R →Er+. propioceptivas e interoceptivas. El reforzamiento positivo es el principio fundamental sobre el cual descansa el análisis experimental de la conducta. FACTORES Y PARÁMETROS DEL REFORZAMIENTO . El presupuesto frecuentemente contiene una descripción del estado conductual anterior a la ejecución del procedimiento de una sucinta de lo que hace el experimentador. de manera que cuando el sujeto de la R desaparece el E aversivo dicha respuesta se vuelve más probable en el futuro. Representación del Paradigma: Presupuesto 1) Respuesta emitida con una frecuencia superior a cero.con al reducción del impulso. es decir. Guthrie lo considera como algo que altera una situación. Procedimiento: Preséntase a continuación de cada emisión del operante elegido. un procedimiento. Ejemplo: Darle un dulce a un niño tan pronto se lave las manos. la desaparición del estímulo debe ser una consecuencia de la conducta). Para definir el reforzamiento positivo no basta con especificar el procedimiento. un proceso y un resultado. Denny y Adelman lo ven como una causante de conducta. se ha alcanzado el resultado. es decir relacionada con las propiedades del estímulo y. La acción abiente es la que tiende a apartar el organismo de la fuente de estimulación la acción adiente tiende a aproximar o exponer al organismo al estímulo. REFORZAMIENTO NEGATIVO: Se refiere al reforzamiento (fortalecimiento) de una respuesta mediante la eliminación del estímulo (estímulo aversivo). sugiere que el reforzador se añada o se suma a la situación en que se presenta la conducta. es decir relacionada con las propiedades del estímulo y. sino que también se debe señalar el efecto de dicha operación. 1974) Todo paradigma conductual consistirá de un presupuesto. mientras que el reforzamiento negativo de escape (primario) la respuesta da por terminada la presentación de estímulos aversivos incondicionados. consecuentemente la respuesta volverá a repetirse en condiciones semejantes. En el reforzamiento negativo una respuesta da por terminada la presentación de un estímulo. (La respuesta es el medio a través del cual se retira o excluye aquel estímulo. 1971). 2) Un reforzador adecuado. para Thorndike. REFORZAMIENTO POSITIVO: Como procedimiento consiste en la presentación de un reforzador (positivo) contingente a la emisión de una conducta operante. Por lo general en el reforzamiento negativo se hacha mano a los estímulos aversivos. cuando el estímulo aversivo ya está presente. sin embargo este último no incrementa la frecuencia de una respuesta. Con frecuencia se confunde este procedimiento con el castigo. Skinner y Tolman lo manejan como estímulo. El reforzamiento implica la aceptación de la actividad desencadenada o emitida por el organismo en función de sus resultados a través de un proceso de feed-back o retroalimentación por el cual el acontecimiento ulterior fortalece el acontecimiento previo. dependiente del carácter mismo de la respuesta y de su relación con los cambios en el estado de necesidad del organismo (Raúl Gonzales. es decir relacionadas con las propiedades del estímulo y. El término positivo. propioceptivas. Esta retroinformación es esteroceptiva. sino la suprime. es un incremento en la tasa de respuesta que pertenecen a la clase de la emisión de la operante reforzada. 1974). en el reforzamiento negativo de evitación (secundario) la respuesta da por terminada la presentación de estímulos aversivos condicionados. Sheffield. y que también recibe el nombre de condicionamiento operante (Reynolds. es un satisfacer o un perturbador. su rápida incorporación a un cuerpo de conducta y un estrechamiento de la topografía operante. propioceptivas. el proceso informa brevemente lo que ocurre con el tiempo en aspectos importantes de la conducta según se siga aplicando el procedimiento y el resultado es el estado final del proceso. estudiar por sustituir una nota. Ejemplo: rascarse cuando nos pica algo. Más detalladamente. Proceso: Un incremento difícil es la tasa del operante. Cuando la conducta ha cesado de cambiar significativamente debido al procedimiento empleado. Resultado: Igual que el proceso. cuando el E aversivo no está presente aún dentro de la situación y b) de escape. o sea. PARADIGMA DEL REFORZAMIENTO OPERANTE (Millenson.

(Gonzáles. las necesidades son estados carenciales en el organismo. Está relacionado con las necesidades del organismo. c) FACTORES DE RESPUESTA. más nutritiva pero menos dulce. magnitud. El término de parámetro de reforzamiento se refiere a las dimensiones del reforzador que pueden variar independientemente. consumatorias y dominantes. en el sentido de reducción (reducción del impulso). la demora de reforzamiento. se utiliza como sinónimo de variable independientemente y se refiere a una variable cuyo valor se mantiene constante. y que es necesario tener en cuenta ciertos factores que van a facilitar u obstruir tal proceso. realizó experimentos utilizando las propiedades dulces de la sacarina que carece de valor nutritivo como reforzador. composición.FACTORES DEL REFORZAMIENTO. a) FACTORES DEL ORGANISMO. Las respuestas consumatorias son el final de una serie de acciones del organismo que le ocasionan un estado de adaptación a la situación. Son aquellas respuestas que preferentemente emite un organismo cuando tiene la ocasión de hacerlo. estas respuestas pueden actuar como reforzadores de otras respuestas emitidas previamente. El reforzamiento no puede reducirse solamente a la presentación de una consecuencia reforzante contingente a la conducta. Los cuatro principales parámetros de reforzamiento son: la magnitud. si es que siguen a otras conductas como resolver problemas mecánicos. lograron que un grupo de ratas aprendieran a oprimir una palanca que les permitiera correr en una rueda giratoria (las ratas vivían en espacios reducidos). que si no lo corrigen lo perturban o matan. La respuesta exploratoria emitida actuaba como reforzador. 2) La sacarina actúa como mejor reforzador que una solución de dextrosa. 2) RESPUESTAS CONSUMATORIAS. proximidad temporal con la respuesta. frecuencia. La acción de organismo (la respuesta) se puede manifestar también intrínsecamente reforzadora. Las propiedades sensoriales del estímulo son también factores del reforzamiento. como por ejemplo. 1) Se ha RESPUESTAS EXPLORATORIAS. mientras cambia el valor de otras variables. Los parámetros de reforzamiento se refieren a como determinadas dimensiones del estímulo reforzador controlan la ejecución en la situación del aprendizaje. los resultados fueron: 1) La sacarina tiene un alto valor reforzante como la comida. . PARÁMETROS DE REFORZAMIENTO. Los factores del reforzamiento más estudiados son aquellos que provienen del organismo. El término parámetros. etc. investigado papel de 3 tipos de respuestas: exploratoria. Las evidencias empíricas apoyan que las propiedades gustativas de la sacarina son un elemento reforzante. 3) RESPUESTAS DOMINANTES. el intervalo entre estímulos y los programas de reforzamiento. Existe evidencia experimental que el proceso de reforzamiento es complejo. La magnitud del reforzamiento abarca dos propiedades diferentes de los reforzadores: la cantidad y la calidad. Meyers y Miller lograron un aprendizaje de laberinto con ratas utilizando como reforzador el acceso de los animales a un comportamiento que podían explorar. Kagan y Ber Keen. Schoenfeld. a) MAGNITUD DE REFORZAMIENTO. Harlow ha demostrado que la respuesta manipulatoria muy intensa en los monos actúa como un reforzador. 1971). b) FACTORES DEL ESTÍMULO. El reforzamiento según Hull es producido por un cambio en el estado de necesidad. del estímulo y de la respuesta.

Los programas de reforzamiento intermitente se establecen en función de: 1) El reforzamiento puede administrarse sobre las bases determinadas por el número de respuestas y el tiempo. REFORZAMIENTO CONTINUO. El reforzamiento intermitente se administra de acuerdo a un programa en el que el reforzador se da en base a contingencias temporales o a una cierta cantidad de respuestas correctas.. Entre la emisión de la respuesta y la ocurrencia del reforzador transcurre un periodo de tiempo. tanto los intervalos mayores o menores ocasionan un condicionamiento más pobre. es decir el reforzador contingente a una conducta es presentada todas las veces. la ejecución aumenta a mayor magnitud en el reforzamiento (la función es negativamente acelerada. Es la acción de reforzar cada una de las respuestas emitidas por el sujeto. Consiste en especificar la probabilidad para cada respuesta elegida en un momento determinado en los cuales la presentación el reforzador es contingente o discontinua. estas se fortalecen más rápidamente que cuando se demore la presentación del reforzador. Se refiere al tiempo que transcurre entre la iniciación de un estímulo a condicionarse y del estímulo incondicionado (sólo es aplicable este parámetro al condicionamiento clásico). Por ahora parece improbable que el aprendizaje pueda efectuarse si la demora del reforzamiento pasa de unos cuantos segundos (6” ú 8”). Experimentos demuestran y sugieren que las respuestas cercanas en espacio o tiempo al reforzamiento se aprenden más rápidamente que las respuestas lejanas a él. es decir. o en cada ensayo o puede efectuarse en alguna fracción de estos. volumen o disposición del comedero para el organismo. REFORZAMIENTO INTERMITENTE. . 2) Que la contingencia temporal o de respuesta puede ser regular o irregular. c) INTERVALO ENTRE ESTÍMULOS. Los estudios experimentales demuestran que la separación óptima entre ambos estímulos es de 5 seg. A la relación temporal entre la ocurrencia de una conducta y las consecuencias reforzantes (en base al tiempo que media entre ambos) se le denomina Gradiente Temporal de Reforzamiento para señalar que al efecto del mismo será mayor cuando más cerca está el reforzador de la conducta. las ejecuciones que al inicio son bastante altas van decreciendo conforme el organismo se va saciando). Un Programa de Reforzamiento. b) DEMORA EN EL REFORZAMIENTO. es decir. o es presentado algunas veces y otras no. Los experimentos demuestran que la cantidad de reforzamiento influye sobre la ejecución de la situación de aprendizaje.La cantidad se especifica por medio de alguna medida física: peso. cómo y cuánto tiempo estará funcionando una contingencia de reforzamiento. En los aprendizajes humanos el reforzador de tipo secundario sirve de enlace entre la conducta y el reforzador primario. Se define como un plan o procedimiento que determina cuándo. (El reforzador se administra en cada ensayo correcto y para cada R. La calidad se especifica usualmente según las preferencias del organismo (un reforzador de alta calidad es aquel que un organismo prefiere en lugar de otros). esto da lugar a un reforzamiento continuo. si un reforzador sigue inmediatamente a una respuesta. La manera como se prescribe el reforzamiento para las conductas dan lugar a los programas de reforzamiento. esperada). Son los que solamente refuerzan algunas respuestas del total de respuestas emitidas por el sujeto. La magnitud del reforzamiento se refiere generalmente a la cantidad de reforzador que se administra en cada operación de reforzamiento (puede referirse al número de gramos administrados o el tiempo que permanece disponible para el animal el depósito de granos). d) PROGRAMAS DE REFORZAMIENTO El reforzamiento puede administrarse consistentemente en cada respuesta. esto da lugar al reforzamiento intermitente. Los arreglos alternativos así descritos son condiciones de reforzamiento continuo y parcial o intermitente.

por lo tanto será un programa de IV3’. 1974). 1. La serie podrá repetirse indefinidamente o bien. el promedio de la serie es 3’. El valor del programa lo determina el lapso que debe transcurrir para reforzar la primera respuesta que ocurre (IF60”).F. Se presenta el reforzador cada vez que el organismo emite determinado número fijo de respuestas que son siempre los mismos contados a partir del reforzamiento anterior. resistentes a la extinción. Por ejemplo. Un R. DE RAZÓN VARIABLE (R. hacen por ejemplo que el estudiante durante los primeros días no estudie muy poco. sin embargo. éstas no se reforzarían. 3. Se establece en base a un determinado tiempo (en segundos o minutos) medido a partir del último reforzamiento al término del cual se refuerza l a primera respuesta En este programa aparece un fenómeno denominado Festoneo. En este programa. 2’. en cuanto al nivel de ejecución. Se estructuran eligiendo de antemano diversos intervalos de tiempo de diferente duración.).V. y los basados en el número de respuestas de Razón. son denominados de Intervalo. Los exámenes que se programan para fecha determinada. producen respuestas más duraderas pero pausadas (resistentes a la extinción). (Ribes. los de Razón variable (RV) producen mayor cantidad (o controlan mayor cantidad) de la R que los programas de Razón Fija (RF). Los programas de reforzamiento intermitentes. 3’. 2. existen otros programas de reforzamiento que reciben el nombre genérico de Programas de Reforzamiento Diferencial. 5’.F. son conductas que en la vida diaria parecen controlables por este tipo de programas. En estos programas el paso del tiempo no guarda ninguna relación con la entrega del reforzador. algunos programas generan o controlan de manera particular ejecuciones más altas que otras así como. Ejemplo: el llamado trabajo al destajo en donde al obrero se le paga por determinada cantidad de productos que haya realizado (una docena de camisas por ejemplo). es decir. se estructuran con la finalidad de mantener ejecuciones altas de respuestas. supóngase la siguiente serie de intervalos: 2’. de R emitidas) los programas de razón producen frecuencias más altas de respuestas que los de intervalo en el tiempo (las R son más constantes). se podrán alterar sus valores cuidando el porcentaje de 4. Por ejemplo. (Nro. Pueden ser de dos tipos: 1) INTERVALO FIJO (I. presentándose el reforzador a la primera respuesta esperada o correcta emitida después de cumplirse el intervalo respectivo de tiempo.).).Los programas basados en el tiempo. para incrementar el mismo al cumplirse el tiempo fijado para el reforzamiento. Puede ser de dos tipos: DE RAZÓN FIJA (R. Los programas de variables generan R más resistentes a la extinción y entre ellos los de I. Las conductas de llamar por teléfono a una persona y las rabietas de un niño. Los programas de razón producen formas constantes de R (a la misma velocidad).V. En este tipo de programas se distribuyen los reforzamientos de acuerdo a una serie de razones al azar. CARACTERÍSTICAS DE LOS PROGRAMAS DE REFORZAMIENTO INTERMITENTE. Ejemplo: suponga que se eligen para reforzamiento las siguientes razones (Nro. algunos son más resistentes a la extinción que otros. . Los promedios de dichos valores da la razón valor del programa. eligiendo valores que difieren de reforzamiento a reforzamiento al azar. por lo tanto es un programa de RV4. teniendo un determinando promedio y cayendo dentro de los valores extremos arbitrarios. de R): 5. PROGRAMAS DE RAZÓN. un ejemplo de la vida diaria. OTROS TIPOS DE PROGRAMAS DE REFORZAMIENTO INTERMITENTE. 1. se reforzará al organismo cuando haya emitido 20 respuestas a partir del reforzamiento anterior. con bajo reforzamiento y. Además de los programas de Razón y de intervalo. Si antes de dicha lapso el organismo emitiera algunas respuestas. Entre los programas de razón. de 20.V).F. 8. los reforzamientos se disponen de acuerdo a serie de intervalos diferentes entre sí. 3) PROGRAMAS DE INTERVALO VARIABLE (I. las máquinas tragamonedas y los juegos de azar parecen controlados por este tipo de programas. PROGRAMAS DE INTERVALO. 3. el reforzador se administra de acuerdo a un número determinado de respuestas. Tienen como criterio el número de respuestas para el presentar el reforzador. que describe un espaciamiento en las ejecuciones del organismo al inicio del intervalo. teniendo un determinado promedio. Se define en función del tiempo reforzando la primera respuesta esperada o correcta que da el organismo luego de haber transcurrido el tiempo establecido. la razón promedio es 4. A los programas regulares se les denomina fijos y a los programas irregulares se les denomina variables. Esto da lugar a cuatro programas simples de reforzamiento intermitente: 2 de razón y 2 de intervalo que pueden ser fijos o variables. que se computa a partir del último reforzamiento obtenido. El valor del programa lo da la cantidad de respuestas requeridas para el reforzamiento (RF20). para incrementar la conducta de estudiar faltando un día u horas para el examen.

P.). 3. con lo cual se desea mantener frecuencias bajas de conducta. Los programas diferenciales de tasas pueden ser de tasas altas y de tasas bajas. Este programa se estructura especificando un máximo de respuestas en un mínimo de tiempo (lo que se espera es que el sujeto decremente su nivel de respuestas). se puede especificar el número de palabras u hojas que debe leer como mínimo. y el tiempo máximo que debe hacerlo. de R. CASTIGO: CONSIDERACIONES GENERALES El castigo desde hace mucho tiempo se ha utilizado como una forma de aprendizaje para hacer que un sujeto adquiera patrones de conducta adecuados o para evitar la repetición de conductas consideradas como inadecuadas (ejemplo. es decir. PROGRAMA DIFERENCIAL DE PAUSAS LARGAS (D. PROGRAMAS DE REFORZAMIENTO DIFERENCIAL DE PAUSAS.Los programas de reforzamiento diferencial se estructuran combinando los criterios de tiempo y el Nro. PROGRAMAS DE REFORZAMIENTO DIFERENCIAL DE TASAS. PROGRAMA DIFERENCIAL DE TASAS BAJAS (D. en los cuales el objetivo es elevar el nivel de respuestas que da el sujeto.B.A. Ejem. Dentro de estas consideraciones se supone que el castigo es lo opuesto al reforzamiento positivo o por lo menos actúa en forma opuesta (lo cual no es válido. Se emplea para incrementar la conducta de leer (velocidad de lectura). Por ejemplo. Este programa se estructura especificando un mínimo de respuestas en un máximo de tiempo.T. 1. B.3. de tal manera de que si el sujeto no cumple con un criterio establecido.L. Lo que se desea es incrementar la velocidad en la cual responde el sujeto. Este programa se estructura en base al mínimo de tiempo que debe transcurrir entre dos respuestas sucesivas. con lo cual se puede conseguir que el sujeto hable más rápidamente. PROGRAMA DIFERENCIAL DE TASAS (D. si el sujeto enciende el cigarrillo después de 10 minutos de haber terminado de fumar el cigarrillo anterior. entre cada palabra se pospone el reforzamiento hasta que el sujeto emita 2 palabras que están separadas entre si por 4 seg.C. el padre castiga a su hijo para que estudie o para que no llegue tarde a casa). sólo que el criterio que especifica en base al tiempo que debe transcurrir entre R y R (pausa entre respuestas y deben ser de pausas cortas y de pausas largas)..). a una frecuencia muy alta o muy baja (‘) y se estructuran en base a un mínimo o máximo de Rs. Por ejemplo tenemos un sujeto que habla demasiado lento y especificamos que el tiempo máximo que debe de ocurrir entre palabra y palabra es de 4 seg. 2. tenemos un sujeto que fuma en exceso y deseamos que fume menos. A. el criterio se puede ir variando hasta que el sujeto muestre escasas respuestas). y estos a su vez pueden ser de tasa altas o bajas y de pausas cortas o largas (según se desee incrementar o reducir el nivel de ejecución de un sujeto). . El objetivo de estos programas diferenciales es lograr que el sujeto responda con frecuencias más elevadas o reducidas de respuestas (a diferencia de los otros programas de razón y de intervalo. (3 hojas en 30 minutos por ejemplo). si el sujeto enciende un cigarrillo antes de los 10 minutos establecidos no se le refuerza y se le pospone el reforzador. (‘) Interesa el número de respuestas que va a dar el sujeto en un periodo de tiempo prefijado.. El objetivo de este programa es que el sujeto presente una R. En este programa se refuerza al sujeto si no tarda más de cierto lapso de máximo tiempo entre cada R (máximo de tiempo que debe transcurrir entre R y R). 2. así como su mantenimiento en el tiempo). Si el sujeto dice más de 5 palabras (6) en ese lapso pierde reforzamiento. se pospone la presentación del reforzador.). recibe reforzamiento.P.T. si el sujeto tarda más de 4 seg.: Si deseamos que un sujeto decremente su emisión de palabras soeces estableceremos un máximo de respuestas (5 por ejemplo) soeces admisibles dentro de un mínimo de tiempo (una hora). Por ejemplo. PROGRAMA DIFERENCIAL DE PAUSAS CORTAS (D. si lee menor cantidad de palabras u hojas pierde reforzamiento y vuelve a iniciarse un nuevo periodo. pero se emite 5 o menos R soeces se reforzará (el próximo criterio puede ser por ejemplo 3 palabras soeces en una hora. por ejemplo 10 minutos establecidos no se le refuerza y se le pospone el reforzador. Si el sujeto lee igual o mayor cantidad de palabras y hojas en el tiempo fijado se le administra reforzamiento. hasta que cumpla dicho criterio (‘). Los programas diferenciales pueden ser de dos tipos: de Tasas y de Pausas. si se desea que un niño lea a cierta velocidad. Estos programas persiguen un mantenimiento de frecuencias bajas o elevadas de conducta. 1.). se puede especificar un tiempo mínimo que debe transcurrir entre cada R de fumar. en un máximo o mínimo de tiempo.

en el momento de ocurrir el castigo. salvo en condiciones extremas. por ejemplo: − Las características o rasgos de la situación. 1966). ya que el mismo especifica que el estímulo aversivo acompañará a la conducta castigada y no a otra y que es necesario que el sujeto pueda emitir una conducta con la cual finalice la acción del estímulo castigador. hacer rabietas para conseguir lo que se quiere). y que esta reducción se describe mejor y con más propiedad si se le llama represión de conducta que eliminación de la misma. Ferster. en otros es simplemente decir no eso está mal hacer que el sujeto se retire de la situación en que se comporta: decirle que se vaya a su cuarto porque se ha comportado mal o quitar su bicicleta a un niño porque no ha hecho sus tareas. De acuerdo a este último factor. en algunos casos puede estar relacionado con la presentación de estímulos punitivos. están presentes otros factores que también pueden influir en la conducta. pero cuando esto ocurre. señala que el castigo no elimina una conducta sino solamente la reprime. si comprende alguna conducta que se ha reforzado positivamente. Los resultados señalan que los efectos supresores del castigo son pequeños cuando simultáneamente se refuerza la conducta y los efectos supresores son mayores cuando la respuesta se encuentra en periodo de extinción (Azrin y Holz. El estímulo se denomina estímulo castigador (Azrin y Holz. CASTIGO: DEFINICIÓN En términos generales el castigo es la reducción de la futura probabilidad de una R específica como resultado de la producción inmediata de un estímulo para esa conducta. El proceso del castigo es un fenómeno muy complicado. para los psicólogos la concepción del término es mucho más amplia. para observar la efectividad del castigo: la frecuencia con que se ha reforzado la conducta de manera positiva. El castigo se conceptualiza entonces. se pueden convertir en estímulos condicionados que producirán los mismos reflejos en el organismo que el E aversivo. El castigo no es entonces lo opuesto al reforzamiento positivo y solo reduce la conducta temporalmente. El término castigo en cuanto a su acepción popular se ha asimilado a la aplicación de consecuencias dolorosas. 1961). por lo cual es necesario tener en consideración tres factores potenciales de interacción. es decir el efecto del castigo consiste en reducir la operante reforzada. otras conductas del sujeto reforzadas negativamente por el estímulo aversivo que pueden incrementarse y el estado emocional que se origina en el individuo por la acción de la presentación de las consecuencias aversivas. − El castigo puede reducir la frecuencia de muchas ejecuciones además de las respuesta castigada como consecuencia de los estados emocionales generados por el estímulo aversivo (influyen en el estado de las conductas que el sujeto está emitiendo).lo opuesto al reforzamiento positivo es la extinción). propio del castigo puede reforzar indirectamente conductas operantes incompatibles de manera tan enérgica que parecen haber tenido un efecto sobre la conducta castigada. b) Se castiga una respuesta y al mismo tiempo se le administra un programa de reforzamiento positivo. − El estímulo aversivo. Existen dos procedimientos generales empleados en el estudio del castigo: a) Castigo de una respuesta durante el periodo de extinción. físicamente hablando. algunos teóricos señalan que el castigo debilita una respuesta reforzando conductas incompatibles. El castigo requiere siempre de la presentación de estímulos aversivos. como la consecuencia que sigue a una conducta y que la suprime reduciendo su probabilidad de ocurrencia (la consecuencia es aversiva). al servir el castigo como reforzador negativo para otras conductas en donde la aparición de la conducta incompatible es un resultado inevitable del procedimiento del castigo. Toda conducta que un sujeto emite de manera consistente es que ha sido reforzada y de alguna u otra manera tiene una utilidad funcional en el sujeto (por ejemplo. PROCEDIMIENTOS EMPLEADOS EN EL ESTUDIO DEL CASTIGO. todos estos ejemplos funcionan como castigo aunque no produzcan daño corporal en el sujeto. TIPOS DE CASTIGO: .

la respuesta castigada desaparece completamente y no reaparece nunca más.Consiste en hacer que el sujeto restituya en el ambiente los efectos que su conducta inadecuada ha producido en él: por ejemplo: que recoja el papel que tiró al suelo o que limpie las inscripciones que hizo sobre la pared. MANERA DE INTRODUCIR EL ESTÍMULO CASTIGADOR. en el tiempo fuera de reforzamiento lo que se hace es sacar al sujeto de la situación cuando el sujeto emite la conducta inadecuada. 4. Church (1936) separa 3 niveles de intensidad: a) Intensidad débil. B.Experimentalmente se ha estudiado tres modalidades diferentes de castigo. CASTIGO NEGATIVO. Por ejem. en donde la respuesta se vuelve a presentar en el futuro pero de manera incompleta. ello ocasionará la reducción de la respuesta cuya consecuencia es la pérdida del reforzador. c) Intensidades altas. Hay algunas evidencias experimentales que señalan que parámetros temporales menores a una hora no afectan la eficacia del ... b. CASTIGO POSITIVO. esto no tiene influencia notable sobre la conducta sin embargo.. 1. INTENSIDAD DEL ESTÍMULO CASTIGADOR.. que el padre le quite la propina al hijo por no haber cumplido con realizar las tareas. es decir.Si la intensidad del estímulo castigador es moderada se puede obtener dos efectos diferentes: b. es decir. como consecuencia. Se ha logrado la supresión total de la R con E. se le toma del brazo y se le retira del aula y se le lleva en un lugar especial en donde no haya reforzadores a la mano. se consigue una supresión total. El estímulo castigador si se introduce repentinamente puede mucha mayor supresión de la respuesta. consiste en quitarle al sujeto un reforzador que ya tiene como consecuencia la emisión de una conducta.Consiste en la presentación (aplicación) de un E aversivo o punitivo como consecuencia de la emisión de una conducta cuyo efecto es la presión de dicha conducta por reducción de su probabilidad futura de ocurrencia. Ej.: el manotón que aplica el padre a su hijo cada vez que éste habla palabras soeces. que involucran la utilización de estímulos aversivos incondicionados y condicionados. y de estímulos reforzadores positivos condicionados e incondicionados. que si el mismo se introduce a bajas intensidades y de manera gradual.2. TIEMPO FUERA DE REFORZAMIENTO. Una supresión parcial de la respuesta. Una supresión temporal de la respuesta. 3. SOBRECORRECCIÓN. que el sujeto recoja todos los papeles tirados en el suelo o que limpie todas las inscripciones que hay en la pared.1.Consiste en retirar al sujeto de la situación de reforzamiento como consecuencia de una conducta que deseamos suprimir. Puede considerarse un tipo de sobrecorrección con práctica positiva (más propiedades aversivas). El castigo para que tenga efecto supresor sobre una conducta específica. PARÁMETROS DEL CASTIGO. castigadores de intensidades elevadas. El castigo negativo o costo de respuesta. el niño se quedará allí durante un rato y después será integrado a la situación de estudio. en donde la respuesta vuelve a presentarse completamente. se la presentación se demora va perdiendo efectividad gradualmente. debe ser administrado inmediatamente después de dicha conducta. el sujeto pierde contacto con los estímulos reforzantes y discriminativos que mantienen su conducta... C. 2. INTERVALO ENTRE RESPUESTA Y CASTIGO. algunos aspectos de la respuesta original desaparecen del todo. Por ejem.Si la intensidad del estímulo castigador es baja. Ejem.. b) Intensidad moderada.La característica fundamental de este tipo de castigo es que se utiliza cuando el sujeto tiene a la mano algún reforzador positivo que es susceptible de ser retirado. si un niño no presta atención en clase y se dedica a juguetear.Si la intensidad del estímulo castigador es alta. el estímulo puede servir de señal para el organismo. Se han estudiado varios parámetros del estímulo castigador: A. según el caso anterior.

terror.) se han observado una supresión anticipatoria. haciendo que el organismo regrese al nivel previo que tenían antes del reforzamiento. 1955. deja de ser reforzada en un momento determinado...Se han encontrado una completa reversibilidad una vez que la respuesta se ha suprimido.. la extinción consiste en dejar de presentar el estímulo reforzador.Es factible observar un aumento de las respuestas castigadas después de que termina el castigo.castigo (estímulo punitivo). esta probabilidad de obtener supresión semejante aún después de dejar de aplicar el castigo está en relación directa con la intensidad del estímulo castigador. la supresión se generaliza. D.F. CARACTERÍSTICAS DEL CASTIGO.. neurosis. b) Produce cierto tipo de agresión.El castigo produce algunas veces agresión ya sea dirigida hacia la persona que castiga o a otras personas que no tienen ninguna relación con ello.Las bajas intensidades del estímulo castigador ayudan al sujeto a discriminar más rápidamente cuando se le asocia a estímulos discriminativos. este efecto se le denomina fenómeno de contraste (las respuestas ocurren en proporción mayor que antes de comenzar el castigo). . PROGRAMAS DE CASTIGO. Como proceso para hacer referencia a la explicación del fenómeno. vergüenza o culpa. es decir. masoquismo y trastornos gástricas como las úlceras por ejemplo.. DEFINICIÓN DE EXTINCIÓN: La extinción puede definirse como un procedimiento en el cual una respuesta que ha sido reforzada en el pasado. de tal manera que un programa de reforzamiento continuo tendría mayores efectos supresores (un E. Desde este punto de vista es la conducta la que se extingue.El castigo produce temor.4. d) Discriminación. es decir. c) Recuperación después del castigo. En lo relacionado con los programas de razón fija (R. luego de las respuestas condicionada. las respuestas caen al nivel de cero cuando se acerca al momento de recibir castigo.) se han observado que cuando mayor es la proporción de respuestas castigadas mayor es la reducción de las mismas. en cambio tiempos mayores a una hora si alteran su eficacia (Estes. 1944 Hunt y Brady. e) Generalización. así como odio a la persona que castiga o a otras personas que no tienen ninguna relación con ello. punitivo para cada respuesta). d) Puede producir trastornos de conducta. 3. ya sea en términos comportamentales o en términos fisiológicos. Se han observado una serie de cambios de conducta que pueden ser consecuencia del castigo: a) Supresión permanente. Se ha estudiado el efecto del castigo bajo programas de Razón fija y de Intervalo fijo. lo que se extingue. EFECTOS COLATERALES Algunos teóricos señalan que el castigo produce efectos colaterales además de los señalados anteriormente: a) Efectos emocionales. Azrin. El efecto básico de la extinción es una reducción gradual en su fuerza. como proceso y como procedimiento.. LA EXTINCIÓN El término extinción se ha estado utilizando indistintamente. Desde este punto de vista es el reforzador el que ha estado manteniendo una conducta. Como procedimiento. la supresión de la conducta castigada en inmediata bajo la acción del estímulo castigador (es también función de la intensidad). Ejemplo: el niño no quiere ir a la escuela porque la maestra lo castiga. En cuanto a los programas de intervalo fijo (I. c) Causas de separación y aislamiento..A veces el castigo genera o lleva al sujeto a escapar de la situación total en la cual recibe castigo..El castigo no sólo reduce la frecuencia de las respuestas que preceden al castigo sino también otras. miedo.Esta es su característica más importante.F. 1956). b) Rapidez de los efectos.

y ahora ya no es cargado por ella. serán más fáciles de ser afectadas por la extinción que las conductas reforzadas intermitentemente. que consiste en una estimación general de la resistencia en la tendencia a emitir una respuesta después de que ésta ha dejado de ser reforzada. La RC decrementará su fuerza gradualmente hasta llegar a cero. Este efecto de incremento inicial de la respuesta se dice que es efecto emocional que produce en el organismo la supresión del estímulo reforzante. Pávlov encontró que después de someter a extinción una respuesta condicionada de salivación esta ocurría espontáneamente ante el EC. Asimismo. aunque el efecto de las respuestas sometidas a extinción son diferentes.Ejemplo: Si un niño llora y la madre deja de levantarlo en brazos el niño reducirá su frecuencia de llanto. A mayor número de extinciones más rápidamente ocurrirá la extinción y a menor número más difícil será la extinción. durante y en el momento de la extinción. (El EC luz se presenta sólo sin ser apareado con alimento). algunas de las cuales actúan antes de que comience la extinción y otras cuando la extinción y ha comenzado. para posteriormente ir decrementando su fuerza hasta el nivel de ser levantado en brazos). RECUPERACIÓN ESPONTANEA: La respuesta sometida a extinción reaparecerá algunas veces espontáneamente después de cierto tiempo. la conducta será más difícil a la extinción si ha recibido un gran número de reforzamientos anteriormente. Estos parámetros de extinción están influenciados por diversas variables. 4) LA MAGNITUD DE LA MOTIVACIÓN. El fenómeno de la extinción es válido tanto para las respuestas condicionadas mediante la modalidad clásica como para la modalidad operante. con el cual se mantiene previamente la conducta. Si el reforzador administrado para una conducta ha sido de alta calidad y cantidad la conducta será más resistentes a la extinción. pero con una fuerza menor a la que tenía cuando fue condicionada. La tasa a la que baja la frecuencia de la respuesta (nivel operante). la extinción se produce al dejar de reforzar una conducta anteriormente reforzada. La recuperación de la respuesta es generalmente parcial. previas que haya tenido el organismo. El número total de las respuestas emitidas antes de que cese la acción de responder o que se llegue a su nivel operante. del organismo durante la extinción. Las conductas sometidas a un programa de reforzamiento continuo. El curso que sigue la extinción es muy variable dependiendo de las experiencias del organismo antes. La recuperación espontánea depende de tres factores: . C. VARIABLES QUE AFECTAN LA EXTINCIÓN. 2) LA MAGNITUD DE REFORZADOR Y EL NÚMERO DE REFORZAMIENTO. La recuperación espontánea es una función negativamente acelerada del tiempo transcurrido desde la extinción. inicialmente el llanto será mayor. En conjunto estos parámetros son responsables de lo que se denomina resistencia a extinción. recibidos antes de la extinción. 3) LA MAGNITUD DE EXTINCIONES. En la modalidad operante. Su nivel final. En la modalidad clásica la extinción se produce al presentar al estímulo condicionado. Se han estudiado cuatro variables o parámetros que van a hacer más o menos resistentes a una respuesta a la extinción. En tres parámetros se puede resumir el curso que siguen las respuestas sometidas a extinción: A. 1938). (Si un niño cada vez que era levantado en brazos por la madre. la RC. la reaparición ocurre rápidamente al comienzo y se nivela al paso del tiempo (Ellson. estos son: 1) EL PROGRAMA DE REFORZAMIENTO. para luego descender al nivel que tenía antes de ser reforzada (nivel operante). inicialmente incrementará su fuerza. por debajo del cual la frecuencia de la respuesta no descenderá durante un periodo de tiempo relativamente largo. Por lo general la extinción será más lenta cuando se lleve a cabo con un nivel de privación alto. B.

b) El número de ensayos de extinción: a mayor cantidad de ensayos de extinción.a) La fuerza original de la respuesta condicionada: a mayor fuerza de la R. c) El número de veces que la R se ha extinguido y re-condicionado: a mayor cantidad de extinciones y recondicionamientos mayor será la recuperación espontánea de la R. menor será el número de veces que aparezca RC sometida a extinción. mayor será el número de veces que se recupere espontáneamente.C.C. .

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->