You are on page 1of 77

CAPITULO

CASTIGO

N.

H . A z r in

y W. C.

H olz

INTRODUCCIÓN

Pocos D E
, psicólogos o legos, enfocaríamos el problema
dei castigo en términos neutrales. Más bien, nuestra reacción ante el
uso dei castigo muchas vecès parece estar determinada por opiniones precientíficas. En cierta época, el uso dei castigo fue ampliamente sancio­
nado. Por ejemplo, antiguamente, en los Estados Unidos el sistema
educativo y las prácticas penales dependían enormemente de la eliminación de la conducta por medio dei castigo. Actualmente, la opinión
pública parece estar en contra dei uso dei castigo. Se han planteado múltiples tipos de preguntas evaluativas acerca dei castigo, como: “,;Debe
emplearse el castigo? ,;Es efectivo el castigo? ,;Produce el castigo solamente câmbios temporales en la conducta? jEs el castigo menos efectivo
que el reforzamiento?” El neutralismo científico exige que no formulemos
ningún juicio, sino hasta que la evidencia experimental sea completa­
mente definitiva. Es con este espíritu que analizamos el problema dei
castigo: ,:qué papel desempena el castigo en la conducta?
Primero examinaremos la metodologia en que se han basado los
experimentos sobre castigo, pues la validez de los datos experimentales
no puede sobrepasar lo adecuado de los procedimientos empleados para
obtener los datos. Nuestro examen de la metodologia no consistirá en una
simple enumeración de los diferentes procedimientos utilizados; más bien,
se evaluarán criticamente los procedimientos en términos de la p ro b a bilidad que tengan de ser adecuados para aislar los efectos dei p ro c e so
dei castigo. Uno de los propósitos primordiales de este tratamiento m e to n o so tro s

* La m ayor parte de la investigación original que aqui se in f o r m a f u e finan­
ciada por el Fondo de Salud M ental dei Estado de» Illinois, por las s u b v e n c io n e s
dei N IM H 4925 y 4926 y p o r la subvención dei NSF G16357R. E x p r e s a m o s nuestro
agradecim iento a los doctores D. F. Hake, K. M iller, R. R. H utchinson y T . AyH°n
por haber leído minuciosamente el manuscrito.
455

456

CAP. 9

C A ST IG O

dológico es dar una dirección y proporcionar incentivos para el desarrollo
ulterior de una metodologia perfeccionada. Luego examinaremos diversas
variables relacionadas con la administración dei castigo (como la intensidad dei castigo) y con otras variables relacionadas con aspectos que
determinan la efectividad de un estímulo punitivo en particular, como
el estado motivacional dei sujeto. Nuestra atención se enfocará después
en un examen detallado de los tipos de câmbios conductuales que, por lo
que se ha visto, se derivan dei uso dei castigo, como la recuperación que
se produce durante el castigo y los aumentos de la emisión de respuestas
que se producen después dei castigo. Sólo después de llevar a cabo este
examen de los hallazgos experimentales específicos acerca de los deter­
minantes y los resultados dei castigo, trataremos de responder a preguntas
tan generales como: “^Es efectivo el castigo?” Finalmente, nos ocupa­
remos dei problema de determinar si el castigo es deseable. La respuesta
a este problema exigirá que se tengan en consideración hallazgos hechos
en varias áreas que emplean la estimulación aversiva.
METODOLOGIA
Definición de castigo

Hay un gran número de definiciones informales dei castigo. En un
extremo se encuentra el tipo de definición subjetiva en la que el cas­
tigo se refiere a un estado desagradable subjetivo, como en el “posfecto
molesto” de Thorndike (1911). Sin embargo, las dificultades que plantea
la medición de los estados subjetivos nos obligan a buscar otro camino.
Un segundo tipo de definición de castigo implica designar al castigo como
una variable de pulsión, tal como han hecho Dollard y Miller (1950).
Puesto que este tipo de definición se basa en inferencias acerca de la
conducta, seria preferible, como paso inicial, buscar en la propia conducta una definición mínima. Un aspecto inequívoco dei castigo parece
ser el que esto reduce la emisión de una conducta cuando se dispone
como consecuencia de dicha conducta. Por tanto, la definición mínima
será' que el castigo es una consecuencia de la conducta que reduce la
probabilidad futura de dicha conducta. Enunciada de un modo más
completo, el castigo es una reducción de la probabilidad futura de una
respuesta específica, como resultado de la administración inmediata de
un estímulo ante esa respuesta. El estímulo se designa con el nombre
de estímulo punitivo, y todo el proceso se denomina castigo.
Hay varios aspectos de esta definición que deben comentarse. Primero, la definición no se efectúa en términos de un sentimiento subjetivo
o de un estado dei ser. Por tanto, será incorrecto llamar punitivo a un

m e t o d o l o g ía

457

estímulo, sólo porque ese estímulo lleve a una expresión de infelicidad
o de un estado emocional. Segundo, para que un evento específico sea
considerado estímulo punitivo, el evento debe ser producido por una
respuesta específica. Una simple disminución de las respuestas no es razón
suficiente para considerar punitivo a un procedimiento. También la saciedad, la extinción, las drogas, una enfermedad, un cambio de estímulo,
etcétera, pueden reducir las respuestas. Estos procedimientos se diferencian
claramente dei castigo en que no producen una reducción de respuestas
que sean atribuibles a la producción de un estímulo específico (el estímulo
punitivo) por parte de la respuesta. Solamente designamos al proceso
con el nombre de castigo cuando se produce una reducción de respues­
tas como resultado de que las respuestas producen un estímulo específico.
Un corolário de esta definición es que resulta contradictorio hablar de
castigo por no responder, pues no hay ninguna respuesta especificable
que produzca al estímulo punitivo. Un procedimiento de este tipo se
designa mejor con el nombre de escape o euitación (Sidman, 1953). Un
tercer aspecto fundamental de esta definición es que especifica la probabilidad futura de una respuesta. La reducción de las respuestas durante
la presentación real de un estímulo no indica que haya castigo. Si se
administra un choque intenso a las patas de un animal después de una
respuesta, el choque puede producir reacciones, como la de saltar, que
son fisicamente incompatibles con la respuesta; pero esto no es suficiente
para dar al choque la categoria de estímulo punitivo. Asimismo, la administración de comida produce como resultado una conducta consumatoria
que generalmente es incompatible con la respuesta. El cambio de la
frecuencia de respuesta que se produce de manera subsecuente a un es­
tímulo define las propiedades reforzantes o punitivas de ese estímulo. Por
esta razón, nuestra definición dei castigo se hace en términos de una
reducción de la probabilidad futura de la respuesta castigada.
La presente definición de castigo se diferencia en varios aspectos de
las definiciones anteriores dei castigo. Una definición (Dinsmoor, 1954;
Keller y Schoenfeld, 1950; Skinner, 1953) se rcfiere al castigo, en tér­
minos de procedimientos, como la administración de un estímulo aversivo
después de una respuesta. Entonces, se define al estímulo aversivo como
un estímulo que aumenta la probabilidad de las respuestas que hacen
terminar ese estímulo. Esta definición de aversividad requiere una demostración de que puede emplearse la terminación dei estímulo para reforzar
la conducta de escape. Cualquier reducción que sea producto dei proce
dimiento de castigo se atribuye a la existencia de respuestas de escape
que interfieren o compiten de alguna manera con la respuesta castiga a
(Dinsmoor, 1954; Skinner, 1953). En esta definición, el castigo es un
proceso secundário en términos dei procedimiento, pues para d e sig n a r o

La presente definición considera al castigo como un proceso primário porque: a) no se requiere ninguna evidencia independiente de que el estímulo mantendrá a la conducta de escape. La tercera ventaja de esta definición es que dirige la atención de investigador a las variables independientes más que a un conjunto interventor de conductas “competitivas”. La presente de­ finición sólo requiere que se obtenga una reducción de la respuesta cuando produce el estímulo. Rara vez se ha utilizado el nivel operante de una respuesta (Baron y Antonitis. 9 C A ST IG O se debe hacer un condicionamiento de escape previo. Esta definición parece tener varias ventajas. 1961). En ausência de esta determinación. como resultado de que la respuesta produce ese estímulo. a las que con frecuencia se les da un status de “exploratorios”. Virtualmente. Ningún proceso es secundário con respecto al otro. el estímulo no podría considerarse aversivo y la definición de procedimiento dei castigo no podría aplicarse a la mayoría de los estúdios que han implicado esta designación. Las definiciones difieren solamente con respecto a la dirección dei cambio de la probabilidad de la respuesta: un aumento de la probabilidad de obtener reforzamiento positivo. el proceso punitivo se caracteriza por una reducción de la tasa de respuestas.458 CAP. ninguno de los estúdios dei castigo ha determinado inicialmente que la terminación dei estimulo punitivo refuerce la conducta de escape. El procedimiento común ha consistido en emplear reforza­ miento positivo para condicionar la respuesta y mantenerla a una fre­ cuencia que sea lo suficientemente alta para permitir observar que el procedimiento de castigo reduce la emisión de respuestas. De ahí se deduce que para poder iniciar un estúdio dei castigo debe haber un nivel de respuestas preexistente. y b) la característica que define al castigo es medible directamente en términos de la existencia de una reducción de las respuestas. La estabilidad y el orden de la tasa de respuestas reforzadas determinará . Asimismo. Desarrollo de una tecnologia dei reforzamiento como prerrequisito De acuerdo con nuestra definición. que se supone producen la reducción de la respuesta. pero hasta ahora no registradas. el efecto conductual dei castigo se considera un resultado secundário o indirecto de las respuestas de escape competitivas. La presente definición de un estímulo punitivo es similar a la defi­ nición de un estímulo reforzante en que requiere un cambio de la probabilidad futura de una respuesta. una disminución de la dei castigo. La segunda ventaja de definir al castigo en términos de una reducción de la respuesta es que no se requiere ningún registro u observación de las respuestas de escape hipotéticas.

I No fue sino hasta hace poco (Ferster y Skinner. los procedimientos de reforzamiento de Ferster y Skinner (1957) hacen posible prescindir de los promedios de respuestas. su impacto sobre el sujeto puede ser muy variable. y prescindiera completamente de un procedimiento de ensayos limitado que interrumpía constantemente el flujo de la con­ ducta con un intervalo entre los ensayos. . el “orden” de los datos sobre las respuestas se ha obtenido me­ diante promedios de grupo y de procedimientos de ensayos discretos (Muenzinger. y ocuparse directamente de la ocurrencia de las respuestas de momento a momento. un choque administrado a las patas de la rata a través de una rejilla puede especificarse exactamente en términos de la diferencia de potencial que hay en el estimulador. en términos de su replicabilidad y su confiabilidad. Historica­ mente. El estímulo punitivo REQUISITOS DEL ESTÍMULO PUNITIVO ‘ IDEAL" Idealmente. 1957) que la tec­ nologia dei reforzamiento llegó a un grado tal de desarrollo que ahora se puede especificar la ocurrencia momento a momento de las respuestas operantes condicionadas que emite un organismo particular. La segunda característica deseable que debe tener un estímulo pu­ nitivo es la consecuencia dei estímulo en términos dei contacto real que tiene con el sujeto. Estos progresos hacen posible valorar con más exactitud los efectos dei castigo y permiten observar que los câmbios conductuales son regidos por regias. 1934). Un estímulo puede ser especificado precisamente en su fuente y. no es posible llegar a muchas conclusiones al agregar este último. el estímulo punitivo debe tener una especificación física precisa. Si la medida de la res­ puesta es variable o impredecible antes de aplicar el castigo. Primero. tanto dentro de los sujetos como entre ellos. Ahora.M E T O D O L O G IA 459 el grado en que cualquier cambio que se produzca en las respuestas pueda ser atribuído definitivamente al castigo. estamos limitando desde el principio los estúdios. Si las dimensiones pertinentes dei estímulo no pueden medirse con exactitud y en unidades físicas. sin tener que recurrir a artefactos estadísticos ni a grandes grupos de sujetos. sin embargo. un estímulo punitivo debe tener propiedades que permitan valorar el proceso dei castigo sin dejar penetrar factores extranos al procedimiento. Los primeros trabajos operantes de Skinner (1938) hicieron posible que Estes (1944) usara promedios de grupo que incluían sólo a cuatro sujetos. Por ejemplo. pero las variaciones de humedad dei aire tienen como resultado una gran v a r i a b i l i d a d de la intensidad que actúa realmente sobre el organismo.

9 C A ST IG O La tercera característica dei estímulo punitivo ideal se refiere a la capacidad que tiene el sujeto para escapar o para reducir al mínimo la estimulación por medio de alguna conducta no autorizada. Supuestamente. entonces la producción de estas reacciones per se puede hacer disminuir la frecuencia de la respuesta. En este apartado no nos referimos a la uniformidad física dei estímulo punitivo. Si el sujeto puede hacer disminuir esta estimulación gracias a medios no autorizados o inidentificables. Los problemas que origina este control no autorizado van más allá de cualquier interés purista por la cons­ tancia física. como la de poner solamente una pata en la rejilla. Al estudiar el castigo. y eliminaba así la posibilidad de recibir choques al mismo tiempo que seguia produciendo bolas de comida. Se encontro que los efectos reductivos totales dei castigo eran nulificados por la disponibilidad de la respuesta de escape. corre. a pesar de la constancia que tenga el choque al ser medido en el piso de rejilla. trata de pararse en una barra. como se puede notar en un estúdio de Dinsmoor y Campbell (1956). En un estúdio de Azrin. y usa las partes pilosas de su cuerpo para responder. nos ocupamos de la reducción de la probabilidad futura de una respuesta. la rata puede cambiar de postura. primordialmente por medio de un aumento de la cantidad de estimu­ lación que actúa sobre el organismo. Asimismo. el castigo logra su efecto en la conducta. La cuarta característica dei estímulo punitivo ideal es que deben haber pocas reacciones esqueléticas ante ese estímulo. salta. Este contacto se halla siempre bajo el control de la conducta dei sujeto. entonces los conteos de las respuestas carecen de significado. excepto en la medida en que el sujeto puede controlaria. En tal caso. y lo hace. el techo y el piso de rejilla.460 CAP. Hake. las reducciones de la respuesta se producirán debido a la simple incompatibilidad . La postura desmanada puede producir una reducción de respuestas que es sólo una consecuencia indirecta dei estímulo punitivo. pero que reducen los choques. la uniformidad dei choque administrado a las patas de la rata depen­ de dei grado de contacto de la piei con el piso de rejilla. la reduc­ ción de las respuestas puede ser resultado de posturas desmanadas. como lo evidencia el caso extremo que se representa en la figura 1. Todas estas conductas van a alterar la intensidad efectiva de la estimulación. puede parecer que no hay ninguna reducción de las respuestas. Incluso. si se han electrificado la barra de respuestas. baila. Holz y Hutchinson (1965) se estudió este problema proporcionando experimentalmente una respuesta de esca­ pe específica. titu­ lado el “Desayuno en la cama”. Por otra parte. las paredes. Si el estímulo punitivo produce reacciones esqueléticas fuertes y duraderas. en el cual una rata aprendió a presionar una palanca de respuestas con su pata mientras yacía sobre su espalda. Por ejemplo.

Pareceria ser que otra ventaja de usar el choque es que éste puede especificarse con precision . Ya que hemos visto algunos de los critérios que se espera que llene un estímulo punitivo. hasta la reducción completa de la respuesta. que interfieren fisicamente con la emisión de la respuesta medida. en los que una observación simple revela que a menudo las altas intensidades dei choque. vamos a evaluar algunos de los estímulos utiliza­ dos. en los valores más altos. La rata h a a p re n d id o a ev ita r el ch oq u e d e la rejilla sob re su e s p a ld a .M E T O D O L O G IA F IG U R A 1. con mucho. en los valores más bajos. y no necesariamente debido a la aversividad dei estímulo punitivo. m ien tras p re sio n a la p a la n c a de la s re sp u e sta s con su p a ta tra se ra p a r a p ro d u c ir b o la s de co m ida. La quinta característica dei estímulo punitivo ideal es que pueda hacerse variar por una amplia gama de valores y que pueda producir grados de reducción de la respuesta que vayan desde ningún efecto. Pueden ilustrar este problema los estúdios que han utilizado choques aplicados a las patas. (T om ad o de A z rin y H olz. e c h á n d o se 461 “ D e s a y u n o en la c a m a ” . el estímulo más usado. La principal ventaja dei choque es que puede hacerse variar por toda la gama de efectividad para reducir la respuesta. producen la inmovilización parcial dei sujeto. es imposible averiguar cuál es toda la gama de efectividad dei castigo. d a to s n o p u b lica d o s.) de las reacciones provocadas con la respuesta castigada. El choque a las patas ha sido. En ausência de tal variación.

Sin embargo. En este momento podemos poner en duda que se tenga un control tan preciso dei choque como estímulo punitivo.462 CAP. el aumento de la intensidad produce pocos câmbios. 1963). Puede explicarse la sensibilidad de las respuestas castigadas a la intensidad dei choque. Se han creado varios artefactos para dismi­ nuir al mínimo la variabilidad dei choque administrado a las patas. o ninguno. Dinsmoor (1958) ha usado rejillas tubulares grandes. . Dins­ moor (1961) invento un estimulador para reducir las variaciones dei flujo de la corriente que pasa por el sujeto. el choque a las patas dei animal tiene las desventajas siguientes: a) permite que haya escape no autorizado. Parece que se requiere un mínimo de intensidad para mantener las respuestas de evitación. eléctricas). confrontando los procedimientos de castigo y de evitación en términos de la frecuencia de los contactos habidos entre el sujeto y el estímulo aversivo. Hoffman y Fleshler (1962) han perfeccionado la técnica dei revolvedor. a fin de reducir al mínimo los corto circuitos entre ellas y aumentar al máximo el con­ tacto dei sujeto con las rejillas. un au­ mento de intensidad de 50 a 60 voltios (un cambio dei 20% ) produjo una reducción instantânea de aproximadamente el 50% en la tasa de respuestas castigadas. Sidman y Hermstein. usó una descarga corta dei capacitador (condensador). en los estúdios dei condicionamiento de evitación (Boren. Por otra parte. Estes (1944). se ha encontrado que las respuestas castigadas son muy sensibles a los câmbios de intensidad dei estímulo punitivo. en la tasa de respuestas de evitación. por ejemplo. 1959) se han hallado pocos câmbios en las respuestas de evitación emitidas ante una amplia gama de intensidades de choque aplicadas a las patas. y b ) permite que haya variabilidad en la estimulación real que llega al sujeto. en comparación con la insensibilidad de las res­ puestas de evitación. En el condicionamiento de evitación de choques. Skinner y Campbell (1947) han creado un revolvedor para alternar la polaridad de cada rejilla y evitar así que el animal apoye las patas en rejillas de la misma polaridad. pero que más allá de ese punto. con el fin de hacer alternaciones de polaridad más rápidas y confiables. A pesar de estas mejorías sustanciales. 9 C A ST IG O en unidades de medida físicas (es decir. las respuestas se emiten pronto con una tasa que es sufi­ ciente para eliminar virtualmente todas las administraciones dei choque. como puede verse en los ejemplos anteriores que consideraban el choque a las patas en términos de su contacto real con el sujeto. esta especificidad aparente es ilusória. En un estúdio (Hake y Azrin. La producción de reacciones esqueléticas duraderas se ha reducido un poco mediante el procedimiento de hacer que las duraciones de la estimu­ lación sean muy breves. Ciertamente.

mientras que en el caso de los estúdios sobre el condicionamiento de evitación. el sujeto está haciendo contacto con el choque conti­ nuamente. 1959<z) y de electrodos de superficie (Hake y Azrin. Ya se ha visto que el choque a las patas tiene las siguientes desventajas: a) da lugar a variaciones en la intensidad con que se recibe verdaderamente. Flanagan. El contacto continuo que hay entre el sujeto y el estímulo aversivo explica también la sensibilidad que muestran las respuestas de escape ante los câmbios de intensidad dei estímulo aversivo (Barry y Harrison. 1964) y con pichones (Holz y Azrin. el control preciso parece ser esencial en los trabajos sobre el castigo. Por la misma naturaleza de los procesos que estudian. Skinner (1938) usó la bofetada de una^palanca. Harrison. pero lo reduce al mínimo la poca duración que tiene generalmente la presentación dei cho- . Como resultado de esto. Masserman (1946) ha empleado una ráfaga de aire con gatos y una serpiente de juguete con monos. con ratas. DIFERENTES TIPOS DE ESTÍMULOS AVERSIVOS Se han encontrado varios tipos de estímulos punitivos efectivos. En el castigo por medio de choques.M E T O D O L O G ÍA 463 El resultado final es que se emite un gran número de respuestas. lo cual reduce al mínimo las variaciones físicas de la intensidad dei choque. En la supresión parcial. encon­ tramos que la conducta de evitación persiste durante períodos largos (Sidman. 1952). pero los choques son tan poco frecuentes que se necesita mucho tiempo para poder descubrir la ausência de choques. 1955). 1958. Abelson y Fisher. Herman y Azrin. 19606). 1960. un cambio inmediato de la conducta castigada (Azrin. generalmente. y c) produce una perturbación esquelética extremada. Goldiamond y Azrin. Kaplan. 1957. la situación es diferente. b) permite que respuestas de escape no autorizadas tengan control de la intensidad y la duración dei choque. El choque punitivo se ha adminis­ trado también a través de electrodos implantados (Azrin. 1958. 1963). De este modo. a menos que haya habido una supresión completa de la respuesta castigada. 1962a). El problema de las reacciones esqueléticas extremas sigue existiendo. y evita que la con­ ducta de escape no autorizada controle la intensidad. la contingência de hacer terminar el choque durante el castigo tiene como resultado. Dinsmoor y Winograd. tal vez no requieran más que un estímulo efectivo al mí­ nimo para múltiples propósitos. Por tanto. El ruido ha sido efectivo con humanos (Azrin. pues generalmente cada respuesta va seguida por el choque. no hay problema para dis­ criminar el momento preciso en que se suprime el choque. 1958. El estímulo punitivo que se ha utilizado más extensamente ha sido el choque eléctrico administrado a través de un piso de rejilla.

Desafortu­ nadamente. se atribuye a los efectos punitivos condicionados que tiene el EC en virtud de su asociación previa con el choque EIC. En teoria. Estas reacciones perturbadoras se redujeron aún más al colocar los electrodos en la cola de unos monos-ardilla que se mantenían sentados sin sujeción alguna (Hake y Azrin. 1958). El ruido parece ser igualmente deseable. Una vez que la respuesta ha sido condicionada. Parece que este tipo de castigo se emplea frecuentemente en muchos tipos ordinários de control de la con­ ducta humana. El ruido parece tener muchas ventajas para usarlo en los estúdios dei castigo. LA ESTIMULACIÓN AVERSIVA C O N D IC IO N A D A C O M O CASTIGO Los estímulos punitivos que hemos descrito hasta ahora. 9 464 C A STIG O que. EIC. en términos generales. En varios estúdios se ha tratado de establecer este “castigo condicionado”.CAP. no se les ha aplicado la prueba dei uso extensivo. es asociado con un choque eléctrico. 1962a). Por ejemplo. pues mediante el uso de audífonos ha sido posible especificar con precisión y controlar la intensidad dei estímulo que recibe el sujeto (Flanagan. la agresión física se usa con poca frecuencia. 1963). el ruido no ha producido una reducción com­ pleta de la respuesta. Después de varios apareamientos dei EC y el EIC. Los procedimientos empleados en estos estúdios pueden describirse. el animal es condicionado a responder por comida. cuando se castiga a un nino. debería ser posible usar un estímulo punitivo que fuera efectivo debido a su asociación con un estímulo aversivo primário. que es el nombre con el que lo designare­ mos (Barlow. se definen en términos de sus propiedades aversivas primarias. se hace que el EC se presente después de las respuestas. Mowrer y Aiken. las ráfagas de aire. Este procedimiento elimino al gran desequilibrio de la postura que produce generalmente el choque a las patas. y Azrin. A otros estímulos aversivos. de la manera siguiente: un estímulo neutro. Incluso a intensidades muy altas. más que por cualquier propiedad aversiva que tuviera en sí mismo. 1952. pero no tienen mayores ventajas que el cho­ que eléctrico aplicado a las patas o que el ruido. las serpientes. o también a través de sistemas de altavoces que producen un campo sonoro uniforme (Holz y Azrin. este paradigma básico no permite hacer investigaciones a . como las bofetadas de la barra. 1954. La reducción de la frecuencia de estas respuestas que asi se produce. Mowrer y Solomon. 1962. EC. Goldiamond. 1954). antes de condi­ cionar de cualquier manera la conducta dei animal. El procedimiento más frecuente es fruncir el ceno o expresar frases que se suponen asociadas con eventos aversivos más naturales. pero sin que esté presente ningún EC ni EIC. etc. Su principal desventaja es que carece de una amplia gama de efectividad.. Evans.

1965) trataron de superar el problema de mantener el castigo condicionado. Un pichón fue reforzado con comida por responder en una tecla. v é a se el texto. M é to d o p a r a p ro d u c ir c a stig o co n d ic io n a d o . (T om ad o de A z rin y H olz. I largo plazo dei castigo condicionado. d a to s n o p u b lica d o s. Experimentos recientes (Hake y Azrin.M E T O D O L O G ÍA 465 PR OCE DIM IE NTO segundos neutros neutros condicionada D ESD E E L P R IN C IP IO H A S T A E L FIN F IG U R A 2. cada respuesta produjo un cambio de estímulo de 5 segundos que consistia en un cambio de la iluminación y un cambio dei nivel de ruido dei am­ . La figura 2 muestra la situación experimental general y el procedimiento de control.) P a ra la e x p lica c ió n . El registro acumulativo que se encuentra abajo a la izquierda muestra la ejecución obtenida. típica de un programa IV. En el segundo segmento desde la derecha. pues el EC pierde su efectividad cuando deja de ser apareado con el EIC.

el EC producido por la respues­ ta siguió teniendo sus propiedades aversivas condicionadas y pudo ser efectivo para suprimir la conducta castigada. pero que la conducta no fue afectada apreciablemente en ausência dei EC. 9 466 C A STIG O biente.CAP. pasadizos. el mismo estímulo neutro fue presentado a intervalos irregulares separados por un promedio de 6 minutos. Tal es el caso. como se indica en el cuarto segmento dei registro acumulativo. 1957). el estímulo neutro no afectó la tasa de respuestas. durante el cual cada respuesta produjo al EC durante 5 segundos. tanto tiempo como estuvo en efecto el procedimiento. el tiempo-fuera dei reforzamiento positivo se ha considerado en sentido estático. procedimientos de elección. Parece que el castigo condicionado no necesita ser un fenômeno transitorio. en los procedimientos de ensayos limitados. Historicamente. Este choque se administro al final de la presentación dei estímulo de 15 segundos. disminuye la frecuencia de la respuesta anteriormente reforzada. Una característica fundamental de este procedimiento es que se continuaron haciendo apareamientos dei EC con el EIC. Si reforzamos alternadamente una respuesta en presencia de un estímulo. es decir. un estímulo que anteriormente era neutro continuará suprimiendo las respuestas después de las cuales se presenta. Por tanto. en los que se designa al tiempo-fuera . la tasa de respuestas se recupero gradualmente. pero no la reforzamos en presencia de otro estímulo. Luego se administro un choque eléctrico breve a través de los electrodos implan­ tados en la región posterior dei pichón. cuando se supri­ me el reforzador. tiempo-fuera dei reforzamiento positivo (Ferster y Skinner.. simplemente como un periodo de tiempo que separa las oportunidades de responder. por ejemplo. rampas. En el tercer segmento. De nuevo. Puede verse que el estímulo neutro produjo pocos câmbios en la conducta. entonces puede designarse a este último con el nombre de estímulo tiempofuera. Durante el castigo condicionado. si ese estímulo neutro es asociado ocasionalmente con el estímulo incondicionado. Puede verse que hubo una supresión de las respuestas en presencia dei estímulo (EC). etc. es decir. El segmento dei registro acumu­ lativo que se encuentra a la derecha representa los resultados obtenidos mediante el procedimiento de castigo condicionado. EL TIEMPO-FUERA DEL REFORZAMIENTO POSITIVO C O M O ESTlMULO PUNITIVO El período de tiempo-fuera constituye otro ejemplo de estímulo pu­ nitivo condicionado. Este procedimiento es semejante al procedimiento de supresión condicionada que crearon Estes y Skinner (1941). pero de todos modos no pasó de 20 respuestas por minuto. En la conocida ley de la extinción. Puede verse que la tasa de respuestas se redujo de su nivel anterior de aproximadamente 80 res­ puestas por minuto a un nivel de supresión casi completa.

p ich ón in d ica n no la d u ra n te el o curren cia d e corrió d u ra n te el cu a l se c u a le sp e rio d o de tiem p o-fue ra. Si el periodo de tiempo-fuera constituyera un estímulo punitivo. lo cu al evitó reforzam ie ntos. podríamos esperar que disminuyera la tasa total de respuestas para obtener comida. cada quincuagésima respuesta produzca un periodo de tiempo-fuera. no se han notado las posibles propiedades dinâmicas que tiene este tiempofuera. re sp u e sta s En el de la com ida. por ejemplo. Hasta el momento. (T o m a d o de A z rin y H olz. se puede controlar la frecuencia de las respuestas disponiendo ese estímulo como consecuencia de las mismas. Sólo en los últimos anos se ha descubierto que un estímulo de tiempo-fuera puede poseer propiedades reforzantes o aversivas y que. no se sabe bien por qué medios un estímu­ lo de tiempo-fuera actúa como estímulo punitivo.467 M E T O D O L O G IA M IN U T O S F IG U R A 3. Si examinamos la situación simple en la que un pichón responde para obtener comida en un programa de reforzamiento IV. podemos disponer un paradigma de castigo haciendo que. como puede verse en la figura 3 (datos no publicados). gram a IV R egistro de a c u m u la tiv o refo rzam ie nto con de la s com ida.) como un intervalo entre ensayos. por tanto. En nuestra propia experiencia Ho se ha notado ninguna disminución. Parece ser que la primera vez que alguien notó las posibles propie­ dades reforzantes o aversivas dei tiempo-fuera fue en un estúdio de Herrnstein (1955). d a to s n o p u b licad o s. en donde se le administro un tiempo-fuera de 60 . Aunque en los métodos de ensayos limitados se han utilizado necesariamente periados de tiempo-fuera. Las r a y a s t ra z a d a s p or la p lu m a in d ic a n de la s u s p e n d ió q u ie ra a d m in istra c ió n la ilu m in a c ió n re sp u e stas y de de un la p e rio d o em itid a s registro no re g istra d o ra tie m p o -fu e ra de por se un El papel dei re g istra d o r la s b a jo un p ro ­ a d m in istra c io n e s (vé a se eje m plos en la s flecha s) un m inu to c â m a ra expe rim e ntal. en el cual se alteró la frecuencia de las respuestas dispo­ niendo períodos de tiempo-fuera de duraciones variadas después de las respuestas. lu e g o de un in te rv alo de un m in u to tra n sc u rrid o a p a rtir dei tie m p o -fu e ra a n te ­ rior. El tie m p o -fu e ra se a d m in istro in m e d iatam e n te d e sp u é s de la p rim e ra re sp u e s­ ta e m itid a.

en vez de dejar de responder. Los resultados de este procedimiento concordaron con la regia general mencionada anteriormente. Si el sujeto no emitia respuestas durante la presencia de este estímulo breve pretiempo-fuera. proporcionándole al sujeto un modo de responder alternativo (TERs cortos) que eliminaba el estímulo punitivo sin tener que dejar de responder por completo. De nuevo. Sin embargo. Un estúdio posterior de Holz. Ferster (1958) encontro que el tiempo-fuera suprimia la conducta si había un estímulo pretiempofuera disponible. cuando mucho. en el sentido de que el estímulo puni­ tivo podia ser eliminado respondiendo en momentos diferentes. El sujeto podia tener un modo de conducta alternativo para evi­ tar los períodos de tiempo-fuera. pues la ocurrencia de un período de tiempo-fuera después de la respuesta de picoteo no redujo la probabilidad futura de esa respuesta. Solamente las respuestas que se emitían ante el es­ tímulo pretiempo-fuera eran castigadas por la acción dei tiempo-fuera. se hizo que el tiempo-fuera tuviera efectos de estímulo punitivo. Es decir.468 CAP. cuando no se tenía ninguna respuesta alterna­ tiva. disminuyó la frecuencia relativa de los TERs lar­ gos. los efectos punitivos de un estímulo de tiempo-fuera se han visto en varios estúdios en los que el sujeto disponía de algún modo de conducta alternativo. entonces no se presentaba el período de tiempofuera. se condi­ ciono a seres humanos para responder en un programa IV con el fin de obtener cigarrillos como reforzamiento. Azrin y Ayllon (1963a) esclareció aún más los medios posibles a través de los cuales el período de tiempofuera podia actuar como estímulo punitivo. ya se había notado anteriormente un aumento de la tasa total. En realidad. Luego se programo un período de tiempo-fuera para que se presentara por cada décima respuesta emitida en ese manipulando. los sujetos tenían a su disposición un manipulando de respuestas. pero no después de TERs cortos. Este investigador programo los periodos de tiempo-fuera de tal manera que se presentaran después de TERs largos. Por ejemplo. 9 C A ST IG O segundos a la primera respuesta emitida después de un minuto. 1957). Como resultado de esto. mientras que no afectaba a los TERs no castigados. Ferster amplió aún más el uso dei tiempo-fuera como estímulo punitivo al demostrar que un período de tiempo-fuera podia eliminar selectivamente los tiempos entre respuestas (TERs) castigados. pareceria que el período de tiempofuera no llena los requisitos de estímulo punitivo. En este estúdio. cuando los períodos de tiempo-fuera se introducían independientemente de las respuetsas (Ferster y Skinner. Si aplicáramos nuestra definición de estímulo punitivo. el período de tiempo-fuera producía. una supresión parcial de las respuestas castigadas. En una parte dei experi­ mento. En la segunda parte dei procedi- .

incluso. Zimmerman y Baydan. Zimmerman y Ferster. el periodo de tiempo-fuera produjo una supresión casi inmediata y virtualmente completa en este mani­ pulando. (I EL CASTIGO POR M E D IO DEL "CO STO DE RESPUESTA" El costo de respuesta es un tercer tipo de castigo condicionado que ha utilizado Weiner (1962) con sujetos humanos que trabajaban para obtener puntos en un cantador. puede funcionar como estímulo punitivo. Se ha encontrado que la efectividad dei tiempo-fuera como estímulo punitivo está en función de la duración dei tiempo-fuera. con estímulos aversivos condicionados. para que se presentara después de cada décima respuesta emitida en uno de los manipulandos. 1963. lo cual ha sido usado eficazmente para eliminar las respuestas “incorrectas” en un procedimiento de igualación a la muestra (Ferster y Appel. Después de que la conducta se había vuelto estable. parece que un periodo asociado con extinción. entonces. que el costo de respuesta es similar al choque eléctrico intenso en términos dei grado de reducción de la respuesta logrado. como el ruido o el choque eléctrico o. 1961. En este procedimiento de respuesta alternativo. el tiempo-fuera pue­ de ser un estímulo punitivo muy efectivo si el organismo dispone de una respuesta alternativa que no és castigada y que produce reforzamientos. La emisión de respuestas se desplazó al manipulando en el cual no se había programado ningún periodo de tiempo-fuera como estímulo punitivo. pero no es muy efectivo comparado con otros tipos de estímulos punitivos. En cada sujeto.M E T O D O L O G IA 469 miento se tenían dos respuestas. cualquiera de las cuales producía el reforzamiento. Otra similitud con el choque eléctrico intenso era que la contingência dei costo de respuesta no permitia que hubiera una recuperación de las respuestas castigadas durante el periodo de castigo. la contingência dei costo de respuesta redujo el número de las respuestas a una pequena fracción dei nivel de las respuestas . debe haber algún nivel . Weiner encontro una reducción de las respuestas que era inmediata y en algunos casos casi completa. Esta sustracción de los puntos dei contador como consecuencia de una respuesta se deno­ mino costo de respuesta. El efecto que tuvo este procedimiento fue mayor que el que se observa generalmente cuando se ha empleado un periodo de tiempo-fuera (que senala la ausência de reforzamiento) como estímulo punitivo.no castigadas. No obstante. Pare­ ceria. Hay dos aspectos que parece necesario tener en cuenta al crear una situación en la que puede usarse el costo de respuesta: primero. 1963). dispuso las cosas de tal manera que cada respuesta restaba un punto de los que estaban en el contador. Luego se programo el tiempo-fuera de la misma manera como se había hecho anteriormente. que constituye un periodo de tiempo-fuera. Entonces.

Puede disponerse que se presente continuamente o puede dejarse una pausa. VARIABLES RELACIONADAS CON LA ADMINISTRACIÓN DEL CASTIGO Una vez que el estímulo punitivo ha sido especificado. inmediatamente después de una respuesta o de una demora. Por lo contrario. se pueden castigar todas las respuestas o castigar sólo algunas de ellas. 9 C A ST IG O de reforzamiento positivo. la adición de un punto al contador de res­ puestas constituía un reforzamiento. el procedimiento dei costo de respuesta ejemplifica con detalle el modo como puede considerarse que el reforzamiento positivo y el negativo se encuentran situados a lo largo de un solo continuo. Masserman (1946) informa que los gatos siguen respondiendo bajo un castigo severo si el estímulo punitivo ha sido introducido con baja intensidad y se ha aumentado gradualmente . Como se ha descubierto que estas consideraciones afectan el grado de reducción obtenida. El procedimiento dei costo de respuesta es particularmente interesante debido a su semejanza con el uso dei cambio monetário. En el procedimiento de Weiner. A pesar de estas limitaciones. a fin de programar tanto las consecuencias reforzantes como las punitivas. cada una de ellas será examinada en detalle. a fin de tener la oportunidad de retirar ex­ perimentalmente ese reforzamiento. pues no parece posible disponer una situación en la que se pueda eliminar un reforzador primário que el animal ya haya obtenido. El procedimiento de Weiner parece proporcionar una oportunidad excelente para estudiar el refor­ zamiento y el castigo concurrentes empleando una sola dimensión de estímulo.470 CAP. el costo de respuestas parece ser un estímulo punitivo que tiene un gran efecto en las respuestas de los humanos. y segundo. Modo de presentación Es fundamental el modo como se presenta por primera vez el es­ tímulo punitivo. La presentación súbita dei castigo parece producir una mayor reducción de las respuestas castigadas que si se aumenta gradual­ mente la intensidad dei castigo. Es de suponerse que la ausência de câmbios en el contador de respuestas constituiria un estado de cosas neutral. debe haber un reforzador condicionado. la sustracción de un punto dei contador de respuestas constituía un estímulo punitivo. su efecto depende en gran parte de la manera como se administre el estímulo. El estímulo punitivo puede presentarse gradualmente o de súbito. Además. Puede ser ligero o severo.

antes de tratar de evaluar la efectividad dei reforzamiento comestible. Si la presentación inicial dei castigo se hacía a intensidades más bajas (60 voltios o menos). Miller (1960) encontro que el castigo producía una reducción menor de la respuesta si la intensidad dei estímulo punitivo se aumentaba gradualmente en dias sucesivos. El procedimiento comúnmente adoptado en tales circunstancias es hacer que los animales se adapten al sonido dei solenoide. Holz y Azrin. En un estúdio previo dei castigo continuo se había demos­ trado que si se empleaba inicialmente una intensidad elevada (80 voltios o más). en vez de presentarle el estímulo pu- . haciendo primero que el animal se adapte a la novedad consumada dei estímulo punitivo. Este fenômeno no se limita a la presentación dei castigo. Puede ser que la aparición inicial* dei castigo sea especial­ mente efectivo no sólo debido a sus propiedades aversivas. 1963) que: Fue necesario tener mucho cuidado al presentarle el castigo por primera vez al sujeto. pareceria que el castigo se pudiera estudiar de modo semejante. se ha notado (Azrin. Es sabido que la presentación súbita de un estímulo novedoso por sí mismo reduce la emisión de las respuestas. por lo ge­ neral. Aún no se ha podido determinar la base de esta efectividad acentuada dei castigo. de manera irreversible. Una situación semejante parece existir con respecto al reforzamiento positivo que se da por medio de la administración de comida. el primer movimiento dei solenoide suele causar una perturbación en la conducta dei animal. Holz y Hake. 1963). entonces. la ejecución se mantenía fácilmente. paradójicamente. Asimismo. Esta novedad puede combinarse con la aversidad dei estímulo punitivo. Se ha descubierto que un au­ mento súbito y sustancial de la intensidad prevaleciente dei estímulo punitivo también acentúa el grado de supresión producido (Azrin. 19606. sino también porque constituye un cambio de estímulo muy dramático. incluso cuando posteriormente se hacía aumentar el castigo a intensidades hasta de 130 voltios.A D M IN IS T R A C IÓ N DEL C A ST IG O 471 durante un periodo. Brethower y Reynolds (1962) notaron que la presentación inicial de un castigo de intensidad elevada producía una gran reducción de las respuestas en un sujeto. Entonces. 1959a. Parece entonces que la supresión de las respuestas que produce el castigo se acentua al presentar súbitamente el estímulo punitivo con toda su intensidad. Por analogia. parece que la administración de reforzamientos comestibles realmente ha reducido la conducta. era probable suprimir las respuestas completamente y. a fin de producir una reducción inicial profunda de las respuestas castigadas. En un estúdio experimental directo de este pro­ blema. Cuando se da comida a un pichón mediante un depósito operado por un solenoide ruidoso.

1956) se obtuvieron resultados similares en que el castigo inmediato no era más efectivo que el mediato durante la primera hora. En estúdios posteriores (Azrin. independientemente de la conduc­ ta dei sujeto (Azrin. Técnicamente. el estímulo puni­ tivo debe administrarse inmediatamente. En ausência de tales precauciones. Éstos indicaron que el estímulo punitivo era igualmente efectivo si se reducían las respuestas cuando era inmediato y cuando no lo era. después de ese mo­ mento las respuestas se recuperaron sustancialmente y muchas veces por completo durante el castigo mediato.472 CAP. Hunt y Brady (1955) obtuvieron resultados similares. afirmamos también que tal administración debe ser inmediata para lograr un máximo de efectividad. 1956). Estes (1944) planteó la cuestión de si era necesaria la inmediatez dei castigo. Cuando se quiere administrar el castigo inmediatamente después de una respuesta. mientras que durante el cas­ tigo inmediato las respuestas se redujeron indefinidamente y muchas veces por completo. A fin de evitar este apareamiento . se han empleado cuatro métodos para programar el casti­ go mediato. el estímulo aversivo se administra por medio de un aparato contador. sino algún tiempo después de la emisión de la misma. el estímulo aversivo puede presentarse inmedia­ tamente después de una respuesta. La desventaja aparente de este método es que. En uno de estos métodos. puede suceder que la supresión extremada producida por la ocurrencia inicial de un castigo de gran intensidad constituya una confusión de las propiedades aversivas dei estímulo punitivo con sus propiedades de estímulo novedoso. sin embargo. Chung (1965) ha no­ tado este efecto cuando se aumenta súbitamente el requisito de fuerza de una respuesta. Inmediatez dei castigo Al definir el castigo afirmamos que el estímulo punitivo debe administrarse después de la respuesta que se ha de castigar. ocasionalmente. Por implicación. En am­ bos estúdios la administración dei castigo se limitó a un período de menos de una hora. En un estúdio. el procedimiento técnico es directo. Para una efectividad duradera. Los resultados de este procedimiento de castigo mediato se compararon con los resultados de un procedimiento de castigo inmediato. Llevó a cabo un experimento con­ trol en el que el estímulo punitivo no era administrado inmediatamente después de la respuesta. Sin embargo. Esta explicación no parece dar cuenta por completo de la sensibilidad que muestran las respuestas castigadas ante un aumento súbito dei castigo. 9 C A ST IG O nitivo a intensidad elevada en la primera presentación. el es­ túdio dei castigo mediato presenta algunos problemas metodológicos.

pues el ruido continuo no parece producir reacciones esque­ léticas interferentes.A D M IN IS T R A C IÓ N DEL C A ST IG O 473 ocasional dei estímulo aversivo con la respuesta. Cuando el ruido se administraba en una base continua. 1955) han empleado una combinación de estos dos métodos con el fin de evitar coincidências accidentales de las respuestas con el estímulo punitivo. El tercer método ha consistido en administrar automáticamente un estímulo punitivo siempre que ha transcurrido un tiempo fijo sin emitir una respuesta. El cuarto método para evitar que la respuesta sea seguida por el inicio dei estímulo punitivo consiste en abandonar el uso de un estímulo punitivo discreto. En los cuatro . el choque eléctrico no puede usarse fácilmente para comparar este método de castigo mediato con el cas­ tigo inmediato. entonces. se hizo una comparación con los efectos dei ruido continuo (Azrin. en vez de en una con­ tingente sobre la respuesta. no existe ninguna posibilidad de que el inicio o la terminación dei es­ tímulo coincida con la ocurrencia de una respuesta en particular. Este método de programar el castigo mediato evita las desventajas de los tres métodos anteriores. más que discreto. el estímulo punitivo se presenta como un evento continuo. no se producía ninguna reacción duradera. éste es precisamente el método que ha usado extensivamente Sidman (1953) para mantener la conducta en vez de eliminaria. El ruido se programo con sujetos humanos de dos maneras: en el procedimiento de castigo inmediato se producía un estallido ruidoso inmediatamente después de cada respuesta. En un estúdio en que se empleó el ruido como castigo inmediato. Cuando este método se emplea al mismo tiempo que el reforzamiento positivo para una respuesta (Azrin. Se encontro que las respuestas se reducían mientras estaba presente la contingência punitiva en el procedimiento en el que el ruido se administraba inmediatamente después de las respuestas. Con todo. 1959) las respuestas aumentan en vez de disminuir. Parece. 1958). Con todo. se ha utilizado un segundo método en el que el experimentador observa al sujeto y admi­ nistra el choque solamente cuando el sujeto no está respondiendo. 1958. Hunt y Brady. Si el estímulo se presenta sin interrupción. como seria el caso con el castigo. pues el choque eléctrico continuo da lugar a reacciones esqueléticas que pueden interferir con la emisión ^de respuestas. Pare­ ceria que este tercer procedimiento fuera a prueba de tontos para eli­ minar cualquier coincidência de la respuesta con el estímulo punitivo. Algu­ nos investigadores (Estes. El ruido es un estímulo punitivo más adecuado para usarlo en presentaciones continuas. 1944. mientras que en el segundo procedimiento el ruido se administraba conti­ nuamente. En este método de estimulación no contingente. el más simple de todos. Kelleher y Cook. que la inmediatez dei castigo es un determinante fun­ damental dei grado de reducción de respuestas obtenido.

1963. como en los estúdios anteriores. incluso cuando la duración de tiempo-fuera era muy grande. Intensidad dei castigo Se ha encontrado que la intensidad dei castigo es uno de los principales determinantes dei grado de reducción de la respuesta que produce el castigo. 1963. 1938). Estes. Azrin. al reducir la emisión de respuestas. Azrin. Holz y Hake. el grado de supresión parece ser igualmente pequeno (Skin­ ner. Brethower y Reynolds. sólo en las etapas iniciales dei castigo tiene un efecto apreciable el castigo mediato. Holz y Azrin (1962a) encontraron que el castigo sonoro reducía las respuestas en no más dei 80 por ciento. la supresión ha sido virtual­ mente completa en las intensidades altas (Appel. aunque la intensidad dei ruido fuera de 138 decibeles. Es probable que la capacidad que tiene el choque eléctrico de producir cualquier grado de supresión que se desee. 9 C A ST IG O métodos. aunque no se hizo ninguna manipulación experimental de la intensidad de la bofetada para determinar si se podia aumentar el grado de supresión. 1960a. 1961. redujeron las respuestas aproximadamente en un 50 por ciento. Las intensidades grandes. 19596. De modo semejante. mayor será la reducción de las respuestas castigadas (Appel. Utilizando seres humanos como sujetos. 1952. hasta de 135 decibeles. el castigo administrado por medio dei ruido intenso no parece ser capaz de eliminar completamente las respuestas dentro de la gama de intensidades practicable que ha sido empleada. el castigo de tiempofuera produjo poca supresión. Masserman (1946) informo que había una supresión completa cuando las respuestas se castigaban con ráfagas de aire. cuando la intensidad dei castigo sonoro era de 105 decibeles o menos. relativamente.474 CAP. Dinsmoor. 1944). no se hizo ningún estúdio de los câmbios dei grado de supresión como función de la intensidad de la ráfaga de aire. Cuando se usaron pichones como sujetos. 1959a). la amplia gama de efectividad dei choque eléctrico constituye su principal ventaja. No todos los estímulos aversivos han resultado poseer el grado de efectividad dei choque eléctrico. La severidad dei cho­ que eléctrico puede manipularse a lo largo de una gama lo suficien­ temente amplia para producir cualquier grado de supresión deseada. Como se vio en la figura 3. explique en parte el uso generalizado dei choque eléctrico como estímulo punitivo. Las ráfagas de aire parecen ser muy efectivas. Azrin (1958) en­ contro que había poca supresión. Cuando se usó una bofetada de la barra como estímulo punitivo. De nuevo. Cuando se ha aplicado un choque eléctrico. Como se hizo notar anteriormente. . 1962. Azrin. Todos los estúdios de la intensidad dei castigo han descubierto que mientras mayor sea la intensidad dei estimulo punitivo.

se administra un estímulo punitivo por cada respuesta. 1956). La existencia de esta supresión “anticipatoria” demuestra cómo puede restringirse especificamente el efecto dei castigo al momento en que el mismo ha sido programado. Zimmerman y Ferster (1963) encontraron la misma superioridad dei castigo continuo sobre el intermitente usando un periodo de tiempo-fuera como estímulo punitivo. En la exposición continua. Hendry y Van-Toler (1964) en­ contraron una aceleración negativa de las respuestas bajo el castigo de razón fija cuando las respuestas eran mantepidas con reforzamiento continuo. Este . en vez dei programa de reforzamiento de intervalo variable que usaron Azrin. Holz y Hake (1963). Hunt y Brady (1955) y Azrin (1956) han utilizado este programa con algunas modificaciones. 1963). Alternativamente puede administrarse un estímulo punitivo por cada n respuestas (cas­ tigo R F). mayor fue la reducción de la respuesta. Se encontro que después de una exposición prolongada al programa IF (Azrin. La primera presentación dei castigo RF produjo una aceleración positiva en el periodo situado entre las administraciones sucesivas dei estímulo punitivo (Azrin. la tasa de respuestas disminuía a cero conforme se acercaba el momento de administrar el castigo programado. el castigo continuo (RF 1) produjo la mayor supresión. En ambos estúdios. aunque cada una de estas operaciones cambió la tasa de respuestas absoluta. se produjo una reducción general de las respuestas con las primeras administraciones dei estímulo punitivo. la uniformidad dei patrón de respuestas no fue alterada por los câmbios de intensidad dei castigo ni por el nivel de privación de comida. Holz y Hake. De este modo. La frecuencia de las respuestas castigadas estuvo en función directa de la razón fija: mientras mayor era la proporción de respuestas castigadas. Este programa de castigo puede disenarse como un castio-o continuo por analogia con el reforzamiento positivo. La uniformidad de la tasa de respuestas prevaleció cuando la razón de las respuestas no castigadas en relación con las castigadas se aumento de 1:1 a 1000:1.A D M IN IS T R A C IÓ N DEL C A STIG O 475 Programa de castigo RAZÓN FIJA En el caso más simple. surgió una tasa de respuestas uniforme sin ninguna aceleración ni desaceleración de las respuestas castigadas entre las administracio­ nes sucesivas dei estímulo punitivo. INTERVALO FIJO Bajo el castigo en IF. el estímulo punitivo se administra a la primera respuesta que se emite después de un tiempo fijo transcurrido desde que se administro el castigo anterior.

Asueto sin castigo Podría parecer que un periodo de “asueto” o tiempo-fuera de un período de castigo permitiria ganar fuerza a la respuesta castigada. 1962) o mayor (Azrin. Un método de proporcionar un asueto consiste en evitar que ocurra la respuesta (no hay respuesta. aunque se había eliminado el estímulo punitivo. Cuando se reintrodujo al sujeto a la situación experimental.476 CAP. no hay castigo) durante un periodo entre las sesiones. Otro tipo de asueto permite que la respuesta sea reforzada mientras el castigo se elimina temporalmente. Podría parecer que los reforza­ mientos adicionales fortalecen la respuesta y que ésta resiste los efectos de cualquier castigo posterior. En un estúdio. que también es un programa intermitente. Al comparar el castigo continuo con un programa de castigo intermitente. se comparo el programa de castigo IV con el IF y se encontro que el primero producía más supresión (Azrin. Los resultados obtenidos indican que no es esto lo que sucede. las respuestas siguieron estando comple­ tamente suprimidas. También se ha encontrado que cada uno de estos factores . 19606). 19606). Otro ejemplo de un programa de castigo es el castigo diferencial de tasas altas de respuesta de Ferster (1958). en vez de una positiva. 1938). El espacio temporal por si mismo no reduce los efectos supresivos dei castigo. a veces mayor (Azrin. 1956). Masserman (1946) citó un ejemplo dramático: dio un descanso de veinte meses a un gato cuyas res­ puestas habían sido suprimidas por completo. Se ha visto que la efectividad dei estímulo punitivo es influida por la intensidad. 1946). Este hallazgo concuerda con el descubrimiento acerca dei castigo de razón fija. no hay reforzamientos. Los resultados indican que la reimplantación de la situación de castigo suprime las respuestas con igual intensidad (Masserman. 9 C A ST IG O patrón temporal de las respuestas parece ser similar al patrón temporal que se observa bajo el programa de reforzamiento IF con comida (Skin­ ner. los hallazgos indican que lo que sucede es que el retiro dei castigo tiene como resultado una su­ presión igualmente grande (Brethower y Reynolds. 1946) cuando el castigo se vuelve a aplicar pos­ teriormente. a excepción de que se produce una aceleración negativa. que antes dei asueto. Aún no se han estudiado extensivamente otros tipos de programas de castigo. También se obtuvo este nivel de supresión cuando se interrumpió brevemente una sola sesión (Azrin. Masserman. la frecuencia. la programación y la distribución temporal dei estímulo. 19606. De nuevo. 19596. Estes (1944) encontro que el castigo continuo era más efectivo que el intermitente mientras el castigo estaba en efecto.

pero opuesto al mismo en términos de la dirección dei cambio conductual. Asimismo.V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A STIG O 477 desempena un papel primordial como determinante de la efectividad de un estímulo reforzante. Para que una persona pueda aprender a emitir en primer lugar una cierta respuesta. Sin embargo. y se ha encontrado que un periodo de descanso aumenta la efectividad de un reforzador positivo (Ferster y Skinner. 27). se inicia la extinción. y el uso dei castigo sólo acelera la eliminación de la respuesta. En realidad. 1961) dei mismo modo que hemos visto que un periodo de descanso o asueto aumenta la efectividad dei castigo. es necesario hacer investigaciones adicionales a fin de dilucidar la generalidad de esta comparación teórica dei reforzamiento con el castigo. el castigo y el reforzamiento están entrelazados inextricablemente: la propia existencia dei proceso de castigo exige que haya algunos procedimientos de reforzamiento concurrentes. VARIABLES DEL REFORZAMIENTO QUE INFLUYEN EN LOS EFECTOS DEL CASTIGO Si una respuesta es castigada. a un nivel descriptivo. la frecuencia es un determinante primordial tanto de las respuestas reforzadas con comida (Skinner. 1957. Ciertamente. pero un aumento de la frecuencia de la administración dei castigo hará disminuir las respuestas castigadas. 1938) como de las respuestas castigadas.reforzamiento. supuestamente se requiere algún tipo de reforzamiento. como veremos en secciones posteriores. y tal vez deje de haber respuestas que castigar (pág. se ha encontrado que el refor­ zamiento demorado es menos efectivo (pero no inefectivo) para mantener la respuesta cuando se usa comida como reforzamiento (Skinner. El reforzamiento positivo y el castigo parecen comparables en otros aspectos. si el reforzamiento se suprime durante mucho tiempo. 1938). se ha visto que el castigo demorado fue menos efectivo (pero de ninguna manera inefectivo) para suprimir las respuestas. se extingue por la ausência de . Un aumento de la frecuencia de la ad­ ministración de comida aumentará las respuestas reforzadas con comida. Si el reforzamiento se presenta como una simple consecuencia física dei acto. no parece haber ninguna razón para suponer que el reforzamiento cese siempre que se empieza a aplicar el castigo. por ejemplo. por ejemplo. como vere­ mos en la sección siguiente. Como regia empírica. Reynolds. pero no es reforzada de alguna ma­ nera. . parece adecuado describir al castigo como un proceso semejante al reforzamiento positivo en términos de sus deter­ minantes. Dinsmoor (1952) ha expresado la misma opinión acerca de la existencia necesaria dei refor­ zamiento.

1938). pero no cambia esta uniformidad básica (Azrin. Herrstein y Morse. Como resultado de esto. 1957). cada respuesta es reforzada y castigada. Cuan­ do el castigo se administra a cada respuesta durante el reforzamiento RF. Puede considerarse que el grado de esta ace­ leración de la respuesta es un tipo de “discriminación temporal” o un patrón. 1960. Cuando se usa un programa de reforzamiento IF. 1961). la elección de un programa de reforzamiento en particular debe ser importante para determinar el efecto que va a tener un estímulo punitivo. Brethower y Reynolds. la pausa posreforzamiento se alarga. 19756) para cuantificar el grado de aceleración de la respuesta. Cuando se administra un castigo por cada respuesta. 1957). la ráfaga de aire punitiva eliminó tanto la conducta de alimentarse como la respuesta operante. El castigo de cada respuesta reduce la tasa. 1960a. la tasa de respuestas suele ser bivalente: de inmediato después dei reforzamiento se presenta un periodo de cero respuestas. Skinner. 1961). 1938). En el caso más simple. normalmente se presenta una aceleración positiva de las respuestas entre los reforzamientos (Ferster y Skinner. 1962. puede reducirse considerablemente el número de respuestas IF (Azrin. Bajo el reforzamiento RF. Cuando se usa únicamente un programa de reforzamiento IV. Examinemos varios aspectos dei re­ forzamiento que se han revelado significativos para la efectividad dei castigo. Un programa de reforzamiento continuo crea una situación especial en la que el castigo se administra en el mismo momento en que el organismo se acerca al reforzamiento. Programas de reforzamiento Ya que la respuesta castigada también es reforzada. 1944. pues las respuestas no reforzadas serán también castigadas. 9 C A ST IG O Una situación punitiva duradera debe incluir tanto el reforzamiento como el castigo de las respuestas. 1952. pero hay sólo una ligera reduc- . Se han creado dos medidas (Fry. Holz y Azrin. 19606. como sucede en el estúdio de Masserman (1946). Estes. pero el grado de discriminación temporal permanece inmutable (Azrin y Holz. las respuestas se emiten a una tasa uniforme (Ferster y Skinner. seguido por un cambio repentino a un “encarreramiento de la razón” con una tasa de respuestas muy alta (Skinner. Dinsmoor. Kelleher y Cook. Este problema se reduce al mínimo si se utiliza un programa de reforzamiento intermitente en el cual el estímulo punitivo no se aparee exclusivamente con el reforzamiento de comida. 1958.478 CAP. Se ha encontrado que el tipo de reducción de la respuesta que pro­ duce el castigo depende dei tipo de programas de reforzamiento que está manteniendo las respuestas castigadas.

se obtienen explosiones de res­ puestas ocasionales. Asimismo. Frecuencia dei reforzamiento Se han efectuado dos estúdios (Azrin y Holz. Dardano y Sauerbrunn (1964c) encontraron que sus sujetos preferían un requisito de tasa elevada que no era castigada. Azrin y Ulrich. En un tercer experi­ mento. Este programa rdb produce ordinariamente una emisión de respuestas de tasa baja en la que los tiempos entre respuestas generalmente se aproximan al tiempo entre respuestas mínimo requerido para obtener refor­ zamiento (Anger. se alarga el tiempo modal entre respuestas. se debe especificar cuál es el programa de reforzamiento que está manteniendo las respuestas. esto se nota en la alta frecuencia que tienen los tiempos entre respuestas cortos en la distribución dei tiempo entre res­ puestas. estos tiempos entre respuestas cortos son eliminados. El uso dei castigo durante el reforza­ miento RF no se manifiesta en una tasa más baja. lo que se reduce es la tasa de respuestas total. Esto puede verse en un segundo experimento de Dardano y Sauer­ brunn (19646) en el que una larga pausa precedia al encarreramiento de la razón cuando se administraba un choque intenso durante la parte inicial de la razón. como sería de esperarse por la definición básica dei castigo. 19596). A fin de especificar la naturaleza de la reducción de respuestas que produce el castigo. Cuando se castiga cada respuesta durante el reforzamiento rdb. ocasionalmente. inexacta. con el . La parte inicial dei encarreramiento de la razón parece ser muy sensible a los efectos dei casti­ go. 1956). La tasa de respuestas terminal permanece constante. 1961. a un requisito de tasa baja que era castigada. incluso con bajas intensidades de castigo que no producen câmbios en el resto de la distribución de los tiempos entre respuestas (Holz. La simple afirmación de que el castigo reduce las respuestas castigadas es inadecuada y. determina el patrón temporal que tienen las respuestas durante el castigo. Hemos visto que la elección de un programa de reforzamiento en particular para mantener la respuesta castigada. En las intensidades de castigo más altas. Dardano y Sauerbrunn (1964a) encontraron el mismo resultado cuando se administraba un solo castigo a la primera respuesta de la razón fija. La pausa era más corta cuando el choque intenso se administraba durante la última parte de la razón. 1963).V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O 479 ción en la alta tasa de respuestas (Azrin. Estes. El procedimiento de reforzamiento puede disponerse también de una manera tal que haya un reforzamiento diferencial de las tasas bajas. 1944) en los que se ha comparado el grado de reducción de las respuestas que se produjo cuando el castigo se aplicó durante la extinción.

9 480 F IG U R A 4. Asimismo. en ambos estúdios se demostro que en tanto se mantuviera el castigo mientras duraba el período de extinción. el pro­ ceso de extinción podia acortarse considerablemente. (T o m a d o de A z rin y de H olz. ambos procedimientos reducen la tasa de la respuesta. Parece. tanto con respecto al número de respuestas como por lo que se refiere al tiempo que du­ raba la extinción (véase la figura 4). En ambos estúdios se encontro que el castigo producía una tasa de respuestas más baja cuando se aplicaba durante los períodos de extinción. entonces. De este modo. como el castigo de gran intensi­ dad operan en la misma dirección. No la em itid a s hubo sesión . d iv e rsa s prim ero. el cada Efectos in te n sid a d e s cual se de la de extinción c a stig o a d m in istro al de la s re sp u e sta s m anten id o. n in g ú n El c a stig o en un in te rv a lo refo rza m ie nto se C A ST IG O a d m in istro fijo d e sp u é s d e sp u é s ante dei de 1 9 6 1 .) grado de reducción habido cuando el castigo se aplicó durante el refor­ zamiento.CAP. cuando ambos se usan simultânea- . que tanto una frecuencia de reforzamiento reducida. in icio respuesta.

sólo durante los programas de reforzamiento de razón los efectos reductivos dei castigo llevan a una disminución dei reforzamiento. Como la administración dei reforzamiento depende de la emisión de las respues­ tas. 1959£>). El programa de reforzamiento drb es especialmente útil como mé­ todo para estudiar el castigo. De tal suerte. porlo general se usa el castigo para contrarrestar un reforzamiento concurrente. el proceso dei castigo lleva indirectamente a una menor frecuencia de re­ forzamiento en los programas de reforzamiento de razón. El empleo dei reforzamiento drb es un caso en el que el castigo de una respuesta aumenta realmente la eficiencia de esa respuesta. la eliminación de la conducta es más rápida que cuando se emplea sólo el castigo o la extinción.V A R IA BLE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O 481 mente. Una opinión común acerca dei castigo pretende que éste interfiere con la ejecución deseable o productiva. En realidad. existe una interrelación inversa entre la inten­ sidad dei castigo y la frecuencia de reforzamiento (Azrin. Azrin y Ulrich. Holz. Bajo programas de intervalo. y a pocos câmbios bajo el reforzamiento de intervalo. Como el castigo produce pausas más largas entre las respuestas. generalmente el nú­ mero de respuestas emitidas es mayor que el número necesario para obtener la máxima frecuencia de reforzamiento. En resumen. Hemos visto que la presencia o ausência dei reforzamiento de la respuesta castigada determina la efectividad dei castigo. Si se usa un programa de reforzamiento RF. salvo cuando las respuestas se suprimen casi completamente (Azrin y Holz. Por tanto. Es probable que muchos investigadores hayan utilizado los programas de reforzamiento de intervalo debido a este alto grado de independencia que hay entre el castigo y la frecuencia de reforzamiento. 1963). Puede considerarse que el castigo de las respuestas drb se hace “en provenho” dei sujeto castigado (mayor frecuencia de reforzamiento positivo). 1961. pues la frecuencia de reforzamiento se reduce en proporción directa a la efectividad dei castigo. la reducción de éstas mediante el castigo lleva generalmente a una reducción de la frecuencia de reforzamiento. Azrin y Ulrich. 1963). la reducción de la frecuencia de la respuesta por medio dei castigo lleva a poca o ninguna reducción de la frecuencia de reforzamiento. Como se dijo anteriormente. . a una mayor frecuencia de reforzamiento bajo el reforzamiento drb. es inexacto considerar que el empleo concurrente dei castigo y el reforzamiento constituye necesariamente una situación de “conflicto” acerca de la recepción dei reforzamiento. a menudo la frecuencia de reforzamiento aumenta durante el castigo (Holz. También sucede que la adición de un castigo altera la frecuencia dei reforzamiento de la respuesta castigada.

Número de respuestas disponibles En la mayoría de los estúdios sobre el castigo.482 CAP. se pone a disposición dei sujeto una sola respuesta para obtener el reforzamiento. Si el castigo hace que el sujeto deje de responder por completo. fueron esencialmente los mismos que se obtuvieron . Sin embargo. si las respuestas han sido completamente suprimidas por una motivación baja para la comida. Los resultados obtenidos con ruido. Holz y Hake. Herman y Azrin (1964) llevaron a cabo un experimento en el que se repitieron las caraterísticas esenciales dei procedimiento de Holz. En este punto podemos poner en tela de duda si los resultados de este experi­ mento son aplicables a las situaciones punitivas en general. Azrin. usaron un ruido. 1962). Consideremos ahora la situación en la que el sujeto sí tiene a su disposición alguna respuesta alternativa que no ha sido cas­ tigada y que puede producir el reforzamiento. No obstante. el castigo se volvió casi inefectivo al aumentar el grado de moti­ vación para emitir las respuestas castigadas (Azrin. con una considerable privación de comida. a câmbios ligeros de privación de comida (Azrin. 1963). en vez de emplear un tiempo-fuera como estímulo punitivo. sin embargo. la tasa de respuestas castigadas parece ser extrahamente sensible. Storms. En un caso. incluso. Sin embargo. Dinsmoor (1952) encontro que el castigo reducía las respuestas si el sujeto era privado de comida en mayor o menor grado. 1963). o si se limitan a las situaciones que utilizan las propiedades únicas de un periodo de tiempo-fuera como estímulo punitivo. como se ve en la figura 5. Se ha encontrado que cuando ha estado en efecto una larga historia de reforzamiento de IV con comida. Holz y Hake. 1957). el sujeto no tiene ningún medio alternativo para obtener el reforzamiento de comida. la tasa de respuestas no cambia apreciablemente como función dei grado de privación de comida (Ferster y Skinner. Azrin y Ayllon (1963). las respuestas eran reducidas en una proporción más pequena. 1946. el aumento de la motivación no parece ser efectivo para restablecer las respuestas (Masserman. 19606. cuando se agrega el castigo después de esta larga historia. 9 C A ST IG O Motivación para responder La medida en que una respuesta reforzada con comida resiste los efectos dei castigo depende dei grado de privación de comida. Cuando esta respuesta también es castigada. Boroczi y Broen. en una sección anterior dedicada a los efectos dei tiempo-fuera. no se produce ningún reforzamiento. Hemos visto anteriormente ejemplos de este caso en el experimento de Holz.

Cuando sólo había un manipulando (situación de respuesta única). las 25 res­ puestas dei requisito de razón fija tenían que ser emitidas en el manipu­ lando disponible. la tasa de respuestas castigada emitida en el mismo manipulando fue reducida por completo y casi inmediatamente. mediante el procedimiento de cubrir la segunda tecla. datos inéditos) se usaron pichones como sujetos y un choque con un electrodo como estímulo puni­ tivo. 1 9 6 4 . nos en un R egistros a c u m u la tiv o s de p ro g r a m a de refo rzam ie nto la s IV . el sujeto podia distribuir las 25 respuestas de cualquier manera. Parece que la situación de respuesta alternativa produce una mayor supresión de respuesta cas­ tigada que una situación de respuesta única. se usaron dos teclas de respuesta circulares. Los picoteos en cualquier tecla eran reforzados según un programa de reforzamiento con comida RF 25.VA R IA BLE S Q UE INFLU YEN EN LOS EFECTOS DEL C A STIG O 483 M IN U TO S F IG U R A 5. mientras que en una situación de respuesta alternativa. En un experimento adicional (Azrin. La tasa de respuestas en una situación de respuesta única fue afectada sólo ligeramente por una intensidad dada de cas­ tigo sonoro. re sp u e stas No se c a s t ig a d a s in d ic a n la s em itid a s p o r su{etos a d m in istra c io n e s de hum a­ refo rza - m ientos. Cuando disponía de las dos teclas.) con el tiempo-fuera. Cuando se ponía a disposición dei sujeto una sola tecla. se registraba un castigo . q u e se a p lic a b a a ca d a respuesta. a fin de estudiar los efectos de una situación de respuesta alterna­ tiva en comparación con una situación de respuesta única. todas o ninguna de las 25 respuestas podían emitirse en un manipulando dado. Como manipulandos. El c a stig o era un so n id o m olesto e m itid o p o r un z u m b a d o r. (B a s a d o en d a to s to m a d o s de H e rm a n y A z rin . una parte. El castigo por medio de un choque en la cola se administraba a cada una de las respuestas emitidas en una de las teclas.

por la La lo em itid a s m en os tecla d e scu b ie rta s en in te n sid a d cinco p re fe rid a (con la d ei d ia s cubierta resp ue sta tecla ca stigo p a ra (sin a lter­ p u b licad o s. Puede verse que la tasa de respuestas emitida en el manipulando castigado estuvo en función inversa de la intensidad dei choque. aunque la misma intensidad de castigo pro- . A 50 voltios. la s resp ue stas e m itid a s en a m b a s teclas e ra n efectiva s p a ra concurrente d escargas a lte rn ativa) (T om ad o re sp u e stas de RF. re sp u e sta n ativa). Cuando se disponia de ambos manipulandos en la situación de respuesta alternativa. a 50 voltios. Los d a to s H a b ía La se ta sa tom aro n d o s teclas de lle n a r el req u isito a u m e n to ca d a con in te nsid ad . como se muestra en la parte supe­ rior.) por cada respuesta. de m a n e ra se de de d ie z voltio s. respuesta. la tasa de respuestas siguió siendo de aproximadamente el 70% de la tasa no castigada. sólo se castigaban las respuestas emi­ tidas en un manipulando (el manipulando preferido). p ro g r a m a RF 2 5 . Una parte de los resultados de este experimento se resumen en la figura 6.CAP. d e ja n d o llevó d a to s de no a la s RF de cabo p a sa r con resp ue sta re sp ue sta s com ida . un p ic h ó n c a s t ig a d a s que com o h a b ía Este fu nció n sid o de re fo rza d o la in te n sid a d b a jo un dei castigo. que muestra la tasa de respuestas emitida en el manipulando castigado con diversas intensidades de choque. El c a stig o se a d m in istro a p re fe rida . p ro ce d im ien to se y teclas con de A z rin y to d a s con el p ro g ra m a am bas Holz. el castigo no tuvo un efecto más pronunciado. En la situación de respuesta alternativa. 9 484 C A ST IG O IN T E N SID A D D E L CASTIG O ( V O L T IO S ) F IG U R A 6. la tasa se redujo sólo en un 10%. No se puede observar ninguna reducción de las respuestas superior a aproximadamente 40 voltios en la situación de respuestas única. en la sección sobre la intensidad dei castigo. se suprimieron completamente las respuestas emitidas en el manipulando castigado. Incluso a 60 voltios.

En el tercer procedi­ miento que examinamos ahora. El procedimiento es el siguiente: un pichón es reforzado concomida según un programa de reforzamiento de razón fija a fin de establecer una frecuencia de respuestas elevadas. El procedi­ miento de respuesta alternativa difiere dei procedimiento común en que hay una segunda respuesta que proporciona la misma frecuencia de reforzamiento y no proporciona ningún castigo. al sujeto se le da la oportunidad de escapar enteramente de la situación relacionada con el castigo. En el procedimiento punitivo común. produce un cambio de estímulos. La respuesta emitida en esta segunda tecla de respuestas no produce reforzamiento ni comida. Consideremos ahora la situación en la que el sujeto tiene un medio para escapar de la situación en la que la respuesta es castigada. el periodo de seguridad dura hasta la administración dei reforzamiento. Luego se pone a disposición dei sujeto una. un ruido molesto. que consiste en un cambio de la iluminación y un cam­ bio dei nivel de ruido dei ambiente. Luego se administra el castigo en forma de un choque eléctrico después de cada respuesta. la función de la respuesta de escape emitida en la segunda tecla de respuestas es la de proporcionar un periodo de escape durante el cual puede emitirse la respuesta sin ser castigada. Ante este estímulo cambiado. ya sea que el estímulo aversivo sea un periodo de tiempo-fuera. el sujeto tiene la opción de responder y recibir tanto el castigo como el reforzamiento. el sujeto debe emitir otra respuesta de escape con el fin de reinstalar el periodo de escape. o de no responder. un choque con electrodo o que los sujetos sean seres humanos o pichones. Una vez emitida la respues­ ta de escape. segunda tecla de respuestas. podemos llegar a la conclusión de que la situación de respuesta alternativa hace que una intensidad de choque dada produzca una ma­ yor supresión que en una situación de respuesta única. en cuyo caso no recibe ninguna de las dos cosas. Entonces. Escape de un estímulo punitivo Acabamos de estudiar la situación en la que el sujeto dispone concurrentemente de una respuesta alternativa no castigada mientras se castiga una respuesta diferente. En vez de eso. . a una situación en la que la respuesta no es castigada. Por tanto.V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O 485 dujo una reducción muy pequena en la situación de respuesta única. Inmediatamente después de la comida reforzante. pero sin que se administre ningún castigo. con lo cual se construye el procedimiento común de castigo y reforzamiento con comida concurrentes. el sujeto puede responder enla tecla de respuesta común y obtener comida como reforzamiento.

9 486 C A ST IG O IN T E N S ID A D D EL C AST IG O ( V O L T IO S ) F IG U R A 7. En la investigación anterior se comparo experimentalmente este pro­ cedimiento de escape con el procedimiento de castigo común en el cual ningún escape era posible. El procedimiento de escape y castigo tuvo como resultado mayor supre­ sión de respuestas castigadas que el procedimiento que no tenía escape. Cuando no se administro ningún castigo o se administro uno muy ligero. Hake. el castigo no solamente llevó a una reducción de las respuestas castigadas. Holz y Hutchinson (1965). tomada de Azrin. lo refo rzam ie nto a que m en os con que p ro d u c ía com ida. sino hasta que se alcanzó una intensidad de 70 voltios. el un sujeto p erio do d u ra n te el cual p o d ía n em itirse la s re sp u e stas sin q u e se a p lic a ra el c a stig o (cu rva p u n te a d a ). se emitieron pocas respuestas de escape. Cuando la intensidad llegó a 40 voltios. H olz y H utch inson . (T om ad o d e A zrin .) La figura 7. el sujeto estaba emitiendo respuestas de escape suficientes para permanecer en la situación segura durante casi toda la sesión experimental. sino que retiró al sujeto de la situación estímulo en la que se había programado el castigo. En esta figura puede verse que no se obtuvo una supresión completa. La línea continua de la figura 8 indica la reducción progresiva de las res­ puestas como función de la intensidad dei castigo sin oportunidad de esca­ par.CAP. basada en los datos de Azrin. muestra los resultados de este procedimiento. En 30 voltios se observo poca o ninguna supresión cuando no había ningún escape po- . Holz y Hutchinson (1965). En este procedimiento. La misma figura muestra que las respuestas se desplazaron de la situación estímulo donde había castigo a la situación estímulo en la que no lo había. 1 9 6 5 . H ake. Las R e sp u e stas re sp u e sta s em itiera una se de un c a s t ig a b a n resp ue sta de p ich ón típ ico en concurrentem ente e sca p e en otra tecla un RF (cu rva de 25 de continua). Hake. respuesta. Los resultados de esta comparación se muestran en la figura 8.

T a sa con de la re sp u e stas t a sa resp ue sta em itid a q u e te rm in a b a e ra n m a n te n id a s 1 9 6 5 . parece evidente que la tendencia a escapar de una situación seriamente punitiva fue lo bastante grande para mantener niveles sustanciales de respuestas de escape. la respuesta castigada se redujo a un nivel cero. . en la tercera parte dei procedimiento se le pedia al sujeto que emitiera más de una respuesta para producir el periodo de escape. Se encontro (véase la figura 9) que. 25. sible. c a stig o p ara H o lz d u ra n te un ob ten er co m id a y H utchinson. 30 voltios produjeron una eliminación casi completa de las respuestas castigadas. podían mantenerse requisitos de razón fija hasta de aproximadamente cien respuestas. Asimismo. cuando la respuesta de escape se programaba según un programa IF. Esta ten­ dencia a escapar de la situación punitiva se ve incluso a intensidades de castigo que no son lo bastante severas para suprimir la propia res­ puesta castigada. Estos resultados muestran que uno de los principales efectos que se producen al castigar una respuesta es la generación de una fuerte tendencia por parte dei sujeto a escapar totalmente de la situación punitiva. (T om ad o n in g ú n hay e lim in a b a el L as de no h a y cuando re sp u e sta s A zrin . A la ligera intensidad de 40 voltios. si se empleaba el periodo de escape como evento reforzante. c o m p a ra d a U na so la p eriodo. De este modo. De tal suerte.) con de c a s t ig a d a s e m itid as. e sca p e posible. un e sca p e p osible. H ake. en el procedimiento de castigo y escape (línea punteada). produjo una supresión completa en el procedimiento de castigo y escape. sin embargo. A fin de evaluar la fuerza de esta conducta de escape. surgia el pa­ trón de respuestas IF común. una intensidad de cas­ tigo que produjo poca o ninguna supresión en el procedimiento en el que no había la oportunidad de escapar.VA R IA BLE S Q UE INFLUYEN EN LOS EFECTOS DEL C A STIG O 487 co F IG U R A 8. re sp ue stas en una c a s t ig a d a s tecla con el sigu ie n te un p ro g r a m a RF de cuando em itid a s “ e sc a p e ” reforzam iento.

la inmediatez y lo gradual de su aplicación. La contribución de estas variables conductuales es enorme. El p a p e l de registro n o Los tres registros ex p e rim e ntale s de de la s un re sp u e sta s em itid a s en y H utch inson .) re sp u e stas sujeto. Son igualmente importantes la frecuencia y el programa de reforzamiento.488 CAP. Los p e rio d o s de son re fo rza d a s en escap e se in d ica n en el registro de resp uestas. como lo son la intensidad. se p or un o b licu a p e rio d o de corta tra z a d a lo s p e rio d o s de escape. 9 C ASTIG O ESCAPE RF D E L C A ST IG O 500 (/)< > < _J D D O< B-44 10 M IN UTO S F IG U R A esca p e 9. La misma intensidad de castigo que eli­ mina completamente las respuestas bajo un conjunto de procedimientos de reforzamiento. la motivación para responder. No es suficiente especificar las variables relacionadas con la administración dei castigo. H a ke . puede no afectar a la respuesta de ninguna manera bajo un conjunto diferente de procedimientos de reforzamiento. Las re sp u e sta s de escap e dei castigo. diferente. 1 9 6 5 . No poder observar los efectos reductivos de un estímulo que se supone punitivo puede atribuirse a la situa- . las H olz Hemos visto que el procedimiento de reforzamiento que se usa para mantener una respuesta es un determinante fundamental de la efectividad dei castigo sobre esa respuesta. una de D u rante tecla de escap e el se p e rio d o resp ue sta una con fija lín e a corrió d u ra n te tom aro n de ra zón la d e sd e escape. el in icio e stuvie ro n (T om a d o de de la s sesion es re fo rz a n d o A z rin . así como también la oportunidad de obtener el reforzamiento por medio de una respuesta no castigada o en una situación no castigada.

Veamos ahora algunos de los câmbios de la conducta que parecen ser resultado característico dei uso dei cas­ tigo. En ese estúdio. se encontro que la probabilidad de obtener una supre­ sión tan duradera estaba en función de la intensidad dei castigo. Primero. Estos otros eventos pueden referirse a la presencia o ausência dei propio castigo (como en una situación donde hay castigo intermitente o periodos alternados de cas­ tigo). En seguida. Los investigadores han notado que la respuesta castigada no se recupera du­ rante largo tiempo. 1962). la rapidez y el grado de supresión producidos durante el castigo prolongado. Azrin. Permanencia de la supresión Una de las características primordiales dei castigo es la virtual irreversibilidad o permanencia de la reducción de la respuesta que se pro­ duce. en un estúdio (Azrin. incluso después de que se ha retirado la contingência de castigo (Appel. Boroczi y Broen. más que de las propiedades estrictamente aversivas dei estímulo punitivo. analizaremos los resultados de los estúdios sobre el castigo en términos de la permanencia. Masserman. aunque ya no estuviera presente el castigo. 19606) en el que se empleó como estímulo punitivo un choque muy intenso. o incluso con un estímu­ lo asociado al reforzamiento. 1961. Luego. nos ocuparemos de los aspectos discriminativos dei castigo. Veremos que en la conducta hay câmbios característicos como resultado dei castigo. no se presentaba este efecto duradero y par­ cialmente irreversible dei castigo. 1946. El aspecto discriminativo dei castigo se refiere a la relación que tiene un estímulo punitivo con otros eventos.C ARAC TERÍSTICAS DEL PRO CESO DE C A ST IG O 489 ción de reforzamiento utilizada y no a su inefectividad como estímulo punitivo. se encontro que las respuestas se reducían a cero y no se recuperaban en un periodo de seis dias. Podría tratarse de explicar estos efectos . Por ejemplo. que han tenido relativamente poco reconocimiento a pesar de su importancia. CARACTERÍSTICAS DEL PROCESO DE CASTIGO Hemos examinado con algún detalle los diversos factores que determinan la efectividad dei castigo. una vez que la conducta ha sido suprimida por completo. A inten­ sidades de castigo bajas. examinaremos algunos câmbios distintivos que se producen en la conducta al terminar el castigo. 19606). Storms. El castigo puede asociarse discriminativamente con un estímulo reforzante o con un periodo de reforzamiento. pero que algunos de estos câm­ bios se derivan de la asociación única que tiene el castigo con otros eventos.

Dinsmoor.490 CAP. 1944) y la duración (Azrin. El castigo intenso no solamente redujo las respuestas al nivel incondicionado u operante. Sin embargo. Por supuesto. fue la efímera explosión de respuestas que se presentó después de la introducción de la bofetada de la barra como estímulo punitivo (Skinner. 1952) o en unos cuantos minutos (Estes. si bien a un nivel operante. . En contraste con la extinción. el grado (Estes. a menos que responda. especialmente si se observa una recuperación espontânea. en todos los estúdios dei castigo se ha estado completamente de acuerdo en que la reducción de las respuestas que produce el castigo es inmediata si el castigo es efectivo. 19606. la extinción lleva a una reducción de las respues­ tas. En los procedimientos de castigo y evitación. 9 C A ST IG O duraderos dei castigo teniendo en cuenta lo absoluto dei grado de su­ presión. Una variación menor de esta regia acerca de la inmediatez dei efecto. el castigo puede producir una reducción completa y duradera de las respuestas que evitarán el regreso de las respuestas castigadas. el sujeto no tiene ninguna oportunidad de notar la ausên­ cia dei castigo. 1938). la reducción de las respuestas se ha producido dentro de las primeras administraciones dei castigo (Azrin. podemos comparar el castigo con la extinción dei reforzamiento con comida en términos dei grado de reducción de las respuestas obtenido. El mismo tipo de razonamiento se usó anteriormente al analizar la persistencia de la conducta de evitación cuando se eliminaba la contin­ gência de choque. Cuando los datos se han presentado en términos de los câmbios que se presentan de momento a mo­ mento. sino que las redujo a un nivel de cero abso­ luto. 1938). Como el castigo se administra solamente después de que se emite una respuesta. 1956. 19606) de esta supresión inicial está en función directa de la intensidad dei castigo. incluso después de que se haya eliminado el castigo. la extinción a largo plazo reduce la conducta al nivel incondicionado u operante (Skinner. Si el castigo es tan severo que elimine completamente las respuestas. asegura que el animal ajuste su conducta de acuerdo con cualquier cambio experimental dei procedimiento de extinción. La existencia continua de respuestas durante la extinción. 1959a. 1944). entonces deja de existir la oportu­ nidad de notar la ausência dei castigo. Para hacer comparaciones. 1959Ò. Rapidez de los efectos dei castigo íQ ué tan rápidamente reduce el castigo a la conducta? Virtual­ mente. la con­ ducta dei animal puede alterarse de tal manera que elimine virtualmente todo contacto entre ella misma y las presentaciones dei choque.

la tasa de respuestas disminuyó sustancialmente a aproximadamente el 50% de la tasa no castigada durante los primeros 30 minutos de castigo. hacia la décima hora. tomada de Azrin (1960a). También . en los dias subsiguientes la tasa de respuestas ascendió gradualmente hasta que. también se ha observado que el castigo ligero permite que haya una recuperación característica dei castigo. completa e irreversible. Cuando se aplicó por primera vez el castigo en forma de un choque eléctrico breve después de cada respuesta. La figura 10. 1 9 6 0 b . había habido una recuperación casi completa.C ARAC TERÍSTICAS DEL PRO CESO DE C A ST IG O F IG U R A nido. una 10. 491 resp ue stas a c u m u la tiv o d uran te de la s un m om en to estuvo en acción pequenas lín e a s o b licu a s que c a d a a d m in istra c ió n dei reforzam iento. En todo com ida. El c a stig o se ad m in istro d u ra n te la sesión de castigo. (T om ad o de A zrin .) c a stig o re sp u e sta s hay un en d e sp u é s ligero e m itid a s p ro g r a m a el de de regisrto ca d a m a nted ura n te refor­ in d ica n resp ue sta Recuperación durante el castigo Así como se ha encontrado que el castigo intenso produce una supre­ sión característica. Sin embargo. Cada R ecup e ración c u rva sesión d ia r ia de u n a z a m ie n to IV 1 con co m p leta rep resenta el de Las la s registro hora. muestra la ejecución de un pichón que fue reforzado con administraciones de comida.

el choque con monos (Hake y Azrin. La figura 11 muestra también que el aumento compensatorio se presenta después de un castigo prolongado. tal vez la contingência de castigo no lleve a la recuperación de las respuestas. el choque a las patas con pichones (Azrin. incluso cuando la tasa de respuestas habida durante el castigo se ha recuperado a su nivel anterior al castigo. este aumento se producía incluso .492 CAP. y mucho menos a algún aumento compensatorio. Una de las maneras de interpretar este aumento de las respuestas pos­ terior al castigo (Estes. 9 C A ST IG O hubo una recuperación de las respuestas dentro de cada sesión mientras el castigo estaba todavia en acción. 19606). parece que el fenômeno de la recuperación depende no sólo de la intensidad dei estímulo puni­ tivo. como se notó anteriormente. 1944) pretendia que la tasa aumentada “compensaba” la dismlnución de las respuestas que había producido el castigo. Por tanto. esto se hizo evidente al usar el tiempofuera (Holz. Cuando la intensidad dei castigo fue muy grande (aproximadamente de 100 voltios). E. La figura 11 muestra que cuando dejó de administrarse el castigo. 1963) y el castigo condicionado con pichones (Hake y Azrin. Se ha observado la recuperación al usar la bofetada de una barra con ratas (Skinner. el grado de recuperación que hay durante el castigo está en función de la intensidad dei castigo. como lo muestra la figura 11. 1956). Azrin y Ulrich. el ruido con pichones (Holz y Azrin. cuando hay una supresión completa de las res­ puestas. no hubo ninguna recuperación. Recuperación después dei castigo EFECTO DE CONTRASTE DEL CASTIGO Otra característica general de la conducta que surge durante el pro­ ceso de castigo es un aumento de la conducta después de la terminación dei castigo. se encontro que solamente había un grado de recuperación parcial con las intensidades de castigo más elevadas. como la naturaleza dei estímulo punitivo. no en todos los estúdios ha habido este proceso de recuperación. 1962a). Sin embargo. Pero. 1963). De tal suerte. 1938). Esta tasa de respuestas extraordinariamente alta se mantuvo sólo temporalmente por supuesto. sino también de otras variables. Se ha encontrado que el aumento compensatorio se presentaba después de usar intensidades de choque hasta el punto de producir una supresión completa (Azrin. ya que las respuestas regresaron eventualmente a la línea-base no castigada común. Se ha encontrado que este proceso de recuperación caracteriza a muchas situaciones de castigo. Pero. 1965).n la misma serie de estúdios. las respuestas se emitieron a una tasa que excedió al nivel no cas­ tigado.

Siguiendo estos mismos lineamientos. 1944).C AR A C TERÍSTICA S DEL PRO CESO DE C A ST IG O F IG U R A 11. en vez de efecto compensatorio. 19606. La explicación de este efecto de contraste dei castigo no es totalmente clara. Hay otra explicación posible. parece que después de una frecuencia de reforzamiento pequena se presenta una tasa de res­ puestas elevada. puede ser más adecuado llamarlo efecto de contraste dei castigo. pueden incrementarse las respuestas pos­ teriores a la extinción. 1957) que si se introduce un periodo de extinción o de tiempofuera en medio de una sesión. verticales. Reynolds (1961) ha elaborado con algún detalle este . (T om ad o de El refo rzam ie nto A zrin . de c o m id a se o b te n ía to d o s los d ia s 1 9 6 0 a ). Dicho de otra manera. Efecto re fo rz a d a s con que tiene co m id a de un la a d ic ió n 493 y el retiro sujeto. Ya hemos visto que su existencia no puede explicarse apelando a un aumento compensatorio que compensa a las respuestas perdidas durante el castigo. Por tanto. Estes. se ha descubierto que el castigo severo o prolongado reduce la respuesta a tal grado que las respuestas extra emitidas en el fenômeno de contraste no igualan ni compensan la reducción de las respuestas habidas durante el periodo de castigo (Azrin. cuando la tasa de respuestas castigadas se recuperaba completamente y no había nada que “compensar”. Sabido es (Ferster y Skinner. El c a stig o fu e un dei c a stig o sob re la s ch oq u e eléctrico b reve resp ue sta s que se a p li- ca b a d e sp u é s de ca d a resp ue sta en los d ia s q u e se en cu en tran entre a q u e llo s rep resen ta d o s por en la s un lín e a s de p ro g ra m a rayas IV 1.

9 C A ST IG O principio general. y han encontrado que se trata de procesos diferentes. No obstante. El castigo intermitente lleva a una recuperación gradual de las respuestas después de que se ha termi­ . 19596). entonces. Este regreso inmediato de las respuestas ha sido obser­ vado sólo después dei castigo continuo. Como se menciono anteriormente. Holz. el aumento posterior al castigo puede explicarse en estos términos. en la transición de una frecuencia de castigo elevada a una frecuencia de castigo más baja (contraste de castigo). En este caso. Muy bien podría ser que el aumento dei nivel de las respuestas que se observa al retirar el castigo (aumento posterior al castigo) fuera realmente un producto dei cambio de la frecuencia de reforzamiento. más que dei cambio dei castigo. Recuperación graduai después dei castigo Con anterioridad se vio que cuando se suspende el procedimiento de castigo. Si se emplea un programa de reforzamiento de razón para mantener la conducta (Azrin. Sin embargo. Holz y Azrin (1962a) han comparado y estudiado experimentalmente los dos tipos de fenômenos de contraste. se está permitiendo que haya una mejor frecuencia de reforzamiento. se produce casi inmediatamente un nivel de respuestas inusitadamente alto. que hay dos tipos de fenômenos de contraste: uno que se presenta en la transición de una frecuencia de reforzamiento baja a una mayor (contraste de reforzamiento) y el segundo. los resultados mostraron que de todos modos se producía el aumento pos­ terior al castigo al suprimir el castigo de las respuestas drb.494 CAP. Azrin y Ulrich (1963) encontraron que el castigo aumento realmente la frecuen­ cia dei reforzamiento drb durante el periodo de castigo. Cuando se elimina la contingência de castigo. los resultados de experimentos que han utilizado un programa drb de reforzamiento con comida evidencian que la frecuencia de refor­ zamiento alterada no puede explicar el aumento de las respuestas poste­ riores al reforzamiento. Además. Pareceria. Se recordará que algunos procedimientos punitivos reducen simultáneamente la frecuencia dei castigo en algún grado. a menos que se supriman completamente las respuestas. pues cualquier disminución de la tasa de res­ puestas lleva necesariamente a una disminución correspondiente de la tasa de reforzamiento. Es improbable que esta dismi­ nución pueda explicar el aumento de las respuestas posteriores al castigo. en vez de después de una menor. simultáneamente. el grado de reducción dei reforzamiento es generalmente muy pequeno. el efecto de contraste dei castigo se presentaba después de una mayor frecuencia de reforzamiento. cuando se emplea un programa de reforzamiento de intervalo para mantener las respuestas.

C ARAC TERÍSTICAS DEL PRO CESO DE C A ST IG O

495

nado el castigo (Azrin, Holz y Hake, 1963; Estes, 1944). Vimos ante­
riormente que el castigo intermitente producía durante el periodo de
castigo menos supresión que el castigo continuo. Podemos resumir esta
comparación entre el castigo continuo y el intermitente de la manera
siguiente: el castigo continuo produce menos supresión que el intermi­
tente mientras se mantiene la contingência de castigo; sin embargo, des­
pués de que se ha suprimido la contingência de castigo, el castigo continuo
permite una recuperación más rápida de las respuestas, debido a que la
ausência dei castigo puede discriminarse más rápidamente.
Es probable que a intensidades de castigo muy altas, la relación sea
más complicada. Podría esperarse que el castigo continuo produjera una
supresión completa y que el castigo intermitente produjera solamente
una supresión parcial. Como la recuperación se demora o desaparece
después de una supresión completa, parece que a intensidades muy altas
el castigo continuo fuera más efectivo que el castigo intermitente, tanto
en términos de la permanencia como en el grado de supresión.
Discriminación y generalización a través dei castigo
D ISC RIM IN A CIÓ N DE LAS CONDICION ES DE CASTIGO

Un procedimiento especialmente informativo para estudiar el castigo
consiste en presentar dos estímulos alternadamente, castigar las respues­
tas emitidas ante un estímulo (de aviso) y dejar sin castigar las res­
puestas emitidas ante el otro estímulo (periodo seguro). Este procedi­
miento produce una reducción de las respuestas durante el estímulo de
aviso, pero poca o ninguna reducción durante el estímulo de seguridad
(Azrin, 1956; Brethower y Reynolds, 1962; Dinsmoor, 1952; Hunt y
Brady, 1955). Por tanto, puede usarse el castigo para producir una dis­
criminación entre dos situaciones estímulo. Cuando sólo se administra
intermitentemente el estímulo punitivo durante el estímulo de aviso, en­
contramos que el propio estímulo de aviso controla una tasa de respuestas
baja (Azrin, 1956; Hunt y Brady, 1955). En un estúdio, por ejemplo,
las respuestas fueron castigadas en un promedio de una cada dos minutos
durante el estímulo de aviso (Azrin, 1956). Después de un momento, la
tasa de la respuesta disminuyó a cero tan pronto como apareció el es­
tímulo punitivo, aunque todavia no se había administrado un estímulo
punitivo durante esa presentación particular dei estímulo de aviso.
GENERALIZACIÓN DEL CASTIGO

Cuando castigamos las respuestas en presencia de un estímulo y no
las castigamos en presencia de otro, la supresión se limita completamente

496

CAP. 9

C A ST IG O

al primero. Examinaremos ahora qué efecto produce el castigo en las
respuestas en presencia de otro estímulo. Los hallazgos afirman que alguna supresión de las respuestas se generaliza inicialmente en el periodo de
seguridad; pero después de una exposición prolongada, las respuestas
emitidas durante el periodo de seguridad se recuperan sustancialmente,
y generalmente llegan al nivel no castigado (Azrin, 1956; Dinsmoor,
1952; Honig y Slivka, 1964). En realidad, las respuestas emitidas durante
el periodo de seguridad llegan a alcanzar un nivel que sobrepasa al nivel
existente antes de aplicar el castigo ante el otro estímulo (Brethower y
Reynolds, 1962). Este aumento que se presenta ante el estímulo no cas­
tigado es el mismo efecto de contraste dei castigo que ha sido descrito
anteriormente.
La figura 12, que representa un trabajo no publicado que llevamos
a cabo en nuestro laboratorio, muestra los resultados típicos que se
obtienen cuando se administra un castigo a las respuestas ante un estímu­
lo, pero no ante otro. Aunque esta figura se presenta primordialmente
para representar el fenômeno de generalización de la supresión, los re­
sultados muestran también el fenômeno de la inmediatez dei efecto dei
castigo, el establecimiento de una discriminación basada en el castigo
y la recuperación común que se presenta durante el castigo, así como
también el efecto de contraste dei castigo. Dos estímulos se alternan cada
diez minutos; la línea de reajuste vertical de la pluma indica el momento
dei cambio. En el segmento superior no hay ningún castigo, y la tasa de
la respuesta es aproximadamente igual en ambos estímulos. Los reforzamientos de comida se han programado para las respuestas, pero no se
indican en el registro. En el segundo segmento, desde arriba se administra
un choque breve que tiene una intensidad de aproximadamente 60 vol­
tios después de cada respuesta omitida en presencia de un estímulo
(como lo indica el sombreado de la figura). Puede verse que las respues­
tas se suprimieron ante ambos estímulos. Esta generalización de la su­
presión dura diez dias. Las respuestas regresan hasta el onceavo dia
y, primordialmente, ante el estímulo seguro. Hacia el doceavo dia se
emiten muchas respuestas durante el estímulo ante el cual se castigan
las respuestas. Hacia el dia decimoquinto, las respuestas se emiten a una
tasa alta ante ambos estímulos, pero a un nivel ligeramente pequeno
durante el castigo.
Los efectos iniciales dei castigo, entonces, son reducir las respuestas
no solamente durante el estímulo ante el cual se castigan las respuestas,
sino también en presencia dei estímulo ante el cual no se castigan las
respuestas. Esta generalización de la supresión desaparece eventualmente
y las respuestas regresan a su nivel no castigado durante el estímulo
seguro. En realidad, la tasa de las respuestas emitidas durante el es-

C ARAC TERÍSTICAS DEL PRO CESO DE C A ST IG O

497

•|er dia

2 o dia
10° dia

11° dia

12° dia

15o dia

M IN U T O S
F IG U R A

12.

p re sen ta

el

que

R egistros
m om en to

ilu m in a n

p ro g r a m a

IV

cion es

de

de

parte

la

choques.

p or
de

d etrás

Las

ca m b io
a

la

refo rzam ie nto

com ida.

Las

su p e rio r
zonas

e ra c a s t ig a d a con
y Holz, d a to s n o

a c u m u la tiv o s
dei

dos

(sin

tecla
con

luces

castigo)

s o m b re a d a s

de

de

la s

re sp u e sta s

un

estím u lo

de

respuesta.

co m ida ;
e stím u lo

se

representa

d e s ig n a n

un ch oq u e b reve
p u b licad o s.)

(1 0 0

en

la

la

el

de

de

un

un

color

Las

a lte rn a b a n
co nd ición

co nd ición

a

no

lín e a
de

e ra n

se

vertical

diferente

re fo rz a d a s

in d ic a n

la s

cada

d ie z

m inu tos.

en

que

no

estím u lo
de

La

otro

re sp u e sta s

registro

m ilise g u n d o s)

pichón.

60

la

en

la

voltios.

que

se

re­

color,
en

un

a d m in istra El

registro

a d m in istra ro n

ca d a

(T o m a d o

resp ue sta
de

A z rin

tímulo seguro (dei dia doce al dia quince) es mayor que la tasa de
respuestas que se han obtenido antes de la aplicación dei castigo, lo
cual muestra un efecto de contraste. Estos resultados no solamente revelan
el fenômeno de recuperación que hay durante el castigo, sino también un
efecto de “asueto dei castigo”. La inserción dei periodo de seguridad

los efectos de un procedimiento de castigo han sido interpretados en términos de los efectos reductivos dei estímulo punitivo. el sujeto aprendió pronto que la administración dei estímulo punitivo significaba que la siguiente respuesta también seria castigada. Generalmente. luego que ha terminado el asueto. Tradicional­ mente. *9 498 C A ST IG O o “asueto” alternando con el castigo tiene como resultado un mayor grado de supresión de la respuestas.CAP. No se usó ningún estímulo externo para indicar el cam­ bio de un periodo al siguiente. los sujetos usaban la aplicación de un estímulo punitivo como sexual de la aplicación de un castigo subsiguiente. sino que pueden ser adquiridas por cual­ quier estímulo. es decir. una vez que se dejaban de castigar una o dos respuestas. En un experimento (Azrin. había una rápida recuperación de la tasa de la respuesta hasta alcanzar su nivel no castigado. Cuando se aplicó por primera vez el castigo RF. Las propiedades discriminativas o de senal que tiene el estímulo punitivo no son específicas de ese es­ tímulo como estímulo punitivo. se programo un castigo RF. las respuestas se suprimieron com­ . En el experimento de Dinsmoor. ocultar o incluso contrarrestar las propiedades supresivas comunes dei estímulo punitivo. Un estímulo punitivo puede convertirse en estímulo discriminativo de diferentes tipos de eventos. Además. También puede disponerse el castigo de tal manera que la adminis­ tración dei mismo sea un estímulo discriminativo de la ausência. las propiedades discriminativas pueden aumentar. el estímulo punitivo puede llegar a fun­ cionar como senal de algún otro evento. el único medio que tenía el sujeto para predecir si se iba a aplicar el castigo era si se había castigado o no la última respuesta. el estímulo punitivo puede adquirir propie­ dades discriminativas. Inversamente. EL CASTIGO C O M O ESTÍMULO DISCRIM INATIVO El principal efecto que tiene el castigo es disminuir la respuesta que se está castigando. No obstante. Esto podia saberse por el hecho de que poco después de que era castigada una res­ puesta. había una disminución inmediata de la probabilidad de las respuestas sucesivas. En tales circunstancias. Holz y Hake. como veremos posteriormente. más que de la presencia de estímulos punitivos adicionales. El castigo como estímulo discriminativo de otro estímulo puni­ tivo. En este procedimiento. y producen así lo que parece ser un efecto paradójico dei castigo. 1963). Dinsmoor (1952) altemó periodos fijos durante los cuales se programo un castigo con periodos fijos en los que no se programo ningún castigo. en los estúdios acerca dei castigo se han pasado por alto las propiedades discriminativas dei castigo. Consideremos primero la situación en la que un estímulo punitivo se convierte en estímulo discriminativo de otro estímulo punitivo.

Este procedimiento de castigo diferencial le proporciono al sujeto un estímulo discriminativo de la presencia o ausên­ cia de reforzamientos potenciales. No hubo ningún estímulo externo. desapareció gradualmente el periodo de supresión completa después dei castigo. se dispuso el procedimiento de tal manera que todas las respuestas eran casti­ gadas durante el periodo de extinción. se alternaron períodos de reforzamiento intermi­ tente con comida con períodos de extinción. En la mayoría de los estúdios en los que el estímulo punitivo pudo convertirse en estímulo discriminativo dei reforzamiento de comida. Pronto aprendió el sujeto que la respuesta nunca era castigada inmediatamente después de la administración de un estímulo punitivo. En la segunda parte dei experimento de Holz y Azrin (1961). produ­ cen una reducción sustancial de las respuestas si el castigo ligero se asocia diferencialmente con un periodo de no reforzamiento. Existen varios métodos para producir tales propiedades discriminativas dei estímulo pu­ nitivo. También este procedimiento permitió al sujeto . Estas reducciones no podían atribuirse al estímulo punitivo. También puede disponerse que el estímulo puni­ tivo se convierta en estímuio discriminativo de la ausência dei reforzamien­ to de comida que había estado manteniendo la respuesta. En este experimento. pues la intensidad de este estímulo producía ordinariamente poca o ninguna supresión.C ARAC TERÍSTICAS DEL PRO CESO DE C A ST IG O 499 pletamente después de cada administración dei estímulo punitivo. El castigo como estímulo discriminativo de la ausência de comida como reforzamiento. En estas circunstancias. vemos que intensidades de castigo muy bajas o inefectivas de otra manera. También puede disponerse el castigo de tal manera que su administración sea estímulo discriminativo de la presencia de comida como reforzamiento. pero ninguna era castigada durante el periodo de reforzamiento. el sujeto no tenía manera de discriminar las condiciones de reforzamiento de las de extinción. de tal manera que se pudieran estudiar directamente las propiedades discriminativas. 1961) que asoció explicitamente el estímulo punitivo con el reforzamiento. En el estado estable los sujetos reanudaron pronto la emisión de respuestas inmediatamente después de la administración de cada estímulo punitivo. Por tanto. los experimentadores no analizaron el problema desde el punto de vista que adoptamos aqui. En consecuencia. todas las respuestas fueron castigadas solamente durante el pe­ riodo de reforzamiento. El resultado de esta asociación selectiva dei castigo con la extinción fue que el estímulo punitivo produjo grandes reducciones de las respuestas. Entonces. analicemos estos otros estúdios después de examinar primero un experimento (Holz y Azrin. El castigo como estimulo discriminativo de la presencia de re­ forzamiento. De este modo.

Este empleo dei estímulo punitivo como estímulo discriminativo de la comida como reforzamiento. no era .500 CAP. En muchos casos. con la administración de comida. aparentemente paradójico. se vio que los efectos dei castigo podían ser modificados enormemente si se asociaba explicitamente el castigo con la presencia o ausência dei estímulo reforzante. La tasa de respuestas aumentó realmente en el periodo durante el cual se programo el castigo y disminuyó en el periodo en el que no había ningún castigo. en vez de ser continuo. el estímulo neutro aumenta la tasa de respuestas durante la extinción. No obstante. Se ha considerado que este aumento de la tasa de respuestas surge dei reforzamiento condicionado que proporciona el clic dei comedero (Skinner. El resultado de este procedimiento fue invertir completamente los efectos comunes dei castigo. Holz y Azrin (19626) analizaron ex­ perimentalmente las propiedades discriminativas dei castigo empleando un procedimiento de control en el que se administraba un estímulo neu­ tro a manera de choque eléctrico breve. Se encontro que el estímulo neutro producido por la respuesta podia adquirir propiedades discrimi­ nativas si ese estímulo se asociaba diferencialmente con la presencia o ausência de las administraciones de comida. en las circunstancias más comunes en las que el estímulo no tenía pro­ piedades discriminativas. El procedimiento empleado por Holz y Azrin (1961) sustituyó el estímulo neutro por un estímulo punitivo. Este mayor nivel de las respuestas durante el castigo se presentó a una intensidad de castigo que había producido la supresión de la respuesta. En los resultados antes citados. 1957). Se ha encontrado que cuando se asocia especificamente un estímulo neutro. en vez de la disminución usual. Los resultados se interpretaron en términos de las propiedades discriminativas dei es­ tímulo punitivo. Anteriormen­ te subrayamos que muchos procedimientos que se disenaron para estudiar los efectos dei castigo pueden haber permitido inadvertidamente que llegaran a ser dominantes las propiedades discriminativas dei estímulo pu­ nitivo. el control discriminativo se estudia comúnmente con la presen­ cia continua de un estímulo neutro (Ferster y Skinner. Se presentó el fenômeno. de que la iniciación dei castigo producía un aumento de las respuestas. porque necesariamente el estímulo es producido por la respuesta. podemos considerar que el estímulo puni­ tivo ha adquirido propiedades de reforzador condicionado. más que en términos de las propiedades aversivas. Por tanto. 1938). es comparable a la utilización de un estímulo neutro como estímulo discriminativo de la comida como reforzamiento. como el clic dei comedero. Consi­ derar a un estímulo punitivo como estímulo discriminativo es un poco extraordinario. Propiedades aversivas y discriminativas dei castigo. 9 C A ST IG O usar la aplicación dei estímulo punitivo como un medio para reconocer si el reforzamiento estaba disponible.

El resultado característico de este procedimiento es que el uso concurrente dei castigo y la extinción lleva a una reducción de las respuestas mayor de la que produce el uso de la extinción unicamente. Luego que el nivel de las respuestas reforzadas con comida se ha estabilizado. se ha encontrado que una vez que se elimina el castigo. a fin de establecer un nivel de res­ puestas sustancial. En la segunda parte dei procedimiento. incluso cuando todavia está en acción el periodo de extinción. La razón para hacer terminar el periodo de castigo es que se quiere ver si la reducción de las respuestas persiste durante el periodo de extinción. se administran choques eléctricos breves o bofetadas con la barra a cada una de las respuestas. Examinemos ahora los resultados de un procedimiento que se utilizo para estudiar el castigo (Estes. El estímulo punitivo pudo haberse convertido en senal de que no había comida disponible. Si este razonamiento es correcto la terminación dei periodo de castigo debe lie- . Se recordará que en la parte original dei procedimiento. La pregunta que se ha planeado al utilizar este procedimiento es si el uso concurrente dei castigo facilita la reducción de las respuestas que se presenta durante la extinción. sino que sólo las “suprimen”.C AR A C TERÍSTICA S DEL PRO CESO DE C A ST IG O 501 necesario apelar a las propiedades aversivas dei choque. ha sido propuesto como evidencia de que los estímulos punitivos no debilitan verdaderamente a las res­ puestas. se deja durar el castigo y la extinción hasta que el nivel de las respuestas es muy bajo. Este procedimiento produce ahora una asociación dife­ rencial entre el castigo y la extinción. primero se refuerza a una rata con pelotillas de comida en un pro­ grama de reforzamiento intermitente. En este procedimiento. las respuestas eran reforzadas y no se programaba ningún castigo. En este procedi­ miento. así como también una asociación diferencial dei no castigo con el reforzamiento. en base a nuestro análisis precedente podemos ver que el choque también puede haber ad­ quirido propiedades discriminativas. Simultáneamente.) Aunque los resultados anteriores se interpretaron originalmente en términos de las propiedades aversivas dei choque. pues podían obtenerse esencialmente los mismos resultados usando un estímulo neutro como un destello de luz. 1944. Entonces se elimina la contingência de castigo y se le permite al animal seguir respondiendo. se aplica la extinción. Este súbito aumento de las respuestas que se produce des­ pués de la terminación dei castigo. (Este punto de vista se examinará con detalle en una sección posterior. las respuestas muestran un súbito aumento de frecuencia. De tal suerte. incluso después de que el castigo ha dejado de estar ahí. la disponibilidad de los reforzamientos de comida pudo haberse asociado potencialmente con la ausência de cas­ tigo. en vez dei choque eléctrico. Skinner. Además. la extinción se aplicó junto con el castigo. pero todavia sin darle comida como reforzamiento. 1938).

de b ia n c o (T om ad o de a verd e A z rin y la ilu m in a ció n H olz. En vez de eso. cada respuesta producía en la tecla un cambio de iluminación de 400 miiisegundos.) var a un aumento de las respuestas. pues la terminación dei castigo re­ instala a los estímulos discriminativos de que el reforzamiento está disponible. refo rzam ie nto El 2 de T a sa de refo rzam ie nto no se re sp ue stas con co m ida. D urante el p e rio d o que se d e s ig n a com o “ R —> luz v e rd e ” . se reforzó a un pichón por responder en una tecla en un programa IV 2 de refor­ zamiento con comida. d a to s no de la tecla de respuesta. Luego se duplico con sus detalles esenciales el procedi­ miento seguido por Estes. más que en base a las propiedades aversivas. de la luz blanca usual a una luz verde. Primero. Se u d o co stigo . en de un siete “ s o la ­ resp ue sta d u ra n te 400 p u b licad o s. pero no se aplicó ningún castigo. Al mismo tiempo.50 2 CAP. 9 R EFO R Z A M IEN T O E X T IN C IÓ N C A ST IG O SO LAM ENTE HORAS F íG U R A 13. Este análisis teórico fue evaluado en nuestro laboratorio siguiendo el mismo procedimiento anteriormente descrito. la luz verde y el periodo de extinción) produjo una rápida disminución de las respuestas . a d m in istro de un d u ra n te d uran te el p ich ón una que se sió n p e rio d o que se en cuentra in in te rru m p id a se d e s ig n a con m ente ex tin ció n ” . Durante ese tiempo. Este programa estuvo en efecto durante un mes aproximadamente. ca d a h a c ía r a m b ia r m iiise g u n d o s. a un nivel teórico. Entonces. El efecto de este procedi­ miento puede verse en la figura 13 (datos no publicados) que muestra que el uso concurrente dei “seudocastigo” (es decir. pero sustituyendo el uso dei choque eléctrico por un destello de luz neutro. parece posible explicar los câmbios de la conducta en base a las propiedades discriminativas dei choque. se suspendían los reforzamientos con comida. se iluminaba por detrás la tecla con una luz blanca: no había ninguna otra luz durante las sesiones experimentales. p ro g r a m a IV horas.

el procedimiento presente produjo un aumento inme­ diato de las respuestas cuando se eliminó la luz verde. Se siguió entonces con el periodo de extinción. Por tanto. El resultado de este experimento hace evi­ dente que debe prestarse mucha atención a las propiedades discrimi­ nativas que puede haber adquirido gracias a la presentación de los choques. En el primer dia de extinción después de veinte reforzamientos con comida. Inversamente. Luego disminuyó gradualmente el nivel de las res­ puestas hasta alcanzar otra vez un nivel cercano a cero. por ejemplo. sin ningún aviso. Los resultados de un procedimiento de esta naturaleza. Este control discriminativo que ejercen los estímulos punitivos no debe considerarse característica única de esos estímulos. Este es el mismo resultado que se obtuvo en los experimentos que emplearon un choque eléctrico. durante el reforzamiento. En realidad. el nivel de las respuestas sobrepasó ligeramente al nivel que se había observado anteriormente. En la segunda parte dei procedimiento se eliminó el seudocastigo: la luz verde breve dejó de presentarse después de cada respuesta. El control dis­ criminativo también se da comúnmente con los estímulos reforzantes positivos.C AR A C TERÍSTICA S DEL PRO CESO DE C A ST IG O 503 hasta un nivel cercano a cero. Puede verse que la eliminación de la luz verde produjo un aumento de las res­ puestas rápido e inmediato. veinte respuestas. llevado a cabo en nuestro laboratorio. se pueden ver en la figura 14 (datos inéditos). no es necesario atribuir estos câmbios de conducta a las propie­ dades punitivas dei choque. la administración de la comida se convierte en estímulo discriminativo de la posibilidad de otras administraciones de comida. diez minutos. lo cual produce un nivel menor de respuesas después de cada administración de comida (Skinner. la adición de un choque eléctrico después de una respuesta acelero considerablemente el proceso de ex­ tinción. el mismo modo que el procedimiento que emplea un choque produjo un aumento inme­ diato de las respuestas cuando se suspendió el choque. De acuerdo con nuestro análisis teórico. en este procedimiento se obtuvieron los mismos resultados usando un estímulo neutro en vez de un estímulo aversivo. 1938). se refuerza cada respuesta de. es decir. en el que la administráción de comida se convierte en estímulo discriminativo de la ausência de comida. En un programa tal. cuando se emplea un programa mixto rfc de extinción de reforzamiento con comida. por ejemplo. El gran número de respuestas de extinción que se emitió cuando las respuestas dejaron de producir la luz verde. Asimismo. se deja de reforzar las respuestas durante. se emitieron múltiples respuestas de extinción. puede verse . Luego. muestra que el hacer que la luz verde se presentara después de las respuestas acelero considerablemente la extinción. Sin embargo. Un ejemplo conocido es el programa de intervalo fijo con co­ mida como reforzamiento.

Los efectos de una consecuencia conductual deben analizarse en términos de sus propiedaes discriminativas y de sus propiedades reforzantes o punitivas. Muenzinger. en los que se obtuvieron resultados aparentemente paradójicos. el sujeto n o tiene n in g ú n e stím u lo d isc rim in a tiv o p a r a d isc rim in a r entre el p e rio d o de extinción y el de reforzam iento. pequena la deflección a p a rie n c ia (T o m a d o de de A z rin una y h a cia b a rra a b a jo de só lid a H olz. El hecho de tener en cuenta las posibles propiedades discriminativas dei estímulo punitivo ayuda a esclarecer otros tipos de procedimientos de castigo. 9 F IG U R A 14. el llamarlas “correcta” o “incorrecta” sólo significa que la respuesta correcta es la que va seguida por un reforzamiento .) que en el cuarto dia sólo se emitieron dos o tres respuestas durante la extinción. lo al cual a d m in ist ra b a daba en sucesión una registro rá p id a .504 CAP. de a h í en a d elante. Hall y Bretnall (1932). Este tipo de procedimiento fue utilizado por Thorndike (1932). Respuestas correctas y respuestas incorrectas. Los periodos repetidos de reforzamiento y de extinción establecieron un con­ trol discriminativo que hizo disminuir el número de respuestas de ex­ tinción. una de las cuales se llamaba correcta y la otra incorrecta. invirtiendo así la relación común en la que el número de res­ puestas emitidas en la extinción aumenta en función dei número de reforzamientos (Perin. Cada refo rzam ie nto p ro d u c ía d o ra . a lte rn a d o s R egistro de a c u m u la tiv o refo rzam ie nto de co ntin uo la s y de re sp u e stas e m itid a s extinción. d a to s n o la cuando p lu m a la re g istra ­ co m id a se p ub lica d o s. La presencia o ausência de la comida había adquirido un control discriminativo. El sujeto había aprendido que si una sola respuesta no era seguida por la administración de comida. un pro­ cedimiento empleado con frecuencia para estudiar el castigo era la situa­ ción de elección con dos respuestas. entonces las otras respuestas tampoco serían seguidas por la administración de comida. 1942). Un p or un p ich ó n z u m b id o de resp ue sta C A ST IG O en p erio do s s e n a la la d is p o n ib ilid a d dei p rim er reforzam ie nto. Operacionalmente. En el pasado. (1934) y Tolman.

estos resultados se desprenden razonablemente de las propiedades discriminativas que se adquirieron indudablemente por medio dei choque. en realidad estamos diciendo que una respuesta es castigada y reforzada. estos mismos resultados se han obtenido en los experimentos anteriormente mencionados. En el procedimiento de evitación de Sidman (1953). pues la administración dei choque se convierte en la ocasión para emitir una respuesta con el fin de posponer otras aplicaciones dei choque. Las propiedades discriminativas de un estímulo punitivo parecen ser efectivas en la situa­ ción en la que una respuesta es castigada por medio dei mismo estímulo que se había empleado anteriormente para mantener una conducta de evitación. Podría esperarse que el castigo de la respuesta correcta o de la incorrecta tuviera como resultado un aprendizaje más rápido que el que se produce cuando no hay castigo. entonces. la presencia dei castigo puede convertirse en estímulo discriminativo de la presen­ cia dei reforzamiento. 1957). En estas circunstancias. De acuerdo con nuestro análisis teórico. en tanto que el procedimiento fuera consistente. mientras que la otra no es castigada ni reforzada. en contraste con la situa­ ción en la que no se programo ningún castigo. los choques se producen uno tras otro a una frecuencia predeterminada. en vista de las supuestas propiedades aversiva dei cho­ que eléctrico. pues cualquiera de los procedimientos punitivos proporciona estímulos discriminativos. Esencialmente. se encontro que la adición dei castigo a la res­ puesta correcta no producía el gran resultado de reducir la respuesta en cuestión. el castigo y los reforzamientos se asocian entre si.C AR A C TERÍSTICA S DEL PRO CESO DE C A ST IG O 50 5 positivo. Herrnstein y Conrad. Los resultados de este procedimiento han indi­ cado. es decir. que el choque eléctrico adquiere propiedades dis­ criminativas. Sin embargo. Esta propiedad discriminativa que tiene el choque durante el condicionamiento de evitación de choques. . Asimismo. Si no hay respuestas. Estos resultados parecen paradójicos y como tales se han presentado. podríamos esperar que el castigo de una respuesta “correcta” pudiera producir un aumento de la probabilidad de esa respuesta. De acuerdo con nuestro análisis teórico. El castigo durante el condicionamiento de evitación. una respuesta pospone la administración dei choque durante un tiempo fijo. no im­ portaria si el castigo se administrara a la respuesta correcta o la inco­ rrecta. puede verse también en los estúdios en los cuales se mantuvo una alta tasa de respuestas programando choques inevitables (Sidman. Cuando el procedimiento se dispone de tal manera que la respuesta correcta es castigada. y la incorrecta es la que no va seguida por el mismo. la ausência dei castigo puede convertirse fácilmente en senal o estímulo discriminativo de la ausência de reforzamiento. por lo general. pues es de suponerse que el choque constituyó la ocasión para emitir las respuestas.

que hay entre los procedimientos de castigo y de refor­ zamiento. Appel (1960) encontro este mismo aumento de las respuestas cuando el castigo de éstas se alternaba con la evitación dei choque en un programa mixto. Después de proporcionarle al sujeto una historia de condicionamiento de evitación de choques. hemos visto que el castigo es un proceso complejo porque su efectividad depende no sólo de la administración dei estímulo puni­ tivo. Migler (1963) obtuvo un aumento semejante de las respuestas cuando los choques se administraron como estímulos punitivos de res­ puestas que se estaban reforzando concurrentemente con el escape dei choque. de tal manera que el efecto primordial de este último es consecuencia de las propiedades discriminativas dei estímulo punitivo y no necesariamente dei castigo por si mismo. Además. El resultado fue un aumento temporal de las respuestas castigadas. En vista dei número de interacciones. Hemos visto varios câmbios característicos que se producen en la conducta como consecuencia dei castigo. como la inmediatez dei efecto. como seria de esperar dadas las propiedades discriminativas adquiridas por el choque. Otros efectos dei castigo están en función de las propiedades discriminativas que este adquiere. es decir. En sus procedimientos. Black y Morse administraron el choque como es­ tímulo punitivo de la respuesta de saltar. la reducción potencialmente completa de la respuesta. la generalización de la supresión y la recu­ peración que hay durante el castigo. el efec­ to de contraste dei castigo. que la administración dei choque fuera la ocasión ante la cual la respuesta de saltar haría terminar el choque o lo evitaria. se considera que . por otro lado. como el aumento de la supresión o la facilitación paradójica. las administraciones adicionales dei estímulo punitivo suprimieron las res­ puestas. Vemos de nuevo que el efecto reductivo dei castigo puede ser invertido por una historia previa o por un procedimiento con­ currente que permite al choque adquirir propiedades discriminativas. el procedimiento de reforzamiento puede interactuar con el procedimiento de castigo.506 CAP. grande y generalmente insospechado. tal vez urja abandonar el uso dei castigo debido a su inefectividad. no es sorprendente que se haya llegado a conclusiones contradictorias acerca dei castigo. Por un lado. se entrenó a unos perros a evitar un choque eléctrico emitiendo una respuesta de saltar. podríamos esperar que el choque adquiriera propiedades discrimi­ nativas. De acuerdo con nuestro análisis teó­ rico. Eventualmente. sino de las características dei procedimiento de reforzamiento que mantiene a la respuesta castigada. 9 C A STIG O Este análisis un poco especulativo de la situación dei condicionamiento de evitación nos hace comprender algunos resultados obtenidos por Black y Morse en su estúdio de la evitación de choques en perros (1961). Así. Algunos de los câmbios están en función de la aversividad dei estímulo punitivo.

de tal manera que hubiera una línea-base conductual estable sobre la cual se pudieran evaluar los efectos reductivos dei castigo. muchas veces la supresión de las respuestas ha persistido durante largo tiempo. ciertamente. No obstante. pues se sabe que la efectividad depende de todos los factores hasta ahora estudiados. hay pocas evidencias que sostienen esta afirmación. La pregunta de si el castigo es efectivo o no puede contestarse de una manera simple. Debe recordarse que en la mayoría de las investigaciones se fortaleció delibera­ damente una respuesta con reforzamiento positivo. Aunque. podemos decir que el castigo puede ser muy efectivo. Una de las razones para hacer esta afirmación es que se supone que el cas­ tigo no es muy efectivo para eliminar la conducta. PROBLEMAS GENERALES: EFECTIVIDAD DEL CASTIGO c.EFECTIVID AD DEL C A STIG O 507 el castigo es factor fundamental. pues la existencia de una supresión completa hace imposible la evaluación cuantitativa dei grado de reducción alcanzado.puede el castigo reducir la conducta?” En realidad. Ahora que hemos revisado algunos de los hallazgos experimentales básicos. el grado en que elimina la conducta puede constituir un problema. Imaginemos que se nos asigna la tarea de eliminar la conducta por medio de castigo. según se ha encontrado. Podría darse una contestación definitivamente afirma­ tiva si la pregunta se volviera a formular de la manera siguiente: “. en múltiples estúdios se ha producido sólo una supresión parcial. en gran parte. examinemos detenidamente algunos de estos pro­ blemas generales. A manera de una generaliza­ ción descriptiva.. Resumamos brevemente algunas de las circunstancias que. de los desordenes mentales crônicos. seria errôneo llegar a la conclusión de que no era posible producir una supresión mayor. incluso después de que se ha eliminado la contingência de castigo. elevan al máximo su efec- .Es el castigo efectivo para eliminar la conducta? Muchas veces se ha sugerido que no debería usarse el castigo. Verdaderamente. en muchos estúdios se ha producido una supresión completa de las res­ puestas. iCómo debe disponerse el castigo para que tenga un máximo de efectividad? Vimos anteriormente que el castigo puede ser muy efectivo para eli­ minar la conducta. no es aventurado afirmar que los investigadores deliberadamente han dejado de utilizar intensidades de castigo lo bastante severas para producir una supresión completa. De tal suerte.

e) no debe aumentarse gradualmente la intensidad dei estímulo punitivo. puede esperarse que el castigo de la conducta criminal sea más efectivo si existe una conducta no criminal que produzca las mismas ventajas que la conducta criminal. puede asociarse un estímulo condicionado con el estímulo aversivo. parece deseable proporcionarle al sujeto una historia sustancial de reforzamiento. h ) la administración dei estímulo punitivo debe constituir una senal o estímulo discriminativo de que un periodo de extinción está en marcha. con el fin de tener la oportunidad de retirarle el reforzamiento como medio de castigo de las respuestas indeseables. . 9 C A ST IG O tividad: a) el estímulo punitivo debe disponerse de tal manera que no haya ningún escape no autorizado posible. /) deben evitarse los periodos prolongados de castigo. i) debe reducirse el grado de motivación para emitir la respuesta castigada. el castigo mediante el re­ forzamiento positivo puede llevarse a cabo disponiendo la ocurrencia de un periodo que tenga una frecuencia de reforzamiento reducida (tiempofuera) o disponiendo una disminución dei reforzamiento condicionado (costo de respuesta). por razones prácticas. por ejemplo.50 8 CAP. especialmente en lo que se refiere a las intensidades bajas dei castigo. Ambos métodos exigen que el sujeto tenga un nivel elevado de reforzamiento al empezar. pues de esta manera puede haber un efecto de recuperación. c) la frecuencia dei castigo debe ser tan intensa como sea posible —lo ideal es aplicar estímulo punitivo a cada respuesta. m) si no es posible adminis­ trar el propio estímulo punitivo después de una respuesta. lo mejor es aplicarlas solamente durante un corto tiempo. b) el estímulo punitivo debe ser tan intenso como sea posible. y n ) puede usarse como castigo una reducción dei reforzamiento positivo cuando no es posible aplicar el castigo físico. no es posible retirar el reforzamiento. g) debe tenerse gran cuidado en que la administración dei estímulo punitivo no se asocie diferencialmente con la administra­ ción de reforzamiento — de otro modo. sino que éste debe aplicarse a una intensidad máxi­ ma. cuando se usan inten­ sidades bajas de castigo. k) debe haber una respuesta alternativa que no sea castigada. Si va a emplearse un castigo no físico. de otro modo. y este estímulo condicionado puede administrarse después de una respuesta para lograr el castigo condicio­ nado. j) debe reducirse igualmente la frecuencia de reforzamiento positivo de la respuesta castigada. el estímulo punitivo puede adquirir propiedades reforzantes condicionadas. pero que produzca el mismo o mayor reforzamiento que la respuesta castigada. e) si no hay ninguna respuesta alternativa. d) el estímulo punitivo debe administrarse inmediatamente des­ pués de la respuesta. En tales situaciones. el sujeto debe tener acceso a una situación diferente en la que obtenga el mismo reforzamiento sin ser castigado. legales o morales. entonces sigue habiendo un método de castigo efectivo.

Si no se puede obtener una reducción de las respuestas usando un evento que se conoce como punitivo. en los cuales se vio que el castigo aumenta la frecuencia de una respuesta si se ha asociado un reforzamiento positivo con el estímulo punitivo. Este tipo de fenômeno se ha observado a menudo en el campo de la psico­ logia clínica. estos resultados sólo sirven para indicar que las variables que mantienen a la respuesta casti­ gada están contrarrestando el efecto reductivo dei castigo. Por tanto. hasta que la madre suspende lo que está haciendo y lo regana o le da una tunda. parece que el sujeto pudiera gozar con el castigo.Cómo puede un estímulo ser inefectivo y seguir siendo llamado estímulo punitivo? Examinemos de nuevo nuestra definición anterior dei estímulo puni­ tivo como la consecuencia de una respuesta que reduce la probabilidad futura de esa respuesta.Cómo puede ser que un sujeto parezca gozar con el castigo? En algunos casos.EFECTIVIDAD DEL C A ST IG O 509 c. cuando no puede notarse ninguna disminución de la probabilidad de la respuesta castigada. Este tipo de observación ha estado relacionado con el problema general de si el castigo es efectivo y de si debe aplicarse éste. donde se le denomina medio de llamar la atención. Constituye un ejemplo de este fenômeno el nino que parece portarse mal deliberadamente. y en psicologia infantil. por encima de la frecuencia que existia antes de aplicar el castigo. si la respuesta castigada es mantenida por un programa de reforzamiento frecuente y existe un fuerte estado de privación. Las variables de reforzamiento pueden eliminar fácilmente los efectos reductivos. Lo que estamos analizando ahora es el fenômeno en el cual el uso dei pro­ cedimiento punitivo ha aumentado realmente la frecuencia de la respues­ ta. Ya hemos visto cómo una respuesta puede seguir emitiéndose sin que se reduzca su fre­ cuencia. por ejemplo. Surge el problema de cómo designar a un es­ tímulo que reduce a una respuesta en un momento. existe un dilema para definir como estímulo punitivo a un estímulo de una intensidad dada. en criminología. Puede encontrarse una explicación de este efecto dei castigo en los hallazgos referentes a las propiedades discriminativas dei castigo. . donde se le da el nombre de masoquismo. pero no reduce a otra en otro momento. donde se le llama autopunición. c. El punto crítico es que la efectividad dei castigo depende. a pesar dei uso de un procedimiento de castigo. de las variables de reforzamiento que están manteniendo la respuesta. entonces el castigo puede ser inefectivo aunque se aplique a intensidades altas. en gran medida.

Se usa la designación R-CH para denominar el tiempo transcurrido entre la respuesta y el estímulo aversivo. En el para­ digma del castigo. En el caso dei maso­ quismo.510 CAP. Sidman ha aportado un medio simple y útil para representar los programas de evita­ ción (1953). El mismo razonamiento se aplica a la eliminación de la conducta criminal en adul­ tos y a la eliminación de conductas indeseables en los ninos. sino más bien como una confirmación de la efectividad dei refor­ zamiento condicionado. mientras que la ausência dei dolor se asocia con la ausência de reforzamiento. COMPARACIÓN DEL CASTIGO CON OTROS PROCEDIMIENTOS Comparación del castigo con otros métodos de estimulación aversiva Hasta ahora. es posible comparar al castigo con otros tipos de programas de control aversivo tanto en términos del procedi­ miento usado. estos reforzadores están siendo asociados selectivamente con un estímulo aversivo que es la lesión. como en términos de los resultados obtenidos. El resultado final puede ser que el indivíduo parezca estar “buscando” el castigo. en consecuencia. Se deduce entonces que la conducta masoquista puede eliminarse de dos maneras: a) retirando cualquier exceso de atención o de simpatia cuando se sufre la lesión. Suponiendo que la asistencia y la simpatia sean reforzadores positivos. Es común que se preste asistencia médica y se sienta simpatia por una persona que ha sufrido alguna lesión. pues la presencia dei dolor se asocia selectivamente con el refor­ zamiento. El padre que sólo presta atención al nino cuando se porta mal (y. entonces se ha llenado el paradigma básico para establecer las propiedades discriminativas dei castigo. La designación CH-CH se usa para designar el tiempo transcurrido entre el estímulo aversivo y la ausência de una respuesta. y b) dándole simpatia y aten­ ción al indivíduo por conductas que no sean la de lesionarse. 9 C A STIG O Considérese el ejemplo dei masoquismo patológico. Si no se tienen simpatia y asistencia cuando 110 hay lesión. la respuesta produce inmediatamente el estímulo aver- . Este fenômeno no debe interpretarse como una contradicción en cuanto a la efectividad dei castigo. sin embargo. El castigo puede describirse de modo semejante en términos de intervalos R-CH y CH-CH. hemos considerado al castigo como un proceso comple­ tamente aislado. es castigado) ha transformado inadvertidamente el estímulo punitivo en un estímulo reforzante condicionado. la respuesta de maltratarse a uno mismo produce tanto el re­ forzamiento (la simpatia) como el estímulo aversivo (la lesión).

Al igual que el procedimiento de castigo. podemos darle un valor de infinito al intervalo CH-CH. Por otro lado. el estímulo aversivo no tiene ninguna relación fija con las respuestas. En el castigo. podemos decir que en el castigo el intervalo R-CH es igual a cero. el condicionamiento de evitación o de escape tiene un intervalo R-CH mayor de cero y un intervalo CH-CH menor que infinito. Vemos que al analizar los efectos de la estimulación aversiva en la conducta. podríamos preguntarnos cuál de los dos procedimientos es más efectivo para eliminar las respuestas que se están emitiendo. Esta diferencia esencial de procedimiento entre la supresión condi­ cionada y los otros tres procedimientos se manifiesta en los resultados obtenidos. También puede hacerse una comparación entre el procedimiento de castigo y el procedimiento de supresión condicionada creado por Estes y Skinner (1941). En un estúdio en el que se compararon experimentalmente los dos procedimientos. Aún no se ha podido determinar por qué el procedimiento de supresión condicionada debe llevar a una reducción y no a un aumento de las respuestas que se emiten. El castigo se diferencia dei condicionamiento de es­ cape y dei de evitación en términos de si la respuesta tiene como resultado un aumento o una disminución de la estimulación aversiva. el escape y la evi­ tación en que se deja sin especificar la relación existente entre el estímulo aversivo y una respuesta específica. el de su­ presión condicionada sirve para reducir las respuestas. lo que se especifica es la relación existente entre el estímulo aversivo y algún estímulo neu­ tro. por tanto. En vez de eso. En la supresión condicionada. en el castigo el intervalo CH-CH es infini­ tamente grande. el escape y el condicionamiento de evitación. se encontro que el castigo producía una supresión de las respuestas mucho mayor que la que producía . pues no se administra ningún estímulo aversivo a menos que se emita una respuesta. pues el estímulo aversivo no tiene ninguna relación fija con' estas respuestas. tanto el procedimiento de supresión condi­ cionada como el de castigo reducen las respuestas. De este modo. El procedimiento de supresión condicionada se diferencia dei castigo. se refiere a la relación existente entre la res­ puesta y la dirección dei cambio de la estimulación aversiva que actúa sobre el sujeto.EL C A ST IG O Y O TRO S PR O C ED IM IE N T O S 511 sivo. sino más bien con un estímulo que anteriormente era neutro. Mientras el castigo puede describirse como un procedimiento en el que el intervalo R-CH es igual a cero y el inter­ valo CH-CH es infinitamente largo. Puesto que. Esta dife­ rencia básica entre el castigo por un lado y el condicionamiento de escape y de evitación por el otro. la dirección dei cambio de las respuestas puede determinarse analizando la dirección dei cambio de la estimulación aversiva que se produce como resultado de la emisión de las respuestas. es necesario especificar la relación temporal que existe entre la estimulación aversiva y la conducta que se emite.

9 C A ST IG O el procedimiento de supresión condicionada (Azrin.512 CAP. sin ningún reforzamiento evidente de esa respuesta. necesariamente. Como hemos visto en los estúdios en que se utilizo una respuesta alternativa no castigada. La gran su­ presión de las respuestas que produce el castigo indica que la relación existente entre la respuesta y el estímulo aversivo sigue siendo un factor fundamental. Si las respuestas no producen ningún cambio en el estímulo aversivo. había un aumento si las respuestas no castigadas eran además reforzadas. Esta pre­ gunta carece de significado si acatamos la definición técnica de castigo. Los efectos que tienen los estímulos aversivos se desprenden de un modo completamente directo de la relación existente entre las respuestas y los estímulos aversivos. entonces hay poco o . cuando el sujeto es obligado a elegir entre dos respuestas en cada ensayo. De este modo. no se sabe que la eliminación de una respuesta mediante el castigo tenga como re­ sultado un aumento de las respuestas no castigadas. Sin embargo. Se . 1956). En esta situación de elección. Si las respuestas eliminan el estímulo aver­ sivo. Sólo vemos un aumento de la respuesta no castigada. a menos que estas respuestas estén al mismo tiempo bajo el control de algún procedimiento de reforzamiento. un decremento de la proporción de la respuesta castigada tiene como resul­ tado. también en este procedimiento se ha encontrado que una especificación de la relación existente entre la respuesta y el choque aumenta el grado de supresión obtenido. mientras que el reforzamiento es un método para producir o mantener la conducta. se presenta una tasa de respuestas menor. Por tanto.nin­ gún cambio en las respuestas. Una aparente excepción de la regia general es el procedimiento de supresión condicionada. un aumento de la proporción de la respuesta no castigada. El castigo es un método para eliminar la conducta.Qué produce un aprendizaje más rápido: la recompensa o el castigo? A menudo se ha planteado la pregunta de si el castigo es más o menos efectivo que la recompensa para ensenar una nueva conducta. se produce un aumento de la tasa. Esta es la situación de elección en la que el sujeto es obligado a elegir una de entre varias alternativas en cada ensayo. c. Un tipo especial de situación experimental ha causado la falsa impresión de que el castigo aumenta o ensena nuevas conductas. pues el castigo es un método para eliminar la conducta. sin embargo. es inadecuado considerar al castigo como un método para ensenar nue­ vas conductas. se pueden malinterpretar los resultados pretendiendo que significan que el castigo de una respuesta lleva generalmente a un aumento de otras respuestas. Si las respuestas producen el estímulo aversivo.

es posible que comparemos estos dos procedimientos en los valores paramétricos en los que cada procedimiento se acerca al máximo de efectividad. 1963). de saciedad y de castigo llevaron a diferentes distribuciones de TERs (tiempo entre respuestas) cuando se igualaron las tasas totales de respuesta. especialmente de la intermitencia dei programa de reforzamiento que se usó antes de la extinción (Skinner. la velocidad con que la extin­ ción elimina las respuestas depende en gran medida de varios factores. la extinción. En un experimento (Holz y Azrin. Asimismo. el castigo y la recompensa son procesos antagônicos. por ejemplo. se hizo una comparación entre el cambio de estímulo. Las distribuciones que hubo durante la saciedad y la extinción fueron más planas que las distri­ buciones que se obtuvieron durante el castigo” (pág. Aun cuando resulta arriesgado comparar procedimientos generales entre si. Como se vio anteriormente. No obstante. la supresión con­ dicionada es otro método. Holz y Aznn hallaron que: “los procedimientos de extinción.EL C A ST IG O Y O TRO S PR O C ED IM IE N T O S 513 puede reformular la pregunta en términos de la efectividad relativa dei escape o de la evitación comparada con el reforzamiento. . Al analizar la distribución de los tiempos entre respuestas. De esta ma­ nera. Una de las diferencias que se encontraron entre los efectos de estos procedimientos fue el patrón de respuestas. la saciedad y el castigo en términos de la efectividad de estos cuatro procedimientos. Sin embargo. pues el escape. Comparación dei castigo con otros métodos para eliminar la conducta El castigo es un método para eliminar la conducta. la evitación y el reforzamiento son métodos para ensenar nuevas conductas. la extinción es un procedimiento general para eliminar respuestas. Es posible com­ parar el grado de reducción de las respuestas que hay durante la extinción después de un reforzamiento continuo. 403). 1938). creemos que de todos modos es posible comparar los procedimientos cuando se eligen parâmetros que han resultado ser efectivos al máximo en cada procedimiento. a fin de reducir respuestas que se habían mantenido de acuerdo con un programa drb de reforzamiento con comida. la comparación de ambos métodos reveló que el castigo era más efectivo que la supre­ sión condicionada en términos de la reducción de las respuestas. es posible que comparemos el castigo con algunos de los otros métodos que se usan comúnmente para eliminar la conducta. con el grado de reducción ob­ servado en los estúdios sobre el castigo cuando se han usado parâmetros dei procedimiento de castigo que son efectivos al máximo. La extinción parece ser efectiva al máximo después de un reforzamiento continuo.

el alcance. la duración. Parece que el castigo puede ser por lo menos tan efectivo como la extinción. 9 15. R ep resen tación e sq u e m á tic a del cu rso tem po ral de la reducción de C A ST IG O la s res­ p u e sta s q u e p ro d ucen la extinción.) Los tres diferentes procedimientos. la duración y la irreversibilidad de la reduc­ ción de las respuestas. difirieron también en términos del efecto reductivo total. Las conclusiones totales se resumen en la tabla 1. También se incluye un quinto procedimiento: la sujeción física. (T om a d o de A z rin y H olz.514 F IG U R A CAP. la saciedad. así como el efecto del cambio de estímulos. b) reduce las respuestas tanto tiempo como el procedimiento está en efecto. Debe recordarse que la anterior comparación entre . la sa c ie d a d y el castigo. la medida y el grado de irreversibilidad de la reducción de las respuestas. que describe cada uno de los cinco procedimientos reductivos en términos de la inmediatez. Los critérios empleados consistieron en establecer si un procedimiento: a) re­ duce la tasa de respuestas inmediatamente después de aplicar ese proce­ dimiento. el cambio de estímulo y la eliminación física en tér­ minos del grado. y d) mantiene la reducción de las respuestas después de suspender el procedimiento. Fueron analizados de acuerdo al grado en que se eliminaron las respuestas. la extinción y el cambio de estímulo. d a to s n o p u b licad o s. la saciedad. La figura 15 representa esquemáticamente los câmbios de la respuesta que se observan comúnmente durante y después del uso del castigo. el ca m b io d e estím u lo . c) reduce a cero la tasa de respuestas mientras el proce­ dimiento está en efecto.

EL C A ST IG O Y O TROS PR O C ED IM IE N T O S 515 los procedimientos se basa en un conjunto de parâmetros.Es general el efecto dei castigo. pues rara vez se emitiria la respuesta. Uno de los puntos que se afirman comúnmente es que . Si nunca se reforzó una respuesta. el castigo ligero. TABLA C o m p a r a c i ó n d e v a r i o s L A T A S A 1 p r o c e d i m i e n t o s D E q u e r e d u c e n R E S P U E S T A S Procedim iento Efecto inmediato Efecto duradero Supresión total Efecto irreversible Cambio de estímulos Extinción Saciedad Sujeción física Castigo sí no sí sí sí no sí sí sí sí no no no sí sí no no no no sí F u e n t e : Holz y Azrin (19636). mientras que el dei reforzamiento es específico? Nuestro análisis anterior se refirió a una comparación entre el cas­ tigo y otros métodos para reducir la conducta. El mundo físico proporciona a menudo contingências de reforzamiento que no pueden eliminarse fácilmente. esta ausência total dei reforzamiento es imposible. la extin­ ción después de un reforzamiento intermitente. como la saciedad parcial. como el castigo. el correr y el apresurarse serán reforzados inevitablemente. También se ha comparado el castigo con el reforzamiento positivo. en los cuales cada procedimiento se acerca a su máximo de efectividad. Podría insistirse en que la extinción puede hacerse más efectiva que el castigo instituyendo una extinción completa. entonces dificilmente seria posible aplicar el castigo. más pronto llegamos a donde vamos. c. Sin embargo. que es un metodo para aumen­ tar la conducta. ya sea que el movimiento consista en caminar o en conducir un automóvil. Por tanto. etc. entonces puede alterarse fácilmente el orden de superioridad de estos métodos.. Solamente se podría extinguir el correr y el apresurarse mediante el procedimiento imposible de eliminar todos los eventos reforzantes que se producen como resul­ tado dei movimiento en el espacio. para una clase de conducta grande. Debe emplearse algún otro método reductor. Mientras más rápido nos movemos en el es­ pado. Si se eligen otros parâmetros menos efectivos.

había una perturbación general de la conducta durante el estímulo ante el cual no se habían castigado las respuestas. Sidman (1958) descubrió que. bajo el reforzamiento positivo. pues las coincidências ocasionales entre el choque y la respuesta pueden explicar la reducción. Después de que se administran varios reforzamientos. se producía una reducción temporal de las respuestas. Al condi­ cionar pichones a picotear una tecla para obtener comida como re­ forzamiento.316 CAP. Ya hemos visto que cuando se aplicaba por primera vez el castigo. Notamos anteriormente (Azrin. 1956) que cuando los choques no se administraban inmediatamente. 1938). se observa generalmente que el aumento de la actividad da lugar a un aumento selectivo de la frecuencia de presión de la palanca (Skinner. Como las respuestas eran reforzadas y se emitían a una tasa moderada. Skinner (1948) notó que había un aumento de la actividad general cuando el reforzamiento de comida se administraba al azar (con- . cuando una respuesta era reforzada o extinguida en una situación de respuesta múltiple. si el estímulo punitivo se administra inmediatamente después de esa respuesta. Por tanto. la reducción de las respuestas que produce un choque mediato no puede interpretarse en el sentido de que el castigo tiene un efecto general. Por ejemplo. y también durante el estímulo ante el cual se habían castigado las respuestas. De tal suerte. se observa el mismo aumento general de la actividad des­ pués de los primeros estímulos reforzantes. pero ésta da lugar otra vez a una reducción selectiva de la res­ puesta castigada. Parece que se puede hacer el mismo tipo de consideración en cuanto al reforzamiento positivo. la rata recibe a menudo su primer reforzamiento después de presionar una palanca “accidentalmente”. Asimismo. la observación simple de un sujeto castigado revela que el estímulo punitivo produce inicialmente una reducción de la actividad general. No obstante. la observación simple del proceso de condicionamiento muestra que durante la adquisición de la respuesta. los hallazgos experimentales hasta ahora revisados no apoyan la afirmación de que este efecto general sea una característica particular del castigo y no lo sea del reforzamiento. Comúnmente. era posible que hubiera coincidências ocasionales entre el choque y una respuesta. en las cercanias de la palanca se produce un aumento general de la actividad. Igualmente. se producía una generalización y las otras respuestas eran afectadas de manera similar en la misma dirección. revela que el animal “se congela” des­ pués de recibir un estímulo punitivo. La observación simple de una rata que ha recibido choques a menudo. parece que la aplica­ ción inicial del castigo produce una alteración general de la conducta. 9 C A ST IG O la acción del castigo sobre la respuesta castigada es más general que la del reforzamiento sobre la respuesta reforzada.

el efecto se limita a la respuesta particular que se está ma­ nipulando. Además. es imposible obtener un informe subjetivo dei grado de moléstia. a nivel animal. LA BASE TEÓRICA DEL CASTIGO En varios estúdios dei proceso de castigo se ha tratado de formular una teoria acerca de por qué el castigo reduce la frecuencia de la res­ puesta castigada. pero después de una exposición prolongada. En este estúdio. Hasta que estas respuestas competitivas sean medidas de una manera más completa y directa. Esta explicación afirma que la fre­ cuencia de la respuesta castigada disminuye debido al aumento de la frecuencia de las respuestas que compiten con la respuesta castigada. . parece preferible posponer nuestro dictamen acerca de esta explicación de los efectos dei castigo. Incluso a nivel humano. tanto el reforzamiento como el castigo tienen efectos generales en la conducta si no se tiene cuidado de disponer el reforzador o el estímulo punitivo para que se presente inmediatamente después de la respuesta medida. Podemos re­ sumir estos resultados afirmando que el reforzamiento con comida y el castigo parecen ser análogos en que ambos procedimientos afectan ini­ cialmente a la conducta en general. se producía un mantenimiento duradero de una respuesta existente. nuestra posición ha sido neutral con respecto a qué tan adecuada es la teoria de la respuesta competitiva para explicar los efectos dei castigo. El efecto dei castigo no parece ser más general que el dei reforzamiento. 1955). este tipo de explicación es inadecuado debido al aspecto necesariamente sub­ jetivo que tiene el reporte verbal dei sujeto. pues. Un ejemplo seria la emergencia de respuestas de retirarse en una rata que ha sido castigada por presionar una palanca. Ya se hizo mención de que se ha considerado que el castigo logra su efecto debido a sus posefectos molestos. Esta explicación no parece ser muy útil. Teoria de la respuesta competitiva Se ha dado una explicación teórica más reciente de por qué el castigo es efectivo (Dinsmoor. Sólo en los últimos anos se ha tratado de disponer experimentalmente las res­ puestas “competitivas” y de estudiar los efectos que tiene el castigo en estas respuestas competitivas. la especificidad de los efectos dei castigo se observo claramente cuando la respuesta no castigada ante un estímulo no se veia afectada al castigar la misma respuesta emitida ante otro estímulo. Skinner (1938) informo que cuando se administraba al azar la comida como reforzamiento. 1954. De este modo.LA BASE T E Ó RICA DEL C A ST IG O 517 ducta supersticiosa). Por otra parte.

pero al igual que en el caso del castigo. Si sucede que un estímulo aumenta la respuesta cuando se administra inmediatamente después de esa respuesta. 9 C A STIG O Hasta este momento. neurosis. Asimismo. excepto en la medida en que la identificación de las variables independientes constituye una explicación. más que medidos directamente. Así pues. respuestas competitivas. etc. pulsiones condicionadas. parece más útil describir la naturaleza y la medida de los câmbios conductuales que se presentan durante el castigo e identificar las variables independientes causantes de estos câmbios. a fin de explicar los câmbios que se observan durante el reforzamiento posi­ tivo y la extinción. sin apelar a câmbios de la conducta que hasta ahora han sido inferidos. pulsiones menores. se ha considerado que la reducción de la respuesta que produce el castigo es un proceso primário que se deduce directamente de la definición de castigo. Por una parte. En la actualidad. Hasta el momento en que los términos anteriores se refieren a eventos directa­ mente medibles. se ha propuesto una teoria de la respuesta competitiva. entonces se le clasifica como estímulo reforzante. Como ha hecho notar Marx (1963) en un comentário reciente acerca de la teoria de la respuesta competitiva del reforzamiento positivo. parece que lo más adecuado es considerar que el castigo se encuentra en el mismo nivel descriptivo que se ha adjudicado al reforzamiento positivo. quienes desean hacer un análisis conductual del proceso de reforzamiento no han encontrado aceptable este tipo de explicación. la supresión emocional. Más bien. esta me­ dida es idêntica. el aumento que se observa en la fre­ cuencia de la respuesta reforzada se explica en base a la extinción de respuestas competitivas inferidas. en tér­ minos de las consecuencias satisfacientes.518 CAP. En la actualidad. Las investigaciones acerca del castigo se han interesado frecuentemente en las implicaciones que tiene un cambio conductual dado para alguna teoria que se enuncia en términos de la reducción del miedo. En cierto modo. a una medida directa del grado de reducción de la respuesta castigada. La teoria actual acerca de los determinantes de las propiedades reforzantes de un estímulo reforzante se encuentra en un nivel descriptivo. la disminución que se observa en la frecuencia de una respuesta extinguida se ha explicado en base a un aumento de la frecuencia de estas respuestas competitivas inferidas. el hecho de usarlos aumentará sólo relativamente nues- . la ansiedad. Thorndike propuso una explicación de por qué un estímulo es reforzante. la mejor indicación de la existencia de estas respuestas competitivas es la ausência de la respuesta castigada. En el estúdio presente no se han tratado de “explicar” los efectos del castigo. ha existido la misma situación con respecto al reforzamiento positivo. actualmente muy pocos investigadores utilizan esta teoria. operacionalmente. respuestas proprioceptivas. pulsiones mayores.

Si la noción de fuerza de la respuesta ha de ser de alguna utilidad. se tienen varias me­ didas de la fuerza de la respuesta. Considerando. como ya lo hemos visto (figura 15 y tabla 1). por tanto. solamente el reforzamiento po- . Por implicación. no puede haber dudas acerca dei efecto temporal dei castigo. En este sentido. en el mismo sentido que otros procedimientos para reducir la conducta la “debilitan”. la mayoría de los otros procedimientos para elimi­ nar la conducta deben considerarse también temporales según este crité­ rio cuando se aplica a la extinción. Salvo en inten­ sidades muy altas de castigo. o simplemente la suprime? Otro enfoque teórico sobre el proceso dei castigo se ha ocupado dei problema de si el castigo debilita verdaderamente a la conducta. Según este concepto de fuerza de la respuesta. Más bien. Hull (1943). el cambio de estímulo. No obstante. Esta interpretación se deriva de las formulaciones teóricas que utilizan el concepto de “fuerza” de la respuesta. el castigo parece ser potencialmente más efectivo que otros procedimientos para debilitar a una respuesta. ^Debilita el castigo a la conducta. Se hace la sugerencia de que los efectos dei refor­ zamiento positivo son genuinos. la sujeción física y la supresión condicionada. por el momento. el uso de estos términos irnpide al investigador concentrar su atención en la reducción observable de las respuestas como un fenômeno que es interesante por sí mismo y no como un “índice” de algún proceso subyacente que desafia la medición di­ recta. entonces se supone que las diversas medidas de la fuerza de la respuesta deben covariar. Resulta difícil saber exactamente por qué debe considerarse que el aumento de la conducta que produce el castigo sólo es aparente. Puede interpretarse de otra manera la creencia común de que el castigo no debilita verdaderamente a la conducta. se infiere que el reforzamiento positivo fortalece verdadera­ mente a la conducta. entre ellas la frecuencia de la respuesta y el número de respuestas emitidas durante la extinción. la eliminación de la contingência de castigo tiene como resultado un retorno a la conducta anteriormente castigada. la saciedad. Debemos concluir. usó el concepto de fuerza de há­ bito. que el castigo sí “debilita” verdaderamente a la respuesta. mientras que los câmbios que produce el castigo sólo son aparentes. El que estas medidas no covaríen ha sido una fuente de dificultades.LA BASE TEÓ RICA DEL C A ST IG O 519 tra comprensión dei castigo. La interpretación que proponemos es que muchas veces se ha encontrado que el efecto dei castigo es reversible. por ejemplo. En realidad. y Skinner (1938) empleó alguna vez el concepto de reserva refleja.

cualquier reducción de la tasa de respuestas durante el castigo debe ir acompaííada por una disminución de la resistencia a la extinción. Se ha encontrado en otros estúdios que la recuperación de las respuestas que tiene lugar durante la extinción es resultado de la terminación del castigo. en tanto tomemos precauciones para impedir que las propiedades discrimi­ nativas o reforzantes condicionadas acrecienten el efecto del estímulo punitivo. por el otro. Esta misma noción de la fuerza de la respuesta parece ser la causante de la afirmación de que el castigo no debilita la conducta.520 CAP. En la actualidad. los resultados obtenidos en diversos estúdios del castigo no apoyan la idea de que el castigo produce solamente una debilitación aparente de la respuesta. La tasa de respuestas máxima se emite bajo el reforzamiento continuo. entonces debemos esperar que el reforzamiento continuo lleve a mayor resistencia a la extinción. Si la mejor medida de la fuerza de la respuesta es la tasa de la respuesta. parece ser más fructífero abandonar la noción de la fuerza de la respuesta y considerar la tasa de la respuesta. a pesar de las pruebas que demuestran que durante el castigo hay una reducción extremada de la conducta. Por otro lado. cuando excluimos el tiempo real que es necesario para administrar y consumir el reforzamiento. La base empírica . Por supuesto. sino más bien de las propiedades discriminativas adquiridas por el estímulo “punitivo”. probablemente. del proceso de castigo. La conclusión de que el castigo no debilita a la respuesta se basa en la recuperación de las respuestas anteriormente castigadas que tiene lugar durante la extinción (Estes. Con todo. 1938). Se recordará que el castigo hacía disminuir la resistencia a la extinción en tanto se mantuviera la contingência punitiva mientras du­ rara el periodo de extinción. se sabe que la tasa de respuesta está en función de la frecuencia de reforzamiento (Skinner. como dos enti­ dades diferentes. 9 C A ST IG O sitivo. Si la resistencia a la extinción se toma como la verdadera medida de la fuerza. entonces habría que considerar al castigo inefectivo para debilitar la conducta. De acuerdo con la noción de la fuerza de la respuesta. 1944). pues las dos medidas deben covariar. Si la tasa de respuestas y la resistencia a la extinción son dos medidas equiva­ lentes de la fuerza de la respuesta. entonces debe considerarse débil la alta tasa de respuestas que se emite durante el reforzamiento continuo. hemos visto (fi­ gura 13) que esta recuperación durante la extinción no está en función. entonces habría que considerar que el castigo debilita verdaderamente a la conducta. se ha descubierto que lo que sucede es precisamente lo con­ trario: el reforzamiento continuo tiene como resultado poca resistencia a la extinción. No obstante. si la mejor medida de la fuerza de la respuesta es la resistencia a la ex­ tinción. por un lado. y la resistencia a la extinción.

El castigo por tiempo-fuera parece usarse con más frecuencia que el castigo físico cuando se trata de la conducta hu­ mana. La respuesta de rodar en la cama y caerse es castigada inmediata y duramente por la colisión con el suelo. no parece probable que se pueda eliminar fácilmente al tiempo-fuera y al costo de respuesta como métodos de castigo. Incluso en los lugares donde el castigo es admi­ nistrado por una persona o por una institución. . golpes u otros maltratos físicos. correr o alcanzar. Por cualesquiera razones. Entonces. ASPECTOS INDESEABLES DEL CASTIGO ^Podemos eliminar el castigo como método de control conductual? Hemos visto que. No tenemos más que cerrar los ojos mientras corremos. de eliminar el castigo dei mundo físico en un futuro cercano. Siempre que interactuamos con el mundo físico. A nivel de la conducta individual. Tan poderosas son estas contingências punitivas potenciales. Es concebible que se puedan cambiar los reglamentos administrativos de tal manera que dejen de aplicarse castigos públicos en forma de azotes. Eliminar el tiempo-fuera como contingência punitiva significaria . Sin embargo. Pero parece haber pocas probabilidades. hay muchas contingências punitivas esperándonos.ASPECTO S INDESEABLES DEL C A ST IG O 521 de la pretendida inefectividad dei castigo parece estar sujeta a una reinterpretación. como caminar. o ninguna.necesario eliminar toda conducta que implicara una interacción con el mundo físico. Un buen ejemplo de esto seria cualquier conducta que nos mueve a través dei espacio. para damos cuenta dei grado en que las contingências punitivas rodean nuestro movimiento. parece que es posible eliminar el castigo físico como pro­ cedimiento institucional.. aunque no mucho. parece un poco más difícil eliminar el uso dei castigo físico. parece que seria posible eliminar el uso dei castigo físico. que existen incluso cuando dormimos. El gra­ do en que se aplican verdaderamente estas contingências punitivas puede verse en los esfuerzos iniciales que hace el nino pequeno para aprender a caminar o a correr. pero de todos modos no es imposible. hay un tipo de castigo que parece ser virtualmente imposible eliminar: el de las contingências punitivas de que dispone el mundo físico. incluso parece posible. aparte dei castigo.En qué medida es factible este objetivo? A nivel de instituciones. tal vez queramos emplear otros métodos que no sean el castigo. Parece ser que para eliminar las contingências punitivas que impone el mundo físico seria . que pueda eliminarse el castigo como actividad individual. existen varios métodos para eli­ minar la conducta.

Más bien. El castigo parece haber arraigado entre nosotros.52 2 CAP. los estímulos aversivos se programan a una frecuencia elevada. la observación simple de un pichón que está siendo castigado no revela mayores signos de zozobra o de vacilación conductual que los que se observan durante procedimientos alternativos. parece que la experiencia simplemente hiciera disminuir la probabilidad de que el nino tocara otra vez el radiador. en comparación con las ocasiones en que se empleaba un choque no contingente. como el de extinción. Como es improbable que alguna vez se elimine el castigo que aplica el mundo físico. 9 C A ST IG O eliminar las multas. y que su eliminación en un futuro cercano parece bastante improbable. la negación de favores o el retiro de privilégios. Concomitantes emocionales Una razón que se esgrime con frecuencia para tratar de eliminar el castigo es que los estímulos aversivos en general. que está bien adaptado para afrontar las contingências de la evitación. Asimismo. Parece que actualmente lo correcto es afirmar que el castigo es un método de control conductual que se usa con frecuencia. hay poca evidencia de que la experiencia haya causado una perturbación conductual crônica en tales casos. al usarse el choque como castigo sólo se producía una perturbación tem­ poral. A pesar de lo grave que pueda ser la quemada sufrida. y el castigo en par­ ticular. el encarcelamiento. Hearst (1965) encontro que. la observación simple no indica tampoco que se produzca un desajuste emocional crônico en el nino que se ha quemado al tocar un radiador caliente. que se midieron por medio de la defecación de las ratas. producen estados emocionales perturbadores o indeseables. Por ejemplo. En vez de eso. se ha encontrado que los sujetos que se hallan bajo la evitación de Sidman distribuyen sus respuestas en un patrón temporal bien definido. aun cuando el choque no contingente pro­ ducía una perturbación duradera en una discriminación establecida. A nivel humano. es una suerte que tales . Estos investigadores encontraron po­ ços efectos emocionales. Con todo. la observación simple de un animal du­ rante la evitación de Sidman no muestra generalmente ningún signo de zozobra después del periodo de adquisición inicial. No obstante. Hunt y Brady (1955) han obtenido evidencias experimentales respecto a los efectos no perturbadores del castigo. en el procedimiento de evitación de Sidman. el despido de un empleo. no parece ser evidente que podamos atribuir un estado emocional tal al uso de los estímulos aversivos especificamente. Igualmente. Nos­ otros analizaremos estos estados emocionales solamente si tienen como resultado una perturbación conductual crônica. cuando se usaba el choque como castigo.

Denominaremos al primer tipo agresión operante. La conducta agresiva hacia el estímulo punitivo parece desempenar la función de lograr precisamente ese propósito. Cuando castigamos una respuesta. en cuyo caso se desea eliminar la vocalización no autorizada dei nino. en términos de que producen una incapacidad para vivir una existencia efectiva.ASPECTO S INDESEABLES DEL C A ST IG O 5 23 castigos no parezcan generar una compulsión emocional de naturaleza crônica. el individuo puede eliminar la contingência de castigo abandonando la situación. Por ejemplo. hay dos tipos posibles de agresión social. Este efecto colateral dei castigo parece ser uno de los aspectos más indeseables de que un individuo aplique un castigo a otro individuo. Agresión operante Parece ser que cuando un organismo aplica un castigo físico a otro. esto significa que no sólo seria de esperarse que el castigo de la voca­ lización hiciera disminuir. Aparentemente. se produce la agresión social. El resultado final seria la terminación de la relación social. lo cual haría imposible cualquier control social adicional de la conducta dei individuo. pues el proceso de socialización debe depender necesariamente de una interacción continua con otros indivíduos. En términos dei ejemplo que estamos citando. sino también que aumentara la probabilidad de que el nino abandonara la situación dei salón de clases. “irse de pinta” y abandonar la escuela. Sin embargo. Perturbación social Es en el área de la perturbación social donde el castigo sí parece ser capaz de producir câmbios conductuales de largo alcance. generalmente deseamos producir una disminución de esa respuesta específica. Ya hemos visto que cuando se está castigando una respuesta. se supone que una agresión de éxito contra la fuente dei estímulo punitivo tendrá como resultado la elimi- . Otro modo de eliminar la contingência de castigo seria destruir o inmovilizar al individuo que está administrando el estímulo punitivo (Del­ gado. hemos visto que uno de los efectos colaterales dei proceso de castigo era que reforzaba en el individuo tendencias a escapar de la propia situación punitiva. pero que sus otras conductas permanezcan intactas. Aunque las evidencias experimentales acerca de la importancia de las consecuencias de la agresión no son definitivas. Se fortalecerían conductas tales como llegar retrasado. 1963). y al mismo tiempo deseamos que los demás aspectos de la conducta dei indivíduo permanezcan relativa­ mente inmutables. un maestro puede castigar a un nino por hablar en clase.

El estúdio de Ulrich y Azrin (1962) ilustra algunas de las características de esta agresión provocada. bajo esta agresión provocada. cuando éste es administrado por un individuo: a) el indivíduo casti­ gado es ahuyentado del agente punitivo. Hutchinson y Hake. Además. El término agresión operante indica que este tipo de agresión es mantenido por las consecuencias potencial­ mente favorables de la agresión. La existencia de este tipo de agresión no parece depender de ninguna consecuencia favorable. Nuestro principal objetivo de eliminar una respuesta castigándola puede tener el efecto completamente inesperado de producir agresión por parte del organismo castigado. En ese experimento. 1965. 1962). Azrin. 1963. lo importante de esta lucha reflexiva es que parece ser una respuesta general a la estimulación aversiva. Hutchinson. cuando el experimentador administraba el choque a las patas. los animales no mostraban ningún signo de agresión. Se ha encontrado que esta agresión provocada existe en varias especies y es provocada por diferentes tipos de estimulación dolorosa (Azrin. Más bien. entonces se produce una agresión o un ataque contra los organismos cercanos. Ulrich y Azrin. Hutchinson y Sallery. Parece que las principales desventajas de usar el castigo son que. aunque el organismo que es atacado no haya administrado el estímulo doloroso. pues ninguno de los combatientes ha causado de alguna manera la estimulación aversiva. Azrin. 9 C A S T IG O nación de los estímulos punitivos. Agresión provocada Llamaremos agresión provocada al segundo tipo de agresión (Ulrich y Azrin. A diferencia de la agresión operante. Se ha encontrado que este tipo de agresión tiene lugar cuando se administran estímulos dolorosos a un organismo que se en­ cuentra en companía de otro organismo. se colocaron dos ratas en una câmara que contenía un piso de rejilla. lo cual destruye la relación . Ulrich. 1964. esta agresión provocada no parece tener la función de reducir la estimulación aversiva. 1965. Hake y Hutchinson. Wolff y Azrin. En ausência del choque a las patas. 1964). Azrin. incluso a los que no tienen ninguna relación con la administración del estímulo punitivo. 1964.524 CAP. sin embargo. las ratas daban la vuelta y se atacaban entre sí. Como el castigo físico requiere de la administración de estimulación aversiva. seria de esperarse que esta agresión social constituyera una reacción pro­ vocada ante el castigo físico. parece que cuando se aplica a un organismo una estimulación dolorosa intensa. es de esperarse que el indivíduo castigado ataque a cualesquiera otros organismos cercanos. Para nuestros propósitos.

Como procedimiento reductivo. el costo de respuesta y el castigo con­ dicionado. es de esperarse que haya una agresión provocada contra los indivíduos cercanos que no son responsables dei castigo. El resultado de una asociación temporal selectiva de esta naturaleza puede ser el de fortalecer. incluso. RESUMEN Y CONCLUSIONES A nivel de definición. puede ser asociado inadvertidamente con estímulos reforzantes. como el choque y el ruido. Esta confusión surge cuando olvidamos que un estímulo punitivo sigue siendo un estímulo. y c) incluso cuando el castigo es adminis­ trado por medios físicos y no por otro organismo. como tal. con períodos de reforzamiento. la programación y la inmediatez dei castigo. la frecuencia. como lo inmediato de la reducción de la respuesta. Son por lo menos tan impor­ tantes como éstos. la generalización y la discriminación. neutralizar o. el castigo simplemente reduce la frecuencia de la respuesta castigada. Los estímulos que se usan con más frecuencia en las investigaciones experimentales son los estímulos incondicionados. Se han identificado varios câmbios conductuales característicos que tienen lugar durante el castigo. Varios aspectos dei estímulo punitivo han resultado ser fundamentales. el castigo pa­ rece ser por lo menos tan efectivo como la mayoría de los demás proce­ dimientos para eliminar respuestas. pues la supervivencia dei organismo humano parece depender completamente dei mantenimiento de relaciones sociales verdaderamente armoniosas. el efecto de contraste dei castigo.R ESU M EN Y C O N C L U S IO N E S 52s social. como la intensidad. con períodos de extinción y con otros estímulos punitivos. como la frecuencia y el programa de reforzamiento. pero hay otros tipos de estímulos punitivos. No se ha prestado suficiente atención al papel que desempenan estas variables de reforzamiento en la determinación de la efectividad dei castigo. como el tiempo-fuera. la recuperación gradual que se produce durante el castigo. las variables de reforzamiento que mantienen a la respuesta castigada. que parecen emplearse con más frecuencia que el castigo en el control social de la conducta. Estas tres desventajas parecen ser fundamentales especialmente para la conducta humana. Quizá el aspecto más paradójico y confuso dei castigo haya sido la capacidad que tiene un estímulo punitivo de convertirse en estímulo discriminativo o estímulo reforzante condicionado. mvertir el aspecto aversivo dei estímulo punitivo. . y también la oportunidad que tiene el sujeto de emitir modos de con­ ducta alternativos. b ) el individuo castigado puede emitir agresión operante diri­ gida hacia el agente punitivo.

pues la reacción conductual del sujeto hace disminuir la probabilidad futura del castigo. La agresión operante parece ser igualmente infortunada porque la agresión social perturba la relación social particular. Puede esperarse que el castigo incapacite al indivíduo para existir en la sociedad humana. ni la perturbación conductual duradera son necesariamente resultados indeseables del castigo. Ni el estado emocional. la agresión provocada no parece ser funcional. pero. 9 C A ST IG O Cuando castigamos una respuesta. La existencia del animal humano depende completamente de la asis­ tencia que le prestan otros seres humanos durante sus primeros anos de vida. desde el punto de vista evolutivo. o incluso la existencia de un estado emocional. esta dependencia sigue existiendo durante toda la vida de la persona. Si no hemos pasado por alto los efectos de las variables de reforzamiento o las variables discrimina­ tivas. Esta conducta no parece ser demasiado infortunada mientras se mantengan interacciones sociales en otras situaciones no castigadas. Por otra parte. Se ha encon­ trado que el castigo produce tres fuentes de perturbación: a) el escape de una situación en la que se administra un castigo. los câmbios conductuales extensivos que produce el castigo seguirán constituyendo una parte útil del repertorio conductual. ni lo son tampoco la gravedad de là reducción de la respuesta. esta agresión no es adaptativa como medio específico para reducir la estimulación aversiva . el escape de la situación social en la que se administra el castigo tiene el infortunado efecto colateral de impedir cualquier interacción social futura en esa situación. ni la generalización conduc­ tual de los efectos punitivos indeseables. nos interesamos primordialmente en reducir la frecuencia de esa respuesta. de nuevo. Por tanto. b) la agresión operante. se podría esperar que la conducta agresiva se emitiera solamente en aquella situación en que la agresión redujera el castigo. Incluso en las sociedades más primitivas. y c) la agresión provocada. pues la agresión se despliega incluso hacia indivíduos que no están relacio­ nados de ninguna manera con el castigo. en la medida en que elimine o perturbe la interacción social. No obstante.526 CAP. tenemos razones para creer que nuestro procedimiento de castigo va a ser completamente efectivo para eliminar la respuesta indeseable. a reducir la probabilidad futura de eventos dolorosos y posiblemente destructivos. es probable que todos estos efectos sean muy útiles cuando un castigo físico está dirigido. De hecho. Dado que el castigo físico constituye una parte inevitable y continua de nuestra interacción con el mundo físico. La desventaja primordial del castigo para los humanos puede ser la perturbación social que produce y no la severidad o generalidad de la reducción de la respuesta. Los primeros dos fenômenos son un poco adaptativos desde un punto de vista de corto alcance.

(1965) Elicitation of aggression by a physical blow. 2. (1963) Fixed-ratio punishment. J. F.. N. F. Anal. (1961) Punishment in the squirrel monkey saimiri sciurea. R. N.. /. (1964) Aggressive responses of paired animais. N. 301-305 (b). Hake. C. N. Anal. C.. Behav. R. 605606(a). Azrin. H. Puede esperarse que la naturaleza indiscriminada de esta agresión per­ turbe o termine relaciones sociales que de ninguna manera son puni­ tivas. /. H. Science. (1959) A technique for delivering shock to pigeons. 131. Hutchinson. por tanto. F. R. abril. (1960) Sequential effects of punishment. D. B. (1956) Effects of two intermittent schedules of immediate and nonimmediate punishment. (1960) Some schedules involving aversive control. 3. 55-57. Azrin. 528-529. Holz. Anal. 1. /. H.. Psychol. N. D. Podemos concluir. 36.1 6 LJ. Anal. J. ]. Azrin. exp. Behav.. H. Azrin. 2. 8.. 133. exp. N. H. 123-142 (b). (1956) The dependence of interresponse times upon the relative reinforcement of different interresponse times. R. Psychol. y Hutchinson. H. B. Washington. D. que la perturbación de la conducta social constituye la desventaja primordial dei uso dei castigo. 161-163(a). 4. Holz. Anal. Azrin. 141-148. Anal. exp. 3-21. Science. Behav. exp. Science. H. C. 31-44. W.. (1965) Motivational aspects of escape from punishment.. exp. D. /. Azrin. . pues se ataca tanto a indivíduos punitivos como no punitivos. Hake. exp. Behav. Azrin. 6. N. /. B. Behav. exp. exp. 349-359. 8.. de importancia secundaria para los productos sociales dei uso dei castigo. dis­ tintamente. 6. /. y Hutchinson. Azrin. /. R. N. 42. Anal. N. 145— Appel. (1963) Pain-induced fighting in the squirrel monkey. Behav. W. R. W. II.. Behav. D.REFERENCIAS B IB L IO G R Á FIC A S 527 futura. y Holz. y Hake. Azrin. 343-347. exp.. 52. 3. J. (1961) Punishment during fixed-interval re­ inforcement. 620. H. Anal. H. REFERENCIAS BIBLIOGRÁFICAS Anger. H. exp. Trabajo leído en el Simposio acerca de la importancia de los aspectos médicos. Appel. Anal. (1958) Some effects of noise on human behavior. Los câm­ bios que se producen en la propia respuesta castigada parecen ser. (1959) Punishment and recovery during fixed-ratio perfor­ mance. Azrin. /.. 141. /. Walter Reed Institute of Research. exp. 183-200. Behav. N. (1963) Punishment and shock intensity. Behav. Azrin N... J.. y Hake. Appel. Anal. Azrin. (1960) Effects of punishment intensity during variable-interval reinforcement.. H. Behav. N.

M. 17-23.. exp. 4. A. J.. exp. 223-228. Rep. E. (1964) Selective punishment of fixedratio performance. Anal. Anal... L. 191-199. exp. 62. A. 273. N. Psychologist. 7. S. A. Anal. 273-274.. 27-45. /. D. E. 43-49.. Behav. (1957) Relation between stimulus intensity and strength of escape responding. H. Anal. thinking. (1961) Avoidance learning in dogs without a warning stimulus. J. 3. y Winograd. (1964) An aversive stimulus as a correlated block counter in FR performance. Psychol. Behav. A.. Barry. Behav. y Antonitis.. Anal. /. 1-7. 161-163. Delgado. 4. (1959) Avoidance. J. /. H. Psychol. A. M. y Sauerbrunn. /. T. 9 C A ST IG O Azrin. Psychol. D.. 7. Dinsmoor. H. J. 420-425. F. Nueva York: McGraw-Hill. J. G. (1961) Punishment and preshock as determinants of bar-pressing behavior. y Sauerbrunn. escape and extinction as functions of shock intensity. 54. physiol. (1955) Punishment: II An interpretation of empirical findings. J. Quart J. J. Anal. 7. Rev. Behav. S. y Campbell. 7. A. comp.. (1964) Selective punishment of concurrent progressive ratio behavior. (1950) Personality and psychotherapy: An analysis in terms oi learning. J. J. 255-260(a). 2. A. Anal. Anal. 52. F. M. Behav. y Hermstein. D.. (1964) Pain-aggression toward inanimate objects. Psychol. Anal. Dinsmoor. A. (1961) A wide range constant current shock stimulator. Behav. J. /. 141.5 28 CAP. J. Behav. Black. Dardano. Dinsmoor. Anal. /. y Sauerbrunn. D. 145—148. J. Rep. . R. exp. 3-8. J. Amer. 37-43 (b). (1958) Shock intensity in variable-interval escape schedules.. R. (1963) Cerebral heterostimulation in a monkey colony. exp. (1958) A new shock grid for rats. Chung. (1954) Punishment: I The avoidance hypothesis. J. Barlow. 51-65 (c). y Sallery. J. y Reynolds. 1. exp. (1952) Secondary motivation through classical conditioning: One trial nonmotor learning in the white rat. and culture. J. exp. R. R. 61. Behav. J. (1965) Effects of effort on response rate. A. y Harrison. Dollard. /. Dinsmoor. y Morse. Rev. Behav. Dinsmoor. exp. M. Behav.. A. Science■. Sidman. exp. 1. Dardano. Psychol.. physiol. J. J. (1952) A discrimination based on punishment. S. Brethower. 182. (1956) Escape-from-shock training following exposure to inescapable shock. D. exp. Dinsmoor. 716— 720. R. 34-46.. 5. /. 4. Boren. Baron. 8. Jr. Psychol. F. P. comp. Dinsmoor. J. 7. 96-105. J.. Dardano.. (1962) A facilitative effect of punish­ ment on unpunished behavior.. /. N. J. exp. y Miller. Hutchinson.. Phychol. J.

(1965) Conditioned punishment. y Azrin. G. 135-146. Monogr. J. Anal.. 8. Behav. 335-337. Flanagan. Anal. Rep. Psychol. R. R. Herrnstein.. 185-188. 3. H.. exp. (1962) A relay sequencing device for scrambling grid shock. y Azrin. 207-220. exp. C. H. 29. 193-199. (1944) An experimental study of punishment. (1957) Schedules of reinforcement.. (1964) Performance on a fixed-ratio schedule with correlated amount of reward. 8.. y Skinner. Hake. L. Hoffman. Fry. Harvard University. W. (1958) Operant stuttering: The control of stuttering behavior through response-contingent consequences.. 45-56. D. M. J. 297-298. 3. 7. /. F. Ferster. exp. N. Anal. T. Anal. I. H. Estes. y Azrin. Behav. Psychol. J. W. Holz. 279-293. D. H. Herman.. Anal. (1962) Producing either positive or negative tendencies to a stimulus associated with shock. Hake. y Appel. 173-177. N. 225—232. . 6. N. I. exp. y Cook. C. (1961) Punishment of SA responding in matching-to-sample by time-out from positive reinforcement. Anal. C. (todo el número 263). Harrison. Science. R. N. C. B. 655-657(a). exp. y Skinner. E.. R. y Azrin. (1962) Recovery during punishment by intense noise. /.. M. B. W. ]. Nueva York: Appleton-Century-Crofts. B. /. y Morse. J. (1958) Control of behavior in chimpanzees and pigeons by time-out from positive reinforcement.. 57. Goldiamond. W. 329—330. K. Anal. L. /. H. Hearst. D. (1955) Behavioral consequences of the removal of a discriminative stimulus associated with variable-interval reinforcement. R. 5. J. Behav. exp. (1961) Discriminative properties of punish­ ment. C. B. Monogr. 5... 1. 4.REFERENCIAS B IB L IO G R Á FIC A S 529 Estes. B. Behav. (1960) A mathematical index of per­ formance on fixed-interval schedules of reinforcement. (1965) Stress-induced breakdown of an appetitive discrimantion. N. F. Kelleher. exp. 11. Ferster. y Azrin. F. /. Anal. exp. Some relations between the auditory system of the medulla and auditory stimulus functions. H. W. B. exp. (1941) Some quantitative properties of anxiety. 929-931. Anal. 207209.. K. 7. 72 (Volumen núm. 390-400. Behav. /. Holz. B. L. /. Hendry. P. exp. Psychol. 461). Anal. C. Behav. Psychol. W. y Van-Toler. J. (1963) An apparatus for delivering pain-shock to monkeys. Behav. Behav. M. Anal. (1964) Punishment by noise in an alternative response situation. Behav. Behav. Behav. Herrnstein. exp. F. H.. D. Evans.. (1957) Effects of pentobarbital on intermittently reinforced behavior.. Behav. H. J. y Fisher. y Azrin. Ferster. S. N. W. 125. y Fleshler. Abelson. 4. J. Tesis doctoral inédita. exp. Anal. exp...

R. Behav. C. 729-730.. Anal. exp. y Ulrich.CAP. F. N. 538-549. S.. 6. L. E. W. Muenzinger. Psychol.. Holz. 45. physiol.. 6. y Azrin. comp. R. C.. J. y Slivka. R. N. exp. H. 305-310. /. (1954) Contiguity vs drive-reduction in conditioned fear: The proximity and abruptness of drive-reduction. Holz. L. exp. exp. (1965) Effects of age and related factors on the pain-aggression reaction. R. Holz. Behav. T. y Aiken. N. 12.. Anal. y Ayllon. Anal. H. H. Amer. W.. y Brady. (1963) A comparison of several procedures for eliminating behavior. Behav. Kaplan. exp.. N. Azrin. W. Behav. C. y Solomon. H. N. Ulrich. 6. /. Anal. N. M. 67. Keller. 21-25. B. (1960) Learning resistance to pain and fear effects over learn­ ing. G. 7. 371-385. Kelleher. (1963) Experimental self-punishment and superstitious escape behavior. J.. (1954) Contiguity vs drive-reduction in conditioned fear: Temporal varations in conditioned and unconditioned stimulus. E. Hunt. K. Migler. Masserman.. Rep.. J.. C. Behav. 59. /. L. 203-211. H. (1943) Principies of behavior. Nueva York. 60. (1934) Motivation in learning: I Electric shock for correct responses in the visual discrimination habit. Hutchinson. R. Filadélfia: Saunders. 439-448. N. E. J. Appleton-CenturyCrofts. Amer. Mowrer. Azrin. comp. y Azrin.. N. 626-638.. F. M. F. Nueva York: Appleton-Century-Crofts. K. Anal. 6. y Schoenfeld. M. physiol. Behav. E. W. Mowrer. 9 530 C A ST IG O Holz. ]. 137-145. physiol. 5. J. ]. exp. O. 229234(b)... (1962) Interactions between the discriminative and aversive properties of punishment. /. Psychol. 115-122. T. Psychol. Anal. 48. (1959) An analysis of the behavior of rats and monkeys on concurrent fixed-ratio avoidance schedules. /. y Cook. exp. Marx. W. Psychol. Honig. O. ]. (1952) The effect of noxious stimulus intensity and duration during intermittent reinforcement of escape behavior. y Ayllon. J. 407-412(a). (1946) Principies of dynamic psychiatry. . /. Miller. 67. 399. exposure.. Psychol. Psychol. C. 15-25. H. (1955) Some effects of punishment and intercurrent anxiety on a simple operant. Psychol. W. (1963) The need for more specific formulation of the competing response interpretation of extinction. H. (1963) Elimination of behavior of mental patients by response-produced extinction. and rewarded exposure in context. comp. Psychol. H. 365-369.. Behav. H. T. V. 17. 2. Azrin. (1963) Punishment of temporally spaced-responding.. Hull. comp. (1964) Stimulus generalization of the effects of punishment. Anal. exp. R. /. (1950) Principies of psychology. H.

(1911) Animal intelligence: Experimental studies. Wolff. R. 15. y Bretnall. (1957) Maintenance of avoidance behavior by unavoidable shock. Anal. C. y Broen. /. Sidman. 349-356. 217-220. Nueva York: AppletonCentury-Crofts. Psychol. C. abnorm... Thordinke. 553-557. y Campbell. (1942) Behavior potentiality as a joint function of the amount of training and the degree of hunger at the time of extinction. . Psychol. exp.. Anal. P.. Thorndike. Herrnstein. comp. H. W. B. 601-614. C. /. B. 511-520. M. S. Anim. 305-307. E. B. comp. B. Nueva York: Teachers College. 265-280. J. 168-172. Nueva York: Macmillan. 1. H. 30. Skinner. Psychol. Psychol. Tolman.. Science. C. Skinner. E. y Azrin.. J. B. Sidman. Behav. physiol. /. L. y Azrin. Sidman. Anal. R. F. P. F. R. exp. C. E. /. (1962) Reflexive fighting in response to aversive stimultion. G. Behav. (1963) Punishment of SA responding of humans in conditional matching-to-sample by time-out. (1932) A disproof of the law of effect and a substitution of the laws of emphasis. 5. F. F. soc. N. Hall. (1947) An automatic shocking grid apparatus for continuous use. Behav. Psychol. Ulrich. /. exp. 157-158... 40. Anal. /. 118. ]. exp. L. H. exp. 135. y Conrad. exp. Anal. Reynolds. (1962) Some effects of response cost upon human operant be­ havior. (1948) “Superstition” in the pigeon. /. Borocszi. N. N.. exp. Behav. H. S.. motivation. and disruption. 5. M. Sidman.. J. (1961) Behavioral contrast. D. ]. Behav. Storms. (1962) Punishment inhibits an instrumental response in hooded rats. T. M. 6. 57—71. Behav. 50. 4... 93-113. Nueva York: Macmillan. y Baydan.. Zimmerman. y Ferster. J. (1953) Science and human behavior. 201-208. (1963) Intermittent punishment of SA responding in matching-to-sample. 50. physiol. Skinner. 6. (1953) Avoidance condi tioning with brief shock and no exteroceptive warning signal. E. Skinner. J.. M.REFERENCIAS B IB L IO G R Á F IC A S 531 Perin. Zimmerman. Behav. Psychol. (1938) The behavior of organisms. exp. 14-15. (1958) By-products of aversive control. T. L. E. G.. Ulrich. E.. /. Weiner. Anal. 12. Science. exp. L. 1133-1134. 589-597. (1932) The fundamentais of learning. S. G. (1955) On the persistence of avoidance behavior. 38. E. (1964) Shock as an elicitor of intra-and inter-species fighting behavior.