You are on page 1of 68

La naturaleza del aprendizaje

LA NATURALEZA DEL APRENDIZAJE

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

LA NATURALEZA DEL APRENDIZAJE 1

En el estudio del aprendizaje estamos interesados en cmo un organismo adquiere nuevas formas de comportarse. Pero el comportamiento de un organismo puede cambiar de muchas formas, y podramos estar dispuestos a considerar ms algunos cambios como aprendizaje que otros. De tal manera, an la definicin de aprendizaje es potencialmente controversial, y en psicologa el estudio del aprendizaje ha tenido muchas controversias.

Una de las controversias menores pero ms persistentes, si los organismos unicelulares pueden aprender, ilustra el problema de distinguir aprendizaje de otros tipos de cambios comportamentales. En alguna ocasin fue argumentado, por ejemplo, que el paramecium poda aprender, porque se haba demostrado que los paramecios podan congregarse, despus de varias sesiones de alimento, en una regin donde el alimento era presentado. Pero este argumento desapareci cuando se encontr que su congregacin dependa de residuos fsicos de sesiones anteriores ms que de oportunidades previas de alimentarse en ese lugar (Jensen, 1957); los paramecios se congregaban ah por lo que haba ah actualmente, y no debido a lo que haba ocurrido ah en el pasado.

Tambin se discuti el aprendizaje en el paramecium cuando se mostr que los paramecios evitaban la luz despus de que sta haba sido apareada con calor. Pero este argumento tambin desapareci cuando se encontr que los paramecios evitan la luz despus de haber sido calentados independientemente de que la luz y el calor hayan sido presentados juntos o no (Best, 1954); los paramecios evitaban la luz debido a que eso es lo que los paramecios calentados hacen, y no debido a que hubiesen aprendido algo acerca de la relacin entre luz y calor en estos experimentos. La cuestin, si los paramecios pueden aprender, se ha mantenido igual; la respuesta ha cambiado con el tiempo.

Pero Qu clase de cuestin es sta? Ciertamente el comportamiento de un paramecium individual puede cambiar. Pero algo ms debe estar involucrado, porque el mismo cambio en comportamiento puede o no llamarse un ejemplo de aprendizaje, dependiendo de las circunstancias que llevan a l. La cuestin es parcialmente acerca de los paramecios; tambin es acerca de las condiciones bajo las cuales decimos que un organismo ha aprendido.

Considere otro ejemplo. Si exponemos por un tiempo a los paramecios a una temperatura un poco ms alta que aqulla en la que han estado viviendo, encontramos que pueden sobrevivir temperaturas an ms altas que de otro modo los hubieran matado ( Beale, 1953). No pudiesen muchos observadores Catania, Ch. (1973). The Nature of Learning. En: Nevin, J. y Reynolds, G. The Study of Behavior. Glenview, Ill. Scott, Foresman and Company. (pginas 31-68). Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA
1

La naturaleza del aprendizaje

hablar de esta adaptacin a la temperatura diciendo que los paramecios haban aprendido a tolerar temperaturas ms altas? Y qu pudisemos encontrar acerca de la forma en la cual esta adaptacin a la temperatura funciona que los convenciese para hablar de ello de manera diferente?

No existe una respuesta sencilla o final a estas cuestiones, pero ellas ilustran que el modo en que nos referimos al aprendizaje merece tanto escrutinio como el comportamiento que investigamos. Nuestro propsito, por lo tanto, es doble: Examinaremos algunas propiedades del comportamiento, y consideraremos las formas en las cuales estas propiedades pueden ser descritas. Salvo que ofrezcamos ejemplos que comnmente son considerados como ejemplos de aprendizaje, no intentaremos definir el aprendizaje mismo, porque los fenmenos de aprendizaje son variados aunque comparten la misma naturaleza.

LA NATURALEZA DEL COMPORTAMIENTO

Cuando analizamos el comportamiento, tenemos disponibles para nuestro estudio solamente las propiedades del ambiente del organismo y las propiedades del comportamiento del organismo. Llamamos a estas propiedades estmulos y respuestas, pero ninguno de ellos es de inters por s solo. Estudiamos los estmulos para determinar las formas en las cuales afectan a las respuestas, y estudiamos las respuestas para determinar las formas en que pueden ser afectadas por los estmulos. As, una de las tareas esenciales del anlisis del comportamiento es examinar los tipos de relaciones que pueden existir entre los estmulos y las respuestas, y cmo es que estas relaciones se presentan.

Observando al organismo

La primera y ms sencilla cosa que podemos hacer para saber acerca del comportamiento de un organismo es simplemente observarlo (cf. mtodos etolgicos en el Captulo 9). Por ejemplo, si estuvisemos interesados en el comportamiento de una rata, podramos colocarla en un espacio abierto y despus observar (cf. Bindra, 1961). La rata podra permanecer inmvil por un tiempo, pero despus podramos verla caminar o correr y ocasionalmente levantar sus patas traseras. Podramos verla olfatear o posiblemente lamerse o acicalarse; o la rata podra orinar y defecar. Si instalamos el equipo de registro necesario, tambin podramos ver cambios en su respiracin, pulso, presin arterial, y otras respuestas que no son fcilmente observadas con el simple ojo.

Podramos registrar stas y otras respuestas, pero nuestro conocimiento del comportamiento de la rata estara seriamente limitado por el carcter restringido de su ambiente. Si deseramos encontrar ms, tendramos que construir un ambiente que diese a la rata ms oportunidad para desarrollar otros tipos de Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

comportamiento. Por ejemplo, podramos construir un rea alrededor de la cual estuviesen localizados varios compartimientos. Cada uno de estos compartimientos podra ofrecer un diferente juego de estmulos. Una lista posible podra incluir un compartimiento que contuviese un dispensador lleno de alimento que se elevase; un compartimiento que contuviese un tubo lleno de agua; un compartimiento que contuviese una rueda de actividad; un compartimiento que contuviese la entrada a un laberinto; un pequeo compartimiento vaco; un compartimiento grande vaco; un compartimiento en el cual la entrada de la rata encendiese un juego de luces y figuras en la pared; un compartimiento en el cual la entrada de la rata encendiese una grabacin de ruidos a un nivel moderado; un compartimiento en el cual la entrada de la rata encendiese una grabacin de ruidos a un nivel extremadamente alto; un compartimiento en el cual la entrada de la rata encendiese un bao de agua fra; un compartimiento en el cual la entrada de la rata encendiese una bocanada de aire caliente; y finalmente, un compartimiento con un piso con rejilla electrificada.

Tambin aqu podramos esperar observar caminata, corrida, lamida o acicalamiento, orinar o defecar. Pero tambin podramos empezar a encontrar la probabilidad con la cual podra presentar otras respuestas que dependen ms directamente de estmulos especficos en el ambiente. La rata podra presumiblemente pasar algn tiempo alimentndose del dispensador, tomando agua del tubo, corriendo en la rueda de actividad, o explorando el laberinto. Despus de algunos das podra empezar a dormir de manera consistente en el pequeo compartimiento vaco, pero podra quizs pasar muy poco tiempo en el compartimiento grande vaco. La rata tambin podra pasar un tiempo viendo y escuchando en los compartimientos con luces y niveles moderados de ruidos. Y despus de unas cuantas visitas, probablemente rara vez visitara los compartimientos con ruidos altos, bao de agua fra, aire caliente, o parrilla electrificada.

Jerarquas del comportamiento

Podemos asumir que la rata aprendera lo que la lleva a cada compartimiento, pero nuestro mayor inters sera evaluar la probabilidad con la que la rata se expondra a los estmulos en diferentes compartimientos en tiempos diferentes. Sobre esta base, podramos describir el comportamiento de la rata en trminos de una jerarqua de respuestas. Por ejemplo, la rata podra alimentarse a una hora especfica del da, y podra comnmente tomar agua despus de comer. As, en ese momento el comer estara alto en la jerarqua y el tomar agua estara despus; entonces las otras respuestas, tales como correr en la rueda de actividad, seguiran. La organizacin del comportamiento en trminos de las probabilidades relativas de diferentes respuestas han sido referidas como jerarqua de hbitos (Hull, 1943). Como veremos, una de las caractersticas esenciales del aprendizaje es la modificacin de las posiciones de diferentes respuestas en tal jerarqua. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

La descripcin del comportamiento en trminos de jerarquas restringidas solamente a aqullas respuestas que hemos tornado disponibles todava deja fuera algunos aspectos del comportamiento del organismo. Por ejemplo, del comportamiento de la rata en el rea podramos no encontrar nada acerca de su comportamiento social o sexual. Para estudiar los efectos de otras ratas como estmulos, deberamos aadir ms compartimientos, algunos de ellos con individuos ratas machos, otros con individuos ratas hembras, y todava otros con grupos de tamaos diferentes de ratas de uno o ambos sexos.

La clasificacin de los estmulos

Sin embargo, sobre la base del comportamiento de la rata en la arena original podramos empezar a clasificar algunas de sus respuestas en trminos de las probabilidades de que la rata las presente. Encontraramos que en un perodo de tiempo la rata frecuentemente se coloca en situacin de presentar respuestas tales como comer, mientras que rara vez, si acaso, se coloca en situacin de presentar el salto y el chillido producido por una rejilla electrificada. Los estmulos que poseen estos diferentes efectos se han distinguido por nombres diferentes; los primeros son referidos como estmulos apetitivos o reforzantes, y los ltimos como estmulos aversivos o castigantes.

Pero tal caracterizacin an no est completa, porque la rata puede no exponerse a estmulos que no son aversivos si ocurre que esos estmulos tampoco son apetitivos. Tales estmulos podran referirse como neutrales. Por ejemplo, la rata podra rara vez entrar al compartimiento en el que las luces y las figuras son proyectados en la pared simplemente porque no es muy probable que vea tales estmulos. Nuestro inters no solamente debe ser con la probabilidad de que la rata se exponga a estmulos diferentes, sino tambin con la probabilidad de que finalizar tal exposicin una vez que ha iniciado. En este punto, es necesario que intervengamos; no podemos simplemente observar a la rata. Para evaluar la probabilidad de que la rata finalice su exposicin a los estmulos en cualquier compartimiento dado, debemos elegir a la rata y colocarla sucesivamente en cada compartimiento y observar qu tan rpido se retira. Podramos quizs tomar como lnea base -un punto de referencia- el tiempo que la rata toma para retirarse de los compartimientos vacos pequeo o grande. Relativo a esta lnea base, podramos probablemente encontrar que la rata se detiene un poco ms en los compartimientos con alimento y agua, pero se retira mucho ms rpido de los compartimientos con ruido alto y descarga elctrica.

Nuestra conclusin de tales observaciones es que los estmulos, y las diversas respuestas para las cuales proveen una oportunidad, no caen ordenadamente dentro de una triple clasificacin del ambiente en eventos apetitivos, neutrales y aversivos; al contrario, el ambiente ofrece un continuo de posibilidades Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

que abarcan de aqullas a las cuales es ms probable que el organismo se exponga, a aqullas con efectos relativamente indiferentes, hasta aqullas a las cuales no solamente es poco probable que el organismo se exponga, sino que es altamente probable que las finalice si se expone. Tambin podramos anticipar que el ordenamiento de estos eventos a lo largo del continuo cambia de tiempo en tiempo, as como el estatus de comer cambia como una funcin del tiempo transcurrido desde el ltimo alimento.

Es importante hacer notar que las caractersticas de los diferentes estmulos no pueden especificarse independientemente del comportamiento de la rata. Sabemos que el alimento es apetitivo o reforzante solamente en virtud del comportamiento de la rata con respecto al alimento; y sabemos que la descarga es aversiva o castigante solamente en virtud del comportamiento de la rata con respecto a la descarga. Solo a travs de nuestras observaciones del comportamiento podemos asegurar cual ser el efecto de un estmulo, y podramos incluso cambiar los efectos de un estmulo particular al manipular sus propiedades. Por ejemplo, la rata podra ocasionalmente exponerse a ruidos con niveles moderados en un compartimiento, pero rara vez exponerse a estos ruidos con niveles intensos en otro compartimiento. De esta manera, tendramos que concluir que los ruidos son reforzantes, neutrales, o aversivos, dependiendo de su nivel.

Operaciones y procesos

Hemos indicado que el comportamiento involucra relaciones entre estmulos y respuestas, y hemos visto que estas relaciones no pueden examinarse simplemente observando a un organismo. En algunas ocasiones debemos intervenir presentando estmulos al organismo. Una vez que hemos iniciado tal intervencin, debemos distinguir entre operaciones comportamentales y procesos comportamentales. Las operaciones son los procedimientos experimentales que pueden ser impuestos sobre el comportamiento; los procesos son los efectos comportamentales de estos procedimientos.

La operacin de elicitacin La presentacin de estmulos a un organismo es la operacin ms sencilla, y como resultado de esta operacin en el comportamiento, podramos observar cambios en las respuestas del organismo. Nos referimos a la presentacin de estmulos como una operacin de elicitacin, y el efecto de esta operacin es hacer ms o menos probables las respuestas particulares. (Consideraremos despus con ms detalle algunos de los efectos de la operacin de elicitacin).

Las operaciones consecuenciales de reforzamiento y castigo Sin embargo, algunas de las propiedades ms interesantes del comportamiento involucran no slo el efecto de eventos ambientales en el comportamiento, sino tambin el efecto del comportamiento en el Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

ambiente. Podemos arreglar que el comportamiento de un organismo tenga consecuencias. Por ejemplo, podramos presentar alimento a una rata hambrienta cada vez que la rata levantara sus patas traseras, o podramos presentar descarga cada vez que la rata se trasladara a una cierta rea del piso. En estas operaciones consecuenciales, discutidas posteriormente en las secciones de reforzamiento y castigo, el comportamiento puede cambiar no simplemente porque los estmulos son presentados al organismo, sino porque los estmulos son presentados en alguna relacin a su comportamiento.

Operaciones de control del estmulo Podemos complicar ms las cosas al sobreimponer otra operacin en elicitacin, en reforzamiento, o en castigo. Podemos arreglar que las operaciones ms sencillas estn en vigor solamente en la presencia de algn estmulo adicional. Nos referimos a tal procedimiento como una operacin de control del estmulo. Por ejemplo, este procedimiento podra ser sobreimpuesto en elicitacin arreglando que el alimento sea presentado a la rata slo cuando suena un timbre, o que una descarga sea presentada slo cuando una luz est encendida. O el procedimiento podra en su lugar ser sobreimpuesto en las operaciones consecuenciales de reforzamiento o castigo, de tal manera que las respuestas tendrn consecuencias slo en presencia de un estmulo particular: El alimento podra ser presentado a una rata siempre que se levanta sobre sus patas traseras, pero slo si lo hace cuando una luz verde est encendida. Como resultado de la operacin de control del estmulo, los cambios en el comportamiento producidos por las operaciones ms sencillas de elicitacin, reforzamiento, o castigo pueden llegar a ocurrir slo en presencia de los estmulos correlacionados con estas operaciones. Este resultado se refiere como el proceso comportamental de discriminacin.

Estas diversas operaciones, y los procesos comportamentales que resultan de ellas, constituyen las principales caractersticas de los experimentos en aprendizaje y condicionamiento, y ofrecen la organizacin bsica del presente captulo. Primero examinaremos brevemente algunos de los efectos de la presentacin de estmulos, y la operacin de elicitacin. Despus consideraremos las operaciones consecuenciales de reforzamiento y castigo, en las cuales los estmulos son presentados como una consecuencia del comportamiento del organismo. Finalmente, esquematizaremos la relacin de estas operaciones con la operacin de control del estmulo a manera de una introduccin a la cobertura ms detallada de algunos de estos procedimientos en captulos subsecuentes.

LOS EFECTOS DE LOS ESTMULOS

Cuando hablamos de estmulos y respuestas, frecuentemente invocamos el vocabulario del reflejo. Decimos que los estmulos producen respuestas, o que el comportamiento es una respuesta a los estmulos. Esta forma de hablar entr en nuestro lenguaje cotidiano, al menos en parte, como una Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

herencia de varias fuentes: fisiologa (e.g., Sherrington, 1906), los conceptos de Pavlov del reflejo condicionado (1927), y el conductismo inicial de Watson (1919). De estas fuentes provino la nocin de que el reflejo -la produccin confiable de una respuesta particular por un estmulo especfico- deba ser considerado como una unidad del comportamiento; el comportamiento complejo y el aprendizaje seran entonces reductibles a la combinacin de unidades reflejas.

Muchos reflejos son bien conocidos: La salivacin producida por alimento en la boca, el reflejo rotuliano producido por un pequeo golpe en el tendn patelar, la contraccin pupilar producida por una luz brillante, la reaccin de sorpresa producida por un ruido intenso sbito, y los ajustes posturales producidos por una prdida de soporte. La caracterstica comn de cada uno de estos ejemplos es que un estmulo especfico produce de manera confiable una respuesta particular. El reflejo en s mismo no es ni estmulo ni respuesta; en su lugar, es la relacin entre estos dos eventos (cf. Skinner, 1931). As, el reflejo salival es definido por la relacin entre alimento en la boca y salivacin. La respuesta salival, por s misma, no puede ser referida como un reflejo, porque no se ha especificado un estmulo elicitador.

Estmulos elicitadores y respuestas elicitadas

El concepto del reflejo posea una simplicidad tentadora, pero no se encontr adecuado para una descripcin exhaustiva del comportamiento. A pesar de que el enfoque contemporneo an trata el comportamiento en trminos de la relacin entre estmulos y respuestas, el reflejo es considerado como slo una relacin especializada entre muchas. En un reflejo, la presentacin de un estmulo dado produce una respuesta particular con gran confiabilidad. Pero el estmulo de ese reflejo puede tener efectos diferentes en otras respuestas, y la respuesta de ese reflejo puede ser afectada de manera diferente por otros estmulos. Cualquier estmulo puede elevar la probabilidad de algunas respuestas, disminuir la probabilidad de otras, y no tener efecto todava en otras. Cualquier respuesta puede tornarse ms probable por algunos estmulos, tornarse menos probable por otros, y no ser afectada todava por otros. Para especificar completamente la relacin entre un estmulo particular y una respuesta particular, debemos plantear qu tan probable es la respuesta en ausencia del estmulo y qu tan probable es cuando el estmulo es presentado.

Considere algunos ejemplos. Si observamos un perro por un perodo extendido de tiempo, podramos ver que se mueve ocasionalmente, levanta sus orejas, o ladra. Si presentamos alimento al perro, podramos ver que estas respuestas cesan e inicia el comer. Si entonces aplicamos una descarga a la pata delantera del perro, el perro dejar de comer, flexionar su pata, y posiblemente alle. Si en su lugar presentamos un ruido intenso, el perro de nuevo dejar de comer, pero esta ocasin podra levantar sus orejas y ladrar. El alimento, la descarga, y el ruido simultneamente elevan la probabilidad de algunas Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

respuestas y disminuyen la probabilidad de otras. Algunas de las respuestas pudiesen ocurrir con alguna frecuencia an en la ausencia de estos estmulos, pero ninguna de las respuestas ocurrir necesariamente en cada ocasin que un estmulo dado es presentado. As, el reflejo, en el cual un estmulo particular eleva una respuesta especfica de baja frecuencia a virtualmente una ocurrencia cierta, es solamente una clase especial de relacin estmulo-respuesta.

Una descripcin ms general del comportamiento explica las observaciones de que las respuestas pueden ocurrir con frecuencias altas an en ausencia de cualquier estmulo identificable, y que sus frecuencias pueden ser modificadas por la presentacin de un estmulo. En cualquier momento, las respuestas disponibles pueden ser caracterizadas en trminos de una jerarqua comportamental; cuando un estmulo es presentado, su efecto inmediato es modificar esa jerarqua. Por ejemplo, cuando el perro estaba comiendo, el efecto de la descarga fue de elevar la flexin de la pata y de disminuir el comer en sus posiciones relativas en la jerarqua.

La situacin puede en ocasiones ser ms complicada. Por ejemplo, si presentamos una bolita de alimento a una rata privada de alimento, la rata comer primero la bolita. Entonces tpicamente tomar agua si est disponible (Falk, 1961). De manera similar, si se aplica una descarga a un mono, morder cualquier objeto cercano a la que pueda hincar sus dientes. Entonces tpicamente manipular objetos, tales como palancas, que se encuentran disponibles en su cmara (Hutchinson, Renfrew, & Young, 1971). Las respuestas que de manera confiable siguen a otras respuestas que han sido elicitadas son referidas como comportamiento adjunto (Falk, 1971). Estos patrones secuenciales son propiedades adicionales de comportamiento elicitado que deben considerarse.

En resumen, entonces, las presentaciones de un estmulo proporcionan una operacin, llamada elicitacin, para modificar el comportamiento. Podemos cambiar lo que un organismo hace simplemente presentndole estmulos. Sin embargo, para poder decir de qu forma puede ser modificado el comportamiento, no es suficiente solamente catalogar los efectos de diferentes estmulos, porque estos efectos pueden variar con el nmero de presentaciones del estmulo y con el espaciamiento de estas presentaciones en el tiempo. Es en este punto que la operacin de elicitacin se vuelve relevante al estudio del aprendizaje: La respuesta producida por un estmulo en un momento puede depender de lo que le ha ocurrido al organismo previamente.

Efectos temporales de los estmulos

Si a una rata le presentamos bolitas de alimento y la rata se las come rpidamente, es muy probable que digamos que la rata estaba hambrienta. Si continuamos presentando las bolitas, la rata las come cada Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

10

vez ms lentamente hasta que eventualmente deja de comer completamente; en este punto podramos decir que la rata se ha saciado. La probabilidad con que estos estmulos (bolitas de comida) son seguidos por una respuesta particular (comer) disminuye con cada presentacin sucesiva del estmulo. Este proceso ha sido llamado saciedad, pero no slo se limita a estmulos tales como alimento y agua que el organismo consume. Una diversidad de otros estmulos tambin tienen este efecto en el comportamiento. Un perro levantar sus orejas con la presentacin de luces o sonidos, pero si continuamos estas presentaciones el perro pronto deja de responder. Un gato jugar con una pelota de hilo balanceada frente a l, pero el gato eventualmente se dirige a otros objetos. Y un nio puede pasar un largo perodo de tiempo con un juguete nuevo, pero finalmente la novedad se acaba.

Figura 2.1. Diversos efectos temporales de la operacin de elicitacin. Las flechas indican las presentaciones del estmulo. Se ilustran en A, B y C los efectos comnmente referidos como adaptacin o habituacin: La respuesta disminuye con presentaciones repetidas del estmulo (con estmulos consumibles tales como alimento o agua, el fenmeno es comnmente llamado saciedad). Los efectos comnmente referidos como sensibilizacin o facilitacin se ilustran en D, E y F: Las respuestas se incrementan con presentaciones repetidas del estmulo. En ambos casos el tiempo transcurrido desde la ltima presentacin del estmulo tambin influye en la respuesta. En el primero, en el cual el tiempo transcurrido es a veces llamado perodo de privacin, la respuesta se incrementa a medida que el tiempo transcurre sin presentaciones del estmulo; en el ltimo, la respuesta se decrementa.

Este proceso, el decremento en la respuesta con presentaciones repetidas de un estmulo, ha sido llamado de diferentes formas dependiendo de los estmulos involucrados. Ha sido llamado saciedad con Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

11

respecto a estmulos consumibles, pero con respecto a otros estmulos ha sido ms comnmente llamado adaptacin o habituacin. A pesar de que las distinciones entre estos trminos poseen una larga historia, algunas veces involucrando intereses fisiolgicos, no est claro que las distinciones tengan importancia comportamental. El fenmeno se ilustra en las Figuras 2.1 A a 2.1 C. La respuesta inicia a niveles diferentes en cada uno de los tres ejemplos, pero en cada caso la respuesta declina con presentaciones sucesivas del estmulo.

El proceso de saciedad o adaptacin parece ser un efecto caracterstico de la presentacin de la mayor parte de los estmulos apetitivos o reforzantes, y posiblemente tambin de algunos estmulos considerados como neutrales. Otros estmulos tienen efectos diferentes. La primera presentacin de una descarga elctrica puede producir menor respuesta que presentaciones subsiguientes (e.g. Badia, Suter, & Lewis, 1966; Hutchinson, Renfrew, & Young, 1971). Este proceso parece ser un efecto caracterstico de la presentacin de estmulos considerados como aversivos o castigantes. Esta base para la distincin entre diferentes clases de estmulos tambin es apoyada por evidencia indirecta. Por ejemplo, los organismos en experimentos que involucran estmulos aversivos (e.g. evitacin) tpicamente pasan por un perodo de calentamiento al inicio de cada sesin experimental; durante este tiempo, el estmulo aversivo es menos efectivo de lo que lo es ms adelante en la sesin.

Un incremento en la respuesta elicitada con presentaciones sucesivas del estmulo no tiene un nombre bien establecido. Algunas veces ha sido llamado sensibilizacin (pero el trmino ha sido tambin aplicado a casos en los cuales las presentaciones de un estmulo incrementan el efecto elicitante de algn otro estmulo); el trmino facilitacin puede tambin ser apropiado. El fenmeno se ilustra en las Figuras 2.1 D a 2.1 F. La respuesta aumenta a una razn diferente cada uno de los tres ejemplos, pero en cada caso aumenta con presentaciones sucesivas del estmulo.

Los procesos de adaptacin y sensibilizacin sern indudablemente ms explorados en investigacin futura. Por lo pronto, es suficiente hacer notar que la probabilidad con la que un estmulo particular produce una respuesta especfica depende no solamente de qu se trata el estmulo, sino tambin en la exposicin previa del organismo a ese estmulo.

Las presentaciones repetidas de un estmulo modifican el grado al que un estmulo produce respuestas. Pero en la ausencia subsiguiente de ese estmulo, la tendencia a responder puede retornar a valores anteriores. La rata cuya alimentacin ha cesado despus del consumo de muchas bolitas de alimento comer de nuevo si las bolitas se suspenden por un perodo de tiempo. La probabilidad de que coma y el nmero de bolitas que comer antes de dejar de comer depende de cunto tiempo ha transcurrido desde su ltima comida. Esta propiedad de las presentaciones del estmulo est ntimamente relacionada con el Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

12

proceso de saciedad o adaptacin. La probabilidad de la respuesta disminuye con presentaciones repetidas del estmulo, pero aumenta con el paso del tiempo desde la ltima presentacin del estmulo, como se ilustra en las Figuras 2.1 A a 2.1 C. La operacin de la suspensin del estmulo es referida como privacin. Desafortunadamente, no existe un trmino que corresponda precisamente al proceso que resulta de esta operacin. Trminos disponibles, tales como impulso, comnmente implican estados inferidos del organismo y tienden a distraer acerca de los eventos crticos que ocurrieron en el pasado del organismo.

Nuevamente, pueden mantenerse las relaciones inversas para estmulos que producen sensibilizacin ms que adaptacin. Por ejemplo, las respuestas producidas por descarga pueden convertirse en menos probables a medida que el tiempo transcurre desde la ltima descarga (cf. Figuras 2.1 D a 2.1 F). Pero, de nuevo desafortunadamente, no existen todava datos no ambiguos que pudiesen permitir tal generalizacin acerca del comportamiento. El anlisis del comportamiento se simplificara si los diversos efectos temporales descritos aqu fueran correlacionados con las categoras de eventos apetitivos y aversivos que fueron derivados de las jerarquas comportamentales discutidas previamente (i.e. la probabilidad de que el organismo inicie o finalice diferentes comportamientos). Pero este asunto tambin debe aguardar a experimentacin futura.

La naturaleza de la motivacin

Hemos indicado que las probabilidades de la respuesta pueden ser alteradas por presentaciones sucesivas de un estmulo. Esta propiedad del comportamiento proporciona otros medios para la modificacin del comportamiento. Retornemos a la rata en su rea. Podramos notar que el comer y tomar agua son altamente probables a una hora particular del da, pero el correr en la rueda de actividad es menor. Sin embargo, si retiramos la rueda y as privamos a la rata de una oportunidad de correr en ella, podemos encontrar al presentar despus la rueda a la rata que ahora es ms probable que corra a que coma o tome agua. La operacin de la privacin hace posible alterar la jerarqua comportamental en un tiempo dado. Podemos hacer el correr ms probable que el comer, o el tomar agua ms probable que el correr, dependiendo de la exposicin previa del organismo a los estmulos en presencia de los cuales estas respuestas ocurren. Bajo cada una de estas diferentes condiciones, podemos describir las probabilidades de diferentes respuestas en trminos de su estatus relativo a otras respuestas en la jerarqua. Veremos despus que este tipo de descripcin incide en los efectos de operaciones consecuenciales en las cuales las respuestas tienen un efecto sobre el ambiente.

En los captulos anteriores, la significacin de los estmulos era cambiada por las condiciones bajo las cuales los estmulos eran presentados. Tales cambios son el inters bsico del estudio de la motivacin Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

13

(cf. Cofer & Appley, 1964): Los estmulos pueden ser hechos ms o menos reforzantes, o ms o menos aversivos, dependiendo de tales factores como el tiempo transcurrido desde su ltima presentacin. Sin embargo, la significacin de los estmulos puede ser cambiada por otras operaciones aparte de la privacin. En el fenmeno llamado impronta (ver Captulo 9), por ejemplo, un estmulo adquiere su significacin para un organismo simplemente en virtud de su presentacin en un perodo particular en la vida de un organismo. Una cra de pato ordinariamente ve a su madre durante las horas siguientes de salir del cascarn y en adelante se mantiene cerca de su madre; pero si algn otro estmulo en movimiento es sustituido por la madre pato durante este perodo crtico despus de salir del cascarn, la cra de pato puede despus seguir ese estmulo en lugar de su madre (Hess, 1959). Una vez que un estmulo ha adquirido propiedades reforzantes a travs de la impronta, el seguimiento puede ocurrir porque tiene la consecuencia de mantener este estmulo cerca (Peterson, 1960).

El ejemplo de la impronta es de especial inters porque ilustra otro efecto de la operacin de elicitacin. La explicacin de otros procedimientos motivacionales, tales como la intervencin fisiolgica, est ms all de la esfera de este captulo, pero algunos mtodos para alterar la significancia de los estmulos son tratados en los Captulos 5 y 8.

El papel del ejercicio

Hemos resumido diversos efectos de las presentaciones de un estmulo. Un ltimo efecto posible de la operacin de elicitacin debe mencionarse antes de pasar a las operaciones consecuenciales de reforzamiento y castigo. El efecto no est bien documentado, posiblemente porque ha sido ensombrecido por los fenmenos de aprendizaje que consideraremos despus. Pero a pesar de la sorprendente escasez de evidencia, puede ser de significado fundamental para un anlisis del comportamiento. Los primeros trabajos en aprendizaje (e.g., Thorndike, 1913) con frecuencia se refirieron a la importancia de ocurrencias repetidas de una respuesta, descrita en trminos de leyes de ejercicio o prctica. A pesar de que el fenmeno ha sido descuidado, puede todava probar ser el caso de que la produccin repetida de una respuesta por un estmulo hace esa respuesta ms probable an en ausencia del estmulo. Por ejemplo, en un ambiente experimental dado un perro puede al principio salivar slo cuando el alimento es presentado, pero despus de varias presentaciones el perro puede tambin salivar en ausencia de alimento (e.g., Zener & McCurdy, 1939). Tal respuesta ha sido llamada salivacin espontnea; no puede ser tomada como reflejo, porque no existe un estimulo elicitante identificable. Otro ejemplo proviene de experimentos interesados en estmulos aversivos, especialmente aquellos que involucran evitacin. Estos experimentos con frecuencia parecen ser diseados para sacar provecho del mismo fenmeno, as como el salto de obstculo es elegido como una respuesta de evitacin con ratas porque la descarga las hace saltar; una vez que el saltar ha sido producido por la descarga, es probable que ocurra en otras Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

14

ocasiones cuando la descarga est ausente. Finalmente, existe evidencia que el picoteo de un pollo no slo depende de las condiciones elicitantes o de las consecuencias de picoteos previos, sino tambin es afectado por qu tanto picoteo el polluelo ya ha presentado (Hogan, 1971).

Es slo una suposicin que este efecto de presentaciones repetidas del estmulo puede ser la propiedad general del comportamiento. Si la suposicin es correcta, el fenmeno ser eventualmente descrito, analizado, y formulado en trminos considerablemente diferentes de las leyes clsicas de ejercicio y prctica. Sin embargo, no podemos ignorar la posibilidad de que la elicitacin de respuestas por un estmulo hace ms probables estas respuestas an en ausencia del estmulo. En trminos que sern ms familiares despus, la elicitacin de una respuesta puede elevar la probabilidad de su emisin subsecuente. El proceso, en trminos de las operaciones necesarias para producirla, es sin lugar a duda el ms sencillo que puede entrar en ejemplos de aprendizaje. LAS CONSECUENCIAS DE LA RESPUESTA

Un organismo no es pasivamente dirigido por los estmulos. Los estmulos pueden afectar su comportamiento de momento a momento, pero su comportamiento afecta a su vez el ambiente. Simplemente al moverse, el organismo cambia la porcin del ambiente que confronta. El comportamiento tiene consecuencias, y es un factor importante del comportamiento el que pueda ser modificado por sus consecuencias. Una rata que encuentra alimento en un lugar particular tiene ms probabilidad de dirigirse hacia ese lugar en ocasiones subsecuentes cuando est privada de alimento. Una rata que encuentra una descarga elctrica en otro lugar tiene ms probabilidad de mantenerse lejos de ese lugar.

En estos casos las operaciones no solo involucran la presentacin de estmulos, sino la presentacin de los estmulos con alguna relacin al comportamiento. El experimentador arregla el ambiente de tal manera que ciertos eventos sigan a ciertas respuestas emitidas por el organismo. Una rata puede encontrar agua en una caja meta despus de recorrer un laberinto; un pichn puede producir alimento al picotear un disco iluminado; un mono puede tener una oportunidad de ver otros monos cada vez que presiona una palanca; un nio puede obtener un dulce al colocar monedas en una mquina dispensadora. En cada uno de estos casos las respuestas tienen consecuencias, y estas consecuencias pueden hacer las respuestas ms probables en el futuro.

La ley del efecto

El efecto de las consecuencias de la respuesta en respuestas subsiguientes fue estudiado experimentalmente por Thorndike (1898), y fue descrito en trminos de un principio que l llamo Ley del Efecto. Esta ley sufri muchas revisiones, pero su esencia era que el comportamiento poda ser Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

15

fortalecido por algunas consecuencias y debilitado por otras. La Ley del Efecto estaba basada en experimentos con animales en cajas problema, cajas de las cuales los animales podan escapar al operar un pestillo. En un ejemplo tpico, un gato hambriento era colocado dentro de la caja con un pescado a la vista desde fuera. En sus diversas actividades dentro de la caja, el gato eventualmente operaba el pestillo y estaba libre para comerse el pescado. Las condiciones eran repetidas, y despus de una cantidad de ensayos el gato aprenda a operar el pestillo ms y ms rpidamente. El operar el pestillo inici como una respuesta de baja probabilidad, pero su probabilidad increment despus de varias ocasiones dio al gato la oportunidad de comerse el pescado. Se muestran datos de la caja problema, presentados de dos formas, en la Figura 2.2.

Este proceso, el cual por un tiempo fue llamado aprendizaje por ensayo y error, fue examinado con diferentes organismos en muchas variaciones. Una descripcin de las cajas problema, laberintos, pasillos rectos, plataformas de salto, y otros mecanismos (e.g., Hilgard, 1951) que fueron empleados en el estudio del aprendizaje est ms all del mbito de la presente explicacin. Sus diseos fueron con frecuencia determinados por intereses tericos, tales como si es que el aprendizaje era discreto o continuo, si el organismo aprenda patrones motores (aprendizaje de la respuesta), o si las consecuencias de la respuesta eran necesarias para el aprendizaje o slo permitan al organismo comportarse de acuerdo con lo que haba aprendido de otras maneras. Algunas de estas cuestiones se sostienen de inters experimental y terico (e.g., Goldstein, Krantz, & Rains, 1965).

Figura 2.2. Dos formas de graficar una curva de aprendizaje en el desempeo de un gato en una caja problema. En A, el tiempo para escapar de la caja se grafica como funcin de los ensayos. En B, el tiempo se acumula horizontalmente, y los ensayos sucesivos se representan verticalmente como pasos Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

16

acumulativos. En el primer caso, el desempeo se muestra como un decremento variable en la medida temporal. En el segundo caso, se muestra como una curva, cuya pendiente corresponde a los escapes sucesivamente mas rpidos (Woodworth & Schlosberg, 1954).

Sin embargo, la caracterstica esencial de estos diversos diseos experimentales era que el comportamiento poda tornarse ms probable cuando tena ciertas consecuencias. El cambio en la probabilidad de la respuesta fue medido de diferentes formas por diferentes investigadores, dependiendo de los mecanismos empleados y de los propsitos del experimento. Las medidas contribuyeron a las curvas de aprendizaje, grficas que muestran cmo es que el comportamiento cambi en el curso de un experimento: El tiempo para escapar de una caja problema como una funcin de los ensayos; el porcentaje de vueltas correctas como una funcin del nmero de recorridos en un laberinto; o la proporcin de animales que alcanzaron un criterio de desempeo exitoso en etapas sucesivas de entrenamiento. Pero la forma de la curva de aprendizaje dependa tanto de cul instrumento era empleado y cules medidas eran tomadas que ninguna descripcin cuantitativa de la progresin del aprendizaje era satisfactoria.

Una dificultad era que los desempeos estudiados en estos experimentos de aprendizaje eran complicados. El perodo de tiempo en el cual las entradas a pasillos ciegos era eliminado a medida que la rata aprenda a negociar un laberinto no necesariamente mostraba cmo es que el aprendizaje prosegua en un punto particular del laberinto. Una medida de desempeo promedio del progreso de un grupo de animales no era necesariamente representativa del desempeo de ningn animal individual en el grupo. Y an una medida relativamente sencilla, tal como la velocidad del correr en un pasillo recto, poda ser afectada por factores irrelevantes tales como la direccin hacia la cual el animal estaba orientado cuando un ensayo iniciaba, rastros de olor dejados por otros animales, el espacio disponible para que el animal desacelerara en la caja meta sin golpear su cabeza contra la pared, o la forma en que el animal era manipulado entre ensayos cuando el experimentador lo regresaba de la caja meta a la caja de inicio del pasillo.

Una solucin a estos problemas requera al menos dos innovaciones experimentales: El diseo de un instrumento en el cual el organismo pudiese emitir repetidamente una respuesta de fcil especificacin sin intervencin del experimentador; y la medicin de la respuesta directamente en trminos de la razn de frecuencia, ms que indirectamente en trminos de otras medidas que eran derivadas o de secuencias complejas de respuestas o del comportamiento de grupos de organismos. Estas fueron las caractersticas de un enfoque de investigacin iniciado por Skinner (1930, 1938; ver tambin a Skinner, 1950, 1956).

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

17

En un arreglo tpico, una rata privada de alimento es colocada en una pequea cmara. De una pared sobresale una palanca que puede ser presionada por la rata y un comedero en el cual se pueden entregar bolitas de alimento (pellets). Una vez que la rata se ha dirigido a comer pellets del comedero, el instrumento es arreglado de tal manera que la entrega de las bolitas depende de los palanqueos: El palanqueo as ofrece a la rata una oportunidad de comer. En un arreglo anlogo para el pichn, la pared de la cmara contiene un disco pequeo, o tecla, que puede ser iluminado desde atrs y una hendidura dentro de la cual puede ser presentada al pichn una bandeja con grano mixto. Puede entonces arreglarse que los picoteos en la tecla ofrezcan al pichn una oportunidad de comer grano. Bajo estas circunstancias, la oportunidad de comer puede emplearse para elevar la probabilidad del palanqueo de la rata o el picoteo de tecla del pichn, tal como era empleada para elevar la probabilidad de la operacin del gato del pestillo de una caja problema.

Algunas de las ventajas de estos arreglos y la importancia de la medicin de respuestas en trminos de su frecuencia o razn sern consideradas de nuevo en el Captulo 6. Por lo pronto, ser suficiente hacer notar que todo lo que estos arreglos experimentales tienen en comn es que las consecuencias siguen al comportamiento y que el comportamiento subsiguiente puede ser modificado por estas consecuencias.

El principio del reforzamiento

Los palanqueos de una rata privada de alimento se hacen ms frecuentes cuando estos palanqueos producen bolitas de alimento. Este ejemplo ilustra el principio del reforzamiento, el cual plantea que la respuesta se incrementa cuando es seguida de estmulos reforzantes. El principio es relativamente sencillo, pero durante su evolucin de la Ley del Efecto inicial de Thorndike a su estado actual ha trado con l una cantidad de problemas de lenguaje y lgica (Catania, 1969). Estos problemas deben ser tratados antes de que puedan examinarse algunas de las propiedades empricas del reforzamiento.

El vocabulario del reforzamiento Consideramos primero el vocabulario del reforzamiento, el cual incluye el trmino reforzador como estmulo y el trmino reforzamiento como operacin. Un estmulo reforzante, tal como la bolita de alimento presentada a la rata privada de alimento, es llamada reforzador. El reforzamiento, sin embargo, no es ni un estmulo ni una respuesta. En su lugar, el reforzamiento es la operacin de presentar un reforzador cuando una respuesta ocurre. Esta operacin es aplicada a respuestas, y por lo tanto hablamos de respuestas reforzadas, no organismos. As, podemos decir que el palanqueo de la rata produjo el reforzador, una bolita de alimento, o que el palanqueo de la rata fue reforzado con una bolita de alimento.

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

18

El trmino reforzamiento tambin ha sido aplicado con frecuencia al proceso que sigue de la operacin de reforzamiento, especficamente, el incremento en la frecuencia de la respuesta. Este doble empleo del trmino, como operacin y como proceso, complica la forma en la cual el comportamiento es descrito. Por ejemplo, la declaracin de que una respuesta fue reforzada puede significar tanto que la respuesta produjo un reforzador como que la respuesta increment en frecuencia como consecuencia de producir un reforzador. A pesar de que ambos usos son comunes en la literatura experimental, este captulo se restringir al primer uso, aqul del reforzamiento como operacin. El proceso que sigue de esta operacin es descrito concretamente en trminos de los cambios en la frecuencia de una respuesta, y de esta manera existe poca justificacin para sustituir otra terminologa por una descripcin directa en trminos de cambios de frecuencia (cf. Catania, 1968).

Sin embargo, an si el trmino reforzamiento se restringe a una operacin experimental, este vocabulario lleva a algunas dificultades lgicas. Cuando una respuesta produce un estmulo y as aumenta en frecuencia, se dice que el estmulo es un reforzador y que la respuesta es reforzada. Si nos preguntan cmo es que sabemos que el estmulo era un reforzador, nos apoyamos en el aumento en frecuencia de la respuesta. Si entonces nos preguntan por qu la respuesta increment en frecuencia, decimos que lo hizo porque fue reforzada. Es claro que en algn punto empezaremos a repetirnos; no podemos definir al mismo tiempo un estmulo reforzante en trminos de su efecto en el comportamiento y el efecto del comportamiento en trminos del estmulo reforzante.

El problema de la circularidad en la definicin puede ser resuelta en una variedad de formas (cf. Meehl, 1950). Es primero importante reconocer que la funcin del trmino reforzamiento es descriptivo ms que explicatorio. El trmino nombra una cierta relacin entre comportamiento y ambiente; no explica esta relacin. Sera inapropiado, por ejemplo, decir que porque una respuesta aument en frecuencia la respuesta debe haber sido reforzada; el incremento pudo haber ocurrido por otras razones (e.g., la respuesta pudo haber sido elicitada por un estmulo). En su lugar, debemos mostrar que la respuesta aument en frecuencia porque la respuesta produjo un estmulo. Una vez que hemos logrado esto, podemos describir estas circunstancias diciendo que la respuesta fue reforzada y que el estmulo fue un reforzador.

Tambin podemos hacer la conjetura de que el estmulo continuar funcionando como un reforzador en el futuro, y que reforzar otras respuestas en otras situaciones.

Este supuesto, sin embargo, puede ser incorrecto. Es concebible que ciertos estmulos pueden ser reforzadores con respecto a ciertas respuestas pero no con respecto a otras. Por ejemplo, si el palanqueo de una rata nos lleva a la conclusin de que las bolitas de alimento son reforzadores, no Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

19

necesariamente seguir que las bolitas de alimento aumentarn la frecuencia con la cual la rata cruza una rejilla electrificada. Sin embargo, tales posibilidades son al menos susceptibles a la prueba emprica, y permanece como dato bien establecido el que los reforzadores empleados en la mayor parte de las situaciones experimentales son reforzadores efectivos con respecto a una variedad de respuestas.

Las propiedades de los reforzadores A pesar de que tales consideraciones pueden apoyar la lgica del vocabulario del reforzamiento, esta formulacin todava no ofrece un medio para identificar los reforzadores independientemente de sus efectos en la operacin de reforzamiento. Sin convertir un estmulo particular como una consecuencia de la respuesta, no es posible decir si el estmulo ser o no un reforzador. An aqullos estmulos que se ha demostrado son reforzadores, tales como alimento y agua, pueden ser efectivos o no efectivos dependiendo de la privacin. La entrega de alimento o agua siempre que una rata presiona una palanca no elevar la probabilidad del palanqueo si el alimento y el agua estn continuamente disponibles an cuando esta respuesta no ocurre. (Tales circunstancias fueron discutidas anteriormente en trminos de motivacin: Podemos ahora definir el estudio de la motivacin con mayor precisin como un inters con los factores que hacen a los estmulos ms o menos efectivos como reforzadores o como castigadores).

Los estmulos reforzantes existen en gran variedad. Algunos estmulos reforzantes son consumibles; otros no. Algunos son efectivos slo si el organismo entra en contacto fsico con ellos; otros son efectivos an a distancia. Algunos parecen ser efectivos en el primer contacto del organismo con ellos; otros parecen adquirir sus propiedades reforzantes durante la vida del organismo (ver Captulo 5). No es por lo tanto razonable esperar que los reforzadores sean identificables, independientemente de sus efectos comportamentales, sobre la base de cualquier caracterstica fsica comn.

Sin embargo, es posible que las propiedades reforzantes de un estmulo estn correlacionadas con otros efectos comportamentales de ese estmulo. Ya hemos indicado que las probabilidades con las que los estmulos producen respuestas pueden variar con presentaciones sucesivas del estmulo, de acuerdo a los procesos de adaptacin o sensibilizacin. Estos procesos parecen distinguir clases de estmulos, y puede ser que estn relacionados con propiedades reforzantes.

Hasta aqu hemos hablado de estmulos reforzantes, pero el posible involucramiento de procesos temporales tales como adaptacin en la funcin de estos estmulos sugiere que nuestra explicacin estar incompleta si no tratamos tambin con las respuestas producidas por estos estmulos. El palanqueo de una rata produce alimento, y el alimento proporciona a la rata una oportunidad de comer. Sabemos que si hicisemos disponibles a la rata tanto la palanca como el alimento de manera simultnea, sera ms probable que la rata comiera a que presionara la palanca. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

20

Este tipo de observacin lleva a la conclusin, formulada por Premack (1959), que la probabilidad de una respuesta aumentar si produce un estmulo que ofrece al organismo una oportunidad para presentar una respuesta an ms probable. De acuerdo a esta explicacin, el alimento es un reforzador efectivo para los palanqueos de la rata privada de alimento simplemente porque el comer es ms probable que el palanqueo.

La relatividad del reforzamiento Premack ha demostrado este principio en una variedad de experimentos. Uno de stos (Premack, 1962) muestra cmo es que los reforzadores pueden ser revertidos al variar independientemente las probabilidades de dos respuestas. El correr de una rata en una rueda de actividad era controlado al accionar o liberar un freno en la rueda, y era medido en trminos de la frecuencia de las revoluciones de la rueda. El tomar agua de la rata de un tubo era controlado por la introduccin del tubo en, o retirarlo de una apertura en una pared estacionaria a un lado de la rueda, y era medido por un sistema elctrico, un medidor de la cantidad de agua bebida, que contaba los lamidos. Despus de que la oportunidad de correr de la rata haba sido restringida mientras el agua permaneca disponible, el correr se convirti ms probable que el tomar agua. Despus de que el acceso de la rata al tubo fue restringido mientras que el correr libremente era permitido en la rueda, el tomar agua se convirti ms probable que el correr. Fue entonces mostrado, en cada uno de estos casos, que una oportunidad de presentar la respuesta ms probable podra ser empleada para incrementar la frecuencia de la respuesta menos probable. Cuando el correr era ms probable que el tomar agua, el tomar agua se hizo ms frecuente si liberaba el freno en la rueda y permita a la rata correr que si no hubiese consecuencia con respecto al correr. Inversamente, cuando el tomar agua era ms probable que el correr, el correr se hizo ms frecuente si introduca el tubo y permita a la rata tomar agua que si no tuviese consecuencia con respecto al tomar agua.

La implicacin de esta demostracin es que los reforzadores no pueden ser definidos independientemente de las respuestas que son reforzadas. La mayora de los experimentos restringen su atencin a respuestas que ocurren con relativa poca frecuencia y a reforzadores que presentan la ocasin para respuestas altamente probables. A pesar de ser experimentalmente tanto comunes como convenientes, estos son casos especiales. Nos referiremos, en el texto subsecuente, a estos reforzadores simplemente como estmulos. Pero no deberamos olvidar que, de acuerdo a esta explicacin, los reforzadores son relativos, no absolutos; sus caractersticas importantes no descansan en sus propiedades como estmulos, sino en las respuestas para las cuales ofrecen una oportunidad.

La relatividad de la relacin del reforzamiento puede ser ilustrada al considerar tres diferentes respuestas en lugar de slo dos. Suponga que un dispensador de bolitas de alimento es aadido a la rueda de Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

21

actividad y el tubo del experimento precedente, y que, por operaciones adecuadas de privacin, el comer es hecho ms probable que el correr, el cual a su vez es hecho ms probable que el tomar agua. Bajo estas circunstancias, el correr aumentara en frecuencia si produjese una oportunidad para comer, pero al mismo tiempo el tomar agua aumentara en frecuencia si produjese una oportunidad para correr. Con respecto al comer, el correr es la respuesta reforzada, pero con respecto a tomar agua, una oportunidad de correr funciona como un reforzador.

Hablamos anteriormente del comportamiento como una jerarqua. El ordenamiento de respuestas dentro de esta jerarqua vara con el paso del tiempo, con los estmulos que son presentados al organismo, y con la oportunidad del organismo de involucrarse en las diferentes respuestas que forman la jerarqua. Al restringir la oportunidad del organismo de participar en ciertas respuestas en esta jerarqua, o , en otras palabras, por operaciones de privacin, hacemos estas respuestas ms probables y as podemos emplear la oportunidad de involucrarse en ellas para elevar la probabilidad de otras respuestas que estn ms bajas en la jerarqua. El reforzamiento no es una explicacin; es el nombre de la operacin que tiene este efecto.

Reforzamiento positivo y negativo

Previamente en esta explicacin, cuando sugerimos formas en las cuales podan ser clasificados los eventos ambientales, consideramos no slo la probabilidad con la cual el organismo se expona a los estmulos, sino tambin la probabilidad con la cual el organismo finalizaba tal exposicin una vez iniciada. Una rata comnmente no se expone a una descarga elctrica, y una vez sacudida se retirara de la descarga si tuviese la oportunidad. Este tipo de estmulo es algunas ocasiones llamado aversivo, y la terminacin de un estmulo aversivo proporciona la base para otro tipo de operacin de reforzamiento.

La terminacin de un estmulo, as como su presentacin, puede ser tornada en una consecuencia de la respuesta. Si esta terminacin del estmulo hace la respuesta ms probable, se dice que el estmulo es un reforzador negativo y la operacin es llamada reforzamiento negativo. El reforzamiento positivo y el reforzamiento negativo, por lo tanto, se distinguen sobre la base de si un estmulo es presentado o retirado cuando una respuesta ocurre.

Escape y evitacin La operacin ms sencilla de reforzamiento negativo es algunas veces referida como un procedimiento Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

22

de escape. Por ejemplo regresemos una vez ms a la rata en el rea. Notamos que la rata pronto dejara de entrar al compartimiento con la rejilla electrificada en el piso. Pero la rata puede ser expuesta a la descarga elctrica simplemente colocndola en ese compartimiento. La construccin del rea entonces presenta el escenario para reforzamiento negativo: La rata puede escapar de la descarga al abandonar el compartimiento. En otras palabras, este instrumento est arreglado de tal manera que la terminacin de la descarga elctrica es una consecuencia de la respuesta locomotora de abandonar el compartimiento.

El movimiento de un lugar a otro con frecuencia ha sido la base para estudios experimentales de reforzamiento negativo, pero es posible sustituir respuestas que son ms discretas y de medicin ms fcil. Por ejemplo, si la salida del compartimiento est cerrada, una palanca puede ser introducida, la cual, cuando es presionada, apagar la descarga por un perodo de tiempo. En este ejemplo, as como en otros anteriores, el principio es el mismo: Se permite que una respuesta tenga una consecuencia particular y puede as aumentar en frecuencia.

Considere entonces los dos casos. En ausencia de alimento, una respuesta que produce alimento puede aumentar en frecuencia. En presencia de descarga, una respuesta que elimina la descarga puede aumentar en frecuencia. El paralelo es sencillo y directo. Sin embargo, a pesar de la naturaleza fundamental del reforzamiento negativo en el procedimiento de escape, no ha recibido tanta atencin experimental como procedimientos ms complejos que involucran estmulos aversivos. El grueso de la literatura sobre reforzamiento negativo est interesado con evitacin (cf. Herrnstein, 1969; Herrnstein & Hineline, 1966; ver tambin Captulo 7), en el cual las respuestas en ausencia de un estmulo aversivo previene o retardan la presentacin subsecuente del estmulo. En un procedimiento de evitacin, un estmulo neutral, tal como una luz, precede consistentemente la presentacin de una descarga, pero una respuesta en presencia de la luz apaga la luz y previene la presentacin subsecuente de la descarga. El desempeo generado por tal procedimiento es algunas veces interpretado en trminos de escape de un estmulo, la luz, que ha adquirido propiedades aversivas por virtud de su relacin con la descarga.

La razn por el descuido relativo del escape en la literatura experimental en reforzamiento negativo es clara: Respuestas tales como los palanqueos de ratas o los picoteos de pichones que son fcilmente elevados en frecuencia por reforzamiento positivo son con frecuencia difciles de afectar por reforzamiento negativo en procedimientos de escape. Esta diferencia en los resultados de operaciones de reforzamiento positivo y reforzamiento negativo se debe a que las relaciones temporales entre la respuesta reforzada y otras respuestas producidas por estmulos reforzantes son diferentes en los dos casos.

El papel de las respuestas elicitadas Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

23

En el reforzamiento positivo el reforzador est ausente en el momento en que la respuesta reforzada debe ocurrir. Cuando la respuesta ocurre, el reforzador es presentado y pueden entonces seguir otras respuestas producidas por el reforzador. Por ejemplo, si la respuesta reforzada es el palanqueo de una rata y el reforzador es alimento, el comer no puede ocurrir sino hasta que el palanqueo es completado y el alimento ha sido presentado; las respuestas de palanqueo y comer necesariamente ocurren en sucesin y no compiten directamente la una con la otra.

Sin embargo, en el reforzamiento negativo, el estmulo efectivo est presente en el momento en que la respuesta reforzada debe ocurrir. Slo despus de que la respuesta ocurre el estmulo es retirado. Por ejemplo, si la respuesta reforzada es un palanqueo y el reforzador negativo es una descarga, el palanqueo debe ocurrir en el momento en que la descarga est produciendo otras respuestas, quizs incompatibles. La descarga puede producir directamente salto, y puede tambin elevar la probabilidad de otras respuestas diferentes al palanqueo que reducen la descarga al cambiar el contacto de la rata con la rejilla electrificada. Estas respuestas permanecen altamente probables mientras la descarga est presente y por lo tanto reducen la probabilidad de palanqueo. Cuando el palanqueo ocurre, la descarga termina junto con las respuestas que genera. En este punto, las respuestas producidas por la descarga ya no compiten con el palanqueo. Sin embargo, en ausencia de la descarga, el palanqueo no puede ya ser reforzado negativamente porque no puede tener la consecuencia de terminar la descarga.

Esta explicacin sugiere que un criterio importante para distinguir reforzamiento positivo y negativo es si las respuestas producidas por el reforzador pueden ocurrir en un momento cuando pudiesen interferir con la respuesta reforzada. Por lo tanto, una distincin basada en la operacin de presentacin o retiro de estmulos puede ser de utilidad dudosa, porque cada una de esas operaciones es simplemente un cambio en el ambiente del organismo que pudiese afectar de manera diferente la probabilidad de diferentes respuestas en momentos diferentes.

Este punto se ilustra con un experimento de escape del fro (Weiss & Laties, 1961). Los palanqueos de una rata en un cuarto fro fueron reforzados por la operacin de una lmpara de calor, y los palanqueos en el fro aumentaron as en frecuencia. En un aspecto, puede decirse de este procedimiento que es un reforzamiento positivo, porque involucra la presentacin de un estmulo, calor, cuando un palanqueo ocurre. Por otra parte, a pesar de que el fro no es nada ms que ausencia de calor, puede funcionar como un estmulo a travs de su accin en los receptores de temperatura en la piel de la rata. De esta forma, puede tambin decirse del procedimiento que es un reforzamiento negativo, porque involucra la terminacin de los efectos de fro del estmulo cuando un palanqueo enciende la lmpara de calor.

La conclusin a que debe llegarse de este ejemplo es que la distincin entre reforzamiento positivo y Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

24

negativo es hasta cierto punto arbitrario. Sin embargo, a pesar de que pueden existir casos tales como escape del fro en el cual es difcil especificar si la operacin de reforzamiento involucra la presentacin o el retiro de un estmulo, la distincin puede tener significado comportamental. En este ejemplo, puede ser importante saber qu sucede con respuestas diferentes al palanqueo durante la operacin de reforzamiento. En el fro, la rata puede temblar, arrinconarse, o engarzarse en otras respuestas que reduzcan la probabilidad de presionar la palanca; slo despus de que el palanqueo es reforzado, cuando la lmpara de calor ha sido encendida, es que la competencia entre estas otras respuestas y el palanqueo termina. Por lo tanto, con respecto a las probabilidades de la respuesta antes y despus del reforzamiento, este caso parece ser mejor descrito como reforzamiento negativo ms que positivo.

Reforzamiento y castigo

Hasta el momento hemos considerado los casos en los cuales las consecuencias de una respuesta elevan la probabilidad de la respuesta. Pero tambin existen consecuencias de la respuesta que reducen la probabilidad de la respuesta. De hecho, las consecuencias de la respuesta pueden ser representadas de manera exhaustiva a lo largo de un continuo que abarca desde aqullas que elevan significativamente la respuesta, a aqullas que tienen poco o ningn efecto en la probabilidad de la respuesta (discutidas despus en la seccin sobre estmulos neutrales), hasta aqullas que reducen significativamente la probabilidad de la respuesta.

El vocabulario del castigo La operacin de arreglar la consecuencia de una respuesta que reduce la probabilidad de la respuesta es llamada castigo. El estmulo que es arreglado como una consecuencia es llamado punitivo. Por ejemplo, si es presentada una descarga elctrica cada vez que una rata presiona una palanca, se dice que el palanqueo es castigado y que la descarga es el castigador, porque el efecto de esta operacin es una reduccin en la frecuencia de los palanqueos. As, el vocabulario del castigo es paralelo al vocabulario del reforzamiento.

Un estmulo punitivo refiere al evento estmulo, y el castigo es una operacin. Pero as como el trmino reforzamiento ha sido aplicado en algunas ocasiones tanto a procesos como a operaciones, el trmino castigo tambin se le ha usado indistintamente para referir a procesos o a operaciones. Por lo tanto, en cierta literatura, la declaracin de que una respuesta fue castigada puede significar o que la respuesta produjo un punitivo o que la respuesta disminuy en frecuencia como resultado de producir un punitivo. As como en el reforzamiento, la explicacin presente restringir la aplicacin del trmino castigo al vocabulario de operaciones, y el proceso resultante ser descrito directamente en trminos de cambios en la frecuencia de la respuesta o probabilidad. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

25

Otro paralelo al vocabulario del reforzamiento es que las respuestas, no los organismos, se dice que son castigados. As, cuando el palanqueo de una rata produce una descarga, podemos decir que la rata fue sacudida pero que el palanqueo de la rata fue castigado. Superficialmente, esta distincin puede parecer tanto conceptualmente como gramaticalmente trivial, pero puede tener un efecto significativo en la precisin con la que observamos y describimos el comportamiento.

Considere un caso en el cual un nio se porta mal. Un padre llama al nio, y despus, cuando el nio llega, el padre le da una zurra al nio. Es conveniente decir simplemente que el padre castig al nio. Pero esta forma de hablar hace muy fcil omitir hacer mencin de las respuestas que pueden ser afectadas por la zurra. La consecuencia del mal comportamiento del nio fue que el padre llam al nio, y que el padre administr la zurra cuando el nio obedeci la llamada. As, a pesar de que la zurra puede afectar el mal comportamiento futuro del nio, es ms importante notar que el padre castig la aproximacin del nio a la llamada. Este tipo de observacin es ms probable que sea hecha cuando es necesario ser explcito acerca de la respuesta castigada (la aproximacin del nio al padre fue castigada por la zurra) que cuando una descripcin menos precisa es considerada como aceptable (el nio fue castigado por la zurra). El vocabulario de reforzamiento y castigo de respuestas no prejuzga los efectos de estas operaciones sobre el comportamiento; no presupone que los efectos de estas operaciones estarn restringidos solamente a las respuestas en las cuales las operaciones son ejecutadas. Sin embargo, los efectos comportamentales de estas operaciones pueden ser descritas fcilmente, y es por tanto ventajoso trabajar con un vocabulario de operaciones que exprese sin ambigedad las consecuencias del comportamiento.

La efectividad del castigo Ha sido una controversia prolongada el hecho de si el castigo es de hecho efectivo. La delaracin de que el castigo debilitaba la respuesta fue parte de las primeras versiones de la Ley del Efecto de Thorndike, pero fue abandonada en versiones posteriores. Solamente en aos recientes se ha acumulado suficiente evidencia como para reinstalar el castigo como una operacin efectiva para modificar el comportamiento (e.g., Azrin & Holz, 1966; Solomon, 1964). Las formas en las que el castigo puede afectar la respuesta se considerarn en detalle en el Captulo 7; por lo tanto, la explicacin presente solamente resume brevemente algunas caractersticas significativas del castigo y su relacin con otras operaciones.

La primera dificultad en el anlisis del castigo es que, para empezar, una reduccin en la frecuencia de la respuesta solamente puede ser estudiada si la respuesta posee una frecuencia considerable. Una respuesta que nunca es emitida no puede ser castigada. De esta forma, muchos experimentos sobre castigo proceden sobreimponiendo esta operacin en una respuesta que es mantenida por Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

26

reforzamiento. Por tanto, en un experimento dado, los efectos del castigo pueden depender en parte de cmo es reforzada la respuesta. Por ejemplo, los palanqueos de una rata pueden ser menos afectados cuando son castigados con descarga elctrica si la rata est severamente privada y sus palanqueos son reforzados con bolas grandes de alimento que si la rata est slo levemente privada y los palanqueos son reforzados solamente con bolitas pequeas de alimento.

Una segunda dificultad es que los estmulos efectivos como castigadores pueden afectar el comportamiento an cuando no son convertidos en una consecuencia de las respuestas. Por lo tanto, debe mostrarse que el efecto del castigo depende de la relacin entre respuestas y castigadores, y no simplemente de la entrega de castigadores. Por ejemplo, un pichn puede picotear una tecla con menos frecuencia cuando se presentan descargas ocasionales an si las descargas ocurren independientemente de los picoteos en la tecla. As, debe ser demostrado que las descargas tienen un mayor efecto cuando son producidas por picoteos en la tecla que cuando ocurren independientemente de los picoteos en la tecla (cf. Azrin, 1956).

Una tercera dificultad, y la que posiblemente tuvo las implicaciones mayores para el desarrollo histrico del anlisis del castigo, es que los efectos de esta operacin son temporales. Una vez que la frecuencia de una respuesta ha sido reducida por castigo, es probable que la frecuencia regrese a niveles anteriores cuando el castigo es descontinuado. Esta transitoriedad del efecto no es una propiedad sorprendente de un proceso comportamental y tiene su equivalencia en la transitoriedad de los efectos del reforzamiento. Como veremos despus en nuestra discusin de extincin, las respuestas que se han convertido en ms frecuentes a travs de reforzamiento se mantienen solamente si el reforzamiento contina; cuando el reforzamiento es descontinuado regresan a niveles anteriores.

Sin embargo, en la evolucin del anlisis del castigo, la transitoriedad de sus efectos fue enfatizada; por esta razn, el castigo fue por mucho tiempo no reconocido como una operacin con propiedades comportamentales fundamentales. De hecho, los procedimientos de castigo efectivos eran en ocasiones llamados por nombre diferente, evitacin pasiva. Cuando una respuesta era eliminada por castigo, se deca que el organismo estaba evitando pasivamente al castigador al retener la respuesta castigada. Con este uso, los procedimientos efectivos de castigo podan ser referidos en trminos del vocabulario de evitacin pasiva, mientras que los procedimientos restantes podan ser utilizados para defender la afirmacin de que el castigo era inefectivo.

Pero estas suposiciones han cedido a los hallazgos experimentales. El castigo es paralelo al reforzamiento, salvo que los efectos de las dos operaciones difieren en signo: El reforzamiento aumenta la frecuencia de la respuesta reforzada, mientras que el castigo disminuye la frecuencia de la respuesta Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

27

castigada. Los efectos de ambas operaciones disminuye con el tiempo despus de que las operaciones son descontinuadas.

Propiedades de los estmulos punitivos En la mayora de los experimentos sobre castigo, los estmulos que funcionan como punitivos son seleccionados por su efectividad confiable con respecto a una variedad de respuestas, porque tales estmulos revelan muy claramente los efectos del castigo. La descarga elctrica es un ejemplo de tal evento, y posee las ventajas adicionales de que puede ser medido adecuadamente y de que puede ser presentada a niveles que no lastiman al organismo. Sin embargo, tales estmulos representan slo ejemplos extremos de estmulos punitivos, y an estmulos que ordinariamente funcionan como reforzadores pueden convertirse en punitivos bajo ciertas condiciones. La autoadministracin de drogas, por ejemplo, puede tener consecuencias reforzantes hasta cierto punto, pero las drogas pueden convertirse en aversivas con la administracin continuada (as como cuando demasiados martinis enferman al bebedor, o cuando una dosis de LSD produce un mal viaje).

La implicacin de esta observacin es que, as como los reforzadores, los estmulos punitivos no pueden ser definidos en trminos absolutos, ni pueden ser identificados en trminos de propiedades fsicas comunes. Por el contrario, las propiedades de dichos eventos deben ser evaluadas en trminos de las respuestas que son castigadas y su relacin con las respuestas producidas por el estmulo punitivo.

Regresemos una vez ms a la caja experimental en donde el correr de una rata en una rueda de actividad y el tomar agua de un tubo pueden ser controlados. Anteriormente, mostramos cmo estas respuestas pueden ser utilizadas para ilustrar el principio del reforzamiento de Premack , el cual afirma que la probabilidad de una respuesta menos probable puede ser aumentada si esta respuesta produce una oportunidad para participar en una respuesta ms probable. Este tipo de anlisis, en trminos de probabilidades de respuesta, tambin ha sido extendido al castigo (Premack, 1971).

La relatividad del castigo Considere la siguiente modificacin en la caja experimental para correr y tomar agua de Premack. La rueda de actividad est comnmente bloqueada, pero un motor est unido a ella de tal manera que, cuando es operada, gira la rueda y as fuerza a la rata a correr. La operacin del motor puede entonces ser convertida en la consecuencia de alguna respuesta, tal como el presionar una palanca o el tomar agua del tubo.

El primer paso en este experimento es controlar las probabilidades relativas de correr y tomar agua. Se pueden arreglar dos condiciones: El correr puede ser convertido en ms probable que el beber privando a Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

28

la rata de una oportunidad de correr pero dndole libre acceso al agua, y el beber puede ser convertido en ms probable privando a la rata de agua pero dndole una oportunidad de correr.

El siguiente paso es convertir la operacin de la rueda una consecuencia del beber: Cada vez que la rata bebe, la rueda empieza a girar y la rata es forzada a correr. Cuando correr es ms probable que beber, el resultado de esta operacin es consistente con nuestra discusin anterior del principio del reforzamiento. La probabilidad de beber aumenta, y es por tanto apropiado describir esta operacin como el reforzamiento de beber por la actividad de correr. Sin embargo, cuando beber es ms probable que correr, la operacin tiene un efecto opuesto. La probabilidad de beber disminuye cuando correr es su consecuencia, y es apropiado describir la operacin como el castigo de beber por correr. As, en este ejemplo, una nica respuesta, beber, es o reforzada o castigada por una nica consecuencia, correr reforzado, dependiendo de las probabilidades relativas de estas respuestas en la jerarqua comportamental.

La reversibilidad potencial de las consecuencias como reforzadores o punitivos no es evidente en los estmulos empleados en la mayor parte de los experimentos en reforzamiento y castigo. Los estmulos reforzantes y punitivos son seleccionados de tal manera que las respuestas que producen estn representadas en los extremos de la jerarqua comportamental. Es ms probable que la rata privada de alimento coma, si se le presenta la oportunidad, a que participe en otras respuestas; y en el experimento tpico sobre reforzamiento con alimento, comer es convertido en una consecuencia de las respuestas, tales como palanqueo, que comnmente son de probabilidad relativamente baja. Por el otro lado, existen pocas circunstancias bajo las cuales una rata se colocar en posicin de participar en respuestas producidas por una descarga; y en el experimento tpico sobre castigo con descarga, el comportamiento elicitado por descarga es convertido en una consecuencia de respuestas, tales como palanqueo mantenido por reforzamiento, que comnmente son de probabilidad relativamente alta. Estos arreglos experimentales tpicos empaan la relatividad de reforzamiento y castigo y la forma en que esta relatividad est basada en las posiciones de respuestas diferentes en la jerarqua comportamental. Es por tanto importante reconocer que, a pesar de que las respuestas pueden ser manipuladas al cambiar las consecuencias ambientales, los efectos de estas consecuencias dependen de sus propiedades comportamentales. Una explicacin adecuada de estas propiedades debe tratar con la relacin entre las respuestas que produce una consecuencia particular y las respuestas que a su vez son producidas por esa consecuencia.

Estmulos aversivos En diversos puntos en nuestra discusin, hemos hablado de estmulos aversivos, reforzadores negativos, y punitivos. Cada uno fue introducido en un contexto diferente. Los estmulos aversivos fueron discutidos Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

29

en trminos de los efectos de las operaciones de elicitacin, los reforzadores negativos en trminos de consecuencias que incrementaban la probabilidad de las respuestas, y los estmulos punitivos en trminos de consecuencias que reducan la probabilidad de las respuestas. Sera conveniente asumir que cada trmino identifica un aspecto diferente de una nica categora comportamental de eventos ambientales. Puede decirse que la descarga elctrica, por ejemplo, es un estmulo aversivo, un reforzador negativo, o un estmulo punitivo, dependiendo del contexto experimental dentro del cual ocurre. Para muchos estmulos llamados aversivos, esta suposicin es probablemente correcta, porque cada clasificacin tiene sus orgenes en las relaciones entre las probabilidades de diferentes respuestas en la jerarqua comportamental. Un estmulo que es efectivo como reforzador negativo puede por lo tanto esperarse que sea efectivo como estmulo punitivo. Sin embargo, es importante hacer notar que el supuesto solamente ofrece una categorizacin prctica. Dado el presente estado de nuestra comprensin del comportamiento, la correspondencia entre reforzadores negativos y estmulos punitivos permanece como un tema para comprobacin emprica.

Castigo positivo y negativo Debe hacerse una ltima distincin antes de cerrar nuestra discusin de la operacin de castigo. As como con los reforzadores positivos y negativos, es posible distinguir entre estmulos punitivos positivos y negativos. La presentacin de ciertos eventos ambientales, tales como una descarga elctrica o una rueda giratoria que fuerza a la rata a correr, pueden funcionar como estmulo punitivo. Pero las respuestas tambin pueden ser castigadas por la terminacin de un estmulo. Por ejemplo, el retiro de alimento como consecuencia del palanqueo puede reducir la probabilidad del palanqueo (y los padres algunas ocasiones castigan el mal comportamiento al retirar privilegios). Por lo tanto, esta operacin puede ser referida como castigo negativo. Sin embargo, los efectos de esta operacin no han sido estudiados directamente, porque es difcil arreglar las condiciones necesarias. Por ejemplo, si el retiro de alimento es convertido en consecuencia del palanqueo de una rata privada de alimento, es ms probable que la rata coma a que presione la palanca; de esta forma, surgirn muy pocas oportunidades de castigar el palanqueo. As como los estudios de reforzamiento negativo se han concentrado ms en evitacin que en escape, los estudios de castigo negativo se han concentrado en castigo por tiempo fuera de reforzamiento positivo (e.g., Ferster, 1958), en el cual una respuesta es castigada por retiro de un estmulo en presencia del cual las respuestas pueden ser reforzadas ms que simplemente por retiro del propio reforzador positivo.

Estmulos neutrales

Hasta el momento hemos discutido las consecuencias de la respuesta, llamadas reforzadores, que aumentan la probabilidad de las respuestas, y otras consecuencias de la respuesta, llamadas punitivas, Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

30

que disminuyen la probabilidad de las respuestas. Pero tanto los reforzadores como los punitivos deben ser definidos relativamente, porque una consecuencia que puede funcionar como reforzador para una respuesta puede funcionar como punitivo para otra respuesta. Hemos visto que los estmulos que funcionan experimentalmente como reforzadores o punitivos son por lo comn seleccionados por sus efectos dramticos. Sin embargo, tales estmulos representan solamente extremos a lo largo de un continuo de efectos comportamentales. Entre estos extremos se encuentra un rango de estmulos que comnmente son llamados neutrales, porque su efectividad como reforzadores o punitivos no puede ser demostrada tan fcil o dramticamente. Sin embargo, tales estmulos tambin pueden ser consecuencias de la respuesta, y como tales pueden afectar el comportamiento subsecuente.

Considere algunos ejemplos. Cuando alcanzamos un objeto en una mesa, una consecuencia de alcanzar es que nuestra mano entra en contacto con el objeto. Cuando escuchamos mientras alguien habla, una consecuencia de escuchar es que omos lo que el hablante dice. Y cuando miramos una pgina de un libro, una consecuencia de ver es que podemos leer el texto. Cada una de estas consecuencias puede a su vez presentar la ocasin para otras respuestas: Una vez que hemos tocado un objeto, podemos moverlo; una vez que hemos escuchado a un hablante, podemos responder; y una vez que hemos ledo una pgina de un libro, podemos continuar con la siguiente.

En cada uno de estos casos, podemos describir las consecuencias del comportamiento en el vocabulario del reforzamiento. Podemos decir que alcanzar es reforzado por tocar, que escuchar es reforzado por or, o que mirar es reforzado por ver. Tal aplicacin de este vocabulario tiene precedente (Skinner, 1957), pero ser suficiente para nuestros propsitos hablar simplemente en trminos de consecuencias. Aqu estamos interesados no tanto con cmo aumentamos o disminuimos la probabilidad de las respuestas, sino en cmo la respuesta llega a ser coordinada con eventos ambientales.

Procesos sensoriales como comportamiento El papel de los procesos sensoriales ha sido una fuente de una controversia sostenida en el estudio del aprendizaje. Los tericos tomaron partido en la cuestin de si el aprendizaje era sensorial o motor: Aprenda un organismo relaciones entre estmulos, o aprenda respuestas? La cuestin no ha sido todava resuelta.

Parte de la dificultad es si los procesos sensoriales deben ser tratados como comportamiento. La explicacin presente asume que tal tratamiento es apropiado pues es consistente con el enfoque de que las propiedades importantes del comportamiento pueden ser tratadas no slo en trminos de estmulos y respuestas aislados, sino en trminos de relaciones entre estmulos y respuestas. As, a pesar de que ver y or no son tan fcil o sin ambigedad medidos como respuestas discretas como palanqueos o picoteos, Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

31

son sin embargo parte del comportamiento de un organismo. Ver y or dependen respectivamente de estmulos visuales y auditivos, pero tambin dependen de lo que el organismo hace. Un organismo no est pasivo en su ambiente: Ve lo que mira y oye lo que escucha. Tal comportamiento puede tambin ocurrir en ausencia de estmulos relevantes, as como cuando hablamos de atender, buscar, imaginar, o pensar.

Luces, sonidos, y otros eventos ambientales relativamente sencillos han sido con frecuencia descritos como estmulos neutrales. La etiqueta neutral es prctica, y la empleamos aqu por esa razn. Pero, como veremos, es un trmino inapropiado. Los eventos que pueden ser consecuencias del comportamiento no pueden ser verdaderamente neutrales, porque como consecuencias no es posible que no tengan ningn efecto en comportamiento subsecuente. Es tambin difcil concebir situaciones en las cuales todo lo que un organismo pudiese hacer no tendra consecuencia.

La importancia de los estmulos que una vez fueron considerados neutrales fue demostrado en experimentos interesados con un fenmeno llamado reforzamiento sensorial (ver Kish, 1966, para un resumen). Por ejemplo, se saba que los palanqueos de una rata aumentaban en frecuencia si encendan brevemente una luz. Este efecto de la luz era tanto pequea como transitoria, pero era sin embargo apropiado concluir que la luz era temporalmente efectiva como un reforzador dbil. Estos y otros fenmenos relacionados fueron discutidos en trminos de curiosidad o comportamiento exploratorio (e.g., Berlyne, 1960), y una variedad de demostraciones fueron aadidas a la literatura experimental. Por ejemplo, se mostr que un mono en una cmara cerrada presionar un interruptor si las presiones le ofrecen una oportunidad de ver hacia fuera de la cmara a otros monos (Butler, 1957).

Tales experimentos evalan el efecto de consecuencias sensoriales de una respuesta elegida por el experimentador por su facilidad de medicin. Pero las inevitables consecuencias del estmulo del comportamiento en cualquier ambiente pueden afectar la respuesta. Simplemente al moverse, el organismo cambia la porcin de ambiente con el cual entra en contacto; si el organismo se mueve, las cosas que ve y toca cambian.

La importancia de estas consecuencias del comportamiento se ilustra en un experimento realizado por Held y Hein (1963). Se criaron parejas de gatitos de tal manera que la estimulacin visual a la que un gatito (activo) se expona mientras se mova alrededor de un recinto circular era duplicada por un segundo gatito (pasivo). Sin embargo, la estimulacin visual para el gatito activo, era una consecuencia de su propio movimiento, mientras que para el gatito pasivo dependa de los movimientos del gatito activo. Esto fue arreglado al aadir un sistema de arns y polea al gatito activo y conectarlo, a travs de una palanca montada en un punto de apoyo en el centro de la cmara, a un pequeo compartimiento Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

32

dentro del cual estaba el gatito pasivo. De esta forma, el gatito pasivo, que era movido como en un pequeo carrusel, vea los mismos tipos de cambios en estmulos visuales en las mismas secuencias temporales que aquellos vistos por el gatito activo, pero estos cambios no eran consecuencias de su propio comportamiento. A pesar de sus exposiciones equivalentes a estmulos visuales, el gatito que estaba expuesto pasivamente a los estmulos visuales por los movimientos del gatito activo no poda responder apropiadamente en pruebas subsecuentes de coordinacin visual-motora, aunque lo logr hacer despus de que le fue permitido moverse libremente en un cuarto iluminado.

Por lo tanto, debemos concluir que las consecuencias de la respuesta juegan un papel crtico en el control del comportamiento, podamos o no categorizar de manera prctica estas consecuencias como estmulos reforzantes o neutrales o punitivos. Y si, cuando hablamos de situaciones en las que un organismo aprende, no podemos decir que el organismo ha aprendido o estmulos o respuestas, podemos al menos generalmente decir que el organismo ha aprendido las consecuencias de su comportamiento.

Aprendizaje latente Una amplia base para controversias acerca de la naturaleza del aprendizaje provino de un fenmeno llamado aprendizaje latente (ver Thistlethwaite, 1951, para un resumen). En un experimento sobre aprendizaje latente, ratas privadas de alimento en cada uno de dos grupos recorrieron un laberinto. Las ratas en un grupo encontraron alimento en la caja meta del laberinto, y en ensayos sucesivos su tiempo de recorrido del laberinto y sus entradas a los pasillos ciegos disminuy gradualmente. Las ratas en el otro grupo no encontraron alimento en la caja meta, y en el mismo nmero de ensayos que el primer grupo sus desempeos no mostraron evidencia de aprendizaje. Entonces las ratas en este grupo fueron colocadas en la caja meta y se les present alimento ah por primera vez, y los desempeos de los dos grupos fueron probados de nuevo. Esta ocasin no hubo diferencia considerable entre los grupos. Las ratas que previamente haba recorrido el laberinto sin alimento en la caja meta empezaron a correr tan rpido y con tan pocas entradas a los pasillos ciegos como las ratas que haban encontrado alimento en la caja meta en todos los ensayos previos.

Las ratas haban aprendido el laberinto igual de bien con o sin alimento en la caja meta, deca el argumento, y por lo tanto el aprendizaje no poda ser atribuido al efecto del alimento como reforzador. Pero, se opona, el alimento en la caja meta no es el nico reforzador posible para el correr de la rata por el laberinto. Se realizaron entonces experimentos para evaluar si un reforzador efectivo podra ser el retiro de la rata del laberinto, o su escape del confinamiento de los pasillos ciegos, o su regreso a su caja hogar, donde es alimentado. Mientras un experimento mostr que un reforzador particular podra ser efectivo, otro repiti la demostracin del aprendizaje latente de modo tal que este reforzador no poda Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

33

explicar el fenmeno.

Pero el argumento no poda ser resuelto ni an en principio, porque la negociacin de una rata del laberinto inevitablemente involucra consecuencias de la respuesta. En un punto particular en el laberinto, una vuelta es seguida por un pasillo ciego y la otra por una oportunidad de avanzar en el laberinto; en otro punto, una vuelta es seguida por la entrada a la caja meta, contenga sta o no alimento. El ver, olisquear, tocar, y moverse de la rata en el laberinto es comportamiento consecuencial, an si este comportamiento no es tan de fcil acceso al experimentador como vueltas correctas y entradas a pasillo ciegos. Llamar a estas consecuencias reforzadores es quizs nada ms que un asunto de preferencia. Pero sera difcil afirmar que estas consecuencias no son esenciales para el proceso llamado aprendizaje.

Extincin y supersticin

Algunas respuestas tienen consecuencias que permanecen bastante constantes a lo largo de la vida de un organismo. Alcanzar un objeto en una mesa, por ejemplo, es generalmente seguido por tocar el objeto. Pero para muchas respuestas, las consecuencias cambian. El comportamiento que es reforzado en la niez puede ya no ser reforzado cuando el nio se ha convertido en adulto. Y cuando las consecuencias de la respuesta cambian, el comportamiento a su vez puede cambiar. Cuando una respuesta es reforzada, aumenta en frecuencia; pero este efecto no es permanente, porque cuando el reforzamiento es suspendido, la frecuencia de la respuesta regresa a niveles anteriores.

La suspensin del reforzamiento es llamada extincin, y una respuesta en la cual esta operacin se ejecuta se dice que es extinguida. (La extincin es ocasionalmente confundida con el olvido, pero una respuesta extinguida no es necesariamente olvidada; simplemente ya no tiene las consecuencias reforzantes que antes tena). Como resultado de la operacin de extincin, la probabilidad de la respuesta regresa al nivel previo al reforzamiento. En este respecto, la extincin demuestra simplemente que la operacin de reforzamiento es temporal en su efecto. La disminucin en la respuesta durante la extincin es por tanto solamente una parte del proceso generado por el reforzamiento, en tanto que la disminucin muestra cmo los efectos del reforzamiento persisten en el tiempo (cf. Morse, 1966).

La respuesta durante la extincin fue considerada en un tiempo como una medida fundamental de los efectos del reforzamiento. Referida como resistencia a la extincin, tales mediciones como el nmero de respuestas emitidas durante un perodo de extincin, o el tiempo transcurrido antes de que la respuesta disminuyera a un nivel especfico, suplementaron otras medidas de la respuesta tomadas durante el reforzamiento. As, si un procedimiento de reforzamiento generaba ms respuesta despus de haber sido Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

34

suspendido que otro procedimiento de reforzamiento, se deca que el primer procedimiento de reforzamiento haba producido mayor resistencia a la extincin.

Extincin e inhibicin Pero las cuestiones se complicaron porque los efectos de la extincin no podan ser descritos solamente como una declinacin en la respuesta. Esta declinacin era tpicamente acompaada por otros efectos. Uno de los ms prominentes era el fenmeno de la recuperacin espontnea. Despus de que la respuesta haba disminuido a niveles bajos al final de una sesin de extincin, la respuesta se recuperaba a niveles anteriores altos al inicio de la siguiente sesin. Anlisis experimentales de ste y otros fenmenos de extincin llevaron a una variedad de explicaciones acerca de la extincin, formuladas en trminos de procesos inferidos tales como frustracin, interferencia, e inhibicin (cf. Kimble, 1961, Captulo 10). Estas explicaciones sugeran que la respuesta en la extincin no solamente declinaba pasivamente, sino que era suprimida activamente por propiedades aversivas o inhibitorias de respuestas no reforzadas. Fenmenos tales como recuperacin espontnea fueron tomados como indicadores de que la respuesta reducida por la extincin estaba de alguna manera ah todo el tiempo pero inhibida (cf. Reid, 1958).

Las explicaciones asumieron que la supresin activa de la respuesta extinguida era criticada sobre la base de que explicaban los fenmenos de la extincin en trminos de procesos o eventos que no eran ni observados ni observables. Cuando se deca que una respuesta extinguida era inhibida, por ejemplo, era posible medir la respuesta inhibida pero no era posible medir directamente los procesos o eventos que se deca producan la inhibicin. Por lo tanto, fueron formuladas otras explicaciones que no asumieron procesos supresores o inhibitorios.

Una de tales explicaciones sugiri que el inicio de la sesin tena propiedades especiales de estmulo, posiblemente derivadas de la manipulacin del animal y otras condiciones pre-experimentales, y que por tanto, los efectos de la extincin bajo condiciones diferentes durante la sesin podan no transferirse al inicio de la siguiente sesin de extincin. En una evaluacin experimental de esta explicacin (Kendall, 1965), las condiciones del estmulo fueron modificadas durante la extincin del picoteo de un pichn. Los picoteos del pichn en una tecla iluminada haban previamente sido reforzados con grano. Se condujo entonces la extincin durante perodos de 1 minuto de iluminacin de la tecla alternados con perodos de 1 minuto de oscuridad en la cmara, durante los cuales el pichn no picoteaba. Despus de que los picoteos en la tecla iluminada se hicieron poco frecuentes, la tecla se mantena iluminada continuamente; en pocos minutos el pichn de nuevo empez a picotear. De esta forma, la extincin durante iluminacin peridica de la tecla redujo la respuesta, pero este efecto no se transfiri a la iluminacin continua durante la sesin. En este experimento, poda decirse que la recuperacin espontnea ocurri dentro de Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

35

la sesin ms que en su inicio.

Dependencias estmulo-respuesta y entregas de estmulo Sin embargo, explicaciones acerca de la naturaleza de la extincin y de los fenmenos que la acompaan permanecen controversiales. La razn puede ser que la suspensin del reforzamiento tiene dos efectos: Termina una dependencia entre respuestas y reforzadores, y los reforzadores ya no son entregados. La diferencia entre estos dos efectos de la operacin de extincin pueden ser ilustrados al comparar la extincin con el procedimiento de saciedad, en la cual la respuesta contina produciendo un estmulo pero el estmulo se convierte en inefectivo como reforzador, y un procedimiento de elicitacin, en el cual la entrega del reforzador contina pero es independiente de la respuesta.

Asuma que los palanqueos de una rata privada de alimento son reforzados con bolitas de alimento, y que la rata presiona la palanca y come una bolita de alimento una vez cada diez o quince segundos. Si los palanqueos son entonces extinguidos, ya no producen bolitas y la rata ya no come. Como resultado, el palanqueo se vuelve menos frecuente.

Si, en su lugar, la dependencia entre los palanqueos y las bolitas de alimento se mantiene pero la rata ya no est privada de alimento, la rata ya no come aunque los palanqueos continen produciendo bolitas. Como resultado de esta operacin de saciedad, el palanqueo se vuelve menos frecuente. Sin embargo, es as, no porque los palanqueos no tengan consecuencias, sino porque las consecuencias ya no son efectivas como reforzadores.

Considere la tercera posibilidad. La rata permanece privada de alimento y la dependencia entre palanqueos y bolitas de alimento es suspendida, pero ahora las bolitas se entregan automticamente cada 10 o 15 segundos. Como resultado de esta operacin de elicitacin, el palanqueo de nuevo se hace menos frecuente. Pero en este caso los efectos de la terminacin de la dependencia entre respuestas y reforzadores, contrarios a aquellos de la operacin de extincin, no son acompaados por el efecto de la suspensin de alimento.

La distincin entre terminar una dependencia y terminar la entrega de reforzadores es importante porque los efectos de estas dos operaciones no son necesariamente los mismos. La terminacin de una dependencia es seguida por un cambio en la probabilidad de la respuesta para la cual la dependencia fue arreglada. Sin embargo, la terminacin de la entrega de reforzadores, tiene efectos en un rango ms amplio de comportamiento, dependiese o no la entrega de reforzadores de la respuesta. Por ejemplo, si una rata privada de alimento ha estado comiendo bolitas y las bolitas ya no son de pronto disponibles, la rata se volver ms activa, probablemente orinar o defecar, y comnmente morder la palanca o Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

36

atacar objetos de la cmara. Si las bolitas fueron producidas por palanqueos, la rata puede morder la palanca (e.g., Mowrer & Jones, 1943); si otro organismo se encuentra en la cmara, el otro organismo puede ser atacado (Azrin, Hutchinson, & McLaughlin, 1965). Tales efectos como stos no son resultado directo de la terminacin de una dependencia; son efectos colaterales, sobreimpuestos en la declinacin de la respuesta cuando la dependencia es terminada, porque esta terminacin est necesariamente acompaada por la terminacin de la entrega de reforzadores.

Existen problemas anlogos con respecto a reforzamiento negativo y con respecto a castigo. La extincin con respecto a reforzamiento negativo en escape por descarga, por ejemplo, pudiera asumirse que involucra terminacin de la dependencia entre respuestas y la descarga durante presentacin continua de descarga (cf. Herrnstein & Hineline, 1966). Sin embargo, con ms frecuencia, la simple terminacin de la descarga ha sido referida como una operacin de extincin en el caso del reforzamiento negativo. En este caso, no puede haber dependencia entre respuestas y terminacin de descarga, pero tampoco puede haber un evento reforzador independiente de la respuesta porque la ausencia de descarga puede slo reforzar efectivamente si la descarga est en ocasiones presente.

La terminacin de castigo es referida en trminos de recuperacin ms que en trminos de extincin. Sin embargo, si las respuestas son castigadas por descarga, la dependencia entre respuestas y descargas puede ser terminada con la terminacin de la entrega de descargas o terminando la dependencia mientras se entregan descargas independientemente de las respuestas. El primer caso, mas no el segundo, es anlogo al de extincin con reforzamiento positivo, porque los efectos generales de terminar la descarga pueden sobreimponerse en los efectos especficos de la terminacin de la dependencia. (Ni en reforzamiento negativo ni en castigo positivo est claro cmo es que la dependencia puede ser mantenida mientras las presentaciones del estmulo son descontinuadas. Una operacin anloga a la saciedad en reforzamiento positivo puede ser la reduccin de la intensidad de la descarga a un nivel que la hace inefectiva como reforzador negativo o como un castigador positivo, mientras mantiene la dependencia entre respuestas y descarga).

Se ofrece un ejemplo con experimentos interesados con el mantenimiento de la respuesta por descarga elctrica (e.g., Kelleher & Morse, 1968). Si se arreglan las condiciones de tal manera que el palanqueo de un mono produce una descarga al final de intervalos sucesivos de 10 minutos cada uno, el mono puede llegar a producirse la descarga a s mismo por palanqueo. Despus de cada descarga el mono se detiene, y entonces responde ms y ms rpidamente hasta que nuevamente se choca a s mismo al final del intervalo siguiente. Si la descarga es descontinuada, el palanqueo del mono cesa. En este desempeo, la descarga parece funcionar como reforzador: El mono responde cuando sus respuestas producen descarga pero no cuando sus respuestas no tienen consecuencia. Sin embargo, tambin es Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

37

necesario evaluar lo que el mono hace cuando las descargas son entregadas independientemente de su respuesta. Las descargas independientes de la respuesta elicitan palanqueo en el mono (e.g., Hutchinson, Renfrew, & Young, 1971). La comparacin apropiada no es entre descargas producidas por respuesta y no descargas en absoluto, sino entre descargas producidas por respuesta y descargas independientes de la respuesta. Si el palanqueo ocurre con menor frecuencia cuando las descargas son producidas por la respuesta que cuando son independientes de la respuesta, es apropiado concluir que la descarga es un castigador efectivo. En estas circunstancias, el castigo reduce la respuesta, pero los efectos elicitadores del estmulo punitivo son tan potentes que el castigo no es suficiente para eliminar la respuesta; as, tenemos el hallazgo paradjico de que el mono contina chocndose a s mismo an cuando las descargas ya no seran entregadas si dejase de responder completamente.

Este ejemplo puede tener implicaciones importantes. Podramos asumir, por ejemplo, que un padre que trata de lograr que un nio deje de llorar castigando el llanto tendr dificultad simplemente porque el estmulo positivo elicita la misma respuesta que el padre est tratando de suprimir. Por lo tanto, en el castigo, as como en el reforzamiento, debemos observar que las dependencias y las entregas del estmulo tienen efectos separados.

En todos estos casos, es de inters saber cmo cambia la frecuencia de la respuesta cuando termina una dependencia entre respuestas y consecuencias. Pero este proceso ha sido comnmente examinado durante extincin, cuando los efectos generales de la terminacin de las presentaciones del estmulo son sobreimpuestas en los efectos especficos de la terminacin de la dependencia. Es razonable preguntarse por qu ha sido ste el caso. Para responder a esta cuestin, debemos considerar ms ampliamente los efectos de las presentaciones del estmulo independientes de la respuesta.

Operaciones elicitadoras y supersticin La presentacin de un estmulo produce respuesta, pero an si el estmulo es presentado sin referencia al comportamiento del organismo, tambin sigue a las respuestas. Por ejemplo, la entrega de una bolita de alimento independiente de la respuesta podra ocurrir justo cuando la rata se muerde la cola. Y si sucede que la bolita es entregada justo despus de que la rata presiona una palanca, qu es lo que puede distinguir esta sucesin, la presin seguida por la bolita, de aquella en la cual la presin actualmente produce la bolita? La sucesin de respuesta y reforzador puede afectar respuestas subsecuentes tanto si esta sucesin ocurre accidentalmente como si es arreglada por la operacin de reforzamiento.

La respuesta que es aumentada en probabilidad por la sucesin accidental de respuestas y reforzadores ha sido llamada respuestas supersticiosas (Skinner, 1948). En la demostracin de una supersticin Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

38

experimental, Skinner le present grano a un pichn privado de alimento en intervalos de 15 segundos. Cualquier respuesta que ocurriese justo antes de la entrega del grano era probable de ser repetida, y por lo tanto era probable que fuese seguida por todava otra entrega de grano. As, a travs de esta sucesin accidental de respuestas y reforzadores, tenda a desarrollarse un patrn estereotipado de respuestas. Los pichones giraban, saltaban, o picoteaban; las respuestas fueron diferentes para diferentes pichones, y an para un solo pichn el patrn cambiaba con frecuencia gradualmente con entregas sucesivas de grano. A pesar de que era imposible anticipar cules respuestas seran afectadas, era posible, despus de que el procedimiento haba operado por un tiempo, identificar las respuestas que las haban vuelto altamente probables.

El desarrollo de la respuesta supersticiosa depende en parte al menos del espaciamiento temporal de las entregas del reforzador, porque este espaciamiento determina si una respuesta que ha sido hecha ms probable por un apareamiento accidental con un reforzador ser ms probable que ocurra de nuevo justo antes de la entrega del siguiente reforzador. El efecto puede tambin depender de las propiedades elicitantes del reforzador, porque el reforzador puede directamente cambiar las probabilidades de las respuestas que ocurren entre entregas sucesivas. Por ejemplo, si el grano hace ms probable que los pichones picoteen an en ausencia de grano, entonces ser ms probable que el picoteo se desarrolle supersticiosamente que otras respuestas no relacionadas con comer grano (cf. Staddon & Simmelhag, 1971).

Las supersticiones generadas por la sucesin accidental de respuestas y reforzadores son un problema siempre presente en el anlisis del comportamiento, porque pueden surgir si los reforzadores son entregados independientemente de las respuestas o como consecuencia de las respuestas. Por ejemplo, si una respuesta es seguida por una respuesta diferente que es entonces reforzada, el reforzador puede afectar ambas respuestas an cuando su entrega no dependa de esa sucesin particular de respuestas.

Para ilustrar este punto, regresemos al caso que nos llev a la discusin de supersticin: La dependencia entre respuesta y reforzador es terminada mientras la entrega de reforzadores es continuada. Los palanqueos de una rata son primero reforzados con bolitas de alimento; entonces, los palanqueos ya no producen bolitas pero las bolitas continan siendo entregadas, ahora independientemente del comportamiento. Bajo estas circunstancias, es probable que la rata contine presionando la palanca y, debido a que las bolitas todava son entregadas, es probable que las presiones sean frecuentemente seguidas por bolitas. As, el palanqueo puede declinar solo lentamente, posiblemente para ser reemplazado eventualmente por otras respuestas, no porque una dependencia tiene efectos perdurables an despus de que la dependencia es descontinuada, sino porque el efecto supersticioso de sucesiones accidentales de respuestas y reforzadores contrarresta hasta cierto punto los efectos de la terminacin de Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

39

la dependencia.

Hemos visto que, a pesar de que la extincin es sencilla como operacin experimental, sus efectos son complejos. Cuando el comportamiento tiene consecuencias, la terminacin de estas consecuencias afecta tanto al espaciamiento de los estmulos en el tiempo como la relacin de estos estmulos con el comportamiento. Un anlisis adecuado de la transicin del reforzamiento a la extincin debe tomar en cuenta estos dos efectos.

REFORZAMIENTO DIFERENCIAL Y CONTROL DEL ESTMULO

Hemos hablado de formas en las que el comportamiento puede ser modificado por presentaciones del estmulo en la operacin de elicitacin y por sus consecuencias en las operaciones de reforzamiento y castigo. Tambin hemos discutido cmo estas operaciones afectan las posiciones relativas de las respuestas en la jerarqua comportamental. La jerarqua comportamental es una propiedad de la respuesta con la cual el organismo llega a nosotros. Puede decirse que el comportamiento del organismo consiste en un repertorio de respuestas, cada una de las cuales tiene una probabilidad diferente. Sin embargo, no podemos restringir nuestra atencin slo a estas respuestas, porque una caracterstica importante de las modificaciones del comportamiento descritas como aprendizaje es que el organismo llega a responder en formas novedosas. Como resultado del proceso de aprendizaje, el organismo emite respuestas que no poda emitir antes de que el aprendizaje iniciara. Por lo tanto debemos considerar cmo estas nuevas respuestas pueden ser aadidas a la jerarqua comportamental o, en otras palabras, cmo el repertorio de respuestas del organismo puede ser ampliado.

Con frecuencia hemos empleado el palanqueo de una rata o el picoteo de una tecla de un pichn como ejemplos de respuestas. Pero si simplemente colocamos a una rata en una cmara con una palanca o a un pichn en una cmara con una tecla, estas respuestas no necesariamente ocurrirn. Y la operacin de reforzamiento no puede tener ningn efecto si la respuesta a ser reforzada no es emitida nunca. Por lo tanto, ms que esperar la respuesta, el experimentador puede emplear un procedimiento llamado moldeamiento: Produce palanqueos o picoteos de tecla al reforzar comportamiento que se aproxima ms y ms a estas respuestas.

Moldeamiento: Reforzamiento diferencial por aproximaciones sucesivas

Considere el palanqueo. Una vez que la rata ha empezado a comer bolitas de alimento a medida que son entregadas, el experimentador entrega una bolita slo cuando la rata gira hacia la palanca. Despus de reforzar dos o tres movimientos hacia la palanca con bolitas, el experimentador puede reforzar no Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

40

solamente cualquier movimiento hacia la palanca, sino solo aquellos movimientos que incluyen levantar las patas delanteras. Pero esta ocasin, la rata pasa la mayor parte de su tiempo cerca de la palanca, y el experimentador pronto tiene la oportunidad de reforzar el contacto con la palanca. Ya no es necesario reforzar giros hacia la palanca, porque los contactos con la palanca se aproximan ms al palanqueo y sern repetidos una vez que el contacto sea reforzado. El experimentador por lo tanto puede despus empezar a reforzar toques en la superficie superior de la palanca, y pronto ocurre una presin de la palanca. En este punto, el experimentador puede retirarse, porque el instrumento puede automatizarse de tal forma que cada palanqueo subsiguiente produzca una bolita de alimento.

El procedimiento de moldeamiento est basado sobre reforzamiento diferencial: En cada etapa, algunas respuestas son reforzadas pero otras no. Adems, los criterios para reforzamiento diferencial cambian, en aproximaciones sucesivas a palanqueo, as como la respuesta cambia. Dos propiedades del comportamiento contribuyen a la efectividad de este reforzamiento diferencial de aproximaciones sucesivas a la respuesta. La primera es que el comportamiento es variable. No existen dos respuestas idnticas, y el reforzamiento de una respuesta produce un espectro de respuestas que, a pesar de ser similares a la respuesta reforzada, difieren de ella hasta cierto punto en topografa o forma, y en otras propiedades tales como fuerza, magnitud, y direccin. De estas respuestas, algunas se aproximarn a la respuesta a ser moldeada ms que otras, y por lo tanto pueden ser seleccionadas para reforzamiento. El reforzamiento de estas respuestas ser seguido a su vez por respuestas adicionales, de las cuales algunas de ellas se aproximarn ms a la respuesta a ser moldeada. As, el espectro de respuestas puede gradualmente ser alterado por reforzamiento hasta que ocurra la respuesta a ser moldeada.

Este aspecto del procedimiento de moldeamiento, el cual depende del efecto especfico de reforzadores y respuestas precedentes, puede en ocasiones ser suplementado por un segundo efecto ms amplio de algunos reforzadores en el comportamiento: La entrega de algunos reforzadores, tales como alimento, tiende a hacer ms activo a un organismo (e.g., Blough, 1958). As, tanto la dependencia entre respuestas y reforzadores, en su efecto especfico en respuestas reforzadas, como la entrega de reforzadores, en su efecto general en una variedad de respuestas, contribuyen al moldeamiento de nuevas respuestas. Una respuesta mayor en fuerza o magnitud y con mayor parecido a la respuesta a ser moldeada que la respuesta reforzada puede ocurrir no slo porque el reforzamiento hace ms probables las respuestas similares a la respuesta reforzada, sino tambin porque la entrega del reforzador hace ms activo al organismo. Una vez ms, tanto los efectos especficos de la dependencia entre respuestas y reforzadores como los efectos generales de la entrega de reforzadores deben ser tomados en consideracin.

Operantes: Diferenciacin e Induccin Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

41

Una rata puede presionar una palanca con su pata izquierda, su pata derecha, o ambas patas. Ocasionalmente, puede an presionar la palanca recargndose en su barbilla, mordindola, o sentndose en ella. Cada una de estas respuestas es diferente, y an dos presiones sucesivas con la misma pata no sern idnticas. Sin embargo, todas estas respuestas son llamadas palanqueos. La rata puede tambin hacer los mismos movimientos en el lado opuesto de la cmara, de tal manera que la palanca no es presionada. Pero tales movimientos no seran llamados palanqueos.

Es por lo tanto insuficiente hablar del comportamiento slo en trminos de respuestas particulares. Las respuestas particulares son ejemplos de comportamiento, y debido a que ninguna respuesta es idntica en todos sus aspectos, cada respuesta puede ocurrir solamente una vez. El reforzamiento de una respuesta produce respuestas subsiguientes que se parecen ms o menos a la respuesta reforzada, pero estas respuestas no pueden ser exactamente iguales a la respuesta reforzada. As, para hablar de comportamiento efectivamente debemos hablar no de respuestas nicas sino de clases de respuestas definidas por propiedades comunes.

Clases de respuestas En los experimentos en donde se trabaja con respuestas a la palanca, la palanca est unida a un interruptor que opera cada vez que la palanca es lo suficientemente presionada. As, la propiedad comn de todos los palanqueos es este efecto ambiental de las presiones: Cada respuesta que opera el interruptor califica como palanqueo. La definicin de clases de respuestas en trminos de efectos ambientales comunes ofrece la base para la medicin de respuestas en la clase y para las operaciones experimentales que son impuestas en estas respuestas. Por ejemplo, el experimentador puede medir las respuestas a la palanca al registrar desde el interruptor y arreglar que todas las respuestas dentro de la clase definida (respuestas a la palanca) sean reforzadas con bolitas de alimento.

Pero la clase de respuestas medida por el experimentador no tendr ninguna significacin comportamental a menos que los efectos de las operaciones impuestas sobre la clase sean tambin tomadas en consideracin. Con respecto a cualquier clase de respuesta es necesario preguntar una cuestin comportamental fundamental: Puede la probabilidad de las respuestas en esta clase ser modificada por sus consecuencias? Si es as, la clase es llamada una clase operante; es una clase de respuestas que es afectada por la forma en la cual opera en el ambiente. Los palanqueos y picoteos son ejemplos prcticos de tales clases; sin embargo, como veremos, el comportamiento que puede ser referido en trminos de clases operantes es a la vez variado y complejo.

Anteriormente en el estudio del aprendizaje, cuando el comportamiento operante era llamado Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

42

comportamiento instrumental o voluntario, se asuma que las clases de respuestas que podan ser modificadas por sus consecuencias estaban limitadas principalmente a la musculatura esqueltica. Otras clases de respuestas, las respuestas autnomas tales como aquellas de las glndulas y msculos lisos, no se haba mostrado que fuesen modificables por sus consecuencias. Tales respuestas eran elicitadas por estmulos, y los procedimientos del condicionamiento de Pavlov (ver Captulo 3) haban mostrado cmo estmulos nuevos podan llegar a elicitar estas respuestas. No exista evidencia en ese momento que estas respuestas pudiesen ser modificadas por reforzamiento o castigo.

Sin embargo, este punto de vista ha cambiado, con la demostracin de que las respuestas autnomas pueden ser afectadas por sus consecuencias. La respuesta salival ofrece un ejemplo. Se saba que la salivacin ocurre espontneamente tambin cuando es elicitada por un estmulo tal como alimento en la boca (e.g., Zener & McCurdy, 1939). As, era posible arreglar consecuencias para salivacin espontnea o emitida, la cual era medida en gotas de fluido extrado del ducto salival de un perro a un sistema de registro externo. Pero la consecuencia no poda ser la entrega de alimento, porque un efecto del alimento como reforzador no sera distinguible de su efecto como un elicitador de salivacin. Por lo tanto, Miller y Carmona (1967) estudiaron la salivacin en perros privados de agua con un reforzador (agua) que no elicita salivacin. Encontraron que la salivacin decreca cuando evitaba la entrega de agua (castigo negativo). En otras palabras, mostraron que esta clase de respuestas, medida en gotas de saliva, poda ser modificada por sus consecuencias y por tanto poda ser apropiadamente referida como una clase operante.

Una operante, entonces, es una clase de respuestas que puede ser modificada por sus consecuencias. As como los estmulos no pueden ser clasificados independientemente de sus efectos comportamentales, la definicin de clases de respuestas depende de las propiedades comportamentales de las respuestas y no de sus propiedades fsicas o fisiolgicas independientes. La operacin experimental en la cual el estudio de estas propiedades comportamentales est basada es llamada reforzamiento diferencial, o el reforzamiento de solamente aquellas respuestas que caen dentro de una clase especfica. El efecto de esta operacin es hacer que las respuestas subsiguientes se conformen a los lmites de la clase especfica. As, la caracterstica esencial de una operante es la correspondencia entre la clase de respuestas definida por sus consecuencias y el espectro de respuestas generado por estas consecuencias.

Un ejemplo experimental: Diferenciacin de la localizacin de la respuesta La naturaleza de esta correspondencia puede ilustrarse con un ejemplo. (Los datos a ser presentados son hipotticos, pero Antonitis, 1951, y Gollub, 1966, han reportado experimentos relacionados.) Asuma que una rata privada de alimento es colocada en una cmara experimental en la cual se localiza en una Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

43

pared una rendija horizontal de 30 centmetros de longitud. Detrs de la rendija se encuentra una serie de fotoceldas que permiten que las respuestas sean registradas por separado en segmentos sucesivos de 2.5 centmetros (ms o menos una pulgada) siempre que la rata introduce su nariz en la rendija. (Estos segmentos sern llamados espacios del 1 al 12, leyendo de izquierda a derecha a lo largo de la rendija.) En la pared opuesta a la rendija se encuentra una taza en la cual pueden ser entregadas bolitas de alimento como reforzadores. La entrega de bolitas se acompaa por un chasquido fuerte, y siempre que una bolita es entregada la rata rpidamente viene a la taza y come. Mientras se mueve en la cmara, la rata puede ocasionalmente oler la rendija y colocar su nariz en ella. Pero en ausencia de reforzamiento estas respuestas son bastante poco frecuentes, y no necesariamente tienen una relacin sistemtica con los diversos espacios a lo largo de la rendija (ver Figura 2.3 A).

Suponga ahora que las respuestas son reforzadas, pero slo en los espacios 7, 8, y 9. El efecto inmediato del reforzamiento (ilustrado en la Figura 2.3 B) puede ser un incremento general en la respuesta en todos los espacios. Este fenmeno es en ocasiones llamado induccin: El efecto del reforzamiento no se restringe a la respuesta reforzada, sino que se extiende a otras respuestas similares. En este caso, el efecto de reforzar una respuesta en los espacios 7, 8, o 9 no se limit a respuestas en estos espacios, sino que se extendi a respuestas en otros espacios.

Sin embargo, a medida que el reforzamiento diferencial contina, de tal forma que las respuestas en los espacios 7, 8, y 9 son reforzadas mientras que las respuestas en otros espacios no lo son, la respuesta en los espacios reforzados aumenta mientras que la respuesta en otros espacios disminuye (ver Figuras 2.3 C a 2.3 F). Eventualmente, todas salvo una pequea proporcin de respuestas ocurre en los espacios 7, 8, y 9 (E), y se llega a un punto en el cual la prolongacin del procedimiento de reforzamiento diferencial no produce ms cambios importantes en la distribucin de respuestas a travs de los espacios (F).

En este ejemplo, la distribucin de respuestas viene a conformarse muy de cerca de los lmites de la clase de respuesta que ha sido reforzada. Este proceso es llamado diferenciacin, y tal respuesta se dice que es diferenciada. Ha sido establecida una clase operante que es definida en trminos de la localizacin de las respuestas.

Sin embargo, Qu puede decirse de las respuestas en los espacios 6 y 10? Con seguridad, estn fuera de los lmites de la clase de respuestas que es reforzada, y de acuerdo a la interpretacin ms estricta de las propiedades definitorias de las operantes no cuentan como respuestas en la clase operante. Tales respuestas han sido referidas en ocasiones en trminos de induccin; estas respuestas estn tan cercanamente relacionadas con las respuestas reforzadas a lo largo del continuo de los espacios que los Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

44

efectos del reforzamiento se extienden a ellas. En este enfoque, las respuestas dentro de los lmites de la clase reforzada son atribuidos a diferenciacin, y las respuestas fuera de los lmites a induccin. Pero tal distincin parece inapropiada, porque la respuesta tanto dentro como fuera de estos lmites es generada por las mismas operaciones y es representada por una distribucin continua.

Figura 2.3. Datos hipotticos que ilustran los efectos del reforzamiento diferencial en una distribucin de respuestas (introduccin de la nariz de una rata en una ranura horizontal de 30 cm. ubicada en la pared). La respuesta no reforzada se muestra en A. De B a F, las respuestas en los lugares 7, 8 y 9 (delimitados por lneas verticales) son reforzadas con pellets. La induccin se muestra en B; los efectos del reforzamiento se extienden a respuestas a todo lo largo de la ranura. La diferenciacin se ilustra a medida que la respuesta se restringe mas y mas a los lugares reforzados con reforzamiento diferencial continuo de C a F. En E y F, la distribucin de las respuestas se ha estabilizado y corresponde muy de cerca de la clase de respuestas reforzadas.

La solucin de esta dificultad radica en reconocer que estn involucradas dos diferentes clases de

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

45

respuestas. Una de ellas ofrece la base para la operacin experimental de reforzamiento (lneas verticales discontinuas en la Figura 2.3). La otra representa el desempeo que viene como resultado de estas operaciones (distribucin de respuestas en la Figura 2.3). No es necesario asumir que las dos deben corresponder exactamente. De hecho, para cualquier clase de respuestas reforzadas, la cuestin fundamental concierne el grado al cual el comportamiento producido se conforma al comportamiento reforzado.

Considere ahora otro ejemplo. Una vez ms, las respuestas pueden ser medidas por separado en regiones sucesivas de una rendija en una pared de la cmara, pero en esta ocasin la rendija es vertical en lugar de horizontal. En la medida en que la rata algunas veces coloca su nariz en la rendija mientras olisquea la cmara en ausencia de reforzamiento, sus respuestas estn concentradas en la porcin inferior de la rendija (ver Figura 2.4 A). Por lo tanto, la diferenciacin de la respuesta en la porcin superior de la rendija no puede proceder a menos que la respuesta en la parte superior sea moldeada.

A medida que aproximaciones sucesivas a respuestas en niveles superiores son diferencialmente reforzadas, la distribucin de las respuestas cambia, como se ilustra en la Figura 2.4. Al principio, todas las respuestas en el nivel 5 o ms alto son reforzadas (B). Como resultado, la respuesta aumenta en muchos niveles, y cierta respuesta ocurre en el nivel 7 y arriba por primera vez. En este punto, el lmite para reforzamiento diferencial es trasladado hacia arriba de tal forma que slo las respuestas a nivel 7 o ms arriba son reforzadas (C). De nuevo, la distribucin de respuestas se traslada hacia arriba, y la respuesta en niveles inferiores empieza a disminuir. El lmite para reforzamiento diferencial es entonces trasladado ms arriba de nuevo, a respuestas a nivel 9 o ms arriba (D). La distribucin de respuestas se traslada ms arriba, y la respuesta en niveles inferiores contina disminuyendo. Pero la altura que la rata puede alcanzar es limitada, y a pesar de que el mantenimiento del reforzamiento diferencial a nivel 9 y superiores produce poco ms estrechamiento de la distribucin (E), se alcanza eventualmente un punto en el cual el reforzamiento diferencial continuado en este nivel no produce ms cambios importantes en la distribucin de las respuestas (F).

En este caso, la clase de respuestas que tuvo consecuencias (respuestas a nivel 9 y superior, las cuales fueron reforzadas) fue diferente de la distribucin de respuestas producida por estas consecuencias (las respuestas abarcando hasta el nivel 10, pero con un mximo a nivel 8). La respuesta en esta situacin ha sido claramente modificada por sus consecuencias, pero parece inapropiado decir que el criterio para el reforzamiento es la propiedad definitoria de la clase operante. Este criterio ofrece la base para una operacin experimental, pero la importancia comportamental de esta operacin es dada por la respuesta que resulta. As, la propiedad definitoria de la clase operante debe en su lugar ser el comportamiento: Una vez que la operacin consecuencial de reforzamiento ha sido mostrada como afectando la Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

46

distribucin de las respuestas, esta distribucin define la clase operante.

Estos ejemplos han sido hipotticos. Pero ahora es posible considerar cmo estas relaciones repercuten en el rea tradicionalmente llamada aprendizaje, en la que muchos problemas se reducen a cuestiones acerca de las correspondencias entre clases de respuesta definidas en trminos de sus consecuencias y clases de respuestas definidas en trminos de las distribuciones resultantes.

Propiedades diferenciables del comportamiento La operacin de reforzamiento inevitablemente involucra diferenciacin. Respuestas tales como palanqueo y picoteo de tecla deben estar situadas en una localizacin adecuada y de una fuerza suficiente, y los ejemplos hipotticos de las Figuras 2.3 y 2.4 podran ser repetidos sustituyendo las dimensiones de estas respuestas, respectivamente, por las dimensiones de respuesta consideradas en las figuras. Pero las respuestas pueden variar no slo en localizacin y fuerza, sino tambin en topografa o forma, en duracin, y en direccin. Y como cualquier dimensin de respuesta puede ser la base para reforzamiento diferencial, cualquier dimensin de respuesta puede ofrecer las propiedades definitorias de una clase operante.

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

47

Figura 2.4. Datos hipotticos que muestran los cambios en la distribucin de respuestas (insercin de la nariz de una rata en una ranura vertical de 30 cm. ubicada en la pared de la cmara) con reforzamiento diferencial de aproximaciones sucesivas a respuestas mas altas (moldeamiento). Las respuestas no reforzadas, concentradas en los niveles mas bajos se muestran en A. En B, las respuestas en los niveles 5 y superiores (a la derecha de la lnea vertical) son reforzadas. La distribucin resultante incluye algunas respuestas en los niveles 7 y superiores. En C y en D, la clase de respuestas reforzadas cambia a los niveles superiores. Cuando el reforzamiento diferencial de solamente las respuestas en los niveles 9 y superiores se mantienen, en E y F, la distribucin de respuestas se estabiliza, pero no corresponde cercanamente a la clase de respuestas que es reforzada.

Una dimensin de inters especial es la separacin de respuestas en el tiempo. Por ejemplo, en el reforzamiento de los picoteos de tecla de un pichn, el reforzamiento diferencial puede ser arreglado slo para aquellos picoteos precedidos por un perodo de 10 segundos de no picoteo, o slo por aquellos picoteos emitidos tan rpidamente que al menos cinco picoteos ocurran en un perodo de 5 segundos. En el primer caso, el picoteo puede disminuir, pero slo porque la probabilidad de los picoteos precedida por pausas largas aumenta; la pausa debe de hecho ser tratada como componente de una operante compleja que consiste en una pausa ms un picoteo. En el segundo caso, el picoteo puede aumentar, pero slo porque la misma tasa alta ha sido diferencialmente reforzada. La importancia de estos ejemplos Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

48

es que la frecuencia o tasa de respuesta algunas veces puede ser tomada como una medida directa de los efectos del reforzamiento porque, as como otras propiedades de respuesta, tambin puede ser diferenciado (cf. Captulo 6). Por lo tanto, los anlisis de la diferenciacin de la tasa de respuesta dependen crticamente del grado al que el espaciamiento temporal de las respuestas se conforma al espaciamiento temporal que es reforzado.

Si una pausa ms un picoteo pueden ser tratados como una clase de respuesta compleja, entonces una pausa sola puede ser tratada tambin como una clase de respuesta. Considere, por ejemplo, la clase de todas las respuestas que consisten de 10 segundos de no picoteos. Si un reforzador es entregado despus de cada 10 segundos sin picoteo, entonces cada picoteo retrasa el reforzamiento al menos por 10 segundos. Pero cuando un picoteo evita o retrasa la entrega de un reforzador, tambin se dice que el picoteo es negativamente castigado. As, el reforzamiento positivo de un perodo sin respuesta es equivalente al castigo negativo de la respuesta. El estatus emprico de esta distincin depende al menos en parte de las propiedades de la no respuesta; debera la no respuesta ser tratada como comportamiento, o como ausencia de comportamiento?

Un problema anlogo surge en el vocabulario del castigo. Si un palanqueo produce una descarga, se dice que esta respuesta es castigada positivamente. Pero cada respuesta salvo el palanqueo evita la entrega de la descarga. Debera decirse que la clase de todas las respuestas excepto los palanqueos son reforzados negativamente? (mencionamos anteriormente que algunas explicaciones de hecho se refieren al castigo como evitacin pasiva). Por otra parte, si los palanqueos escapan o evitan la descarga, entonces cada respuesta excepto el palanqueo es seguida por descarga. Debera el reforzamiento negativo en escape o evitacin ser referido en trminos de castigo en ausencia de palanqueo?

Es ms sencillo hablar en trminos de respuestas discretas que en trminos de su ausencia, de forma que la descripcin directa de los efectos de respuestas mensurables tales como picoteos de tecla o palanqueos es probablemente preferible en cada uno de estos casos. Sin embargo, estos ejemplos ilustran la inevitable complementariedad de las operaciones de reforzamiento y castigo y muestran cmo la definicin de una clase operante puede afectar la forma en la cual hablamos de operaciones y procesos comportamentales.

Comportamiento complejo: Aprendizaje de laberinto Hemos comnmente hablado de respuestas relativamente sencillas, tales como palanqueos y picoteos de tecla. Pero la explicacin anterior indica que secuencias complejas de respuesta pueden tambin ser afectadas por reforzamiento diferencial y por tanto pueden tambin ser tratadas como clases operantes. Es posible, por ejemplo, tratar el recorrido de un laberinto como una respuesta nica pero compleja. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

49

Considere el laberinto ms sencillo, el laberinto T, en el cual la caja de inicio lleva a un solo punto de eleccin en el cual una vuelta o a la izquierda o a la derecha es seguida por alguna consecuencia. Si la caja meta a la izquierda est vaca y la caja meta a la derecha contiene alimento, una secuencia de respuesta de la caja de inicio a la caja meta que incluye una vuelta a la derecha se har ms probable o, en otras palabras, se diferenciar. (Debera notarse que las secuencias largas tambin pueden ser tratadas como una sucesin de diferentes operantes, cada una de ellas teniendo la consecuencia reforzante de producir una oportunidad de continuar con la siguiente, hasta que la siguiente es terminada por la entrega del reforzador. Tal tratamiento, el cual se encuentra ms all del enfoque del captulo presente, se considera en el Captulo 5.)

La complejidad de la diferenciacin de secuencias de respuestas se ilustra con el problema de doble alternancia (e.g., Hunter, 1928) en aprendizaje de laberinto. Al final de un pasillo central, un punto de eleccin ofreci una oportunidad para una vuelta hacia la izquierda (L) o una vuelta hacia la derecha (R), pero ambos caminos llevaron de nuevo al inicio del pasillo central. As, el organismo poda realizar vueltas sucesivas en el punto de eleccin sin ser retirado del instrumento. La cuestin era si una secuencia de doble alternancia (LLRR o RRLL) poda ser aprendida. Los experimentos fueron dirigidos hacia la cuestin de si el comportamiento del organismo en un momento poda controlar su comportamiento subsiguiente, y hacia la comparacin de comportamiento en especies diferentes. De hecho, la secuencia fue aprendida con diversos xitos por diferentes especies y por las mismas especies en experimentos diferentes. Sin embargo, para los objetivos presentes el punto principal es que la cuestin trata con la correspondencia entre la secuencia de vueltas que es reforzada y la secuencia que es producida por la operacin de reforzamiento.

Excepto por la longitud y complejidad de la secuencia, difiere como clase de respuesta de los ejemplos presentados anteriormente principalmente en la forma en que puede ser medida. Las secuencias posibles pueden ser especificadas, pero no pueden ser ordenadas sin ambigedad a lo largo de una sola dimensin (e.g., es la secuencia LLLR, que contiene slo una transicin de L a R, o la secuencia LRLR, que contiene nmeros iguales de Ls y Rs, relacionada ms de cerca de la secuencia reforzada, LLRR?). Dentro de cada secuencia, la contribucin de sus componentes puede tambin ser evaluada (e.g., ocurren las Rs con ms frecuencia que las Ls slo porque la ltima vuelta en la frecuencia reforzada, LLRR, es inmediatamente seguida por reforzamiento?). Estos problemas tienen paralelos en el estudio de habilidades motoras en humanos (e.g., Bilodeau, 1969), que algunas veces trata con la adquisicin de secuencias complejas de respuestas.

La estructura del comportamiento Las cuestiones acerca de las propiedades diferenciables de la respuesta estn interesadas con la Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

50

estructura del comportamiento, y las tcnicas de medicin variarn con las respuestas bajo estudio. En cada caso el inters central est en las dimensiones a lo largo de las cuales la respuesta se conforma a la clase de respuestas que es reforzada. Cuando estas dimensiones involucran caractersticas estructurales del comportamiento, es difcil definirlas. Por ejemplo, Pryor, Haag, y OReilly (1969) produjeron desempeos novedosos en una marsopa al seleccionar para reforzamiento, en cada sesin experimental, una clase de respuestas que no haba sido reforzada en ninguna sesin previa. La marsopa lleg a emitir respuestas, al inicio de sesiones sucesivas, que los experimentadores no haban observado nunca. Este experimento demostr la novedosidad de la diferenciacin de la respuesta. Sin embargo, la especificacin de las propiedades de esta clase operante est necesariamente limitada a una descripcin de los criterios para el reforzamiento.

Otro caso igual es la estructura gramatical de las oraciones en el comportamiento verbal humano. Oraciones gramaticales y no gramaticales pueden sin duda tener diferentes consecuencias para el que habla, y las oraciones pueden ser diferenciadas en clases gramaticales tales como voces activas vs voces pasivas, o declarativas vs interrogativas. Los casos son complicados porque la funcin de una oracin, y por tanto la interpretacin de su estructura,, puede depender de las condiciones bajo las cuales es enunciada (e.g., Skinner, 1957). Sin embargo, hay tcnicas disponibles para tratar con las propiedades formales de la estructura gramatical (e.g., Chomsky, 1963). La paradoja consiste en que el desarrollo de estas tcnicas ha llevado a controversia acerca de la naturaleza del lenguaje humano (Chomsky, 1959), sobre el fundamento de que las propiedades estructurales de la gramtica en el comportamiento verbal humano son incompatibles con los procesos de reforzamiento diferencial en comportamiento operante.

Sin embargo el comportamiento verbal es comportamiento consecuencial, y el hallazgo de que algunas estructuras gramaticales son ms fcilmente aprendidas que otras (e.g., McNeill, 1968), o que oraciones particulares son ms o menos fcilmente aprendidas dependiendo de su estructura gramatical (e.g., Mehler, 1963), no es ms embarazoso para una formulacin del comportamiento como el hallazgo de que la rata puede aprender una secuencia de alternancia simple (LRLR), o que la respuesta de una rata puede ser ms fcilmente diferenciada a lo largo de una rendija horizontal que a lo largo de una vertical. En cualquiera de estos casos, el problema es emprico: La identificacin de las dimensiones a lo largo de las cuales la respuesta puede llegar a conformarse a la clase de respuestas que tiene consecuencias. Para un organismo dado, las clases operantes pueden ser establecidas con mayor facilidad a lo largo de algunas dimensiones que a lo largo de otras (anteriormente, hubisemos dicho que algunas respuestas son ms fciles de aprender que otras). Si estas dimensiones son simples o complejas, intensivas o estructurales, un inters con el anlisis de estas dimensiones debe ser distinguido de un anlisis de los procesos que resultan de las consecuencias diferenciales de las respuestas a lo largo de estas Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

51

dimensiones. Los dos intereses no son incompatibles; son complementarios, y el anlisis del comportamiento verbal debe ser deficiente si las consecuencias del comportamiento verbal son ignoradas.

Operantes discriminadas: Discriminacin y generalizacin

Las propiedades con respecto a las cuales las respuestas pueden ser reforzadas diferencialmente no solamente incluyen las dimensiones de las respuestas sino tambin las dimensiones de los estmulos en presencia de los cuales estas respuestas ocurren. Por ejemplo, un picoteo de tecla en presencia de una luz verde es diferente de un picoteo de tecla en presencia de una luz roja, y el reforzamiento puede ser arreglado para picoteos en presencia de una luz pero no de otra. Las clases de respuesta que son establecidas por tal reforzamiento diferencial con respecto a las propiedades de los estmulos son llamadas operantes discriminadas.

Un ejemplo experimental: Discriminacin de la localizacin de un estmulo Algunas caractersticas de las operantes discriminadas pueden ser ilustradas por un ejemplo hipottico que se relaciona de cerca con el presentado en la Figura 2.3. Una pared de la cmara experimental de la rata contiene una rendija horizontal detrs de la cual una serie de lmparas pueden iluminar por separado segmentos sucesivos de 2.5 centmetros de la rendija. Debajo de la rendija est colocada una palanca, y un dispensador de bolitas de alimento est colocado en la pared opuesta. Asuma ahora que las lmparas individuales son iluminadas en un orden irregular, y que los palanqueos son registrados durante la iluminacin de cada segmento. En ausencia de reforzamiento, el palanqueo ser poco frecuente y probablemente no tendr relacin sistemtica con el segmento que es iluminado. De hecho, los datos pueden ser bsicamente los mismos a aquellos mostrados en la Figura 2.3 A, siendo la mayor diferencia que el eje horizontal podra ser etiquetado localizacin del estmulo en lugar de localizacin de la respuesta.

En este punto, puede introducirse reforzamiento para los palanqueos, pero slo cuando los segmentos 7, 8, y 9 son iluminados. El efecto inmediato del reforzamiento puede ser el incremento del palanqueo durante la iluminacin de todos los segmentos, con un resultado muy parecido al mostrado en la Figura 2.3 B. Pero con reforzamiento diferencial continuado con respecto a palanqueos durante la iluminacin de solamente los segmentos 7, 8, y 9, ser probable que el palanqueo aumente durante la iluminacin de estos segmentos y disminuya durante la iluminacin de los otros segmentos, casi como la distribucin de las respuestas cambi en las Figuras 2.3 C a 2.3 E. Eventualmente, el reforzamiento diferencial podra producir un patrn de respuesta bastante estable durante la iluminacin de los diferentes segmentos, as como en las Figuras 2.3 E y 2.3 F, con la mayor parte de los palanqueos ocurriendo durante la Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

52

iluminacin de los segmentos 7, 8, y 9, y con el palanqueo disminuyendo con el aumento de distancia de la iluminacin de aquellos segmentos correlacionados con reforzamiento.

En el caso del reforzamiento diferencial con respecto a las propiedades del estmulo, como en este ejemplo, el proceso resultante es llamado discriminacin en lugar de diferenciacin, y la extensin de los efectos del reforzamiento de los estmulos correlacionados con reforzamiento a estmulos en otros puntos a lo largo del continuo es llamada generalizacin en lugar de induccin. Pero la distincin entre estos conjuntos de trminos es hasta cierto punto arbitraria, porque en ambos casos se involucra la operacin de reforzamiento diferencial y los procesos resultantes de esta operacin son similares.

El vocabulario de la diferenciacin y la discriminacin Una caracterstica que distingue al reforzamiento diferencial con respecto a las propiedades de la respuesta, del reforzamiento diferencial con respecto a las propiedades del estmulo es metodolgica. En la primera, el experimentador mide las respuestas en diferentes clases a medida que ocurren; en la ltima, el experimentador puede controlar la oportunidad del organismo de emitir respuestas en diferentes clases al presentar o retirar los estmulos relevantes. Por ejemplo, el experimentador podra establecer una discriminacin con respecto a los espacios 4 y 8 iluminando alternadamente estos dos segmentos y reforzando palanqueos slo durante la iluminacin del segmento 8, pero nunca iluminando ninguno de los otros diez segmentos. Por esta razn, se dice que los estmulos involucrados en procedimientos de discriminacin presentan la ocasin para las respuestas: Cuando un estmulo particular es tratado como una propiedad de las respuestas dentro de una clase dada, las respuestas en esta clase no pueden ocurrir si el estmulo no ha sido presentado. (Es apropiado aadir el calificativo de que un estmulo puede presentar la ocasin para la respuesta an cuando un retraso es impuesto entre estmulo y respuesta; cuando preguntamos si la respuesta del organismo ahora es ocasionada por algn estmulo en el pasado, estamos interesados con el estudio de la memoria.)

Pero an esta distincin metodolgica tiene excepciones. Considere, por ejemplo, el reforzamiento diferencial del espaciamiento de las respuestas en el tiempo, discutido brevemente en una seccin previa. Si los picoteos de tecla de un pichn son reforzados slo cuando siguen a un perodo de 5 segundos de no picoteo, el pichn puede llegar a espaciar sus picoteos cada 5 segundos. Este desempeo puede ser referido como la diferenciacin de una operante compleja que consiste de una pausa ms un picoteo. Por otra parte, la duracin de la pausa puede ser tratada como una propiedad del estmulo, y el desempeo puede entonces ser referido como discriminacin con respecto a la duracin de la pausa precedente: Los picoteos despus de pausas menores de 5 segundos no son reforzados y se convierten en menos probables, mientras que los picoteos despus de pausas mayores de 5 segundos son reforzados y se convierten en ms probables (Catania, 1970). Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

53

Aqu la distincin involucra el vocabulario con el que describimos el comportamiento y no las caractersticas de los procesos comportamentales. La operacin de reforzamiento diferencial subyace en cada uno de estos casos. Anteriormente en este captulo indicamos que respuestas y estmulos tienen poca significacin a menos que sean tratadas en relacin unas con otros. Los presentes ejemplos ilustran la cercana de estas relaciones entre respuestas y estmulos. No es significativo hablar de respuestas independientemente del ambiente en el cual ocurren, y an en los casos en los que el experimentador no arregla reforzamiento diferencial con respecto a propiedades del estmulo, algunos estmulos en el ambiente del organismo deben ser relevantes para su desempeo. Los palanqueos no pueden ocurrir en ausencia de palancas, y los picoteos de tecla no pueden ocurrir en ausencia de teclas. Y an aquellas respuestas que no dependen de instrumentos especiales, tales como cambios posturales, ocurren en un ambiente. As, los procesos de discriminacin y generalizacin, que son considerados en ms detalle en el Captulo 4, son similares en su relevancia a los fenmenos de aprendizaje a los procesos de diferenciacin e induccin. La cuestin fundamental nuevamente concierne a la correspondencia entre las dimensiones en las que el reforzamiento diferencial est basado y en las dimensiones del comportamiento resultante.

La controversia sobre aprendizaje de lugar vs aprendizaje de respuesta ofrece un ejemplo (e.g., Restle, 1957). Si las vueltas a la derecha son reforzadas pero no las vueltas a la izquierda, en un laberinto T, las vueltas a la derecha de una rata pueden ser diferenciadas. Es entonces posible preguntarse si esta diferenciacin est basada en una dimensin de respuesta (vueltas a la derecha opuestas a vueltas a la izquierda), o si est basada en una dimensin de estmulo (discriminacin con respecto a la orientacin del laberinto relativo a los estmulos fuera del laberinto). Si la rata siempre se ha aproximado al punto de eleccin desde el sur, estas alternativas pueden ser evaluadas modificando el laberinto de tal forma que la rata se aproxime al punto de eleccin desde el norte. Si la rata gira a la derecha, y por tanto hacia la caja meta opuesta a aquella en la que el reforzador haba sido previamente entregado, se dice que se ha demostrado aprendizaje de respuesta. Si en su lugar la rata gira hacia la izquierda, y por tanto hacia la misma caja meta que en ensayos anteriores, se dice que se ha demostrado aprendizaje de lugar. La cuestin es si la rata ha aprendido vueltas a la derecha VS vueltas a la izquierda, o vueltas al este VS vueltas al oeste. De hecho, debido a que el aprendizaje de lugar no puede ocurrir a menos que estmulos discriminables estn correlacionados con vueltas en una direccin particular, la demostracin del aprendizaje de lugar depende hasta cierto punto de la construccin del laberinto. Si el laberinto es abierto, de tal forma que los estmulos fuera del laberinto estn disponibles (e.g., ventanas o luces en el techo del cuarto experimental), el aprendizaje de lugar probablemente ser observado; si el laberinto es cerrado, de tal forma que los estmulos externos no estn disponibles, el aprendizaje de respuesta es predominante. Cualquier resultado puede ser hecho ms probable que el otro. Pero en ambos casos, el Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

54

inters es si la respuesta producida por reforzamiento diferencial puede ser caracterizada como una clase operante definida por propiedades del estmulo o una clase operante definida por propiedades de la respuesta.

Propiedades discriminables de los estmulos Tal como las propiedades de la respuesta, las propiedades del estmulo que definen la clase de respuesta de una operante discriminada pueden ser variadas y complejas. Propiedades sencillas de los estmulos, tales como intensidad o forma visual, pueden ofrecer la base para reforzamiento diferencial. Por ejemplo, en la plataforma de salto de Lashley (1930), las ratas eran forzadas a saltar de una plataforma hacia uno de dos tableros (e.g., un tringulo o un crculo). Uno de estos tableros se baja cuando la rata salta hacia l, y permite a la rata acceso a alimento. Si la rata salta hacia el otro tablero, el cual est inmvil, la rata cae en una red bajo la plataforma. Las posiciones de los dos estmulos son alternados irregularmente de ensayo en ensayo. As, el reforzamiento diferencial es arreglado con respecto a los saltos hacia un estmulo, y castigo diferencial con respecto al otro. La cuestin experimental es si la respuesta se conforma a las consecuencias diferenciales en el sentido de que la rata llega a saltar solamente hacia el estmulo correlacionado con reforzamiento. En este instrumento, las propiedades del estmulo que controlan el comportamiento de la rata pueden ser estudiados.

Pero el reforzamiento diferencial puede tambin ser arreglado con respecto a las relaciones entre estmulos, y con respecto a propiedades complejas que no son fcilmente cuantificadas. Los pichones, por ejemplo, pueden ser entrenados a responder al estmulo extrao de varios estmulos si todos salvo uno de los estmulos son iguales, o a responder a uno de varios estmulos que corresponde a un estmulo muestra (e.g., Cumming & Berryman, 1965); y en un procedimiento que pudiese decirse demuestra la formacin de conceptos en pichones, pueden ser entrenados a responder a dibujos que contienen forma humana pero no a dibujos en los cuales la forma humana est ausente (e.g., Herrnstein & Loveland, 1964). As, las dimensiones complejas de extraez y correspondencia o del concepto de forma humana pueden definir operantes discriminadas (cf. Captulo 4).

Comportamiento complejo: Arreglo de aprendizaje La forma en la que las relaciones entre las propiedades del estmulo pueden llegar a controlar la respuesta independientemente de los estmulos especficos involucrados se ilustra en experimentos sobre un fenmeno llamado arreglo de aprendizaje (Harlow, 1949). El alimento es colocado bajo uno de dos objetos diferentes presentados a un mono privado de alimento, y el levantar este objeto es por tanto reforzado diferencialmente. Despus de que la discriminacin entre estos dos objetos es establecida, un nuevo par de objetos es presentado, de nuevo con reforzamiento diferencial arreglado con respecto a uno de ellos. Cuando esta discriminacin es establecida, todava otro nuevo par es presentado, y as Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

55

contina. A medida que la sucesin de nuevos pares de estmulos contina, son establecidas sucesivas discriminaciones ms y ms rpidamente, y eventualmente el mono puede responder consistentemente al estmulo correlacionado con reforzamiento despus de un solo ensayo con un par nuevo. Una operante discriminada en esta situacin no puede ser descrita simplemente en trminos de los estmulos en un par dado. En su lugar, debe estar basada en la dependencia entre estmulos y sus consecuencias correlacionadas en ensayos sucesivos. Si la respuesta a un estmulo dado es reforzada en el primer ensayo con un nuevo par, el mono responde a ese estmulo en todos los ensayos subsiguientes. Si esa respuesta no es reforzada, el mono responde al otro estmulo en todos los ensayos subsiguientes. Estas relaciones entre estmulos, respuestas, y consecuencias son las propiedades definitorias del comportamiento que es establecido en el fenmeno del conjunto de aprendizaje y demuestran la complejidad de las dimensiones que debe tomar en consideracin el anlisis de operantes discriminadas.

Enfrentamos problemas similares cuando preguntamos acerca de las caractersticas crticas de letras y palabras a medida que un nio aprende a leer (e.g., Gibson, 1965). La facilidad con que un nio aprende a distinguir letras del alfabeto depende de relaciones entre tales propiedades del estmulo como simetra, curvatura, y cierre. Pero no podemos simplemente enumerar las propiedades crticas; con respecto a algunas propiedades, por ejemplo, formas maysculas o minsculas de una sola letra pueden diferir ms de cada una que lo que difieren de otras letras (cf. e, E, y F; o h, n, y N). Una explicacin adecuada debe tratar tanto con las propiedades estructurales de las letras como estmulos como con las formas en las que el nio se comporta con respecto a las letras (cf. El anlisis de los procesos cognitivos: Neisser, 1967). Nombrar las letras en una secuencia es diferente de leer la secuencia como palabra. La diferencia est en el comportamiento del nio, y no en las letras como estmulos: En un caso, el nio responde a las letras como unidades; en el otro, el nio responde a una unidad mayor, la palabra, en la que las letras son componentes. Podemos decir que el nio est listo para leer ya sea letras o palabras. As, este ejemplo de nuevo demuestra que la estructura del estmulo no puede ser especificada sin referencia a la estructura de la respuesta.

La naturaleza del control del estmulo Hemos enfatizado las propiedades del estmulo como base para reforzamiento diferencial, y la discriminacin como un proceso comportamental. Es ahora apropiado regresar a las operaciones en las que esta formulacin est basada. Consideramos, en una seccin anterior, las operaciones consecuenciales de reforzamiento y castigo: Una respuesta es seguida por una consecuencia. Pero tambin hicimos notar ms recientemente que el reforzamiento diferencial con respecto a las propiedades del estmulo depende de la presentacin de los estmulos. As, para tratar de forma ms general con reforzamiento diferencial debemos sobreimponer otra operacin, la operacin de control del estmulo, en las operaciones consecuenciales de reforzamiento y castigo: En presencia de un estmulo, una respuesta Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

56

es seguida por una consecuencia. En estos tres trminos, estmulo-respuesta-consecuencia, caracterizamos exhaustivamente las relaciones fundamentales del comportamiento operante. Resta por tanto completar el crculo y regresar a la operacin de elicitacin, para considerar brevemente su relacin con la operacin del control del estmulo.

Respondientes: Elicitacin diferencial

Definimos las operantes en trminos de sus efectos ambientales, pero las clases de respuestas tambin pueden ser definidas en trminos de los estmulos que las producen. Tales clases son llamadas respondientes y corresponden a lo que anteriormente nos referimos como comportamiento elicitado o reflexivo. As, la salivacin producida por alimento en la boca es una clase respondiente. Esta clase debe distinguirse de la salivacin producida por cido en la boca, la cual es una clase respondiente diferente, y de la salivacin espontnea, la cual puede ser tratada como una clase operante porque es emitida ms que elicitada.

Hablamos de la produccin de respuestas por estmulos como la operacin de elicitacin. No existe un procedimiento que corresponda al reforzamiento diferencial de propiedades de respuesta para la operacin de elicitacin, porque las propiedades de las respuestas en las clases respondientes son determinadas por los estmulos elicitadores presentados al organismo. De esta forma, a pesar de que pueden ser creadas nuevas operantes por moldeamiento, las respondientes son ms limitadas en su potencialidad para modificacin.

Existe, sin embargo, un procedimiento correspondiente al reforzamiento diferencial con respecto a las propiedades del estmulo. As como la operacin del control del estmulo puede ser sobreimpuesta en las operaciones de reforzamiento y castigo, tambin as puede ser sobreimpuesto en la operacin de elicitacin: Un estmulo discriminativo puede presentar la ocasin en la que un estmulo elicitador es presentado (Catania, 1971). Podemos llamar tal procedimiento elicitacin diferencial; la operacin de elicitacin es arreglada slo en presencia de un estmulo particular.

Condicionamiento respondiente Los casos ms conocidos vienen de la demostracin de condicionamiento respondiente de los experimentos en reflejo condicionado de Pavlov (1927). (El condicionamiento respondiente tambin ha sido con frecuencia llamado condicionamiento clsico o Pavloviano, y es explorado en detalle en el Captulo 3.) Por ejemplo, un perro es sostenido en una plataforma por un arns, una campana suena, y entonces el alimento es colocado en el hocico del perro. El alimento, el cual elicita salivacin, es presentado cuando una campana suena, pero nunca en otras ocasiones. As, la campana es un estmulo Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

57

en presencia del cual la operacin de elicitacin, la entrega de alimento, es arreglada. La campana es referida como un estmulo condicionado (o condicional), y el alimento es un estmulo incondicionado (o incondicional). Como resultado de este procedimiento, el perro puede empezar a salivar al sonido de la campana, y entonces se dice que un reflejo condicionado (o condicional) ha sido establecido.

Un ejemplo actual que involucra una respuesta motora ms que glandular se la ofrecen Brown y Jenkins (1968). La tecla en una cmara de un pichn es iluminada a intervalos irregulares. Despus de varios segundos de iluminacin, el dispensador es operado. As, la iluminacin de la tecla presenta la ocasin en la que comer es elicitado por alimento. En este procedimiento, los pichones llegan a picotear la tecla despus de varias sucesiones de iluminacin de tecla y alimento. Este fenmeno se ha referido como auto moldeamiento del picoteo de tecla, y se le han dado diversas interpretaciones. Una es que el picoteo de tecla gradualmente evoluciona como una respuesta supersticiosa; otra es que ocurre porque el alimento eleva la probabilidad de picoteo an cuando el alimento est ausente, y esta respuesta por tanto viene a ser emitida en la presencia del estmulo correlacionado con presentaciones de alimento. El punto esencial es que estos procedimientos ilustran la operacin de elicitacin diferencial, elicitacin en presencia de un estmulo discriminativo.

Clases de estmulo en condicionamiento La sobreimposicin de la operacin del control del estmulo en la operacin de elicitacin no necesita ser restringida a reforzadores como estmulos elicitadores. Puede tambin ser extendida a estmulos con propiedades relativamente neutrales y a estmulos con propiedades aversivas. Por ejemplo, en experimentos sobre el fenmeno de precondicionamiento sensorial (Brogden, 1939), un conjunto de estmulos presenta la ocasin en la cual un segundo estmulo es presentado; una campana puede ser taida slo en presencia de una luz. Subsecuentemente, es establecido un reflejo condicionado en el que la campana funciona como estmulo condicionado (e.g., la campana puede presentar la ocasin para salivar). La luz es entonces presentada para examinar si, por virtud de su relacin anterior con la campana, la luz tambin controlar la respuesta. Las demostraciones de precondicionamiento sensorial poseen el mismo tipo de relacin con la operacin de elicitacin diferencial que las demostraciones de aprendizaje latente poseen con la operacin de reforzamiento.

La elicitacin diferencial que involucra estmulos aversivos ha sido referida como condicionamiento defensivo. Por ejemplo, una luz puede presentar la ocasin en la que una descarga es presentada, y las respuestas en presencia de la luz y su relacin con las respuestas elicitadas por descarga pueden entonces ser examinadas. En un procedimiento relacionado interesado con un fenmeno llamado supresin condicionada o ansiedad (ver Captulo 8), los efectos de la luz son examinados sobre una lnea base continua de respuesta reforzada. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

58

Propiedades de la respuesta en condicionamiento Tanto en elicitacin diferencial como en reforzamiento diferencial con respecto a las propiedades del estmulo, la respuesta llega a concentrarse en presencia de los estmulos discriminativos. En el primer caso, la respuesta es producida por la operacin de elicitacin, y en el segundo caso, por la operacin de reforzamiento. Pero en ambos casos la sobreimposicin de una operacin de control del estmulo tiene efectos similares; as, los procesos discriminativos generados por esta operacin pueden estar relacionados muy de cerca (cf. Captulo 3). Muchos experimentos han estado interesados con la relacin entre procesos operantes y respondientes, y el xito o fracaso de experimentos particulares ha sido tomado como evidencia de que los procesos operantes son de alguna forma reductibles a procesos respondientes, o que los procesos respondientes son de alguna forma reductibles a procesos operantes, o que los dos procesos son completamente independientes. Sin embargo, los resultados de experimentos particulares pueden depender en forma crtica de la relacin entre respuestas elicitadas y reforzadas. Esta dependencia puede ilustrarse al comparar dos experimentos interesados con las propiedades operantes o respondientes de la salivacin.

En el experimento Pavloviano clsico, la salivacin era elicitada por alimento, y la elicitacin subsiguiente de la salivacin por un estmulo condicionado que preceda consistentemente al alimento fue tomada como evidencia de que una nueva clase respondiente, salivacin elicitada por el estmulo condicionado, haba sido establecida. Sin embargo, era posible argumentar que la relacin entre salivacin y el estmulo condicionado lleg accidentalmente, y que la salivacin era subsiguientemente mantenida, as como en un procedimiento de supersticin, porque la salivacin en presencia del estmulo condicionado era consistentemente seguido por alimento (e.g., Smith, 1954). Para evaluar este tipo de posibilidad, Sheffield (1965) condujo un experimento para determinar si la adicin de consecuencias a este procedimiento podran modificar la salivacin. Especficamente, el alimento era presentado a un perro en presencia de un estmulo condicionado, pero la presentacin de alimento era omitida cada vez que el perro salivaba en presencia del estmulo condicionado. Este procedimiento, un ejemplo de castigo negativo referido como entrenamiento por omisin, no elimin la salivacin; la salivacin no lleg a estar bajo el control de su consecuencia, la omisin de alimento. Una vez que la salivacin ocurra en presencia del estmulo condicionado, el alimento era omitido; como resultado la salivacin disminuy en ensayos subsiguientes. Pero en ensayos sin salivacin, el alimento era de nuevo presentado, y as la salivacin era reinstaurada por la sucesin del estmulo condicionado y alimento. Entonces iniciaba un nuevo ciclo de omisiones de alimento y salivacin disminuida.

Sin embargo, en una seccin anterior, consideramos un experimento de Miller y Carmona (1967). En ese estudio, la salivacin se reduca cuando tena la consecuencia de omisin de reforzamiento. La diferencia Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

59

era que el reforzador era agua. Por tanto debemos concluir que la efectividad relativa de operaciones elicitantes y reforzantes debe depender hasta cierto punto de la compatibilidad de las respuestas reforzadas y las respuestas elicitadas. En el experimento de Sheffield, la ausencia de salivacin era reforzada por la presentacin de alimento, el cual entonces elicitaba salivacin; la ausencia reforzada de salivacin y la salivacin elicitada eran claramente incompatibles, y el reforzamiento no demostr ser efectivo. Sin embargo, en el experimento de Miller y Carmona la ausencia de salivacin fue reforzada por la presentacin de agua, la cual no elicita salivacin; as, no exista incompatibilidad entre la respuesta reforzada (ausencia de salivacin) y la respuesta elicitada por el reforzador. En este caso, el reforzamiento fue efectivo.

Funciones mltiples Estos ejemplos ilustran un inters general en el anlisis del comportamiento: El problema de la funcin mltiple. Hemos tratado con estmulos en elicitacin, reforzamiento, y control del estmulo. Pero es poco probable que un estmulo dado en un procedimiento particular posea slo una de estas funciones. Un estmulo discriminativo puede tambin funcionar como reforzador, y un estmulo reforzador puede tambin funcionar como elicitador. A pesar de que entendemos algunas de las propiedades de estas funciones por separado, nuestro entendimiento de sus efectos en combinacin es limitado. El progreso en el anlisis de los fenmenos de aprendizaje depender por tanto en parte de nuestra habilidad para caracterizar las interacciones entre funciones de estmulo.

LOS LMITES DEL APRENDIZAJE

La explicacin previa ha enfatizado la clasificacin de fenmenos del aprendizaje en trminos de operaciones comportamentales. Pero cuando un procedimiento experimental es impuesto sobre un organismo, no existe garanta de que el procedimiento ser efectivo. Un procedimiento que lleva a aprendizaje en un organismo puede no hacerlo con otros organismos, y un organismo que aprende bajo un procedimiento puede no hacerlo bajo otros procedimientos. Tales hallazgos no invalidan la clasificacin, porque la clasificacin es simplemente una forma de nombrar fenmenos y relacionar unos con otros. Sin embargo, sera de otro modo si se asumiese que el aprendizaje est basado en un solo proceso que acta en todos los organismos y en todos los procedimientos.

En su desarrollo histrico, la psicologa del aprendizaje examin los resultados experimentales de diversos procedimientos comportamentales; a cada procedimiento, a su vez, se le asign importancia en proporcin a su efectividad demostrable. Los hallazgos experimentales disponibles en diferentes momentos llevaron a formulaciones tericas en las que los principios de asociacin y contigidad, las reglas del condicionamiento respondiente, y las leyes del reforzamiento fueron seleccionados para Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

60

papeles dominantes, en ocasiones hasta el punto en que uno u otro era considerado como la base exclusiva y fundamental para el aprendizaje. Sin embargo, tales formulaciones estaban inevitablemente abiertas a desafo y controversia, porque un nico proceso no poda explicar exhaustivamente los fenmenos del aprendizaje. Las teoras del aprendizaje se hicieron ms precisas, pero los refinamientos progresivos fueron necesariamente acompaados por restricciones del rango de fenmenos a los cuales las teoras podan ser aplicadas. El reconocimiento de los lmites del aprendizaje estaba implcito en estas restricciones.

Cuando los lmites del aprendizaje pueden ser rastreados con facilidad a las capacidades sensoriales o motoras de un organismo, no presentan problemas. No nos sorprende, por ejemplo, si ciertos estmulos son ms capaces de controlar respuestas en ciertas especies que en otras. El pichn es capaz de discriminaciones visuales que son imposibles para el murcilago, y el murcilago es capaz de discriminaciones auditivas que son imposibles para el pichn, simplemente porque estos organismos poseen sistemas sensoriales diferentes. Las diferentes capacidades de respuesta no nos preocupan. Podemos atribuir diferentes modalidades de vuelo en pichones y murcilagos a tales diferencias anatmicas como la estructura del ala. Los ejemplos son obvios mas no triviales. Ilustran el grado al cual damos por descontado las limitaciones de las capacidades sensoriales y motoras de un organismo. No es siquiera probable que preguntemos acerca del vuelo de la rata, como lo haramos con el murcilago o el pichn; sabemos bien por qu las ratas no pueden volar.

As como las capacidades sensoriales y motoras, las capacidades de varios estmulos para reforzar difieren en las especies. Sin embargo, antes de que la relatividad del reforzamiento fuera reconocido, era difcil tratar con hallazgos en los cuales reforzadores establecidos para una especie fracasaran en tener sus efectos caractersticos. Algunos casos fueron descritos por Breland y Breland (1961). En una demostracin con mapaches, por ejemplo, reforzadores de alimento eran entregados cuando un mapache recoga monedas del suelo y las depositaba en un depsito. Pero despus de que el procedimiento haba continuado por algn tiempo, el mapache empezaba a pasar su tiempo frotando una moneda con la otra en lugar de soltarlas en el depsito. Este hallazgo no invalid el principio de reforzamiento; por el contrario, demostr una propiedad del comportamiento del mapache. Un mapache comnmente frota y enjuaga su alimento antes de comerlo, pero las monedas aparentemente ofrecan una mejor oportunidad para este comportamiento que el alimento que era empleado para reforzar el desempeo del mapache. En esta situacin, frotar era suficientemente ms probable que comer ese alimento que no era un reforzador efectivo; podemos por tanto suponer que una oportunidad para frotar pudo haber sido empleada para reforzar otras respuestas, posiblemente incluyendo comer.

Cuando la relatividad del reforzamiento fue reconocida, ya no era suficiente simplemente identificar los Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

61

reforzadores efectivos para una especie dada. Los reforzadores tambin tenan que ser definidos en trminos de la respuesta a ser reforzada. En una especie dada, un reforzador efectivo con una respuesta no es necesariamente un reforzador efectivo con otras. As, los lmites del aprendizaje no pueden ser especificados por separado en trminos de estmulos y en trminos de respuestas; tambin es necesario considerar las limitaciones de las clases de relaciones que pueden ser establecidas entre estmulos y respuestas en una especie dada.

Se ofrece un ejemplo con el experimento de aversin al alimento en la rata (Revusky & Garca, 1970). Si una rata se enferma despus de comer un alimento particular, la rata comnmente deja de comer ese alimento; as, comer puede ser castigado por sus consecuencias sistmicas an cuando esas consecuencias pueden seguir el comer slo despus de un retraso considerable. Las propiedades de este tipo de castigo fueron estudiadas al permitir que ratas sedientas bebieran agua endulzada en presencia de ruido y luz. En un grupo de ratas, beber era seguido por descarga elctrica. En un segundo grupo, beber era seguido por niveles de irradiacin X que despus produca enfermedad. En pruebas subsiguientes con agua endulzada y no endulzada, las ratas que haban sido irradiadas bebieron menos agua endulzada estuviesen o no presentes el ruido y la luz. Cuando el estmulo aversivo era descarga, las ratas aprendieron su relacin con eventos externos tales como ruido y luz. Cuando el estmulo aversivo era el efecto sistmico retardado de la irradiacin X, las ratas aprendieron su relacin con el sabor del agua que haban consumido recientemente. En otras palabras, los efectos inmediatos de la descarga castigaron beber en presencia de ruido y luz, pero los efectos retardados de las irradiaciones X castigaron beber el agua endulzada. Este ejemplo, el cual es tratado bajo el tpico de atencin en el Captulo 4, demuestra que las ratas estn predispuestas a aprender relaciones diferentes entre estmulos y respuestas en situaciones diferentes (cf. Seligman, 1970). As, no es suficiente decir que para una especie dada algunas respuestas o algunos estmulos son ms fcilmente aprendidos que otros; una explicacin de los lmites del aprendizaje debe tambin tratar con las relaciones entre estmulos y respuestas.

La lista podra extenderse. Investigacin reciente ha examinado el papel del reforzamiento y consecuencias sistmicas retardadas en el desarrollo de preferencias de alimento y de las hambres especficas que siguen a deficiencias dietticas (Rozin & Kalat, 1971), el efecto de reacciones de defensa especficas de la especie que son elicitadas por estmulos aversivos en el desarrollo del desempeo de evitacin (Bolles, 1970), y la naturaleza del comportamiento que no puede ser atribuido a la sucesin accidental de una respuesta y un reforzador en el desarrollo del desempeo durante un procedimiento de supersticin (Staddon & Simmelhag, 1971). Estos ejemplos, los cuales tambin son discutidos en el Captulo 9, tratan con los lmites dentro de los que diversas operaciones son efectivas, pero al serlo no alteran las propiedades definitorias de los procesos comportamentales. Si un fenmeno viene a ser Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

62

menos general de lo que antes creamos, no se sigue que deberamos llamarle por diferente nombre.

Si se mantuviese que el principio nico del aprendizaje es demostrado por una operacin experimental dada, tal como elicitacin o reforzamiento o control del estmulo, entonces el descubrimiento de las condiciones que limitaron la efectividad de esa operacin desafiaran su generalidad como una base del aprendizaje. Pero hoy es reconocido que las diversas operaciones son todas importantes en sus diferentes formas. As, el descubrimiento de las limitaciones de cada una es una parte integral de, ms que un desafo crtico a, el anlisis de los fenmenos del aprendizaje.

RESUMEN Y CONCLUSIONES

Hemos presentado los fenmenos del aprendizaje en trminos de operaciones experimentales. Primero consideramos los efectos de la operacin ms sencilla, la elicitacin o presentacin de estmulos. Las respuestas son producidas por estmulos, y la probabilidad de estas respuestas puede ser modificada no slo por presentaciones del estmulo sino por el patrn temporal de estas presentaciones. La operacin de elicitacin tambin puede tener otros efectos: Las respuestas elicitadas pueden volverse ms probables an en ausencia del estmulo elicitador, y las presentaciones del estmulo pueden afectar las respuestas que les siguen en el fenmeno de la supersticin.

Pero as como los estmulos pueden ser seguidos por respuestas, las respuestas pueden ser seguidas por estmulos, y por tanto el tratamiento de las operaciones consecuenciales de reforzamiento y castigo trataron con los efectos de las consecuencias de la respuesta. Sobre la base de los efectos de estas operaciones, distinguimos entre reforzamiento positivo, reforzamiento negativo (o escape y evitacin), castigo positivo, y castigo negativo (o entrenamiento por omisin). En aadidura, el tratamiento de fenmenos tales como aprendizaje sensorial-motor y aprendizaje latente demostr la importancia de consecuencias menos dramticas, algunas veces errneamente llamadas neutrales, que no son generalmente clasificadas como reforzadores o punitivos.

El reforzamiento y el castigo fueron distinguidos sobre la base de si las consecuencias de la respuesta producan aumentos o disminuciones en la respuesta, pero notamos que la distincin entre casos positivos y negativos de estas operaciones era hasta cierto punto arbitraria. Los casos positivos y negativos no podan ser tratados consistentemente en trminos de si las consecuencias de la respuesta involucraban la presentacin o retiro de estmulos. En su lugar, estos casos fueron tratados en trminos de la relacin temporal entre las respuestas reforzadas o castigadas con otras respuestas que fueron producidas por estas operaciones.

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

63

La operacin final, control del estmulo, es una operacin que puede ser sobreimpuesta tanto en la operacin de elicitacin como en las operaciones consecuenciales de reforzamiento y castigo. Cuando es sobreimpuesta en la elicitacin, esta operacin genera los procesos que han sido referidos como condicionamiento respondiente; casos especiales incluyen el precondicionamiento sensorial, en el cual el estmulo elicitador es neutral, y el condicionamiento defensivo, en el cual el estmulo elicitador es aversivo. Cuando es sobreimpuesta en operaciones consecuenciales, la operacin de control del estmulo genera procedimientos de discriminacin. Consideramos aqu solamente el caso de discriminacin con respecto al reforzamiento positivo, pero el anlisis puede ser extendido al castigo, as como a las consecuencias neutrales del aprendizaje latente.

Estas operaciones agotan las relaciones comportamentales que pueden ser establecidas entre estmulos y respuestas. Por lo tanto, un inters particular era la caracterizacin de las dimensiones a lo largo de las cuales los estmulos y las respuestas pueden variar: Este inters fue tratado en la discusin de los procesos de diferenciacin y discriminacin y se mostr que las dimensiones relevantes incluan no solamente tales dimensiones relativamente sencillas como intensidad, localizacin, y topografa, sino las dimensiones complejas de la relacin y estructura de estmulo y respuesta. El anlisis de la estructura es diferente del anlisis de las funciones de estmulos y respuestas, y es esencial para la definicin de las clases de respuesta.

Una conclusin a ser derivada de esta explicacin es que el comportamiento es mejor representado en trminos de un continuo de procesos en lugar de categoras dicotomizadas. Reforzamiento y castigo no son procesos independientes, sino extremos en un continuo que abarca desde aquellas operaciones consecuenciales que elevan la probabilidad de las respuestas, a aquellas que no tienen efecto en la probabilidad de las respuestas, hasta aquellas que disminuyen la probabilidad de las respuestas. Tanto el reforzamiento positivo como el negativo no son procesos independientes, sino que difieren con respecto a la magnitud de los efectos elicitadores y discriminativos de los estmulos que estn presentes durante la operacin de reforzamiento. La diferenciacin y discriminacin no son procesos independientes, sino que slo difieren con respecto a si la operacin de reforzamiento diferencial enfatiza las propiedades de la respuesta o las propiedades del estmulo. Y los efectos del reforzamiento diferencial y de la elicitacin diferencial no son procesos independientes, sino que estn relacionados en tanto que la operacin de control del estmulo modifica la respuesta que es generada por las operaciones de reforzamiento o elicitacin en las cuales est sobreimpuesta.

En todo esto, el trmino aprendizaje ha retrocedido al trasfondo, y bien puede suceder que ha terminado su utilidad. Las jerarquas comportamentales pueden ser modificadas, nuevas respuestas pueden ser moldeadas, y pueden ser establecidas discriminaciones. Estos son fenmenos del comportamiento, y Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

64

parte de nuestro entendimiento de estos fenmenos depende de qu tan precisamente podemos hablar de ellos. El vocabulario actual no carece de ambigedades, e indudablemente cambiar. Pero en su nfasis en operaciones comportamentales y procesos comportamentales, se adhiere muy cercanamente a lo que se hace y se observa en experimentos sobre comportamiento. Y esta adherencia puede ser esencial a nuestro progreso, porque no es de utilidad decir que un organismo ha aprendido a menos que tambin podamos decir lo que ha aprendido, y cmo. REFERENCIAS

Antonitis, J. J. Response variability in the white rat during conditioning, extinction, and reconditioning. Journal of Experimental Psychology, 1951, 42, 273-281. Azrin, N. H. Some effects of two intermittent schedules of immediate and non-immediate punishment. Journal of Psychology, 1956, 42, 3-21. Azrin, N.H., & Holz, W. C. Punishment. In W. K. Honig (Ed.), Operant Behavior: Areas of research and application. New York: Appleton-Century-Crofts, 1966. Pp. 380-447. Azrin, N. H., Hutchinson, R. R., & Hake, D.F. Extinction-induced aggression. Journal of the Experimental Analysis of Behavior, 1966, 9, 191-204. Azrin, N.H., Hutchinson, R. R., & McLaughlin, R. The opportunity for aggression as an operant reinforcer during aversive stimulation. Journal of the Experimental Analysis of Behavior, 1965, 8, 171-180. Badia, P., Suter, S., & Lewis, P. Rat vocalization to shock with and without a CS. Psychonomic Science, 1966, 4, 117-118. Beale, G. H. Adaptation in paramecia. In R. Davis & E. F. Gale (Eds.), Adaptation in microorganisms. (Third Symposium of the Society for General Microbiology.) Cambridge: Cambridge University Press, 1953. Pp. 294-305. Berlyne, D. E. Conflict, arousal, and curiosity. New York: McGraw-Hill, 1960. Best, J. B. The photosensitization of paramecia aurelia by temperature shock. Journal of Experimental Zoology, 1954, 126, 87-99. Bilodeau, E. A. (Ed.) Principles of skill acquisition. New York: Academic Press, 1969. Bindra, D. Components of general activity and the analysis of behavior. Psychological Review, 1961, 68, 205-215. Blough, D. S. New test for tranquilizers. Science, 1958, 127, 586-587. Bolles, R. C. Species-specific defense reactions and avoidance learning. Psychological Review, 1970, 77, 32-48. Breland, K., & Breland, M. The misbehavior of organisms. American Psychologist, 1961, 16, 681-684. Brogden, W. J. Sensory preconditioning. Journal of Experimental Psychology, 1939, 25, 323-332.

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

65

Brown, P. L., & Jenkins, H. M. Auto-shaping of the pigeons key-peck. Journal of the Experimental Analysis of Behavior, 1968, 11, 1-8. Butler, R. A. The effect of deprivation of visual incentives on visual exploration motivation in monkeys. Journal of Comparative and Physiological Psychology, 1957, 50, 177-179. Catania, A. C. Glossary. In A. C. Catania (Ed.), Contemporary research in operant behavior. Glenview, Ill.: Scott, Foresman, 1968. Pp. 327-349. Catania, A. C. On the vocabulary and the grammar of behavior. Journal of the Experimental Analysis of Behavior, 1969, 12, 845-846. Catania, A. C. Reinforcement schedules and psychophysical judgments: A study of some temporal properties of behavior. In W. N. Schoenfeld (Ed.), The theory of reinforcement schedules. New York: Appleton-Century-Crofts, 1970. Pp. 1-42. Catania, A. C. Elicitation, reinforcement, and stimulus control. In R. Glaser (Ed.), The nature of reinforcement. New York: Academic Press, 1971. Pp. 196-220. Chomsky, N. Review of B. F. Skinners Verbal behavior. Language, 1959, 35, 26-58. Chomsky, N. Formal properties of grammars. In R. D. Luce, R. R. Bush, & E. Galanter (Eds.), Handbook of mathematical psychology. Vol. 2. New York: Wiley, 1963. Pp. 323-418. Cofer, C. N., Appley, M. H. Motivation: Theory and research. New York: Wiley, 1964. Cumming, W. W., & Berryman, R. The complex discriminated operant: Studies of matching-to-sample and related problems. In D. I. Mostofsky (Ed.), Stimulus generalization. Stanford: Stanford University Press, 1965. Pp. 284-330. Falk, J. L. Production of polydipsia in normal rats by an intermittent food schedule. Science, 1961, 133, 195-196. Falk, J. L. The nature and determinants of adjunctive behavior. Physiology and Behavior, 1971, 6, 577588. Ferster, C. B. Control of behavior in chimpanzees and pigeons by time out from positive reinforcement. Psychological Monographs, 1958, 72, (8, Whole Number 461). Gibson, E. J. Learning to read. Science, 1965, 148, 1066-1072. Goldstein, H., Krantz, D. L., & Rains, J. D. Controversial issues in learning. New York: Appleton-CenturyCrofts, 1965. Gollub, L. R. Stimulus generalization of response-position in the rat. Psychonomic Science, 1966, 6, 433434. Harlow, H. F. The formation of learning sets. Psychological Review, 1949, 56, 51-65. Held, R., & Hein, A. Movement-produced stimulation in the development of visually guided behavior. Journal of Comparative and Physiological Psychology, 1963, 56, 872-876. Herrnstein, R. J. Method and theory in the study of avoidance. Psychological Review, 1969, 76, 49-69. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

66

Herrnstein, R. J., & Hineline, P. N. Negative reinforcement as shock-frequency reduction. Journal of the Experimental Analysis of Behavior, 1966, 9, 421-430. Herrnstein, R. J., & Loveland, D. H. Complex visual concept in the pigeon. Science, 1964, 146, 549-551. Hess, E. H. Imprinting. Science, 1959, 130, 133-141. Hilgard, E. R. Method and procedures in the study of learning. In S. S. Stevens (Ed.), Handbook of experimental psychology. New York: Wiley, 1951. Pp. 517-567. Hogan, J. A. The development of a hunger system in young chicks. Behaviour, 1971, 39, 128-201. Hull, C. L. Principles of behavior. New York: Appleton-Century-Crofts, 1943. Hunter, W. S. The behavior of raccoons in a double-alternation temporal maze. Journal of Genetic Psychology, 1928, 35, 374-388. Hutchinson, R. R., Renfrew, J. W., & Young, G. A. Effects of long-term shock and associated stimuli on aggressive and manual responses. Journal of the Experimental Analysis of Behavior, 1971, 15, 141-166. Jensen, D. D. Experiments on learning in paramecia. Science, 1957, 125, 191-192. Kelleher, R. T., & Morse, W. H. Schedules using noxious stimuli: III. Responding maintained with response-produced electric shocks. Journal of the Experimental Analysis of Behavior, 1968, 11, 819-838. Kendall, S. B. Spontaneous recovery after extinction with periodic time-outs. Psychonomic Science, 1965, 2, 117-118. Kimble, G. A. (Ed.) Hiilgard and Marquis Conditioning and Learning. (2nd ed.) New York: AppletonCentury-Crofts, 1961. Kish, G. B. Studies of sensory reinforcement. In W. K. Honig (Ed.), Operant Behavior: Areas of research and application. New York: Appleton-Century-Crofts, 1966. Pp. 109-159. Lashley, K. S. The mechanism of vision. I. A method for rapid analysis of pattern vision in the rat. Journal of Genetic Psychology, 1930, 37, 453-460. McNeill, D. On theories of language acquisition. In T. R. Dixon & D. L. Horton (Eds.), Verbal behavior and general behavior theory. Englewood Cliffs, N. J.: Prentice-Hall, 1968. Pp. 406-420. Meehl, P. E. On the circularity of the law of effect. Psychological Bulletin, 1950, 47, 52-75. Mehler, J. Some effects of grammatical transformations on the recall of English sentences. Journal of Verbal Learning and Verbal Behavior, 1963, 2, 346-351. Miller, N. E. & Carmona, A. Modification of a visceral response, salivation in thirsty dogs, by instrumental training with water reward. Journal of Comparative and Physiological Psychology, 1967, 63, 1-6. Morse, W. H. Intermittent reinforcement. In W. K. Honig (Ed.), Operant Behavior: Areas of research and application. New York: Appleton-Century-Crofts, 1966. Pp. 52-108. Mowrer, O. H., & Jones, H. M. Extinction and behavior variability as functions of effortfulness of task. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

67

Journal of Experimental Psychology, 1943, 33, 369-385. Neisser, U. Cognitive Psychology. New York: Appleton-Century-Crofts, 1967. Pavlov, I. P. Conditioned reflexes. G. V. Anrep (Trans.) London: Oxford University Press, 1927. Peterson, N. Control of behavior by presentation of an imprinted stimulus. Science, 1960, 132, 1395-1396. Premack, D. Toward empirical behavior laws: I. Positive reinforcement. Psychological Review, 1959, 66, 219-233. Premack, D. Reversibility of the reinforcement relation. Science, 1962, 136, 255-257.

Premack, D. Catching up with common sense or two sides of a generalization: Reinforcement and punishment. In R. Glaser (Ed.), The nature of reinforcement. New York: Academic Press, 1971. Pp. 121150. Pryor, K. W., Haag, R., & OReilly, J. The creative porpoise: Training for novel behavior. Journal of the Experimental Analysis of Behavior, 1969, 12, 653-661. Reid, R. L. The role of the reinforcer as a stimulus. British Journal of Psychology, 1958, 49, 202-209. Restle, F. Discrimination of cues in mazes: A resolution of the place-versus-response question. Psychological Review, 1957, 64, 217-228. Revusky, S., & Garcia, J. Learned associations over long delays. In G. H. Bower (Ed.), The psychology of learning and motivation. Vol. 4. New York: Academic Press, 1970. Pp. 1-84. Rozin, P., & Kalat, J. W. Specific hungers and poison avoidance as adaptive specializations in learning. Psychological Review, 1971, 78, 459-486. Seligman, M. E. P. On the generality of the laws of learning. Psychological Review, 1970, 77, 406-418. Sheffield, F. D. Relation between classical conditioning and instrumental learning. In W. F. Prokasy (Ed.), Classical conditioning: A symposium. Appleton-Century-Crofts, 1965. Pp. 302-322. Sherrington, C. S. The integrative action of the nervous system. New Haven: Yale University Press, 1906. Skinner, B. F. On the conditions of elicitation of certain eating reflexes. Proceedings of the National Academy of Sciences, 1930, 16, 433-438. Skinner, B. F. The concept of the reflex in the description of behavior. Journal of General Psychology, 1931, 5, 427-458. Skinner, B. F. The behavior of organisms. New York: Appleton-Century-Crofts, 1938. Skinner, B. F. Superstition in the pigeon. Journal of Experimental Psychology, 1948, 38, 168-172. Skinner, B. F. Are theories of learning necessary? Psychological Review, 1950, 57, 193-216. Skinner, B. F. A case history in scientific method. American Psychologist, 1956, 11, 221-233. Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA

La naturaleza del aprendizaje

68

Skinner, B. F. Verbal behavior. New York: Appleton-Century-Crofts, 1957. Smith, K. Conditioning in an artifact. Psychological Review, 1954, 61, 217-225. Solomon, R. L. Punishment. American Psychologist, 1964, 19, 239-253. Staddon, J. E. R., & Simmelhag, V. L. The superstition experiment: A reexamination of its implications for the principles of adaptive behavior. Psychological Review, 1971, 78, 3-43. Thistlethwaite, D. A critical review of latent learning and related experiments. Psychological Bulletin, 1951, 48, 97-129. Thorndike, E. L. Animal intelligence: An experimental study of the associative processes in animals. Psychological Monographs, 1898, 2, 109. Thorndike, E. L. The psychology of learning. New York: Teachers College, 1913. Watson, J. B. Psychology from the standpoint of a behaviorist. Philadelphia: Lippincott, 1919. Weiss, B., & Laties, V. G. Behavioral thermoregulation. Science, 1961, 133, 1338-1344. Woodworth, R. S., & Schlosberg, H. Experimental psychology. (Rev. ed.) New York: Holt, Rinehart & Winston, 1954. Figure 2.2: Copyright 1938, 1954 by Holt, Rinehart and Winston, Inc. Copyright 1966 by Mrs. Greta Woodworth Herron, Svenson Woodworth, William Woodworth, and Virginia Woodworth. Reprinted by permission of Holt, Rinehart and Winston, Inc. Zener, K., & McCurdy, H. G. Analysis of motivation factors in conditioned behavior: I. Differential effect of change in hunger upon conditioned, unconditioned, and spontaneous salivary secretion. Journal of Psychology, 1939, 8, 321-350.

Seminario Interactum de Anlisis del Comportamiento UNIVERSIDAD DE SONORA