You are on page 1of 39

UNIVERSIDAD NACIONAL AUTONOMA

DE MEXICO

FACULTAD DE PSICOLOGIA

Aprendizaje y Conducta Adaptativa II


Unidad 1: Condicionamiento Instrumental

Rubén Ortiz Hernández


APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 A diferencia de la conducta refleja o respondiente, que


es provocada por estímulos que la anteceden y es
insensible a sus consecuencias, la conducta operante o
instrumental se caracteriza porque:
 a) No es provocada sino emitida (orientada a metas).

 b) Tiene control sobre las consecuencias y a su vez es


determinada por ellas.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 El estudio de la conducta instrumental se remonta a los


trabajos de Thorndike (1898, 1911) sobre la inteligencia
animal en las cajas problema.

 En su preparación, un gato privado de alimento era


introducido en una caja que podía abrirse mediante una
respuesta o secuencia de respuestas de complejidad
variable.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 Por ensayo y error, en algún momento el animal


realizaba la respuesta requerida, que tenía como
consecuencia inmediata el escape del encierro y el
acceso a comida fuera de la caja.

 Thorndike llevaba un registro sistemático del tiempo


(latencia) que tardaba el animal en cada ensayo en dar
la respuesta requerida para escapar.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 Conforme transcurrían los ensayos, la latencia del


escape disminuía, lo que es un indicador del aprendizaje
del animal.

 Thorndike sistematizó sus observaciones en su Ley del


Efecto: “En una situación estímulo determinada, las
respuestas que sean seguidas de un evento satisfactorio
se repetirán en circunstancias similares, mientras que
las que sean seguidas por un evento desagradable
tenderán a desaparecer”
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 Pese a las connotaciones de los términos elegidos


(satisfactorio, desagradable, etc) Thorndike insistió en
evitar las explicaciones antropomórficas en términos de
razonamiento o de emociones.

 Su “Ley del Efecto” sólo pretendía describir la relación


observada entre la conducta emitida en ciertas
condiciones estímulo y sus consecuencias.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL
 Siguiendo la tendencia dominante en la época, su
respuesta a la interrogante de qué es lo que se aprende
era una conexión estímulo-respuesta (E-R), es decir,
la conexión entre la situación estímulo previa y la
respuesta dada por el organismo en esa situación.
 En su esquema, la consecuencia (o efecto) no formaba
parte de la relación aprendida. Su función consistía
simplemente en “fortalecer” o “debilitar” la conexión
entre el estimulo previo y la respuesta.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL
 La situación experimental de Thorndike (la caja
problema) se conoce como ensayo discreto
caracterizado porque permite una sola respuesta por
ensayo (tanto en la caja problema como en los
laberintos el animal es sacado del aparato en cuanto da
la respuesta) .

 Dicha característica implica que las medidas apropiadas


del aprendizaje son la latencia o la velocidad de la
carrera.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 B. F. Skinner acuñó el término conducta operante para


referirse a la conducta no provocada, que permite al
organismo operar en el ambiente y producir cambios
que a su vez determinan la probabilidad de que dicha
conducta se repita.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL
 Skinner prefería el término conducta operante (una clase
de respuestas cuya pertenencia a la clase es
determinada por el efecto específico sobre el medio) al
de conducta instrumental, por considerar que ésta última
hacía referencia a un propósito.

 Aunque ambos términos hacen referencia al efecto de la


conducta en el medio, la conducta instrumental (a
diferencia de la operante) incluye además
características como la topografía o forma de la
conducta.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL
 A diferencia de la preparación de ensayo discreto
empleada por Thorndike, Skinner diseñó una
preparación conocida como operante libre que permite
el estudio más continuo de la conducta ya que no
impone restricciones a la emisión de la respuesta
operante.
 Lo anterior implicó el uso de otras medidas del
aprendizaje (como la frecuencia o la tasa de
respuestas) en lugar de la latencia o la velocidad.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

Términos de Términos de Términos de


Thorndike Skinner Domjan

Estado Estímulo Estímulo


placentero o reforzador apetitivo
satisfactorio positivo
Estado Estímulo Estímulo
desagradable o aversivo o aversivo
molesto reforzador
negativo
PROCEDIMIENTOS DEL
CONDICIONAMIENTO INSTRUMENTAL
Procedimiento Contingencia Tipo de estímulo Resultado

Reforzamiento Positiva: la Reforzador Aumenta la


positivo conducta suma positivo o probabilidad de
(+) un estímulo estímulo la conducta
apetitivo

Reforzamiento Negativa: la Estímulo Aumenta la


negativo conducta evita o aversivo probabilidad de
termina (-) un la conducta
estímulo
PROCEDIMIENTOS DEL
CONDICIONAMIENTO INSTRUMENTAL
Procedimiento Contingencia Tipo de estímulo Resultado

Castigo positivo Positiva: la Estímulo Disminuye la


conducta suma aversivo probabilidad de
(+) un estímulo la conducta

Castigo Negativa: la Reforzador Disminuye la


negativo (costo conducta resta positivo o probabilidad de
de respuesta, (-) un estímulo estímulo la conducta
¿RDO?) apetitivo
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 Para poder reforzar una conducta es necesario que esté


presente en el repertorio del sujeto o que se realice con
la frecuencia suficiente para poder reforzarla. En caso
contrario debe “moldearse” por medio del
Reforzamiento diferencial (combinación de
reforzamiento y extinción) de aproximaciones
sucesivas a la conducta meta.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
CONDICIONAMIENTO INSTRUMENTAL

 El moldeamiento supone:
 a) El planteamiento de la meta conductual
 b) Evaluación del nivel inicial del desempeño
 c) Dividir el entrenamiento en pasos (o
aproximaciones sucesivas) a la conducta meta.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Aunque los hallazgos confirman la idea de


Thorndike y Skinner de que el reforzamiento
fortalece una respuesta particular (el desarrollo
de una respuesta estereotipada), Neuringer
demostró la posibilidad de incrementar la
variabilidad (creatividad) de la respuesta si se
exige dicha variabilidad como requisito para el
reforzamiento.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Así como en el condicionamiento clásico se demostró
que ciertos aprendizajes eran más sencillos (por
ejemplo, aversión condicionada al sabor) o difíciles que
otros (como la asociación entre un sabor y una
descarga), también en el condicionamiento instrumental
se encontró que el aprendizaje depende de la relevancia
o pertinencia entre respuesta y reforzador; por ejemplo,
la imposibilidad de reforzar bostezos con el escape
(Thorndike) o la intromisión de conductas instintivas en
una secuencia aprendida (arrastre instintivo, Breland y
Breland, 1961)
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Diversos autores (Timberlake y Lucas, 1989;


Shettleworth, 1975) propusieron la aplicación de
la teoría de los sistemas de conducta a la
conducta instrumental.
 Según dicha teoría, si el animal se encuentra en
un estado motivacional (por ejemplo hambre) y
en una situación en que puede encontrar el
reforzador necesario, se activa el sistema
conductual pertinente, por lo que el animal
empieza a emitir las conductas del sistema.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Si al sistema conductual activado se le


sobrepone un condicionamiento instrumental, la
efectividad del procedimiento para fortalecer la
conducta instrumental exigida dependerá de la
compatibilidad de dicha conducta con el sistema
activado; de otro modo, las respuestas del
sistema activado irrumpirán en la secuencia
desplazando a la respuesta reforzada.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Timberlake et al (1982) probaron dicha predicción en un


procedimiento que comparaba procedimientos de
condicionamiento instrumental y condicionamiento
clásico.
 En una caja inclinada se liberaba un balín que rodaba de
un extremo a otro y salía por un hoyo. Las condiciones
experimentales eran las siguientes:
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
Procedimiento Descripción Resultados

Condicionamiento Los animales debían En ambos grupos las


operante hacer contacto con el ratas tocaban y
balín para obtener la manipulaban el balín,
comida aunque no fuera
necesario
Condicionamiento Se asociaba la Algunas incluso se lo
clásico presencia del balín llevaban a la boca (lo
(EC) con la comida trataban como si fuera
(EI). El animal no comida, como en el
tenía que responder arrastre instintivo)
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Algunas de las variables relacionadas con el


reforzador que influyen en el aprendizaje son:
 a. Cantidad y calidad del reforzador: en igualdad
de condiciones, los organismos prefieren
trabajar por reforzadores más grandes y de
mayor calidad.
 b. Cambios en la cantidad o calidad del
reforzador: los organismos han demostrado ser
sensibles a los cambios entre lo que recibían
antes y lo que reciben ahora.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Crespi (1942) fue el primero en describir los efectos del
cambio en la cantidad o calidad del reforzador:

 Los organismos que pasan de una recompensa grande


(digamos 22 pellas) a una pequeña (digamos 2 pellas)
muestran un deterioro en su desempeño en
comparación con los que siempre han recibido la
recompensa pequeña (CONTRASTE CONDUCTUAL
NEGATIVO)
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Los organismos que pasan de una recompensa


pequeña (digamos 2 pellas) a una recompensa grande
(digamos 22 pellas) muestran una mejora en su
desempeño en relación con los que siempre recibieron
la recompensa grande (CONTRASTE CONDUCTUAL
POSITIVO).
 Si bien es más común el hallazgo del contraste negativo
que del positivo, esto puede deberse a un efecto “de
techo”
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Otra variable que tiene una influencia definitiva en el
aprendizaje es el tipo de relación entre respuesta y
reforzador.

 a. Los estudios de Skinner sobre conducta supersticiosa


y los hallazgos sobre los efectos de la demora del
reforzamiento apuntan a la importancia de una relación
de contigüidad (cercanía temporal) entre respuesta y
reforzador.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 En los casos en que la consecuencia (reforzamiento o


castigo) es demorada, al aprendiz le resulta difícil
identificar la respuesta que ocasionó la consecuencia
(antes de presentar el reforzador o el estímulo aversivo)
pueden ocurrir muchas respuestas, una de las cuales
coincide con la consecuencia.

 Para evitar esa dificultad, pueden usarse reforzadores


condicionados o sistemas de marcado que faciliten la
identificación de la respuesta reforzada y permitan
salvar el lapso temporal entre respuesta y consecuencia.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 En su experimento sobre conducta supersticiosa


Skinner (1948) entregaba comida cada 15” a palomas
que no tenían que hacer nada para obtenerla
(programa no contingente de TF 15”).

 A pesar de que el reforzamiento era “gratuito”, las aves


desarrollaron “manerismos” que Skinner atribuyó al
reforzamiento accidental, de ahí el nombre de conducta
supersticiosa.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Su conclusión fue que la condición necesaria y suficiente


para aprender era la contigüidad entre respuesta y
reforzador, sin que fuera menester la existencia de una
relación causal (de contingencia) entre ellos.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 La repetición del experimento de superstición por John


Staddon y Virginia Simmelhag (1971) obligó a replantear
las conclusiones de Skinner.
 El hallazgo principal de esta repetición fue la
observación de que la presentación periódica de
reforzadores daba lugar a una organización temporal
de la conducta en dos categorías principales:
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Conductas interinas: ocurridas sobre todo a la mitad


del intervalo entre presentaciones del reforzador.

 Conductas terminales. ocurridas sobre todo al final


del intervalo, cuando era inminente la entrega del
reforzador, e inmediatamente después de la entrega.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Las respuestas interinas y terminales eran similares


entre todas las aves, y a diferencia de Skinner, Staddon
y Simmelhag no encontraron evidencia de reforzamiento
accidental.

 Staddon y Simmelhag concluyeron que las respuestas


terminales son respuestas innatas en anticipación del
reforzamiento y que las interinas obedecen a otras
fuentes de motivación.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Trabajos posteriores condujeron a reinterpretar los


resultados de Staddon y Simmelhag en el contexto de la
teoría de sistemas según la cual, la presentación del EI
(o reforzador primario) activa el sistema de conducta
pertinente para ese estímulo, dicho sistema incluye:
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

PRESENTACIÓN
DEL EI

CONDUCTAS DE CONDUCTAS DE
CONDUCTA
BÚSQUEDA BÚSQUEDA
CONSUMATORIA
GENERAL FOCALIZADA
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Según la interpretación de la teoría de sistemas, la
presentación periódica de comida activa el sistema
motivacional alimenticio junto con las respuestas
preorganizadas y específicas de la especie.

 Según esta teoría, la presentación de diferentes EI


debería activar sistemas distintos y por ende, deberían
observarse respuestas diferentes, predicción
confirmada por la investigación posterior
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Otra variable fundamental para el aprendizaje es la
existencia de una relación de contingencia (causalidad)
entre la respuesta y su consecuencia (reforzamiento o
castigo).

 En esencia, la relación de contingencia implica que la


respuesta controla la consecuencia de la misma (el
reforzamiento o el castigo deben ser más probables en
presencia que en ausencia de la conducta)
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL

 Una evidencia importante sobre la sensibilidad de los


organismos a la contingencia entre respuesta y
consecuencia (o controlabilidad de las consecuencias)
proviene de los estudios de Seligman, Overmier y Maier
en el campo del DESAMPARO APRENDIDO.
 Mediante un diseño triádico, demostraron que la
experiencia previa de control o falta de control sobre los
eventos importantes determina la posibilidad del
aprendizaje posterior.
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
DISEÑO TRIÁDICO

Grupo Fase de Fase de Resultado


exposición condiciona
miento
Grupo de Descarga Entrenamiento Aprendizaje
escape- rápido
escape escapable evitación

Grupo Descarga Entrenamiento Aprendizaje


inescapable escape- lento
acoplado evitación

Grupo Sin descarga, Entrenamiento Aprendizaje


control confinado en escape- rápido
evitación
el aparato
APRENDIZAJE Y CONDUCTA ADAPTATIVA II:
ELEMENTOS DEL CONDICIONAMIENTO
INSTRUMENTAL
 Es importante distinguir entre el efecto y la hipótesis
del desamparo aprendido.
 El efecto del desamparo aprendido es la descripción
de que la exposición a una descarga incontrolable
impedía o dificultaba luego el aprendizaje posterior.
 La hipótesis del desamparo aprendido es el intento
de explicar el hallazgo asumiendo que dado que los
animales pueden percibir la existencia o inexistencia de
una relación de contingencia en el fenómeno de
desamparo aprenden que nada de lo que hagan podrá
controlar lo que sucede en su vida.

You might also like