You are on page 1of 5

INSTITUTO POLITECNICO NACIONAL

CENTRO INTERDISCIPLINARIO DE
CIENCIAS DE LA SALUD UNIDAD SANTO
TOMAS

ALUMNA: LUNA CERON MARIA DEL CARMEN


GRUPO: 2PV21

PSICOLOGIA

TEORIAS DE APRENDIZAJE
PROFESOR: Dr. LUIS JESUS LOPEZ ROMERO

RESUMEN CAPITULO 5 DOMJAN


Primeras Investigaciones Condicionamiento Instrumental

El condicionamiento operante, tambin llamado condicionamiento instrumental, es una


forma de aprendizaje en el que una respuesta voluntaria se refuerza o debilita segn
sus consecuencias, ya sean estas positivas o negativas.

A diferencia del condicionamiento clsico, donde los comportamientos son las


respuestas biolgicas naturales a la presencia de estmulos como el alimento, el agua,
el dolor, etc., en el condicionamiento operante, un organismo opera en su ambiente y
efecta respuestas voluntarias para producir un resultado deseable: los organismos
tienden a repetir las respuestas que se acompaen de consecuencias favorables.

Este condicionamiento fue descubierto por el norteamericano E. L. Thorndike, ms o


menos en la misma poca en que Pavlov haca sus experimentos con perros.

Thorndike es considerado un antecesor de la psicologa conductista estadounidense.


Sus principales aportaciones fueron el aprendizaje por desarrollo y error, y la ley del
efecto. El desarrollo de sus investigaciones estuvo apoyado en el estudio de animales,
en concreto gatos, utilizando herramientas como la caja rompecabezas o caja
problema. De acuerdo con Thorndike, hay dos tipos de aprendizaje: El
condicionamiento clsico, que consiste en aprender la relacin entre s de varios
sucesos del entorno y el condicionamiento instrumental, que consiste en aprender la
relacin entre varios eventos contextuales y el comportamiento.

Thorndike desarrollo sus experimentos con gatos, perros y gallinas, privndolos de su


libertad hasta que los mismos hicieran algo para poder salir o recibir comida. Es decir,
trabaj con un condicionamiento instrumental (relacin entre el comportamiento y
sucesos contextuales significativos, como premios y castigos). Encontr que a
ms intentos que haca el animal, menor tiempo usaba para escapar. Segn l, el
proceso de aprendizaje se puede reducir a varias leyes: la ley de la disposicin, que
establece la preparacin de las conducciones neurolgicas en la conexin estmulo-
respuesta, la ley del ejercicio o del uso y desuso, en la que la conexin estmulo-
respuesta se refuerza con la prctica o a la inversa y la ley del efecto, la ms
importante de ellas, que describe cmo en el proceso de ensayo y error, si se produce
una respuesta seguida por una satisfaccin, la conexin se hace ms fuerte y conduce
a su aprendizaje, y al contrario, si hay un displacer o refuerzo negativo, la conexin
estmulo-respuesta se debilita y acaba desapareciendo.

Utilizo libros apilados simulando paredes, construyendo laberintos donde los sujetos
experimentales tenan que encontrar la salida que conduca a otro laberinto,
mostrando notable tensin, pero tras varios ensayos finalmente los animales lograban
encontrar la salida. Conforme pasaba el tiempo y los ensayos se repetan, los sujetos
lograban encontrar la salida con mayor rapidez, indicando asi que haban aprendido a
escapar.

Los estudios ms famosos sobre el condicionamiento operante se deben al tambin


norteamericano B. F. Skinner, este personaje utiliza tambin animales, ratas y
palomas, principalmente. Skinner ide un mecanismo: "la caja de Skinner" dispuesto
de tal manera que cada vez que se presiona cierta tecla se tiene acceso a la trampilla
donde se encuentra la comida, que en este caso es el refuerzo que consigue la
consolidacin de una conducta en el animal.
Este aprendizaje se denomina "operante" porque el sujeto aprende a realizar ciertos
comportamientos. Para ello son fundamentales los refuerzos y castigos: un castigo,
este es cualquier acto o estmulo que sigue a una conducta y que aumenta la
probabilidad de que sea repetida en el futuro; Existe tanto reforzador positivo como
negativo. El positivo es un objeto, evento o conducta que incrementa la frecuencia de
la respuesta; ocurre cuando una respuesta se fortalece porque se acompaa de un
estmulo reforzante y es el ms efectivo.

El reforzador negativo se produce cuando una respuesta se fortalece porque se


acompaa de la eliminacin de un estmulo aversivo (desagradable); Por ejemplo los
animales que aprenden a presionar palancas para evitar descargas elctricas.

Por otra parte el castigo es en s un evento que resulta desagradable (doloroso,


lastimoso) a quien lo recibe; el propsito fundamental del castigo es evitar que una
conducta se repita.

Dentro del condicionamiento operante existen dos trminos que vale la pena
mencionar: Extincin y programas de reforzamiento, el primero ocurre como resultado
del debilitamiento y desapariciones graduales de una tendencia a responder en cierta
forma a un estimulo porque la respuesta no se acompaa de un reforzador. Un
ejemplo de esto seria que el investigador deja de dar alimento cuando la rata oprime
la palanca; El segundo trmino vienen siendo patrones o reglas que indican el
momento y la forma en que la aparicin de una respuesta va a ir seguida de un
reforzador. Estos programas incluyen en el aprendizaje de la conducta y en como sta
se mantiene.

Existen dos categoras importantes:

Reforzamiento continuo: cada respuesta da lugar a un reforzador; por ejemplo, la


paloma va a recibir comida cada vez que picotee una tecla determinada.

Reforzamiento intermitente: las respuestas slo se refuerzan algunas veces; por


ejemplo, una persona que juega a las mquinas recibe el refuerzo o el premio cada
cierto tiempo.

APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO


INSTRUMENTAL

Procedimientos de ensayo discreto

Los procedimientos de ensayo discreto son similares al mtodo de Thorndike, en el


que cada ensayo del entrenamiento acaba con la retirada del animal del aparato, y a la
respuesta instrumental se realiza slo una vez durante cada ensayo. Este tipo de
ensayos son realizados principalmente con laberintos para ratas, existiendo dos tipos;
el corredor (pasadizo recto), y el laberinto en T (una T que implica una decisin de
camino a tomar). Se coloca a la rata en la caja de salida al comienzo y se permite a la
rata caminar a lo largo del corredor hasta alcanzar la caja meta que contiene un
reforzador (comida o agua). La conducta en el laberinto puede cuantificarse midiendo
la velocidad de la carrera (normalmente aumenta con ensayos de entrenamiento
repetidos). Otra medida comn es la latencia, el tiempo que tarda el animal en
abandonar la caja de salida y empezar a desplazarse por el pasadizo. Las latencias se
hacen ms cortas segn progresa el entrenamiento.

Procedimientos de operante libre

En el caso anterior el animal tiene limitadas oportunidades de responder, y estn


programadas por el experimentador. En los procedimientos de operante libre se
permite al animal que repita la respuesta instrumental una y otra vez sin restricciones.

Skinner propuso el concepto de operante como la forma de dividir la conducta en


unidades medibles con significado. Una respuesta operante, como presionar una
palanca, se define a partir del efecto que produce en el ambiente. Las actividades que
provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta
operante. El elemento fundamental no son los msculos involucrados en la conducta,
sino la forma en la que la conducta opera en el ambiente. Se asume que las diversas
formas de presionar la palanca son funcionalmente equivalentes porque todas tienen
el mismo efecto en el medio.

Entrenamiento y moldeamiento al comedero La mayora de las ratas situadas en una


caja de Skinner no presionan la palanca con frecuencia (se necesitan unos pasos
preliminares). Primero tienen que aprender cuando est disponible la comida en el
comedero mediante condicionamiento clsico (sonido dispensador-bolita de comida).
El sonido elicita una respuesta seguimiento del signo (aproximacin al comedero).
Esta fase se denomina entrenamiento al comedero.

Posteriormente el animal est preparado para aprender la respuesta instrumental.

Para facilitar la adquisicin de una nueva respuesta operante, los experimentadores


inicialmente entregan comida si el animal hace algo remotamente relacionada con la
respuesta deseada. Posteriormente se restringe el rango de respuesta asociadas con
bolita de comida, hasta finalmente conseguir la respuesta deseada (ej. inicialmente se
da comida si la rata se pone sobre dos patas, posteriormente se da comida slo si lo
hace sobre la palanca, y finalmente slo si presiona la palanca). Esta secuencia de
pasos se denomina moldeamiento. El moldeamiento incluye dos tcticas
complementarias: reforzamiento de aproximaciones sucesivas a la respuesta
requerida, y no reforzamiento de las formas de respuesta ms tempranas.

La forma en que el organismo cumple la operacin requerida en el ambiente no


importa. Sin embargo, los pasos utilizados en el moldeamiento de la conducta afectan
a la forma de realizar la respuesta, Moldeamiento y nueva conducta Los procedimiento
de moldeamiento sin utilizados a menudo para generar una nueva conducta; pero
hasta que punto son nuevas esas respuestas? Al ensear a la rata a presionar la
barra, el investigador no le est enseando nuevos componentes de respuestas; le
est inculcando como combinar respuesta familiares en una nueva actividad. El
condicionamiento instrumental incluye a menudo la construccin de una nueva unidad
conductual a partir de componentes de respuesta preexistentes que ya se encuentran
en el repertorio del sujeto. El condicionamiento instrumental puede tambin utilizarse
para producir respuestas que no se parecen en nada a lo que el individuo es probable
que haga sin entrenamiento.

En experimentos con palomas que picoteaban una tecla (con una apertura de pico
diferente segn el ensayo), se comprob que se poda ensear a las palomas a
picotear la tecla con aperturas cada vez mayores premindolas segn se iba
incrementando la apertura. Esta variabilidad de las respuestas ayuda a asegurar que
al menos algunas de las respuestas que suceden lo hagan en la direccin en la que se
quiere moldear la conducta. Por tanto, el moldeamiento aprovecha la variabilidad
inherente de la conducta. Sin esta variabilidad, los procedimientos de moldeamiento
no tendran xito.

El moldeamiento puede producir nuevas formas de respuesta, nunca antes realizadas


por el organismo.

LA TASA DE RESPUESTA COMO MEDIDA DE LA CONDUCTA OPERANTE

Los mtodos de operante libre permiten al organismo determinar la frecuencia de su


respuesta instrumental. Las tcnicas de operante libre proporcionan una ocasin
especial para observar los cambios en la probabilidad de la conducta a lo largo del
tiempo. Skinner propuso que la tasa de ocurrencia de una conducta operante
(frecuencia de la respuesta por minuto) se utilizase como una medida de la
probabilidad de la respuesta. (Las medidas de latencia y velocidad en los ensayos
discretos no permiten que se repita la respuesta).

PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

En todas las situaciones de condicionamiento instrumental, el sujeto realiza una


respuesta y por tanto produce una consecuencia. Una consecuencia placentera se
denomina estmulo apetitivo, y una consecuencia molesta se denomina estmulo
aversivo. La respuesta instrumental puede proporcionar un estmulo dando lugar a una
contingencia positiva entre la respuesta y su estmulo consecuente. La respuesta
instrumental puede retirar o eliminar un estmulo dando lugar a una contingencia
negativa. Que el resultado de un procedimiento de condicionamiento sea un aumento
o una disminucin en la tasa de respuesta depende tanto de la contingencia
respuesta-consecuencia como de la naturaleza de la consecuencia.