You are on page 1of 3

Regla De Peso Temporal 1

Efectos de la integración de diferentes


respuestas en la regla de peso temporal

Daniel Ortega; Giordano Montiel y Ricardo Pichardo

Universidad Univer Milenium


Plantel Ciencias de la Salud Toluca Estado de México

Proyecto

Jueves 1 de Marzo del 2018


Regla De Peso Temporal 2

En al investigación respecto a la conducta de selección se hace referencia a las causas


que provocan que los operantes ejecuten una u otra conducta ante varias opciones de
respuesta. En diversos estudios con humanos (Hastie y Dawers, 2001) se habla sobre una
“deliveración racional” para formular situaciones donde se racionaliza hacer de las diferentes
opciones de respuesta. Como la elección que se lleva a cabo al momento de comprar viveres
en el supermercado o cuando elegimos una ruta para evitar congestionamiento veicular. Sin
embargo en los estudios con animales humanos y no humanos es complicado observar esta
reflexión, lo que dificulta el estudio de dicha elección de respuesta. A pesar de ello existen
investigaciones que han intentado hacer evidentes si los mecanismos psicológicos que estan
implicitos son iguales entre animales humanos y no humanos.
En un articulo se citan diferentes lineas de investigación respecto a la elección de
respuesta:

En la literatura de condicionamiento operante el estudio de la elección se ha


llevado a cabo a partir del estudio de programas concurrentes en los que 2 o más
programas de reforzamiento están disponibles simultáneamente cada uno con un
manipulado diferente, y el sujeto o participante es libre de distribuir sus respuestas
entre alternativas disponibles (Herrnstein, 1961). A partir de estos programas se
han desarrollado diferentes procedimientos experimentales y modelos teóricos
para explicar la conducta de elección en diferentes situaciones experimentales. Por
ejemplo, la ley de igualación (Davison y McCrthy, 1988; Williams, 1988), el
modelo de elección contextual de (Grace, 1994;1996), o la teoría de la reducción
de la demora (Fantino, 1969). Estos modelos hacen diferentes suposiciones sobre
los mecanismos de la conducta de elección y cada uno ha proporcionado resultados
significativos con un gran número de experimentos en programas concurrentes
(Mazur, 2001). (López-Romero, Alvarado, Cabrera, Luna y Vila, 2013).

Mazur, (1996) estudió el efecto de la posible integración de experiencias


anteriormente reforzadas durante multiples bloques de entrenamiento en una última elección
entre varias opciones de respuesta. Diseñó un experimento donde registró las respuestas en
palomas usando un programa concurrente de reforzamiento en el que cambiaba la magnitud
de reforzamiento relativo a cada uno de los elementos del diseño de forma sucesiva durante
varios ensayos. Una primera condición contenia en una de la opciones un reforzador con
“mayor saliencia” en comparación con la otra, y en la segunda condición ambas opciones
tenian el mismo valor en saliencia durante los ensayos restantes. Los resultados de su
experimento demostrron un a preferente inclinación en la ultima sesion por la opcion que
proporcionaba mayor saliencia y hubo indiferencia en la eleccion bije el contexto donde
varias opciones tenia la misma cantdad de reforzamiento. Mas sin en cambio la preferencia
de respuesta cambiaba luego de un ntervalo de 24 hrs dentro de la condicion en la una de la
opciones era mas saliente. Pero en la otra condicion donde las dos opciones contienen el
mismo reforzamiento durante todos los ensyos en la eleccion despues de 24 hrs se notó
indiferencia entre las opciones de respuesta.
Regla De Peso Temporal 3

Se ha demostrado que la integración de la información de eventos pasados determina


la elección de respuestas en eventos presentes, según la regla de peso temporal (RPT)
propuesta por Devenport, (1998). La configuración de la integración estrá sujeta a parametros
temporales. Cuando se aprenden dos experiencias, durante una prueba inmediata la
experiencia más reciente adquiere mayor peso, pero con el continuar del tiempo en una
prueba posrterior, ambas experiencias serán equivalentes en su peso, en otras palabras, la
recencia desaparece, y el valor subjetivo de las dos experiencias será similar.
La integración de información basada en dos parameros basicosde las experiencias y el
aprendizaje ; distancia temporal relativa (recencia) y el valor subjetivo que tiene (Davenport
y Davenport, 1994). La regla de peso temporal expresa una relacion inversa entre estos dos
factores, dicho en otras palabras; cuando el peso de la recencia es mayor, eel peso del valor
subjetivo es menos y viseversa. Los factores se muestran en la siguiente formula:
AQUÍ VA LA PINCHE FORMULA LOKA
Donde vw representa el valor de estimación temporal de una experiencia, Q el valor subjetivo
estimado y 1/T el valor de recencia. Cuando se requiere una respuesta de elección entre dos
alternativas, se debe calcular el valor de estimación temportal de una segunda experiencia
ademas se debe tener en cuenta la estimación temporal total de ambas experiencias, lo que
se expresa en la ecuacion 2. Donde la elección de la opción B es la proporción de vwB en
relación a vwA: (2) vwB= vwB/vwA+vwB
La RPT supone la integración de las experiencias vividas en base a dos variables, la recencia
(distancia temporal relativa 1/T) y el valor subjetivo (Q), en la ecuación 1 se representa como
(Q * 1/T) el cual va cambiando con el avance del tiempo, asiendi así que Q aumente al
disminuir 1/T y esto lleva a que las experiencias tieneden a igualarse una vez perdida la
recencia por lo que se mostrará la elección de la experiencia que haya adquirido un mayor
valor subjetivo (Q).
Una posible predicción básica basada en estas ideas seria que al aumentar el intervalo de
retención luego de un entrenamiento de dos experiencias (A y B) la elección dependera de la
recencia de cada elección y de su valor subjetivo. Cuando el valor es mayor en A, durante
una prueba inmediata se elegirá la ultima opción reforzada. Sin embargo al aumentar el
intervalo de retención entrenamiento-prueba se notara un efecto de recencia-primicía en
donde habrá una preferencia por A e incrementa proporcionalmente al aumentar el intervalo
de retención de una prueba con demora, esto debido a que el valor que tiene A es en promedio
mayor al que tiene B (Vila, López-Romero y Alvarado. 2010).