Professional Documents
Culture Documents
Cap 2 Resumen - Largo
Cap 2 Resumen - Largo
ID=A∕N
ID= p- =
Donde:
p= proporción de aciertos (índice de dificultad sin
corregir)
q=proporción de fallos
k=número de alternativas del ítem
A=aciertos
E=errores
N=total
El ID no es una propiedad intrínseca del ítem, su valor
depende de la muestra de sujetos a la que se aplique.
Los valores del índice de dificultad de un ítem se suelen clasificar en cinco categorías:
2.2. Discriminación
Determina la selectividad de la pregunta para distinguir o
diferenciar el grupo que tiene mayor cantidad de aciertos
en la misma, frente al de menos aciertos. Un ítem
discrimina cuando existe correlación positiva entre la
puntuación obtenida en el ítem con la puntuación
obtenida en el test, desde este punto de vista el índice de
discriminación da una idea de la homogeneidad del ítem
en relación al test. Va de -1 a +1.
P+ representa la proporción de individuos del extremo
superior que aciertan el ítem
p- representa la proporción de individuos del extremo
inferior que aciertan el ítem
Variabilidad y discriminación
La variabilidad en el test está relacionada con el índice de
discriminación
donde:
Sx= desviación típica del test
Sj= desviación típica del ítem
rjx= índice de discriminación del ítem j
(1)
Y como var(X)=var(v)+var(e)
(2)
Error típico de medida
Si nos fijamos en el segundo aspecto de la fiabilidad,
tendremos que hablar de fiabilidad absoluta definida en
términos de error típico de la medida.
Si repetimos indefinidamente un test a un alumno, la
media de las puntuaciones nos indicará el verdadero valor
de la puntuación, de la misma forma la desviación típica
de las puntuaciones respecto a la media verdadera es el
error típico.
La estimación de estos parámetros será.-
Operando la fórmula (2) tenemos la expresión del error
típico de medida:
VALIDEZ PREDICTIVA
Es la capacidad que tiene la prueba para avanzar
expectativas sobre acontecimientos futuros. Ej.: Hemos
elaborado una prueba de comprensión lectora (x), y la
pasamos a los alumnos partiendo de la hipótesis que una
mayor comprensión lectora, redundará en un mayor
aprovechamiento en el estudio de las materias. Al final
del curso se calcula la correlación entre la prueba de
comprensión lectora (x) y los resultados académicos o
criterio (y).
La predicción es uno de los objetivos de todo trabajo
científico. La forma de obtener un indicador de esta
predicción, es determinar la correlación entre las
puntuaciones obtenidas por los sujetos en la prueba con
alguna otra medida.
Cuando se desea realizar pronósticos sobre una variable
externa (criterio) con el instrumento de medida
construido, se necesita valorar el grado de relación de
cada ítem con dicho criterio, esta relación se valorará con
el llamado índice de validez del ítem que no es otra cosa
que la correlación entre el ítem y el criterio. No implica
validez de contenido
VALIDEZ CONCURRENTE
Es una variante de la predictiva. En la la medida de la
validez predictiva el intervalo de tiempo entre la
aplicación de la prueba y la prueba criterio es más largo
que en el caso de la validez concurrente. Las medidas se
hacen simultáneamente con el fin de tomar decisiones en
un plazo breve. Tampoco implica validez de contenido
2.6. Dimensionalidad
Los test tienen como objetivo medir una variable de
interés. Que se puede concretar en una o más
dimensiones. Uno de los aspectos más importante a
medir es la dimensionalidad del test. Para realizar dicho
estudio la metodología más apropiada es el análisis
factorial de los ítems, con objeto de observar la
agrupación de los ítems en uno o más factores.
El análisis factorial es una técnica estadística de reducción
de dimensión que trabaja con la matriz de correlaciones o
covarianzas como entrada. Si los ítems son dicotómicos la
matriz de correlaciones se construirá con las
correlaciones tetracóricas y si los ítems son categóricos, la
matriz de correlaciones más apropiada será las
correlaciones policóricas.
Las técnicas de factorización más usadas son el método
de componentes principales y el método de ejes
factoriales.
3.1. Supuestos
El primer supuesto, unidimensionalidad, exige que la
respuesta al ítem esté determinada exclusivamente por
una variable, denominada rasgo latente.
El segundo supuesto, independencia local, exige que la
probabilidad de responder correctamente a un ítem sea
independiente de la probabilidad de responder a otro
cualquiera.
3.2 Modelos
Los postulados básicos de la TRI son los siguientes:
1. El resultado de un individuo en un ítem puede ser
explicado por un conjunto de factores llamados rasgos
latentes o aptitudes que simbolizan por ϴ.
2. La relación entre la respuesta de un sujeto a un ítem y
el rasgo latente subyacente puede describirse como una
función monótona creciente que se llama función
característica del ítem o curva característica del ítem
(CCI). Se cumple que a medida que la aptitud (ϴ)
aumenta la probabilidad de una respuesta correcta el
ítem también aumenta. Recordemos que en la TCT la
función era lineal X=V+e
3. Las estimaciones de la aptitud o rasgo latente (ϴ)
obtenidas con distintos ítem serían iguales y las
estimaciones de los parámetros de los ítems obtenidos en
distintas muestras de individuos serán iguales.
Donde:
Pi(ϴ) representa la probabilidad de acertar el ítem i para
un valor de ϴ
bi expresa el índice de dificultad del ítem i
D es una constante que cuando toma el valor de 1’7 la
función logística se aproxima a la normal acumulada.
El parámetro ϴ es el rasgo latente no observado, es una
variable continua cuyo rango va del –infinito al + infinito.
No obstante se considera estandarizado (puntuaciones Z)
y su recorrido como en la curva normal irá de +3 a+3.
El modelo de dos parámetros toma la expresión:
Donde:
PVj representa la puntuación verdadera que corresponde
a individuos con un nivel en el rasgo latente de ϴj
n el número de ítems del test
Pi(ϴj) el valor de cada CCI para ϴ=ϴj
La CCT es la relación entre la puntuación verdadera y la
escala de aptitud, así que si conocemos
automáticamente sabremos calcular el valor de la
puntuación verdadera para ese nivel de aptitud.
En los test de referencia criterial basados en estándares,
se fija la proporción de aciertos para un nivel de aptitud.
Su expresión es la siguiente:
Donde
Ii (ϴ) cantidad de información del ítem i en el nivel ϴ
D constante de escala: 1’7
Pi (ϴ) probabilidad de acierto en el ítem i
Qi (ϴ)= 1-Pi(ϴ)
En el modelo de dos parámetros:
a es el índice de discriminación
En los modelos de uno y dos parámetros la información
será máxima paraϴ=b.
En el modelo de tres parámetros:
4. APLICACIONES DE LA TRI
Banco de ítems.
Dos son las facetas para controlar en la conformación del
banco: la construcción de los ítems donde se debe
respetar la unidimensionalidad de los ítems del banco y la
elaboración de los test con unas determinadas
características.
Equiparación de puntuaciones
Consiste en establecer una correspondencia entre las
puntuaciones de los test, que miden la misma variable y
con la misma fiabilidad.
Dentro de la TRI, el establecimiento de equivalencia entre
los test es innecesario, otra cuestión es establecer
relación entre las puntuaciones estimadas de cada test o
entre las empíricas.
Funcionamiento diferencial de los ítems
Se pretende estudiar si existe distinto comportamiento de
los ítems en función de diferentes grupos. Para realizar tal
estudio el procedimiento es utilizar la curva característica
del ítem para los dos (o más) grupos analizados y ver si
existe diferencia entre las mismas. Uno de los métodos
más utilizados es el cálculo de las diferencias de
probabilidades correspondientes a ambas curvas:
Test adaptativos
Un Test Adaptativo Informatizado (TAI) presenta los ítems
y recoge las respuestas de la persona utilizando un
ordenador. Lo más genuino es su capacidad para
adaptarse al rendimiento de la persona que está siendo
medida.