You are on page 1of 29

Tema 5

Psicometría

Fiabilidad de los test I


Índice
Esquema 3

Ideas clave 4
5.1. ¿Cómo estudiar este tema? 4
5.2. Fiabilidad y error 4
5.3. Fiabilidad como correlación entre formas
paralelas 7
5.4. Fiabilidad como estabilidad temporal 8
5.5. Fiabilidad como consistencia interna 10
5.6. Fiabilidad como acuerdo entre jueces 19
© Universidad Internacional de La Rioja (UNIR)

5.7. Referencias bibliográficas 20

Lo + recomendado 22

+ Información 25

Test 27
© Universidad Internacional de La Rioja (UNIR)

FIABILIDAD DE LOS TEST I

ERROR
(E)

Términos relevantes
Conducta Constructo
observable (V)
(X) Fiabilidad

Tipos de test

Fiabilidad como correlación entre formas paralelas: Fiabilidad como estabilidad temporal:
- Procedimiento: construir dos formas paralelas y - Procedimiento: aplicar una prueba dos veces a la misma
aplicarlas a la muestra. muestra.
- Interpretación: proporción de varianza de X - Interpretación: estabilidad de las puntuaciones a lo
explicada por V. largo del tiempo.
- Problema: generar formas paralelas. - Problemas: efecto de aprendizaje, de congruencia y
cambio de actitud.
Consistencia interna:
- Procedimiento: aplicar una prueba a una muestra y Acuerdo entre jueces:
dividirla en partes. - Procedimiento: dos o más observadores ven la conducta
- Interpretación: consistencia entre las diferentes de una persona.
partes. - Interpretación: grado de acuerdo entre evaluadores.
- Problemas: división de la prueba, ítems solo - Problemas: cambio de criterio de los jueces y su
homogéneos, test no de velocidad. entrenamiento.
- Métodos: dos mitades y covarianza.

Psicometría
Tema 5. Esquema
Esquema

3
Ideas clave

5.1. ¿Cómo estudiar este tema?

Para estudiar este tema, deberás leer con atención las ideas clave que se desarrollan a
continuación.

E
n este tema se estudian los principales procedimientos para calcular la
fiabilidad de una prueba psicométrica. Primero, se repasarán qué relación
se da entre el error y la fiabilidad de una prueba y las principales fuentes de
error. Después, se aborda cómo se calcula la fiabilidad en el caso de considerar dos
pruebas paralelas para su cálculo. Seguiremos con cómo estimar la fiabilidad en el
caso de aplicar una prueba dos veces a una misma muestra tras un periodo de tiempo
(estabilidad temporal de la prueba). También veremos cómo calcular lo consistentes
que son los evaluados al responder a las diferentes partes que configuran una prueba.
Y finalmente, cómo poder calcular la fiabilidad de en un diseño observacional con el
procedimiento de acuerdo entre jueces.

5.2. Fiabilidad y error

C
uando medimos la longitud de una mesa con una cinta métrica siempre
obtendremos la misma longitud si repetimos la medición numerosas veces.
Igualmente, cuando pesamos un objeto en una báscula obtendremos
© Universidad Internacional de La Rioja (UNIR)

siempre el mismo peso, siempre que la báscula esté bien graduada. Por lo tanto,
podemos decir que en estos casos la medida de la longitud y peso son invariantes.
Sin embargo, en psicología, al tratar de medir un rasgo por medio de un instrumento
psicométrico no siempre se obtiene la misma puntuación en el test.

Psicometría
4
Tema 5. Ideas clave
La medida en cada aplicación presentará cierta variabilidad que atribuiremos a
diversos factores y denominaremos error de medida: las instrucciones, el momento
de aplicación, la muestra de evaluados, la situación de evaluación…

Como se puede ver en la figura 1, la conducta observada (X) se predice por el rasgo
psicológico o constructo teórico (V) y el error de medida (E).

Lo que predice V sería la fiabilidad de la prueba, de tal modo que a mayor fiabilidad,
menor sería el error de medida. Desde este punto de vista, la medida de X sería la
variable dependiente y los predictores serían el error y el constructo.

ERROR
(E)

Conducta
Constructo
observable
(V)
(X)
Fiabilidad

Figura 1. Predicción de la puntuación observada (X) a partir de V y E.

La fiabilidad se refiere a la estabilidad a lo largo del tiempo, la precisión o


consistencia entre los ítems de una prueba a la hora de tratar de medir un
rasgo psicológico.

La fiabilidad se refiere al grado de replicabilidad de la medida de la conducta


observada (X) que permite calcular este índice de varios modos (Abad, Olea, Ponsoda
y García, 2011; Martínez, Hernández y Hernández, 2006):
© Universidad Internacional de La Rioja (UNIR)

 Equivalencia entre formas: calcular la correlación de dos formas paralelas o


equivalentes con el propósito de ver si los resultados se replican en ambas
formas. A mayor parecido en ambas formas, mayor fiabilidad.
 Estabilidad temporal: estudiar si se replican los resultados en una prueba que se
aplica dos veces consecutivas después de un periodo de tiempo.

Psicometría
5
Tema 5. Ideas clave
 Consistencia interna: se refiere hasta qué punto las diferentes partes de un test
miden el mismo rasgo. La replicabilidad se daría si con diferentes partes de una
prueba se obtienen los mismos resultados.
 Acuerdo entre jueces: es el grado de acuerdo de dos o más observadores (jueces)
al analizar el comportamiento de una persona o grupo. La replicabilidad tendría
lugar cuando lo observado por un juez coincide con lo del otro.

Por otro lado, se puede hablar de diferentes fuentes de error que hacen disminuir la
fiabilidad de una prueba a la hora de tratar de estimar un rasgo (Abad et al., 2011):

 Factores transitorios: son aquellos factores que cambian entre dos aplicaciones
de una prueba a una misma muestra (edad, motivación, personalidad,
maduración, temperatura, instrucciones…). Estos factores disminuirán la fiabilidad
de la prueba. Una manera de solucionar este tipo de errores es aplicar la prueba
una vez. Hay que distinguir, además, entre dos tipos de periodos:
• Breves: cuando dejamos pasar poco tiempo entre las dos aplicaciones de la
prueba. Se puede dar un efecto de aprendizaje, lo que incrementaría la
fiabilidad de la prueba artificialmente. Afectaría principalmente a los test de
rendimiento óptimo.
• Largos: si se deja pasar mucho tiempo entre las dos aplicaciones, se puede dar
un cambio en la actitud o maduración de los examinados y la fiabilidad bajaría
más de lo debido. Afecta sobre todo a los test de rendimiento típico.
 Factores específicos: se refiere a cambios debidos al contenido concreto de un
ítem. Un ítem que era adecuado hace cincuenta años, actualmente puede no
serlo, ya que su contenido está desactualizado. La manera de controlar este error
es estudiando cómo varía el rendimiento en la prueba de una persona a lo largo
de las diferentes partes del test. Este error no se detecta si la prueba se aplica dos
© Universidad Internacional de La Rioja (UNIR)

veces.
 Factores aleatorios: se deben a variaciones en la atención de los evaluados,
distracciones puntuales… No es necesario controlar este tipo de errores ya que
suceden aleatoriamente y el azar los controla.

Psicometría
6
Tema 5. Ideas clave
5.3. Fiabilidad como correlación entre formas
paralelas

S
i disponemos de dos formas paralelas con diferentes ítems, pero que miden
un mismo rasgo, podemos calcular la fiabilidad de la prueba correlacionando
ambas fórmulas. Recuérdese que dos formas son paralelas cuando poseen la
misma puntuación verdadera y la misma varianza error. En el caso de no poseer dos
formas paralelas, se pueden emplear medidas equivalentes.

Procedimiento

El que se emplearía para calcular la fiabilidad de una prueba sería el siguiente:

 Construir dos formas paralelas (𝑋 y 𝑋’) o equivalentes que midan un mismo rasgo.
 Aplicar las dos formas a una misma muestra.
 Correlacionar las puntuaciones de las dos formas entre sí: 𝜌𝑥𝑥’.

Interpretación

La correlación entre esas dos formas paralelas o equivalentes sería una estimación
del coeficiente de fiabilidad de la prueba y se interpretaría como la proporción de
varianza de la puntuación verdadera (𝑉) que explica la puntuación observada (𝑋). Por
ejemplo: si 𝜌𝑥𝑥’ = 0,85, esto implicaría que V explica un 85 % la puntuación 𝑋.

Este coeficiente de correlación, además, reflejaría el grado de paralelismo entre


© Universidad Internacional de La Rioja (UNIR)

ambas formas (Martínez Arias, 1996).

Psicometría
7
Tema 5. Ideas clave
Dificultad

La dificultad de este procedimiento de estimación de la fiabilidad es obtener formas


paralelas de una prueba, por lo que generalmente se trabajan con formas
equivalentes que no cumplen totalmente el paralelismo.

5.4. Fiabilidad como estabilidad temporal

U
n modo de calcular la fiabilidad de la prueba consiste en aplicar la misma
prueba dos veces consecutivas a los mismos evaluados dejando pasar un
periodo de tiempo entre ambas aplicaciones.

Procedimiento

El procedimiento de obtención de la fiabilidad en este caso sería el siguiente:

 Aplicamos una prueba a una muestra (test).


 Dejamos pasar un periodo de tiempo.
 Volvemos a aplicar la misma prueba a la misma muestra (retest).
 Calculamos la correlación entre las dos aplicaciones, es decir, la correlación test-
retest.

Interpretación

La fiabilidad obtenida de este modo es en realidad una estimación de la estabilidad


© Universidad Internacional de La Rioja (UNIR)

temporal de las puntuaciones en la prueba. Es decir, lo estable que son las


puntuaciones por el paso del tiempo. Cuanto más estables sean, mayor será la
fiabilidad de la medida. En realidad, no hay una prueba más paralela que la misma
medida aplicada dos veces.

Psicometría
8
Tema 5. Ideas clave
Problemas

Los problemas que presenta este procedimiento son los siguientes (Abad et al.,
2011):

 Efecto de aprendizaje: como hemos explicado antes, si el periodo entre las dos
aplicaciones es muy breve, puede pasar que los participantes conozcan los ítems
y se sobreestime la fiabilidad, ya que hay una mayor correlación de la que debería
entre las dos aplicaciones. Sucede principalmente en los test de rendimiento
óptimo.
 Efecto de congruencia: cuando los participantes intentan por todos los medios
responder lo mismo en las dos aplicaciones.
 Cambio de actitud: si el periodo es muy largo entre las aplicaciones, se pueden
dar cambios en la actitud o maduración de los evaluados y la correlación entre las
dos aplicaciones baje y por lo tanto se infraestima la fiabilidad. Sucede
principalmente en los test de rendimiento típico.

Para saber cuál es el periodo de tiempo adecuado entre cada prueba con el
procedimiento test-retest conviene consultar el manual de aplicación para seguir sus
recomendaciones.

La fiabilidad obtenida con este procedimiento no es una buena estimación de la


proporción de varianza que V explica de X (Abad et al., 2011).
© Universidad Internacional de La Rioja (UNIR)

Psicometría
9
Tema 5. Ideas clave
5.5. Fiabilidad como consistencia interna

E
n aquellos casos que solo es posible aplicar una prueba en una ocasión a
una muestra, se puede calcular la fiabilidad mediante el procedimiento
denominado de consistencia interna. En este procedimiento lo que se hace
es dividir la prueba en varias partes y correlacionarlas entre sí.

Procedimiento
Para estimar la fiabilidad con este procedimiento sería el siguiente:

 Aplicamos una prueba a una muestra.


 Dividir la prueba en varias partes equivalentes.
 Calcular la correlación entre esas partes de la prueba.

Interpretación

La correlación entre las diferentes partes de la prueba sería una medida de la


consistencia o concordancia entre las puntuaciones de los evaluados a las diferentes
partes de la prueba. Cuanto más consistentes sean en las respuestas, mayor será la
fiabilidad de la prueba.

Limitaciones

Las limitaciones que tiene este procedimiento son:

 Cómo dividir la prueba en varias partes equivalentes.


© Universidad Internacional de La Rioja (UNIR)

 No se puede aplicar en test heterogéneos, es decir, con ítems muy diferentes entre
sí.
 No es adecuado en test de velocidad, ya que al haber muchos ítems no
contestados se sobreestimaría la fiabilidad de la prueba.

Psicometría
10
Tema 5. Ideas clave
Métodos

Los métodos empleados para calcular la consistencia interna de una prueba han sido
los siguientes:

 Dos mitades: se aplicaría la fórmula general de Spearman-Brown en el caso


particular de que la longitud de la prueba sea dos, ya que estará formada por dos
partes paralelas.
 Covarianza: se calcula la covarianza o correlación entre los diferentes ítems que
configuren la prueba. Por lo tanto, cada ítem supone una parte de ella.

Método de dos mitades

El procedimiento consiste en dividir la prueba en dos partes paralelas o equivalentes


y posteriormente calcular la correlación entre las dos. Existen varias formas de dividir
la prueba y cada una de ellas produce diferentes valores de fiabilidad, por lo que
conviene elegir el método más adecuado para cada test:

 Ítems pares-impares configuran las dos partes. Se necesita que los ítems sean muy
homogéneos.
 Según la dificultad de los ítems, en el caso de test de rendimiento óptimo.
 Formar aleatoriamente las dos partes de la prueba, es necesario que los ítems
sean muy homogéneos.
 Según el contenido de los ítems, como sucede en los test de rendimiento típico

Si las dos partes de la prueba son paralelas, este índice es una buena estimación de
la proporción de varianza que V explicaría de la puntuación del test (X). Si no, sería
© Universidad Internacional de La Rioja (UNIR)

una estimación de la equivalencia de las dos formas.

El método empleado para calcular la fiabilidad cuando las formas son paralelas es la
fórmula General de Spearman-Brown en el caso particular de que la longitud sea 𝑛 =
2.

Psicometría
11
Tema 5. Ideas clave
2𝜌2𝑥𝑥’ 2𝜌2𝑥𝑥’
𝜌2𝑥𝑥’ = =
[1 + (2 − 1)𝜌2𝑥𝑥’ ] [1 + 𝜌2𝑥𝑥’ ]

Donde:
 𝜌𝑥𝑥’ es la correlación de las dos partes de la prueba.

Ejemplo 1.

Disponemos de una prueba que mide aptitud verbal en alumnos


de primaria formada por cuarenta ítems. Aplicamos la prueba a
una muestra representativa y dividimos la prueba en dos partes
paralelas obteniendo una correlación entre ambas de 0,60.
¿Cuál sería la fiabilidad de toda la prueba?

Ítem Ítem Ítem Ítem Ítem Ítem Ítem Ítem Parte Parte
S u jeto
1 2 3 4 5 6 7 7 par impar
1 3 4 3 3 3 4 4 4 13 15

2 3 1 2 3 2 4 1 1 8 9

3 3 2 4 3 4 1 4 4 15 10

4 2 3 1 1 3 1 2 1 8 6

5 1 4 2 1 3 2 4 3 10 10

6 2 5 3 2 4 2 4 4 13 13

7 2 2 4 2 3 4 2 2 11 10

8 1 2 3 1 3 1 3 1 10 5

9 1 2 2 2 3 2 5 2 11 8

10 4 3 1 1 2 3 4 3 11 10

Tabla 1. Puntuaciones en 8 ítems y la mitad par e impar de un test.


© Universidad Internacional de La Rioja (UNIR)

Psicometría
12
Tema 5. Ideas clave
Cálculo con R Commander

Para calcular la fiabilidad de Spearman-Brown procedemos del siguiente modo:

 Generamos la siguiente la base de datos en Excel de la tabla 1 y la cargamos con


R commander como ya vimos en un tema anterior.
 Seguimos los pasos que se indican en las figuras 2, 3 y 4.

La salida de resultados ofrece la matriz de correlaciones entre las dos partes de la


prueba. La correlación vale 0,613.

Aplicando la fórmula general de Spearman-Brown en el caso particular que n = 2


obtendremos la siguiente fiabilidad de la prueba:

2𝜌2𝑥𝑥’ 2 × 0,613
𝜌2𝑥𝑥’ = = = 0,76
[1 + 𝜌𝑥𝑥’ ] [1 + 0,613]

Figura 2. Cálculo de la fiabilidad con Spearmen-Brown. Paso 1.


Fuente: http://cran.r-project.org
© Universidad Internacional de La Rioja (UNIR)

Psicometría
13
Tema 5. Ideas clave
Figura 3. Cálculo de la fiabilidad con Spearmen-Brown. Paso 2.
Fuente: http://cran.r-project.org

Figura 4. Cálculo de la fiabilidad con Spearmen-Brown. Salida.


Fuente: http://cran.r-project.org

En el caso de que se disponga de medidas equivalentes y se quiera usar el


procedimiento de división en dos mitades, pueden emplearse las fórmulas de Rulon
y Guttman-Flanagan (véase Martínez et al., 2006 y Martínez, 1996).

Método de covarianza
© Universidad Internacional de La Rioja (UNIR)

En este caso no es necesario dividir la prueba en diferentes partes, ya que se asume


que cada ítem es una parte de la misma. Lo que se hace es correlacionar los diferentes
ítems entre sí y estimar la consistencia interna de la prueba.

Psicometría
14
Tema 5. Ideas clave
La covarianza entre ítems permite ver la concordancia o consistencia entre las
puntuaciones de las diferentes personas a los ítems que forman el test, es decir, el
grado en el que las medidas de las personas dependen de los ítems.

El método empleado para calcular la fiabilidad en este caso es el alfa de Cronbach:

𝐽 ∑𝑛𝐽=1 𝜎𝐽2
𝛼= (1 − )
𝐽−1 𝜎𝑥2

Donde:
 𝐽 es el número de ítems de la prueba.
 𝜎𝐽2 es la varianza de cada ítem de la prueba.
 𝜎𝑋2 es la varianza de toda la prueba.

El alfa de Cronbach es el límite inferior de la fiabilidad obtenida mediante la


fórmula General de Spearman-Brown, es decir, el alfa de Cronbach toma un
valor menor o igual que Spearman-Brown: 𝛼 ≤ 𝜌𝑥𝑥’ .

El alfa de Cronbach se puede interpretar como una estimación a la baja de la fiabilidad


de una prueba que está formada por ítems equivalentes (no paralelos). En el caso de
que los ítems sean paralelos, el alfa de Cronbach tomará un valor igual al obtenido
con la fórmula general de Spearman-Brown.

Los factores de los que depende el valor del alfa de Cronbach son los siguientes (Abad
et al., 2011):

 La correlación promedio entre los ítems de la prueba: a mayor correlación entre


© Universidad Internacional de La Rioja (UNIR)

los ítems, mayor será el alfa.


 El número de dimensiones que tenga la prueba: si solo recoge una dimensión, el
alfa tiende a ser mayor. Sin embargo, hay que tener presente que el alfa de
Cronbach no es un indicador de unidimensionalidad, es decir, un alfa elevado no
garantiza que la prueba solo mida una dimensión.

Psicometría
15
Tema 5. Ideas clave
 Del número de ítems que tenga la prueba: a mayor número de ítems, mayor alfa.

Los principales problemas o limitaciones del alfa de Cronbach se pueden resumir del
siguiente modo (Abad et al., 2011):

 No se debe aplicar en test de velocidad, ya que los ítems tienden a correlacionar


bastante alto entre sí y, por lo tanto, se sobreestimaría la fiabilidad de la prueba.
 Los ítems pueden correlacionar alto entre sí incluso en el caso de que tengan
contenido diferente.
 En una escala con múltiples dimensiones, es aconsejable calcular el alfa de
Cronbach para cada dimensión por separado.
 No conviene aumentar artificialmente el alfa añadiendo a la prueba ítems
redundantes (muy parecidos en contenido a los existentes).

Ejemplo 2

Con los mismos resultados de la prueba que mide ansiedad en


alumnos de primaria formada por 8 ítems que se recoge en la
tabla 1. ¿Cuál sería la consistencia interna de toda la prueba con
el procedimiento alfa de Cronbach? ¿Y la correlación de cada
ítem con el total de la prueba? ¿Qué ítems se deberían eliminar
con objeto de mejorar la fiabilidad de la prueba?
© Universidad Internacional de La Rioja (UNIR)

Psicometría
16
Tema 5. Ideas clave
Figura 5. Cálculo de la consistencia interna con alfa de Cronbach. Paso 1.
Fuente: http://cran.r-project.org

Figura 6. Cálculo de la consistencia interna con alfa de Cronbach.


Paso 2: seleccionamos todos los ítems de la prueba. Fuente: http://cran.r-project.org
© Universidad Internacional de La Rioja (UNIR)

Figura 7. Cálculo de la consistencia interna con alfa de Cronbach. Salida.


Fuente: http://cran.r-project.org

Psicometría
17
Tema 5. Ideas clave
Cálculo con R commander

Para calcular la consistencia interna procedemos del modo que se indica en las figuras
5, 6 y 7.

La salida de resultados ofrece los resultados de consistencia interna de la prueba


formada por 8 ítems que toma un valor de 0,628.

Además, aparece la correlación de cada ítem con el total de la prueba: r(ítem, total).
Ese valor es el índice de discriminación interna de cada ítem con respecto al total dela
prueba. Como ya vimos aquellos ítems con valores inferiores a 0,20 deberían ser
eliminados de la prueba ya que lograrían mejorar la fiabilidad de esta prueba.

La columna Alpha ofrece cuánto variaría la consistencia de la prueba si elimináramos


cada uno de los ítems. Como se puede ver si elimináramos el ítem 1 (rítem-total = 0,178)
la fiabilidad aumentaría a 0,633 y si se eliminará el ítem 6 (rítem-total = 0,044) la
fiabilidad subiría a 0,680.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
18
Tema 5. Ideas clave
Ejemplo 3

En la siguiente tabla se ofrece una matriz de varianzas-


covarianzas de tres ítems que forman una prueba. ¿Cuál sería la
consistencia de la prueba empleando el alfa de Cronbach?

Ítem 1 Ítem 2 Ítem 3

Ítem 1 1 0,2 0,5

Ítem 2 0,2 3 0,4

Ítem 3 0,5 0,4 2

Tabla 2. Matriz de varianzas-covarianzas de tres ítems.

Una matriz varianzas-covarianzas es aquella en la que la diagonal principal recoge las


varianzas de los ítems y los triángulos inferior y superior las covarianzas entre los
ítems. Aplicando el alfa de Cronbach a esta matriz obtenemos:

𝐽 ∑𝑛𝐽−1 𝜎𝐽2 3 1+3+2


𝛼= (1 − 2 )= (1 − ) = 0,402
𝐽−1 𝜎𝑋 3−1 8,2

Para calcular la varianza de la prueba (X), se asume que la prueba está formada por
los ítems agregados linealmente, por lo que se puede calcular del siguiente modo:

𝜎𝑥2 = 𝜎12 + 𝜎22 + 𝜎32 + 2𝜎12 + 2𝜎13 + 2𝜎23


𝜎𝑥2 = 1 + 3 + 2 + 2 ∗ 0,2 + 2 ∗ 0,5 + 2 ∗ 0,4 = 8,2

5.6. Fiabilidad como acuerdo entre jueces


© Universidad Internacional de La Rioja (UNIR)

E
n un diseño observacional en el que se ve el comportamiento de una
persona o grupo de ellas, para poder estimar la fiabilidad es necesario que
dos o más jueces observen el comportamiento de los participantes y
posteriormente se calcule el grado de acuerdo entre las medidas tomadas por estos.

Psicometría
19
Tema 5. Ideas clave
Procedimiento

El procedimiento empleado sería el siguiente:

 Dos o más observadores (jueces) evalúan la conducta de los participantes en un


diseño observacional.
 Se calcula el grado de acuerdo entre los jueces sobre la conducta que han
observado.

Interpretación

La fiabilidad obtenida es una estimación del grado de acuerdo entre evaluadores de


la conducta que han observado. A mayor grado de acuerdo, mayor fiabilidad. De lo
que se trata es de ver hasta qué punto los jueces estiman del mismo modo la misma
conducta.

Problemas

Los problemas que se pueden dar con este cálculo de fiabilidad serían:

 Que los jueces cambien de criterio a la hora de evaluar, lo que produciría una
disminución en la fiabilidad.
 Es necesario entrenar a los jueces para que la fiabilidad sea alta.
© Universidad Internacional de La Rioja (UNIR)

Para ver el modo de cálculo de esta fiabilidad se puede consultar el capítulo 9 de


Abad et al. (2011).

5.7. Referencias bibliográficas

Psicometría
20
Tema 5. Ideas clave
Abad, F. J., Olea, J., Ponsoda, V. y García, C. (2011). Medición en ciencias sociales y de
la salud. Madrid: Síntesis.

Martínez, R. (1996). Psicometría: teoría de los tests psicológicos y educación. Madrid:


Síntesis.
Martínez, R., Hernández, M. H. y Hernández, M. V. (2006). Psicometría. Madrid:
Alianza Editorial.

Moreno, R., Martínez, R. J. y Muñiz, J. (2004). Directrices para la construcción de


ítems de elección múltiple. Psicothema, 16(3), 490-497.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
21
Tema 5. Ideas clave
Lo + recomendado

Lecciones magistrales

Fiabilidad de los test I

En esta lección magistral se describen las relaciones entre fiabilidad y error de medida
y los diferentes índices de fiabilidad para medidas paralelas o equivalentes; test-
retest; consistencia interna y fiabilidad «interjueces». Así como las principales
ventajas y desventajas de cada uno de estos índices.

Accede a la lección magistral a través del aula virtual


© Universidad Internacional de La Rioja (UNIR)

Psicometría
22
Tema 5. Lo + recomendado
No dejes de leer

Fiabilidad y generalizabilidad: aplicaciones en evaluación educativa

Cobo, B., Batanero, M. C. y Díaz, M. C. (2003). Fiabilidad y generalizabilidad: aplicaciones


en evaluación educativa. Números, 54, 3-21.

En este trabajo se analizan los conceptos de fiabilidad y generalizabilidad,


reflexionando sobre su utilidad en la evaluación educativa. Se describen los
diferentes coeficientes, indicando las situaciones en que podrían aplicarse y qué
información proporciona cada uno de ellos, analizando también los factores que
influyen en su valor. Muestra con un ejemplo los pasos a seguir para el cálculo de la
fiabilidad mediante el método de consistencia interna.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://dialnet.unirioja.es/servlet/articulo?codigo=668325
© Universidad Internacional de La Rioja (UNIR)

Psicometría
23
Tema 5. Lo + recomendado
No dejes de ver

Consistencia interna

En este vídeo se podrá ver una presentación que explica cómo calcular el índice de
fiabilidad de un test por medio del procedimiento de dos mitades.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=ZCMNmX90STU&list=PLi8-
5ukIiM6KIS8qHnIxqxi9lRV-n4WRc
© Universidad Internacional de La Rioja (UNIR)

Psicometría
24
Tema 5. Lo + recomendado
+ Información

A fondo

Teoría G: un futuro paradigma para el análisis de pruebas psicométricas

Zúñiga-Brenes, M. E. y Montero-Rojas, E. (2007). Teoría G: un futuro paradigma para el


análisis de pruebas psicométricas. Actualidades en Psicología, 21, 117-144.

En este artículo se analiza la Teoría G o Generalizabilidad y modelos de error de


medición. Será útil para profundizar en el conocimiento de teorías psicométricas.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://revistas.ucr.ac.cr/index.php/actualidades/article/viewFile/29/5

Webgrafía

Proclapar

En este blog se ofrecen vídeos, tutoriales y ejercicios prácticos de psicometría.


© Universidad Internacional de La Rioja (UNIR)

Accede a la página web a través del aula virtual o desde la siguiente dirección web:
http://psicometriayestadistica.blogspot.com.es/p/escalamiento.html

Psicometría
25
Tema 5. + Información
Bibliografía

Abad, F. J., Olea, J., Ponsoda, V. y García, C. (2011). Modelo clásico y fiabilidad;
Fiabilidad interjueces y medición del cambio. En Medición en ciencias sociales y de la
salud (pp. 92-106, 315-317). Madrid: Síntesis.

Martínez, R., Hernández, M. H. y Hernández, M. V. (2006). Teoría Clásica de los Tests


(TCT) I: el modelo y la fiabilidad de las puntuaciones. En Psicometría (pp. 50-62).
Madrid: Alianza Editorial.

Martínez Arias, R. (1996). La fiabilidad de un test en la Teoría Clásica; Procedimientos


para el cálculo del coeficiente de fiabilidad basados en una única aplicación del test.
En Psicometría: teoría de los tests psicológicos y educación (pp. 81-86, 10-139).
Madrid: Síntesis.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
26
Tema 5. + Información
Test
1. En la aplicación de un test, la varianza de los errores representa un 70 % de la
varianza de las puntuaciones observadas o empíricas. Esto implicará que la
fiabilidad del test será:
A. 0,30.
B. 0,70.
C. 0,49.

2. Se ha aplicado un test formado por cien ítems a una muestra representativa de la


población. Cada uno de los ítems tiene tres alternativas de respuesta. La
correlación entre los ítems pares e impares de la prueba vale 0,70. ¿Cuál sería el
valor de fiabilidad del test?
A. 0,88.
B. 0,91.
C. 0,94.

3. ¿Cuál es el objetivo que se persigue en la construcción de un cuestionario al


correlacionar las puntuaciones totales con las mismas puntuaciones dos meses
más tarde?
A. Obtener la fiabilidad mediante el método de formas paralelas.
B. Obtener la fiabilidad de la mitad del test.
C. Obtener la fiabilidad con el procedimiento test-restest.

4. El método de formas paralelas para calcular el coeficiente de fiabilidad:


A. Consiste en correlacionar una forma en dos muestras diferentes.
© Universidad Internacional de La Rioja (UNIR)

B. Consiste en correlacionar las puntuaciones de las dos formas en dos


muestras.
C. Consiste en correlacionar las puntuaciones en las dos formas en una muestra.

Psicometría
27
Tema 5. Test
5. El coeficiente alfa de Cronbach es un índice:
A. Obtenido a partir de las correlaciones entre ítems.
B. Que es necesario que esté basado en ítems paralelos.
C. Obtenido aplicando la prueba una vez y dividiéndola en dos partes

6. Los métodos de cálculo de fiabilidad basados en la división de la prueba en dos


mitades miden:
A. Estabilidad de la medida.
B. Equivalencia de las medidas.
C. Consistencia interna.

7. Entre las diferentes fuentes de error que pueden hacer bajar la fiabilidad de una
prueba están los que afectan a las aplicaciones por cambios de los participantes.
Estos serían los:
A. Específicos.
B. Transitorios.
C. Aleatorios.

8. El efecto de congruencia:
A. Se minimiza cuando pasa poco tiempo entre las dos aplicaciones de una
prueba.
B. Afecta en el cálculo de la fiabilidad con el procedimiento de partes paralelas.
C. Afecta en el caso de tomar dos medidas de un mismo test.

9. Indica cuál de las siguientes limitaciones se da en el cálculo de fiabilidad con el


método de consistencia interna:
A. Hay que dividir la prueba en varias partes equivalentes.
© Universidad Internacional de La Rioja (UNIR)

B. No se puede aplicar con test de velocidad.


C. Los ítems deben ser heterogéneos para garantizar variabilidad.

Psicometría
28
Tema 5. Test
10. Si la fiabilidad obtenida con la fórmula general de Spearman-Brown, tiene un valor
de 0,95 podemos afirmar que:
A. El alfa de Cronbach sería 0,98.
B. Empleando ítems equivalentes la fiabilidad sería mayor.
C. La consistencia interna dará un valor de 0,99.
© Universidad Internacional de La Rioja (UNIR)

Psicometría
29
Tema 5. Test

You might also like