You are on page 1of 12

Proceso de construcción de los test y su análisis psicométrico

Material complementario

Fases en el proceso de construcción de un test psicométrico:

1.- Definir el constructo o rasgo que pretendemos medir.


Constructos, rasgos, atributos psicosociales. Conceptualizaciones teóricas que no son susceptibles de
medición directa.

2.- Especificar la población a la que va destinado el test.


Población general, poblaciones de características particulares, población adulta, niños, etc

3.- Establecer los objetivos o la finalidad que tiene el test.


Diagnósticar, clasificar, etc

4.- Diseño y elaboración de los ítems (test provisonal)


Items. Preguntas, problemas o tareas que forman parte del test y que los sujetos han responder.

5.- Selección del grupo normativo


Grupo normativo. Muestra representativa de la población a la que va destinado el test.

6.- Ensayo del test provisional.


Aplicación del test al grupo normativo

7.- Análisis de ítems.


Obtención de diferentes índices o indicadores estadísticos de los items a partir de los datos obtenidos
en la fase anterior que nos informaran del grado en que cada item es un buen medidor del constructo o
rasgo que pretendemos medir. A partir de estos indicadores se seleccionan aquellos ítems que formaran
parte del test definitivo

8.- Validez del test.


Característica que ha de tener todo instrumento de medida y que informa de si este mide realmente el
rasgo o constructo que con el pretendemos medir. y de la capacidad predictiva que tiene.

9.- Fiabilidad del test


Característica que ha de tener todo instrumento de medida y que informa sobre el grado de precisión,
estabilidad o consisitencia de las medidas que proporciona.

10.- Baremación
Proceso de transformación de las puntuaciones directas que el grupo normativo obtiene en el test en
otro tipo de puntuaciones que nos permitan interpretar la posición de cada sujeto respecto al grupo.

11.- Elaboración del manual del test


En el que se recogerán, además de sus características psicométricas, todas las indicaciones necesarias
hacer un uso correcto del test.
Análisis estadístico de los items

Ejemplo de datos obtenidos de la aplicación de un test de ejecución máxima


(inteligencia, redimiento, aptitudes)

Sujetos Ítems X Y

1 0 1 0 1 0 2 1
2 1 0 1 1 1 4 6
3 1 1 1 0 0 3 3
4 1 0 1 1 1 4 5
5 1 0 0 0 0 1 1
6 1 1 1 1 1 5 6
7 1 1 1 1 0 4 4
8 1 0 1 1 1 4 7
9 1 1 0 1 1 4 5
10 0 0 0 0 0 0 1

A 8 5 6 7 5
E 2 5 4 3 5

A
* ID = → Media del item
N

p x q → poder discriminativo del item → varianza del item

AxE → nº de pares de sujetos entre los que discrimina el item.

* Indice de homogeneidad → rix corregido.

* Indice de validez → riy

2
Ejemplo de datos obtenidos de la aplicación de un test de ejecución típica (personalidad)

Sujetos Ítems X Y

1 5 6 5 7 23 7
2 4 5 3 5 17 5
3 7 7 6 4 24 8
4 3 2 4 4 13 4
6 1 4 3 1 9 2
7 7 7 5 5 24 9
8 5 5 4 3 17 4
9 6 7 7 6 26 10
10 1 1 3 2 7 1

Indice de homogeneidad → rix corregido.

Indice de validez → riy

3
ANÁLISIS DE ÍTEMS.

Ejemplo: TEST DE COMPRENSIÓN VERBAL

El test de comprensión verbal, compuesto por 8 ítems dirigido a niños de 9 años, tiene por objeto evaluar la
comprensión de palabras y significados, indicando la puntuación 1 “acierto” y la puntuación 0 “error”.

La tarea de los sujetos consiste en elegir entre las 4 alternativas ofrecidas la que significa lo mismo que la
palabra escrita en mayúsculas, tachando con una X la letra que antecede a la respuesta correcta.

1. BELLO: A. feo B. grande C. salvaje D. bonito


2. ROJO: A. encarnado B. verde C. naranja D. amarillo
3. DECIR: A. saludar B. cambiar C. bromear D. hablar
4. ATAR: A. desunir B. enlazar C. olvidar D. asaltar
5. ALEGRE: A. risueño B. triste C. acalorado D. engreído
6. GORDO A. flaco B. asustado C. alocado D. obeso
7. CERCANO A. lejano B. alterado C. próximo D. total
8. CASA A. paisaje B. nido C. ciudad D. vivienda

El test de comprensión verbal fue aplicado a una muestra de 20 niños (X). Además se obtuvieron las
puntuaciones de estos niños en una prueba de fluidez verbal que será utilizada como criterio (Y). En la prueba de
fluidez verbal, se trata de que los sujetos produzcan y evoquen palabras en un tiempo limitado.

Las puntuaciones obtenidas para cada sujeto aparecen recogidas en el fichero de datos “verbal.sav” en la
carpeta PSICOMETRIA del escritorio de Windows:

4
Antes de analizar los ítems, vamos a calcular la puntuación total (Total).

Para calcular la puntuación total (Total) seleccionamos Transformar → Calcular variable…:

A continuación Aceptar.
En el editor de datos, podemos observar la variable creada (Total).

5
1) Índices de dificultad, poder discriminativo y nº de pares de comparaciones.

Selecciona en el menú Analizar, Estadísticos Descriptivos, Descriptivos...

Pulsa Opciones...

6
Pulsa Continuar y luego Aceptar.
Estadísticos descriptivos
Suma Desv.
N Mínimo Máximo (A) Media típ. Varianza AxE
Item1 20 0 1 18 ,90 ,308 ,095 18x2=36
Item2 20 0 1 11 ,55 ,510 ,261 11x9=99
Item3 20 0 1 15 ,75 ,444 ,197 15x5=75
Item4 20 0 1 14 ,70 ,470 ,221 14x6=84
Item5 20 0 1 13 ,65 ,489 ,239 13x7=91
Item6 20 0 1 9 ,45 ,510 ,261 9x11=99
Item7 20 0 1 5 ,25 ,444 ,197 5x15=75
Item8 20 0 1 3 ,15 ,366 ,134 3x17=91
N válido (según lista) 20

2) Índices de homogeneidad y validez.

Selecciona en el menú Analizar, Correlaciones, Bivariadas ...

Pulsa Aceptar

7
Total Criterio
Item1 Correlación de Pearson ,538* ,491*
Sig. (bilateral) ,014 ,028
N 20 20
Item2 Correlación de Pearson ,315 ,385
Sig. (bilateral) ,176 ,094
N 20 20
Item3 Correlación de Pearson ,548* ,487*
Sig. (bilateral) ,012 ,029
N 20 20
Item4 Correlación de Pearson ,590** ,493*
Sig. (bilateral) ,006 ,027
N 20 20
Item5 Correlación de Pearson ,786** ,833**
Sig. (bilateral) ,000 ,000
N 20 20
Item6 Correlación de Pearson ,782** ,760**
Sig. (bilateral) ,000 ,000
N 20 20
Item7 Correlación de Pearson ,658** ,555*
Sig. (bilateral) ,002 ,011
N 20 20
Item8 Correlación de Pearson ,651** ,591**
Sig. (bilateral) ,002 ,006
N 20 20

3) Análisis de la homogeneidad de cada ítem.

Selecciona en el menú Analizar, Escala, Análisis de fiabilidad...

Pulsa Estadísticos...y selecciona Escala si se elimina elemento

8
Pulsa Continuar y luego Aceptar.

Estadísticos de fiabilidad
Alfa de
Cronbach N de elementos
,750 8

Estadísticos total-elemento
Media de la Varianza de la Alfa de
escala si se escala si se Correlación Cronbach si se
elimina el elimina el elemento-total elimina el
elemento elemento corregida elemento
Item1 3,50 4,053 ,425 ,732
Item2 3,85 4,239 ,083 ,797
Item3 3,65 3,818 ,379 ,737
Item4 3,70 3,695 ,419 ,730
Item5 3,75 3,250 ,671 ,676
Item6 3,95 3,208 ,659 ,678
Item7 4,15 3,608 ,515 ,711
Item8 4,25 3,776 ,536 ,712

9
Ejemplo

Escala de Autoestima

DEFINICION DE AUTOESTIMA

- Percepción que uno tiene de si mismo

- Otros términos parecidos son autoconcepto, autoimagen, autoevaluación

Elaboración de ítems

1.- Mis amigos suelen secundar mis ideas ____ ____ ____ ____

2.- Estoy satisfecha con mi físico ____ ____ ____ ____

3.- Casi todos mis amigos son mejores que yo. ____ ____ ____ ____

4.- Creo que soy una persona lista. ____ ____ ____ ____

5.- Me gusta que me miren por la calle ____ ____ ____ ____

6.- En conjunto estoy satisfecha conmigo misma/o ____ ____ ____ ____

7.- Mis amigos se divierten conmigo. ____ ____ ____ ____

Formato de respuesta

Nunca Algunas veces Bastantes veces Siempre

   

Cuantificación de la respuesta

 Puesto que la respuesta tiene un formato de 4 pasos le podemos dar puntuaciones de 0 a 4.


 Tenemos que recordar que daremos mayor puntuación a aquella alternativa de respuesta que
indique mayor nivel del rasgo que estamos midiendo
 La puntuación total de cada sujeto es igual a la suma de las puntuaciones obtenidas en los
diferentes ítems.

10
CARACTERÍSTICAS QUE DEBE DE TENER UN TEST

Ser válido, que mida realmente lo que con él pretendemos medir

Ser fiable, que lo mida bien

VALIDEZ
Actualmente el concepto de validez se entiende como un proceso continuo que incluye diferentes
procedimientos que nos permiten comprobar si un test es un instrumento de evaluación adecuado a los
fines que perseguimos.
Los procedimientos fundamentales a los que hemos hecho referencia se denominan:
Validez de contenido que trata de comprobar si el conjunto de ítems que componen el test representan
adecuadamente el ámbito que pretendemos evaluar.
El proceso de validación de contenido de un test es eminentemente lógico, siendo jueces expertos los que
valoran la congruencia y adecuación de los ítems a los fines que el test persigue.
Validez de constructo. Los constructos son un conceptos teóricos que forman parte de teorías psicológicas
cuya finalidad es explicar el comportamiento humano y que requieren de indicadores externos
observables que permitan estudiarlos. Estos indicadores son los ítems que forman parte del test y lo que
se pretende es comprobar empíricamente si estos reflejan de forma adecuada dicho constructo.
Una de las técnicas que se utiliza con mayor frecuencia para llevar a cabo ese comprobación empírica es
al Análisis Factorial dando lugar a lo que se conoce como validez de constructo factorial.
Validez referida al criterio. Como ya señalábamos cuando nos referimos a la validez de los ítems, un
criterio es una medida externa al test que se refiere al mismo rasgo que pretendemos medir o a otro que
guarda una estrecha relación con él y que hemos seleccionado por considerarlo adecuado para contrastar
nuestro test.
Este tipo de validez nos informa de la capacidad predictiva que tiene el test y se obtiene relacionando las
puntuacions que los sujetos obtienen en el test (X) con las que estos mismos tiene en el criterio (Y).
A este indicador se le denomina coeficiente de validez- rxy -.

FIABILIDAD
Nos informa del grado de estabilidad y consistencia de los test.
La estabilidad se refiere a que un mismo test aplicado en diferentes ocasiones al mismo grupo de sujetos
arroje en todos los casos puntuaciones semejantes.
La consistencia hace referencia al grado en que los ítems o grupos de ítems que forman parte del test
miden o evalúan un rasgo o constructo homogéneo.
La fiabilidad como estabilidad
Se obtiene correlacionando las puntuaciones que los mismos sujetos obtienen en distintas aplicaciones del
test.. El método que se utiliza con mas frecuencia para la obtención de las puntuaciones es el de test-
retest. El coeficiente de correlación calculado se denomina coeficiente de fiabilidad – rxx -.
La fiabilidad como consistencia. Requiere de una sola aplicación del test. La forma de obtención mas
frecuente es el coeficiente α de Crombach.

11
BAREMACIÓN DE UN TEST

Una restricción que tienen las puntuaciones directas que los sujetos obtienen en un test es que no son
directamente interpretables si no las referimos al grupo al que pertenecen dichos sujetos. La baremación
de un test consiste, precisamente, en transformar las puntuaciones directas en otras que nos permitan
saber la posición que ocupa cada sujeto respecto al grupo al que pertenece.

Las formas de baremación mas frecuentes son las siguientes:

- Baremos cronológicos: Cociente intelectual (CI)

EM
CI = x 100
EC

Cuando la EM coincide con la EC el CI del sujeto es 100 e indicará que el sujeto tienen exactamente al
media de su grupo de edad. Un CI superior a 140 indicará una capacidad intelectual excepcional y si es
inferior a 70 indicará deficiencias de tipo cognitivo.

- Percentiles o centiles

Indican la posición de un sujeto respecto a los demás en una escala con un rango de 0 a 100.

Fa
P= x 100
N

Si al transformar la puntuación directa de un sujeto le corresponde, por ejemplo, el percentil 85,


querrá decir que ese sujeto supera al 85% de los sujetos de su grupo y que, por lo tanto sólo un 15% es
superior a él..

- Puntuaciones típicas Z

X X
Z=
Sx

Indican el nº de desviaciones típicas que el sujeto se aleja de la media


La X = 0 y la Sx = 1

- Puntuaciones típicas derivadas

Son transformaciones lineales de las anteriores y se utilizan para evitar los signos negativos y los
decimales que son habituales en las puntuaciones Z.
Las puntuaciones típicas derivadas de uso mas frecuente son las escalas T ( X = 50 y Sx= 10) y
D ( X = 50 y Sx= 20).

ELABORACIÓN DEL MANUAL DEL TEST.


En el que se señalan todos los aspectos necesarios para la correcta aplicación del test: características de la
población a la que va destinado, cuales son sus objetivos, como han de interpretarse las puntuaciones
resultantes de la aplicación del mismo y cuáles son sus características psicométricas: fiabilidad, validez

12

You might also like