You are on page 1of 27

TRABAJO FINAL ASIGNATURA LABORATORIO DE

PSICOMETRIA
ANLISIS DE LAS PROPIEDAS METRICAS EXIGIBLES A UN
TEST PSICOTECNICO
PROGRAMA DE PSICOLOGIA UNAB 2013
1 OBJETIVO
Aplicar los contenidos de la Teora Clsica de los Tests, realizando todos los pasos
que requiere la construccin de un test.
Una vez concluido el anlisis de datos, los alumnos debern confeccionar un informe
que detalle el procedimiento seguido para la creacin de su test.
Semanalmente se dedicarn horas de clase a la orientacin y supervisin del
proceso anterior, desde el anlisis de datos hasta la elaboracin del informe.
2 PROCEDIMIENTO
2.1 COMPOSICIN DEL GRUPO DE PRCTICAS
Cada grupo de prcticas estar integrado por un mnimo de 3 personas y un mximo
de 5, se requiere conocimientos bsicos de SPSS.
2.2 DEFINICIN DEL RASGO A MEDIR Y GENERACIN DE TEMS
Cada grupo deber elegir (libremente) y definir el rasgo que desee medir. Es muy
conveniente que el rasgo elegido tenga un significado psicolgico claro. Si no lo
tiene, ser ms difcil su definicin, la obtencin de predicciones, y la comparacin e
interpretacin de los resultados. A continuacin se proceder a generar tems
adecuados al mismo. El TEST INICIAL debe estar formado por una rasgo medible con
15 tems.
2.3 VARIABLES CRITERIO
Para ayudarnos a saber qu mide nuestro test vamos a introducir en el cuadernillo
de aplicacin una o ms variables criterio. En concreto, adems de los 15 tems, la
hoja de recogida de respuestas contendr ciertos tems (no ms de cinco), que
podrn ser de los siguientes 4 tipos:
1) tems extrados de tests que se sabe que miden un rasgo asociado al constructo
que queremos medir con nuestro test. Por ejemplo, si el test que estamos
elaborando pretende medir liderazgo, puesto que las personas lderes suelen ser
extrovertidas, en la hoja de recogida de respuestas podramos incluir, como
variables criterio, cinco tems tomados de un test de extroversin.
2) tems que muestren la conducta real (no la conducta verbal) que se sabe que est
asociada al rasgo que pretendemos medir. Por ejemplo, si queremos medir actitud
ante el consumo de marihuana, podramos incluir como variables criterio preguntas
como las siguientes: consumes marihuana? Nunca ( ) A veces ( ) Con frecuencia ( )
Muy frecuentemente ( ); has consumido alguna vez herona, xtasis o cocana? Si (
) No ( ),..

3) tems con informacin biogrfica que se sepa que est relacionada con la variable
que queremos medir, como edad, gnero, estudios,..
4) Una combinacin de los tres tipos anteriores. Por ejemplo, si nuestro test
pretende medir la actitud ante el consumo de alcohol en estudiantes de 13 a 16
aos, podramos incluir como tems criterio algunos relativos a si se consume o no
alcohol, y otros de tipo biogrfico, como la edad, pues se sabe que a esas edades
los estudiantes de ms edad tienen una actitud ms favorable.
La eleccin de las variables criterio es tanto ms sencilla cuanta ms y mejor
informacin se tenga del rasgo que se pretende medir con el test.
2.4 MATERIAL DE APLICACIN
Dependiendo del tipo de itemes diseados la recogida de datos se facilita
considerablemente si se utiliza una hoja de papel para las respuestas, un cuadernillo
para las preguntas, una plantilla para la calificacin.
La aplicacin de los tests se llevar a cabo durante las horas lectivas. Cada saln
deber responder a los tests de los grupos. Igualmente ubicaran Esto permitir
disponer a cada grupo de una muestra de unas 100 personas. Para la aplicacin del
test, cada grupo deber venir provisto de 110 copias de su test que entregar a sus
compaeros para ser debidamente diligenciadas.
2.5 CREACIN DEL FICHERO DE DATOS
Despus de aplicar el test tenemos que construir un fichero de datos, en el Editor de
Datos del SPSS, que denominaremos con el nombre del grupo GRUPOX.SAV. En dicho
fichero se incluirn las respuestas de la muestra a todos los tems. (La X representa
el nmero del grupo al cual pertenecen los estudiantes).
Lo primero que tenemos que tener en cuenta es el procedimiento de cuantificacin
de las respuestas, siguiendo las pautas indicadas en clase:
a) la cuantificacin de un tem depende de si el tem mide de manera directa o
inversa el rasgo que interesa.
c) Si una persona no responde a un tem o marca dos alternativas, le asignaremos el
valor 9 en ese tem. sta va a ser la manera de codificar los valores perdidos (o
missings) en el SPSS.
GRUPOX.SAV es un fichero SPSS de datos donde los sujetos son las filas y los tems
las columnas o variables, de tal manera que cada fila recoge las respuestas de una
persona a todos los tems. Por tanto, el fichero tiene tantas filas como sujetos hayan
respondido el test. La columna relativa a cada tem debe reflejar las respuestas de
todos los sujetos a ese tem. Cada fila debe empezar por el nmero de codificacin
del sujeto. Despus del nmero de codificacin, se van grabando las respuestas a
los tems. Por ejemplo, supngase que disponemos de las respuestas de 100 sujetos
a un test de 15 tems y dos tems criterio. Los datos de los tres primeros sujetos son
estos:

El ejemplo muestra las respuestas dadas por las tres primeras personas que
respondieron los 15 tems de un test de rendimiento tpico, formado por tems con
formato de respuesta de categoras ordenadas que se valoran de 1 a 5 o de 5 a 1,
segn si el tem mide de manera directa o inversa el rasgo que interesa. La primera
columna contiene los cdigos de los sujetos. Las respuestas en blanco o incorrectas
(dobles respuestas, por ejemplo) se codifican con 9. Las dos ltimas columnas
contienen las respuestas a los tems criterio (dos, en este ejemplo). Introducidos
estos datos, el Editor de Datos de SPSS los mostrar como sigue:

Si en algn tem hay datos perdidos, codificados con 9, habr que indicarlo al
programa, pulsando en la solapa Vista de variables y en Perdidos:

Cuando se tenga el archivo GRUPOX.SAV completo, se grabar con esta


denominacin en un CD REGRABABLE.
3 ESTUDIO PSICOMTRICO DEL TEST
El estudio de las cualidades psicomtricas del test requiere dos fases: una de
anlisis de tems y otra de estudio de las propiedades del test definitivo. Ambas se
realizarn en al aula de informtica.
3.1 Anlisis de los tems
Para cada tem vamos a obtener diferentes datos:
Media y varianza
ndice de homogeneidad corregido (HC) o correlacin tem-test corregida (es decir,
eliminando del test el tem cuya correlacin se est hallando).
A partir de estos resultados, debemos depurar el test inicial, eliminando los tems
que no resulten apropiados y cambiando la codificacin de alguno, si fuese
necesario. La seleccin se har atendiendo principalmente a los ndices HC.
Eliminaremos los tems con valores de HC prximos a cero. Tambin puede
eliminarse algn tem que tenga una varianza muy pequea.
A continuacin, estudiaremos las garantas que ofrece el test definitivo. En concreto,
considerando nicamente las respuestas a los tems que forman el test definitivo,
vamos a obtener:

a) Su coeficiente de fiabilidad, por la tcnica de dos mitades.


b) Su coeficiente de Cronbach.
c) Un estructura factorial para conocer la validez factorial del test, aplicando dos
procedimientos distintos de anlisis factorial.
d) Las relaciones existentes entre las puntuaciones en el test y las variables criterio.
e) Un baremo en centiles y otra escala alternativa.
Para llevar a cabo el anlisis INICIAL de los 15 tems en el SPSS se selecciona el
men Analizar -> Escalas -> Anlisis de fiabilidad.

Para el anlisis de tems se pulsa el botn Estadsticos y aparece el siguiente cuadro


de dilogo. Se marcan las opciones que aparecen sealadas:

Si se ejecutan las selecciones que aparecen sealadas en el cuadro de dilogo de la


figura anterior, el SPSS proporciona una salida de resultados que contiene toda la
informacin necesaria para realizar el anlisis de los tems y determinar los que
constituyen el test definitivo. Los resultados correspondientes a los datos del
ejemplo se muestran en las tablas siguientes.
Como puede verse en la Tabla 1, en primer lugar se obtienen una serie de
estadsticos descriptivos para cada tem: la media, la desviacin tpica y el nmero
de personas que han respondido el tem. Las medias de nuestro ejemplo estn

comprendidas entre 1.64 del tem 13 y 3.59 del tem 3. El tem 15 tiene la mayor
desviacin tpica, 1.396.

Tabla 1. Estadsticos descriptivos para los 15 tems del test inicial.


Estadsticos de los elementos

La relacin entre cada tem y el test se muestra en la Tabla 2. La primera columna


contiene la puntuacin media en el test si eliminamos el tem. Por ejemplo, si
eliminamos el tem 1 la media del test sera 38.34.
La siguiente columna es la varianza del test si eliminamos el tem. Por ejemplo, si
eliminamos el tem 5 la varianza del test sera 32.63. La columna tercera contiene el
ndice de homogeneidad corregido; es decir, la correlacin entre la puntuacin en un
tem y la suma de las puntuaciones en los tems restantes. Por ejemplo, el ndice de
homogeneidad corregido para el tem 10 es 0.192, lo que nos indica que no hay
mucha relacin entre este tem y los restantes. La cuarta columna contiene la
correlacin mltiple al cuadrado; es decir, el grado en que se puede predecir la
puntuacin en el tem a partir de las puntuaciones en los restantes tems. Tal y
como era de esperar, el tem 10 no se predice bien a partir del resto de los tems. Su
correlacin mltiple al cuadrado es slo 0.168. La ltima columna contiene el
coeficiente de Cronbach si eliminamos el tem. Por ejemplo, eliminar el tem 10
provoca que el coeficiente de Cronbach pase a ser 0.620 en el test de 14 tems.

Tabla 2. Estadsticos total - elemento.


Estadsticos total-elemento

El coeficiente de Cronbach del test inicial, compuesto por 15 tems, aparece en la


Tabla 3. En nuestro datos, alcanza un valor de 0.627.
Tabla 3. Coeficiente de Cronbach del test inicial.
Estadsticos de fiabilidad

Para obtener el test definitivo deberemos eliminar los tems que peor se comporten.
Lo primero que llama la atencin en la Tabla 2 es la alta y negativa correlacin temtest del tem 2 (-0.532). Hay otra correlacin negativa, pero muy prxima a cero. La
alta correlacin negativa del tem 2 nos indica que est mal codificado.
Recodificamos el tem 2 (convertimos la puntuacin 1 en 5, la 2 en 4,.. la 5 en 1) y
pasar a ser directo si era inverso, o al contrario. Guardamos el nuevo archivo de
datos con el nombre GRUPOX.SAV. Volvemos a aplicar el programa ESCALAS con el
nuevo archivo de datos. El nuevo coeficiente alfa obtenido se muestra en la Tabla 4.

Tabla 4. Coeficiente de Cronbach del test inicial tras recodificar el tem 2.


Estadsticos de fiabilidad

Tabla 5. Estadsticos total elemento tras recodificar el tem 2.


Estadsticos total-elemento

El coeficiente alfa pasa a ser 0.765, y, como muestra la Tabla 5, no hay correlaciones
negativas importantes. Vamos a eliminar del test los tems que correlacionen nada o
muy poco con l. Hay que eliminar sin duda los tems 4 y 15, y podran eliminarse
adems el 10, 12 y 13. Eliminaremos los cinco, dado que
a) Son los que tienen menores valores del ndice de homogeneidad corregido.
b) Solo esos cinco tems cumplen que, al ser eliminados, el coeficiente alfa del test
de 14 tems resultante es igual o mayor que el del test de 15 tems, como muestra
la ltima columna de la Tabla 5.
c) Los ndices de homogeneidad son correlaciones. Un ndice de correlacin es
significativamente distinto de cero cuando

r n 1.96

, siendo n el tamao de la

muestra. Slo los cinco tems eliminados tienen ndices de homogeneidad no


significativos.
El test definitivo de nuestro ejemplo estar compuesto, por tanto, por los 10 tems:
1, 2, 3, 5, 6, 7, 8, 9, 11 y 14. El anlisis psicomtrico se har del test final acabado
de definir. La Tabla 6 contiene los ndices de homogeneidad corregidos del test final
de 10 tems. Todos son positivos y significativos.
Tabla 6. Estadsticos total elemento de los diez tems del test final.
Estadsticos total-elemento

3.2 Estudio de las propiedades psicomtricas del test definitivo


3.2.1 Fiabilidad
Entrando de nuevo en el men Analizar -> Escalas -> Anlisis de fiabilidad,
obtendremos los estadsticos para el test definitivo (seleccionando slo los tems del
test final).
La Tabla 7 contiene la media, varianza y el coeficiente del test final. En el test
inicial, una vez recodificado el tem 2, el coeficiente era de 0.765. En el test final, a
pesar de ser ms corto, el coeficiente alcanza un valor de 0.870. Por lo tanto, al
eliminar los cinco tems hemos mejorado la consistencia interna del test.
Tabla 7. Media, varianza y coeficiente de Cronbach del test final.
Estadsticos de la escala

Estadsticos de fiabilidad
El coeficiente alfa obtenido (0.87) es un valor alto, indicando que el test tiene alta
consistencia interna. Los tems covaran fuertemente entre s y, en general, todos
ayudan a medir lo que mide el test.

Tambin podemos informar sobre la consistencia interna del test calculando el


coeficiente de fiabilidad por el mtodo de las dos mitades. Para ello, se selecciona el
men Analizar->Escalas->Anlisis de fiabilidad.
La salida contiene un resumen de los estadsticos que obtenemos al dividir la escala
en dos partes. La parte 1 est formada por los 5 primeros tems (1, 2, 3, 5 y 6) y la
parte 2 por los 5 ltimos de la lista de tems introducida en la casilla Elementos (7,
8, 9, 11 y 14).
La Tabla 8 muestra datos descriptivos de las dos mitades. Es til para determinar,
por ejemplo, si las dos formas tienen una media y varianza similar, como habra de
ocurrir si son formas paralelas. Con nuestros datos, vemos que tanto las medias
(2.796 y 2.596), como las varianzas (0.988 y 1.109) no parecen demasiado
diferentes. A estos valores pueden aplicarse los contrastes estadsticos estudiados
para determinar si la diferencia es o no significativa.

Tabla 8. Estadsticos resumen de las dos mitades.


Estadsticos de resumen de los elementos

El coeficiente de fiabilidad obtenido por este procedimiento se muestra en la Tabla 9.


La correlacin entre las dos mitades del test vale 0.892. Aplicando la frmula de
Spearman-Brown, se obtiene que el coeficiente de fiabilidad de nuestro test vale
0.943. Por lo tanto, el 94% de la varianza de las puntuaciones observadas es
varianza de las puntuaciones verdaderas. El 6% se debe al error de medida. Es, por
tanto, un test con alta fiabilidad y adems de slo 10 tems.
Tabla 9. Coeficiente de fiabilidad obtenido por el mtodo de dos mitades.
Estadsticos de fiabilidad

3.2.2 Estudio factorial


Podemos hacer dos estudios. Para ello, se selecciona el men Analizar -> Reduccin
de datos -> Anlisis factorial. En el primer estudio decidiremos cuantos factores
retener utilizando el mtodo de mxima verosimilitud para la extraccin de factores.
Al utilizar este mtodo vamos a obtener los factores necesarios para explicar la
varianza comn entre los 10 tems. Este mtodo de extraccin lleva a cabo un
contraste estadstico que informa de si los factores extrados dan cuenta
adecuadamente de la varianza comn entre los tems.
Empezamos pidiendo al programa que extraiga un solo factor. La ventana quedar
como se muestra a continuacin:

El contraste (vase Tabla 10) resulta significativo, por lo que no basta un factor para
dar cuenta de la varianza comn. Pedimos dos factores y tambin resulta
significativo (Tabla 11). Pedimos tres, y entonces se alcanza un resultado no
significativo (Tabla 12). Por lo tanto, con tres factores podemos dar cuenta de la
varianza comn entre los 10 tems.
Tabla 10. Prueba de bondad de ajuste con un factor.
Prueba de la bondad de ajuste

Tabla 11. Prueba de bondad de ajuste con dos factores.


Prueba de la bondad de ajuste

Tabla 12. Prueba de bondad de ajuste con tres factores.


Prueba de la bondad de ajuste

La Tabla 13 muestra (columnas 5, 6 y 7) la varianza explicada por los tres factores.


El primero explica el 44.248% de la varianza comn. El segundo, el 19.076%, y el
tercero, el 13.949%. Los tres juntos explican el 77.274% de la varianza comn, que
es un porcentaje elevado. A la vista de los resultados anteriores, se aprecia que el
factor 1 es el ms importante. Para interpretar los factores acudimos a las
saturaciones (Tabla 14)

Tabla 13. Varianza explicada por los 3 factores no rotados.


Varianza total explicada

Tabla 14. Matriz factorial (saturaciones) de los tres factores sin rotar.

La suma de las saturaciones al cuadrado de la primera columna es 4.425 (varianza


explicada por el primer factor). La suma de los de la segunda es 1.908, y la de los de
la tercera, 1.395. Estos valores aparecen tambin en la columna 5 de la Tabla 13. Si
sumamos las saturaciones al cuadrado, por filas, obtenemos la comunalidad o
aportacin a la varianza comn de cada tem. La comunalidad del tem 1 es 0.870,
la del 2 es 0.854. La Tabla 15 muestra las comunalidades de cada tem obtenidas
a partir de los factores extrados (tercera columna) y las iniciales2. La mayor
comunalidad corresponde al tem 8, pues un 94.4% de su varianza es varianza
comn (y solo un 5.6% es unicidad). El tem con menos comunalidad y ms unicidad
es el tem 6. Sera el menos relacionado con los dems tems.

Tabla 15. Comunalidades tras la extraccin de tres factores.


Comunalidades

A la hora de interpretar los factores, la matriz de saturaciones anterior no ayuda


mucho, pues teniendo en cuenta las saturaciones mayores de 0.4, sin considerar el
signo, vemos que casi todos los tems saturan en ms de un factor (vase Tabla 16).
En la tabla se han sombreado las saturaciones mayores, en valor absoluto, de 0.4.
Tabla 16. Matriz factorial (saturaciones) de los tres factores sin rotar.

Se suele facilitar la interpretacin si pedimos la matriz factorial rotada. De pedir la


rotacin ortogonal Varimax tendremos una ventana como la mostrada a
continuacin:

Las varianzas explicadas por los tres factores rotados aparecen en las columnas 8, 9
y 10 de la Tabla 17.

Tabla 17. Varianza explicada por los tres factores sin rotar y rotados.

Vemos que el total de varianza comn explicada por los tres factores rotados
(columna 10) sigue siendo el 77.274%. Sin embargo, los tres factores rotados
ortogonalmente explican porcentajes de varianza similares, a diferencia de lo que
ocurre con los factores no rotados, como se aprecia al comparar las columnas 5 y 8.
La Tabla 18 muestra las saturaciones de los tems en los tres factores rotados. Se
han sombreado las casillas con saturaciones mayores de 0.4, en valor absoluto.
Ahora, cada tem satura solo en un factor, lo que ha de facilitar su interpretacin.
Los tems 3, 5, 9 y 11 definen el factor 1. Los tems 2, 8 y 14, el factor 2. Y los tems
1, 6 y 7, el factor 3. La suma de las saturaciones al cuadrado, por columnas, nos da
la varianza que explica cada factor rotado (valores ya vistos en la columna 8 de la
Tabla 17). La suma de las saturaciones al cuadrado por filas nos da las
comunalidades de cada tem (ya vistas en la Tabla 15), pues la comunalidad de un
tem no cambia si los factores se rotan ortogonalmente.
Tabla 18. Matriz factorial (saturaciones) de los factores rotados.

Veamos ahora el segundo estudio factorial que podemos hacer. En el anlisis


factorial visto en el primer estudio se pretende reproducir la matriz de correlaciones
entre los tems, pero cambiando los unos de la diagonal principal por las
comunidades iniciales. A esta matriz se le suele llamar matriz de correlaciones

reducida. La suma de las comunalidades es la varianza comn y los factores


intentan dar cuenta de dicha varianza comn.
En el anlisis factorial de componentes principales se intenta dar cuenta de la matriz
de correlaciones completa, con unos en la diagonal, y los factores extrados
(tambin llamados componentes) pretenden dar cuenta de la varianza total, que
coincide con el nmero de tems.
Para ello, como mtodo de extraccin seleccionamos Componentes Principales. Para
seleccionar los factores a retener se suele seguir bien lo que indica el grfico de
sedimentacin o la regla de Kaiser. Para pedir al programa que obtenga el grfico de
sedimentacin, hay que indicarlo en la correspondiente ventana:

Con nuestros datos, la grfica de sedimentacin resulta ser la siguiente:

La grfica sugiere que el nmero de factores a retener debiera ser tres. Un


procedimiento alternativo es la Regla de Kaiser, que consiste en retener los factores
con varianza mayor de 1. La grafica anterior muestra que esta regla tambin
seleccionara tres factores en este caso, pues son tres los componentes cuyos
autovalores (o varianza explicada) son mayores de 1.
Vamos a extraer tres factores. Las varianzas explicadas por cada uno vienen en la
columna 5 de la Tabla 19. El primer componente explica el 48.479% de la varianza
total. Los porcentajes de varianza total explicada de los otros dos son 21.798 y
13.300. Tomados conjuntamente los tres, el porcentaje de varianza total que
explican es el 83.577, que no est nada mal. La Tabla 20 contiene las saturaciones.
Sumadas, al cuadrado, por columnas, obtenemos la varianza que explica cada
componente (ya vistas en la columna 5 de la Tabla 19), y por filas, el % de varianza
que cada tem comparte con los tres factores retenidos. Estos porcentajes se
muestran en la columna 3 de la Tabla 21.

Tabla 19: Varianza explicada por los tres componentes sin rotar.
Varianza total explicada

Mtodo de extraccin: Anlisis de Componentes principales.


Tabla 20. Matriz factorial (saturaciones) de los tres componentes sin rotar.

Tabla 21. Varianza de cada tem compartida con los componentes.

Muy posiblemente se facilita la interpretacin de los componentes si pedimos


componentes rotados. Al solicitar una rotacin ortogonal Varimax, obtendramos los
resultados que se muestran en las Tablas 22 y 23. Las tres ltimas columnas de la
Tabla 22 muestran que el % de varianza explicada conjuntamente por los tres
componentes rotados (83.577) coincide con el porcentaje explicado por los tres sin
rotar, si bien los rotados explican una cantidad ms similar de varianza.
Tabla 22. Varianza explicada por los tres componentes sin rotar y rotados.
Varianza total explicada

La Tabla 23 muestra que cada componente rotado est definido por tems distintos,
lo que debe facilitar su interpretacin. En este caso, los tems que definen cada
componente son los mismos que definen cada factor obtenido por el mtodo de
mxima verosimilitud. Ambos mtodos nos han dado una solucin factorial muy
similar, lo que no ocurrir siempre. Cuando se obtengan soluciones distintas,
debern compararse entre s, y con las previsiones que tengamos en relacin a la
estructura factorial del test. Por ejemplo, se podr valorar cul de las dos soluciones
encontradas se acomoda mejor a los componentes del rasgo propuestos en su
definicin (apartado 2.2).
Tabla 23. Matriz factorial (saturaciones) de los tres componentes rotados.

3.2.3 Variables Criterio


La puntuacin en el test se ha de relacionar con las puntuaciones en las variables
criterio. El tipo de anlisis a hacer depender de si las variables criterio son
dicotmicas, nominales,.. , por lo que no pueden darse pautas generales. Lo mejor,
si tenis dudas, es que consultis con vuestro profesor el anlisis que os parezca
ms adecuado.
Supongamos que en nuestro archivo de datos las dos variables criterio estn
medidas a nivel de intervalo. En ese caso, cabra obtener la correlacin de Pearson
entre la puntuacin en el test y cada una de ellas. Para obtener la puntuacin en el
test hay que crear una nueva variable que sea el resultado de sumar las
puntuaciones en los 10 tems del test definitivo. Llamaremos a la nueva variable
total. Para crearla, se selecciona el men Transformar -> Calcular que slo est
disponible en el Editor de datos del SPSS. Con los datos de nuestro ejemplo, el
cuadro de dilogo tendra el siguiente aspecto:

A continuacin, para obtener la correlacin de Pearson entre total e y1 e y2,


pulsamos en Analizar -> Correlaciones -> Bivariadas. Pasamos las tres variables a la
ventana Variables y obtenemos los resultados que se muestran en la Tabla 24.
Ambas correlaciones son positivas y significativas. Los datos muestran que, por lo
general, Las personas con puntuaciones altas (bajas) en test suelen tener

puntuaciones altas (bajas) en las dos variables criterio. El tanto por cierto de la
varianza de y1 explicada por nuestro test es el 40.70% ((0.638) (0.638)=0.407). Una
interpretacin similar podra hacerse de la relacin entre total e y2. Los dos
diagramas de dispersin (Grficos -> Dispersin -> Simple), que siguen a la Tabla
24, confirman lo acabado de decir.
Tabla 24. Correlaciones entre las puntuaciones en el test y las variables criterio.
Correlaciones

3.2.4 Baremos
Para terminar, se ofrece la distribucin de frecuencias que permite calcular el
baremo en centiles. Esta distribucin de frecuencias se obtiene a partir de la
puntuacin total de cada sujeto en el test. Para ello, se selecciona el men Analizar
-> Estadsticos descriptivos -> Frecuencias. Los resultados obtenidos con esta
seleccin aparecen en la Tabla 25. La ltima columna contiene los porcentajes
acumulados que nos permiten conocer los centiles. Por ejemplo, en nuestro test,
C25 = 21; es decir, el 75% de la muestra obtiene puntuaciones superiores a 21.
Tabla 25. Centiles y distribucin de frecuencias de nuestro test.

Una vez obtenidos todos los resultados debern guardarse en el fichero


GRUPOX.SPO, utilizando para ello el men Archivo -> Guardar.
4 ELABORACIN DEL INFORME
Una vez realizados todos los anlisis, los grupos redactarn un trabajo en el que se
describa el proceso seguido, comentando los resultados obtenidos. EL Cuadro de
valoracin describe detenidamente cmo se va a evaluar cada apartado. Su lectura
informa de los aspectos y contenidos que deben tenerse en cuenta a la hora de la
redaccin del informe.
Las hojas del trabajo DEBEN ORGANIZARSE EN EL ORDEN que aparecen al final de
este documento.
Cada grupo debe conservar una copia de su trabajo, ya que tras la correccin
solamente se devolver las hojas de valoracin con la evaluacin y comentarios
oportunos.
Es obligatorio adjuntar al informe un CD regravable, debidamente identificado, con
el fichero de datos y el fichero de resultados. El trabajo en s debe incluir los
siguientes apartados:
CUERPO DEL INFORME
1. Objetivos de la prueba
En este apartado debe especificarse el rasgo que se pretende medir, con una
definicin lo ms operativa posible del mismo y de sus componentes. Es muy
conveniente que se elija un rasgo que tenga entidad psicolgica, pues el grupo

podr definirlo mejor, elegir mejor las variables criterio, hacer un estudio ms
completo de validez, y comparar sus resultados con los obtenidos sobre el mismo
rasgo en otros trabajos. Si se hace una eleccin descuidada del rasgo a medir, muy
probablemente no se tendrn las ventajas expuestas.
2. Redaccin de tems
Se deben especificar los tems que miden cada componente y, en su caso, si lo
hacen de modo directo o inverso. Aclarar el formato de respuesta elegido y el modo
de cuantificacin de las respuestas. Se debe adjuntar un cuadro de anlisis de
contenido de acuerdo con las normas discutidas en clase y el concepto de un juez
sobre los mismos.
3. Anlisis de tems
Para cada tem hay que especificar su varianza, media y su ndice de homogeneidad
corregido. Hay que explicar detalladamente el proceso seguido para determinar
cuntos y qu tems han de eliminarse del test inicial de quince tems. El nmero de
tems a eliminar no est predeterminado. Cada grupo ha de decidir si ha de eliminar
alguno o no, y cules.
4. Fiabilidad del test
Adjuntar, interpretar y evaluar el coeficiente de fiabilidad y el coeficiente alfa
obtenidos. En este caso, tanto del test inicial como del test final. Es importante que
se haga una interpretacin precisa de estos ndices.
5. Validez del test
Comentar los resultados de la estructura factorial, tras aplicar cada mtodo de
extraccin, para establecer qu dimensiones mide el test. Hay que informar de lo
siguiente: a) Cuantos factores y componentes se han extrado o retenido por cada
uno de los dos mtodos de extraccin. b) Las saturaciones y las varianzas
explicadas por los factores y componentes retenidos. c) La importancia y el
significado de cada factor y componente. d) Comparar los resultados obtenidos por
los dos mtodos. e) Conviene tambin considerar si los factores y componentes
encontrados tienen o no relacin con los componentes del rasgo que se
establecieron antes de la redaccin de los tems.
En el cuadernillo de aplicacin se han incluido varios tems criterio que miden
constructos, variables biogrficas o conductas relacionadas con el rasgo que
supuestamente mide el test. En concreto, hay que:
a) Justificar las variables criterio elegidas, indicando las fuentes o referencias en
las que se cita o prueba la relacin existente entre el rasgo que
supuestamente mide el test y las conductas, variables biogrficas o
constructos a los que corresponden los tems criterio.
b) Explicitar claramente qu relaciones cabe esperar entre las puntuaciones en
nuestro test, si mide lo que suponemos, y las variables criterio. c) Realizar el
anlisis de datos que permita comprobar si se cumplen las previsiones
realizadas en el apartado anterior. A partir de los resultados obtenidos en este
apartado de validez, proponer qu mide el test.
6. Baremos

Incluir una tabla que muestre los baremos en centiles y otra escala derivada de
transformaciones de z.
Explicar el uso de la tabla con ejemplos de interpretacin de dos puntuaciones
posibles en el test significativamente distintas.
7. Valoracin subjetiva del trabajo. Usando una hoja como mximo por estudiante.
Valoracin crtica de la experiencia realizada por cada uno de los miembros del
grupo. Se trata de reflexionar sobre lo hecho y comentar:
a) Qu se ha aprendido haciendo el trabajo.
b) Qu errores se han cometido y qu se ha aprendido de ellos.
c) Qu dificultades principales se han tenido que superar y como se han
superado.
d) Sugerencias de mejora de la prctica.
El da de sustentacin y entrega del trabajo se escoger al azar un representante de
cada grupo quien presentar pblicamente la comparacin de lo redactado por l y
sus compaeros de grupo.
8. Apndice
En un apndice debe incluirse el test y los archivos GRUPOX.SAV y GRUPOX.SPO con
los datos y los anlisis realizados.
Cada grupo debe incluir en su informe toda esta informacin y en este orden. Se
pide atencin en paginar el trabajo.

4 ORGANIZACIN DEL INFORME


4.1 FICHA TECNICA DEL TEST (Hoja 1)
Nombre del test:
Autores:
Significacin:
Tipificacin:
Duracin:
Muestra de estandarizacin:
4.2 CUADRO DE VALORACIN (Hoja 2-3-4)
Representa el 10% de la asignatura y se califica en una escala de 0 a 2 los 18
aspectos para una puntuacin final mxima posible de 36. El resultado de la
suma se transforma luego a la escala de 0 a 5 tradicional.
4.3 CUADERNILLO DE APLICACION (Hoja 5)

4.4 CUERPO DEL INFORME (Hojas 6 en adelante)


PUNTOS A TENER EN CUENTA:
1) Este trabajo se califica de forma continua durante el semestre.
2) El trabajo se ajustar a las instrucciones proporcionadas en la gua de la prctica.
Si el trabajo no sigue las especificaciones dadas en este documento el 10% de la
nota ser valorado como cero.
3) Si existieran errores en la codificacin de respuestas que dieran lugar a resultados
aberrantes en los indicadores psicomtricos, y stos no fueran detectados, la
valoracin del 10% final ser cero.

HOJAS DE VALORACIN
0

A) RELEVANCIA DEL
CONSTRUCTO
SELECCIONADO
Valoracin:

B) DEFINICIN DEL
RASGO Valoracin:

1
2
El constructo puede
tener cierto inters
El constructo que se
en algn contexto
El constructo o rasgo
pretende medir no
aplicado de la
elegido es relevante
tiene inters para la Psicologa, aunque no
para los psiclogos,
Psicologa o para los
ha sido objeto de
desde una
psiclogos
estudio desde las
perspectiva terica
profesionales.
diversas tradiciones
y/o aplicada.
tericas de la
Psicologa.
Ausencia de
Definicin
Correcto uso de la
definicin o de
descuidada, por no
teora subyacente
contextualizacin
consultar las
para la definicin del
terica sobre el
referencias tericas
constructo,
rasgo. No se hace
apropiadas, aunque
incluyendo
esfuerzo por
se hace un esfuerzo
referencias sobre las
establecer los
por una definicin
obras consultadas.
componentes ms
propia. Si la actitud o
Los componentes o
operativos del mismo.
rasgo es difcil de
indicadores estn
justificar
bien operativizados, y

tericamente, se
intenta proporcionar
una buena definicin
operativa

son los que deben


ser.

C) REDACCIN DE
TEMS Valoracin:

En bastantes de los
tems se cometen
errores de redaccin.
No parece que haya
adecuacin entre la
redaccin y el
componente que se
desea medir. No se
elaboran tems
inversos.

Existen errores
puntuales de
redaccin o de
adecuacin entre la
redaccin y el
componente, aunque
se han elaborado
tems directos e
inversos.

Se cumplen los
estndares de
redaccin de los
tems de categoras
ordenadas. Resulta
razonable la
redaccin para la
evaluacin de los
componentes. Se
redactan tems en las
dos direcciones.

D) FORMATO DE
RESPUESTA
Valoracin:

El grupo no ha
diseado los itemes
de acuerdo con una
definicin operacional
clara, el formato de
calificacin no es
prctico.

Algunas de las
categoras de
respuesta podran
haberse redactado
mejor

Las categoras estn


bien establecidas y
etiquetadas. Las
instrucciones para los
evaluados son claras.

E) CUANTIFICA-CIN
DE RESPUESTAS
Valoracin:

Ha habido errores
importantes en
alguno de estos dos
aspectos: incorrecta
codificacin de las
omisiones, no se han
recodificado los tems
inversos.

Errores puntuales en
la codificacin: algn
tem mal
cuantificado, errores
puntuales en la
grabacin de datos,
aunque se codifican
bien los tems
inversos y las
omisiones.

Codificacin correcta
de las omisiones y de
las respuestas a los
tems inversos.

No se hace ninguna
referencia a las
caractersticas de la
muestra que se
selecciona para el
estudio psicomtrico.

Se describen con
detalle las
caractersticas
disponibles de la
Se menciona alguna
muestra (tamao,
caracterstica de la
nivel de estudios,
muestra (tamao,
cmo se ha
cmo se ha
conseguido), se
obtenido,..), aunque
informa de su
no se informa de su
rendimiento global en
rendimiento global en
el test y de las
el test (datos
consecuencias que
estadsticos
estos datos pueden
descriptivos).
tener en las
propiedades
psicomtricas de la
prueba.

No se han obtenido
las medias y
varianzas de los
tems o no se informa
en detalle del
significado de estos
valores para cada

Se han obtenido las


medias y varianzas,
aunque no se
interpreta de forma
adecuada los valores
individuales de cada
uno de los tems. Las

F) DESCRIPCIN DE
LA MUESTRA
Valoracin:

G) ANLISIS DE LOS
TEMS: medias y
varianzas Valoracin:
Correlacin tem-test
Valoracin:

Se interpreta con
detalle, y de forma
adecuada al
contenido
correspondiente, la
diferente cuanta de
las medias y

uno de los tems. No


se han obtenido las
correlaciones temtest de forma
correcta o no se
informa con detalle
de su significado.

correlaciones temtest estn bien


calculadas, aunque la
interpretacin de su
cuanta no es
correcta.

La seleccin de tems
no es adecuada,
H) SELECCIN DE LOS
porque se eligen
TEMS Valoracin:
tems para el test
definitivo que no son
los mejores.

Los tems
seleccionados son los
que deben ser,
aunque la
argumentacin sobre
las razones que
llevan a tal seleccin
no es suficiente, o no
se comenta en
detalle los cambios
que se producen en
los indicadores de los
tems cuando forman
parte del test
definitivo.

I) FIABILIDAD:
consistencia interna
global Valoracin:
Consistencia de las
dos mitades
Valoracin: Nuevas
propuestas
Valoracin:

10

J) VALIDEZ:

El coeficiente de
Se obtiene de modo
Cronbach es el
incorrecto el
correcto, pero no se
coeficiente de
interpreta de forma
Cronbach, no se
correcta atendiendo a
interpreta o se
la consistencia del
interpreta de manera
test, o no se
inadecuada. Se
comentan las
obtiene de modo
diferencias entre los
incorrecto el
valores del test inicial
coeficiente de
y del test definitivo.
fiabilidad mediante el
El coeficiente de
mtodo de las dos
fiabilidad es el
mitades, no se
correcto, pero no se
interpreta o se
interpreta de manera
interpreta de manera adecuada. Algunas de
inadecuada. No se
las propuestas
incluyen nuevas
planteadas requieren
propuestas para
mayor concrecin,
mejorar la fiabilidad
dado que slo se
del test.
apuntan ciertas ideas
sin operativizarlas.

No existe justificacin

Se justifica la validez

varianzas que tiene la


muestra en cada uno
de los tems. Las
correlaciones temtest se obtienen de
forma correcta. La
interpretacin de los
valores obtenidos es
rigurosa, indicando su
repercusin en la
fiabilidad del test.
Los tems
seleccionados son los
adecuados, se da
cuenta de las razones
mtricas para
eliminar los tems
rechazados y de las
repercusiones que
esto puede tener en
la fiabilidad y validez.
Se obtienen los
indicadores
psicomtricos de los
tems que forman el
test definitivo y se
comentan
adecuadamente sus
diferencias respecto a
los valores que tenan
en el test inicial.
El coeficiente de
Cronbach es el
correcto, se
interpreta de manera
adecuada y se
comentan bien las
razones de las
diferencias entre los
valores del test inicial
y del test definitivo.
El coeficiente de
fiabilidad es el
correcto y se
interpreta de manera
adecuada. Se
comenta
correctamente la
influencia en el
coeficiente factores
como el tamao y la
varianza del test. Se
plantean
procedimientos
adecuados de
mejora, se
argumentan y se
comentan las
dificultades
previsibles para
obtener dicha mejora.
Se aplica la frmula
de Spearman-Brown
para estudiar la
fiabilidad del test si
se incrementara su
longitud.
Se justifica bien los

11

Justificacin de la
validez de contenido
Valoracin:

al respecto.

Estudios de validez
de constructo:
Decisiones relativas
al Anlisis Factorial
Valoracin:

No se aplica bien la
tcnica del anlisis
factorial, porque no
se elige el mtodo de
extraccin de
factores adecuado,
porque no se retienen
los factores
adecuadamente o
porque no se rotan
para su
interpretacin.

12

Estudios de validez
de constructo:
Interpretacin de los
factores. Valoracin:

13

Formulacin de las
variables criterio
Valoracin:

14

Variables criterio:
Hiptesis y contraste
Valoracin:

15

16

componentes
incorporados en el
test y se argumenta,
de contenido del test,
en el caso de que as
aunque no se
fuera, los
argumenta porqu
componentes
dejan de incluirse
adicionales que
ciertos componentes.
deberan incorporarse
si el test fuera ms
largo.

Se aplica bien el
mtodo de
extraccin, se
retienen los factores
de modo adecuado,
se rotan si es
pertinente hacerlo,
aunque no se
comenta
adecuadamente la
proporcin de
varianza que
explican.
Aunque se ha
intentado dar una
No se hace un
significacin a los
esfuerzo por
factores, no se realiza
interpretar el
un anlisis desde las
significado de los
previsiones tericas
factores, atendiendo
que se tenan en las
a las saturaciones de
fases iniciales de
los factores rotados.
construccin del test.
Se interpreta la
El grupo no ha sido
matriz factorial sin
capaz de identificar el
rotar.
sentido de alguno de
los factores.
Se incluyen las
variable criterio, pero
No se han incluido o
la justificacin es
no se justifica en
pobre (la justificacin
absoluto su inclusin.
no es especifica del
rasgo que el test
supuestamente mide)
Se realizan hiptesis
sobre la relacin
entre las variables
No se realizan
criterio y las
hiptesis sobre cmo
puntuaciones en el
se han de relacionar
test, pero sin base
las variables criterio
psicolgica slida. Se
con las puntuaciones
hacen con base
en el test
slida, pero su
contraste no es
correcto.

K) BAREMACIN:
Adecuacin e
interpretacin
Valoracin:

El baremo centil ha
sido mal obtenido en
SPSS.

El baremo est bien


obtenido, aunque no
se comentan algunas
de sus
caractersticas: tipo
de distribucin,
significado concreto
de unos centiles,..

L) CALIDAD DEL
INFORME: Uso

En partes
importantes del

En algunas ocasiones
no se emplean los

Se aplica bien el
mtodo de
extraccin, se rotan
los factores, se
retienen de forma
adecuada, se
obtienen e
interpretan bien los
porcentajes de
varianza explicada
antes y despus de la
rotacin..
La interpretacin es
muy adecuada,
atendiendo al
contenido de los
tems con
saturaciones altas en
cada factor. Se da
una buena
argumentacin sobre
la coherencia entre
las previsiones
tericas y los
resultados empricos.
Se justifica,
recurriendo al
conocimiento
psicolgico y trabajos
previos las variables
criterio
seleccionadas. s

Se formulan hiptesis
y contrastan
correctamente.

El baremo est bien


obtenido y se
comentan algunas de
sus caractersticas:
tipo de distribucin
de las puntuaciones
de la muestra,
significado concreto
de unos centiles,..
Los conceptos
empleados son

informe no se
emplean los
conceptos
psicomtricos o
riguroso de conceptos
metodolgicos
Valoracin:
adecuados para dar
cuenta con palabras
de los resultados del
estudio psicomtrico.

17

18

Orden Valoracin:

No existe una buena


organizacin en el
informe: reiteraciones
no pertinentes,
contenidos
expresados en un
orden inadecuado.

Valoracin subjetiva

No hay una reflexin


profunda y seria
sobre la experiencia
de aprendizaje. No
existe una
sustentacin pblica
coherente por parte
del representante del
grupo

conceptos
psicomtricos
adecuados. Aparecen
ciertas expresiones
de uso coloquial no
pertinentes para un
informe cientfico.

pertinentes, as como
su interpretacin.

Existe una buena


organizacin en
general, aunque
aparecen algunas
reiteraciones
puntuales.

La organizacin es la
adecuada, no
aparecen
reiteraciones no
pertinentes, se
confeccionan tablas o
figuras a las que se
hacen referencia en
el texto escrito.

En el documento
existe una buena
La reflexin evidencia
reflexin pero solo
el trabajo realizado
por parte de algunos
por cada uno de los
de los integrantes del
integrantes, as como
grupo y se presentan
el esfuerzo personal
errores de redaccin.
de todos en el
La sustentacin
proyecto
publica de este
aspecto es deficiente

EXITOS
El esfuerzo que hagas en este momento te procurar muchas satisfacciones al
finalizar el curso.
NOTA:
Este trabajo prctico SE DISEO UTILIZANDO COMO GUIA EL DOCUMENTO
REDACTADO EN LA UNIVERSIDAD AUTONOMA DE MADRID POR: Carmen Garca, Julio

Olea, Vicente Ponsoda, Javier Revuelta, Carmen Ximnez y Francisco J. Abad. (2003).
Presenta modificaciones y adaptaciones para el contexto de la asignatura impartida en el curso de
psicometra de nuestra universidad. La versin de SPSS que ejemplifica el caso es antigua pero la
versin del programa que se usa actualmente conserva una estructura muy similar.