You are on page 1of 15

TEMA 5.

LA FIABILIDAD

1. Estadsticos de correlacin

1.1. Coeficiente de correlacin de Pearson


1.2. Coeficiente de determinacin
1.3. Otros coeficientes de correlacin en funcin de la naturaleza de las variables

2. Concepto de Fiabilidad

3. Procedimiento para la estimacin de la fiabilidad

3.1. Mtodo de los tests paralelos o de las formas paralelas de un test


3.2. Mtodo test-retest
3.3. Consistencia interna de un test

Mtodo de las dos mitades

Coeficiente de Cronbach

3.4. Fiabilidad entre calificadores o evaluadores

4. Factores que afectan a la fiabilidad de un test

5. Factores que afectan a la segunda medicin


Bibliografa

Tema 5. La Fiabilidad

Prof. Esther Chiner

1. ESTADSTICOS DE CORRELACIN
1.1. Coeficiente de correlacin de Pearson

Se basa en el clculo previo de la covarianza (Sxy), que es la variacin conjunta


de dos variables:

S xy =

( x x )( y y )
N

S xy =

xy
xy
N

Si Sxy > 0 la relacin es positiva


Si Sxy = 0 no existe relacin
Si Sxy < 0 la relacin es negativa
El inconveniente de la covarianza es que no tiene lmite superior porque depende
de las unidades de medida. No sabemos si la relacin es intensa o moderada, slo si es
positiva o negativa. Una manera de compensar este problema es a travs del coeficiente
de correlacin de Pearson, ya que es independiente de las unidades de medida:

rxy =

S xy
sx s y

donde

-1 rxy 1

Si rxy > 0 la relacin es positiva


Si rxy = 0 no existe relacin
Si rxy < 0 la relacin es negativa

Factores a tener en cuenta:


1. Los lmites oscilan entre 1 y 1.
2. Clasificacin de Guilford:
Positiva

Negativa

0 rxy < 020 Muy baja 0 rxy > - 020


020 rxy < 040

Baja

-020 rxy > -040

040 rxy < 060

Media

-040 rxy > -060

060 rxy < 080

Alta

-060 rxy > -080

080 rxy < 1

Muy alta -080 rxy > -1


2

Tema 5. La Fiabilidad

Prof. Esther Chiner

3. Naturaleza de las variables: si trabajamos con variables muy semejantes (ej. dos
formas paralelas de un test) las correlaciones debern ser muy altas, pero si
trabajamos con variables de naturaleza muy diversa (ej. habilidad verbal y
extraversin) una correlacin menor supondr una relacin alta.
4. Coeficientes de correlacin que han obtenido con anterioridad otros
investigadores.
5. Fiabilidad de los instrumentos de medida, ya que si existe correlacin, al
aumentar la fiabilidad de los instrumentos, suele tambin aumentar la
correlacin.
6. Variabilidad de los datos: cuanto mayor sea la covarianza, mayor ser tambin la
correlacin de Pearson.

Condiciones para poder aplicar el coeficiente de correlacin de Pearson:


1. Se debe de tratar de una relacin simple, es decir, entre dos variables.
2. La relacin entre esas dos variables ha de ser lineal.
3. Las variables tienen que estar, como mnimo, en escala de intervalo y adems
tienen que ser continuas.
4. La relacin entre las variables ha de ser una relacin bivariada normal, es decir,
ambas variables se distribuyen de forma normal o parecida a la normal.
5. Entre las variables tiene que aparecer la homocedasticidad (variacin
homognea): La variacin de y para cada valor de x debe ser constante, y
viceversa. La homocedasticidad se da cuando las dos variables son
aproximadamente simtricas.

1.2. Coeficiente de determinacin ( r2xy )


Es el cuadrado del coeficiente de correlacin de Pearson r2xy

2xy. Es la

proporcin de la varianza de una variable asociada a la variacin de otra variable.

Ejemplo: x = introversin

y = inteligencia

rxy = 064 ............ Puntuacin alta en x supone puntuacin alta en y.


r2xy = 040 ............. El 40% de los datos de x estn asociados a los datos y.

Tema 5. La Fiabilidad

Prof. Esther Chiner

1.3. Otros coeficientes de correlacin en funcin de la naturaleza de las variables

Estadsticos para variables ordinales: coeficiente de Spearman


Es, en realidad una aplicacin directa de la frmula de Pearson pero
calculada sobre rangos u rdenes. Su interpretacin es igual que la de Pearson,
pudiendo oscilar entre 1 y 1.
La aplicacin ptima es cuando tenemos variables ordenadas en rangos.
Tambin se puede utilizar con variables en escala de intervalos o razn si los
transformamos en rdenes.

Estadsticos para variables nominales: 2


Para poder aplicarlo no necesitamos tener un nmero concreto de
categoras en las variables, sino que sirve para cualquier nmero de categoras.
El signo siempre ser positivo (no nos indica el sentido de la relacin) y no tiene
lmite superior. Para solucionar este problema se utiliza el coeficiente de
contingencia ( C ) que s que tiene lmite superior.

Relacin entre variables dicotmicas y dicotomizadas:


-

Coeficiente biserial puntual (rbp): se utiliza cuando una variable es

contnua y permanece contnua, y la otra variable es dicotmica.


-

Coeficiente Phi (): se utiliza cuando las dos variables con las que

trabajamos son dicotmicas


-

Coeficiente biserial (rb): se utiliza con dos variables continuas. Una de

ellas ( x ) permanece continua y la otra ( y ) la hemos dicotomizado


-

Coeficiente de correlacin tetracrico (rt): Se aplica con dos variables

continuas y distribuidas normalmente que han sido dicotomizadas.


Nominal

Chicuadrado
Phi

Dicotmica

Biserialpuntual
Tetracrico

Dicotomizada

Biserial
Spearman

Ordinal

Pearson

Continua
Nominal

Dicotmica

Dicotomizada

Ordinal

Continua

Tema 5. La Fiabilidad

Prof. Esther Chiner

2. CONCEPTO DE FIABILIDAD

Una de las principales caractersticas que debe cumplir un test es la de


Fiabilidad. La fiabilidad de un test es el grado o la precisin con que el test mide un
determinado rasgo psicolgico, independientemente del hecho de si es capaz o no de
medirlo (validez). Es decir, se dice que un test es fiable cuando "mide bien aquello que
est midiendo". Se refiere a la constancia de la medida, al grado en que un instrumento
de medida psicolgica no deformar el resultado de una medicin debido a cambios,
fluctuaciones o variaciones del instrumento mismo.

La fiabilidad tiene dos grandes componentes:

 La consistencia interna: se refiere al grado en que los distintos tems, partes o


piezas de un test miden la misma cosa. Significa la constancia de los tems para
operar sobre un mismo constructo psicolgico de un modo anlogo.

 La estabilidad temporal: se refiere al grado en que un instrumento de medida


arrojar el mismo resultado en diversas mediciones concretas midiendo un objeto o
sujeto que ha permanecido invariable.

Un test totalmente fiable sera aquel con el que se pudiera medir, es decir, situar a un
individuo en el baremo sin ningn error. Aunque, en la prctica, ningn instrumento de
medida es totalmente fiable, ni siquiera aquellos que miden caractersticas fsicas. Es
decir, si medimos un mismo objeto repetidas veces con el mismo instrumento
obtenemos medidas ligeramente diferentes. Por tanto, toda puntuacin se compone de la
puntuacin verdadera ms el error cometido, es decir:

X = V + E

De esta manera, podemos definir la fiabilidad como la proporcin de la varianza


verdadera de las puntuaciones de un test; lo que significa que la fiabilidad disminuir a
medida que aumente la varianza de error:
rtt = 1 SE
SV

Tema 5. La Fiabilidad

Prof. Esther Chiner

3. PROCEDIMIENTOS PARA LA ESTIMACIN DE LA FIABILIDAD

El concepto de fiabilidad se ha definido de manera operativa de diferentes


formas:
-

Fiabilidad de formas paralelas

Fiabilidad test-retest

Fiabilidad de consistencia interna

Fiabilidad entre calificadores o evaluadores

3.1. Mtodo de los tests paralelos o de las formas paralelas de un test

Este mtodo consiste en:

1. Elaborar dos formas paralelas de un mismo test, o lo que es lo mismo, dos tests
paralelos.

2. Aplicar una forma del test a la muestra de inters, y tras un lapso de tiempo que no
sea relevante para la aparicin de cambios en los sujetos, aplicar la segunda forma del
test a la muestra.

3. Calcular el coeficiente de correlacin entre las puntuaciones empricas obtenidas por


los sujetos en las dos ocasiones. Si las formas son paralelas esa correlacin es el
coeficiente de fiabilidad del test.

Paso 1: Elaborar formas paralelas

Hay dos tipos de criterios que dos tests han de cumplir para que los
consideremos paralelos:

1. Criterio estadstico: Las dos formas presentan medias iguales y varianzas iguales
tanto en sus puntuaciones empricas, como verdaderas y errores (mediciones paralelas)
u obtienen las mismas puntuaciones verdaderas, pero no se requiere igual varianza de
error (tau-equivalentes).

Tema 5. La Fiabilidad

Prof. Esther Chiner

2. Criterios de formato y contenido: En la prctica dos tests paralelos consisten en dos


conjuntos distintos de tems referidos a una misma variable o constructo psicolgico,
habitualmente con las mismas instrucciones y el mismo formato de prueba y de tems.
Las formas paralelas pretenden muestrear el mismo contenido con cuestiones
formuladas de manera distinta.

No puede considerarse formas paralelas aqullas en las que la diferencia consiste


en que se ha variado el orden de los tems o el orden de las alternativas.

Paso 2: La aplicacin de las formas del test

1. Las dos formas deben ser administradas bajo las mismas condiciones, o, al menos,
bajos los mnimos cambios posibles en las condiciones. Se trata de no introducir
factores que puedan provocar cambios en los resultados.

2. Respecto al tiempo, debe utilizarse un lapso entre ambas formas lo suficientemente


corto como para que los sujetos no hayan cambiado en la variable de inters y lo
suficientemente largo para que factores de memoria, fatiga, o entrenamiento tengan el
mnimo efecto.

* Tipos de tests adecuados para este mtodo


Es adecuado para tests de potencia y para tests de velocidad en todas las reas de
medicin psicolgica con instrumentos de lpiz y papel y tambin, con ciertos tests
manipulativos.

Paso 3: Clculo del coeficiente de correlacin

Una vez se han administrado las dos formas paralelas se dispondr de una tabla
de datos con N sujetos por 2 variables, la puntuacin en la forma A y en la forma B para
cada sujeto. Se procede entonces a calcular el coeficiente de correlacin de Pearson.

El resultado obtenido puede estar entre 1 y +1, pasando por 0 (ausencia de


relacin lineal). En realidad, como se trata de formas paralelas, no tiene sentido esperar

Tema 5. La Fiabilidad

Prof. Esther Chiner

correlaciones negativas debiendo estar el resultado entre 0 y +1, incluso cabra esperar
valores positivos alejados de 0.

Si A y B son formas paralelas entonces la correlacin es el coeficiente de


fiabilidad. Para considerar el test fiable, el coeficiente de correlacin obtenido deber ser
alto, de modo que una gran proporcin de la varianza de las puntuaciones se deba a
varianza verdadera.

Es decir, si obtenemos un coeficiente de fiabilidad de 075 diremos que tres cuartas


partes de la varianza emprica del test se deben a varianza verdadera, o lo que es lo
mismo, que un 25% de la varianza emprica es varianza de error.

3.2. Mtodo test-retest

Est indicado para estimar la fiabilidad de un test del que slo disponemos una
forma. Consistira en:

1. Administrar el mismo test en dos ocasiones diferentes separadas por cierto lapso
temporal a una misma muestra de sujetos.

2. Calcular el coeficiente de correlacin entre las puntuaciones obtenidas por los


sujetos en las dos ocasiones.

El mtodo evala la estabilidad de los resultados a travs de cierto tiempo. Por


ello, al coeficiente de fiabilidad que obtiene se le denomina coeficiente de estabilidad
temporal.

Respecto al tiempo que debe transcurrir:


- A menor tiempo mayor efecto de la memoria de las respuestas dadas, del aprendizaje
debido al propio test y de la fatiga producida por el propio test (si la segunda medicin
sucede de un modo ms o menos inmediato).

Tema 5. La Fiabilidad

Prof. Esther Chiner

- A mayor tiempo, mayor posibilidad de que los sujetos hayan cambiado realmente en la
variable de inters debido a mltiples factores permanentes o circunstanciales:
aprendizaje, cambios evolutivos, experiencias emocionales, enfermedad, condiciones
ambientales y sociales, etc.

Por todo esto, las estimaciones por el mtodo test-retest son ms apropiadas para
tests que miden rasgos poco afectables por los efectos de la prctica y que son estables a
lo largo del intervalo de tiempo transcurrido, como son los tests de rapidez perceptiva,
discriminacin sensorial, verificacin rpida de clculos numricos, etc.

3.3. Consistencia interna de un test

En muchas situaciones no es posible llevar a cabo dos aplicaciones del test. El


objetivo aqu, es establecer hasta qu punto se puede generalizar del conjunto especfico
de tems al dominio o universo de contenidos. Una forma de llevar a cabo esta
estimacin es valorando el grado de consistencia con el que los examinados responden
los tems o subconjuntos de tems del test, en una nica aplicacin del mismo. Cuando
los sujetos tienen un rendimiento consistente en los distintos tems, decimos que el test
tiene homogeneidad de tems. Para que un grupo de tems sea homogneo debe medir el
mismo constructo o el mismo dominio de contenidos.

3.3.1. Mtodos de las dos mitades

Mediante la frmula de correccin de Spearman-Brown

1. Administrar el test a una muestra de sujetos una sola vez.

2. Descomponer el test en dos partes de modo que tengan el mismo nmero de


tems y que puedan ser consideradas paralelas. Calcular la puntuacin total en
cada una de estas partes. (Es comn comparar la primera mitad del test con la
segunda, o comparar los tems pares con los impares).

Tema 5. La Fiabilidad

Prof. Esther Chiner

3. Obtener la correlacin entre las partes. Esa correlacin, si las formas son
paralelas, podra considerarse la fiabilidad de un test con la mitad de tems.

4. Aplicar sobre esa correlacin la correccin de Spearman-Brown para longitud


doble:
rxx =

2r
1+ r

Esta correccin estima la correlacin que se hubiera obtenido entre las partes si
hubiesen tenido el mismo nmero de tems que el test completo.

Mediante la frmula de Rulon

1. Administrar el test a una muestra de sujetos una sola vez.

2. Descomponer el test en dos partes de modo que tengan el mismo nmero de


tems y que puedan ser consideradas paralelas. Calcular la puntuacin total en
cada una de estas partes.

3. Calcular para cada sujeto la diferencia entre las puntuaciones que ha obtenido
en las partes:

d = X1 X2

4. Obtener la varianza del total y la varianza de la nueva variable d. Aplicar la


frmula de Rulon:
rxx = 1

sd2
S X2

10

Tema 5. La Fiabilidad

Prof. Esther Chiner

Mediante la frmula L4 de Guttman

1. Administrar el test a una muestra de sujetos una sola vez.

2. Descomponer el test en dos partes de modo que tengan el mismo nmero de


tems y que puedan ser consideradas paralelas. Calcular la puntuacin total en
cada una de estas partes.

3. Calcular para cada sujeto la varianza que ha obtenido en cada una de las partes
as como la varianza total.

4. Aplicar la frmula L4 de Guttman:

s2 + s2
rxx = 21 1 2 2
sT

La frmula de Guttman puede considerarse una reexpresin de la frmula de


Rulon, por ello ambas darn el mismo resultado bajo cualquier situacin. Ambas, a su
vez, equivalen a Spearman-Brown cuando la varianza de las puntuaciones en ambas
partes es igual. Si no son iguales, entonces las frmulas de Rulon y de Guttman darn
un valor inferior a la frmula de Spearman-Brown

3.3.2. El coeficiente de Cronbach

Alfa representa la consistencia interna del test, el grado que todos los tems del
test covaran entre s. Salvo que tengamos un inters expreso en conocer la consistencia
entre dos o ms partes de un test (ej. primera mitad y segunda mitad; tems pares e
impares) ser preferible calcular el coeficiente , a aplicar mtodos de dos mitades.
stos nicamente ofrecen informacin sobre la consistencia entre las partes, mientras
que alfa tiene en cuenta la covariacin entre cualquier par de tems.

rxx =

n si2
1 2
n 1
sT

11

Tema 5. La Fiabilidad

Prof. Esther Chiner

Donde:
n = nmero de tems
s2i = varianza de cada tem
s2T = varianza del test total
El coeficiente oscila entre 0 y 1. Cuanto ms prximo est a 1, los tems sern
ms consistentes entre s. Hay que tener en cuenta que a mayor longitud del test, mayor
ser alfa.

En el caso de que estemos trabajando con tems valorados dicotmicamente se


utilizarn las frmulas de Kuder-Richardson (KR 20 y KR -21). Cuando los tems
tienen diferentes ndices de dificultad se utiliza la frmula KR 20. En el caso de que el
ndice de dificultad sea igual, utilizaremos KR 21.

KR 20 =

n pi qi
1 2
n 1
sT

KR 21 =

x x2 n
n
1 T 2 T
n 1
sT

Donde:
n = nmero de tems del test
s2T = varianza total de las puntuaciones
p = proporcin de sujetos que acierta el tem
q = 1 p = proporcin de sujetos que no aciertan el tem
xT = suma de las medias de los tems. Para tems dicotmicos: xT = n pi

3.4. Fiabilidad entre calificadores o evaluadores

En los tests no estructurados, aunque no exclusivamente en ellos, es necesario


determinar si dos o ms resultados obtenidos por dos o ms evaluadores distintos o por
el mismo evaluador en momentos diferentes son coincidentes. En estos casos estaremos
hablando de Fiabilidad intrajuez o Fiabilidad interjueces.

12

Tema 5. La Fiabilidad

Prof. Esther Chiner

Se calcula a travs de un ndice de concordancia entre evaluadores, siendo la


frmula ms utilizada el ndice Kappa:

K=

P0 PC
1 PC

Donde:
Po = proporcin de acuerdo observado (suma de los acuerdos conseguidos en cada
categora dividida por el nmero de registros)
Pc = proporcin de acuerdo esperado al azar (suma de la probabilidad de acuerdo por
azar de cada categora).

4. FACTORES QUE AFECTAN A LA FIABILIDAD DEL TEST.

1. Segn el mtodo de estimacin de la fiabilidad que utilicemos.


2. Segn las condiciones concretas seleccionadas para aplicar el mtodo: la
fiabilidad variar en funcin del lapso de tiempo elegido o del nmero de formas
paralelas que apliquemos sobre una muestra.
3. Caractersticas y tamao de la muestra: cuanto ms homogneas sean las
muestras habr menos variabilidad y, por tanto, la fiabilidad ser menor. En
cambio, si las muestras son ms heterogneas, la fiabilidad ser mayor.
4. Longitud del test: es decir, el nmero de tems que presenta el test. Cuanto ms
largo es un test, mayor es su fiabilidad.

5. FACTORES QUE AFECTAN A LA SEGUNDA MEDICIN

La segunda medicin ha de realizarse en condiciones constantes respecto a las


de la primera. Esas condiciones constantes implican ausencia de cambio en los sujetos y
ausencia de cambio en las condiciones de administracin:

13

Tema 5. La Fiabilidad

Prof. Esther Chiner

Factores que pueden introducir cambios Factores que pueden introducir cambios
en los sujetos

en las condiciones de administracin

- Maduracin

- El administrador de la prueba.

- Aprendizaje e influencia general debida - El local y sus condiciones ambientales.


al medio social

- La hora del da.

- Actividad anterior a la administracin de - El da de la semana.


-

la prueba.

Sucesos

no

previstos

durante

la

- Factores que influencian el estado de administracin de la pruebas.


nimo de los sujetos.

- Pequeos errores o variaciones en las

- Cansancio debido a otras actividades.

instrucciones o en los tiempos lmite.

- Estado de salud de los sujetos.


- Fatiga debida a la primera prueba
- Memoria de la primera prueba.
- Aprendizaje debido a la primera prueba.
- Conocimiento de los resultados de la
primera prueba.

Adems, hay otros efectos que son importantes pero que no pueden agruparse
fcilmente en estas dos categoras:
1. Mortalidad experimental o prdida de sujetos entre la primera y la segunda
medicin por las razones que sean.
2. El fenmeno de regresin a la media: una persona con una puntuacin extrema
en la primera medicin tender a presentar su puntuacin en la segunda
medicin ms prxima a la media del grupo.

BIBLIOGRAFA
Amn, J. (1999). Estadstica para psicolgos I. Estadstica descriptiva. Madrid,
Espaa: Pirmide.
Botella, J., Len, O. G., San Martn, R. y Barriopedro, M. I. (2001). Anlisis de datos en
psicologa I. Teora y ejercicios. Madrid, Espaa: Pirmide.
Meli, J. L. (1990). La construccin de la psicometra como ciencia terica y aplicada..
Valencia, Espaa: Cristbal Serrano.

14

Tema 5. La Fiabilidad

Prof. Esther Chiner

Meli, J. L. (1993). Apuntes sobre teora clsica de tests. Valencia, Espaa: Cristbal
Serrano.
Navas, M. J. (2002). La fiabilidad como criterio mtrico de la calidad global del test. En
M. J. Navas (Coord.), Mtodos, diseos y tcnicas de investigacin psicolgica
(pp. 213-261). Madrid, Espaa: UNED.
Prez Juste, R., Garca Llamas, J. L., Gil Pascual, J. A. y Galn Gonzlez, A. (2009).
Estadstica aplicada a la educacin. Madrid, Espaa: UNED/Pearson-Prentice
Hall.

15