You are on page 1of 21

CONFIABILIDAD DE LOS TESTS PSICOLGICOS

Es otra de las cualidades de un instrumento de medida que implica el grado de


precisin de la medicin. Es as, que el puntaje que obtiene un individuo en uno de estos
instrumentos slo tiene valor sir refleja con exactitud la "verdadera" situacin de esa
persona con respecto a la variable con que se mide. Se dice que un test es confiable
cuando mide en forma coherente la situacin en que se encuentra una persona con
respecto a una variable dada.
Todas las mediciones cientficas encierran un cierto error accidental, las medidas
psicolgicas contienen tambin un elemento de error accidental; ste es llamado error de
medicin, que viene a ser la variabilidad de los puntajes que obtiene un sujeto de las
diversas administraciones del test.
Las fuentes de error pueden clasificarse en :
a. Error constante, es el que opera permanentemente en el curso de una medicin
(un cronmetro impreciso, instrucciones deficientemente estandarizadas,
inadecuado muestreo de contenido).
b. Error variable, es aquel que proviene por parte de las caractersticas del
examinado y del ambiente y condiciones en que se administra el test (estado
fsico o mental de la persona en el momento de la administracin, el da de la
semana, el momento del da, incomodidad del ambiente, ruido, interferencias,
inadecuada iluminacin y ventilacin, etc.)

c. Error personal, es aquel que se presenta por inferencia del examinador (falta de
entrenamiento en el proceso de administracin, inadecuada motivacin).

d. Error de interpretacin, como por ejemplo, uso de normas obsoletas o unas no


adecuadas a las caractersticas de los examinados.

La confiabilidad se interpreta a travs de un coeficiente que tiene los siguientes


rangos:
Rango Interpretacin
0,81 a 1,00 Muy alta
0,61 a 0,80 Alta
0,41 a 0,60 Moderada
0,21 a 0,40 Baja
0,00 a 0,20 Muy Baja
Cuando es Negativo Extremadamente Baja
Cuando es Mayor a 1 Extremadamente Alta

METODOS DE ESTIMACION DE LA CONFIABILIDAD

TEST RE TEST.

Es el mtodo ms obvio para encontrar la confiabilidad de las puntuaciones de la


prueba (anastasi, 1998).El procedimiento consiste en aplicar el test a un grupo de
individuo y despus de un intervalo -estimado a criterio del examinador por los efectos
del aprendizaje- volver a aplicarlo. As, se obtienen dos conjuntos de puntuaciones que
se correlacionarn; el resultado ser expresado por un coeficiente de confiabilidad, que
por la aplicacin de ste mtodo particular se denomina coeficiente de estabilidad, el
mismo que indicar el grado en que los dos conjuntos de puntuaciones muestran
estabilidad respecto al test.

FORMAS EQUIVALENTES.

Se refiere a la relacin entre dos conjuntos de puntajes obtenidos por formas


equivalentes o paralelas del test, administrados una a continuacin de la otra. Los
resultados se expresan por un coeficiente de confiabilidad, denominado en este caso
coeficiente de equivalencia, que indicar el grado en que los dos conjuntos de puntajes
guardan equivalencia. Cabe destacar que " formas equivalentes" se refiere a dos tests
construidos paralelamente que tena cada uno el mismo propsito de medida, el mismo
conjunto representativo de tems de igual nivel de dificultad o importancia.

DIVISIN POR MITADES.

Consiste en dividir el test, segn la estructura del mismo y por el tipo de proporciona, la
mejor forma es dividirlo en tems pares versus tems impares, se obtienen dos conjuntos
de puntuaciones que se correlacionarn, los resultados se expresan por un coeficiente de
confiabilidad denominado en este caso coeficiente de consistencia interna el mismo que
indicar el grado de consistencia de los puntajes. ste mtodo utiliza adems la frmula
de prediccin (Spearman-Brown) que predice el coeficiente de confiabilidad para la
totalidad del test(ya que al dividirlo no lo contempla), generalmente, es mayor que el
coeficiente de correlacin entre las mitades del test.

Confiabilidad Kuder-Richardson y Coeficiente Alfa.


Este mtodo requiere una sola aplicacin de una nica forma, se basa en la consistencia
de las puntuaciones a todos los reactivos de la prueba.
El procedimiento ms comn para encontrar la consistencia entre reactivos se debe a
Kuder y Richardson (1937). Como en los mtodos de divisin por mitades, la
consistencia entre reactivos se encuentra en una sola aplicacin de una nica prueba, sin
embargo en lugar de requerir las puntuaciones de las dos mitades, la tcnica se basa en
el examen del
desempeo en cada reactivo. De las diversas frmulas derivadas del artculo original, la
de mayor aplicacin, conocida comnmente como la "frmula 20 de Kuder-
Richardson", es la siguiente:

rtt = n DE t - pq n-1 DE t

En la que rtt es el coeficiente de confiabilidad de toda la prueba, n es el nmero de


reactivos y DE, la desviacin estndar de la puntuacin total. El nico trmino de la
prueba es pq, se encuentra calculando la proporcin de personas que aciertan (p) y la
de personas que no aciertan (q) en cada reactivo. Para obtener pq se calcula para cada
reactivo el producto de p y q, y luego se suman los productos de todos los reactivos.
Este mtodo requiere de pocos clculos adicionales porque al elaborar el instrumento
rutinariamente se registra para encontrar el grado de dificultad de cada reactivo.
La frmula de Kuder-Richardson puede aplicarse a pruebas cuyos reactivos se
califiquen como aciertos o errores, o de acuerdo con algn otro sistema de todo o nada.
Ahora bien, los reactivos de ciertas pruebas pueden obtener diferentes puntuaciones,
por ejemplo, en un inventario de personalidad el sujeto puede recibir en un reactivo una
calificacin numrica diferente dependiendo de si verifica sus respuestas "de manera
regular", " a veces", "rara vez" o "nunca". Para estos casos puede derivarse una frmula
generalizada conocida como coeficiente alfa, en la que ( DE t), la suma de las
varianzas de las puntuaciones del reactivo, sustituye a pq . El procedimiento consiste
en encontrar la varianza de todas las puntuaciones individuales de cada reactivo y sumar
las varianzas de todos los reactivos. La frmula completa de coeficiente alfa es:

rtt = n DE t - (DE ) n-1 DE t

COEFICIENTE DE CORRELACIN LINEAL DE PEARSON

El coeficiente de correlacin de Pearson, pensado para variables cuantitativas


(escala mnima de intervalo), es un ndice que mide el grado de covariacin entre
distintas variables relacionadas linealmente. Advirtase que decimos "variables
relacionadas linealmente". Esto significa que puede haber vari ables fuertemente
relacionadas, pero no de forma lineal, en cuyo caso no proceder a aplicarse la
correlacin de Pearson. Por ejemplo, la relacin entre la ansiedad y el
rendimiento tiene forma de U invertida; igualmente, si relacionamos poblacin y
tiempo la relacin ser de forma exponencial.

En estos casos (y en otros muchos) no es conveniente utilizar la correlacin de Pearson.


Insistimos en este punto, que parece olvidarse con cierta frecuencia.
El coeficiente de correlacin de Pearson es un ndice de fcil ejecucin e, igualmente,
de fcil interpretacin. Digamos, en primera instancia, que sus valores absolutos
oscilan entre 0 y 1. Esto es, si tenemos dos variables X e Y, y definimos el
coeficiente de correlacin de Pearson entre estas dos variables como xy r entonces:
Hemos especificado los trminos "valores absolutos ya que en realidad si se
contempla el signo el coeficiente de correlacin de Pearson oscila entre 1 y +1. No
obstante ha de indicarse que la magnitud de la relacin vienen especificada por el
valor numrico del coeficiente, reflejando el signo la direccin de tal valor. En este
sentido, tan fuerte es una relacin de +1 como de -1. En el primer caso la relacin es
perfecta positiva y en el segundo perfecta negativa
. Pasamos a continuacin a desarrollar algo ms estos conceptos.
Decimos que la correlacin entre dos variables
X e Y es perfecta positiva cuando exactamente en la medida que aumenta una de
ellas aumenta la otra. Esto sucede cuando la relacin entre ambas variables es
funcionalmente exacta.

Difcilmente ocurrir en psicologa, pero es frecuente en las ciencias fsicas donde los
fenmenos se ajustan a leyes conocidas, Por ejemplo, la relacin entre espacio y tiempo
para un mvil que se desplaza a velocidad constante.

CONFIABILIDAD ENTRE CALIFICADORES.


Una fuente de varianza de error que puede supervisarse de manera sencilla es la varianza del calificador.
Algunas categoras de pruebas (sobre todo las de creatividad y las proyectivas de personalidad) dejan
mucho al juicio del calificador. En el caso de estas pruebas hay tanta necesidad de una medida de
confiabilidad del calificador como de los coeficientes ms comunes de confiabilidad. La confiabilidad del
calificador se consigue con una muestra de pruebas calificadas independientemente por dos o ms
examinadores. Los dos resultados se correlacionan de acuerdo con la forma comn y el coeficiente de
correlacin es la medida de confiabilidad del calificador. Esta clase de confiabilidad suele calcularse
cuando se emplean en la investigacin instrumentos de calificacin subjetiva. Los manuales deben
informar en qu casos es apropiada.

A continuacin se revisan algunas definiciones de confiabilidad. Se comienza con


Anastasi y Urbina (1.998) quienes al respecto expresa lo siguiente: ...El trmino de
confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las mima
personas cuando se las examina en distintas ocasiones con el mismo test, con conjunto
equivalentes de reactivos o en otras condiciones de examinacin...(P.84). Ms adelante
las autoras mencionadas definen la confiabilidad: ....en trminos ms tcnicos, la
confiabilidad de una prueba permite estimar qu proporcin de la varianza verdadera
total de las puntuaciones se debe a varianzas del error ...(P.84).
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el da siguiente siempre existe una diferencia, auque a veces es mnima,
la cual es originada por factores fortuitos como haber tomando el peso inmediatamente
despus de consumir alimentos. Este tipo de diferencias se conocen como varianza del
error y es originada por factores aleatorios, los cuales el investigador cuando aplica un
instrumento debe controlar.
La teora del error de medicin en la confiabilidad de los instrumentos se expresa
de la manera siguiente:
Y= T+E; donde:
Y= Puntuacin observada
T= Puntuacin verdadera
E= Error de la medicin
Transformndose la ecuacin en:
V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretacin del Coeficiente de Confiabilidad

La confiabilidad se interpreta a travs de un coeficiente que tiene los siguientes


rangos:
Rango Interpretacin
0,81 a 1,00 Muy alta
0,61 a 0,80 Alta
0,41 a 0,60 Moderada
0,21 a 0,40 Baja
0,00 a 0,20 Muy Baja
Cuando es Negativo Extremadamente Baja
Cuando es Mayor a 1 Extremadamente Alta

Lo normal es que el coeficiente de confiabilidad est entre 0 y 1; pero en algunos


casos traspasa est intervalo. Cuando un instrumento tiene una confiabilidad negativa,
significativa que sta es extremadamente baja, lo cual debe llevar a tomar la decisin de
rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente mayor a 1, la
confiabilidad es extremadamente alta. Debe aceptarse el instrumento. Lo recomendable
cuando ocurre alguno de estos dos casos es revisar determinadamente las respuestas del
instrumento y los clculos. Es comn cuando esto ocurre que el resultado se debe a
incorrecta codificacin de las alternativas de
respuestas o clculos aritmticos incorrectos cuando el coeficiente se calcula en forma
manual.

Mtodos de Confiabilidad

Los mtodos de confiabilidad son tres, los cuales se desarrollan a continuacin:

Reaplicacin de la Prueba (Test-Retest)

Este mtodo de confiabilidad consiste en aplicar el instrumento a los mismos


sujetos en dos momentos diferentes. Es aconsejable que el intervalo de tiempo, entre las
dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre 15 y
30 das. Debe tenerse cuidado que en el periodo entre ambas aplicaciones, los sujetos no
reciban algn estmulo que pudiera influir en la segunda aplicacin. Este mtodo
genera medida de estabilidad, porque garantiza que los resultados del instrumento sean
estables en el tiempo.
El procedimiento para aplicarlo es el siguiente:
1. Se aplica el instrumento en dos momentos a
los mismos sujetos.
2. Se correlacionan los puntajes de ambas mediciones, a travs de un coeficiente
de correlacin; cuando la variable est en una escala de medicin de intervalo o
de razn se aplican el coeficiente de correlacin de Pearson. Si la variable est
expresada en una escala de medicin ordinal, el coeficiente de correlacin
apropiado es el Spearrman.

A continuacin se presentan dos (2) ejemplos que ilustran ambos casos:

Ejemplo 1

Aplicacin del Coeficiente de Correlacin de Pearson

Puntuacin X Puntuacin Y
Sujetos X2 Y2 X.Y
(1 aplicacin) (2 aplicacin)
1 10 12 100 144 120
2 20 19 400 361 380
3 15 15 225 225 225
4 13 15 169 225 195
5 8 9 64 81 72
6 10 12 100 144 120
7 11 11 121 121 121
8 17 16 289 256 272
9 20 19 400 361 380
10 5 4 25 16 20
N = 10 X = 129 Y = 132 X2 = 1.893 Y2 = 1.934 XY = 1.905

X Y
XY
r N
x 2
y 2

x2
y 2

N N
129132
1.905
10 202,20
r 0,97
129 132 209,42
2 2

1.893 10 1.934 10

El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy alta


(ver rangos de interpretacin).

Ejemplo 2

Aplicacin del Coeficiente de Correlacin de Spearman

Primeros Rango Segundos Rango Di


Sujetos Di2
puntajes (RI) Puntajes (R2) (R1-R2)
1 83 2 43 3 -1 1
2 99 6 47 4 2 4
3 88 5 40 2 3 9
4 41 1 38 1 0 0
5 117 10 66 8 2 4
6 114 9 89 11 -2 4
7 112 8 87 10 -2 4
8 84 3 57 6 -3 9
9 86 4 63 7 -3 9
10 127 12 93 12 0 0
11 107 7 55 5 2 4
12 118 11 83 9 2 4
Total 52

6 Di 2
6 52
r 1 0.82
N N 12 N
3 3

La confiabilidad es muy alta, aceptndose sin reservas el instrumento


Cuando dos o mas sujetos reciben el mimos puntaje, se le asignaba a cada uno el
promedio de los rangos de los sujetos empatados. A continuacin se muestra un
ejemplo:

Rango 1 Rango 2 D
Sujetos Puntuaciones Di2
(R1) (R2) (R1-R2)
1 1 20 1 0 0
2 2 18 3,5 -1,5 2,25
3 3 19 2 1 1
4 4 18 3,5 0,5 0,25
5 5 16 6 -1 1
6 6 15 8 -2 4
7 7 16 6 1 1
8 8 16 6 2 4
9 9 13 10 -1 1
10 10 14 9 1 1
11 11 9 11 0 0
12 12 6 12 0 0
Total 15,5

615,5
r 1 0,95
12 3 12
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.
Hay programa estadstico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlacin, lo cual facilita considerablemente la obtencin de
estos coeficientes. La rutina para obtenerlos es muy fcil de manejar y presenta adems
la prueba de contraste de hiptesis que complementa los resultados obtenidos a travs
de los coeficientes.

PRUEBAS DE FORMAS EQUIVALENTES Y FORMAS


ALTERNAS

Este mtodo consiste en elaborar dos versiones de un instrumento que miden la


misma variable, las cuales se aplican a un mismo grupo de sujetos. Genera en el
instrumento medidas de equivalencia, porque garantiza la obtencin de resultados
confiables cuando la variable se mide en dos versiones diferentes del instrumento.
Cuando las dos versiones no se aplican simultneamente al grupo de sujetos, sino que
se aplican en momentos diferentes; adems de generar medida de equivalencia, tambin
genera medida de estabilidad.
El procedimiento para obtener el coeficiente de confiabilidad de equivalencia es el
siguiente.
1. Elaborar las dos versiones equivalentes del instrumento.
2. Correlacionar los puntajes de ambas versiones de la prueba de la misma
manera que en el caso del mtodo de reaplicacin de la prueba, es decir a travs del
coeficiente de correlacin de Pearson, si la escala de medicin de la variable es de
intervalo o de razn; si la escala de medicin de la variable es ordinal, se aplica el
coeficiente de correlacin de Spearman.
Hay autores que establecen diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando
ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando slo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se est en presencia de
una prueba paralela.

Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:

Formas alternas y formas equivalentes son trminos que en ocasiones se


usan en forma indiscriminada, aunque hay una diferencia tcnicas entre
ellos. Existen formas equivalentes de una prueba cuando para cada forma de
la prueba son iguales las medias y las varianzas de las puntuaciones de
pruebas observadas. ... Las formas alternas tan slo son versiones diferentes
de una prueba que se han construido con el fin de ser equivalentes. Aunque
no cumplen con los requisitos para la designacin legtima de
equivalentes, las formas alternas de una prueba estn diseadas
generalmente para ser equivalentes con respecto a variables (o tems) como
contenido y nivel de dificultad. (p. 160)

MTODO DE CONSISTENCIA
INTERNA
Este mtodo tiene como propsito determinar la homogeneidad en las respuestas
de sujetos a quienes se le aplic el instrumento, puede aplicarse a pruebas que miden
habilidades como prueba de aprovechamiento, aptitud, inteligencia, de nivel de
conocimiento, etc, y a pruebas afectivas (o de personalidad) como las escalas de actitud,
test de personalidad, escalas de motivacin, etc. Es incorrecto aplicar este mtodo a los
cuestionarios de opinin; porque al medir homogeneidad en las respuestas de los sujetos
a quienes se aplica el instrumento, es apropiado para aquellos instrumentos que
persiguen obtener una calificacin nica, con alternativas de respuestas en grado de
intensidad.
En los cuestionarios de opinin no hay inconsistencia si los sujetos responden las
preguntas en forma heterogneas, porque las mismas no son para obtener una
puntuacin nica que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinin, cada pregunta como se mencion
en el captulo V, se analiza por separado. No es posible una calificacin nica, porque,
primero, las opiniones estn en una escala de medicin nominal (slo son
clasificatorias), y en segundo lugar, generalmente este tipo de instrumento, aunque
describa una sola variable, incluye preguntas con las cuales no se puede obtener una
calificacin nica, porque los temes miden o describen aspectos diferentes de la
variable.
A continuacin se presentan varias frmulas para calcular la consistencia interna
de un instrumento.
Frmula Kuder-Richardson (KR 20) Datos dicotmicos.

n vt p.q n p.q
Rt ( )( ) Rt ( ) (1 )
n 1 vt n 1 vt

Rt = Coeficiente de Confiabilidad
n = Nmero de temes que contiene el instrumento.
Vt: Varianza total de la prueba
p.q = Sumatoria de la varianza individual de los temes
Se puede aplicar cualquiera de ambas frmulas, obtenindose resultados similares.

Determinar el coeficiente de la confiabilidad Kuder-Richardson


(Matriz de temes dicotmicos)

temes Total
Sujetos X2
1 2 3 4 5 (x)
1 1 1 1 1 1 5 25
2 1 1 1 1 1 5 25
3 1 1 1 1 1 5 25
4 1 1 1 1 1 5 25
5 0 1 1 1 1 4 16
6 1 0 0 1 1 3 9
7 1 1 1 1 1 5 25
8 1 1 1 1 1 5 25
9 0 1 1 1 0 3 9
Total 7 8 8 9 8 40 184
P 0,78 0,89 0,89 1 0,89 - -
q = 1-P 0,22 0,11 0,11 0 0,11 - -
p.q 0,17 0,10 0,10 0 0,10 0,47 -

P = total x columna entre el nuero de sujetos en el


estudio, el resto se sobre entiende
Clculo de la varianza
p.q = 0.47

( x) 2 ( 40) 2
x2 184
( x x ) 2 n 9 0.78
Vt
n 1 n 1 9 1

Vt = Varianza total
n = nmero de sujetos
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson, se
puede calcular por dos frmulas. Se recomienda calcular el promedio por la segunda
frmula que lo calcula abreviado y es menos susceptible a errores de redondeo, los
cuales cuando se calculan coeficientes pueden afectar significativamente los resultados.

Clculo del Coeficiente Kuder-Richardson

n p.q 5 0.47
Rt ( ) (1 ) Rt ( ) x (1 ) 0,50
n 1 vt 5 1 0.78

Rt = Coeficiente de confiabilidad Kuder-Richardson


n = nmero de temes que contiene el instrumento
Al interpretar los resultados de acuerdo a los rangos explicados, se concluye que
la confiabilidad de consistencia interna es moderada. Si el instrumento evaluado es un
test afectivo (como una escala de actitud, escala de motivacin, test de personalidad,
etc.) debe rechazarse el instrumento. Si es un instrumento que mide habilidades (como
una prueba de conocimiento, prueba de rendimiento acadmico, prueba de aptitud, etc.)
se puede aceptar el instrumento, complementando el anlisis con otros indicadores de
validacin. Cuando la confiabilidad es baja, muy baja o extremadamente baja (negativa)
debe rechazarse el instrumento, aunque sea un test de habilidades.

Datos en Escalas no Dicotmicas (ms de 2 Alternativas de Respuestas)

Frmula Alfa de Cronbach


n Vi
n St Vi rt ( ) (1 )
rt ( ) ( ) n 1 Vt
n 1 Vt
rt = Coeficiente de confiabilidad
n = Nmero de temes que contiene el instrumento
Vt St = varianza total
Vi = varianzas individuales

Se puede aplicar cualquiera de las dos frmulas, obtenindose resultados


similares.

DETERMINAR EL COEFICIENTE ALFA DE CRONBACH


(MATRIZ DE TEMES CON CINCO (5) ALTERNATIVAS DE
RESPUESTAS).
temes Total
Sujetos X2
1 2 3 4 5 6 (X)
1 4 4 3 2 1 1 15 225
2 3 1 3 3 1 2 13 169
3 4 5 4 4 4 4 25 625
4 4 3 2 3 1 1 14 196
5 5 2 4 4 3 1 19 361
6 5 4 3 2 4 2 20 400
7 4 4 2 3 2 3 18 324
8 4 4 2 5 2 4 21 441
Total (x) 33 27 23 26 18 18 145 2.741
X2 139 103 71 92 52 52 - -
Vi2 0.41 1,70 0,70 1.07 1,64 1,64 7,16 -

Clculo de la varianza
Varianza total

(145) 2
2.741
Vt 8 16,13
8(331) 2
139
V 12 Clculo 8de las 0varianzas
,41 individuales
8 1
(27) 2
103
V 22 8 1,70
8 1

(23) 2 (26) 2
71 92
8 2 0,70 V 42 8
V 32 (18) (18) 2 1,07
528 1 8
52 1
V 52 8 1,64 V 32 8 1,64
8 1 8 1
Coeficiente de Confiabilidad

rt=( n ) *( 1- Vi ) =( 6 )* (17,16/16,13)
n- 1 VT 6-1
rt = 0,67
rt = Coeficiente de confiabilidad
n = nmero de temes que contiene el instrumento
Vt = Varianza total
Vi = Varianzas individuales
En este ejemplo la confiabilidad es alta. Si el instrumento mide habilidades se
debe aceptar el instrumento; pero cuando es una prueba afectiva, el coeficiente como
mnimo debe ser 0.81, es decir, poseer una confiabilidad muy alta.
La formula alfa de Cronbach tambin es aplicable a datos dicotmicos. Al
respecto Cohen y Swerdlik (2.000) expresa lo siguientes:.....El coeficiente alfa tambin
puede ser usado en pruebas con reactivos dicotmicos. Adems, el coeficiente alfa es
apropiado para ser usado en pruebas que contienen reactivos que no son dicotmicos...
(P.166). Los resultados de la confiabilidad de datos dicotmicos, aplicando la frmula
Alfa de Cronback, son similares a los obtenidos aplicando la formula Kuder-
Richardson, si las respuestas de los sujetos a quienes se aplic el instrumento son muy
homogneas. En la medida que se incrementa la homogeneidad, mayor ser la similitud
de los resultados de ambas frmulas. Si las respuestas de los sujetos son heterogneas,
la diferencia de los resultados obtenidos por ambas frmulas ser considerable. En este
ltimo caso no es recomendable aplicar la frmula Alfa de Cronbach a temes de
respuestas dicotmicas. Se puede proceder en el clculo de la confiabilidad de datos
dicotmica de la manera siguiente: se calcula el coeficiente de confiabilidad alfa de
Cronbch a travs de SPSS, si el coeficiente es muy alto, se acepta como indicador
adecuado de la confiabilidad (en este caso los datos son muy homogneos). Si es bajo,
se considera heterogneo, siendo aconsejable determinar el coeficiente por la frmula
Kuder- Richardson, porque indica diferencias entre los resultados de ambas frmulas.
Cuando se calcula el coeficiente Kuder-Richardson hay que hacerlo manual; porque el
Programa SPSS no lo calcula. Se puede calcular tambin a travs del programa Excel,
siguiendo la rutina que se incluye en el anexo D. Se justifica la aplicacin de este
programa cuando el nmero de tems del instrumento es alto.
Correlacin tem-test y confiabilidad sin el tem

Correlacin tem-test
Este indicador de homogeneidad del test, permite establecer la correlacin entre
el tem y el total de la escala. Pardo y Ruiz (2.002) Expresan que ...lo deseable es que
esas correlaciones sean altas; una correlacin baja estara indicando que el elemento (el
tem) en cuestin no apunta en la misma direccin que el resto de los elementos. (p.
605)
El paquete estadstico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el tem aceptado debe poseer
una relacin con el total, superior a 0,25; porque de lo contrario la relacin no es
aceptable.

Confiabilidad del Instrumento si se Excluye el tem Analizado

Este indicador de confiabilidad del instrumento, permite determinar si el tem


analizado aporta confiabilidad al instrumento. El criterio que se estable es excluir el
tem y observar el comportamiento de la confiabilidad del instrumento. Si la
confiabilidad sube o permanece igual a la obtenida con el tem incorporado, se toma la
decisin de excluirlo del instrumento; porque se demuestra que el mismo no aporta
confiabilidad al instrumento, en caso contrario, cuando la confiabilidad baja, debe
aceptarse el tem; porque indica que si ste se excluye del instrumento, la confiabilidad
ser afectada (disminuir).

Cclculo de Ambos Indicadores

Su clculo manual es muy engorroso y complejo; pero el programa SPSS lo


calcula, siguiendo la siguiente rutina: Men Estadstico ( o Men Analizar)
EscalasAnlisis de fiabilidadEstadstico: activar la opcin Escala si se elimina el
elemento ContinuarAceptar.

CONFIABILIDAD DE DOS MITADES


Es un mtodo que determina consistencia interna del instrumento. Consiste en
dividir el instrumento en dos mitades y proceder a determinar si existen relacin entre
ambas, aplicando el coeficiente de Spearman-Brown, el cual introduce en la frmula
una correccin, porque al dividir el instrumento en dos mitades se reduce el nmero de
temes, afectando la confiabilidad.
Cmo se constituyen las dos mitades?
Las dos mitades pueden conformarse de varias formas; las ms usuales son las
siguientes:
1. temes pares e temes impares
2. Procedimientos aleatorios para seleccionar los temes de cada mitad

Pasos para calcular el coeficiente de las dos mitades

1. Se constituyen las dos mitades


2. Se calcula el coeficiente de correlacin de Pearson correlacionando las dos
mitades
3. Se aplica la frmula de Spearman-Broawn
El procedimiento para calcularlo es similar a los mtodos de reaplicacin de la
prueba y al de confiabilidad de formas equivalentes y formas alternas. Se aplica la
frmula del coeficiente de correlacin de Pearson cuando la escala de medicin de la
variable es de intervalo o de razn. Si la escala de medicin de la variable es ordinal, el
coeficiente de correlacin adecuado es el de Speraman (ver en este mismo captulo la
subseccin correspondiente al mtodo de reaplicacin de la prueba).

Frmula de Spearman Brown

2r1, 2
rsp
1 r1, 2

rsp = coeficiente de correlacin Spearman-Brown


r 1,2 = coeficiente de correlacin de las dos mitades

Ejemplo

Calificaciones de 10 estudiantes de un curso


Estudiantes Calificaciones primera Calificaciones segunda
mitad de la prueba mitad prueba
1 15 16
2 14 13
3 20 20
4 8 10
5 17 16
6 19 19
7 14 15
8 12 13
9 20 20
10 8 6

En este ejemplo el coeficiente de correlacin de Pearson (r1,2) de las dos mitades


es 0,96
Se procede a calcular el coeficiente de confiabilidad aplicando la frmula de
Spearman-Brown. Los resultados son los siguientes:

2 0.96
rsp 0.98
1 0.96

4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el


instrumento tiene consistencia interna.

Diferencias entre Dos Mitades de la Prueba y Formas Paralelas

Pardo (2.000) al referirse a ambos indicadores de evaluacin de un instrumento,


expresa lo siguiente:
Dos Mitades. Divide la escala en dos partes y calcula la fiabilidad a partir de la
correlacin entre ambas partes. (p. 596). Al referirse a las formas paralelas de un
instrumento, expresa: ...Asume que todos los elementos (tems o variables) tienen
iguales varianzas observadas y error. (p. 596). Pardo, tambin establece diferencias
entre las formas paralelas de una prueba y el paralelo estricto. Al referirse a este ltimo
expresa: ...Asume los supuestos del modelo paralelo y, adems, que las medias de
todos los elementos son iguales."
Para acceder a estos tres modelos incorporados en el programa SPSS desde la
Base de datos que se analiza, se sigue la siguiente rutina: Clic en analizar
EscalaAnlisis de fiabilidaden Modelo cambiar Alfa (opcin por defecto) por
Dos Mitades o Paralelo o Paralelo estricto.

Factores que Incrementan la Confiabilidad

1. Exclusin del instrumento temes ambiguos: las temes deben formularse


de manera clara y precisa, para evitar a quienes los responden
interpretaciones diferentes al sentido para el cual fue formulado.
2. Instrucciones claras tienden a reducir los errores de medicin: el
instrumento de recoleccin de datos, debe ir acompaado de
instrucciones donde se especifique la manera de responder las preguntas
y donde se aclare posibles dudas del respondiente en el momento de
contestar las preguntas formuladas.
3. Control de las condiciones del espacio fsico y el personal responsable de
aplicar el instrumento: cuando se aplica un instrumento debe disponerse
de condiciones de espacio fsico similares para todas aquellas personas a
quienes se le aplicar la prueba. Asimismo el personal responsable de
aplicarlas debe poseer el mismo entrenamiento y las mismas
instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del error,
la cual es causada por factores externos a la prueba. Si este tipo de varianza no se
controla, puede afectar considerablemente los resultados de la prueba, y por lo tanto, la
confiabilidad del instrumento.

Incremento de la Confiabilidad de un Instrumento

Si el instrumento posee baja confiabilidad, sta puede incrementarse agregando


temes de igual tipo y calidad
A continuacin se presenta ejemplos de cmo incrementar la confiabilidad
aumentando el nmero de temes:
Cuantos temes deben agregarse a un instrumento para alcanzar la confiabilidad
deseada?
Frmula
N= CD(1-CI)
CI(1-CD)

n = nmero de temes necesarios para lograr la confiabilidad desea


CI = Confiabilidad del test inicial
CD = Confiabilidad deseada

Ejercicios Resueltos

Si la confiabilidad de un instrumento de 10 temes es 0.46 Cuantos temes


deben agregarse para alcanzar una confiabilidad de 0.81?

N= 0,81(1-0,46) = 5 veces ms largo, es decir, necesita 50 temes para lograr la


0,46(1-0,81) confiabilidad deseada

Si la confiabilidad de un instrumento de 30 temes es 0.05. Cuntos temes deben


agregarse para alcanzar una confiabilidad de 0.90?

N= 0,90(1-0,05) = 171 veces ms largo. Tendra que tener 5.130 temes


0,05(1-0,90)

Si la confiabilidad de un instrumento de 30 temes es 0.55. Cuantos temes deben


agregarse para incrementarla a 0.61?

N= 0,61(1-0,55) = 1,28 veces ms largo. Tendra que tener 38 temes.


0,55(1-0,61)

EJERCICIOS PROPUESTOS
Actividad 1
CONFIABILIDAD POR REAPLICACIN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados :
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de medicin de intervalo)
Prueba (F1) aplicada Prueba (F1) aplicada Prueba (F2) aplicada
Sujetos el 29/02/04 el 22/03/04 el 22/03/04
(Puntaje total) (Puntaje Total) (Puntaje total)
1 267 275 272

2 246 236 240

3 246 229 260


4 244 267 265

5 274 267 270

6 264 280 275

7 274 276 260

8 275 257 270

9 264 269 230

10 248 231 255

11 277 256 250

12 246 253 252

13 224 236 240

14 247 272 271

15 241 258 257

16 240 247 250

17 251 262 260

18 254 266 265


Actividad 2
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados

EJERCICIO 1

temes
Sujetos
1 2 3 4 5
1 1 1 1 1 1
2 1 0 1 1 1
3 1 1 0 0 0
4 1 1 1 1 1
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 1
8 1 0 1 0 0
9 0 1 1 1 0

EJERCICIO 2
Items
Sujetos
1 2 3 4 5 6
1 4 4 4 4 4 4
2 5 4 4 5 4 2
3 5 5 5 5 5 5
4 4 5 4 4 5 4
5 4 4 4 4 5 4
6 4 4 5 5 5 5
7 4 5 2 3 5 5
8 5 5 4 5 4 5
9 4 4 4 4 4 4
10 5 5 5 5 5 5

Actividad 3
Aplicando el programa SPSS como herramienta tecnolgica, calcule e interprete
en la siguente base de datos el coeficiente de confiabilidad alfa de Cronbach y excluye
del instrumento los tems que no aportan confiabilidad y presenten una correlacin tem-
test menor o igual a 0.25:

TEMS
sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
1 5 4 5 5 2 4 4 5 4 1 5 5 4 4 5 5 5 5 5
2 4 4 4 4 1 4 4 4 4 1 4 5 5 4 4 4 5 4 4
3 2 1 3 2 2 2 2 2 1 2 1 1 1 2 2 3 4 5 2
4 4 4 4 4 4 4 4 4 4 2 4 4 4 4 1 4 4 4 4
5 5 4 4 4 2 5 3 4 4 4 5 5 2 4 4 4 5 5 4
6 5 5 5 5 2 5 5 5 5 2 5 5 5 5 5 5 1 5 5
7 5 4 4 4 4 4 1 4 4 2 4 4 4 5 5 4 5 5 4
8 3 4 5 2 5 5 3 3 3 2 5 2 5 2 4 4 5 4 4
9 4 4 4 4 4 4 1 4 4 2 4 4 4 4 1 4 4 4 4
10 4 4 4 4 4 4 1 4 4 4 4 4 4 4 4 4 4 4 4
11 5 5 5 4 4 4 1 5 5 5 4 4 4 5 1 5 4 2 3
12 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
13 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 1 1 2 2
14 4 5 4 4 4 4 5 5 5 1 5 5 5 5 5 5 5 5 5
15 4 4 3 2 4 4 3 2 4 5 4 4 4 4 1 4 5 4 5
16 3 2 2 2 2 2 1 2 4 1 2 4 2 4 2 4 2 4 2
17 4 4 4 4 1 4 1 4 4 1 4 4 4 4 2 4 4 4 4
18 2 4 4 4 1 4 1 4 4 1 5 5 4 2 1 4 2 5 5
19 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
20 4 4 5 5 1 5 5 4 4 2 5 1 4 4 4 2 5 5 5
21 2 1 1 1 1 1 1 1 1 1 1 1 2 2 1 2 2 1 1

Referencias

Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall.


Cohen, R., y Swerdlik, M. (2.001). Prueba y evaluacin psicolgicas. Mxico: Mc.
Graw Hill

Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw Hill.

Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones


CIDEG. C.A.

Lecturas Sugeridas

Aiken, L. (1.996). Tests psicolgicos y evaluacin (octava edicin), Mxico; Prentice


Hall. Se recomienda el capitulo 4: Estandarizacin, confiabilidad y validez.
Apartado de confiabilidad.

Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall. Captulo
4: confiabilidad. Apartado: tipos de confiabilidad.

Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introduccin a la investigacin pedaggico.


Mxico: Mc Graw Hill. Se recomienda el captulo 8: validez y confiabilidad.
Apartado: confiabilidad.

Cohen, R., y Sswerdlik,, M. (2.001). Pruebas y evaluacin psicolgicas. Mxico: Mc


Graw Hill. Se recomienda el captulo 5: Confiabilidad. Apartado: Estimaciones de
confiabilidad.

Kerlinger, F. (1.988). Investigacin del comportamiento (tercera edicin en espaol).


Mxico: MC Graw Hill.. Se recomienda el captulo 26. El contenido es el siguiente:
definiciones de confiabilidad, teora de la confiabilidad, interpretaciones del
coeficiente de confiabilidad, error estndar de la media y el error estndar de la
medicin, mejoramiento de la confiabilidad y el valor de la confiabilidad.

Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw Hill. Se
recomienda leer el captulo 25: Fiabilidad de las escalas: Procedimiento. Anlisis
de Fiabilidad. Exxplica los mtodos de confiabilidad analizados en este captulo y
el procedimiento para calcularlos a travs del programa SPSS.

Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones


CIDEG. C.A.