You are on page 1of 33

VALIDEZ Y CONFIABILIDAD DE

INSTRUMENTOS EN LA
INVESTIGACIÓN

Prospero Celso Benites Grados

CASO 1:
Imagina que deseas evaluar el Nivel nutricional de un grupo de niños y el
instrumento que vas a usar es una BALANZA MALOGRADA.
No importa si tu proyecto de investigación es perfecto
No importa si tu muestra es representativa
No importa si contratas al mejor estadístico del mundo
No importa si invertiste mucho dinero y mucho tiempo.
Simplemente tus resultados no sirven ¿EVIDENTE NO?
CASO 2:
Si yo midiera la temperatura ambiental mediante un termómetro y me
indicara que hay 22°C. Un minuto más tarde consultara otra vez y el
termómetro me indicara que hay 5°C . Tres minutos después observara el
termómetro y ahora me indicara que hay 40°C. Este termómetro no sería
confiable. (Su aplicación repetida produce resultados diferentes).

Si el instrumento con el que recolectas tus datos no esta validado, entonces
las conclusiones que obtengan con esos datos tampoco son validos

La validez y la
Relación entre confiabilidad y validez confiabilidad no se
Un instrumento de medición puede ser confiable, pero no necesariamente válido. Por asumen, se prueban
ello el requisito es que el instrumento de medición demuestre ser confiable y válido.

Analogía para representar confiabilidad y validez Se prueba un arma con 3 Tiradores. Cada uno
Prueba de confiabilidad y validez debe realizar 5 disparos

Tirador 1. Sus disparos Tirador 2. Sus disparos no impactan Tirador 3. Sus disparos se
no impactan en el centro en el centro del blanco, aunque se encuentran cercanos entre
del blanco y se encuentran encuentran cercanos entre sí. Fue sí e impactaron en el centro
diseminados. consistente, mantuvo un patrón. del blanco.

Longitud Peso Tiempo Psicoeducativas Es necesario probar empíricamente que el instrumento es VÁLIDO en todos los casos ¿Qué características deseamos que prediga? CRITERIO La exactitud con que pueden Ausencia de sesgos. 2003) Martins. 1998) pretende medir (Ruiz. Fernandez y realmente el rasgo que quiere medir (Palella y Baptista. Grado en que un instrumento hacerse mediciones significativas Representa la relación realmente mide la variable y adecuadas con un instrumento. 2006) . entre lo que se mide y que pretende medir en el sentido que mide aquello que realmente se (Hernández.

considerados como medidas adecuadas del mismo rasgo. otras). ¿Qué significado tiene el comportamiento con respecto a los atributos del individuo para evaluar características y habilidades psicológicas. al hecho de que el instrumento contenga en sus ítem Validez de Contenido todos los aspectos de acuerdo a los objetivos de la investigación. actitud. Validez de Constructo inteligencia. por ejemplo: en una fábrica se utiliza la producción de las personas Validez de Criterio empleadas como criterio para evaluar empleados nuevos . que son de interés para la medición? El Instrumento mide lo mismo que miden otros instrumentos ya existentes. motivación. TIPOS DE VALIDEZ Llamada también de muestreo Cuan representativo Se refiere básicamente al contenido del instrumento. (ansiedad. pensamiento crítico.

. . . ___________________ 9 . ___________________ 11 . . . . . . ___________________ 2 . . . . . ___________________ . ___________________ 5 . . . ___________________ 10 . . ___________________ 8 . . Palella y Martins. . . . . . . ___________________ 6 . . . . . 2003) representatividad). . ___________________ 7 . . . . . . . . . . . . . . . ___________________ 4 . . . . . . EVIDENCIA RELACIONADA CON EL CONTENIDO Se determina hasta donde los itemes de un No puede ser expresada instrumento son representativos de las cuantitativamen variables que se desea medir (grado de te (Ruiz. 2006 Método: Validez de Contenido Técnica: Juicio de Expertos Ítems Congruencia Claridad Tendenciosidad Observaciones Si No Si No Si No 1 . . . . .

2003) 2006) Método: Validez de Constructo Técnica: Análisis Factorial 1. tenían soporte empírico en los datos grado . eficacia lo hace? (Ruiz. mide realmente un determinado indicadores y variables que se rasgo latente o una característica reflejan en la operacionalización de las personas ? ¿Con cuanta de variables. EVIDENCIA RELACIONADA CON EL CONSTRUCTO Verifica que el instrumento ¿Hasta donde un instrumento contenga todas las dimensiones. personal y escolar) alumnos de 6to. Ruiz (1988) desarrolló la escala Con la Técnica Análisis Factorial AC 2000 que mide comprobó que las dimensiones autoconcepto de (Autoconcepto: social. (Palella y Matins.

64 28 0. Ruiz (1988) Coeficiente de Correlación 0.40 13 0.43 26 0.Estima de 2. Escala Auto -.56 30 0. Escolar A.58 22 0.54 7 0. EVIDENCIA RELACIONADA CON EL CONSTRUCTO Item Factor 1 Item Factor 2 Item Factor 3 A.41 Instrumento AC . Social A.51 4 0.57 9 0.53 6 0.48 16 0.48 25 0.79 . Información 2000 Coopersmith (1959) Correlacional.55 10 0.54 29 0.57 27 0.52 1 0.43 2 0.49 12 0. Personal 3 0.63 8 0.45 5 0.

83 Pearson: 0. EVIDENCIA RELACIONADA CON LA PREDICCIÓN Alumno PAA L (Y) Establece la validez de un instrumento de medición (X) comparándola con algún criterio externo. 2009) Ronny 710 87 Frank 682 85 Victor 700 83 Método: Validez Predictiva Técnica: Análisis Correlacional Vanesa 691 80 Liévana 705 82 La PAA es un Ruben 600 81 instrumento Maybeth 690 90 Válido Julio 709 90 Coeficiente de Correlación Marbelis 715 78 entre X e Y: Spearman: 0. mayor será su validez (Silva.87 . Entre más se relacionen los resultados del instrumento con el Egledis 650 75 criterio.

¿Cómo sabemos que estamos haciendo la inferencia correcta? Un instrumento que no Consciencia de usar tiene una validez instrumentos demostrada no vale la IMPORTANCIA técnicamente bien pena aplicarlo DE LA VALIDEZ calibrados Construir un instrumento técnicamente bien hecho. implica en si mismo una investigación .

Silva (2009) Reproducibilidad Estabilidad y Seguridad Precisión Consistencia Interna u Predictibilidad Homogeneidad . CONFIABILIDAD Se refiere al grado en que su aplicación de un instrumento repetida al mismo sujeto produce iguales resultados” Hernández. Menéndez (2009) Se refiere al grado en que su aplicación repetida al mismo sujeto u objeto produce iguales resultados. En el análisis de la confiabilidad se busca que los resultados de un cuestionario concuerden con los resultados del cuestionario en otra ocasión. Fernández y Bastita (1998) “(p.21) Se refiere a la consistencia de los resultados.

(2009) Grupo homogéneo: Confiabilidad baja Grupo heterogéneo: Confiablidad alta .Diferentes versiones (Confiabilidad en paralelo) Muñoz. CONFIABILIDAD Supuestos Básicos: La persona no cambia -Diferentes tiempos (Test – Retest) -Diferentes observadores (Confiablidad interobservador) .

.

. Alfa de Cronbach Homogeneidad de los itemes con escala tipo Lickert. División por dos Pearson/Spearman. Homogeneidad de los itemes al mitades Brown. correlación de Pearson consistencia de las respuestas. medir el constructo Rulón Guttman Análisis de KR 20 Coeficientes de fiabilidad como homogeneidad de los consistencia interna para itemes Itemes dicotómicos (KR20). TIPOS DE CONFIABILIDAD MÉTODO TÉCNICA PROPÓSITO Test/retest Coeficiente r Consistencia en el tiempo de los correlación de Pearson puntajes Formas Equivalentes Coeficiente r Estabilidad Temporal.

. DESCRIPCIÓN DE LOS MÉTODOS Método: TEST – RETEST Características:  El investigador debe aplicar el mismo instrumento dos veces al mismo grupo después de cierto período.  Coeficiente de Correlación de Pearson altamente positivo = Instrumento confiable. Debilidades:  El periodo de tiempo (corto – largo) entre las mediciones puede confundir el coeficiente de confiabilidad.  Debe calcular la confiabilidad del instrumento ANTES de la aplicación definitiva del mismo.

Son administradas al mismo grupo en un período relativamente corto. Deben ser similares en contenido. Debilidades:  Dificultad para obtener dos pruebas realmente paralelas  Implica doble trabajo  Confiable solo si la correlación entre los resultados de ambas aplicaciones es positiva . tipos de preguntas y dificultad. Los patrones de respuestas deben variar POCO entre las aplicaciones. instrucciones. DESCRIPCIÓN DE LOS MÉTODOS Método: FORMAS EQUIVALENTES Características: Se administran dos o más versiones equivalentes de un mismo instrumento. Coeficiente de Confiabilidad = Fórmula de Correlación de Pearson.

etc. que puedan ser codificados con 1 – 0 (correcto – incorrecto. presente – ausente. Es aplicable sólo en instrumentos con ítems dicotómicos. . Técnica: Kuder – Richardson KR . No requiere el diseño de pruebas paralelas. a favor – en contra. DESCRIPCIÓN DE LOS MÉTODOS Técnica: Alfa de Cronbach Características: Requiere sólo una aplicación del instrumento de medición. Se aplica la medición y se calcula el coeficiente.20 Permite calcular la confiabilidad con una sola aplicación del instrumento. Produce valores que oscilan entre cero (0) y uno (1).) . No es necesario dividir en mitades los ítems del instrumento.

3. Correlacionar las puntuaciones totales de las dos mitades. CONFIABILIDAD DIVISIÓN DE DOS MITADES Spearman. como se expresa en la fórmula que aparece en la siguiente lamina: . 2. Multiplicar el coeficiente obtenido por 2 y dividir el término 1 más la correlación de las dos mitades.Brown Pasos: 1. Dividir los itemes de la prueba en dos partes iguales.

CONFIABILIDAD DIVISIÓN DE DOS MITADES Spearman.Brown FORMULA: rtt= coeficiente de confiabilidad de las mitades. rhh= correlación de Spearman entre las dos mitades o los puntajes pares e impares. .

. St2= Varianza total de la prueba o escala.CONFIABILIDAD DIVISIÓN DE DOS MITADES Rulón (1939) FORMULA: rtt= coeficiente de confiabilidad de las mitades Sd2= varianza de la diferencia de los puntajes pares e impares.

00). CONFIABILIDAD DIVISIÓN DE DOS MITADES Rulón (1939) Pasos: 1. Restar esta proporción de la unidad (1. . Calcula la diferencia de la varianza de las dos mitades para cada sujeto. 3. 2. Dividir la varianza de los puntajes totales.

. CONFIABILIDAD DIVISIÓN DE DOS MITADES Guttman y Flanagan (1939) FÓRMULA: rtt= coeficiente de confiabilidad Sd2= varianza de la diferencia de los puntajes pares e impares. St2= Varianza total de la prueba o escala.

75 0 1 0 3 1 0.75 0 0 1 1 0 6 1 1 0 1 0.75 0 1.75 0 1 1 8 1 1 1 1 1 1 1 1.75 1 1 9 0 1 0 1 0 1 1 0 1 0 10 1 1 1 1 1 0 1 0 1 0 IMPARES: 1+3+5+7+9 Media PARES:2+4+6+8+10 Varianza .75 1 1 2 1 0 2 4 1 1 1 1 1 0. CONFIABILIDAD GUTTMAN Alumnos I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 IMPAR PAR TOTAL 1 2 1.75 1 0.25 2 0 2 1 1 1 1 0.75 1 1 1 1 5 1 1 1 0 0.75 1.75 1 0 0 5.75 0 1 0 0 0 7 0 0 0 0 0.50 9.75 3.75 1 0 1 0.

CONFIABILIDAD KUDER-RICHARDSON (KR-20) PROCEDIMIENTO: Correlación a través de proporciones de aciertos y desaciertos y varianza del total de aciertos. APLICABLE EN: Lista de Cotejo y cuestionarios de preguntas cerradas con opciones de respuestas dicotómicas (SI.NO) .

∑p. S2 T= Varianza del total de aciertos.q= sumatoria de proporciones de aciertos por desaciertos. CONFIABILIDAD KUDER-RICHARDSON (KR 20) K= Número de Ítems. HOJA DE CÁLCULO 2 EN EXCEL .

.

CONFIABILIDAD KUDER-RICHARDSON (KR 20) Sujetos 1 2 3 4 5 6 Total 1 1 0 1 1 1 1 5 2 0 0 1 1 0 0 2 3 1 1 1 0 1 1 5 4 1 1 0 1 1 0 4 5 1 1 0 0 0 1 3 p q p.q .

.

Escala de Lickert. APLICABLE EN : Escalas de Estimación. test de aptitud no verbal . test de aptitud verbal. cuestionario de preguntas cerradas con opciones policotómicas . CONFIABILIDAD ALFA DE CRONBACH PROCEDIMIENTO: Correlación a través de la varianza de cada ítem asociado por variables y la varianza de las puntuaciones totales. test psicológico. .

Instrumento HOJA DE CÁLCULO EN EXCEL . CONFIABILIDAD ALFA DE CRONBACH K= Número de Ítems. S2T= Varianza de los puntajes totales. S2= Varianza de los puntajes de cada ítems.

47 9. CONFIABILIDAD ALFA DE CRONBACH 1 2 3 Total de Puntajes Sujetos 4 1 4 5 5 1 15 2 1 1 1 3 6 3 2 5 3 4 14 4 3 3 2 4 12 5 3 2 3 4 12 6 5 1 4 5 15 ∑ 10 17 10 21 74 S2/Itemes 2 ∑S2/Itemes St 2=11.27 .

.81 FUENTE: RUIZ (2002).41 A 0. CONFIABILIDAD RANGOS MAGNITUD 0.21 A 0.01 A 0.61 A 0.80 Alta 0.00 Muy Alta 0.81 A 1.60 Moderada 0.40 Baja 0.20 Muy Baja Importante: se sugiere repetir la validación del instrumento puesto que es recomendable que el resultado sea mayor o igual a 0.

Una alta confiabilidad. Pero no puede haber “buenos” resultados científicos sin instrumentos confiables. no garantiza “buenos” resultados científicos. por si sola. Carlos Ruiz Bolívar (2003) .