You are on page 1of 43

Validez y

Confiabilidad

Validez y Confi abilidad

Qu significa medir?
En la vida diaria
medimos
constantemente

MEDIR ES PARTE DE
NUESTRAS VIDAS

Validez y Confi abilidad

Qu significa medir?
Medir
significa
asignar
nmeros, smbolos o valores a
las propiedades de objetos o
eventos de acuerdo con reglas.

MEDICIN
Proceso de vincular conceptos abstractos
con indicadores empricos, el cual se
realiza mediante un plan explcito y
organizado
para
clasificar
(y
con
frecuencia
cuantificar)
los
datos
disponibles
(los
indicadores),
en
trminos
del
concepto
que
el
investigador tiene en mente.

Validez y Confi abilidad

Instrumentos de Medicin
En la medicin, el instrumento de medicin o de recoleccin de datos
tiene un papel central. La definicin sugerida incluye dos
consideraciones:
la primera es desde el punto de vista emprico y se resume en que
el centro de atencin es la respuesta observable (sea una
alternativa de respuesta marcada en un cuestionario, una conducta
grabada va observacin o una respuesta dada a un entrevistador).
la segunda es desde una perspectiva terica y se refiere a que el
inters se sita en el concepto subyacente no observable que se
representa por medio de la respuesta.

Validez y Confi abilidad

VALIDEZ
Se refiere al grado en que un instrumento realmente mide la
variable que pretende medir.
Pensamos en la variable y
vemos cmo hacer preguntas sobre esa variable. La validez es
una cuestin ms compleja que debe alcanzarse en todo
instrumento de medicin que se aplica.

La validez es un concepto del cual


pueden tenerse diferentes tipos de
evidencia:
Relacionada con el
contenido
Relacionada con el
criterio
Relacionada con el
constructo

Validez y Confi abilidad

Validez de Contenido
Se refiere al grado en que un instrumento refleja un
dominio especfico de contenido de lo que se mide. Es
el grado en el que la medicin representa al concepto o
variable medida. Un instrumento de medicin requiere
tener representados prcticamente a todos o la mayora
de los componentes del dominio de contenido de las
variables a medir.

Validez y Confi abilidad

Validez de Contenido
El dominio de contenido de una variable normalmente
est definido o establecido por la teora y
antecedentes. En cada estudio se debe probar que el
instrumento utilizado es vlido. Si el dominio de un
instrumento es demasiado estrecho con respecto al
dominio de la variable, el primero no representar a
sta. La pregunta que se responde con la validez de
contenido es: el instrumento mide adecuadamente las
principales dimensiones de la variable en cuestin?
las preguntas qu tan bien representan a todas las
preguntas que pudieran hacerse?

Validez y Confi abilidad

Validez de Criterio
Establece la validez de un instrumento
de medicin al comparar sus resultados
con los de algn criterio externo que
pretende medir lo mismo.
Este criterio es un estndar con el que
se juzga la validez del instrumento.
Cuanto ms se relacionen los resultados
del instrumento de medicin con el
criterio, la validez de criterio ser
mayor.
Si el criterio se fija en el presente
de manera paralela, se habla de validez
concurrente
(los
resultados
del
instrumento se correlacionan con el
criterio en el mismo momento o punto de
tiempo). Si el criterio se fija en el
futuro, se habla de validez predictiva.

Validez y Confi abilidad

Validez de Criterio
El principio de la validez de criterio es sencillo: si diferentes
instrumentos o criterios miden el mismo concepto o variable, deben
arrojar resultados similares. Si hay validez de criterio, las
puntuaciones obtenidas por ciertos individuos en un instrumento
deben estar correlacionadas y predecir las puntuaciones de estas
mismas personas logradas en otro criterio.
La pregunta que se responde con la validez de criterio es: en qu
grado el instrumento comparado con otros criterios externos mide lo
mismo?, o qu tan cercanamente las puntuaciones del instrumento se
relacionan con otro(s) resultado(s) sobre el mismo concepto?

Validez y Confi abilidad

Validez de Constructo
Se refiere a qu tan exitosamente un instrumento representa y mide
un concepto terico. A esta validez le concierne en particular el
significado del instrumento, esto es, qu est midiendo y cmo
opera para medirlo. Parte del grado en el que las mediciones del
concepto proporcionadas por el instrumento se relacionan de manera
consistente con otras mediciones de otros conceptos, de acuerdo con
modelos e hiptesis derivadas tericamente. A tales conceptos se
les denomina constructos.
Un constructo es una variable medida y
que tiene lugar dentro de una hiptesis,
teora o un esquema terico. Es un
atributo que no existe aislado sino en
relacin con otros. No se puede ver,
sentir, tocar o escuchar; pero debe ser
inferido de la evidencia que tenemos en
nuestras manos y que proviene de las
puntuaciones
del
instrumento
que
se
utiliza.

Validez y Confi abilidad

Validez de Constructo

Se establece
y especifica
la relacin
terica entre
los conceptos
(sobre la
base de la
revisin de
la
literatura).

2
Se
correlacionan
los conceptos
y se analiza
cuidadosamente
la
correlacin.

Se interpreta la
evidencia emprica de
acuerdo con el nivel
en el que clarifica
la validez de
constructo de una
medicin en
particular.

Validez y Confi abilidad

Validez de Constructo
El proceso de validacin de un constructo est vinculado
con la teora. Cuanto ms elaborada y comprobada se
encuentre la teora que apoya la hiptesis, la
validacin del constructo arrojar mayor luz sobre la
validez general de un instrumento de medicin. Las
preguntas que se responden con la validez de constructo
son: el concepto terico est realmente reflejado en el
instrumento?, qu significan las puntuaciones del
instrumento?, el instrumento mide el constructo y sus
dimensiones?, por qu s o por qu no?, cmo opera el
instrumento?

Validez y Confi abilidad

Validez de Expertos
Se refiere al grado en que
aparentemente
un
instrumento
de
medicin
mide
la
variable
en
cuestin, de acuerdo con
voces
calificadas.
Se
encuentra vinculada a la
validez
de
contenido.
Regularmente se establece
mediante la evaluacin del
instrumento ante expertos.

Validez y Confi abilidad

Validez Total
La validez de un instrumento de medicin se evala sobre
la base de todos los tipos de evidencia.
Cuanta mayor
evidencia de validez de contenido, de validez de criterio
y de validez de constructo tenga un instrumento de
medicin, ste se acercar ms a representar la(s)
variable(s) que pretende medir.

Validez
de
contenid
o

Validez
de
criteri
o

Validez
de
construct
o

Valide
z
total

Validez y Confi abilidad

Clculo de la Validez
VALIDEZ

VALIDEZ DE
CONTENIDO

Revisar cmo ha sido medida


la
variable
por
otros
investigadores y elaborar
un universo de tems o
reactivos
posibles
para
medir la variable y sus
dimensiones.

Se seleccionan los tems y


si
la
variable
est
compuesta
por
diversas
dimensiones o facetas, se
extrae
una
muestra
probabilstica
de
reactivos, ya sea al azar o
estratificada.

Se administran los tems, se


correlacionan
las
puntuaciones de stos entre
s y se hacen estimaciones
estadsticas para ver si la
muestra es representativa.

Para calcular la validez de


contenido son necesarios
varios coeficientes.
Algunas veces no se
calculan estos
coeficientes, sino que se
seleccionan los tems
mediante un proceso que
asegura la
representatividad no de
manera estadstica sino
conceptual.

Validez y Confi abilidad

Clculo de la Validez
VALIDEZ DE
CRITERIO
La validez de criterio se estima al
correlacionar la medicin con el
criterio externo (puntuaciones del
instrumento frente a las
puntuaciones en el criterio), y
este coeficiente se toma como
coeficiente de validez.

VALIDEZ DE
LaCONSTRUCTO
validez

de
constructo
suele
determinarse mediante procedimientos de
anlisis
estadstico
multivariado
(anlisis
de
factores,
anlisis
discriminante,
regresiones
mltiples,etc.)

Validez y Confi abilidad

Factores que influyen en la confiabilidad y


la validez
Falta de
estandarizacin

Improvisacin del instrumento


Condiciones en las que se aplica
el instrumento de medicin.
Estilos personales de los participantes

El instrumento resulta inadecuado para las personas


a quienes se les aplica: no es emptico
Uso de instrumentos desarrollados en el extranjero que no han
sido validados en nuestro contexto: cultura y tiempo

Validez y Confi abilidad

El concepto de confiabilidad.
Es el grado de congruencia con se realiza la
medicin

de

una

variable.

Esta

medicin,

puede

llegar a lograr un alto coeficiente de validez,


pero un bajo coeficiente de confiabilidad.

La confiabilidad se refiere a su capacidad para dar resultados iguales al ser


aplicada, en condiciones iguales, dos o ms veces a un mismo conjunto de objetos,
En el cual existe estabilidad, consistencia, seguridad, precisin y predictibilidad, en
las significaciones directas de cada uno de ellos.

Validez y Confi abilidad

De acuerdo a Stromquist Nelly P., este criterio cientfico


tiene que ver con la capacidad del instrumento en uso de producir
medidas constantes dado el mismo fenmeno. Generalmente se
distingue entre la confiabilidad externa para indicar que otros
investigadores usando los mismos instrumentos observaran los
mismos hechos y confiabilidad interna par indicar que otros
investigadores haran la misma conexin entre las definiciones en
uso y los datos que se recojan, es decir, elaboraran el mismo
constructo en base a los mismo hechos.
En si, la confiabilidad se refiere a La extensin o grado en
que un test dar resultados consistentes si se aplica ms de una
vez a la misma gente bajo condiciones estndar-

Validez y Confi abilidad

En este sentido, Una Investigacin con buena


confiabilidad es aquella que es estable, segura,
congruente, Igual a s misma en diferentes tiempos y
Previsible para el futuro. En la evaluacin presenta
dos tipos de confiabilidad que reconocen como:

Confiabilidad
interna.

Al
estudiar
la
misma realidad, se
concuerdan en sus
conclusiones.

Confiabilidad
externa.

Al estudiar una realidad


en tiempos o situaciones
diferentes, llegan a los
mismos resultados.

Validez y Confi abilidad

Qu mide la
confiabilidad?
La

confiabilidad

determinacin

de

es
la

una

medida

estabilidad

consistencia interna del instrumento.

de
la

Validez y Confi abilidad

Un

Estabilidad

instrumento

veces

los

es

estable

mismos

condiciones,

si,

fenmenos,

arroja

aplicado
bajo

resultados

repetidas

las

mismas

consistentes

(congruentes).

Ejemplos

Observadores diferentes aplican un mismo instrumento a la


misma

muestra

(en

momentos

diferentes)

obtienen

resultados consistentes.
Un

mismo

observador

aplica

un

instrumento

equivalentes y obtiene resultados consistentes.

muestras

Validez y Confi abilidad

Propiedad del instrumento segn la


Consistencia
interna

cual, cada parte del mismo mide de


la

misma

manera

que

las

otras

partes.
Cada mitad de una cinta mtrica
arroja las mismas mediciones que
la cinta mtrica completa.

Ejemplo:
Cada

mitad

de

la

cinta

mtrica

arroja los mismos valores que la


otra mitad.

Validez y Confi abilidad

Importancia de la Confiabilidad
Para

que

los

resultados

de

un

instrumento

puedan

ser

interpretables; es decir, para que tengan significado y valor


heursticos, es necesario que los mismos sean confiables. No es
posible determinar la relacin entre dos o ms variables si los
instrumentos utilizados para medirlas son poco confiables. Este
tipo

de

instrumentos,

interpretaciones

erradas

menudo,
de

sus

inducen

al

resultados.

investigador
Por

ejemplo,

a
un

experimento educativo, en el cual se ha evaluado el efecto de


una

nueva

estrategia

instruccional,

pudiera

parecer

poco

efectivo, aun habiendo tenido un impacto altamente significativo


en

el

aprendizaje

de

los

alumnos,

simplemente

porque

los

instrumentos utilizados para medir las variables dependientes


eran poco confiables.

Validez y Confi abilidad

La confiabilidad, aun cuando no es la caracterstica ms importante


de un instrumento de medicin, requiere se le preste toda la atencin que
sea

necesaria.

Ciertamente,

una

alta

confiabilidad,

por

si

sola,

no

garantiza buenos resultados cientficos. Pero, no puede haber buenos


resultados

cientficos

sin

instrumentos

confiables.

En

sntesis,

la

confiabilidad es una condicin necesaria, pero no suficiente para obtener


resultados

de

investigacin

socialmente tiles.

que

sean

cientficamente

valiosos

Validez y Confi abilidad

Relacin entre fiabilidad y


Hay una creencia generalizada de que la validez de una prueba est

validez.

relacionada directamente con su fiabilidad. Para interpretar esta regla


hay que diferenciar entre pruebas homogneas y heterogneas. Las primeras
tienen una alta fiabilidad de consistencia interna, pero pueden no tener
validez

para

medir

ciertos

rasgos

al

dejar

de

incluir

aspectos

importantes. En las segundas puede ocurrir lo contrario.


La fiabilidad y validez pueden ser, por tanto, incompatibles y hay
que llegar a un compromiso. La fiabilidad muy alta requiere tems muy
correlacionados

entre

la

validez

muy

alta

tems

poco

correlacionados. Adems, es deseable una gama de dificultades, con objeto


de disponer de una gama graduada para medir las diversas capacidades de
las personas.

Validez y Confi abilidad

Test-retest

Densidad de un mineral.

Medicin
1.
Tiempo1.

Medicin
2.
Tiempo 2.

Consiste
en
la
aplicacin
de
un
mismo
instrumento
a una misma
muestra de sujetos en al
menos
dos
momentos
diferentes.
No existe criterio nico
respecto de cual debe ser el
lazo adecuado de tiempo
entre la primera y segunda
aplicacin,
este
se
establece en funcin de los
fines del instrumento o la
investigacin.

Validez y Confi abilidad

En

Cmo se aplica el
test-retest para
estimar la
confiabilidad?

este

procedimiento

instrumento
indicadores)
veces

un

Si la correlacin entre los resultados


diferentes

aplicaciones

es

altamente positiva, el instrumento se


considera

confiable.

Pero

(o

aplicado

mismo grupo

tiempo

segunda

las

es

medicin

mismo
tems

dos
de

por

lo

entre

la

ms

sujetos,

despus de un periodo de tiempo.


El

de

de

un

primera

aplicacin es un factor

que hay que considerar.

Cul es el
resultado?

contrario es negativa el mismo no es


confiable.
El coeficiente que se obtiene recibe el nombre de coeficiente de
estabilidad porque denota la coherencia de las puntuaciones en el tiempo.
Para un desarrollo adecuado y que el mismo sean confiables deben variar
entre 0,80 y 0,95.

Validez y Confi abilidad

Limitaciones del test-retest


Si el periodo es largo y la variable susceptible
de cambios, ello puede confundir la interpretacin del
coeficiente

de

confiabilidad

obtenido

por

este

procedimiento. Y si el periodo es corto las personas


pueden

recordar

aplicacin

del

cmo

contestaron

instrumento,

para

en

la

aparecer

consistentes de lo que son en realidad.

primera
como

ms

Validez y Confi abilidad

Formas paralelas de un test.


Este

mtodo

consiste

en

elaborar

dos formas paralelas de un mismo


test a una muestra de inters, o lo
que

es

paralelos.

lo

mismo,

dos

tests

Validez y Confi abilidad

Cmo se aplica el
mtodo de las
formas paralelas
para estimar la
confiabilidad?

Las dos formas deben ser administradas bajo las mismas condiciones, o, al
menos, bajos los mnimos cambios posibles en las condiciones. Se trata de
no introducir factores que puedan provocar cambios en los resultados.

Respecto

al

tiempo,

debe

utilizarse

un

lapso

entre

ambas

formas

lo

suficientemente corto como para que los sujetos no hayan cambiado en la


variable

de

inters

lo

suficientemente

largo

para

que

factores

de

memoria, fatiga, o entrenamiento tengan el mnimo efecto.

Para controlar los efectos, de confusin de la forma de la prueba en el


momento de la aplicacin, la forma A debe administrarse a la mitad del
grupo y la forma B la mitad restante; luego, en la segunda aplicacin, el
primer grupo presenta la forma B y el segundo la forma A.

Validez y Confi abilidad

Cul es el
resultado de la
forma paralela de
un test?

Puede
interpretarse
como
coeficiente
o
indicador
equivalencia entre los dos tests:

un
de

-Si la correlacin es alta, las dos


formas del mismo test dan resultados
parecidos, ordenan a los sujetos de
manera parecida, ambas formas son
intercambiables.
- En caso contrario, la correlacin
entre las dos formas (respondidas con
das u horas de diferencia) es baja,
la conclusin ms razonable no es que
los sujetos han cambiado, sino que
las dos formas no estn equilibradas
en sus contenidos y de alguna manera
miden cosas distintas o con nfasis
distintos.

Validez y Confi abilidad

Limitaciones del forma


paralela de un test?
La

dificultad

de

este

procedimiento

radica

en

conseguir

que

dos

instrumentos sean realmente paralelos, dada la dificultad que supone


realizar

dos

pruebas

que

midan

exactamente

lo

mismo,

pero

con

diferentes tems. No obstante, en condiciones ideales en las que se


pueda garantizar el paralelismo de ambas formas, este es el mtodo ms
recomendable.

Validez y Confi abilidad

Mtodo de mitades partidas


(Split-halves)

Consiste
dividirlo

en
en

elaborar
dos

aplicarlo a un sujeto.

un

test

mitades

para

Validez y Confi abilidad


Cmo se aplica el mtodo
de las prueba en dos
mitades para estimar la
confiabilidad?

Solo

requiere

una

sola

aplicacin de la medicin en un
mismo grupo de sujetos, y se
divide la prueba en dos mitades
y se comparan los resultados en
correlaciones.

Validez y Confi abilidad

Cul es el
resultado del mtodo
de las prueba en dos
mitades?
El

conjunto

total

componentes)

es

mitades

las

de

dividido

tems
en

(o
dos

puntuaciones

resultados de ambas son comparados.


Si el instrumento es confiable, las
puntuaciones de ambas mitades deben
estar fuertemente correlacionadas.

Validez y Confi abilidad

Limitaciones del mtodo de


las prueba en dos mitades.
La principal dificultad de este sistema es asegurarse de que
ambas

mitades

sean

efectivamente

paralelas.

Un

sistema

habitual es dividir el test entre los tems pares y los


impares; no es recomendable dividirlo sin ms por la mitad,
dado que muchos tests muestran un incremento gradual de la
dificultad de sus tems..

Validez y Confi abilidad

Se trata de un ndice de consistencia interna que


toma

valores

entre

que

sirve

para

comprobar si el instrumento que se est evaluando


Coeficiente
Alfa de Cronbach recopila informacin defectuosa y por tanto nos
llevara a conclusiones equivocadas o si se trata
de

un

instrumento

fiable

que

hace

mediciones

estables y consistentes.

El coeficiente Alfa de Cronbach es un modelo de consistencia interna,


basado en el promedio de las correlaciones entre los tems. Entre las
ventajas de esta medida se encuentra la posibilidad de evaluar cunto
mejorara (o empeorara) la fiabilidad de la prueba si se excluyera un
determinado tem.

Validez y Confi abilidad

Cmo se aplica el mtodo de


Coeficiente Alfa de Cronbach
para estimar la confiabilidad?

Este coeficiente requiere una sola medicin y mide la consistencia interna


de los tems en cada escala
y el instrumento como conjunto. Es decir
entrega un valor estadstico que nos indica en que medida un conjunto de
tems apuntan en la misma direccin.

La frmula KR-20 tan solo es una variante de alfa especialmente orientada a items
dicotmicamente valorados.

Una vez obtenido p (=A/N) y q (=1- p) para cada tem, se procede a obtener la
varianza de cada tem como producto de p por q. Tambin necesitamos la varianza del
total y la suma de la varianza de los items para aplicar finalmente la frmula KR20.

Validez y Confi abilidad

Cul es el resultado
Coeficiente Alfa de
Cronbach ?

Alfa de Cronbach es por tanto un coeficiente de


correlacin al cuadrado que, a grandes rasgos, mide la
homogeneidad de las preguntas promediando todas
las correlaciones entre todos los tems para ver que,
efectivamente, se parecen. Su interpretacin ser que,
cuanto ms se acerque el ndice al extremo 1, mejor es
la fiabilidad, considerando una fiabilidad respetable a
partir de 0,80.

Validez y Confi abilidad


Su
frmula
siguiente:

estadstica

es

la

S
i
2

K
1

2
K 1
S

Donde:
K: El nmero de tems
Si^2: Sumatoria de Varianzas de los Items
ST^2: Varianza de la suma de los Items
: Coeficiente de Alfa de Cronbach

Validez y Confi abilidad


Representa un coeficiente de consistencia

El Mtodo KR20
COEFICIENTE DE
KUDER RICHARDSON

interna del instrumento, que proporciona


la media de todos los coeficientes de
divisin

por

mitades

para

todas

las

posibles divisiones del instrumento en dos


partes (Magnusson, 1995).
Se representa de la siguiente manera:

Gracia
s

Por su

atenci
n