You are on page 1of 59

UNIVERSIDAD

NACIONAL FEDERICO
VILLARREAL
FACULTAD
DE PSICOLOGA
CURSO: DISEOS DE
INVESTIGACIN PSICOLGICA
Profesor:

DR. JOS ANICAMA GMEZ


2015

UNIDAD 8:
INSTRUMENTOS DE
MEDICIN EN
CIENCIAS DE LA
SALUD

OBJETIVO 1:

DISCRIMINAR ALGUNOS
CONCEPTOS BSICOS
VINCULADOS A LA MEDICIN DE
VARIABLES COMPORTAMENTALES
Y DE SALUD.

En
el

Campo de las
ciencias
se
intenta
Explicar
Predecir
los
Fenmenos
Observables
e
Trminos
de
n
leyes

En

La psicologa y la
educacin
Empezaron

Relacionarse
con el inicio

del

Desarrollo
de los

test
psicomtricos

y con la

investigacin
experimental

Un ejemplo de ello son las primeras aplicaciones que hizo


Whitner a la medicin directa de nios con problemas de
aprendizaje despus de los sucesos de la 2da guerra
mundial, de esta manera surgi la psicologa clnica.
En el caso de la medicina esto empez mucho ms
temprano por la naturaleza de las variables bio-fsicas y
bio-qumicas en estudio, as como, la adopcin muy
temprana del mtodo experimental por
Claude
Bernard ,en el campo de la medicina.
Con los aos el proceso de medicin ha mejorado
significativamente en todas las ciencias.
La medicin del comportamiento implica el uso de
procedimientos, segn determinadas reglas para
alcanzar un resultado que implique la asignacin de
valores numricos a un atributo psicolgico o variable en
estudio de las personas.

En el caso de las mediciones de las variables que se


estudian en psicologa, medicina, educacin y
ciencias de la salud se accede a la medicin del
objeto de dos formas:
Cuando la recoleccin de datos implica
1.DIRECT
observacin
y
medicin
del
A
comportamiento utilizando un criterio.

Ejemplos
:

Nmero de veces que ocurre una conducta


en una unidad de tiempo.
En una escala de 10 ptos el nio resuelve el
30% de problemas de matemticas, es decir,
de 10 ejercicios, el nio resuelve slo 3
ejercicios.

En el caso de la Salud Pblica, es el


nmero de veces o casos de clera
que ocurre en un da, una semana o un
mes, obteniendo la prevalencia reciente
del clera.
Tambin el caso de las biopsias para
determinar la naturaleza del problema de
salud.

Cuando la recoleccin de los datos se hace


2.INDIRECT sobre la base de los efectos o resultados,
que seala la presencia de una propiedad o de
A
la presencia de un proceso psicolgico,
biofsico o social.
La inteligencia se mide a travs del
rendimiento del sujeto en un test; el
consumo de marihuana se mide a travs de
su prevalencia usando un cuestionario
especifico, o la presencia de alteraciones
oncolgicas se mide por medio de los valores
que permite obtener el antgeno prosttico: PSA.

Ejemplos
:

En la misma rea es la evaluacin de la presencia


del cncer a travs de pruebas como el PSA ,
FTA, TAC, resonancia magntica, etc.
Otro caso son las denuncias que se presentan
por abuso sexual y/o explotacin laboral
infantil
(tambin
se
puede
calcular
prevalencias).

QU IMPLICA LA RECOLECCIN DE
EN EL DATOS?
PROCESO DE
INVESTIGACIN
despus
Problema

seg
n

de

Seleccionar

se

Procede
a

el

Diseo

Recolectar Datos
que

la
los

Muestra
Objetivos

permitan

Medir Las
Variables
que se estn
Estudiando

la

Hiptesis

Recolectar
datos
implica
tres
estrictamente vinculadas entre s:

actividades

1.
Selecciona
r

Un instrumento de medicin de los


disponibles
en
el
estudio
del
comportamiento, sino lo hay se
requiere construir uno nuevo, el cual
debe ser vlido y confiable para
que sus resultados tengan utilidad.

2. Aplicar

Ese instrumento de medicin, el cual


nos permite la observacin y
medicin
de
la
variable
dependiente que estamos estudiando.

Ejemplo: Puntajes en una escala de calidad de vida,


puntajes en una escala de
estilos de aprendizaje,
prevalencia de consumo de alcohol, puntajes en una escala
de satisfaccin del usuario de servicios mdicos.

3.
Preparar

Mediciones obtenidas para que puedan


colocarse en una base de datos, que
permitan sus anlisis estadsticos.

Para variables como autoestima o calidad de la


atencin, stas siendo conceptos abstractos no
pueden ser considerados como algo que puede verse o
tocarse directamente, sino mas bien sabemos de su
existencia cuando lo evaluamos y obtenemos un
resultado, una consecuencia o un indicador o un
producto de que dicha variable est presente.

Desde el punto de vista


psicolgico

La medicin puede definirse como el proceso de


vincular conceptos abstractos, con indicadores
empricos y en este proceso, el instrumento de medicin
juega un papel principal.
A veces es difcil encontrar un instrumento para
medir una variable compleja, pero en la medida que
nos sea posible deberamos mantenernos estrechamente
relacionados con la definicin dada para ese hecho

Ejemplos
:

Cuando
Lo mismo se
seraquiere
para el medir
caso deestrategias
variables
cognitivas,
vinculadas creatividad,
a
la
actividad
estilos de aprendizaje,
profesional
solucin
biomdica:
de problemas,
calidad creencias
de
la irracionales.
atencin,
Estos
satisfaccin
son conceptos
del usuario,
abstractos
oferta yque
demanda
requieren
de
una
servicios
definicin
mdicos,
operacional,
etc., su medicin
la cual
requiere
a su
vez
el uso
permitir
de escalas
construiro el cuestionarios
instrumento
de
especialmente
medicin. construidos.

Finalmente conviene precisar que la definicin


dada sugiere dos consideraciones:

a)

Desde el punto de vista emprico, la medicin


se centra en que el eje de la atencin es lo
observable.
Ejemplo: Marcar una alternativa de
respuesta en una encuesta.

b)

Desde una perspectiva terica se refiere a


que el inters se ubica en el concepto
subyacente no observable el cual es
representado por la respuesta.
Ejemplo: Los puntajes o marcas, hechos en cada
tem de una variable, definen la mayor o menor
presencia de dicha variable.
As en una escala de 10 tems de satisfaccin del
usuario, mientras ms respuestas positivas tenga,
ms puntaje tendremos de satisfaccin.

OBJETIVO 2:
DISCRIMINAR QUE
REQUISITOS DEBE CUMPLIR
UN INSTRUMENTO DE
MEDICIN

Todo instrumento de recoleccin de


datos debe reunir 2 requisitos
esenciales:
La Confiabilidad
La Validez

La Confiabilidad
Se refiere al grado por el cual, la aplicacin repetida al mismo
sujeto, permite estimar la estabilidad en el tiempo del
comportamiento que estamos midiendo (rendimiento
acadmico, ortografa, dislexia, consumo de marihuana, conducta
de riesgo de embarazo).
La confiabilidad se puede determinar mediante diversas
tcnicas:

Confiabilidad test-retest es la mas


usada.
Confiabilidad por mitades (comparar
tems pares con tems impares).
Confiabilidad por el mtodo de la
consistencia interna (todos los tems
contra todos los tems).

LA
VALIDEZ

Se refiere al grado en el cual un


instrumento realmente mide la variable
que
pretende
medir.
La
validez
es un
concepto del cual puede
tenerse
evidencias
a
travs
diferentes procedimientos:

de

1. Evidencias relacionadas con el


contenido
Se refiere al grado especfico por el cual un instrumento refleja un
dominio especfico de contenido de aquello que est midiendo, es
decir representa a todos los tems del rea que pretende
medir.
Una
prueba
diseada
para
medir
operaciones matemticas bsicas y que slo
incluya a la resta, es una prueba cuya validez de
Ejemplo
contenido es pobre, porque no representa a
todos los componentes de las operaciones de
aritmtica bsica, como son: suma, resta,
multiplicacin, divisin.

Por tanto se recomienda que al definir lo que se


quiere medir, se establezca una tabla de
especificaciones.

2. Evidencias relacionadas con el


criterio
Por el cual se establece la validez de un instrumento,
comparndolo con un criterio externo. Este criterio es un
estndar con el cual se juzga la validez del instrumento. Este
criterio externo por lo general es el puntaje en otra prueba
anteriormente validada.

Ejemplo

La escala API de Anicama para evaluar


desordenes emocionales se compara con las
escalas del EPI de Eysenck, o las de depresin
de Zung y la de Beck

Si el criterio se fija en el momento presente, se habla de


validez concurrente, pero si el criterio se fija en el futuro, se
habla de validez predictiva.

3. Validez relacionada con el


constructo
Es una de las ms importantes pruebas desde el punto de vista
cientfico y se refiere al grado en el cual una medicin se relaciona
consistentemente con otras planteadas anteriormente.
La validez de constructo comprende 3 etapas:
1era Etapa

Se establece y especifica la relacin terica entre los


conceptos.

2da Etapa

Se correlacionan los conceptos y generalmente se utiliza


una prueba estadstica de anlisis factorial para encontrar
las consistencias o relaciones subyacentes entre los rasgos
que se quiere medir.

3era Etapa

Se interpreta la evidencia emprica para clarificar la


validez de dicha medicin. Es conveniente recordar que el
proceso de validacin de constructo est vinculado a la
teora.

OBJETIVO 3:
DISCRIMINAR Y UTILIZAR
CRITERIOS PARA HACER
OPTIMO: VLIDO Y
CONFIABLE, UN
INSTRUMENTO DE
MEDICION.

Paso
1

Para hacer ptimo o confiable un instrumento, si el


instrumento
esta
construyndose
o
adaptndose al pas, el primer paso es:

Que 10 expertos psiclogos, mdicos o no, redacten o


traduzcan los tems que componen el instrumento cada
uno por separado.

Luego el investigador principal los junta, compara e


integra redactando la primera versin del texto o del
instrumento de medicin.

En el caso que se construya una prueba esta debe tener una


tabla de especificaciones, es decir una matriz en la cual se
describa las diversas reas componentes del instrumento, y el
nmero de tems que se asigna a cada rea.

Ejemplo
1

1
2
3
4

Tabla de especificaciones para evaluar


maltrato infantil (definicin operacional
de maltrato infantil).

reas o
N de tems
Total
componentes
Sustitucin de
1,2,3,4
4
letras
Omisin de letras
5,6,7,8,9,10
6
Adicin de letras
11,12,13,14
4
Inversin de letras 15,16,17,18,19,
6
20
TOTAL
20

La definicin en sus componentes del rea o tema a


estudiar es muy importante, para saber que es lo que se
quiere medir.

Ejemplo
2
Item
1
2
3
4
5
6
7

Tabla de especificaciones para un test de


escritura(definicin
operacional
de
escritura)

Areas
Maltrato Pre Natal
Maltrato Fsico
Maltrato Psicolgico
Negligencia Fsica
Negligencia
Psicolgica
Abuso sexual
Abuso y explotacin
laboral
TOTAL

Ejemplo de tems
para maltrato prenatal:

Numero de
Total
1=
NoItems
ir al control
1,2,3,4,5,6,7,8,9
9
mdico,
10, 11, 12, etc.
12
2= Consumo
de
alcohol

12
durante
el embarazo

8
3= Consumo
de tabaco

10
durante el embarazo

6
4= Consumo
de drogas

7
durante el embarazo
5= Intentos de aborto
64
6=
Recibir
golpes
estando
en
gestacin.
7= Nutricin deficiente
durante el embarazo

Ejemplo
3
Tabla de especificaciones de las creencias acerca
del desempeo profesional en la oferta-demanda
de los servicios y cuidados mdicos (definicin
operacional)
N
INDICADORES
CREENCIAS
1 Desempeo en los servicios y 1,2, 3 y 14
cuidados mdicos
2 Marketing en Salud
4
3 Calidad del servicio y cuidado que
5 y6
ofrecen
4 Administracin de salud
7y8
5 Polticas de salud
9
6 Sede de trabajo
10
7 Econmicos
11,12 y 13

Paso
2
Para hacer ptimo un instrumento es necesario aplicarlo a
pequeos grupos poblacionales de 10 a 20 personas muy
variados en edad, sexo y grado educativo con el objetivo de
hacer la adaptacin lingstica y el anlisis de la comprensin de
los tems y del test total.
A continuacin se hacen las correcciones al instrumento y se
aplica a un nuevo grupo seleccionado al azar, no mayor de 30
personas con el propsito de hacer un nuevo anlisis global de la
prueba con nfasis en:

La
comprensin
de los tems

La
comprensin
de las
instrucciones

Determinar el tiempo que se


requiere para resolver la
prueba o escala

Paso
3

Realizar una prueba de validacin de


contenido por criterio de jueces.

En este nivel se procede a hacer la primera prueba de


validez de contenido, es decir de 5 a 10 jueces
analizarn
cada tem en funcin de la definicin
operacional dada para la prueba
Luego se analiza y se establece el grado de acuerdo
entre los jueces. El porcentaje ideal de acuerdo es
de 95% hacia arriba. Lo ptimo es de 100%.
Existe en la actualidad algunos procedimientos para
poder hacer algunos clculos cuantitativos de la validez
de contenido.

Frmula de
ndice de
acuerdos

Si tenemos:

Ejemplo

n= 10
jueces
Acuerdo = 6
Desacuerdo = 4

Es un procedimiento psicomtrico, por


el cual se trata de cuantificar de alguna
manera los acuerdos que tienen los
jueces. Los valores que se utilizan como
criterio de medida van de 0 a 1. Los
coeficientes obtenidos (V) son mejores
cuando su valor es ms elevado:

COEFICIENTE
DE VALIDEZ
DE AIKEN (V):

Si esto:

Ejemp
lo

S= Numero de acuerdos
N = Numero de jueces
C = Numero de valores
con el cual se trabaja
en la escala

Si tiene dos valores se denomina dicotmica.


Ejemplo: Los valores de respuesta: SI NO; Masculino Femenino;
Verdadero - Falso.
Si tiene ms de dos valores se denomina politmica.
Ejemplo:
Si las respuestas a marcar son: nunca, a veces, mucho,
siempre; entonces la escala es politmica porque tiene cuatro valores.

Ejemp
lo

BASE DE DATOS PARA REGISTRAR


ACUERDOS Y DESACUERDOS DE JUECES

ITEMS /
JUECES

10

TOTAL

9A

5A

7A

I V de 0.80 es aceptable , pero es ideal tener un IV > 0.90

Puede
concluirse
siguiente:

lo

Si hay necesidad de corregir los


tems se procede a hacerlo ahora
antes de pasar a la siguiente
etapa.
Si se tuviera que validar nuevos
tems no olvide el seleccionar
jueces expertos.

Ahora le mostrar un estudio realizado por:


Jos Anicama & colaboradores, 2011. titulado:

Elaboracin de estudio de lnea de base


para evaluar el efecto del programa de
intervencin teraputico en medio cerrado
para adolescentes en conflicto con la ley
penal con problemas de consumo y
dependencia de alcohol y otras drogas de
centros juveniles.

Validacin del
Instrumento

1era
FASE

La validacin del
instrumento se realiz las
siguientes fases:

Consisti en la revisin conceptual por


parte del equipo consultor, el cual
elabor una versin preliminar del
instrumento.
El especialista responsable de DEVIDA,
propuso ajustes a dicha versin y luego a
la
versin
final
del
instrumento,
particularmente en lo referido a los
indicadores teraputicos, para una mejor
comprensin
por
parte
de
los
adolescentes

2da
FASE

Validacinpsicomtrica
por Criterio de Jueces

En la tabla 1 se presentan los valores obtenidos para la validez por


el mtodo de jueces utilizando el coeficiente de validez de Aiken.
Se utilizaron 8 jueces especialistas en el campo de las drogas,
obtenindose en 71 tems un coeficiente de validez igual a 1.0
cuando p<.01, es decir son puntajes de correlacin altamente
significativos.
Y se obtuvieron 4 tems con un coeficiente de validez igual a
0.875 cuando p<.05, siendo este valor significativo, esos tems
fueron los nmeros 5, 11, 24 y 58; en otros trminos nuestros
tems tuvieron una mnima probabilidad de error del 1% lo
cual es marcadamente significativo y muy aceptable cuando
se trabaja con 8 jueces.
En suma, el instrumento muestra una alta consistencia interna
entre sus indicadores y los tems que evalan los comportamientos
para permitir establecer una lnea de base de la dependencia al
consumo de drogas tal como se muestra a continuacin;

Tabla 1. Valores de Aiken y niveles de probabilidad.


Jueces
5
6
7
8
9
10

Acuerdo
s
3
4
5
4
5
6
5
6
7
6
7
8
7
8
9
8
9
10

IA

PB

0.60
0.80
1.00
0.67
0.83
1.00
0.71
0.86
1.00
0.75
0.88
1.00
0.77
0.89
1.00
0.80
0.90
1.00

.312
.156
.031
.234
.094
.016
.164
.054
.008
.109
.031
.004
.070
.018
.002
.043
.009
.000

0.60
0.80
1.00
0.67
0.83
1.00
0.71
0.86
1.00
0.75
0.88
1.00
0.77
0.89
1.00
0.80
0.90
1.00

.032

.016

.008

.035
.004

.020
.002
.049
.001
.001

Tabla 2: Valores de Aiken para la validez psicomtrica del


instrumento a emplearse en el establecimiento de una
lnea de base de los comportamientos de dependencia o
abuso de drogas en adolescentes en conflicto con la ley
penal:
Item
1
2
3
4
5
6

V de
Aiken
1.0
1.0
1.0
1.0
0.875
1.0

1.0

1.0

1.0

Valores
.004
.004
.004
.004
.035
.004
.004
.004
.004

Anlisis y descripcin
Altamente Significativo p <
Altamente Significativo p <
Altamente Significativo p <
Altamente Significativo p <
Significativo p < 0.05
Altamente Significativo p <
Altamente Significativo p <
Altamente Significativo p <
Altamente Significativo p <

0.01
0.01
0.01
0.01
0.01
0.01
0.01
0.01

Item

Valores

Anlisis y descripcin

12

V de
Aiken
1.0

.004

Altamente Significativo p <


0.01

13

1.0

.004

Altamente Significativo p <


0.01

14

1.0

.004

Altamente Significativo p <


0.01

15

1.0

.004

Altamente Significativo p <


0.01

16

1.0

.004

Altamente Significativo p <


0.01

17

1.0

.004

Altamente Significativo p <


0.01

18

1.0

.004

Altamente Significativo p <


0.01

19

1.0

.004

Altamente Significativo p <


0.01

20

1.0

.004

Altamente Significativo p <

Paso
4

Validez por anlisis de tems: Con la


tercera versin del instrumento se procede a
realizar la prueba de validez de contenido
ms completa.

OBJETIVO
es
Establecer
una
que
correlacin
permita
especifica
tem - test

Precisar si
cada tem
mide lo que
dice medir:

Como y cuanto
contribuye a la
validez total
de la prueba.

Para ejecutar esta etapa se debe aplicar el


instrumento a un nuevo grupo poblacional formado
al azar de 100 sujetos.

En esta fase se utiliza tcnicas de anlisis estadstico para


calcular este grado de correlacin.
Las principales pruebas ms usadas son:
PRUEBA DE CORRELACIN CONTINUO
BISERIAL
o
Prueba
basada

Ms alto

en la

Proporcin de puntajes
o

Ms bajo

en

la

Distribucin del test


emplendose
cuando
las

Respuestas son dicotmicas

PRUEBA DE CORRELACIN DE PEARSON


empleada

si las

Respuestas a los tems


incluyen

3 o ms alternativas
Esperndose
las

que

Correlaciones

Mayor numero

para que
el

sean
siempre

Significativas

de

Puntajes

expliquen
los

tems de la escala

Por lo tanto se calcula tambin la significacin de la


correlacin utilizando la prueba t de student.

COEFICIENTE DE CORRELACIN BISERIAL


PUNTUAL (RBP):
se establece

Como una correlacin de Pearson entre dos


variables
Con la particularidad de que una de esas
variables
es de tipo
continuo

dicotmica

(no dicotomizada, como ocurre en el


caso de la correlacin biserial).

Dentro de las dos formas de anlisis de tems mencionados,


la validez por la

PRUEBA DE CORRELACIN CONTINUO


BISERIAL

ha sido
Perfeccionada
Simplificada
al mismo tiempo
Utilizando una estrategia basada en la distribucin de
puntajes entre grupos extremos, por ello este mtodo
se conoce como mtodo de las diferencias entre grupos
extremos.

MTODO DE LAS DIFERENCIAS ENTRE GRUPOS


EXTREMOS PARA HACER ANLISIS DE TEMS.
Esta basado en el hecho que la medida mas precisa de la
capacidad de un tem para discriminar se obtiene cuando la
comparacin o computacin de la diferencia pa pi (pa =
puntaje alto; pi= puntaje inferior), se basa en el anlisis
del 27% extremo de cada mitad de la distribucin del test.
Segn Magnunson (1976) cuando pa pi se computan de este
modo, la capacidad discriminativa del tem puede expresarse por
un coeficiente de correlacin para establecer la relacin
entre el tem y el test y con estas estimaciones construir
tablas o grficos que sin perder la precisin, simplifiquen
el procedimiento de anlisis.
La tabla grfica de anlisis ms conocida es la de Flanagan, sin
embargo la ms actualizada es la de Colver.

El procedimiento para
consiste en lo siguiente:

a)

b)

c)

hallar

la

correlacin

Una muestra poblacional entre 60 a 100 sujetos como


mnimo es evaluada con el instrumento para probar su
validez y confiabilidad.
Se califican las pruebas y se ordenan los
puntajes de menor a mayor.
Se identifica la proporcin del 27% de los puntajes
ms altos que resolvieron el test y el tem a validar:
se denomina pa (proporcin de los puntajes
ms altos).
Se identifica la proporciona del 27% de los
puntajes mas bajos que resolvieron el tem y el
test: se denomina pi (proporcin de los puntajes
ms bajos).

d)

e)

El procedimiento para calcular la proporcin es


establecer una relacin proporcional entre el
nmero de aciertos correctos de los sujetos que estn
ubicados en el 27% ms alto o ms bajo y
dividirlo entre el total de sujetos de esa
proporcin
Obtenidas las proporciones pa y pi se calcula la
correlacin usando la grfica modificada de
Colver por la cual se intersectan las dos proporciones
en una lnea recta que corta la lnea media de la
figura para dar en el punto de interseccin: el puntaje
de la correlacin. ( puntajes menos de 0.40 se
debe eliminar por que discriminan muy poco)

Ejemp
lo

tems /
Sujetos
1
2
3
4
5
6
7
8
9
etc.

N=
Pa=
altos

120 sujetos
27% Puntajes mas

Si
Si
Si
No
Si
No
Si
Si
Si

N = 32
Aciertos = 30 dicen Si

Pa

Pi= 27% Puntajes ms bajo

Ejemp
lo

N=
Pa=
altos

tems/Sujetos
1
2
3
4
5
6
7
8
9
etc.

120 sujetos
27% Puntajes mas

1
No
No
No
No
Si
No
Si
No
No

N = 32
Aciertos = 2 Dicen Si

Pi
Usando la tabla de Colver se
obtiene una correlacin = 0.84
(correlacin muy aceptable)

Ejm: Calcular la correlacin con los siguientes valores de pa


y pi:
Pa = 86 Pi = 36 CORRELACION = 0.53 (baja, requiere

4.2. PRUEBA DE CORRELACIN PRODUCTO


MOMENTO DE PEARSON:
Es la ms empleada para calcular la relacin entre 01 tem y el
puntaje total del test.
Para calcularla se siguen los siguientes pasos:

1. Elaborar la base de datos donde el n


mnimo debe ser entre 60 a 100 sujetos.
ITEMS
SUJETO
S

X1

X2

X3

X4

X5

X6

X7

X8

1
2
3
4
5
6
7
8
9
10

1,0
1,5
2,0
2,0
2,5
2,5
3,0
3,0
3,5
3,5

1,5
1,5
1,5
2,0
2,0
2,5
3,0
3,0
3,0
3,5

X9 X10

Pje.
total
del test
(Y)
5
11
18
16
18
19
20
22
21
23

2. Armar la relacin entre cada columna (X) con el


puntaje total (y).
X1
1
1.5
2.0
2.0
2.5
2.5
3.0
3.0
3.5
3.5

Y1
5
11
18
16
18
19
20
22
21
23

X2
1,5
1,5
1,5
2,0
2,0
2,5
3,0
3,0
3,0
3,5

Y2
5
11
18
16
18
19
20
22
21
23

3. Calcular la suma de cuadrados para


cada tem:
= 2,45
= 17, 30

4. Calcular la suma cuadrada (Cxx)


de X:

=
Ejemp
lo

= 66,75 -

= 6. 725

5. Calcular la suma cuadrada (Cyy) de


Y:

=
Ejemp
lo

= 3265 -

= 272.10

6. Calcular el cuadrado de las variables cruzadas: suma


de productos cruzados

=
= 542-

= 5.2

7. Calcular la correlacin r de
Pearson

r=

r=

r=

r=
r=0.681
4

Lo ideal es que pase de


0.5.
Lo recomendable es que este lo mas
cerca de 1

debido a que as
El tem es mas potente y discrimina mas
lo que se quiere medir.

8. Para probar la hiptesis se ejecuta una: Prueba de


significancia

t = 2.6232 luego se compara la t hallada con la t esperada


Hallar los grados de libertad teniendo en cuenta la frmula t
n-2 = 8 grados de libertad

Para t ( = .05) = 2.306 (es el valor esperado en la tabla de t)


t hallado
t esperado
2.62
>
2.306
La r es significativa porque el t hallado es mayor que el
t esperado, cuando p < .05

Paso
5

VALIDEZ
FINAL
INSTRUMENTO

DEL

Luego que se ha efectuado la prueba de anlisis de tems,


el instrumento queda listo para hacer las pruebas finales
de validez y de confiabilidad del instrumento total.
Es recomendable realizar las siguientes pruebas:

Validez de
constructo:
Su objetivo es analizar en que medida la prueba
tiene una serie de factores componentes que la
definen y le dan sustento al instrumento.
El procedimiento estadstico para hacerlo es el anlisis
factorial.

Validez concurrente o por criterio externo:


Su objetivo es validar el instrumento cruzndolo con otras
pruebas que midan dicho factor o algn componente de l,
la cual es trabajada habitualmente en el medio.
Por ejemplo cruzar la escala de Neuroticismo de Eysenck con la
escala de depresin de Beck. Cruzar o relacionar dos escalas que
midan satisfaccin laboral clima organizacional.

Validez por el mtodo de grupos nominados


El anlisis estadstico consiste en hacer comparaciones
calculndose primero las medidas de tendencia central para los
diagnsticos dados por el juez y los puntajes obtenidos por los
sujetos en las pruebas; luego se comparan ambos criterios.
Se espera que los puntajes de acuerdo sean mayores del 90%
y lo ideal es que sean del 100%.

Paso
6

DESARROLLO DE PRUEBAS
FINALES DE CONFIABILIDAD.

El objetivo
de

esta

Prueba

es

Ver la consistencia y la
estabilidad de las medidas
tomadas en el tiempo.

Se procede de la siguiente manera:

CRITERIOS

PROCEDIMIENTO

TCNICAS DE ANLISIS

1. ESTABILIDAD

Test Retest

r de Pearson

2.

Forma A vs B

r de Pearson

EQUIVALENCIA
3.CONSISTENCI

Prueba de mitades : r de Pearson

INTERNA

Par Impar

DICOTMICA: (S o No)

Homogeneidad

Prueba de Kuder Richardson


POLITOMICA: Prueba Alfa de
Crombach

Concluida esta fase de confiabilidad el procedimiento queda


listo para realizar la etapa de establecimiento de normas o
baremos de la prueba.

Paso
7
LOS
BAREMOS

Construccin de Baremos o
Normas de Estandarizacin
Tablas que se prescriben en la
forma
de
escalas
percentilares de 0 a 100
de estaninos de 0 a 9 .

Se presentan distribuidos todos los puntajes posibles a


ser obtenidos por el test y que a su vez permitan que
cuando se aplique la prueba a cualquier sujeto se pueda
ubicar su posicin en dichas escalas

Procede a hacer un diagnostico comparndola con una poblacin


normal de referencia, para precisar si el sujeto esta dentro de la
normalidad de la poblacin, o en los lmites superior o inferior.

1. Modelo de Escala
Percentilar

2. Modelo de Escala de
Estaninos

Ambos modelos de
baremos
distribuyen
los puntajes siguiendo
la
curva
de
distribucin normal.

Fin del objetivo

c
a
r
G