You are on page 1of 79

CI

UNIVERSIDA D DEL BIO-BIO

Indice de Procedimientos
Estadsticos

DC
I

Cundo usas qu?

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

B
Carlos
Rodrguez Garcs
20
07

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

a la infinidad de
DFrente
CI
pruebas
E
cuando usar qu?
UB
B

20
07

Diseo

Tipo de
variable

Un grupo

Prueba
Estadstica

Proporciones
Cuantitativas

Prueba Z, Binomial,
Prueba t, Intervalos de
Confianza

Dos grupos
independient
es

Proporciones
Rango
Cuantitativas

Fisher, Ji cuadrada, Prueba Z


U de Mann-Whitney
Prueba t no pareada

Dos grupos
relacionados

Proporciones
Rango
Cuantitativas

Tres o ms
grupos
independient
es

Proporciones
Rango
Cuantitativas

Tres o ms
grupos
relacionados

Proporciones
Rango
Cuantitativas

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

McNemar, Binomial
Signos, Wilcoxon
Prueba t pareada
Correlacin de Pearson

Ji cuadrada
Kruskal-Wallis
ANOVA

20

07

Q de Cochran
Friedman
ANOVA con observaciones
repetidas

Carlos Rodrguez G.: Trabajo Social UBB

Pruebas No Paramtricas
Son de libre distribucin

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Menos robustas que las paramtricas pero menos


exigente que aquellas

DC
I

Pueden ser usadas cuando la variables es ordinal (Las


paramtricas exigen sea Escalar)
Las Hay:

UB

De un Muestra

De Dos Muestras Independientes

De Dos Muestras Relacionada

De K Muestras Independientes

De K Muestras Relacionadas

20

07

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

E No Paramtrica 1M
P.

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Chi-2 de Bondad de Ajuste




CI

UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba No Paramtrica
Una variable ordinal o nomimal
Compara las fo y fe en cada categora
Contrasta si las categoras contienen la misma
proporcin de valores o una proporcin especificada por
el usuario

DC
I

UB

Ej.: Determinar si una bolsa de caramelos contiene en


igualdad de proporcin caramelos de color azul, marrn,
verde, naranja, rojo y amarillo

Ej.: Para ver si una bolsa de caramelos contiene un 5% de


color azul, un 30% de color marrn, un 10% de color verde, un
20% de color naranja, un 15% de color rojo y un 15% de color
amarillo.

20

Supuestos:
 Las pruebas no paramtricas.
 Se asume que los datos son una muestra aleatoria.
 Las fe para cada categora debern ser 1 como
mnimo.
 No ms de un 20% de las categoras debern tener
frecuencias esperadas menores que 5.

07

CI

Chi-Cuadrado

UNIVERSIDA D DEL BIO-BIO

DC Se acepta la hiptesis nula


IEcuando:

U
BB < Chi-tabular
Chi-calculado

20
07


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Carlos Rodrguez G.: Trabajo Social UBB

Prueba Binomial
Prueba No paramtrica

CI


UNIVERSIDA D DEL BIO-BIO




Una variable y Dicotmica

DC
I

Contrasta bondad de ajuste entre distribucin terica y


muestral


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

p y q

Compara fo de cada categoras de una variable dicotmica


con las fe de una distribucin binomial con un parmetro de
probabilidad especificado.
Por defecto: Parmetro de probabilidad para ambos grupos
es 0,5.
Cambiar probabilidades: Introducir una proporcin de
prueba para el primer grupo. La probabilidad del segundo
ser 1 menos la probabilidad del primer grupo (1-p).

UB

20

07

Ej.: Una moneda al aire, la probabilidad de que salga cara es 1/2.


Si se lanza al aire 40 veces y 3/4 de los lanzamientos sali cara
Est cargada?

Ejemplo Prueba Binomial




CI

UNIVERSIDA D DEL BIO-BIO

100 sobres (50 con el frmaco y 50 con un placebo) se


distribuyen aleatoriamente?
Se conoce el resultado del tratamiento en 79 de ellos.
 Antes de analizar el efecto del frmaco se debe comprobar
que la muestra de 79 pacientes es representativa de la
poblacin objeto de estudio. Que la proporcin de pacientes
tratados con el frmaco es igual a la proporcin de pacientes
tratados con el placebo.
La Binomial como prueba de bondad de ajuste contrasta Ho que
la muestra procede de una poblacin en la que las proporciones
de individuos que presentan los valores x1, y x2, son iguales a
pe(esperada) y a qe= (1 pe), respectivamente:

DC
I


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

H0: p = pe y q = qe


20

07

Si el p-valor asociado al estadstico de contraste es menor que


alfa, se rechazar Ho al nivel de significacin alfa.
 H0: p = p(FARMACO= 1) = 0,5


Lo que es lo mismo: la muestra procede de una poblacin en


la que la proporcin de pacientes tratados con el frmaco es
igual a la proporcin de pacientes tratados con el placebo.

Prueba de rachas

CI


UNIVERSIDA D DEL BIO-BIO

Prueba No Paramtrica
Contrasta si es aleatorio el orden de aparicin de dos
valores de una variable.
 Una racha es una secuencia de observaciones
similares.
 Una muestra con un nmero excesivamente grande
o excesivamente pequeo de rachas sugiere que la
muestra no es aleatoria.
La prueba de rachas se puede utilizar para determinar si
la muestra fue extrada de manera aleatoria.

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

Ej.: Suponga que se realiza una encuesta a 20


personas para saber si compraran un producto. Si
todas estas personas fueran del mismo sexo, se
pondra seriamente en duda la supuesta
aleatoriedad de la muestra

07

Prueba de K-S para una muestra

CI


UNIVERSIDA D DEL BIO-BIO




Prueba No Paramtrica
Una variable cuantitativa
Compara la funcin de distribucin acumulada
observada de una variable con una distribucin terica
determinada, que puede ser la normal, la uniforme, la de
Poisson o la exponencial.
La Z de Kolmogorov-Smirnov se calcula a partir de la
diferencia mayor (en valor absoluto) entre las funciones
de distribucin acumuladas terica y observada.
Esta prueba de bondad de ajuste contrasta si las
observaciones podran razonablemente proceder de la
distribucin especificada.
Ej.: Muchas pruebas paramtricas requieren que las
variables se distribuyan de forma normal. La prueba de
Kolmogorov-Smirnov para una muestra se puede utilizar
para comprobar que una variable, por ejemplo ingresos,
se distribuye normalmente

DC
I


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Un Ejemplo de Kolmogorov-Smirnov


CI

UNIVERSIDA D DEL BIO-BIO

Un estudio proporciona los siguientes puntuaciones:


166,141,136,153,170,162,155,146,183,157,148,132,16
0,175, y 150.
Con un n.c. del 0.01 pruebe que las puntuaciones
provienen de una poblacin normal

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

U
Ho: Las puntuacionesB
provienen de una poblacin
normal
B
H1: Las puntuaciones no provienen
de una poblacin

normal
20
07
Carlos Rodrguez G.: Trabajo Social UBB

12

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

P. No Paramtrica
E 2M
Independientes
UB
B

20
07

Pruebas para 2M Independientes




CI

UNIVERSIDA D DEL BIO-BIO

Similar a la T de 2M Independientes
Compara dos grupos de casos existentes en una
variable.
 Ej.: Se han desarrollado nuevos correctores dentales
diseados para que sean ms cmodos y estticos,
as como para facilitar un progreso ms rpido en la
realineacin de la dentadura. Para averiguar si el
nuevo corrector debe llevarse tanto tiempo como el
modelo antiguo, se eligen 10 nios al azar para que
lleven este ltimo y otros 10 para que usen el nuevo.
Mediante la prueba U de Mann-Whitney podra
descubrir que, de media, los nios que llevaban el
nuevo corrector tenan que llevarlo puesto menos
tiempo que los que llevaban el antiguo.

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

Hay varias pruebas:




20

07

Pruebas: U de Mann-Whitney, reacciones


extremas de Moses, Z de Kolmogorov-Smirnov,
rachas de Wald-Wolfowitz.

U de Mann - Whitney


CI

UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba No Paramtrica
Requiere que las dos muestras probadas sean similares
en la forma
Dos variables
Hay una variable respuesta
Datos No Pareados

DC
I

UB

Admite.

Variable respuesta ordinal y variable explicativa


dicotmica
 Variable respuesta escalar y variable explicativa
dicotmica
Contrasta si dos poblaciones muestreadas son
equivalentes en su posicin.
La Ho del contraste es que las dos muestras, de
tamao n1 y n2, respectivamente, proceden de
poblaciones continuas idnticas.


20

07

U de Mann Whitney (continuacin)




CI

UNIVERSIDA D DEL BIO-BIO

Es similar a la t de dos grupos independientes


La Ho es que no hay diferencias entre los dos grupos
 H0: X1 = X2
Pasos:
 Pasar las puntuaciones a rangos (conjuntamente en
los dos grupos)
 Computar la suma de los rangos del grupo 1
Para Muestras Pequeas (n1 y n2 20)

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

U = R i1


Para Muestras Grandes


z emp =

n (N+1)
1

n n (N+1)
1

12

Hay tablas para este caso de


muestras pequeas; en todo
caso, si la muestra es
relativamente grande, se puede
efectuar la aproximacin a la
distribucin normal

20

07

(U es la suma de los rangos asignados a la muestra 1)

Prueba Z de K-S para 2M

CI


UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba No Paramtrica
Dos variables
Hay variables respuesta
Datos No pareados
Admite:
 Variable respuesta ordinal o escalar
 Variable explicativa dicotmica
Detectan las diferencias entre las posiciones y las
formas de las distribuciones.
K-S se basa en la diferencia mxima absoluta entre las
funciones de distribucin acumulada observadas para
ambas muestras.
Si la diferencia es significativamente grande, se
consideran diferentes las dos distribuciones

DC
I

UB

20

07

Rachas de Wald-Wolfowitz

CI


UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va




Prueba No Paramtrica
Dos variables
Hay variables respuesta
Datos No pareados
Admite:
 Variable respuesta ordinal o escalar
 Variable explicativa dicotmica
Combina y ordena las observaciones de ambos grupos.
Si las dos muestras proceden de una misma poblacin,
los dos grupos deben dispersarse aleatoriamente en la
ordenacin de los rangos

DC
I

UB

20

07

P. de reacciones extremas de Moses




CI

UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba No paramtrica
Dos variables y datos no pareados
Hay variables respuesta
Variable respuesta escalar y Variable explicativa
dicotmica
Presupone que la variable experimental afectar a
algunos sujetos en una direccin y a otros sujetos en la
direccin opuesta.
Contrasta las respuestas extremas comparndolas con
un grupo de control.
Se centra en la amplitud del grupo de control y supone
una medida de la influencia de los valores extremos del
grupo experimental en la amplitud al combinarse con el
grupo de control.
El grupo de control se define en el cuadro Grupo 1 del
cuadro de dilogo Dos muestras independientes: Definir
grupos.
Valores atpicos pueden distorsionar fcilmente el rango
de la amplitud, de manera automtica se recorta de
cada extremo un 5% de los casos de control

DC
I

UB

20

07

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

P. No Paramtrica
E
2 Muestras
Relacionadas

UB
B

20
07

Pruebas para 2M relacionadas




CI

UNIVERSIDA D DEL BIO-BIO

Compara las distribuciones de dos variables.


Ej.: En general, cuando una familia vende su casa
logra obtener la cantidad que pide inicialmente? Si
aplica la prueba de Wilcoxon de los rangos con signo a
10 casas, podra descubrir que siete familias reciben
menos cantidad de la solicitada, una recibe ms y dos
familias reciben el precio solicitado.

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

Pruebas:
 Wilcoxon de los rangos con signo, signos, McNemar
y P. de Homegeneidad Marginal

Si los datos:
 Son continuos, use la prueba de los signos o la
prueba de Wilcoxon de los rangos con signo.
 Si son binarios, use la prueba de McNemar.
 Si son categricos, use la prueba de homogeneidad
marginal

20

07

P. de Signos

CI


UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Dos variables
Variables respuesta
Datos pareados
Calcula las diferencias entre las dos variables para
todos los casos y clasifica las diferencias como
positivas, negativas o empatadas.
Si las dos variables tienen una distribucin similar, el
nmero de diferencias positivas y negativas no difiere de
forma significativa
Admite:
 Variable respuesta escalar o ordinal
 Variable explicativa dicotmica

DC
I

UB

20

07

Prueba de Wilcoxon para dos Muestras




CI

UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba de rangos asignados para dos muestras


pareadas
Dos variables
Hay variable respuesta
Datos pareados
Tiene en cuenta la informacin del signo de las
diferencias y de la magnitud de las diferencias entre los
pares.
Dado que la prueba de Wilcoxon de los rangos con
signo incorpora ms informacin acerca de los datos, es
ms potente que la prueba de los signos.
Admite varias opciones:
 Variable respuesta ordinal y variable explicativa
dicotmica
 Variable respuesta escalar y variable explicativa
dicotmica

DC
I

UB

20

07

P. Wilcoxon para 2MR




CI

UNIVERSIDA D DEL BIO-BIO

Similar a la t 2M Relacionadas
Pasos:
 Restar las puntuaciones (sujeto a sujeto) entre
grupos 1 y 2, y dejarlas en valor absoluto.
 En valores ordinales, hacer una columna con los
rangos para G2>G1 y otra para G1>G2
 Muestra Pequeas

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va




UB

Es la suma de rangos de la columna "G2>G1"


Muestras Grandes

20

07

Hay tablas en caso de muestras


pequeas; pero si la muestra es
relativamente grande, se puede
efectuar la aproximacin a la
distribucin normal

P. De McNemar


CI

UNIVERSIDA D DEL BIO-BIO




Dos variables
Hay variable respuestas y datos pareados
Se usa si los datos son binarios
 Variable respuesta dicotmica
 Variable explicativa dicotmica
Usualmente: Situacin de medidas repetidas. Respuesta
de cada sujeto se obtiene dos veces. Una antes y otra
despus de que ocurra un evento especificado.
Determina si la tasa de respuesta inicial (antes del
evento) es igual a la tasa de respuesta final (despus
del evento).
til para detectar cambios en las respuestas causadas
por la intervencin experimental en los diseos del tipo
antes-despus

DC
I


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

P. de homogeneidad marginal

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Usada cuando los datos son categricos.


Se trata de una extensin de la prueba de
McNemar a partir de la respuesta binaria a la
respuesta multinomial.
Contrasta los cambios de respuesta utilizando la
distribucin de chi-cuadrado y es til para detectar
cambios de respuesta causados por intervencin
experimental en diseos antes-despus

DC
I

UB

20

07

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC Prueba para Varias


I
E
Muestras
Independientes

UB
B

20
07

Pruebas K Muestras independientes




CI

UNIVERSIDA D DEL BIO-BIO

El procedimiento Pruebas para varias muestras


independientes compara dos o ms grupos de casos
respecto a una variable.
Ejemplo. Es diferente el tiempo medio en que se
fundirn las bombillas de 100 vatios de tres marcas
distintas? A partir del anlisis de varianza de un factor
de Kruskal-Wallis, puede comprobar que las tres marcas
s se diferencian en su vida media.

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

Pruebas:
 H de Kruskal-Wallis
 P. de la mediana.
 P. Jonckheere - Terpstra

20

07

Carlos Rodrguez G.: Trabajo Social UBB

28

P. H de Kruskal-Wallis


Comparacin de "a" grupos independientes

Paralela a la F unifactorial entre-sujetos

CI

UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va




DC
I

Dos variables

Hay variables

Datos no pareados

UB

Es una extensin de la prueba U de Mann-Whitney


Es el anlogo no paramtrico del anlisis de varianza de
un factor y detecta las diferencias en la localizacin de
las distribuciones
Admite:

20

07

Variable respuesta escalar o ordinal

Variable explicativa nominal

P. H de Kruskal-Wallis


CI

Pasos:

UNIVERSIDA D DEL BIO-BIO

Pasar las puntuaciones a rangos (conjuntamente en los


"a" grupos)
Computar la suma de los rangos en cada grupo (son
las Rj)

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Estadstico de contraste

UB

Si la H0 es cierta (es decir, que no hay diferencias entre


los grupos), H se distribuye segn chi-cuadrado con a-1
grados de libertad

20

07

Se puede aplicar esta prueba cuando no se cumplan:





Supuestos de homogeneidad de varianzas


Normalidad del ANOVA unifactorial entresujetos.

P. De la Mediana


Dos variables

Hay variable respuesta

CI

UNIVERSIDA D DEL BIO-BIO





DC
I

Datos No Pareados

Es una prueba ms general pero no tan potente


Detecta diferencias distribucionales en la localizacin y
en la forma.

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Admite.

UB

Variable respuesta ordinal o escalar.

Variable explicativa nominal

20

07

Tanto la P. H de Kruskal-Wallis y la P. de la mediana


suponen que no existe una ordenacin a priori de las
poblaciones k de las cuales se extraen las muestras

P. Jonckheere - Terpstra


CI

UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

P. No paramtrica
Dos variables
Hay variable respuesta
Datos No pareados
Admite:
 Variables respuesta ordinal o escalar
 Variable explicativa ordinal
Es ms potente cuando existe una ordenacin natural a
priori (ascendente o descendente) de las poblaciones k,

DC
I

UB

Ej.: Las k poblaciones pueden representar k temperaturas


ascendentes. Se contrasta la hiptesis de que diferentes
temperaturas producen la misma distribucin de respuesta,
con la hiptesis alternativa de que cuando la temperatura
aumenta, la magnitud de la respuesta aumenta. La
hiptesis alternativa se encuentra aqu ordenada; por
tanto, la prueba de Jonckheere-Terpstra es la prueba ms
apropiada

20

07

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba
para
E
Varias Muestras
UB Relacionada
B

20

07

Pruebas para K Muestras relacionadas




CI

Compara las distribuciones de dos o ms variables.

UNIVERSIDA D DEL BIO-BIO

DC
I

Ejemplo. Asocia la gente diferentes niveles de prestigio


a doctores, abogados, policas y profesores? Se pide a
diez personas que ordenen estas cuatro profesiones por
orden de prestigio. La prueba de Friedman indica que la
gente efectivamente asocia diferentes niveles de
prestigio con estas cuatro profesiones.

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

Pruebas:
 Friedman
 W de Kendall
 Q de Cochran

20

07

P. Friedman

CI


UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va






Equivalente no paramtrico de un diseo de medidas


repetidas para una muestra o un anlisis de varianza de
dos factores con una observacin por casilla.
Paralela a la F unifactorial intra-sujetos
Contrasta la Ho que las k variables relacionadas
procedan de la misma poblacin.
En cada caso, las k variables se ordenan en un rango de
1 a k. El estadstico de contraste se basa en estos
rangos.
Dos variables
Hay variable respuesta
Datos pareados
Admite:
 V. Respuesta ordinal o escalar
 V. Explicativa Nominal

DC
I

UB

20

07

P. W. de Kendall
Es una normalizacin del estadstico de Friedman.

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Se puede interpretar como el coeficiente de


concordancia, que es una medida de acuerdo entre
evaluadores.

DC
I

Cada caso es un juez o evaluador y cada variable es un


elemento o persona que est siendo evaluada. Para
cada variable, se calcula la suma de rangos.

UB

La W de Kendall vara entre 0 (no hay acuerdo) y 1


(acuerdo completo).

Dos variables

Hay variable respuesta

Datos pareados

V. Respuesta Escalar

V. Explicativa Nominal

20

07

P. Q. de Cochran

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va






Idntica a la P. de Friedman pero se puede


aplicar cuando todas las respuestas son binarias.
Es una extensin de la prueba de McNemar para
la situacin de k muestras.
Contrasta la hiptesis de que diversas variables
dicotmicas relacionadas tienen la misma media.
Las variables se miden al mismo individuo o a
individuos emparejados.

DC
I

UB

Dos variables
Hay variable respuesta y dato pareados
Variable respuesta dicotmica
Variable explicativa Nominal

20

07

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Y qu pasa con la
E
Pruebas
Paramtricas?
UB
B

20
07

Pruebas Paramtricas
Son de No Libre distribucin

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Por lo general exigen normalidad, aunque algunas son


bastante resistentes a la falta de ella (ej: anova)

DC
I

Ms robustas que las No Paramtricas pero ms


exigentes que aquellas

Las hay de Comparacin de Medias :

UB

De un Muestra

De Dos Muestras Independientes

De Dos Muestras Relacionada

De K Muestras Independientes

De K Muestras Relacionadas

20

07

Medias: Consideraciones sobre los


datos

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Datos:
 La variables respuesta es escalar y la variable
explicativa es nominal.
 Los valores de las variables categricas pueden ser
numricos o de cadena corta.
Supuestos:
 Estadsticos opcionales de subgrupo , como la media
y la d.t., se basan en la teora normal, adecuados
para variables escalar con distribuciones simtricas.
 Los estadsticos robustos, tales como la mediana y el
rango, son adecuados para las variables
cuantitativas que pueden o no cumplir el supuesto de
normalidad.

DC
I

UB

20

07

CI

UNIVERSIDA D DEL BIO-BIO

El anlisis de varianza es robusto a las desviaciones


de la normalidad, aunque los datos de cada casilla
deberan ser simtricos.
El anlisis de varianza tambin supone que los
grupos proceden de poblaciones con la misma
varianza.
Para comprobar este supuesto, utilice la prueba de
homogeneidad de las varianzas de Levene,
disponible en el procedimiento ANOVA de un factor

DC
I


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Prueba t para una Muestra




Una variable

Escalar

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
I

Contrasta si la media de una sola variable difiere de una


constante especificada.
Se desea comprobar si la puntuacin media del
rendimiento primer certamen difiere del obtenido por el
curso del ao pasado. (ej.: 65)
Una prueba t que contrasta que esta diferencia es 0 y un
intervalo de confianza para la diferencia promedio (para
el que puede especificarse el nivel de confianza).
Asume que los datos estn normalmente distribuidos;
sin embargo, esta prueba es bastante robusto frente a
las desviaciones de la normalidad

UB

20

07

Prueba t para 2M Independientes




Compara las medias de dos grupos de casos.


Dos variables
Hay variable respuesta
Datos no pareados
Variable respuesta escalar y Variable explicativa
dicotmica
Idealmente sujetos asignarse aleatoriamente a dos
grupos, as cualquier diferencia en la respuesta se deber
al tratamiento (o falta de tratamiento) y no a otros
factores.

CI

UNIVERSIDA D DEL BIO-BIO 





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
I




UB

Al comparar ingresos medios para hombres y mujeres. El sexo


no se asigna aleatoriamente.

20

Asegurarse que las diferencias en otros factores no


enmascaren o resalten una diferencia significativa entre
las medias.


07

Ej.: Las diferencias de ingresos medios pueden estar


sometidas a la influencia de factores como los estudios y no
solamente el sexo

Supuestos:

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Para la prueba t de igualdad de varianzas, las


observaciones deben ser muestras aleatorias
independientes de distribuciones normales con la misma
varianza de poblacin.
Para la prueba t de varianzas desiguales, las
observaciones deben ser muestras aleatorias
independientes de distribuciones normales.
La Prueba de Levene permite contrastar igualdad de
varianzas
La prueba t para dos muestras es bastante robusta a las
desviaciones de la normalidad.
Al contrastar las distribuciones grficamente, compruebe
que son simtricas y que no contienen valores atpicos.

DC
I

UB

20

07

Prueba t para muestras relacionadas




CI

UNIVERSIDA D DEL BIO-BIO






Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Dos variables
Hay variable respuesta y Datos pareados
Variable respuesta escalar y Variable explicativa
dicotmica
Compara las medias de dos variables de un solo grupo.
Calcula las diferencias entre valores de las dos variables
de cada caso y contrasta si la media difiere de 0.

DC
I

UB

Ej.: En un estudio sobre la hipertensin sangunea, se toma la


tensin a todos los pacientes al comienzo del estudio, se les
aplica un tratamiento y se les toma la tensin otra vez. De esta
manera, a cada paciente le corresponden dos medidas,
normalmente denominadas medidas pre y post.

Un diseo alternativo para el que se utiliza esta prueba


consiste en un estudio de pares relacionados o un
estudio de control de casos. En estos, cada registro en
el archivo de datos contiene la respuesta del paciente y
de su sujeto de control correspondiente.


20

07

En un estudio sobre la tensin sangunea, pueden emparejarse


pacientes y controles por edad (un paciente de 75 aos con un
miembro del grupo de control de 75 aos

Supuestos t Muestras Relacionadas

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Las observaciones de cada par deben hacerse en las


mismas condiciones.
Las diferencias entre las medias deben estar
normalmente distribuidas.
Las varianzas de cada variable pueden ser iguales o
desiguales

DC
I

UB

20

07

Anova


CI

UNIVERSIDA D DEL BIO-BIO

Anlisis de Varianza (AVAR) es una tcnica que permite


contrastar medias
Permite estudiar el efecto de una variable de agrupacin
sobre una variable escalar

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

 Estudia un tipo de efecto similar a la prueba t de


Student, pero a diferencia de sta, posibilita estudiar el
efecto de variables de agrupacin con ms de dos
valores.

UB

 El Anova puede ser para datos pareados y no pareados




20

Posibilita abordar el efecto de una variable de


agrupacin (Anova Unifactorial), como estudiar el efecto
de ms de una variable de agrupacin (Anova
Multifactorial).

07

En el Anova Unifactorial

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Dos variables
 Una variable respuesta y otra explicativa

DC
I

La variable respuesta:
 De carcter cuantitativa (escalar)

UB

La variable explicativa:
 Nominal
 Tricotmica o ms
Anova es un contraste global: habiendo diferencias
estadsticamente significativas entre las medias, ser
preciso llevar a cabo contrastes parciales entre las
medias de los grupos.

20

07

Tamao del Efecto




CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

El estadstico F slo informa acerca de si hay o no


diferencias estadsticamente significativas entre las
muestras pero no sobre la magnitud de esa diferencia
Se han desarrollado varios ndices que facilitan
informacin sobre el tamao del efecto de las
variables.
El ndice ms utilizado es
(tb. llamado ).

DC
I

UB

Oscila entre 0 y 1, y es la cantidad de variancia de la


variable cuantitativa (generalmente la variable
dependiente) explicada por la variable de agrupacin
(generalmente la variable independiente).
El tamao del efecto puede calcularse tanto para los
efectos principales como para los efectos interactivos
en el caso de que nos encontremos ante un ANOVA
multifactorial.

20

07

Los Tres Supuestos de Aplicacin


Independencia de las Observaciones: Valores de los
distintos individuos no han de covariar entre s.

CI
1.

UNIVERSIDA D DEL BIO-BIO

DC
I


Aleatorizacin de muestras e individuos a los grupos da alta


seguridad este supuesto.

2. Normalidad de los datos: el conjunto de residuales en la


poblacin debe distribuirse segn una ley normal.

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

 Existen distintas pruebas


 No obstante, el ANOVA es bastante robusto ante pequeas
desviaciones de la normalidad
 Este supuesto debe cumplirse para poder utilizar la razn de
variancias como contraste estadstico

UB

3. Homocedasticidad: Variancias intragrupo homogneas,

para poder realizar una estimacin conjunta de la variancia


residual.
 Pruebas de Hartley, Cochran, Bartlett-Box o Levene.
 Las dos primeras podrn utilizarse cuando todos los
grupos tengan el mismo nmero de individuos
 Por el contrario, la prueba de Bartlett-Box y la de
Levene se aplicarn tanto si trabajamos con grupos de
igual tamao como si trabajamos con grupos de
diferente tamao

20

07

Ejercicio ANOVA Unifactorial M.


Independientes

CI


UNIVERSIDA D DEL BIO-BIO

Unas empresas desean estudiar la eficacia de distintos


sistemas de incentivos para incrementar la produccin
de sus trabajadores. Se seleccionan las secciones de
serigrafa de tres de empresas y durante dos meses
somete a cada grupo de operarios a uno de estos
sistemas de incentivos: incentivo monetario en funcin
de la produccin individual, incentivo monetario en
funcin de la produccin de la seccin y no-incentivo.
Para medir la produccin se toma para cada empleado
la diferencia entre el promedio de piezas diarias
producidas durante la primera semana y el promedio de
piezas diarias producidas la ltima semana del estudio

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
Medidas
de Asociacin
IE

UB
B

20
07

Distribuciones Bivariantes


CI

UNIVERSIDA D DEL BIO-BIO

Hace posible analizar las condiciones que influyen en la


distribucin de una variable
Generalmente:

DC
I




Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Los porcentajes se pueden calcular en base a:






A travs de la distribucin porcentual para facilitar


comparacin.
VD en filas y VI en columnas

UB

Totales de Columnas
Totales de Filas
Total General

Regla:
 % calcularse en sentido al factor causal
 Lectura se hace en sentido inverso y a travs de las
diferencias porcentuales (epsiln)


20

07

Epsiln : Valor resultante de la comparacin misma fila


distinta columna. Tb. Llamado % de contraste
Carlos Rodrguez G.: Trabajo Social UBB

53

Caractersticas de Asoc. Bivariable




Interesa la forma en que se distribuye la VD para las


diferentes categoras de la VI

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

Existencia o No de Asociacin:



Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

Relacionado con y . Si ambos son elevados hay


alto grado de asociacin

Direccin:


Grado o Fuerza de la Asociacin:




La hay cuando la distribucin de una Var. difiere entre


las diversas categoras de la otra Var.

Desde V. Ordinales.
Hay positiva y negativa

Naturaleza o Forma:



20

07

En base a la distribucin porcentual, forma regular o


irregular
Ej.: Asociacin lineal: Casos concentrados en la VD
en lnea recta.
Carlos Rodrguez G.: Trabajo Social UBB

54

Estadsticos y Medidas de Asociacin




Hay mltiples pruebas disponibles para determinar si la


relacin entre dos variables es significativa.
Su estructura y el hecho de que las categoras estn
ordenadas o no, determinan las pruebas o medidas ha
utilizar
Medidas de asociacin:

CI

UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
I





UB

Chi-cuadrado de Pearson
Chi-cuadrado de la razn de verosimilitud
Prueba de asociacin lineal por lineal, prueba exacta de
Fisher, chi-cuadrado corregido de Yates, r de Pearson, rho de
Spearman, coeficiente de contingencia, phi, V de Cramr,
lambdas simtricas y asimtricas, tau de Kruskal y Goodman,
coeficiente de incertidumbre, gamma, d, de Somers, tau-b de
Kendall, tau-c de Kendall, coeficiente eta, kappa de Cohen,
estimacin de riesgo relativo, razn de ventajas, prueba de
McNemar y estadsticos de Cochran y Mantel-Haenszel.

20

07

Carlos Rodrguez G.: Trabajo Social UBB

55

Otros Tipologas de Medidas de Asociacin

CI

UNIVERSIDA D DEL BIO-BIO

Las hay Simtricas y Asimtricas

D
LasC
Simtricas:
IE

UB



Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

No distinguen entre VI y VD
Reflejan slo la fuerza y direccin
Q de Yule, C. de Pearson, V de Cramer

Las Asimtricas:
 Requiere distincin entre VI y VD
 Mide capacidad predictiva e influencia de una VI
para predecir los valores de una VD
 Coeficiente Lambda, Rho de Spearman

20

07

Carlos Rodrguez G.: Trabajo Social UBB

56

5.- Indices de Asociacin




Hiptesis:
 0: La asociacin entre variables es nula.
 1: La asociacin entre variables es significativa.

CI

UNIVERSIDA D DEL BIO-BIO

DC
I

a) Estadsticos para Variables Nominales:


 Coeficiente PHI
 Coeficiente C de contingencia (y Ajustado)
 V de Cramer
 Coeficiente Rho -Equivale a Pearson y a PHI Lambda de Goodman y Kruskal (Basada en la
medida de Concentracin).
 Prueba de Mantel-Haenszel
 Coeficiente de Incertidumbre (Basada en la
medida de Entropa).
 Razn de Productos Cruzados (RPC) para cada subtabla 2x2 (como en Homogeneidad).
 Q. de Yule
 Coeficiente de Coaligacin Y de Yule

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

57

CI

UNIVERSIDA D DEL BIO-BIO

b) Estadsticos para Variables ordinales:


 Rangos de Spearman -Equivale a Pearson
 Gamma de Goodman y Kruskal (1979)
 D de Somers (1962)
 Tau- B de Kendall (1979)
 Tau-C de Stuart (1953)
 Asociac. Parcial Tau- B de Kendall (Comparable
a Correlac. Parcial)

DC
I


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

c) Estadsticos para Casos Mixtos:


 Continua vs Dicotmica: Biserial-puntual.
 Dicotmica vs Dicotmica: PHI.
 Continua vs Dicotomizada Normal-: Biserial.
 Dicotomizada Normal- vs Dicotomizada
Normal-: Tetracrica.

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

58

4) ndices de Concordancia


Similares a los estadsticos de asociacin, pero


aplicables cuando las variables se computan en
funcin de acuerdos-desacuerdos o
concordancias-discrepancias.
De utilidad para estimar la fiabilidad interjueces.

CI

UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
I

E
Estadsticos:

UB

ndice Concordancia ( Porcentaje


Acuerdos)
 Coef. Kappa de Cohen.


20

07

Carlos Rodrguez G.: Trabajo Social UBB

59

Chi-2 de Independencia

CI


UNIVERSIDA D DEL BIO-BIO

Chi-cuadrado de Pearson contrasta la hiptesis


que las variables de fila y columna son
independientes.
El valor de significacin (Sig. asinttica) contiene la
informacin buscada, cuanto menor sea, menor
posibilidad habr de que las dos variables sean
independientes (no estn relacionadas).
Dos variables
No hay variable respuesta
Variables nominales u ordinales
Siempre positivo
No tiene un lmite superior
Es un prueba unilateral (N.S. 0,05)
 Ho: No hay relacin entre las variables
 H1: Si hay asociacin

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va








UB

20

07

Condiciones Aplicacin Chi-2 Independencia

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Tabla superior a 2 x 2:
 Si fe mayor o igual a 5: Chi-2 de Pearson
 Si fe menor que 5: recategorizar
Cochran admite fe menores que 5, siempre que:
 No ms 20% de fe menores que 5
 Ninguna fe menor que 1
Tabla 2 x 2:
 Si fe mayor o igual a 5: Chi-2 de Pearson
 Si fe mayor o igual a 3 y menor a 5: Chi-2 con
correccin de Continuidad de Yates
 Si fe menor que 3: Prueba exacta de Fisher

DC
I

UB

20

07

Chi-cuadrado de la razn de verosimilitud

CI Likelihood ratio chi square


DEstadstico
de bondad de ajuste similar al chi
CI de Pearson.
cuadrado
E e interpreta igual que 2
Se distribuye
Para tamaos
de muestra grandes, los dos

estadsticos son
equivalentes.
U
Su es que puede
subdividirse en una serie de
B
partes interpretables
por separado que,
B
sumadas, equivalen al total.

Muy utilizado para estudiar


la relacin entre
variables categricas, particularmente
en el
2
00
contexto de los modelos log-lineales.
7

UNIVERSIDA D DEL BIO-BIO







Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Carlos Rodrguez G.: Trabajo Social UBB

62

Prueba Exacta de Fisher

CI


UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Es una prueba de independencia en una tabla de 2


x 2 que se basa en la distribucin hipergeomtrica
Su utilidad es mayor si el tamao de muestra total y
valores esperados son pequeos.
Calcula la probabilidad exacta de obtener el
resultado observado, o uno ms extremo, si las dos
variables son independientes y los marginales fijos.
Se usa cuando el tamao de la muestra en una
tabla de 2 x 2 es 20 o menor.
Determina si los valores de A difieren en la
proporcin correspondiente a la clasificacin
realizada por los valores de B (o viceversa)

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

63

Chi cuadrado Corregido de Yates




Correccin de Continuidad de Yates


Correccin a Ji-Cuadrado que mejora la
aproximacin del estadstico a la distribucin de
probabilidad de Ji-cuadrado.
Reduce en medio punto la diferencia en valores
absolutos entre las frecuencias observadas y las
frecuencias tericas:

CI

UNIVERSIDA D DEL BIO-BIO 

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

64

Coeficiente de Contingencia


Medidas que no dependen del orden en que las


categoras se hayan dispuesto en la tabla, muchas se
fundamentan en el Ji-Cuadrado

CI

UNIVERSIDA D DEL BIO-BIO

D
C
Coeficiente
IE
Pearson


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va





de contingencia cuadrtico medio de

Se cumple que 0 2 q-1, donde q = min{I,J}.


Cuando 2 = 0, las variables son independientes o sin
asociacin.
Para 2 = q-1 la asociacin es mxima.
Requiere una modificacin, pues depende de la
dimensin de la tabla; por tanto, no permite la
comparacin entre coeficientes obtenidos en tablas
de distintos rdenes.

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

65

Coeficiente de Contingencia de Pearson:




CI

Mejorar el problema anterior, permitiendo la comparacin


entre coeficientes de tablas de distintos rdenes
2
q 1
p=
;
0

q
1+ 2

UNIVERSIDA D DEL BIO-BIO

DC
I

Est acotado, pero an el mximo valor del coeficiente p


depende de la dimensin de la tabla. Sakoda propuso
una modificacin para acotarlo entre 0 y 1, para cualquier
dimensin.
2

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

p* =

q
; 0 p* 1
2
( q 1) (1 + )

U
Coeficiente de contingencia
BB de Chuprov
{
20
07
t=

( I 1)( J 1)

pmax

; 0t

q 1
max I 1, J 1}

El valor mximo de t depende de la dimensin de la tabla.

Carlos Rodrguez G.: Trabajo Social UBB

66

V de Cramr


CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Coeficiente de contingencia acotado entre 0 y 1


Su mximo valor, V=1, lo alcanza en caso de
"perfecta asociacin"; y V=0, en caso de
"independencia".
Al variar entre 0 y 1, puede ser interpretada como la
proporcin de variabilidad debida a la asociacin o
interaccin entre las variables

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

67

Phi de Cramer

CI

UNIVERSIDA D DEL BIO-BIO





Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida de asociacin basada en chi cuadrado


Resulta de dividir el estadstico chi cuadrado por el
tamao de la muestra y extraer la raz cuadrada del
resultado.
Toma valor 0 en caso de independencia, pero su
valor mximo depende de las dimensiones de la
tabla.
En tablas donde una dimensin es mayor que 2, phi
no necesita estar entre 0 y 1.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

68

Lambda

CI


UNIVERSIDA D DEL BIO-BIO



Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida de asociacin que refleja la reduccin


proporcional en el error cuando se utilizan los
valores de la variable independiente para
pronosticar los valores de la variable dependiente.
Tiene un rango de 0 a 1
Un valor igual a 1 significa que la variable
independiente pronostica perfectamente la
variable dependiente.
Un valor igual a 0 significa que la variable
independiente no ayuda en absoluto a pronosticar
la variable dependiente.
Las hay simtricas y asimtrica

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

69

Coeficiente de Incertidumbre

CI

UNIVERSIDA D DEL BIO-BIO

Medida de asociacin que indica la reduccin


proporcional del error cuando los valores de una
variable se emplean para pronosticar los valores de
la otra variable.
 Por ejemplo, un valor de 0,83 indica que el
conocimiento de una variable reduce en un 83%
el error al pronosticar los valores de la otra
variable.
Se calcula tanto la versin simtrica como la
asimtrica del coeficiente de incertidumbre

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

70

Gamma

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida de asociacin simtrica entre dos variables


ordinales cuyo valor siempre est comprendido
entre -1 y 1.
Los valores prximos a 1, en valor absoluto, indican
una fuerte relacin entre las dos variables.
Los valores prximos a cero indican que hay poca o
ninguna relacin entre las dos variables.
Para las tablas de doble clasificacin, se muestran
las gammas de orden cero.
Para las tablas de tres o ms factores de
clasificacin, se muestran las gammas
condicionales.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

71

d de Somers

CI

UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida de asociacin entre dos variables ordinales


que toma un valor comprendido entre -1 y 1.
Los valores prximos a 1, en valor absoluto, indican
una fuerte relacin entre las dos variables.
Los valores prximos a cero indican que hay poca o
ninguna relacin entre las dos variables.
La d de Somers es una extensin asimtrica de
gamma que difiere slo en la inclusin del nmero
de pares no empatados en la variable
independiente.
Tambin se calcula una versin simtrica de este
estadstico.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

72

Tau-b de Kendall

CI

UNIVERSIDA D DEL BIO-BIO

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida no paramtrica de la correlacin para


variables ordinales o de rangos que tiene en
consideracin los empates.
El signo del coeficiente indica la direccin de la
relacin y su valor absoluto indica la magnitud de la
misma, de tal modo que los mayores valores
absolutos indican relaciones ms fuertes.
Los valores posibles van de -1 a 1, pero un valor de
-1 o +1 slo se puede obtener a partir de tablas
cuadradas.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

73

Tau-c de Kendall

CI

UNIVERSIDA D DEL BIO-BIO

Medida no paramtrica de asociacin para variables


ordinales que ignora los empates.
El signo del coeficiente indica la direccin de la
relacin y su valor absoluto indica la magnitud de la
misma, as los mayores valores absolutos indican
relaciones ms fuertes.
Los valores posibles van de -1 a 1, pero un valor de
-1 o +1 slo se puede obtener a partir de tablas
cuadradas

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

74

Eta

CI

UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Medida de asociacin cuyo valor siempre est


comprendido entre 0 y 1.
El valor 0 indica que no hay asociacin entre las
variables de fila y de columna.
Los valores cercanos a 1 indican que hay gran
relacin entre las variables.
Eta resulta apropiada para una variable dependiente
medida en una escala de intervalo (por ejemplo,
ingresos) y una variable independiente con un
nmero limitado de categoras (por ejemplo, sexo).
Se calculan dos valores de eta: uno trata la variable
de las filas como una variable de intervalo; el otro
trata la variable de las columnas como una variable
de intervalo

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

75

Kappa

CI

UNIVERSIDA D DEL BIO-BIO



Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

La kappa de Cohen mide el acuerdo entre las


evaluaciones de dos jueces cuando valoran un
mismo objeto.
Un valor igual a 1 indica un acuerdo perfecto.
Un valor igual a 0 indica que el acuerdo no es mejor
que el que se obtendra por azar.
Slo est disponible para las tablas cuadradas
(tablas en las que ambas variables tienen el mismo
nmero de categoras y utilizan los mismos valores
de categora).

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

76

Estimacin de riesgo relativo

CI


UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Para las tablas 2 x 2, medida del grado de asociacin entre la


presencia de un factor y la ocurrencia de un evento.
Si el intervalo de confianza para el estadstico incluye un valor
de 1, no se podr asumir que el factor est asociado con el
evento.
Cuando la ocurrencia del factor es poco comn, se puede
utilizar la razn de ventajas como estimacin del riesgo relativo.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

77

McNemar

CI

UNIVERSIDA D DEL BIO-BIO


Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

Prueba no paramtrica para dos variables


dicotmicas relacionadas.
Contrasta los cambios en las respuestas utilizando
la distribucin de chi-cuadrado.
Es til para detectar cambios en las respuestas
debidas a la intervencin experimental en los
diseos del tipo "antes-despus".
Para tablas cuadradas mayores, se utiliza la prueba
de simetra de McNemar-Bowker.

DC
I

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

78

Estadsticos de Cochran y de MantelHaenszel

CI

UNIVERSIDA D DEL BIO-BIO

Se utilizan para contrastar la independencia entre


una variable dicotmica de factor y una variable
dicotmica de respuesta, condicionada por los
patrones en las covariables, los cuales vienen
definidos por la variable o variables de las capas
(variables de control).
Mientras otros estadsticos se calculan capa por
capa, los estadsticos de Cochran y MantelHaenszel se calculan una sola vez para todas las
capas.

DC
I

Ce ntro d e in vesti ga ci n y
De sarr oll o d e la
C omp uta ci n e Info rmti ca
Ed uca ti va

UB

20

07

Carlos Rodrguez G.: Trabajo Social UBB

79