You are on page 1of 56

CURSO DE

ESTADSTICA BSICA

ESQUEMA DEL CURSO


ESTADSTICA BSICA
DISEO DE EXPERIMENTOS

ESTADSTICA DESCRIPTIVA

INFERENCIA ESTADSTICA
CONTRASTE
DE HIPTESIS

ESTIMACIN
TIPOS DE
VARIABLES

TABLAS Y
GRFICAS

MEDIDAS DE
POSICIN CENTRAL
Y DE DISPERSIN

PUNTUAL

POR
INTERVALOS

MTODOS
PARAMTRICOS

MTODOS NO
PARAMTRICOS

T-STUDENT

U-MANN
WHITNEY

ANOVA
FISHER

K-W
TABLAS DE
CONTINGENCIA

Tablas de contingencia
Contraste de hiptesis
Medidas de asociacin

EN LA SESIN ANTERIOR VIMOS


Denominamos variables cualitativas a aquellas cuyo
resultado es un valor o categora de entre un conjunto
finito de respuestas

POR
EJEMPLO

El sexo, el estado civil o el grupo sanguneo son variables


cualitativas

5.1 TABLAS DE
CONTINGENCIA

Para analizar la relacin de dependencia o


independencia entre dos variables cualitativas es
necesario estudiar su distribucin conjunta o tabla de
contingencia
Tabla de contingencia: Tabla de doble entrada donde
en cada casilla figura el nmero de individuos que
posee esas caractersticas

5.1 TABLAS DE
CONTINGENCIA

5.3 MEDIDAS DE
ASOCIACIN

EJEMPLOS

El sexo y el hbito de fumar

Estudiar la relacin
entre

El grupo sanguneo y la posibilidad de


rechazar un trasplante
La prctica de ejercicio y el riesgo de
infarto

5.1 TABLAS DE
CONTINGENCIA

OBJETIVOS
Las tablas de contingencia tienen dos objetivos fundamentales:
1.- Organizar la informacin, cuando est referida a
factores
2.- Analizar si existe alguna relacin de dependencia o
independencia entre los niveles de las variables objeto
de estudio
El hecho de que dos variables sean independientes significa que los
valores de una de ellas no estn influidos por la otra
7

5.1 TABLAS DE
CONTINGENCIA

CMO SE CONSTRUYE UNA TABLA DE CONTINGENCIA?


Una tabla de contingencia se presenta de la siguiente forma
HOMBRE

MUJER

MARGINAL

SI

n11

n12

n1.

NO

n21

n22

N2.

MARGINAL

n.1

nij=n
n.2 observaciones denla.. fila
i y la columna j

Frecuencia: Nmero de veces que se presenta un valor dado de una observacin


8

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

EJEMPLO
Para contrastar la hiptesis El sexo influye en el hbito de fumar,
podemos construir la siguiente tabla de contingencia
HOMBRE

MUJER

MARGINAL

SI

65

58

123

NO

43

67

110

MARGINAL

108

125

233

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

TIPOS DE TEST UTILIZADOS

Para identificar relaciones entre variables cualitativas se


utiliza el test estadstico de la Chi-cuadrado

Para las tablas 2x2 se utiliza el test de Fisher

10

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

TIPOS DE TEST UTILIZADOS


En los ejemplos anteriores

La hiptesis que
plantearemos ser:

Influye el sexo en el
hbito de fumar?

H0: independencia
H1: dependencia

Tienen ms posibilidades los de


un cierto grupo sanguneo de
rechazar un trasplante?

El resultado nos permitir afirmar con un nivel de confianza que nosotros


determinaremos si los niveles de una variable influyen en los niveles de la
otra
11
TABLAS DE CONTINGENCIA

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RAZONAMIENTO
El razonamiento para contrastar si existe o no asociacin entre dos
variables cualitativas se basa en:
calcular cul seran los valores de frecuencia esperados para cada una de
las celdas en el caso de que efectivamente las variables fuesen
independientes y compararlos con los valores realmente observados

12

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Si no existe mucha diferencia entre ambos valores

no hay razones para dudar de que las variables sean


independientes

13

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Una vez que hayamos hecho los
clculos, obtendremos un nivel
de significacin

probabilidad de equivocarnos si
rechazamos la hiptesis nula

Si es p<0.05 rechazamos la hiptesis nula y decimos


que las variables son dependientes
Si es p>0.05 no podramos rechazar H0 porque la
probabilidad de equivocarnos sera muy alta
14

5
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS
La Chi-cuadrado est influenciada por el tamao muestral

A mayor nmero de casos


analizados el valor de la Chicuadrado tiende a aumentar

Si la muestra es excesivamente
grande ser ms fcil que
rechacemos la hiptesis nula de
independencia cuando a lo mejor
podran ser independientes

15

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS
En cada celda de la tabla deber existir un mnimo de 5
observaciones esperadas

Se agrupan filas o columnas (excepto tablas


2x2)
Si no fuera as

Se elimina la fila que da la frecuencia <5


16

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS
Para el ejemplo anterior El sexo influye en el hbito de fumar
HOMBRE

MUJER

MARGINAL

SI

12

32

44

NO

18

10

28

OCASIONALMENTE

17

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

Y si la tabla es de 2x2?

Se aplica la correccin de Yates

18

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS
La Chi-cuadrado permite contrastar la hiptesis de independencia pero

en el caso de que se rechace dicha hiptesis no dice nada sobre la fuerza


de la asociacin entre las variables estudiadas

19

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

Las MEDIDAS DE ASOCIACIN distinguen entre que las variables sean


ordinales o nominales

Las MEDIDAS DE ASOCIACIN NOMINALES slo informan del grado de


asociacin existente pero no de la direccin
Las MEDIDAS DE ASOCIACIN ORDINALES aportan informacin sobre la
direccin de la relacin, pudiendo tomar tanto valores positivos como
negativos
TABLAS DE CONTINGENCIA

20

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

Se pueden encontrar los intervalos de confianza para los riesgos relativos, lo


cual alcanza la misma finalidad que la prueba de significancia, segn contenga
el 1 o no

Los intervalos de confianza para riesgos relativos cada vez son ms utilizados
para las publicaciones en revistas mdicas

21

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

MEDIDAS DE ASOCIACIN ORDINALES

VALORES
POSITIVOS

Existe una relacin


directa entre las
variables

Valores altos de una se


corresponden
con
valores altos de la otra
y al contrario

VALORES
NEGATIVOS

Existe una relacin


inversa entre las
variables

Valores altos de una se


corresponden
con
valores bajos de la otra
y al contrario
22

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RESIDUOS
CMO SE
CALCULAN?

Diferencia entre la frecuencia observada y


esperada en cada casilla

PARA QU
SIRVEN?

Son muy tiles para interpretar las relaciones


que se observan en la tabla

QU
INFORMACIN
DAN?

Indican que la diferencia entre las frecuencias es


elevada cuando su valor es superior a 1.96
inferior a -1.96
23

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RESIDUOS
Un valor del residuo tipificado en una casilla

Mayor a 1.96 en
valor absoluto

Hay ms casos (si es positivo) o menos (si es


negativo) de los que debera haber en esa casilla si
las variables fueran independientes, por lo que las
variables son dependientes

Comprendido
entre 1.96

La diferencia es pequea por lo que las variables


son independientes
24

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO
Debido a que la prueba Chi-cuadrado es fcil de entender y calcular, en
ocasiones se utiliza cuando es ms apropiado otro mtodo
POR
EJEMPLO

Cuando se analizan dos grupos y las caractersticas de inters


se miden en escala numrica

LO CORRECTO
LO INCORRECTO

Aplicar la prueba t-Student


Convertir la escala numrica en
una ordinal o incluso binaria
TABLAS DE CONTINGENCIA

25

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO


Se desea conocer los pacientes de una intervencin que tienen mayor
probabilidad de padecer complicaciones que otros

Los investigadores queran saber si existe relacin entre la edad y


la probabilidad de tener complicaciones

26

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO


MTODO DE TRABAJO:
1

Se recogen datos de pacientes que sufrieron complicaciones y de otros


pacientes que no las sufrieron

Los investigadores formaron una tabla de contingencia 2x2 y agruparon


la edad en 45 o >45

Emplearon la prueba de chi-cuadrado para la independencia y los


resultados indicaron que no haba relacin entre la edad y la presencia
de complicaciones

MAL!
TABLAS DE CONTINGNCIA

27

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO


DNDE EST EL ERROR?
En la seleccin arbitraria de los 45 aos como
punto de corte para la edad
Y en usar una prueba de forma incorrecta

28

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO

Cuando las variables numricas se analizan con mtodos diseados para


variables categricas u ordinales, se pierde la mayor especificidad de las
mediciones numricas

Antes de hacerlo hay que investigar si las categoras son correctas

29

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

McNEMAR

Una variante de las tablas longitudinales es medir una misma variable


dicotmica (tratamiento-no tratamiento, rechazo-no rechazo) en dos
momentos temporales distintos

CONSEJO

Resulta especialmente til para medir el cambio

30

5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

McNEMAR
CMO SE TRABAJA?

Se toma una medida de una variable dicotmica, se aplica el


tratamiento (o se deja pasar el tiempo) y se vuelve a tomar una
medida de la misma variable en los mismos sujetos
Se contrasta la hiptesis de igualdad de proporciones antes y
despus
31

REGRESIN
Correlacin
Regresin Lineal Simple

32

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DEFINICIN DE CORRELACIN
Se considera que dos variables cuantitativas estn
relacionadas entre s cuando los valores de una de
ellas varan de forma sistemtica conforme a los
valores de la otra.

33

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON


El coeficiente de correlacin de Pearson es un ndice
estadstico que permite definir de forma ms concisa
la relacin entre las variables
Es una medida de la relacin lineal entre dos
variables medidas con escala numrica

34

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON


Su resultado es un valor que flucta entre -1 y +1
+1

Relacin perfecta en sentido positivo

Cuanto ms cercanos a 0 sean los valores


significar una relacin ms dbil o incluso
ausencia de relacin

-1

Relacin perfecta en sentido negativo


35

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

El valor del coeficiente de correlacin est muy


influenciado por los valores extremos, igual
que la desviacin estndar.
Por tanto la correlacin no describe bien la
relacin entre dos variables cuando cada una de
ellas tiene valores extremos
En estos casos debe hacerse una transformacin de
los datos o usarse la correlacin de Spearman
36

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

El valor del coeficiente de correlacin est muy


influenciado por los valores extremos, igual
que la desviacin estndar.
Por tanto la correlacin no describe bien la
relacin entre dos variables cuando cada una de
ellas tiene valores extremos
En estos casos debe hacerse una transformacin de
los datos o usarse la correlacin de Spearman
37

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

Finalmente, correlacin no es igual a causa

Correlacin = Causa
El juicio de que una caracterstica causa otra debe justificarse con
argumentos, no slo con el coeficiente de correlacin

38

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON


Segn su valor la relacin entre las variables ser:
1

0,9
0,8

Perfecta
Excelente
Buena
Regular

0,5
39

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN
Un DIAGRAMA DE DISPERSIN ofrece una idea bastante aproximada
sobre el tipo de relacin existente entre dos variables

Un DIAGRAMA DE DISPERSIN tambin puede utilizarse como una forma


de cuantificar el grado de relacin lineal existente entre dos variables

40

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

41

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

42

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

43

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

44

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN
El DIAGRAMA DE DISPERSIN permite formarse una primera impresin
sobre el tipo de relacin existente entre variables

Intentar cuantificar esa relacin tiene inconvenientes porque la relacin


entre dos variables no siempre es perfecta o nula

Normalmente ni lo uno ni lo otro

45

6
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

MODELOS DE REGRESIN
Una vez que
relacionadas

sabemos

que

dos

variables

estn

Cmo averiguar qu tipo de relacin tienen?

Para esto utilizamos los modelos de regresin

46

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

CONCEPTO DE REGRESIN

QU ES?

PARA QU
SIRVE?

La regresin como tcnica estadstica analiza


la relacin de dos o ms variables contnuas

La regresin se utiliza para inferir datos


a partir de otros y hallar una respuesta a lo que
pueda suceder

47

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIFERENCIA ENTRE CORRELACIN Y REGRESIN:

La correlacin es independiente de la escala pero no la


regresin

EJEMPLO

SIN EMBARGO

La correlacin entre estatura y peso es la misma sin


importar que la estatura se mida en metros o
centmetros
La ecuacin de regresin entre el peso y la estatura
depende de las unidades que utilicemos
48

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

SIMILITUDES ENTRE CORRELACIN Y REGRESIN:

La pendiente de la lnea de regresin tiene el mismo


signo que el coeficiente de correlacin
OJO!
La correlacin y la regresin slo describen relaciones lineales. Si los
coeficientes de correlacin y las ecuaciones de regresin se calculan a
ciegas, sin examinar las grficas, los investigadores pasarn por alto
relaciones muy estrechas pero no lineales

49

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

VARIABLES DE LA REGRESIN
Las variables del modelo de regresin deben ser cuantitativas
Dada la robustez de la regresin es frecuente encontrar incluidas como
variable independiente variables nominales transformadas

La variable dependiente debe ser siempre cuantitativa


Robustez: un estadstico se dice que es robusto
cuando es vlido aunque no se cumpla alguno de
sus supuestos
50

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

TIPOS DE REGRESIN
Se pueden encontrar distintos tipos de regresin

Regresin Lineal

Regresin Mltiple

Regresin Logstica

51

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL
Consideremos una variable aleatoria respuesta Y, relacionada con otra
variable que llamaremos explicativa X
Supongamos una muestra de n individuos para los que se conocen los
valores de ambas variables
Hacemos una representacin grfica:

Variable aleatoria

en el eje X la variable explicativa


en el Y la respuesta

Variable explicativa

Muestra
52

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

OBJETIVO

Encontrar una recta que se ajuste a la nube de puntos

A partir de esa recta podemos usar los valores de X para predecir los de Y

Normalmente se utiliza el mtodo de los mnimos cuadrados que minimiza


la distancia de las observaciones a la recta
53

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REPRESENTACIN GRFICA
Una recta tiene una ecuacin muy simple:

Y=a+bX
b

Habra que calcular los


coeficientes a,b.

b
a

es la pendiente de la recta
es el punto en que la recta corta el eje vertical
54

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL
Conociendo los valores de estos dos coeficientes podramos reproducir la
recta y describir con ella la relacin entre las variables

Adems de representar la recta con su frmula tambin es til disponer de


alguna informacin sobre el grado en que la recta se ajusta a la nube de
puntos

55

6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

BONDAD DEL AJUSTE


Una medida de ajuste muy
aceptada es el coeficiente de
determinacin R2

Cuadrado del coeficiente de


correlacin lineal

Se trata de una medida estandarizada que toma valores entre 0 y 1

R2=0.86

La recta explica un 86% de la variabilidad de Y en


funcin de X

56