You are on page 1of 55

1 2 3 4 5 6

CURSO DE
ESTADSTICA BSICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6
ESQUEMA DEL CURSO
ESTADSTICA BSICA
DISEO DE EXPERIMENTOS
ESTADSTICA DESCRIPTIVA

INFERENCIA ESTADSTICA
CONTRASTE
DE HIPTESIS

ESTIMACIN
TIPOS DE
VARIABLES

TABLAS Y
GRFICAS

MEDIDAS DE
POSICIN CENTRAL
Y DE DISPERSIN

PUNTUAL

POR
INTERVALOS

MTODOS
PARAMTRICOS

MTODOS NO
PARAMTRICOS

T-STUDENT

U-MANN
WHITNEY

ANOVA
FISHER
PEARSON

K-W
TABLAS DE
CONTINGENCIA

Guadalupe Ruiz Merino - Curso de Estadstica Bsica

1 2 3 4 5 6

SESIN 5

INFERENCIA ESTADSTICA II
5.1 Tablas de contingencia
5.2 Contraste de hiptesis
5.3 Medidas de asociacin
Guadalupe Ruiz Merino - Curso de Estadstica Bsica

1 2 3 4 5 6

EN LA SESIN ANTERIOR VIMOS


Denominamos variables cualitativas a aquellas
cuyo resultado es un valor o categora de entre un
conjunto finito de respuestas

POR
EJEMPLO

El sexo, el estado civil o el grupo sanguneo son


variables cualitativas

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

Para analizar la relacin de dependencia o


independencia entre dos variables cualitativas es
necesario estudiar su distribucin conjunta o tabla
de contingencia
Tabla de contingencia: Tabla de doble entrada
donde en cada casilla figura el nmero de
individuos que posee esas caractersticas

Guadalupe Ruiz Merino - Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

EJEMPLOS

Estudiar la
relacin entre

El sexo y el hbito de fumar


El grupo sanguneo y la posibilidad
de rechazar un trasplante
La prctica de ejercicio y el riesgo de
infarto

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

OBJETIVOS

Las tablas de contingencia tienen dos objetivos fundamentales:


1.- Organizar la informacin, cuando est referida a
factores

2.- Analizar si existe alguna relacin de dependencia


o independencia entre los niveles de las variables
objeto de estudio
El hecho de que dos variables sean independientes significa
que los valores de una de ellas no estn influidos por la otra
Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

CMO SE CONSTRUYE UNA TABLA DE CONTINGENCIA?


Una tabla de contingencia se presenta de la siguiente forma
HOMBRE

MUJER

MARGINAL

SI

n11

n12

n1.

NO

n21

n22

N2.

MARGINAL

n.1

n.2 observacionesnde
nij=n
..
la fila i y la columna j

Frecuencia: Nmero de veces que se presenta un valor dado de una observacin


Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

EJEMPLO

Para contrastar la hiptesis El sexo influye en el hbito de


fumar, podemos construir la siguiente tabla de contingencia
HOMBRE

MUJER

MARGINAL

SI

65

58

123

NO

43

67

110

MARGINAL

108

125

233

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

TIPOS DE TEST UTILIZADOS

Para identificar relaciones entre variables cualitativas se


utiliza el test estadstico de la Chi-cuadrado

Para las tablas 2x2 se utiliza el test de Fisher

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

TIPOS DE TEST UTILIZADOS


En los ejemplos anteriores
Influye el sexo en
el hbito de fumar?

Tienen ms posibilidades los


de un cierto grupo sanguneo
de rechazar un trasplante?

La hiptesis que
plantearemos ser:
H0: independencia
H1: dependencia

El resultado nos permitir afirmar con un nivel de confianza que


nosotros determinaremos si los niveles de una variable influyen en
los niveles de la otra
Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RAZONAMIENTO

El razonamiento para contrastar si existe o no asociacin entre dos


variables cualitativas se basa en:
calcular cul seran los valores de frecuencia esperados para cada
una de las celdas en el caso de que efectivamente las variables
fuesen independientes y compararlos con los valores realmente
observados

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Si no existe mucha diferencia entre ambos valores

no hay razones para dudar de que las variables sean


independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

QU CONCLUSIONES SE OBTIENEN?
Una vez que hayamos hecho
los clculos, obtendremos un
nivel de significacin

probabilidad de equivocarnos si
rechazamos la hiptesis nula

Si es p<0.05 rechazamos la hiptesis nula y


decimos que las variables son dependientes
Si es p>0.05 no podramos rechazar H0 porque la
probabilidad de equivocarnos sera muy alta

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

La Chi-cuadrado est influenciada por el tamao muestral

A mayor nmero de casos


analizados el valor de la Chicuadrado tiende a aumentar

Si la muestra es excesivamente
grande ser ms fcil que
rechacemos la hiptesis nula de
independencia cuando a lo mejor
podran ser independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

En cada celda de la tabla deber existir un mnimo de 5


observaciones esperadas

Se agrupan filas o columnas (excepto


tablas 2x2)

Si no fuera as

Se elimina la fila que da la frecuencia <5

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

Para el ejemplo anterior El sexo influye en el hbito de fumar


HOMBRE

MUJER

MARGINAL

SI

12

32

44

NO

18

10

28

OCASIONALMENTE

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

Y si la tabla es de 2x2?

Se aplica la correccin de Yates

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

PROBLEMAS

La Chi-cuadrado permite contrastar la hiptesis de independencia


pero

en el caso de que se rechace dicha hiptesis no dice nada sobre


la fuerza de la asociacin entre las variables estudiadas

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

Las MEDIDAS DE ASOCIACIN distinguen entre que las variables


sean ordinales o nominales

Las MEDIDAS DE ASOCIACIN NOMINALES slo informan del


grado de asociacin existente pero no de la direccin
Las MEDIDAS DE ASOCIACIN ORDINALES aportan informacin
sobre la direccin de la relacin, pudiendo tomar tanto valores positivos
como negativos

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

Se pueden encontrar los intervalos de confianza para los riesgos


relativos, lo cual alcanza la misma finalidad que la prueba de
significancia, segn contenga el 1 o no

Los intervalos de confianza para riesgos relativos cada vez son ms


utilizados para las publicaciones en revistas mdicas

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

MEDIDAS DE ASOCIACIN ORDINALES

VALORES
POSITIVOS

Existe una relacin


directa entre las
variables

Valores altos de una


se corresponden con
valores altos de la
otra y al contrario

VALORES
NEGATIVOS

Existe una relacin


inversa entre las
variables

Valores altos de una


se corresponden con
valores bajos de la
otra y al contrario

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RESIDUOS

CMO SE
CALCULAN?

Diferencia entre la frecuencia observada


y esperada en cada casilla

PARA QU
SIRVEN?

Son muy tiles para interpretar las


relaciones que se observan en la tabla

QU
INFORMACIN
DAN?

Indican que la diferencia entre las


frecuencias es elevada cuando su valor
es superior a 1.96 inferior a -1.96
Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

RESIDUOS

Un valor del residuo tipificado en una casilla

Mayor a 1.96 en
valor absoluto

Hay ms casos (si es positivo) o menos (si es


negativo) de los que debera haber en esa
casilla si las variables fueran independientes,
por lo que las variables son dependientes

Comprendido
entre 1.96

La diferencia es pequea por lo que las


variables son independientes

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO

Debido a que la prueba Chi-cuadrado es fcil de entender y calcular, en


ocasiones se utiliza cuando es ms apropiado otro mtodo
POR
EJEMPLO

Cuando se analizan dos grupos y las caractersticas de


inters se miden en escala numrica

LO CORRECTO

LO INCORRECTO

Aplicar la prueba t-Student


Convertir la escala numrica
en una ordinal o incluso binaria
Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO

Se desea conocer los pacientes de una intervencin que tienen


mayor probabilidad de padecer complicaciones que otros

Los investigadores queran saber si existe relacin entre


la edad y la probabilidad de tener complicaciones

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO


MTODO DE TRABAJO:
1

Se recogen datos de pacientes que sufrieron complicaciones y


de otros pacientes que no las sufrieron

Los investigadores formaron una tabla de contingencia 2x2 y


agruparon la edad en 45 o >45

Emplearon la prueba de chi-cuadrado para la independencia y


los resultados indicaron que no haba relacin entre la edad
y la presencia de complicaciones

MAL!

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO - EJEMPLO

DNDE EST EL ERROR?

En la seleccin arbitraria de los 45 aos


como punto de corte para la edad
Y en usar una prueba de forma incorrecta

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

USO EXCESIVO

Cuando las variables numricas se analizan con mtodos diseados


para variables categricas u ordinales, se pierde la mayor especificidad
de las mediciones numricas
Antes de hacerlo hay que investigar si las categoras son correctas

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

McNEMAR

Una variante de las tablas longitudinales es medir una misma variable


dicotmica (tratamiento-no tratamiento, rechazo-no rechazo) en dos
momentos temporales distintos

CONSEJO

Resulta especialmente til para medir el cambio

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

V
5.1 TABLAS DE
CONTINGENCIA

5.2 CONTRASTE
DE HIPTESIS

5.3 MEDIDAS DE
ASOCIACIN

McNEMAR

CMO SE TRABAJA?

Se toma una medida de una variable dicotmica, se aplica el


tratamiento (o se deja pasar el tiempo) y se vuelve a tomar
una medida de la misma variable en los mismos sujetos
Se contrasta la hiptesis de igualdad de proporciones antes
y despus

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI

SESIN 6

REGRESIN

6.1
6.1 Correlacin
6.2 Regresin Lineal Simple
Guadalupe Ruiz Merino - Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DEFINICIN DE CORRELACIN

Se considera que dos variables cuantitativas


estn relacionadas entre s cuando los
valores de una de ellas varan de forma
sistemtica conforme a los valores de la otra.

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON

El coeficiente de correlacin de Pearson es


un ndice estadstico que permite definir de
forma ms concisa la relacin entre las variables

Es una medida de la relacin lineal entre dos


variables medidas con escala numrica

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON


Su resultado es un valor que flucta entre -1 y +1
+1

Relacin perfecta en sentido positivo

Cuanto ms cercanos a 0 sean los valores


significar una relacin ms dbil o incluso
ausencia de relacin

-1

Relacin perfecta en sentido negativo

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

El valor del coeficiente de correlacin est


muy influenciado por los valores extremos,
igual que la desviacin estndar.

Por tanto la correlacin no describe bien la


relacin entre dos variables cuando cada
una de ellas tiene valores extremos

En estos casos debe hacerse una transformacin


de los datos o usarse la correlacin de Spearman

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

Finalmente, correlacin no es igual a causa

Correlacin = Causa

El juicio de que una caracterstica causa otra debe justificarse


con argumentos, no slo con el coeficiente de correlacin

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

EL COEFICIENTE DE CORRELACIN DE PEARSON


Segn su valor la relacin entre las variables ser:
1

0,9
0,8

Perfecta
Excelente
Buena

Regular

0,5

Mala

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN

Un DIAGRAMA DE DISPERSIN ofrece una idea bastante


aproximada sobre el tipo de relacin existente entre dos variables
Un DIAGRAMA DE DISPERSIN tambin puede utilizarse como
una forma de cuantificar el grado de relacin lineal existente entre
dos variables

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

COEFICIENTE DE PEARSON REPRESENTACIN GRFICA

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIAGRAMAS DE DISPERSIN

El DIAGRAMA DE DISPERSIN permite formarse una primera


impresin sobre el tipo de relacin existente entre variables
Intentar cuantificar esa relacin tiene inconvenientes porque la
relacin entre dos variables no siempre es perfecta o nula

Normalmente ni lo uno ni lo otro

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

MODELOS DE REGRESIN

Una vez que sabemos que dos variables estn


relacionadas

Cmo averiguar qu tipo de relacin tienen?

Para esto utilizamos los modelos de regresin

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

CONCEPTO DE REGRESIN

QU ES?

PARA QU
SIRVE?

La regresin como tcnica estadstica analiza


la relacin de dos o ms variables contnuas

La regresin se utiliza para inferir datos


a partir de otros y hallar una respuesta a lo
que pueda suceder

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

DIFERENCIA ENTRE CORRELACIN Y REGRESIN:

La correlacin es independiente de la escala pero


no la regresin

EJEMPLO

SIN EMBARGO

La correlacin entre estatura y peso es la misma


sin importar que la estatura se mida en metros o
centmetros
La ecuacin de regresin entre el peso y la
estatura depende de las unidades que utilicemos

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

SIMILITUDES ENTRE CORRELACIN Y REGRESIN:

La pendiente de la lnea de regresin tiene el


mismo signo que el coeficiente de correlacin

OJO!
La correlacin y la regresin slo describen relaciones lineales.
Si los coeficientes de correlacin y las ecuaciones de regresin
se calculan a ciegas, sin examinar las grficas, los
investigadores pasarn por alto relaciones muy estrechas pero
no lineales

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

VARIABLES DE LA REGRESIN

Las variables del modelo de regresin deben ser cuantitativas

Dada la robustez de la regresin es frecuente encontrar incluidas


como variable independiente variables nominales transformadas

La variable dependiente debe ser siempre cuantitativa

Robustez: un estadstico se dice que es


robusto cuando es vlido aunque no se
cumpla alguno de sus supuestos

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

TIPOS DE REGRESIN

Se pueden encontrar distintos tipos de regresin

Regresin Lineal

Regresin Mltiple

Regresin Logstica

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

Consideremos una variable aleatoria respuesta Y, relacionada


con otra variable que llamaremos explicativa X
Supongamos una muestra de n individuos para los que se
conocen los valores de ambas variables

Hacemos una representacin


grfica:

en el eje X la variable explicativa


en el Y la respuesta

Variable aleatoria

Variable explicativa

Muestra

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

OBJETIVO

Encontrar una recta que se ajuste a la nube de puntos

A partir de esa recta podemos usar los valores de X para predecir


los de Y
Normalmente se utiliza el mtodo de los mnimos cuadrados que
minimiza la distancia de las observaciones a la recta

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REPRESENTACIN GRFICA

Una recta tiene una ecuacin muy simple:

Y=a+bX

Habra que calcular los


coeficientes a,b.

es la pendiente de la recta

es el punto en que la recta corta el eje vertical


Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

REGRESIN LINEAL

Conociendo los valores de estos dos coeficientes podramos


reproducir la recta y describir con ella la relacin entre las variables

Adems de representar la recta con su frmula tambin es til


disponer de alguna informacin sobre el grado en que la recta se
ajusta a la nube de puntos

Guadalupe Ruiz Merino Curso de Estadstica Bsica

1 2 3 4 5 6

VI
6.1 CORRELACIN

6.2 REGRESIN LINEAL SIMPLE

BONDAD DEL AJUSTE


Una medida de ajuste muy
aceptada es el coeficiente
de determinacin R2

Cuadrado del coeficiente de


correlacin lineal

Se trata de una medida estandarizada que toma valores entre 0 y 1

R2=0.86

La recta explica un 86% de la variabilidad de


Y en funcin de X

Guadalupe Ruiz Merino Curso de Estadstica Bsica

You might also like