You are on page 1of 11

Captulo 5 Anlisis de regresin

INTRODUCCIN
OBJETIVO DE LA REGRESIN Determinar una funcin matemtica sencilla que describa el comportamiento de una variable dados los valores de otra u otras variables. DIAGRAMA DE DISPERSIN

Figura1

Figura1: Diagrama de dispersin que relaciona la variable longitud (y ) con una variable altura (x) de la concha Patelloida Pygmatea
47

48

Anlisis de regresin

Investigador

Especicacin de la forma funcional de la funcin de regresin

REGRESIN LINEAL SIMPLE


Suponemos un modelo en la forma yi = 0 + 1xi + i ; i = 1, . . . , n

yi : v.a. que representa la observacin isima de la variable respuesta, correspondiente al isimo valor xi de la variable predictiva X i : Error aleatorio no observable asociado a yi .

EJEMPLOS DE MODELOS DE REGRESIN SIMPLE

1) El consumo de gasolina de un vehculo, cuya variacin puede ser explicada por la velocidad media del mismo. Podemos incluir en el trmino del error aleatorio el efecto del conductor, del tipo de carretera, las condiciones ambientales, etc. 2) El presupuesto de una universidad, cuya variacin puede ser predicha por la variable explicativa nmero de alumnos. En el trmino del error aleatorio pueden incluirse el efecto del nmero de profesores, del nmero de laboratorios, de la supercie disponible de instalaciones, del nmero de personal de administracin, etc.

Anlisis de regresin

49

ESTIMACIN POR MNIMOS CUADRADOS

b1 = b1 =

Cov(x, y ) 2 Sx

b0 = y b0 = b1 x

RECTA DE REGRESIN ESTIMADA

b0 + b1 xi y bi =

b1 (xi x y bi = y + )

b1 : la variacin que se produce en y b por cada unidad de incremento en x COEFICIENTE DE CORRELACIN LINEAL Es una medida de la asociacin lineal de las variables x e y r= Cov (x, y ) , Sx Sy 1 r 1

Si r = 1 relacin lineal negativa perfecta entre x e y Si r = 1 asociacin lineal positiva perfecta entre x e y Si r = 0 no existe ninguna relacin lineal entre x e y

50

Anlisis de regresin

ANLISIS DE LA VARIANZA

Si y bi son estimadores de yi

yi y = (yi y bi ) + (y bi y ) ECUACIN BSICA DEL NLISIS DE LA VARIANZA X X X

(yi y ) =

(yi y bi ) +

(y bi y )2

SCT = SCE + SCReg SCT : Suma de cuadrados total SCE : Suma de cuadrados residual SCReg : Suma de cuadrados de la regresin Tabla ANOVA Sumas de Cuadrados Grados de libertad P SCReg = (y bi y )2 1 P SCE = (yi y bi)2 n2 P SCT = (yi y )2 n1

Fuentes de Variacin Regresin Error Total

Cuadrados medios MCReg SCE M CE = n2 SCT n1

F M CReg M CE

Anlisis de regresin

51

COEFICIENTE DE DETERMINACIN Estadstico que representa la proporcin de variacin explicada por la regresin Es una medida relativa del grado de asociacin lineal entre x e y

R2 =

SCReg SCE =1 ; 0 R2 1 SCT SCT

Si R2 = 0 SCReg = 0 El modelo no explica nada de y a partir de x. Si R2 = 1 SCReg = SCT Ajuste perfecto: y depende funcionalmente de x . Un valor de R2 cercano a 0 Baja capacidad explicativa de la recta. Un valor de R2 prximo a 1 Alta capacidad explicativa de la recta. EL CONTRASTE DE REGRESIN

F F

H0 : 1 = 0 H1 : 1 6= 0

Fijado un nivel de signicacin , se rechaza H0 si Fexp > F,1,n2

52

Anlisis de regresin

EJEMPLO

La Patelloida Pygmatea es una lapa pegada a las rocas y conchas a lo largo de las costas protegidas en el rea Indo-Pacca. Se realiza un experimento para estudiar la inuencia de la altura (x) de la Patelloida Pygmatea en su longitud (y ) medidas ambas en milmetros. Se tienen los siguientes datos: x 0.9 1.5 1.6 1.7 1.7 1.8 1.8 y 3.1 3.6 4.3 4.7 5.5 5.7 5.2 x 1.9 1.9 1.9 2.0 2.0 2.0 2.1 y 5.0 5.3 5.7 4.4 5.2 5.3 5.4 x 2.1 2.1 2.1 2.2 2.2 2.2 2.2 y 5.6 5.7 5.8 5.2 5.3 5.6 5.8 x 2.3 2.3 2.3 2.3 2.4 2.4 2.7 y 5.8 6.2 6.3 6.4 6.4 6.3 6.3

SOLUCIN

Figura1

Figura1: Diagrama de dispersin que relaciona la variable longitud (y ) con una variable altura (x) de la concha Patelloida Pygmatea

Anlisis de regresin

53

Recta de regresin estimada y b = 1.36 + 1.99 x r = 0.8636 Coeciente de determinacin r2 = R2 = 0.74 El 74 % de la variabilidad de y puede atribuirse a una relacin lineal con x Contraste de regresin H0 : 1 = 0 H1 : 1 6= 0

Coeciente de correlacin lineal

A un nivel de signicacin del 5 %, Fexp = 76.42 > F,1,n2 = F0.05;1.26 = 4.23 Ntese adems que el valor p < . Rechazamos la hiptesis nula de no linealidad del modelo

54

Anlisis de regresin

REGRESIN LINEAL MLTIPLE


La v.a. y se relaciona con k variables explicativas x1 , . . . , xk

y = 0 + 1x1 + 2 x2 + . . . + k xk +

Los parmetros 0 , 1 , . . . , k son estimados por mnimos cuadrados. Para n observaciones podemos escribir: y1 = 0 + 1 x11 + 2x12 + . . . + k x1k + 1 . . . . . . . . . . . . . . . . . . yn = 0 + 1xn1 + 2 xn2 + . . . + k xnk + n En notacin matricial Y = X +

donde X= 1 x11 . . . x1k 1 x21 . . . x2k . . . . . 1 . . . . . . xnk 1 xn1 . 1 . =. . n 0 . = . . k

y1 . Y =. . yn

Anlisis de regresin

55

El vector de coecientes es estimado por mnimos cuadrados por: B = (X t X )


1

X tY

La ecuacin ajustada de regresin resultante es: b = XB Y

ANLISIS DE LA VARIANZA yi y = (yi y bi ) + (y bi y ) X (yi y bi )2 + X

ECUACIN BSICA DEL NLISIS DE LA VARIANZA X )2 = (yi y (y bi y )2

SCT = SCE + SCReg

SCT : Suma de cuadrados total SCE : Suma de cuadrados residual SCReg : Suma de cuadrados de la regresin Tabla ANOVA Sumas de Grados de Cuadrados Fexp Cuadrados libertad Medios P 1 SCReg CM Reg B t X t Y t ( yi )2 k CMReg = n k CM E SCE t t t Y Y B X Y n k 1 CM E = nk1 P 1 2 Y t Y ( yi ) n1 n

Fuentes de Variacin Regresin Error Total

56

Anlisis de regresin

COEFICIENTE DE DETERMINACIN MLTIPLE

R2 =

SCReg SCE =1 SCT SCT

0 R 2 1.

Representa la proporcin de variacin de y explicada por la regresin

Si R2 = 0 SCReg = 0 El modelo no explica nada de la variacin de y a partir de su relacin lineal con x1 , . . . , xk . Si R2 = 1 SCReg = SCT Toda la variacin de y es explicada por los trminos presentes en el modelo. Un valor de R2 cercano a 1 Mayor cantidad de variacin total es explicada por el modelo de regresin.

COEFICIENTE DE DETERMINACIN CORREGIDO

2 nk1 R =1 X (yi y )2

e2 i

n1

ei = yi y bi

Anlisis de regresin

57

EL CONTRASTE DE REGRESIN

H0 : 1 = 2 = . . . = k = 0 H1 : j 6= 0 para algn j = 1, . . . , k Fexp > F,k,nk1

Fijado un nivel de signicacin , se rechaza H0 si

Bibliografa utilizada: F Canavos, George C. (1988). "Probabilidad y Estadstica. Aplicaciones y Mtodos". Ed.: Mc Graw Hill. F Lara Porras A.M. (2002). "Estadstica para Ciencias Biolgicas y Ciencias Ambientales. Problemas y Exmenes Resueltos". Ed.: Proyecto Sur. F Milton, Susan (2002). "Estadstica para Biologa y Ciencias de la Salud". Ed.: Mc Graw-Hill. F Pea, Daniel (2002). Regresin y diseo de experimentos". Ed.:Alianza Editorial. Temporalizacin: Dos horas

You might also like