Professional Documents
Culture Documents
INTRODUCCIN
OBJETIVO DE LA REGRESIN Determinar una funcin matemtica sencilla que describa el comportamiento de una variable dados los valores de otra u otras variables. DIAGRAMA DE DISPERSIN
Figura1
Figura1: Diagrama de dispersin que relaciona la variable longitud (y ) con una variable altura (x) de la concha Patelloida Pygmatea
47
48
Anlisis de regresin
Investigador
yi : v.a. que representa la observacin isima de la variable respuesta, correspondiente al isimo valor xi de la variable predictiva X i : Error aleatorio no observable asociado a yi .
1) El consumo de gasolina de un vehculo, cuya variacin puede ser explicada por la velocidad media del mismo. Podemos incluir en el trmino del error aleatorio el efecto del conductor, del tipo de carretera, las condiciones ambientales, etc. 2) El presupuesto de una universidad, cuya variacin puede ser predicha por la variable explicativa nmero de alumnos. En el trmino del error aleatorio pueden incluirse el efecto del nmero de profesores, del nmero de laboratorios, de la supercie disponible de instalaciones, del nmero de personal de administracin, etc.
Anlisis de regresin
49
b1 = b1 =
Cov(x, y ) 2 Sx
b0 = y b0 = b1 x
b0 + b1 xi y bi =
b1 (xi x y bi = y + )
b1 : la variacin que se produce en y b por cada unidad de incremento en x COEFICIENTE DE CORRELACIN LINEAL Es una medida de la asociacin lineal de las variables x e y r= Cov (x, y ) , Sx Sy 1 r 1
Si r = 1 relacin lineal negativa perfecta entre x e y Si r = 1 asociacin lineal positiva perfecta entre x e y Si r = 0 no existe ninguna relacin lineal entre x e y
50
Anlisis de regresin
ANLISIS DE LA VARIANZA
Si y bi son estimadores de yi
(yi y ) =
(yi y bi ) +
(y bi y )2
SCT = SCE + SCReg SCT : Suma de cuadrados total SCE : Suma de cuadrados residual SCReg : Suma de cuadrados de la regresin Tabla ANOVA Sumas de Cuadrados Grados de libertad P SCReg = (y bi y )2 1 P SCE = (yi y bi)2 n2 P SCT = (yi y )2 n1
F M CReg M CE
Anlisis de regresin
51
COEFICIENTE DE DETERMINACIN Estadstico que representa la proporcin de variacin explicada por la regresin Es una medida relativa del grado de asociacin lineal entre x e y
R2 =
Si R2 = 0 SCReg = 0 El modelo no explica nada de y a partir de x. Si R2 = 1 SCReg = SCT Ajuste perfecto: y depende funcionalmente de x . Un valor de R2 cercano a 0 Baja capacidad explicativa de la recta. Un valor de R2 prximo a 1 Alta capacidad explicativa de la recta. EL CONTRASTE DE REGRESIN
F F
H0 : 1 = 0 H1 : 1 6= 0
52
Anlisis de regresin
EJEMPLO
La Patelloida Pygmatea es una lapa pegada a las rocas y conchas a lo largo de las costas protegidas en el rea Indo-Pacca. Se realiza un experimento para estudiar la inuencia de la altura (x) de la Patelloida Pygmatea en su longitud (y ) medidas ambas en milmetros. Se tienen los siguientes datos: x 0.9 1.5 1.6 1.7 1.7 1.8 1.8 y 3.1 3.6 4.3 4.7 5.5 5.7 5.2 x 1.9 1.9 1.9 2.0 2.0 2.0 2.1 y 5.0 5.3 5.7 4.4 5.2 5.3 5.4 x 2.1 2.1 2.1 2.2 2.2 2.2 2.2 y 5.6 5.7 5.8 5.2 5.3 5.6 5.8 x 2.3 2.3 2.3 2.3 2.4 2.4 2.7 y 5.8 6.2 6.3 6.4 6.4 6.3 6.3
SOLUCIN
Figura1
Figura1: Diagrama de dispersin que relaciona la variable longitud (y ) con una variable altura (x) de la concha Patelloida Pygmatea
Anlisis de regresin
53
Recta de regresin estimada y b = 1.36 + 1.99 x r = 0.8636 Coeciente de determinacin r2 = R2 = 0.74 El 74 % de la variabilidad de y puede atribuirse a una relacin lineal con x Contraste de regresin H0 : 1 = 0 H1 : 1 6= 0
A un nivel de signicacin del 5 %, Fexp = 76.42 > F,1,n2 = F0.05;1.26 = 4.23 Ntese adems que el valor p < . Rechazamos la hiptesis nula de no linealidad del modelo
54
Anlisis de regresin
y = 0 + 1x1 + 2 x2 + . . . + k xk +
Los parmetros 0 , 1 , . . . , k son estimados por mnimos cuadrados. Para n observaciones podemos escribir: y1 = 0 + 1 x11 + 2x12 + . . . + k x1k + 1 . . . . . . . . . . . . . . . . . . yn = 0 + 1xn1 + 2 xn2 + . . . + k xnk + n En notacin matricial Y = X +
y1 . Y =. . yn
Anlisis de regresin
55
X tY
SCT : Suma de cuadrados total SCE : Suma de cuadrados residual SCReg : Suma de cuadrados de la regresin Tabla ANOVA Sumas de Grados de Cuadrados Fexp Cuadrados libertad Medios P 1 SCReg CM Reg B t X t Y t ( yi )2 k CMReg = n k CM E SCE t t t Y Y B X Y n k 1 CM E = nk1 P 1 2 Y t Y ( yi ) n1 n
56
Anlisis de regresin
R2 =
0 R 2 1.
Si R2 = 0 SCReg = 0 El modelo no explica nada de la variacin de y a partir de su relacin lineal con x1 , . . . , xk . Si R2 = 1 SCReg = SCT Toda la variacin de y es explicada por los trminos presentes en el modelo. Un valor de R2 cercano a 1 Mayor cantidad de variacin total es explicada por el modelo de regresin.
2 nk1 R =1 X (yi y )2
e2 i
n1
ei = yi y bi
Anlisis de regresin
57
EL CONTRASTE DE REGRESIN
Bibliografa utilizada: F Canavos, George C. (1988). "Probabilidad y Estadstica. Aplicaciones y Mtodos". Ed.: Mc Graw Hill. F Lara Porras A.M. (2002). "Estadstica para Ciencias Biolgicas y Ciencias Ambientales. Problemas y Exmenes Resueltos". Ed.: Proyecto Sur. F Milton, Susan (2002). "Estadstica para Biologa y Ciencias de la Salud". Ed.: Mc Graw-Hill. F Pea, Daniel (2002). Regresin y diseo de experimentos". Ed.:Alianza Editorial. Temporalizacin: Dos horas