Professional Documents
Culture Documents
REGRESION LINEAL:
Un modelo de regresin es un modelo que permite describir cmo influye una
variable X sobre otra variable Y.
Estudiar como influye la estatura del padre sobre la estatura del hijo.
Estimar el precio de una vivienda en funcin de su supercie.
Predecir la tasa de paro para cada edad.
Aproximar la calificacin obtenida en una materia segn el nmero de horas
de estudio semanal.
Prever el tiempo de computacin de un programa en funcin de la velocidad
del procesador.
TIPOS DE RELACIN
1. Determinista: Conocido el valor de X, el valor de Y queda perfectamente
establecido. Son del tipo:
y = f (x)
Ejemplo: La relacin existente entre la temperatura en grados centgrados (X)
y grados Fahrenheit (Y) es:
y = 1,8x + 32
2. No determinista: Conocido el valor de X, el valor de Y no queda
perfectamente establecido. Son del tipo:
y = f (x) + u
Donde u es una perturbacin desconocida (variable aleatoria).
Ejemplo: Se tiene una muestra del volumen de produccin (X) y el costo total
(Y ) asociado a un producto en un grupo de empresas.
3. Lineal: Cuando la funcin f (x) es lineal,
f (x) = 0 + 1x
( x ix ) ( y i y )
cov ( x ; y )= i=1
n1
( x ix )2
s 2x =cov ( x ; y )= i=1
n1
( y i y ) 2
n1
-1 cor (x,y) 1
cor (x,y) = cor (y,x)
cor (ax + b,cy + d) = cor (x,y) para cualesquiera valores a, b, c, d.
Los parmetros que hay que estimar son: 0, 1 y . El modelo de regresin lineal
simple
El objetivo es obtener estimaciones 0 y 1 de 0 y 1 para calcular la recta de
regresin:
y = 0 + 1x
que se ajuste lo mejor posible a los datos.
Ejemplo: Supongamos que la recta de regresin del ejemplo anterior es:
Costo = 15,65 + 1,29 Volumen
La diferencia entre cada valor yi de la variable respuesta y su estimacin y i se llama
residuo:
ei = yi yi
Ejemplo (cont.): Indudablemente, una empresa determinada que haya producido
exactamente 25 mil unidades no va a tener un gasto de exactamente 16,6 mil euros.
La diferencia entre el costo estimado y el real es el residuo. Si por ejemplo el costo
real de la empresa es de 18 mil euros, el residuo es:
ei = 18 16,6 = 1,4mil euros
HIPOTESIS DEL MODELO DE REGRESIN LINEAL SIMPLE
Linealidad: La relacin existente entre X e Y es lineal,
f (x) = 0 + 1x
Homogeneidad: El valor promedio del error es cero,
E[ui] = 0
Homocedasticidad: La varianza de los errores es constante,
Var(ui) = 2
Independencia: Las observaciones son independientes,
E[uiuj] = 0
Normalidad: Los errores siguen una distribucion normal,
ui N(0, )
ESTIMADORES DE MINIMOS CUADRADOS
Gauss propuso en 1809 el mtodo de mnimos cuadrados para obtener los valores
0 y 1 que mejor se ajustan a los datos:
yi = 0 + 1xi
El mtodo consiste en minimizar la suma de los cuadrados de las distancias
verticales entre los datos y las estimaciones, es decir, minimizar la suma de los
residuos al cuadrado
n
2
i
0 1 x i
y i()
e = ( y i y ) =
i=1
i=1
i =1
1=
( x i x ) ( y i y )
cov ( x ; y ) i=1
=
s2x
( x ix )2
i=1
0= y 1 x
ESTIMACION DE LA VARIANZA
Para estimar la varianza de los errores, 2, podemos utilizar
n
e2i
2= i=1
n
e 2i
s 2R = i=1
n2
( x ix )
y i = wi y i
(n1)s 2x
i=1
1=
i=1
( x ix )
i=1
(n1) s x
E [ ]=
E [ y i ]= 1
Y su varianza es:
n
Var [ ] =
i=1
( x i x )
(n1) s 2x
Var [ y i ] =
( n1)s2x
Por tanto:
1 N= 1
2
(n1)s2x
1 1
2
R
( n1 ) s2x
t n2
1 t n2, /2
s2R
( n1 ) s 2x
H0 : 1 = 0
H1 : 1 0
La regin de rechazo de la hiptesis nula es:
| |
1
s 2R
>t n2, / 2
( n1 ) s2x
pvalor=2 Pr t n2 >
s 2R
( n1 ) s2x
i=1
( 1n x w ) y
i
donde wi = (xi
x )/n s 2x
E [ ]=
i=1
( 1n x w ) E [ y ]= 0
i
Y su varianza es
n
Var [ ]=
i=1
2
1
1
x 2
x w i Var [ y i ]= 2 +
n
n ( n1 ) s 2x
Y por tanto:
( (
1
x
N = 0
+
n ( n1 ) s 2x
))
1
x 2
s
+
n ( n1 ) s 2x
2
R
t n2
1 t
n2,
(
s 2R
1
x 2
+
n ( n1 ) s2x
H0 : 1 = 0
H1 : 1 0
La regin de rechazo de la hiptesis nula es:
|(
0
2
x
2 1
sR +
n ( n1 ) s2x
>t n2, /2
pvalor=2 Pr t n2 >
1
x
s
+
n ( n1 ) s 2x
2
R
REGRESION MULTIPLE
El modelo que se plantea en regresin mltiple es el siguiente: