You are on page 1of 19

REGRESIÓN LINEAL

la formalización vendría determinada por una ecuación como la siguiente Y = β1 + β 2 X .Regresión Lineal Simple Planteamiento El comportamiento de una magnitud económica puede ser explicada a través de otra Y = F(X ) Si se considera que la relación puede ser de tipo lineal.

Regresión Lineal Simple Planteamiento Dado que las relaciones en la ciencias sociales no son exactas se incluye el término de pertubación aleatoria Y = β1 + β 2 X + U Supongamos que se dispone de T observaciones de las variable Y y X Y1 = β1 + β 2 X 1 + u1 Y2 = β1 + β 2 X 2 + u 2 ……………………………… Yn = β1 + β 2 X n + un .

3……………. 2. .Regresión Lineal Simple Planteamiento De forma abreviada el sistema de ecuaciones se puede escribir de la siguiente manera Yt = β1 + β 2 X t + U t t = 1..T.

El primer paso es la representación gráfica de las variables (y.x) en un diagrama de dispersión Relación Lineal Exacta 14 12 10 8 Y Y 14 12 10 8 6 4 2 0 Relación Lineal Exacta 6 4 2 0 0 2 4 X 6 8 10 0 2 4 X 6 8 10 .Regresión Lineal Simple Planteamiento El objetivo del análisis de regresión es la estimación de los parámetros.

las observaciones no se encontrarán a lo largo de una recta Regresion Lineal Simple 18 16 14 12 Y 10 8 6 4 2 0 0 2 4 X 6 8 10 La estimación de los parámetros supone encontrar la ordenada en el origen y la pendiente de una recta que mejor se aproxime a los puntos .Regresión Lineal Simple Planteamiento Dado que la relación de dependencia entre ambas variables es aleatoria o estocástica.

Regresión Lineal Simple Planteamiento Recta de Regresión Especificada Yt = β 1 + β 2 X t + U t Recta de Regresión Estimada ˆ +β ˆ X ˆ =β Y t 1 2 t Errores o residuos ˆ −β ˆ X ˆ =β ˆ t = Yt − Y u t 1 2 t .

Regresión Lineal Simple Criterios de Ajuste a) La suma de todos los residuos sean próximas a cero T Minimizar ˆ ∑u t =1 t b) La suma de todos los residuos en términos absolutos sean próximas a cero Minimizar ∑ n t =1 ˆt u c) La suma de todos los residuos elevados al cuadrado sean próximas a cero Minimizar 2 ˆ u ∑ t =1 t n .

Regresión Lineal Simple Obtención de los estimadores Los estimadores se obtienen aplicando el criterio de minimización de la suma cuadrática de los errores n ∑ 2 t t =1 ˆ = u S =∑ t =1 n ( ˆ Yt − Y t ) =∑ (Y − βˆ − βˆ X ) 2 n t =1 t 1 2 t 2 Para minimizar S se derivará la función respecto de cada uno de los parámetros n ∂S ˆ −β ˆ X )=0 = −2∑ (Yt − β t 1 2 ˆ ∂β t =1 1 n ∂S ˆ −β ˆ X )X = 0 = −2∑ (Yt − β 1 2 t t ˆ ∂β t =1 2 .

X ) ˆ β2 = var( X ) ˆ Cov ( X . las expresiones anteriores se transformarían del siguiente modo: ˆ =Y −β ˆ X −β ˆ X β 1 2 2 3 3 ˆ Cov( X . la expresión analítica de los estimadores mínimo-cuadráticos de la regresión lineal simple: ˆ =Y −β ˆ X β 1 2 Cov (Y .Regresión Lineal Obtención de los estimadores Operando y reagrupando términos se obtendría. X 2 ) − β 3 2 3 ˆ β2 = var( X 2 ) En el caso de un modelo de regresión lineal múltiple. X 3 ) − β 2 3 2 ˆ β3 = var( X 3 ) . X ) Cov (Y . X ) Cov (Y .

Modelo Lineal Básico Hipótesis Forma funcional Sobre la perturbación Aleatoria Sobre las variables independientes Sobre el vector de parámetros .

garantiza a su vez la relación lineal con el resto de elementos .Modelo Lineal Básico Hipótesis Forma funcional ˆ +β ˆ X +β ˆ X +β ˆ X + LL L + β ˆ X +u Yt = β 1 2 2t 3 3t 4 4t k kt t a) La relación entre la variable dependiente y las variables independientes es tipo lineal. La incorporación del término de perturbación aleatoria de forma aditiva.

el efecto total recogido por esta no es desdeñable. no obstante.Modelo Lineal Básico Hipótesis Sobre la perturbación aleatoria a) La perturbación aleatoria es una variable aleatoria no observable La perturbación aleatoria representa el conjunto de variables que a tono individual poseen un efecto irrelevante. Adicionalmente representa la aleatoriedad intrínseca del comportamiento humano. con lo que dicha variable toma valores siguiendo una distribución de probabilidades Dado que la variable dependiente es una combinación lineal del término de perturbación aleatoria ésta constituye igualmente una variable aleatoria .

Modelo Lineal Básico Hipótesis Sobre la perturbación aleatoria b) El promedio es igual a cero. Los efectos individuales de las variables incluidas en el término de pertubación aleatoria tienden a compensarse. b) Son homoscedásticas. Las poblaciones de Y dado los distintos valores de X tienen la misma varianza .

. Dado que la perturbación aleatoria incluye un amplio grupo de variables omitidas de forma explícita en el modelo de regresión lineal.Modelo Lineal Básico Hipótesis Sobre la perturbación aleatoria d) No existe autocorrelación entre las perturbaciones. Supone que las perturbaciones correspondientes a distintos unidades o períodos del tiempo no están relacionadas entre si e) Se distribuye como una variable normal. que son independientes entre si. apoyándose en el teorema de límite central se asume que el vector de las perturbaciones corresponde a una variable normalmente distribuida.

No hay relación perfecta entre las variables Sobre el vector de parámetros. Lo que supone estabilidad en la estructura del fenómeno estudiado.Modelo Lineal Básico Hipótesis Sobre las variables exógenas. a) Las betas son valores fijos. . a) Los valores de las variables independientes son fijos en muestreos repetidos. b) No hay multicolinealidad perfecta.

b) Se dispone de información estadística suficiente. . En general para tres variables independientes se necesita 15 observaciones. como mínimo n>K.Modelo Lineal Básico Hipótesis Otras hipótesis a) El modelo está correctamente especificado.

permaneciendo el resto de factores constantes Si las variables introducidas están expresadas en logaritmos ˆ ∂ log Y t ˆ β jt = ∂ log X jt Representa el cambio relativo en la variable dependiente ante un cambio en un 1% en la variable j.Modelo Lineal Básico Interpretación de los coeficientes Si las variables introducidas están expresadas en niveles ˆ ∂Y t ˆ β jt = ∂ X jt Representa el cambio en la variable dependiente ante un cambio unitario en la variable j. permaneciendo el resto de factores constantes .

σx j ˆ ˆ β * jt = β jt σy Donde: σx j σy Corresponde al cociente de las desviaciones típicas de la variable independiente j y de la variable dependiente y .Modelo Lineal Básico Interpretación de los coeficientes Si las variables introducidas están expresadas en la misma unidad de medida (tipificadas) ˆ* β jt Representa la importancia relativa que tiene cada una de las variables en la explicación de la variable dependiente. Relación entre los parámetros estimados con las variable expresadas en niveles y en la misma unidad de medida (tipificadas).