Professional Documents
Culture Documents
Cuadernillo 12 (Regresión Lineal Simple)
Cuadernillo 12 (Regresión Lineal Simple)
Cuadernillo N°12
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE
INTRODUCCIÓN
En esta parte del curso vamos a determinar la relación matemática que existe entre dos
variables.
Existen dos formas de estudiar la asociación o relación entre dos variables cuantitativas.
La primera forma se denomina correlación, que como ya vimos en el capítulo anterior,
consiste en estudiar el tipo o sentido y el nivel o grado de relación que presentan dos
variables. La medida que indica el tipo o sentido de la relación se denomina Covarianza, y
la medida que indica el nivel o grado de relación se denomina Coeficiente de Correlación.
La segunda forma se denomina regresión, que consiste en determinar una relación
matemática y funcional (denominada línea o ecuación de regresión), que nos permita
predecir el valor de una de las variables (denominada variable dependiente), en base al
valor de la otra variable (denominada variable independiente o explicativa).
La ecuación de regresión será confiable si existe un alto grado de correlación entre las
variables indicado por el coeficiente de determinación.
-2- www.grupolamatriz.com
Análisis de Regresión Lineal Simple
y.x i = 0 + 1 .X i
Donde:
0 : Coeficiente de intersección poblacional. (Intercepto de la línea de regresión)
Observaciones:
Si 1 0 entonces, la media de Y aumenta.
El valor observado de Y (Yi) será igual al valor medio de Y para cada valor de X ( yx i ),
Por lo tanto: Y i = y x i + i = 0 + 1 X i + i
www.grupolamatriz.com -3-
Análisis de Regresión Lineal Simple
Donde: Yi = Valor observado.
yx i = Valor medio de Y para cada valor de X.
Yi = 0 + 1 X i + i , i = 1, 2,...,k
2. Los términos aleatorios de error residual i son independientes, y son tales que:
i. i = 0 i = E i = 0
ii. 2 i = E i2
iii. E[ i j ] = 0 i j
4. Para cada valor de Xi, los valores de Y tienen una distribución normal:
2
Y N( y.x , y.x ) .
5. Las distribuciones de Y para los diferentes valores de X tienen igual variancia, a esto
se le denomina HOMOCEDASTICIDAD.
6. Los valores de Y, para cada valor de X, son obtenidos de una muestra aleatoria.
-4- www.grupolamatriz.com
Análisis de Regresión Lineal Simple
Ŷ i =
ˆ y x i = b 0 + b 1 X i
regresión estimada.
X xi X
www.grupolamatriz.com -5-
Análisis de Regresión Lineal Simple
nb o + b 1 X i = Yi (1)
b 0 X i + b 1 X i2 = X i Y i (2)
n X i Yi − X i. Yi SP(X, Y) S XY
b1 = ó b1 = =
n X i2 − [ X i ] 2 SC(X) S 2X
b 0 = Y − b1 X ó b 0 =
Yi − b 1 X i
n
Siendo:
* SP(X, Y) = X i Yi − nXY = X i Yi − X i Yi
n
2 2 [ X i ] 2
* SC(X) = X i − nX = X i2 −
n
n n Xi Yi
Xi Yi − nXY Xi Yi −
n
* S XY = i=1 = i=1
n −1 n −1
n
2 2 n
2 [ Xi ]2
Xi − nX Xi −
n
* S2x = i=1 = i=1
n −1 n −1
-6- www.grupolamatriz.com
Análisis de Regresión Lineal Simple
n
2.
i =1
ei2 es un valor mínimo.
n
6.
i =1
x i ei = 0
n n
7.
i =1
xi yi = xi yi
i =1
n
8.
i =1
y i ei = 0
COEFICIENTE DE DETERMINACIÓN
El coeficiente de determinación se define como el cociente entre la variación explicada por
la regresión y la variación total del modelo.
Expresa la proporción de la variación total que es explicada por la línea de regresión
estimada.
SC(Reg.)
r2 = 0 r2 1
SC(Total)
www.grupolamatriz.com -7-