Professional Documents
Culture Documents
REGRESIN LINEAL
ANLISIS DE REGRESIN
Correlacin Correlacin
Correlacin no
Lineal Positiva o Lineal Negativa Correlacin Nula
Lineal
Directa o Inversa
COEFICIENTE DE CORRELACIN LINEAL DE PEARSON (r)
1 n 1 n
Cov( X , Y ) S XY ( xi x)( y i y ) xy x y
n i 1 n i 1
COEFICIENTE DE DETERMINACIN
b0 Y b1 XY nY
2
r
2
Y nY
2 2
AJUSTE DE UNA FUNCIN DE REGRESIN
Ajustar una funcin de regresin significa buscar o definir la funcin que exprese
con mayor precisin la relacin entre variables. Grficamente ser aquella funcin
que mejor se adecu al diagrama de dispersin (nube de puntos)
En el ajuste de funciones de regresin simple, se pueden utilizar diversas funciones
matemticas conocidas:
X Y
i 1
i i b0 X i b1 X i2
i 1 i 1
Y = Valor estimado n n
Esto expresa Y es un valor estimado Y
i 1
i b0 n b1 X i
i 1
a partir de valores reales de X, que
n XY X Y
sera un modelo de regresin de Y b1
n X 2 X
2
sobre X, donde:
Y = Variable dependiente o explicada b0 Y b1 X
(Valor real o valor observado)
X = Variable independiente o b1 S XY
y r S XY
b1 r S Y
2
explicativa S X S SX Y S X
SIGNIFICADO DE LA PENDIENTE DEL MODELO DE REGRESION
Si b1> 0, entonces, la tendencia lineal es creciente, es decir a mayores valores de
X corresponden mayores valores de Y.
Si b1< 0, entonces, la tendencia lineal es decreciente, es decir a mayores valores
de X corresponden menores valores de Y.
Si b1= 0, entonces, Y b0 ; Y permanece estacionario para cualquier valor de X.
SCE b0 Y b1 XY
Y 2
S i 1
n2 n2 n2
Ejemplo: Analizar la relacin entre la edad y el tiempo efectivo de servicio de los
trabajadores, para el efecto se consider una muestra de 15 trabajadores:
Edad 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicio
Realizar un anlisis de correlacin y construir un modelo de regresin adecuado
Solucin:
PASO 1: Definir las variables:
Cul ser la variable dependiente e
independiente?
Y: Tiempo de Servicio (Variable
Dependiente)
X: Edad (Variable Independiente)
PASO 2: Diagrama de dispersin
En el grafico se observa que la nube de
puntos tiene un comportamiento lineal,
con una relacin positiva en donde es
posible ajustar un modelo de regresin
lineal la cual ser:
Y b0 b1 x
Paso 3: Realizar el siguiente procedimiento para clculos posteriores.
Edad X Tiempo de
Servicio Y XY X2 Y2 Y estimado
48 24 1152 2304 576 23.685
40 18 720 1600 324 16.677
30 9 270 900 81 7.917
39 14 546 1521 196 15.801
46 22 1012 2116 484 21.933
42 22 924 1764 484 18.429
27 4 108 729 16 5.289
36 13 468 1296 169 13.173
34 10 340 1156 100 11.421
46 20 920 2116 400 21.933
32 12 384 1024 144 9.669
42 18 756 1764 324 18.429
40 16 640 1600 256 16.677
32 8 256 1024 64 9.669
27 6 162 729 36 5.289
561 216 8658 21643 3654 215.991
Paso 4: Anlisis de correlacin
r 0.9663
Interpretacin: El 93.37%
El coeficiente de determinacin es: de la variacin en el tiempo
de servicio se explica por la
r 2 (0.9663) 2 0.9337 variacin en la edad de los
trabajadores. Edad explica
muy bien al modelo de
regresin.
Paso 5: Modelo de Regresin Lineal
Interpretacin:
El modelo de regresin es: b0 =-18.363 no tiene
interpretacin (Casi siempre b0
Y b0 b1 x 18.363 0.876 x no tiene interpretacin)
b1 = 0.876; significa que por
n XY X Y cada edad adicional de los
b1 0.876
n X X
2 2
trabajadores puede esperarse
b0 Y b1 X -18.363 aumentar casi 1 ao de
tiempo de servicio
S
SCE
Y 2
a Y b XY
n2 n2
3654 (18.363)( 216) 0.876(8658)
13
S 1.6641
Interpretacin: El error estndar es
1.6641, indica que las observaciones
reales estn bastante cerca de la
lnea de regresin, esto se puede
verificar con el coeficiente de
correlacin, como tambin
observando el siguiente grafico.
Paso 6: Error Estndar
S
SCE
Y 2
a Y b XY
n2 n2
3654 (18.363)( 216) 0.876(8658)
13
S 1.6641
Interpretacin: El error estndar es
1.6641, indica que las observaciones
reales estn bastante cerca de la
lnea de regresin, esto se puede
verificar con el coeficiente de
correlacin, como tambin
observando el siguiente grafico.
REGRESION NO LINEAL