You are on page 1of 17

ANLISIS DE

REGRESIN LINEAL
ANLISIS DE REGRESIN

En muchas aplicaciones estadstica se debe


resolver problemas que contienen dos
variables cuantitativas. En el anlisis de
regresin simple:
X: Variable independiente
Y: Variable dependiente

ANLISIS DE CORRELACIN MODELO DE REGRESIN


- Diagrama de dispersin (mtodo El modelo de regresin es simple:
grafico)

- Coeficiente de Correlacin (r) Y b0 b1 x
- coeficiente de determinacin (r2)
DIAGRAMA DE DISPERSIN
El diagrama de dispersin es la grafica de los valores (xi, yi) de las variables X e
Y en el sistema cartesiano. En el diagrama se visualiza el tipo de correlacin
existente entre las variable dependiente (Y) y la variable independiente (X).

Correlacin Correlacin
Correlacin no
Lineal Positiva o Lineal Negativa Correlacin Nula
Lineal
Directa o Inversa
COEFICIENTE DE CORRELACIN LINEAL DE PEARSON (r)

Si el modelo tiene pendiente positiva:


El coeficiente de correlacin (r)
0.00 r < 0.20; correlacin no significativa
mide el grado de afinidad o
0.20 r < 0.40; correlacin baja
asociacin entre dos o ms
0.40 r < 0.70; correlacin moderada
variables cuando estn relacionadas
0.70 r < 1; alto grado de correlacin
mediante una lnea recta.
Si el modelo tiene pendiente negativa:
El coeficiente de correlacin r es un
-1 < r -0.70; alto grado de correlacin
numero comprendido entre -1 y 1.
-0.70 < r -0.40; correlacin moderada
El coeficiente de correlacin lineal
-0.40 < r -0.20; correlacin baja
de Pearson:
-0.20 < r 0.00; correlacin no significativa
n XY X Y Importante:
r Si r = 1; correlacin perfecta positiva entre
n X 2 ( X ) 2 n Y 2 ( Y ) 2
X e Y, todos los puntos se encuentran sobre
la recta de regresin.
1 r 1 Si r = -1; correlacin perfecta negativa entre
X e Y, si todos los puntos se encuentran
sobre la recta de regresin.
Si r = 0; los datos son incorrelacionados.
COVARIANZA

La covarianza es una estadstica que mide el grado de dispersin conjunta de


dos variables X e Y.
Las covarianzas de n valores (x1, y1), (x2, y2),..., (xn, yn) de una variable
bidimensional (X, Y) que denotaremos por Cov(X, Y) o SXY se define como la
media aritmtica de los productos de la diferencia de los datos con respecto
a su correspondientes medias. Esto es:

1 n 1 n
Cov( X , Y ) S XY ( xi x)( y i y ) xy x y
n i 1 n i 1
COEFICIENTE DE DETERMINACIN

La primera forma del estudio de la asociacin entre las variables X e Y,


es denominada correlacin, que consiste en determinar la variacin
conjunta de las dos variables, su grado de relacin y su sentido. Tal
medida se denomina coeficiente de correlacin (r). El cuadrado del ndice
de correlacin se denomina coeficiente de determinacin (r2).
El coeficiente de determinacin mide la variacin de Y que se explica por la
variable independiente X en el modelo de regresin.

b0 Y b1 XY nY
2

r
2

Y nY
2 2
AJUSTE DE UNA FUNCIN DE REGRESIN

Ajustar una funcin de regresin significa buscar o definir la funcin que exprese
con mayor precisin la relacin entre variables. Grficamente ser aquella funcin
que mejor se adecu al diagrama de dispersin (nube de puntos)
En el ajuste de funciones de regresin simple, se pueden utilizar diversas funciones
matemticas conocidas:

LNEA RECTA CURVA EXPONENCIAL CURVA POTENCIAL



Y b0 b1
x
Y b0 x b1
Y b0 b1 x
log Y log b0 (log b1 ) x log Y log b0 b1 log x
REGRESIN LINEAL SIMPLE

El objetivo de la regresin simple es Los parmetros b0 y b1 de la


estimar la relacin que existe entre funcin de regresin se obtienen
a partir de las Ecuaciones
dos variables X e Y(valor real). El
Normales obtenida por el Mtodo
modelo de regresin es: de los Mnimos Cuadrados

Y b0 b1 x
n n n

X Y
i 1
i i b0 X i b1 X i2
i 1 i 1

Y = Valor estimado n n

Esto expresa Y es un valor estimado Y
i 1
i b0 n b1 X i
i 1
a partir de valores reales de X, que
n XY X Y
sera un modelo de regresin de Y b1
n X 2 X
2
sobre X, donde:
Y = Variable dependiente o explicada b0 Y b1 X
(Valor real o valor observado)
X = Variable independiente o b1 S XY
y r S XY
b1 r S Y
2
explicativa S X S SX Y S X
SIGNIFICADO DE LA PENDIENTE DEL MODELO DE REGRESION
Si b1> 0, entonces, la tendencia lineal es creciente, es decir a mayores valores de
X corresponden mayores valores de Y.
Si b1< 0, entonces, la tendencia lineal es decreciente, es decir a mayores valores
de X corresponden menores valores de Y.

Si b1= 0, entonces, Y b0 ; Y permanece estacionario para cualquier valor de X.

ERROR ESTANDAR DE ESTIMACION


El error estndar de estimacin llamado tambin desviacin estndar, es una
medida de dispersin de los valores observados, con respecto a la lnea de
regresin (valores estimados).

Entre el valor observado y el valor estimado existe una diferencia o sesgo (Yi Y ) ,
que puede ser menor o mayor, en la medida que los n-puntos del diagrama de
dispersin estn ms o menos cerca de la lnea de regresin.
n
i
( y y ) 2

SCE b0 Y b1 XY
Y 2

S i 1

n2 n2 n2
Ejemplo: Analizar la relacin entre la edad y el tiempo efectivo de servicio de los
trabajadores, para el efecto se consider una muestra de 15 trabajadores:
Edad 48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
Tiempo de 24 18 9 14 22 22 4 13 10 20 12 18 16 8 6
Servicio
Realizar un anlisis de correlacin y construir un modelo de regresin adecuado

Solucin:
PASO 1: Definir las variables:
Cul ser la variable dependiente e
independiente?
Y: Tiempo de Servicio (Variable
Dependiente)
X: Edad (Variable Independiente)
PASO 2: Diagrama de dispersin
En el grafico se observa que la nube de
puntos tiene un comportamiento lineal,
con una relacin positiva en donde es
posible ajustar un modelo de regresin
lineal la cual ser:
Y b0 b1 x
Paso 3: Realizar el siguiente procedimiento para clculos posteriores.

Edad X Tiempo de
Servicio Y XY X2 Y2 Y estimado
48 24 1152 2304 576 23.685
40 18 720 1600 324 16.677
30 9 270 900 81 7.917
39 14 546 1521 196 15.801
46 22 1012 2116 484 21.933
42 22 924 1764 484 18.429
27 4 108 729 16 5.289
36 13 468 1296 169 13.173
34 10 340 1156 100 11.421
46 20 920 2116 400 21.933
32 12 384 1024 144 9.669
42 18 756 1764 324 18.429
40 16 640 1600 256 16.677
32 8 256 1024 64 9.669
27 6 162 729 36 5.289
561 216 8658 21643 3654 215.991
Paso 4: Anlisis de correlacin

El coeficiente de correlacin es: Interpretacin: El


n XY X Y coeficiente de correlacin
r se aproxima a 1, esto
n X 2 X n Y 2 Y
2 2

significa que hay un alto


15(8658) 561(216) grado de asociacin entre la
r
15(21643) 561 15(3654) 216 edad y el tiempo de servicio
2 2

r 0.9663

Interpretacin: El 93.37%
El coeficiente de determinacin es: de la variacin en el tiempo
de servicio se explica por la
r 2 (0.9663) 2 0.9337 variacin en la edad de los
trabajadores. Edad explica
muy bien al modelo de
regresin.
Paso 5: Modelo de Regresin Lineal
Interpretacin:
El modelo de regresin es: b0 =-18.363 no tiene

interpretacin (Casi siempre b0
Y b0 b1 x 18.363 0.876 x no tiene interpretacin)
b1 = 0.876; significa que por
n XY X Y cada edad adicional de los
b1 0.876
n X X
2 2
trabajadores puede esperarse
b0 Y b1 X -18.363 aumentar casi 1 ao de
tiempo de servicio

Cul es el tiempo de servicio estimado


para un trabajador de 35 aos de Interpretacin:
edad? Aproximadamente tendra 12
aos de tiempo de servicio

Y 18.363 0.876(35) 12.3 aos efectivo


Paso 6: Error Estndar

El error estndar es:

S
SCE

Y 2
a Y b XY
n2 n2
3654 (18.363)( 216) 0.876(8658)

13
S 1.6641
Interpretacin: El error estndar es
1.6641, indica que las observaciones
reales estn bastante cerca de la
lnea de regresin, esto se puede
verificar con el coeficiente de
correlacin, como tambin
observando el siguiente grafico.
Paso 6: Error Estndar

El error estndar es:

S
SCE

Y 2
a Y b XY
n2 n2
3654 (18.363)( 216) 0.876(8658)

13
S 1.6641
Interpretacin: El error estndar es
1.6641, indica que las observaciones
reales estn bastante cerca de la
lnea de regresin, esto se puede
verificar con el coeficiente de
correlacin, como tambin
observando el siguiente grafico.
REGRESION NO LINEAL

En anlisis de regresin, cuando el diagrama de dispersin no se


ajusta a una lnea recta, hablamos de modelos no lineales, la
cual se pueden trasformar los valores de las variables X e Y,
obtener los estadgrafos de la misma forma como hemos hallado
anteriormente. Los modelos de regresin a estudiar son:

Ecuacin Transformacin Lineal


Exponencial : Y b0b1X log Y log b0 (log b1 ) X
Potencial : Y b0 X b1 log Y log b0 b1 log X
MUCHAS
GRACIAS

You might also like