You are on page 1of 14

REGRESION LINEAL SIMPLE

RELACION ESTADISTICA
Dos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede
estimar aproximadamente el valor de la segunda.
Ejemplos

Ingresos y gastos de una familia.


Produccin y ventas de una fbrica.
Gastos en publicidad y beneficios de una empresa.
VARIABLE ESTADISTICA BIDIMENSIONAL

Una variable bidimensional es una variable en la que cada individuo est definido por
un par de caracteres, (X, Y).
Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin
entre ellas, una de las dos variables es la variable independiente y la otra variable
dependiente.
DISTRIBUCIONES BIDIMENSIONALES

Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par (xi, yi).
Si representamos cada par de valores como las coordenadas de un punto, el conjunto de
todos ellos se llama nube de puntos o diagrama de dispersin.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresin.
EJEMPLO
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas 2
Fsica
1

3
3

4
2

4
4

5
4

6
4

6
6

7
4

7
6

8
7

10
9

10
10

LA COVARIANZA
La covarianza es una estadstica que mide el grado de dispersin o variabilidad conjunta de dos
variables X e Y con respecto a sus medias respectivas ( )
La covarianza de una variable bidimensional es la media aritmtica de los productos de las
desviaciones de cada una de las variables respecto a sus medias respectivas.
Notacin
Se denotara por
Formula

La covarianza a diferencia de la varianza puede ser negativa


La covarianza indica el sentido de la correlacin entre las variables

Ejemplo

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas 2
Fsica
1

3
3

4
2

4
4

5
4

6
4

6
6

7
4

Hallar la covarianza de la distribucin


xi
2
3

yi
1
3

xi*yi
2
9

7
6

8
7

10
9

10
10

4
4
5
6
6
7
7
8
10
10
72

2
4
4
4
6
4
6
7
9
10
60

8
16
20
24
36
28
42
56
90
100
431

Despus de tabular los datos hallamos las medias aritmticas

2.- Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:


y/x
1
2
3

0
2
1
2

2
1
4
5

4
3
2
0

Hallar la covarianza de la distribucin.


En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las
medias aritmticas.
Xi
0
0
0
2
2
2
4
4

Yi
1
2
3
1
2
3
1
2

ni
2
1
2
1
4
5
3
2
20

Xi*ni
0
0
0
2
8
10
12
8
40

Yi*ni
2
2
6
1
8
15
3
4
41

Xi*Yi*ni
0
0
0
2
16
30
12
16
76

LA CORRELACION

La correlacin trata de establecer la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay
correlacin entre ellas.
TIPOS DE CORRELACION

1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nula

La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una
forma redondeada.

GRADO DE CORRELACION

El grado de correlacin indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula : no hay correlacin

COEFICIENTE O INDICE DE CORRELACION

El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de


las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.

Donde

PROPIEDADES

1.-El coeficiente de correlacin no vara al hacerlo la escala de medicin.

Es decir, si expresamos la altura en metros o en centmetros el coeficiente de


correlacin no vara.
2.- El signo del coeficiente de correlacin es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. -El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.
1 r 1
4.- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es
fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
5.- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es
fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. -Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es
dbil.
7. -Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre
ambas variables hay dependencia funcional.
Interpretacin
Si r=1 , se dice que hay una correlacin perfecta positiva
Si r=-1 , se dice que hay una correlacin perfecta negativa
Si r=0 , se dice que no hay una correlacin entre las dos variables
EJEMPLO

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas 2
Fsica
1

3
3

4
2

4
4

5
4

6
4

6
6

7
4

7
6

8
7

10
9

Hallar el coeficiente de correlacin de la distribucin e interpretarlo


xi
2
3
4
4

yi
1
3
2
4

xi*yi
2
9
8
16

(xi)^2
4
9
16
16

(yi)^2
1
9
4
16

10
10

5
6
6
7
7
8
10
10
72

4
4
6
4
6
7
9
10
60

20
24
36
28
42
56
90
100
431

25
36
36
49
49
64
100
100
504

16
16
36
16
36
49
81
100
380

Hallamos las medias aritmticas

Calculamos la covarianza

Calculamos las desviaciones tpicas

Aplicamos la frmula del coeficiente de correlacin lineal

Al ser el coeficiente de correlacin positivo, la correlacin es directa.


Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.
2.- Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:
y/x
0
1
2
2
1
3
2
Determinar el coeficiente de correlacin

2
1
4
5

4
3
2
0

En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las
medias aritmticas.
Xi
0
0
0

Yi
1
2
3

ni
2
1
2

Xi*ni
0
0
0

Yi*ni
2
2
6

Xi*Yi*ni
0
0
0

((Xi)^2)(ni)
0
0
0

((Yi)^2)(ni)
2
4
18

2
2
2
4
4

1
2
3
1
2

1
4
5
3
2
20

2
8
10
12
8
40

1
8
15
3
4
41

2
16
30
12
16
76

4
16
20
48
32
120

1
16
45
3
8
97

Al ser el coeficiente de correlacin negativo, la correlacin es inversa.


Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.

REGRESION LINEAL SIMPLE


De n pares de valores de una variable bidimensional (X,Y). La regresin lineal simple de Y con
respecto a X, consiste en determinar la ecuacin de la recta

Donde
X: es la variable independiente
Y: es la variable dependiente
Llamada constante de regresin
Coeficiente de regresion

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus


ecuaciones son:

INTERPRETACION

El coeficiente b es la pendiente o el coeficiente de la regresin lineal. L a constante a es la


ordenada en el origen
Si b>0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de X
corresponden mayores valores de Y. Tambin, a menores valores de X corresponden menores
valores de Y
Si b<0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores de X
corresponden menores valores de Y. Tambin, a menores valores de X corresponden mayores
valores de Y
Si b=0 , entonces Y=a. Luego, Y permanece estacionario para cualquier valor de X. En este caso
se dice que , no hay regresin

EJEMPLO

Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas 2
Fsica
1

3
3

4
2

4
4

5
4

6
4

6
6

7
4

7
6

8
7

10
9

Hallar el coeficiente de correlacin de la distribucin e interpretarlo


xi
2
3
4
4
5
6
6
7
7
8
10
10

yi
1
3
2
4
4
4
6
4
6
7
9
10

xi*yi
2
9
8
16
20
24
36
28
42
56
90
100

(xi)^2
4
9
16
16
25
36
36
49
49
64
100
100

(yi)^2
1
9
4
16
16
16
36
16
36
49
81
100

10
10

72

60

431

504

Hallamos las medias aritmticas

Calculamos la covarianza

Hallamos la varianza

Calculando b y a

Recta de regresin de Y sobre X

Calculando b y a

Recta de regresin de Y sobre X


Calculando b y a

380

GRAFICAMENTE

EJERCICIOS

1.-Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42 y 44


kilos.
a) Hallar la ecuacin de la recta de regresin de la edad sobre el peso.
b) Cul sera el peso aproximado de un nio de seis aos?
2.- Un centro comercial sabe en funcin de la distancia, en kilmetros, a la que se site
de un ncleo de poblacin, acuden los clientes, en cientos, que figuran en la tabla:
N de
8
clientes (X)
Distancia(Y) 15

19

25

23

34

40

a) Calcular el coeficiente de correlacin lineal.


b) Si el centro comercial se sita a 2 km, cuntos clientes puede esperar?
c) Si desea recibir a 500 clientes, a qu distancia del ncleo de poblacin debe
situarse?
3.-Las notas obtenidas por cinco alumnos en Matemticas y Qumica son:
Matemticas 6
Qumica
6.5

4
4.5

8
7

5
5

3.5
4

Determinar las rectas de regresin y calcular la nota esperada en Qumica para un


alumno que tiene 7.5 en Matemticas.
4.-Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlacin r =
0.9, siendo las medias de las distribuciones marginales = 1, = 2. Se sabe que una
de las cuatro ecuaciones siguientes corresponde a la recta de regresin de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Seleccionar razonadamente esta recta.
5.-Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura(X) 186
Pesos (Y)
85

189
85

190
86

192
90

193
87

193
91

198
93

201
103

203
100

205
101

Calcular:
a) La recta de regresin de Y sobre X.
b) El coeficiente de correlacin.
c) El peso estimado de un jugador que mide 208 cm.
6.-A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a
unidades producidas (Y), determinar la recta de regresin de Y sobre X, el coeficiente
de correlacin lineal e interpretarlo.
Horas(X)
80 79 83 84 78 60 82 85 79 84 80 62
Produccin(Y) 300 302 315 330 300 250 300 340 315 330 310 240

7.-Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas


que dedican diariamente a dormir y ver la televisin. La clasificacin de las respuestas
ha permitido elaborar la siente tabla:
N de horas
6
dormidas(X)
N de horas
4
de
televisin(Y)
Frecuencias 3
absolutas(ni)

Se pide:

10

16

20

10

a) Calcular el coeficiente de correlacin.


b) Determinar la ecuacin de la recta de regresin de Y sobre X.
c) Si una persona duerme ocho horas y media, cunto cabe esperar que vea la
televisin?

8.-La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a
prueba y ventas del primer mes de prueba (Y) en cientos de euros.
X
Y

25
42

42
72

33
50

54
90

29
45

36
48

a) Hallar el coeficiente de correlacin e interpretar el resultado obtenido.


b) Calcular la recta de regresin de Y sobre X. Predecir las ventas de un vendedor
que obtenga 47 en el test.

You might also like