Professional Documents
Culture Documents
Tema Nº 4
DIAGRAMA DE DISPERSIÓN.-
Se llama así a los datos de una tabla en cuyas columnas se presentan datos de
variables relacionadas entre si, expresados como puntos en el plano
coordenado.
Tiempo - Producción
Años Ton. M3
X Y
1 14
2 33
3 20
4 41
5 52
1
Estadística General Lic. MBA Juan Luis Guzmán H.
Gráfico de dispersión
25
Toneladas M3
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Tiempo - años
AJUSTE DE CURVAS.-
Para hallar una ecuación que relacione las variables, el primer paso es recoger
datos que muestren valores correspondientes de las variables. El siguiente
paso es marcar los puntos (X1,Y1), (X2Y2, (X3Y3,…., (XnYn), sobre un sistema de
coordenadas rectangulares.
1. Línea recta Y = a + bX
2. Parábola o curva
Cuadrática Y = a + bX + cX2
3. Curva cúbica Y = a + bX + cX2 + dX3
4. Curva Cuártica Y = a + bX + cX2 + dX3 + eX4
5. Curva de grado n Y = a + bX + cX2 + ……+nXn
2
Estadística General Lic. MBA Juan Luis Guzmán H.
6. Hipérbola Y= 1 .
a + bX
3
Estadística General Lic. MBA Juan Luis Guzmán H.
25
Toneladas M3
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9
Tiempo - años
Y = a + bX
Donde:
X = Variable independiente
Y = Variable dependiente
a = Ordenada en el origen
b = Pendiente de la recta
4
Estadística General Lic. MBA Juan Luis Guzmán H.
X Y
4 2
5 6
9 12
10 14
12 16
2 = a + 4b (-1)
6 = a + 5b
-2 = -a – 4b
6 = a + 5b
4=b
2 = a + 4(4)
2 = a + 16
a = - 14
Y = - 14 + 4X
Estimando valores:
Para X = 4 Para X = 5
Yest = -14 + 4*4 Yest = -14 + 4*5
Yest = -14 +16 Yest = -14 + 20
Yest = 2 Yest = 6
5
Estadística General Lic. MBA Juan Luis Guzmán H.
2 = a + 4b (-1)
16 = a + 12b
-2 = -a – 4b
16 = a + 12b
14 = 8b
b = 14/8 = 7/4 = 1,75
2 = a + 4(1,75)
2= a+7
a = -5
Y = - 5 + 1,75X
Estimando valores:
Para X = 4 Para X = 5
Yest = -5 + 1,75*4 Yest = -5 + 1,75*5
Yest = -5 + 7 Yest = -5 + 8,75
Yest = 2 Yest = 3,75
TIPOS DE REGRESIÓN:
6
Estadística General Lic. MBA Juan Luis Guzmán H.
Si las variables son tres o más y se trata de expresarlas por una Ecuación
lineal de varias variables, se llama Regresión Lineal Múltiple.
Y = a + bX1 + c X2
Y su gráfica:
REGRESIÓN NO LINEAL
La Recta (L), no está muy cercana a todos los puntos, siendo preferible
7
Estadística General Lic. MBA Juan Luis Guzmán H.
insertar una Curva (C) como mejor aproximación a todos los puntos.
Y = a + bX1 + cX22
El caso ideal sería el de hallar una ecuación que contenga a todos los puntos
del Diagrama de dispersión. Lo que en la práctica es prácticamente
imposible.
8
Estadística General Lic. MBA Juan Luis Guzmán H.
En algunos casos las diferencias serán positivas (D1, D3), en otros casos
negativa (D2).
Se debe procurar que S sea lo más pequeña posible ya que ello significará una
mejor aproximación. Obviamente si S. es grande significará menor
aproximación.
Si se ajusta una Recta con el criterio de que S se más pequeña, se llama Recta
de Mínimos cuadrados.
De esta manera la recta posee una mejor aproximación a todos los puntos del
diagrama de dispersión.
∑ Y =aN +b∑X
∑XY = a ∑ X + b ∑ X2
a = ∑Y ∑X2 - ∑X ∑XY
N ∑X2 – (∑X2)
b = N ∑XY - ∑X ∑Y
N ∑X2 – (∑X2)
9
Estadística General Lic. MBA Juan Luis Guzmán H.
X Y
1 14
2 33
3 20
4 41
5 52
15 160
X Y XY X2
1 14 14 1
2 33 66 4
3 20 60 9
4 41 164 16
5 52 260 25
15 160 564 55
160 = a5 + b15
564 = a15 + b55
160 = 5a + 8,40 * 15
160 = 5a + 126
a = 34 / 5
a = 6,8
Luego la ecuación de la recta sería:
Y = 6,8 + 8,4X
Resumiendo:
a = 6,80
b = 8,40
10
Estadística General Lic. MBA Juan Luis Guzmán H.
Regresion Lineal
60,00
40,00
Y
20,00
0,00
0 2 4 6
X
y = 8,4x + 6,8 Línea de Tendencia
Y = 36,20
Y = 6,8 + 8,4 * 6
Y = 57,20
Para el caso en que precise establecer una relación entre más de dos variables,
se debe aplicar el procedimiento llamado regresión múltiple.
11
Estadística General Lic. MBA Juan Luis Guzmán H.
Y X1 X2
16 0 1
34 2 3
38 4 5
32 6 5
72 7 7
66 8 9
Para ello encontraremos los valores de: X12, X22, X1X2, X1Y y X2Y.
2 2
Y X1 X2 X1 Y X1 X1X2 X2 Y X2
16 0 1 0 0 0 16 1
34 2 3 68 4 6 102 9
38 4 5 152 16 20 190 25
32 6 5 192 36 30 160 25
72 7 7 504 49 49 504 49
66 8 9 528 64 72 594 81
258 27 30 1444 169 177 1566 190
12
Estadística General Lic. MBA Juan Luis Guzmán H.
a= 7
b = -2
c= 9
La ecuación de regresión:
Y = 7 – 2X1 + 9X2
Regresión No Lineal.-
Regresión Cuadrática.-
Y = a + bX + cX2
∑ Y = a N + b ∑X + c ∑X2 Ecuaciones
∑XY = a ∑X + b ∑X2 + c ∑X3 Normales
∑X2Y = a ∑X2 + b ∑ X3 + c ∑X4
Y X
5 1
3 2
2 3
4 4
6 5
10 6
18 7
Para ello encontraremos los valores de: X2, X3, X4, XY y X2Y.
Y X X2 X3 X4 XY X2Y
5 1 1 1 1 5 5
3 2 4 8 16 6 12
2 3 9 27 81 6 18
13
Estadística General Lic. MBA Juan Luis Guzmán H.
4 4 16 64 256 16 64
6 5 25 125 625 30 150
10 6 36 216 1.296 60 360
18 7 49 343 2.401 126 882
48 28 140 784 4.676 249 1.491
40 = a7 + b28 + c140
249 = a28 + b140 + c784
1491 = a140 + b784 + c4676
a = 9,4286
b = -5,1071
c = 0,8929
La ecuación de regresión:
Regresión Cuadrática
20
15
10
Y
5
0
0 2 4 6 8
X
y = 0,8929x 2 - 5,1071x + 9,4286
Regresión Exponencial.-
Y = a e bX
14
Estadística General Lic. MBA Juan Luis Guzmán H.
∑ Y = aN + b ∑X
∑XY = a∑X + b∑X2
∑ V = AN + b ∑X
∑XV = A∑X + b∑X2
Y X
8,5 1
10,2 2
12,8 3
15,6 4
19,1 5
Y X1 V = Ln Y X2 XV
8,5 1 2,1401 1 2,1401
10,2 2 2,3224 4 4,6448
12,8 3 2,5494 9 7,6483
15,6 4 2,7473 16 10,9891
15
Estadística General Lic. MBA Juan Luis Guzmán H.
12,7089 = A5 + b15
40,1707 = A15 + b55
A = 1,9285
b = 0,2044
V = A + bX Ecuación de la recta
V = 1,9285 + 0,2044X
Luego: si V = Ln Y
A = Ln a a = eA entonces:
e1,9285 = 6,8794
Ln Y = Ln 6,8794 + 0,2044X La expresión 0,2044X, puede escribirse como
Ln(e0,2044X)
Ln Y = Ln 6,8794 + Ln(e0,2044X) Por propiedad de la suma de Ln.
Ln Y = Ln[6,8794 *(e0,2044X)] Simplificando logaritmos
Y = 6,8794 e0,2044X
16
Estadística General Lic. MBA Juan Luis Guzmán H.
Regresión Exponencial
25
20
y 15
10
5
0
0 2 4 6
y = 6,8794e0,2044x x
Regresión Potencial.
Y=aXb
∑ Y = aN + b ∑X
∑XY = a∑X + b∑X2
∑ V = AN + b ∑U
∑UV = A∑U + b∑U2
17
Estadística General Lic. MBA Juan Luis Guzmán H.
Y X1
19 1
12 2
360 3
980 4
1100 5
U = Log V = Log
Y X X Y U2 UV
19 1 0,0000 1,2788 0,0000 0,0000
12 2 0,3010 1,0792 0,0906 0,3249
360 3 0,4771 2,5563 0,2276 1,2197
980 4 0,6021 2,9912 0,3625 1,8009
1100 5 0,6990 3,0414 0,4886 2,1258
2471 15 2,0792 10,9469 1,1693 5,4713
10,9469 = A5 + b2.0792
5,4713 = A2.0792 + b1.1693
A = 0,9349
b = 3,0167
V = A + bU Ecuación de la recta
V = 0,9349 + 3,0167U
Luego: si V = Log Y
U = Log X
A = Log a a = 10A entonces:
100,9349 = 8,6085
Log Y = Log 8,6085 + 3,0167 Log X La expresión 3,0167X, puede escribirse como
18
Estadística General Lic. MBA Juan Luis Guzmán H.
Log(X3,0167)
3,0167
Log Y = Log 8,6085 + Log(X ) Por propiedad de la suma de Log.
Log Y = Log[8,6085 *(X3,0167) Simplificando logaritmos
Y = 8,6085 X3,0167
Regresió Potencial
1500
1000
y
500
0
0 2 4 6
x
y = 8,6088x3,0166
Regresión Hiperbólica.-
Y= 1 .
a + bX
∑ Y = aN + b ∑X
19
Estadística General Lic. MBA Juan Luis Guzmán H.
∑ V = AN + b ∑X
∑XV = A∑X + b∑X2
Y X
0,50 0,02
0,40 0,04
0,40 0,06
0,33 0,08
0,25 0,10
0,20 0,12
2,08 0,42
Y X V = 1/Y X2 XV
0,50 0,02 2,0000 0,0004 0,0400
0,40 0,04 2,5000 0,0016 0,1000
0,40 0,06 2,5000 0,0036 0,1500
0,33 0,08 3,0303 0,0064 0,2424
0,25 0,10 4,0000 0,0100 0,4000
0,20 0,12 5,0000 0,0144 0,6000
2,08 0,42 19,0303 0,0364 1,5324
19,0303 = a6 + b0,42
1,5324 = a0,42 + b0,034
a = 1,1689
b = 28,6113
20
Estadística General Lic. MBA Juan Luis Guzmán H.
V = a + bX Ecuación de la recta
V = 1,1689 + 28,6113X
Luego: si V = 1 / Y
1 / Y = 1,1689 + 28,6113X
Y= 1 .
1,1689 + 28,6113X
REGRESION HIPERBÓLICA
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0,00 0,02 0,04 0,06 0,08 0,10 0,12 0,14
CORRELACIÓN
Se entiende que existe correlación entre dos variables, cuando es evidente que
al variar una de ellas, también se produce una variación de la otra.
Cuando la relación entre dos variables se la representa por una recta se llama
correlación lineal. Si la relación se la representa por una curva cualquiera (No
una recta), se tiene la correlación no lineal.
21
Estadística General Lic. MBA Juan Luis Guzmán H.
COEFICIENTE DE ESTIMACIÓN.-
Con este coeficiente podemos advertir que valores más altos, significan una
mayor lejanía de los puntos de regresión respecto a la recta.
X Y Z
2 40 35
4 80 85
6 75 75
8 135 140
10 120 115
30 450 450
22
Estadística General Lic. MBA Juan Luis Guzmán H.
Y = 25,5 + 10,75X
Z = 25,5 + 10,75X
(Z - (Z -
X Y Z Yest (Y - Yest) (Y - Yest)2 Zest Zest) Zest)2
2 40 35 47,0 -7,00 49,00 47 -12 144,00
4 80 85 68,5 11,50 132,25 69 17 272,25
6 75 75 90,0 -15,00 225,00 90 -15 225,00
8 135 140 111,5 23,50 552,25 112 29 812,25
10 120 115 133,0 -13,00 169,00 133 -18 324,00
30 450 450 450,0 0,00 1.127,50 450 0 1.777,50
Sus gráficas:
150 150
100 100
Y
50 50
0 0
0 5 10 15 0 + 25,5
y = 10,75x 5 10 15
X X
y = 10,75x + 25,5
S YX = 19,39
S YX = 24,34
Lo que significa que los datos de Z respecto de X tienen mayor lejanía que los
puntos de regresión de Y respecto a la recta.
23
Estadística General Lic. MBA Juan Luis Guzmán H.
Tipos de correlación.-
CORRELACIÓN NEGATIVA PERFECTA
10
9
8
7
6
5
Y 4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
10
9
8
7
6
5
Y 4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
24
Lic. MBA Juan Luis Guzmán H. - ESTADÍSTICA I - 25 -
AUSENCIA DE CORRELACIÓN
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
- 25 -
Lic. MBA Juan Luis Guzmán H. - ESTADÍSTICA I - 26 -
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
9999
COEFICIENTE DE CORRELACIÓN.-
- 26 -
Lic. MBA Juan Luis Guzmán H. - ESTADÍSTICA I - 27 -
-1 -0,7 0 0,7 1
Correlación Correlación
Alta Alta
Negativa Correlación baja Positiva
- 27 -
Lic. MBA Juan Luis Guzmán H. - ESTADÍSTICA I - 28 -
X Y
14 140
16 160
18 170
20 175
22 175
90 820
COVxy = (∑ (X – X) (Y – Y))
N
- 28 -