Professional Documents
Culture Documents
y
j
-1 0 1 f
j
f
j
y
j
f
j
y
j
2
x
i
y
j
1,675
1,65-1,70
1,725
1,70-1,75
1775
1,75-1,80
-1 72,5 70-75 1 1 -1 1
0 77,5 75-80 2 2 4 0 0
1 82,5 80-85 1 1 3 5 5 5
f
i
4 3 3 10 4 6
f
i
x
i
-4 0 3 -1
f
i
x
i
2
4 0 3 7
1- Coeficiente de correlacin
2- Recta de regresin de y sobre x
Luego
3- Recta de regresin de x sobre y
Luego
15. Elegidos 50 matrimonios al azar y preguntada la edad de ambos al contraer
matrimonio, se obtuvo la siguiente tabla bidimensional:
x
i
y
j
15-20 20-25 25-30 30-35 35-40
15-18 3 2 3
18-21 4 2 2
21-24 7 10 6 1
24-27 2 5 3
x = Edad del marido. y = Edad de la esposa.
Calcular:
1- Recta de regresin de y sobre x.
2- Recta de regresin de x sobre y.
SOLUCIN:
Construimos la siguiente tabla:
x
i
y
j
-2 -1 0 1 2 f
j
f
j
y
j
f
j
y
j
2
x
i
y
j
17,5
15-20
22,5
20-25
27,5
25-30
32,5
30-35
37,5
35-40
-1 16,5 15-18 3 2 3 8 -24 72
0 19,5 18-21 4 2 2 8 -8 8
1 22,5 21-24 7 10 6 1 24 24 24
3 22,5 24-27 2 5 3 10 30 90
f
i
3 13 17 13 4 50 22 194
f
i
x
i
-6 -13 0 13 8 2
f
i
x
i
2
12 13 0 13 16 54
Hemos efectuado el cambio de variable
Resulta:
Coeficiente de regresin de y sobre x
Recta de regresin de y sobre x
Coeficiente de regresin de x sobre y
Recta de regresin de x sobre y
16. Se han estudiado los pesos en kg y las tallas en cm de 70 individuos
obtenindose los datos de la tabla siguiente:
PESOS/TALLAS 159-161 161-163 163-165 165-167 167-169 169-171
48 3 2 2 1 0 0
51 2 3 4 2 2 1
54 1 3 6 8 5 1
57 0 0 1 2 8 3
60 0 0 0 2 4 4
1. Hallar el peso medio y la talla media as como el error cometido al resumir pesos y tallas
por sus valores medios Que media es mejor?
2. Hallar la distribucin segn las tallas de los individuos que pesan 54 kg y la
distribucin segn los pesos de los individuos que miden entre 161 cm y 167 cm. Hallar
media y varianza de las dos distribuciones condicionadas.
SOLUCIN:
Si llamamos X a la variable pesos e Y a la variable tallas, los datos pueden arreglarse en una
tabla de doble entrada como sigue para realizar los clculos:
X/Y 160 162 164 166 168 170 Ni. Ni.xi Ni.xi
2
48 3 2 2 1 0 0 8 384 18432
51 2 3 4 2 2 1 14 714 36414
54 1 3 6 8 5 1 24 1296 69984
57 0 0 1 2 8 3 14 798 45486
60 0 0 0 2 4 4 10 600 36000
n.,j 6 8 13 15 19 9 70 3792 206316
n.j yj 960 1296 2132 2490 3192 1530 11600
n.j yj
2
153600 209952 349648 413340 536256 260100 1922896
Para hallar el peso medio y la talla media se calcularn las medias de las distribuciones
marginales de X e Y respectivamente. Asimismo para cuantificar el error cometido al resumir
pesos y tallas por sus valores medios se cuantificarn los coeficientes de variacin de pearson
para ambas marginales. Las distribuciones marginales de X e Y son las siguientes:
X ni. Y n.j
48 8 160 6
51 14 162 8
54 24 164 13
57 14 166 15
60 10 168 19
170 9
Tenemos lo siguiente:
17 , 54
70
3792 1
5
1
= = =
= i
ni
N
X
71 , 165
70
11600 1
6
1
= = =
=
j
j
j
x n
N
Y
98 , 12 17 , 54
70
206316 1
2 2
5
1
2 2
= = =
=
X x n
N
i
i i x
13 , 10 71 , 165
70
1922896 1
2 2
6
1
2 2
= = =
=
Y y n
N
j
j j y
% 65 , 6 0665 , 0
17 , 54
98 , 12
= = =
X
V
x
x
% 92 , 1 0192 , 0
71 , 165
13 , 10
= = =
Y
V
y
y
Se observa que el menor coeficiente de variacin es el relativo a la talla media, que
resulta ser as un promedio ms adecuado.
La distribucin segn las tallas de los individuos que pesan 54 kg es la distribucin de
Y condicionada a X=54, y la distribucin segn los pesos de los individuos que miden entre 161
cm y 167 cm es la distribucin de X condicionada a Y=162,164, 166.
X/Y=162, 164,
166 n i/j=2, 3, 4 Y/X=54 n j/i=3
48 5 160 1
51 9 162 3
54 17 164 6
57 3 166 8
60 2 168 5
170 1
La media y la varianza de cada una de estas dos distribuciones condicionadas se calcula de la
misma forma que para cualquier distribucin de frecuencias.
53
36
1908 1
/
5
1
4 , 3 , 2 / 166 , 164 , 162
= = =
=
= = i
i
j i Y
x n
N
X
33 , 165
24
3968 1
/
6
1
3 / 54
= = =
=
= = j
j
i j X
y n
N
Y
9 53
36
101448
53
1
2
5
1
2 2
4 , 3 , 2 /
2
166 , 164 , 162 /
= = =
=
= =
i
j i y x
i
x n
N
55 , 5 33 , 165
24
656176
33 , 165
1
2
6
1
2 2
3 /
2
54 /
= = =
=
= =
j
j
i j x y
i
y n
N
17. Se considera la variable bidimensional (X, Y) cuya distribucin de frecuencias se
presenta en la tabla siguiente:
X/Y 15 24 27 30
12 3 4 2 5
15 6 8 4 10
19 9 12 6 15
1. Estudiar si las dos variables son independientes utilizando la distribucin conjunta
y las marginales.
2. Estudiar si las dos variables son independientes utilizando las distribuciones
marginales y las condicionadas.
3. Hallar la covarianza de X e Y.
SOLUCIN:
Para estudiar la independencia de las dos variables utilizando la distribucin conjunta y las
marginales tenemos que comprobar quefij=fi.f.j \/ i,j.
La primera tarea ser construir una tabla con la distribucin conjunta (fij=nij/N) y con
las marginales (fi.=ni./N y f .j=n.j/N).
X/Y 15 24 27 30 ni.
12 3 4 2 5 14
15 6 8 4 10 28
19 9 12 6 15 42
n.j 18 24 12 30 84
fij fi.
0,03571429 0,0476191 0,02380952 0,05952381 0,1666667
0,07142857 0,0952381 0,04761905 0,11904762 0,3333333
0,10714286 0,1428571 0,07142857 0,17857143 0,5
f.j 0,21428571 0,2857143 0,14285714 0,35714286 1
Ya estamos en condiciones de probar que . , j i f f f
j i ij
= Para ello ordenaremos los
clculos
j i
f f como se indica a continuacin:
0,21428*0,16666 0,28571*0,16666 0,14285714*0,16666 0,37142*0,16666
0,21428*0,33333 0,28571*0,33333 0,14285714*0,33333 0,37142*0,33333
0,21428*0,5 0,28571*0,5 0,14285714*0,5 0,37142*0,5
Observamos que, una vez realizados estos clculos, se obtiene la tabla de la distribucin
conjunta fij.
fij 0,035714286 0,04761905 0,02380952 0,05952381
0,071428571 0,0952381 0,04761905 0,11904762
0,107142857 0,14285714 0,07142857 0,17857143
0,214285714 0,28571429 0,14285714 0,35714286
Para estudiar la independencia de las dos variables utilizando las distribuciones marginales
y las condicionadas tenemos que comprobar que . ,
/
j i f f
j j i
=
Observamos que se cumple fj/i \/ i,j ya que:
84 / 18 42 / 9 28 / 6 14 / 3 = = =
84 / 24 42 / 12 28 / 8 14 / 4 = = =
84 / 12 42 / 6 28 / 4 14 / 2 = = =
84 / 30 42 / 15 28 / 10 14 / 5 = = =
Para estudiar la independencia de las dos variables utilizando las distribuciones marginales
y la condicionadas tambin podramos comprobar que fi/j=fi. \/ i,j.
fi/j=1 fi/j=2 fi/j=3 fi/j=4 f.j
3/18 4/24 2/12 5/30 14/84
6/18 8/24 4/12 10/30 28/84
9/18 12/24 6/12 15/30 42/84
nj. 18 24 12 30 84
Observamos que se cumple fi/j=fi. \/ i,j ya que:
84 / 14 30 / 5 12 / 2 24 / 4 18 / 3 = = = =
84 / 24 30 / 10 12 / 4 24 / 8 18 / 6 = = = =
84 / 42 30 / 15 12 / 6 24 / 12 18 / 9 = = = =
fi/j=1 fi/j=2 fi/j=3 fi/j=4 nj.
fj/i=1 3/14 4/14 2/14 5/14 14
fj/i=2 6/28 8/28 4/28 10/28 28
fj/i=3 9/42 12/42 6/42 15/42 42
f.j 18/84 24/84 12/84 30/84 84
La covarianza entre X e Y viene dada por la expresin:
ij j
h
i
k
j
i xy
n y y x x
N
) )( (
1
1 1
=
= =
Luego para su clculo necesitamos las medias de las dos marginales X e Y, que se
calcularn con los datos de la tabla:
X/Y 15 24 27 30 nj.
12 3 4 2 5 14
15 6 8 4 10 28
19 9 12 6 15 42
n.j 18 24 12 30 84
5 , 16
84
1386 1
3
1
= = =
= i
i i
x n
N
X
64 , 24
84
2070 1
4
1
= = =
= j
j j
x n
N
Y
La covarianza, que ser cero debido a la independencia, puede calcularse como sigue
La covarianza tambin puede calcularse de la forma siguiente
0 64 , 24 5 , 16
84
34155 1
,
11
= = = =
Y X n y x
N
m
j i
ij j i XY
34155
,
=
j i
ij j i
n y x
X/Y 15 24 27 30 ni. xiyin1j xiz2n2j xiz3n3j xiz4n4j xizinij
0 ) 6 , 24 30 ( 5 , 16 19 ( ) 6 , 24 27 )( 5 , 16 19 ( ) 6 , 24 24 )( 5 , 16 19 ( ) 6 , 24 15 )( 5 , 16 19 (
) 6 , 24 30 )( 5 , 16 15 ( ) 6 , 24 27 )( 5 , 16 15 ( ) 6 , 24 24 )( 5 , 16 15 ( ) 6 , 24 15 )( 5 , 16 15 (
) 6 , 24 30 )( 5 , 16 12 ( ) 6 , 24 27 )( 5 , 16 12 ( ) 6 , 24 24 )( 5 , 16 12 ( ) 6 , 24 15 )( 5 , 16 12 [(
1
= + + + +
+ + + +
+ + + + =
N
xy
Ahora intentaremos ajustar los das de baja en funcin de la edad de los trabajadores mediante
un modelo de regresin exponencial de ecuacin y=ab
x
99 , 0
) 96 , 171 (
184 , 2243
3
3
03
01
= = =
Y
m
g
=
Los parmetros finales buscados a y b del modelo exponencial se estimarn mediante:
04 , 10 10
6013 , 0
= = a
99 , 3 10
01782 , 0
= = b
El modelo estimado tiene la ecuacin
3
) 04 , 1 ( 99 , 3 = y
Para medir la calidad de este ajuste podemos utilizar el coeficiente de determinacin R que se
calcula como:
26 , 0
96 , 171
14 , 126
1
)) ) 04 , 1 ( 99 , 3 ( (
1 1
2
3
1
3
1
2
2
2
2
= =
= =
= =
y
i j
ij
x
i
Y
e
n y
R
i
El ajuste no es de calidad porque R esta ms cerca del cero que de la unidad. El ajuste por
regresin lineal de la forma y= a+bx siendo:
854 , 0
66 , 60
80 , 19 * 20 , 34 72860
100
1
1
2
,
2
=
= =
x
j i
ij j i
x
xy
Y X n y x
N
b
4 , 9 20 , 34 * 854 , 0 8 , 19 = = = X b Y a
El coeficiente de determinacin ser en este caso el cuadrado del coeficiente de correlacin que
se calcula como sigue:
2536 , 0
96 , 171 * 66 , 60
80 , 19 * 20 , 34 728960
100
1
)
1
(
2
2 2
,
2
2 2
2
2
=
= =
Y X
j i
ij j i
Y X
XY
Y X n y x
N
r
Para realizar el calculo de 72860
,
=
j i
ij j i
n y x se utiliza la siguiente tabla:
X/Y 10 30 50
i
n
ij j i
n y x
2 2 2 ij j i
n y x
3 3 3 ij j i
n y x
ij j i
n y x
Se observa que la calidad del ajuste es buena por que el coeficiente de determinacin es alto (el
coeficiente de correlacin vale 851 , 0 72421527 , 0 = que es un valor elevado indicativo de
alto grado de relacin entre el ahorro y la renta de las familias.
20. La inversin K y el producto interior bruto y se relacionan mediante la expresin
c
ak y = . Se pide ajustar una funcin Cobb-Douglas a los datos siguientes:
i
y
2,6 2,9 3,4 4,1 5,1 6,0 7,2 9,2 11,2 13,1 15,2 17,3 19,9
i
K
0,6 0,6 0,8 1,0 1,3 1,4 1,6 1,9 2,2 2,5 2,9 3,5 3,9
SOLUCIN:
Se trata de un ajuste tipo potencial. Todo este tipo de ajustes se resuelve aplicando logaritmos
para linea rizar de la siguiente forma:
cx A Z K Log c a Log y Log aK y
X A Z
c
+ = + = =
43 42 1 3 2 1 3 2 1
) ( ) ( ) (
11,2137= 13 A + 2,54022 c
3,18349 = 2,54022 A + 1,3963c
A=0,6471
C=1,1
Luego el modelo de Cobb-Douglas ajustado ser:
1 , 1
4 , 4 k y =
Para medir la calidad del ajuste potencial medimos la del ajuste lineal al que es equivalente
utilizando el coeficiente de correlacin o su cuadrado el coeficiente de determinacin se calcula:
98 , 0
0851 , 0 * 0692 , 0
763 , 0
2
2 2
2
2
= = =
Z x
xZ
r
Se observa que la calidad del ajuste lineal es buena por que el coeficiente de determinacin es
alto( el coeficiente de correlacin vale 994 , 0 98 , 0 = , que es un valor elevado indicativo del
alto grado de relacin entre Z y Xi.
21. La siguiente tabla muestra el nmero de grmenes patgenos por centmetro cbico de
un determinado cultivo segn el tiempo transcurrido:
N de Horas 0 1 2 3 4 5
N de grmenes 20 26 33 41 47 53
a) Calclala recta de regresin para predecir el numero de grmenes por cm
3
en
funcin del tiempo.
b) Qu cantidad de grmenes por cm
3
es predecible encontrar cuando hayan
transcurrido 6 horas? Es buena esa prediccin?
SOLUCIN:
a) , donde: nmero de horas, nmero de grmenes
b)
Es una buena prediccin, puesto que (y 6 est cercano al intervalo de
valores considerado
22. En un depsito cilndrico, la altura del agua que contiene varia conforme pasa el
tiempo segn esta tabla:
Tiempo (h) 8 22 27 33 50
Altura (m) 17 14 12 11 6
a) Halla el coeficiente de correlacin lineal entre el tiempo y la altura e interprtalo.
r=-0,997. Hay una relacin muy fuerte entre las dos variable, y negativa. A medida que
pasa el tiempo la altura va bajando (se va consumiendo el agua)
b) Cual ser la altura del agua cuando hayan transcurrido 40 horas?
c) Cuando la altura del agua es de 2m, suena una alarmaQu tiempo ha de pasar
para que avise la alarma?
SOLUCIN:
a) . Hay una relacin muy fuerte entre dos variables, y negativa. A medida que
pasa el tiempo, la altura va bajando (se va consumiendo el agua).
b) La recta de regresin es , donde , .
c)
23. En una cofrada de pescadores las capturas registradas de cierta variedad de
pescados, en kilogramos y el precio de subasta en lonja, en euros/kg, fueron los
siguientes:
X(kg) 2000 2400 2500 3000 2900 2800 3160
Y(euros/kg) 1,80 1,68 1,65 1,32 1,44 1,50 1,20
a) Cual es el precio medio registrado?
b) Halla el coeficiente de correlacin lineal e interprtalo.
c) Estima el precio que alcanzara en la lonja el kilote esa especie si se pescasen
2600kg
SOLUCIN:
a)
b) . La relacin entre las variables es fuerte y negativa. A mayor cantidad de
pescado, menos es el precio por kilo.
c) La recta de regresin es
24. Las calificaciones de 40 alumnos obtenidas en el examen parcial (x) y en el examen
final (Y) de una asignatura han sido las siguientes:
X Y X Y X Y X Y
4 3 8 9 8 7 2 0
5 8 0 3 9 6 5 3
1 3 2 3 9 10 4 6
6 3 10 10 8 7 7 5
1 0 4 8 5 3 6 7
2 1 8 7 3 2 15 7
2 0 2 0 4 1 6 4
4 2 6 3 3 2 3 0
5 6 6 6 0 0 9 8
6 5 5 3 2 1 0 10
Formar la tabla estadstica de doble entrada.
SOLUCIN:
Tomando en filas los valores de x y en columnas los valores de y podremos hacer:
Y
X 0 1 2 3 4 5 6 7 8 9 10
0 I 1 I 1 III 3 I 1
1 II 2 I 1
2 II 2 I 1
3 I 1 I 1 I 1 I 1 III 3
II
2
4 I 1
5 I 1 I 1
6 I 1 I 1 I 1 I 1
7 I 1 I 1 III 3
8 I 1 I 1 I 1
9 I 1
10 I 1 I 1 I 1
25. Las alturas (x) y los pesos (y) de 20 hombres son los siguientes:
X Y X Y
1.72 63 1.76 71
1.70 75 1.70 70
1.70 68 1.69 66
1.68 70 1.66 60
1.75 74 1.78 74
1.69 72 1.74 69
1.71 67 1.70 65
1.69 69 1.69 71
1.67 70 1.71 73
1.74 84 1.78 69
Establecer la distribucin correspondiente y hallar las medias aritmticas y las
desviaciones estndar marginales.
SOLUCIN:
La distribucin de frecuencias ser la siguiente:
Y
X 60-65 65-70 70-75 75-80 80-85 TOTAL
1.65-1.70 I 1 II 2 IIII 4 7
1.70-1.75 I 1 IIII 4 I 1 I 1 I 1 9
1.75-1.80 I 1 III 3 4
TOTAL 2 7 9 1 1 20
Con las tablas de clculo correspondiente a las distribuciones marginales podremos calcular las
medias y las desviaciones estndar pedidas:
Distribucin marginal de Y:
L
i-1
-L
i
n
i
y
i
n
i
y
i
y
i
2
n
i
1,65-1,70 7 1,675 11,725 19,639
1,70-1,75 9 1,725 15,525 26,781
1,75-1,80 4 1,775 7,100 12,603
TOTAL 20 34,350 59,023
Y = 34,350/20 = 1,7175
S
y
2
= 59,023/20-(34,350/20)
2
= 0,0013
S
y
= 0,037.
Distribucin marginal de X:
L
i-1
-L
i
n
i
y
i
n
i
y
i
y
i
2
n
i
60-65 2 62.5 125._ 7812.50
65-70 7 67.5 472.5 31893.75
70-75 9 72.5 652.5 47306.25
75-80 1 77.5 77.5 6006.25
80-85 1 82.5 82.5 6806.25
TOTAL 20 1410._ 99825._
X = 1410/20 = 70.50
S
x
2
= 99825/20 (1410/20)
2
= 21._
S
x
= 4,58
26. Representar el diagrama de dispersin correspondiente a las notas de 25 alumnos en
Fsica y Matemticas, siendo stas:
F M F M F M
7 6 5 4 5 3
6 6 9 10 4 6
3 5 10 8 4 7
4 6 4 5 8 9
6 5 6 4 9 7
3 4 9 8
5 3 6 5
8 9 7 6
5 4 4 3
9 10 8 7
SOLUCIN:
Tomando las notas de Fsica en abscisas y las de Matemticas en ordenadas, tendremos la
siguiente nube de puntos o diagrama de dispersin:
0
2
4
6
8
10
12
0 2 4 6 8 10 12
F
M
27. Sea una distribucin bidimensional en donde Syx = 4.1, Sy^2 = 9 y el coeficiente de
regresin de la recta de Y/X es b = -1,1.
Determnese:
a) Las dos rectas de regresin de Y/X y X/Y, sabiendo que x = 2, y = 5.
b) El coeficiente de correlacin lineal.
SOLUCIN:
a) Los coeficientes de regresin de las seran
Y/X b = -1,1 X/Y b' = Sxy/Sy^2 = 4,1/9 = 0,46
lo cual es imposible, ya que los dos coeficientes de regresin deben ser del mismo signo, puesto
que, como
b = Sxy/Sx^2 b' = Sxy/Sy^2
y las varianzas son no negativas, entonces el signo de b y b' debe ser el mismo que la covarianza
Sxy.
Como en este caso Sxy = 4,1 > 0, no puede ser b = -1,1, resultado que necesariamente debe
estar equivocado.
Aceptando como verdadero valor Sxy = 4,1, lo nico que podemos determinar es la recta de
regresin de X sobre Y
X/Y x*-x = Sxy/Sy^2(y-y) x*-2 = 4,1/9(y-5) x* = -0,3+0,46y.
b) Por los mismos motivos que antes no se puede determinar r, ya que, como
r = Sxy/SxSy b = -1,1 = 4,1/Sx^2 Sx^2 = 4,1/-1,1<0
lo cual no puede ser.
Este coeficiente r debe tener tambin el mismo signo que Sxy, b y b'.
28. Estdiese en cules de los casos que a continuacin se relacionan los resultados que se
ofrecen son compatibles entre si:
a) rxy = -0,3 y* = 4x+5.
b) Sxy = 100 Sx = 5 Sy^2 = 400 Se^2= 0.
c) y = 5x+8 y = 1/5x+9 rxy = 0,2.
d) y* = 1/2x+4 x* = y+4 x = 16 y = 12.
SOLUCIN:
a) Como el coeficiente de regresin de la recta b = 4 es positivo, no puede ser el coeficiente de
correlacin lineal negativo.
b) El coeficiente de correlacin lineal es
r = Sxy/SxSy = 100/5*20 = 1
que tambin puede expresarse como
r = sqrt(1-Se^2/Sy^2) = sqrt(1-0/400) = 1
en donde Se^2 es la varianza de los residuos o de los errores.
Por tanto, estos resultados s son consistentes.
c) En este caso existen dos posibilidades:
Caso 1. Que las rectas sean
Y/X y* = 5x+8 X/Y x* = 5y-45
con lo que el coeficiente de correlacin lineal sera
r = sqrt(b*b') = sqrt(5*5) = 5>1
que es mayor que la unidad, lo cual es imposible.
Caso 2. Que las rectas sean
Y/X y* = 1/5x+9 X/Y x* = 1/5y-8/5
y, por tanto
r = sqrt(b*b') = sqrt(1/5*1/5) = 1/5 = 0,2
lo que concuerda con lo sealado en el enunciado.
d) Sabemos que el punto de corte entre las dos rectas de regresin debe ser (x,y); para
comprobar que en este caso se verifica esta propiedad resolveremos el sistema de ecuaciones
formado por estas dos ecuaciones
y = 1/2x+4 2y-x = 8
x = y+4 -y+x = 4
de donde
y = 12 = y
x = 4+y = 4+12 = 16 = x
que son precisamente los dos valores medios que nos ofrecen.
29. Dada la distribucin bidimensional
xi 10 20 30 40 50
yj 200 180 150 120 100
a) Ajstese una recta por el procedimiento de los mnimos cuadrados.
b) Calclese el coeficiente de correlacin lineal y explquese su significado
SOLUCIN:
a) Formemos la siguiente tabla:
xi 10 20 30 40 50 = 150
yj 200 180 150 120 100 = 750
xi^2 100 400 900 1600 2500 = 5500
yj^2 40000 32400 22500 14400 10000 = 119300
xiyj 2000 3600 4500 4800 5000 = 19900
La recta de regresin de Y sobre X, ajustada por mnimos cuadrados, es
y* = a+bx
siendo
b = Sxy/Sx^2 a = y-bx
Determinemos las medias, varianzas y covarianzas
x = Exi/N = 150/5 = 30 y = Eyj/N = 750/5 = 150
Sx^2 = a20- a10^2 a10 = x = 30 a20 = Exi^2/N = 5500/5 = 1100
Sx^2 = 1100-30^2 = 200
Sy^2 = a02- a01^2 a01 = y = 150 a02 = Eyj^2/N = 119300/5 = 23860
Sy^2 = 23860-150^2 = 1360
Sxy = a11- a10*a01 a11 = Eexiyj/N = 19900/5 = 3980
Sxy = 3980-30*150 = -520.
Por tanto,
b = Sxy/Sx^2 = -520/200 = -2,6 a = y-bx = 150-(-2,6)*30 = 228.
De donde la recta ajustada es
y = 228-2,6.
b) El coeficiente de correlacin lineal es
r = Sxy/SxSy = -520/sqrt200*sqrt1360 = -0,99.
Como el coeficiente de correlacin es negativo, nos indica que la asociacin es de tipo
inverso; al estar muy prximo a -1, podemos decir que el grado de asociacin lineal es muy
fuerte y que, por lo tanto, el poder explicativo de la variable X sobre la variable Y es muy
grande.
30. En un determinado sector, la produccin y las exportaciones durante los ltimos aos
han sido:
Aos 1982 1983 1984 1985 1986
Produccin 400 420 440 480 500
(10^6 Ptas.)
Exportaciones 80 80 90 92 98
(10^6 Ptas.)
a) Si se estima que la produccin en el ejercicio 1988 va a ser de 640 millones de
pesetas y que las condiciones del mercado internacional no van a variar, cul
ser el volumen de expotacin previsible?
b) En qu medida esta prevsin puede ser o no aceptable?
SOLUCIN:
a) No es difcil defender la hiptesis de que el volumen de expotaciones es una variable que
depende de la produccin. Si las exportaciones las representamos por X y la produccin por Y,
la especificacin lineal de esta hiptesis viene dada por
x = a+by
Para estimar por mnimos cuadrados los parametros a y b, formaremos la tabla
xj 80 80 90 92 98 = 440
yi 400 420 440 480 500 = 2240
xj^2 6400 6400 8100 8464 9604 = 38968
yi^2 160000 176400 193600 230400 250000 = 1010400
xjyi 32000 33600 39600 44100 49000 = 198360
Como
x = Exj/N = 440/5 = 88 y = Eyi/N = 2240/5 = 448
Sx^2 = a02-a01^2 a01 = x = 88 a02 = Exj^2/N = 38968/5 = 7793,6
Sx^2 = 7793,6-88^2 = 49,6
Sy^2 = a20-a10^2 a10 = y = 448 a20 = Eyi^2/N = 1010400/5 = 202080
Sy^2 = 202080-448^2 = 1376
a11 = EExjyi/N = 198360/5 = 39672
Sxy = 39672-448*88 = 248
Tendremos que
b = Sxy/Sy^2 = 248/1376 = 0,18 a = x-by = 88-0,18*448 = 7,36
El modelo ajustado es
x = 7,36+0,18y
Se estima que la produccin en 1988 va ser de 640 millones de pesetas y que las condiciones
del mercado internacional no cambian. Esta ltima hiptesis nos faculta para poder seguir
utilizando el modelo lineal ajustado por tanto,
x = 7,36+0,18*640 = 122,56 millones de pesetas.
Las exportaciones se situarn, pues, sobre los 122,56 millones de pesetas.
b) Para estudiar la bondad de la prediccin calcularemos previamente el coeficiente de
correlacin lineal,
r = Sxy/SxSy = 248/sqrt49,6*sqrt1376 = 0,95
Estadsticamente, al ser elevado el grado de asociacin lineal entre las variables, debemos
aceptar como muy posible el resultado.
31. En un determinado estudio mdico se pretende medir la relacin existente entre la
exposicin al ruido y la hipertensin. Los siguientes datos han sido extrados del Jourrnal
of Sound and Vibration:
Y 1 0 1 2 5 1 4 6 2 3 5 4 6 8 4 5
X 60 63 65 70 70 70 80 80 80 80 85 89 90 90 90 90
Y 7 9 7 6
X 94 100 100 100
Donde X representa la presin sonora en dB, e Y el aumento de la presin sangunea en
mmHg.
1) Realizar un diagrama de dispersin de Y frente a X.
2) Realizar el modelo de regresin lineal simple.
SOLUCIN:
1) A partir de los datos experimentales que nos proporcionan, obtenemos el siguiente
grfico de dispersin:
0
2
4
6
8
10
0 20 40 60 80 100 120
Presin sonora
Presin
sanguinea
2) Obtenemos las medidas muestrales:
3 . 4
3 . 82
=
=
y
x
Y las varianzas y covarianza muestral:
( )
=
= =
k
i
i i x
n x x
n
S
1
2 2
432 . 158
1
( )
=
= =
k
i
i i y
n y y
n
S
1
2 2
537 . 6
1
( )( )
= =
i j
ij j i xy
n y y x x
n
S 168 . 27
1
Por lo que la ecuacin de la recta de regresin es:
( )
813 . 9 171 . 0
2
=
=
x y
x x
S
S
y y
x
xy
32. Sea (X,Y) una variable aleatoria bidimensional con funcin de densidad conjunta
( ) xy y x f = , si 1 0 x , 1 0 y
Obtenga la recta de regresin de Y sobre X.
SOLUCIN:
Las correspondientes funciones de densidad marginales son:
( ) ( )
2
,
1
0
1
0
x
y xy y y x f x fX = = =
( ) ( )
2
,
1
0
1
0
y
x xy x y x f y fY = = =
Se obtiene entonces:
[ ] ( ) [ ]
01
1
0
10
6
1
= = = = =
Y E x x xfX X E
[ ] ( ) [ ]
= = =
1
0
2 2 2
8
1
Y E x x fX x X E
y por lo tanto:
( ) ( ) [ ]
72
7
2 2 2
20
= = = X E X E
x
Adems: [ ] ( )
= = =
1
0
1
0
11
9
1
, x y y x xyf XY E
36
1
9
1
6
1
6
1
9
1
01 10 11 11
= = = = Cov
La recta de regresin de Y sobre X es, por lo tanto:
( )
10
20
11
01
= x y
=
6
1
72
7
36
1
9
1
6
1
x y
es decir:
=
6
1
7
6
6
1
x y
33. Sea la variable aleatoria bidimensional (X,Y) que asigna probabilidades iguales
a los puntos: (1,1); (2,3); (3,2); (4,4); obtener la recta de regresin mnimo cuadrtica de Y
sobre X.
SOLUCIN:
Recta de regresin de Y sobre X:
( )
10
20
11
01
= x y
[ ] ( ) 5 . 2
4
10
4
1
4
4
1
3
4
1
2
4
1
1
4
1
10
= = + + + = = = =
=
i
i
i
x X P x X E
[ ] ( ) 5 . 2
4
1
01
= = = =
=
j
j
j
y Y P y Y E
[ ] ( ) ( )
4
30
4 3 2 1
4
1
2 2 2 2
4
1
2 2
= + + + = = =
= i
i i
x X P x X E
( ) ( ) [ ] ( ) 25 . 1 5 . 2
4
30
2 2 2 2
20
= = = = X E X E
x
[ ] ( )
= =
= = + + + = = = = =
4
1
4
1
11
25 . 7
4
29
4
1
4 4
4
1
2 3
4
1
3 2
4
1
1 1 ,
i j
j i j i
y Y x X P y x XY E
1 5 . 2 5 . 2 75 . 7
01 10 11 11
= = = = Cov
La recta de regresin de Y sobre X es:
( )
5 . 0 8 . 0
5 . 2
25 . 1
1
5 . 2
+ =
=
x y
x y
34. Las notas obtenidas por 10 alumnos en matemticas y msica son:
Alum. 1 2 3 4 5 6 7 8 9 10
Mat. 6 4 8 5 3.5 7 5 10 5 4
Ms. 6.5 4.5 7 5 4 8 7 10 6 5
Calcular la covarianza, correlacin y rectas de regresin.
SOLUCIN:
Indiquemos por X la nota de matemticas y por Y la nota de msica.
Medias: 75 . 5
1
= =
i
x
n
x
3 . 6
1
= =
i
y
n
y
Covarianza: 075 . 3
1
= =
y x y x
n
S
i i xy
Varianzas:
763 . 3
1
2 2 2
= =
x x
n
S
i x
96 . 2
1
2 2 2
= =
y y
n
S
i y
Coef. de correlacin: 9214 . 0
96 . 2 763 . 3
075 . 3
= = =
y x
xy
S S
S
r
Coef. de regresin:
817 . 0
2
21
= =
x
xy
S
S
b
039 . 1
2
12
= =
y
xy
S
S
b
Recta de regresin de Y sobre X: ( ) x x b y y =
21
( ) 75 . 5 817 . 0 3 . 6 = x y
Recta de regresin de X sobre Y: ( ) x x b y y =
12
( ) 3 . 6 039 . 1 75 . 5 = y x
35. Para realizar un estudio sobre la utilizacin de una impresora en un determinado
departamento, se midi en un da los minutos transcurridos entre las sucesivas
utilizaciones (X) y el nmero de pginas impresas (Y) obtenindose los siguientes
resultados:
X 9 9 4 6 8 9 7 6 9 9 9 8 8 9 8 9 9 9 10 9 15 10 12 12 10 10 12 10 10 12 12 10
Y 3 8 3 8 3 8 8 8 3 8 12 12 8 8 8 12 12 20 8 20 8 8 20 8 8 12 8 20 20 3 3 20
a) Escribir la distribucin de frecuencias conjunta. Cul es el porcentaje de veces
que transcurre ms de nueve minutos desde la anterior utilizacin y se imprimen
menos de 12 pginas? Cuntas veces se imprimen menos de 12 pginas y
transcurren 9 minutos desde la anterior utilizacin?
b) Frecuencias marginales. Cuantas veces se imprimen como mucho 12 pginas?
Cuntas pginas como mucho se imprimen en el 80 % de las ocasiones?
c) Dibujar el diagrama de dispersin.
SOLUCIN:
a) Escribir la distribucin de frecuencias conjunta. Cul es el porcentaje de veces
que transcurre ms de nueve minutos desde la anterior utilizacin y se imprimen
menos de 12 pginas? Cuntas veces se imprimen menos de 12 pginas y
transcurren 9 minutos desde la anterior utilizacin?
x
i
\y
j
3 8 12 20 n
i.
f
i.
4 1/0,03 - - - 1 0,03
6 - 2/0,06 - - 2 0,06
7 - 1/0,03 - - 1 0,03
8 1/0,03 2/0,06 1/0,03 - 4 0,12
9 2/0,06 4/0,12 3/0,09 2/0,06 11 0,34
10 - 3/0,09 1/0,03 3/0,09 7 0,22
12 2/0,06 2/0,06 - 1/0,03 5 0,16
15 - 1/0,03 - - 1 0,03
n
.j
6 15 5 6 32 -
f
.j
0,19 0,47 0,16 0,19 - 1
Ms de 9 min. 13 Menos de 12 Pg. 8 % 25 25 . 0
32
8
=
9 min. 11 Menos de 12 Pg. 6 % 19 19 . 0
32
6
=
b) Frecuencias marginales. Cuantas veces se imprimen como mucho 12 pginas?
Cuntas pginas como mucho se imprimen en el 80 % de las ocasiones?
Y
j
3 8 12 20
n
.j
6 15 5 6 32
f
.j
0,19 0,47 0,16 0,19
N
.j
6 21 26 32
F
.j
0.19 0.66 0.81 1
Como mucho 12 Pg. 6+15+5 = 26
. 12
26 6 . 25
100
80 * 32
21
100
*
80
1
Pg P
N
k n
N
i i
=
=
c) Dibujar el diagrama de dispersin.
y
0
5
10
15
20
25
0 5 10 15 20
Tiempo
N
d
e
P
g
.
i
m
p
r
e
s
a
s
36. Se midi el tiempo en segundos que tardaron en grabarse los mismos 24 ficheros en
cada uno de los dos tipos de discos (3
1/3
y 5
1/4
). Los tiempos observados fueron:
3
1/3
1.2 1 1.1 0.5 1.1 1.5 1 1.4 1.4 1.3 0.4 1.2 0.4 0.3 0.3 1.5 1.4 1.1 1.2 1.2 0.4 0.5 1.3 1.5
5
1/4
1.3 1.1 1.2 0.4 1.2 1.4 1.1 1.6 1.6 1.5 0.4 1.5 0.4 0.3 0.3 1.6 1.3 1.1 1.3 1.1 0.4 0.4 1.4 1.6
a) Construye la tabla de frecuencias conjuntas. Cul es el porcentaje de ficheros que
tardan menos de 1.5 segundos en el primer tipo de disco y ms de 1.4 en el
segundo? Cuntos ficheros tardan en grabarse entre 0.6 y 1.2 segundos en el
primer tipo de disco? Cunto tiempo tarda como mucho en grabarse al menos el
90,5 de los ficheros en el segundo tipo de disco?
b) Hallar la tabla de frecuencias condicionales de los tiempos en el disco de 5
1/4
de
aquellos programas que tardaron 1.2 en el disco de 3
1/3
Cul es la proporcin de
estos programas que tardan en grabarse ms de 1.5 segundos en el de 5
1/4
?
c) Representar grficamente los datos y comentar el grfico obtenido.
d) Si un fichero tarda 0.8 segundos en grabarse en el primer tipo de disco, cuantos
segundos tardar en grabarse en el segundo tipo? Da una medida de fiabilidad.
Confirma esta medida lo comentado en el apartado c?
SOLUCIN:
a) Construye la tabla de frecuencias conjuntas. Cul es el porcentaje de ficheros que
tardan menos de 1.5 segundos en el primer tipo de disco y ms de 1.4 en el
segundo? Cuntos ficheros tardan en grabarse entre 0.6 y 1.2 segundos en el
primer tipo de disco? Cunto tiempo tarda como mucho en grabarse al menos el
90,5 de los ficheros en el segundo tipo de disco?
x
i
\y
j
0,3 0,4 1,1 1,2 1,3 1,4 1,5 1,6 n
i.
f
i.
N
i.
F
i.
0,3 2/0,08 - - - - - - - 2 0,083 2 0,083
0,4 - 3/0,125 - - - - - - 3 0,125 5 0,208
0,5 - 2/0,08 - - - - - - 2 0,083 7 0,292
1 - - 2/0,08 - - - - - 2 0,083 9 0,375
1,1 - - 1/0,04 2/0,08 - - - - 3 0,125 12 0,500
1,2 - - 1/0,04 2/0,08 - - 1/0,04 - 4 0,167 16 0,667
1,3 - - - - - 1/0,04 1/0,04 - 2 0,083 18 0,750
1,4 - - - - 1/0,04 - - 2/0,08 3 0,125 21 0,875
1,5 - - - - - 1/0,04 - 2/0,08 3 0,125 24 1,000
n
.j
2 5 4 4 1 2 2 4 24 -
f
.j
0,083 0,208 0,167 0,167 0,042 0,083 0,083 0,167 - 1
N
.j
2 7 11 15 16 18 20 24
F
.j
0,083 0,292 0,458 0,625 0,667 0,750 0,833 1,000
Menos de 1.5 seg. En x 21 Mas de 1.4 seg. En Y 4
% 17 17 . 0
24
4
=
Entre 0.6 y 1.2 seg. En X % 5 . 37 375 . 0
24
9
=
. 6 . 1
24 72 . 21
100
5 . 90 * 24
20
100
*
5 . 90
1
seg P
N
k n
N
i i
=
=
b) Hallar la tabla de frecuencias condicionales de los tiempos en el disco de 5
1/4
de
aquellos programas que tardaron 1.2 en el disco de 3
1/3
Cul es la proporcin de
estos programas que tardan en grabarse ms de 1.5 segundos en el de 5
1/4
?
Y
j
0,3 0,4 1,1 1,2 1,3 1,4 1,5 1,6
n
.j
0 0 1 2 0 0 1 0 4
f
.j
0 0 0,25 0,5 0 0 0,25 0
N
.j
0 0 1 3 3 3 4 4
F
.j
0 0 0,25 0,75 0,75 0,75 1 1
Mas de 1.5 seg 0 0%
c) Representar grficamente los datos y comentar el grfico obtenido.
0,00
0,20
0,40
0,60
0,80
1,00
1,20
1,40
1,60
1,80
0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60
3 1/3
5
1
/
4
Se puede observar como los puntos describen una lnea recta difusa.
d) Si un fichero tarda 0.8 segundos en grabarse en el primer tipo de disco, cuantos
segundos tardar en grabarse en el segundo tipo? Da una medida de fiabilidad.
Confirma esta medida lo comentado en el apartado c?
( ) x x
S
S
y y
x
xy
= *
2
008 . 1
*
1
= =
=
x
n
n x
x
n
i
i i
97 . 0
*
1
= =
=
y
n
n y
y
n
j
j j
1739 . 0
*
2 2
1
2
2
= =
=
x
n
i
i i
x
Sn x
n
n x
Sn
417 . 0
2
= =
x x
Sn Sn
3895 . 0
*
2 2 1
2
2
= =
=
y
n
j
j j
y
Sn y
n
n y
Sn
624 . 0
2
= =
y y
Sn Sn
1756 . 0 *
* *
1 1
= =
= =
y x
n
y x n
S
n
i
n
j
j i ij
xy
( ) 008 . 1 *
1739 . 0
1756 . 0
97 . 0 = x y 0478 . 0 * 00977 . 1 = x y
Si x = 0.8 y = 0.75996
Medida de fiabilidad
6748 . 0
*
= =
y x
xy
xy
S S
S
r
Es una medida de fiabilidad mala puesto que no llega al 70 %, aunque este cerca.
37. Las siguientes son las calificaciones obtenidas por los 25 alumnos de un grupo de
Bachillerato en las asignaturas de Biologa y Qumica:
B 4 5 5 5 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 9 9 10
Q 3 5 5 6 7 7 7 7 7 7 8 8 8 7 7 8 8 8 8 8 8 8 10 10 10
a) Obtener la tabla de frecuencias conjunta.
b) Qu proporcin de alumnos obtienen ms de un cinco en ambas asignaturas?
Qu proporcin de alumnos obtienen ms de un cinco en Biologa? Qu
proporcin de alumnos obtienen ms de un cinco en Qumicas?
c) Hallar la distribucin de frecuencias condicionales de la calificacin en Biologa de
los estudiantes que obtuvieron un 7 en Qumicas. Qu proporcin de estos
estudiantes obtuvieron notable en Biologa?
d) Representar grficamente. Comentar el resultado.
e) Hallar el coeficiente de correlacin. Comentar el resultado.
SOLUCIN:
a) Obtener la tabla de frecuencias conjunta.
x
i
\y
j
3 5 6 7 8 10 n
i.
f
i.
N
i.
F
i.
4 1/0,04 - - - - - 1 0,040 1 0,040
5 - 2/0,08 1/0,04 - - - 3 0,120 4 0,160
6 - - - 2/0,08 - - 2 0,080 6 0,240
7 - - - 4/0,16 3/0,12 - 7 0,280 13 0,520
8 - - - 2/0,08 4/0,16 - 6 0,240 19 0,760
9 - - - - 3/0,12 2/0,12 5 0,200 24 0,960
10 - - - - - 1/0,04 1 0,040 25 1,000
n
.j
1 2 1 8 10 3 25 -
f
.j
0,040 0,080 0,040 0,320 0,400 0,120 - 1
N
.j
1 3 4 12 22 25
F
.j
0,040 0,120 0,160 0,480 0,880 1,000
b) Qu proporcin de alumnos obtienen ms de un cinco en ambas asignaturas?
Qu proporcin de alumnos obtienen ms de un cinco en Biologa? Qu
proporcin de alumnos obtienen ms de un cinco en Qumicas?
Ms de un 5 en B y en Q % 84 100 *
25
4 25
=
Ms de un 5 en B % 84 100 *
25
4 25
=
Ms de un 5 en Q % 88 100 *
25
3 25
=
c) Hallar la distribucin de frecuencias condicionales de la calificacin en Biologa de
los estudiantes que obtuvieron un 7 en Qumicas. Qu proporcin de estos
estudiantes obtuvieron notable en Biologa?
x
i
Y = 7 n
i.
f
i.
N
i.
F
i.
4 - 0 0,000 0 0,000
5 - 0 0,000 0 0,000
6 2/0,08 2 0,250 2 0,250
7 4/0,16 4 0,500 6 0,750
8 2/0,08 2 0,250 8 1,000
9 - 0 0,000 8 1,000
10 - 0 0,000 8 1,000
8
Notable = 7-8 % 75 100 *
8
6
=
d) Representar grficamente. Comentar el resultado.
0,00
2,00
4,00
6,00
8,00
10,00
12,00
0,00 2,00 4,00 6,00 8,00 10,00 12,00
Biologa
Q
u
m
i
c
a
Se puede observar como a mas nota en biologa se tiende a sacar mas nota en qumica, es una
relacin lineal ascendente.
e) Hallar el coeficiente de correlacin. Comentar el resultado.
32 . 7
*
1
= =
=
x
n
n x
x
n
i
i i
4 . 7
*
1
= =
=
y
n
n y
y
n
j
j j
2176 . 2
*
2 2
1
2
2
= =
=
x
n
i
i i
x
Sn x
n
n x
Sn
489 . 1
2
= =
x x
Sn Sn
32 . 2
*
2 2 1
2
2
= =
=
y
n
j
j j
y
Sn y
n
n y
Sn
523 . 1
2
= =
y y
Sn Sn
992 . 1 *
* *
1 1
= =
= =
y x
n
y x n
S
n
i
n
j
j i ij
xy
878 . 0
*
= =
y x
xy
xy
S S
S
r
Aqu observamos lo que ya se haba comentado al ver el grfico, y es que hay una tendencia
lineal ascendente, por lo que a mayores notas en Biologa, ese mismo alumno, tendr
mayores notas de Qumica.
38. Los siguientes datos corresponden a los tiempos en segundos que tardaron en
ejecutarse seis programas elegidos al azar en el entorno Windows y en DOS:
Programa
Windows 2.5 7.1 5 8.5 7 8.1
DOS 2.3 7.1 4 8 6.6 5
a) Representar grficamente los datos.
b) Si un programa tarda 3 segundos en ejecutarse en Windows, cuanto tardar en
ejecutarse en DOS?
c) Si un programa tarda 6 segundos en ejecutarse en DOS, cuanto tardar en
ejecutarse en Windows?
d) Dar una medida de fiabilidad de los anteriores resultados.
SOLUCIN:
a) Representar grficamente los datos.
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6
Programa
T
i
e
m
p
o
(
s
e
g
)
b) Si un programa tarda 3 segundos en ejecutarse en Windows, cuanto tardar en
ejecutarse en DOS?
Datos de Windows:
2 2
3
6 Re
3 5 . 2 6 50 6
6 5 . 2 5 . 8 Re
= = = =
= = = = =
= =
i
i
i
i
a
C
a
C n m n
Datos de Dos:
2 9 . 1
3
7 . 5 Re
3 5 . 2 6 50 6
7 . 5 3 . 2 8 Re
= = = =
= = = = =
= =
i
i
i
i
a
C
a
C n m n
x
i
\y
j
[2,5-4,5) [4,5-6,5) [6,5-8,5) c
i
n
i.
f
i.
N
i.
F
i.
[2,5-4,5) 1/0,17 - - 3,5 1 0,167 1 0,167
[4,5-6,5) 1/0,17 - - 5,5 1 0,167 2 0,333
[6,5-8,5) - 1/0,17 3/0,5 7,5 4 0,667 6 1,000
c
j
3,5 5,5 7,5
n
.j
2 1 3 6 -
f
.j
0,333 0,167 0,500 - 1
N
.j
2 3 6
F
.j
0,333 0,500 1,000
( ) x x
S
S
y y
x
xy
= *
2
5 . 6
*
1
= =
=
x
n
n c
x
n
i
i i
83 . 5
*
1
= =
=
y
n
n c
y
n
j
j j
33 . 2
*
2 2
1
2
2
= =
=
x
n
i
i i
x
Sn x
n
n c
Sn
527 . 1
2
= =
x x
Sn Sn
26 . 3
*
2 2 1
2
2
= =
=
y
n
j
j j
y
Sn y
n
n c
Sn
8 . 1
2
= =
y y
Sn Sn
355 . 2 *
* *
1 1
= =
= =
y x
n
y x n
S
n
i
n
j
j i ij
xy
( ) 5 . 6 *
33 . 2
355 . 2
83 . 5 = x y 7397 . 0 * 011 . 1 = x y
Si x = 3 y = 2.29 seg
c) Si un programa tarda 6 segundos en ejecutarse en DOS, cuanto tardar en
ejecutarse en Windows?
Si y = 6 x = 6.666 seg
d) Dar una medida de fiabilidad de los anteriores resultados.
8568 . 0
*
= =
y x
xy
xy
S S
S
r
Es una medida de fiabilidad buena puesto que llega al 70 % y lo sobrepasa hasta llegar a un
85.68 %.
39. Un determinado partido poltico, se plantea el problema de hasta que punto le pueden
compensar los gastos de la campaa de propaganda para las futuras elecciones. En las
ltimas elecciones, los gastos de publicidad y el nmero de diputados elegidos han sido:
Gastos publicidad en miles de pesetas Diputados elegidos
1500
1750
3250
4000
5000
3
4
4
6
8
La comisin electoral est estudiando la posibilidad de un presupuesto de propaganda de
diez millones de pesetas.
a) Cul ser el nmero de diputados que seran elegidos de ese partido de acuerdo
con este presupuesto, si la imagen del partido no vara respecto a las elecciones
anteriores?
b) Con qu confianza se puede esperar ese resultado?
c) Cul sera el porcentaje de causas diferentes a la publicidad que influiran en las
elecciones?
SOLUCIN:
a) Cul ser el nmero de diputados que seran elegidos de ese partido de acuerdo
con este presupuesto, si la imagen del partido no vara respecto a las elecciones
anteriores?
x
i
\y
j
3 4 6 8 n
i.
f
i.
N
i.
F
i.
1500 1/0,2 - - - 1 0,200 1 0,200
1750 - 1/0,2 - - 1 0,200 2 0,400
3250 - 1/0,2 - - 1 0,200 3 0,600
4000 - - 1/0,2 - 1 0,200 4 0,800
5000 - - - 1/0,2 1 0,200 5 1,000
n
.j
1 2 1 1 5 -
f
.j
0,200 0,400 0,200 0,200 - 1
N
.j
1 3 4 5
F
.j
0,200 0,600 0,800 1,000
( ) x x
S
S
y y
x
xy
= *
2
3100
*
1
= =
=
x
n
n x
x
n
i
i i
5
*
1
= =
=
y
n
n y
y
n
j
j j
1765000
*
2 2
1
2
2
= =
=
x
n
i
i i
x
Sn x
n
n x
Sn
53 . 1328
2
= =
x x
Sn Sn
2 . 3
*
2 2 1
2
2
= =
=
y
n
j
j j
y
Sn y
n
n y
Sn
789 . 1
2
= =
y y
Sn Sn
2200 *
* *
1 1
= =
= =
y x
n
y x n
S
n
i
n
j
j i ij
xy
( ) 3100 *
1765000
2200
5 = x y 136 . 1 * 10 * 246 . 1
3
+ =
x y
Si x = 10 000 y = 13.596 Diputados
b) Con qu confianza se puede esperar ese resultado?
9256 . 0
*
= =
y x
xy
xy
S S
S
r
92.56 % de confianza
c) Cul sera el porcentaje de causas diferentes a la publicidad que influiran en las
elecciones?
- La cantidad de recursos publicitarios utilizados por otros partidos.
- El nmero mximo de diputados.
40. La resistencia del papel utilizado en la fabricacin de cajas de cartulina (Y) est
relacionado con la concentracin de madera dura en la pulpa original (X). Bajo
condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente de
pulpa y mide la resistencia a la tensin. Los datos obtenidos son los siguientes:
X 1 1.5 1.5 1.5 2 2 2.2 2.4 2.5 2.5 2.8 2.8 3 3 3.2 3.3
Y 101.4 117.4 117.1 106.2 131.9 146.9 146.8 133.9 111 123 125.1 145.1 134.3 144.5 143.7 146.9
a) Representar grficamente los datos y comentar los resultados.
b) Hallar el coeficiente de correlacin.
c) Ajustar un modelo de regresin lineal. Predecir la resistencia de una caja
fabricada con pulpa cuya concentracin es 2.3.
SOLUCIN:
a) Representar grficamente los datos y comentar los resultados.
Datos de X:
6 . 0 575 . 0
4
3 . 2 Re
4 4 16 50 16
3 . 2 1 3 . 3 Re
= = = =
= = = = =
= =
i
i
i
i
a
C
a
C n m n
Datos de Y:
12 375 . 11
4
5 . 45 Re
4 4 16 50 16
5 . 45 4 . 101 9 . 146 Re
= = = =
= = = = =
= =
i
i
i
i
a
C
a
C n m n
x
i
\y
j
[101,4-113,4) [113,4-125,4) [125,4-137,4) [137,4-149,4) c
j
n
i.
f
i.
N
i.
F
i.
[1-1,6) 2/0,125 2/0,125 - - 1,3 4 0,250 4 0,250
[1,6-2,2) - - 1/0,06 1/0,06 1,9 2 0,125 6 0,375
[2,2-2,8) - 2/0,125 1/0,06 1/0,06 2,5 4 0,250 10 0,625
[2,8-3,4) - 1/0,06 1/0,06 4/0,25 3,1 6 0,375 16 1,000
c
j
107,4 119,4 131,4 143,4
n
.j
2 5 3 6 16 -
f
.j
0,125 0,313 0,188 0,375 - 1
N
.j
2 7 10 16
F
.j
0,125 0,438 0,625 1,000
0,00
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
0,00 0,50 1,00 1,50 2,00 2,50 3,00 3,50
Concentracin de madera dura
R
e
s
i
s
t
e
n
c
i
a
Lo que se observa es una variacin muy leve de la resistencia a medida que aumentamos la
concentracin.
b) Hallar el coeficiente de correlacin.
35 . 2
*
1
= =
=
x
n
n c
x
n
i
i i
15 . 129
*
1
= =
=
y
n
n c
y
n
j
j j
5175 . 0
*
2 2
1
2
2
= =
=
x
n
i
i i
x
Sn x
n
n c
Sn
719 . 0
2
= =
x x
Sn Sn
9375 . 165
*
2 2 1
2
2
= =
=
y
n
j
j j
y
Sn y
n
n c
Sn
88 . 12
2
= =
y y
Sn Sn
9625 . 5 *
* *
1 1
= =
= =
y x
n
y x n
S
n
i
n
j
j i ij
xy
644 . 0
*
= =
y x
xy
xy
S S
S
r
No tiene mucha fiabilidad.
c) Ajustar un modelo de regresin lineal. Predecir la resistencia de una caja
fabricada con pulpa cuya concentracin es 2.3.
( ) x x
S
S
y y
x
xy
= *
2
( ) 35 . 2 *
5175 . 0
9625 . 5
15 . 129 = x y 07 . 102 * 52 . 11 + = x y
Si x = 2.3 y = 128.566
41. Sabiendo que x = 3, s
2
x
= 6, s
2
y
= 8 y que la recta de regresin de Y sobre X es:
y=4 0.667x, obtener la recta de regresin de X sobre Y.
SOLUCIN:
( ) x x
S
S
y y
x
xy
= *
2
x x
S
S
y x
S
S
y
x
xy
x
xy
* 667 . 0 4 * *
2 2
=
=
4 *
667 . 0
2
2
=
=
x
S
S
y
S
S
x
xy
x
xy
4 002 . 4 6 * 667 . 0 * 667 . 0
2
= = =
x xy
S S
2 999 . 1 3 * 667 . 0 4 * 4
2
= = + = x
S
S
y
x
xy
( ) y y
S
S
x x
y
xy
= *
2
( ) 2 *
8
4
3
= y x y x * 5 . 0 4 =
42. Hallar la recta de regresin de Y sobre X sabiendo que x = 4.1, y = 2.3 y la recta pasa
por el punto (5.9, 3.5).
SOLUCIN:
x b a x
S
S
y x
S
S
y
x
xy
x
xy
* * *
2 2
+ =
=
x b y x
S
S
y a
b
S
S
x
xy
x
xy
* *
2
2
= =
=
Si pasa por el punto (5.9, 3.5):
( ) x b x b y x b a y * * * + = + =
( ) 9 . 5 * 1 . 4 * 3 . 2 5 . 3 b b + = 6667 . 0 = b
433 . 0 1 . 4 * 667 . 0 3 . 2 * = = = x b y a