You are on page 1of 64

Ejercicios Resueltos de Estadstica:

Tema 1: Descripciones univariantes

1. Los datos que se dan a continuacin corresponden a los pesos en Kg. de ochenta
personas:
(a) Obtngase una distribucin de datos en intervalos de amplitud 5, siendo el primer

intervalo [50; 55].


(b) Calclese el porcentaje de personas de peso menor que 65 Kg.
(c) Cuntas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?
60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61;
63; 69; 80; 59; 66; 70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56;
65; 74; 67; 54; 65; 65; 69; 61; 67; 73; 57; 62; 67; 68; 63; 67; 71; 68; 76;
61; 62; 63; 76; 61; 67; 67; 64; 72; 64; 73; 79; 58; 67; 71; 68; 59; 69; 70;
66; 62; 63; 66;

SOLUCIN:
(a) Como se trata de efectuar una distribucin de datos agrupados, debemos obtener primero los
intervalos correspondientes, situando los datos en sus lugares respectivos:

Li-1 - Li
[50;55)
[55; 60)
[60; 65)
[65;70)
[70; 75)
[75; 80)
[80; 85]

ni

Ni
2
7
17
30
14

2
9
26
56
70

7
3

77
80

80

(b) Observando la columna de frecuencias acumuladas se deduce que existen N3 = 26 individuos


cuyo peso es menor que 65 Kg., que en trminos de porcentaje corresponden a:

26
100 = 32,5%
80
(c) El nmero de individuos con peso comprendido entre 70 y 85 Kg. es:
n5 + n6 + n7 = 14 + 7 + 3 = 24
lo que es equivalente a: N7 N4 = 80 56 = 24

2. Dada la distribucin siguiente, constryase una tabla estadstica en la que aparezcan


las frecuencias absolutas, las frecuencias relativas y las frecuencias acumuladas
relativas crecientes:
xi
ni

1 2 3 4 5 6
5 7 9 6 7 6

SOLUCIN:
La tabla que se obtiene es la siguiente:
xi

ni

1
2
3
4
5
6

5
7
9
6
7
6
40

fi

Fi

0,125 0,125
0,175 0,300
0,225 0,525
0,15
0,675
0,175 0,85
0,15 1
1

3. Las edades de los empleados de una determinada empresa son las que aparecen en la
siguiente tabla:
N o empleados

Edad
Menos
Menos
Menos
Menos
Menos

de
de
de
de
de

25
35
45
55
65

22
70
121
157
184

Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de


frecuencias acumuladas decrecientes (o ms de).

SOLUCIN:
Es preciso obtener, en principio, la distribucin de frecuencias absolutas:

Li-1 - Li

ni

[18; 25)
[25; 35)
[35; 45)
[45; 55)
[55; 65]

22
48
51
36
27

184

A la vista de la tabla anterior, la distribucin pedida es:


Edad

N. de
empleados

Ms de 18
Ms de 25
Ms de 35
Ms de 45
Ms de 55

184
162
114
63
27

4. Las temperaturas medias registradas durante el mes de mayo en Madrid, en grados


centgrados, estn dadas por la siguiente tabla:
Temperatura
N. de das

13 14 15 16 17 18 19 20 21 22
1

Constryase la representacin grfica correspondiente.

SOLUCIN:

8
7
6
5
4

Dias

3
2
1
0

13 14 15 16 17 18 19 20 21 22

5. Dada la distribucin de frecuencias:


xi
1
2
3
4
5
6

ni
9
22
13
23
8
25

(a) Constryase una tabla en la que aparezcan frecuencias absolutas, frecuencias

relativas, frecuencias acumuladas absolutas crecientes (o menos de) y


decrecientes (o ms de).
(b) Represntese mediante un diagrama de barras la distribucin dada y su
correspondiente polgono de frecuencias.
(c) Obtngase el polgono de frecuencias absolutas acumuladas crecientes y
decrecientes.

SOLUCIN:
(a) La tabla pedida es la siguiente:

(b)

xi

ni

fi

Ni

Ni

1
2
3
4
5
6

9
22
13
23
8
25

0,09
0,22
0,13
0,23
0,08
0,25

9
31
44
67
75
100

100
91
69
56
33
25

100

30
25
20
15
10
5
0
1

30
25
20
15
10
5
0
1

(c)

100
80
60
40
20
0
1

100
80
60
40
20
0

6. Represntese grficamente la siguiente distribucin de frecuencias:

Li-1-Li
0-10

ni
22

10-20
20-30
30-40
40-50
50-60
60-70

26
92
86
74
27
12

SOLUCIN:
Como es una distribucin de datos agrupados, o de tipo III, cuyos intervalos tienen
amplitudes iguales (a = 10), su representacin grfica es el histograma siguiente, en
el que se han colocado como alturas las frecuencias absolutas:
100
80
60
Frecuencias
Absolutas

40
20
0

0 10 20 30 40 50 60 70

7. Dada la siguiente distribucin de frecuencias:


Li-1-Li

ni

1-3
3-7
7-8
8-10
10-13
13-20

3
29
35
26
6
1

(a) Constryase una tabla en la que aparezcan las marcas de clase, las frecuencias

absolutas y relativas y las frecuencias absolutas acumuladas crecientes (o menos


de) y decrecientes (o ms de).
(b) Represntese la distribucin mediante un histograma y su correspondiente polgono
de frecuencias.

SOLUCIN:

(a) La tabla pedida es la siguiente, en la que se han aadido, adems, la columna de


las amplitudes de los intervalos y la columna de las alturas correspondientes para

construir el histograma.

ni

Li-1-Li
[1;3)
[3;7)
[7; 8)
[8; 1)
[10;13)
[13;20]

3
29
35
26
6
1

xi
2
5
7,5
9
11,5
16,5

100

fi
0,03
0,29
0,35
0,26
0,06
0,01

Ni
3
32
67
93
99
100

Ni
100
97
68
33
7
1

ai
2
4
1
2
3
7

hi
1,5
7,25
35
13
2
0,143

(b) Con la primera y ltima columna de la tabla anterior se obtienen el siguiente histograma
y su polgono de frecuencias:
35
30
25
20
hi

15
10
5
0

9 11 13 15 17 19

40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

8. Encuestados cincuenta matrimonios respecto a su nmero de hijos, se obtuvieron los


siguientes datos:
2 ; 4 ; 2 ; 3 ; 1 ; 2 ; 4 ; 2 ; 3 ; 0 ; 2 ; 2 ; 2 ; 3 ; 2 ; 6 ; 2 ; 3; 2; 2; 3; 2; 3; 3; 4;1 ;
3 ; 3 ; 4 ; 5 ; 2 ; 0 ; 3 ; 2 ; 1; 2; 3; 2; 2; 3; 1 ; 4 ; 2 ; 3 ; 2 ; 4 ; 3 ; 3 ; 2
Constryase una tabla estadstica que represente dichos datos:

SOLUCIN:
Efectuando el recuento de los datos se obtiene:
xi

ni

21

15

1
50

9. Calcula la media, la varianza, la desviacin tpica y el coeficiente de variacin de


Pearson tras Tras encuestar a 25 familias sobre el nmero de hijos que tenan, se
obtuvieron los siguientes datos,
N de hijos(Xi)

0 1 2 3 4

N de familias(ni) 5 6 8 4 2 25

SOLUCIN:
Las cuatro distribuciones de frecuencia sern:

X i ni

fi

Ni

Fi

0'20 5

0'24 11 0'44

0'32 19 0'76

0'16 23 0'92

0'08 25 1

25 1

0'20

La Media Aritmtica de las veinticinco familias encuestadas ser:


5

a=

x
i 1

ni

0 5 + 1 6 + 2 8 + 3 4 + 4 2 42
=
= 1,68
25
25

es decir, las familias encuestadas tienen un nmero medio de hijos de 1'68.


El Recorrido ser R = 4 - 0 = 4.
La Varianza es:
s2 = 4'24 - (1'68)2 = 1'4176.
Y la Desviacin Tpica s = 1'85.

Para este ejemplo el Coeficiente de Variacin de Pearson, Vp, toma el valor:

vp =

1,19062
100 = 70,869
1,68

En cuanto a la simetra, el Coeficiente de Variacin de Pearson, Ap,es igual a:

Ap =

1,68 2
= 0,2688
1,1906

Con lo que la distribucin es ligeramente asimtrica a la izquierda.


10. Calculo de la media aritmtica, la mediana y la moda. Se analiz el IVA que se aplica,
en diversos pases europeos, a la compra de obras de arte. Los resultados obtenidos fueron
los siguientes:
PAIS
Espaa
0,16
Italia
0,20
Blgica
0,06
Holanda
0,06
Alemania
0,07
Portugal
0,17
Luxemburgo 0,06
Finlandia
0,22

SOLUCIN:
Ahora realizamos las cuatro distribuciones de frecuencias:

Xi
ni
fi
Ni Fi
0,06 3 0,375 3 0,375
0,07 1 0,125 4 0,500
0,16 1 0,125 5 0,625
0,17 1 0,125 6 0,750
0,20 1 0,125 7 0,875
0,22 1 0,125 8
1
__________________________
Total 8
1
Calculamos la media aritmtica:

a=

ni

1
= 0,125.
8

Ahora calculamos la mediana:

Me =

x j 1 + x j
2

0,07 + 0,16
= 0,115.
2

Por ltimo, el valor mas frecuente, correspondiente a la moda, es el valor:

x j = 0,06. Por tanto:


M d = 0,06.
11. Con los mismos datos del ejercicio anterior vamos a calcular los cuartiles:

SOLUCIN:
Como sabemos el segundo cuartil es igual a la mediana:

P2 4 = M e = 0,115.
Para determinar los otros dos cuartiles p1/4 Y p3/4, debemos establecer primero las desigualdades:

N j 1 <

r
n < N j
k

Para los casos r/k = 1/4 y r/k = 3/4.


Para el primer cuartil:

1
8 = 2 < 3 = N1
4
Es decir menor que la primera frecuencia absoluta acumulada, por tanto:

P1 4 = 0,06.
Ahora calculamos el tercer cuartil:

N4 = 6 =

p3 4 =

3
8 = 6 < 7 = N5
4

0,17 + 0,2
= 0,185.
2

12. Del siguiente ejercicio calcular la varianza y la desviacin tpica.

X Intervalo f.absoluta f.acumulada f.relativa f.r.acumulada f.x


52
50-54
7
7
0,078
0,078
364
56
54-58
10
17
0,111
0,189
560
60
58-62
16
33
0,178
0,367
960
64
62-66
20
53
0,222
0,589
1280
68
66-70
18
71
0,2
0,789
1224
72
70-74
11
82
0,122
0,911
792
76
74-78
8
90
0,089
1
608
448
90
1
5788

SOLUCIN:
Varianza:
S2 = [ f x 2 [ ( f x ) 2 / N ] ] / (N 1 )
S2 = [ 376272 [ ( 5788 ) 2 / 90 ] ] / (90 1 )
S2 = 45,402.
Desviacin tpica:
( Raiz cuadrada de la varianza.)
S = 6,74
13. Para los siguientes datos, calcular:
A) El intervalo de intercuartil.
B) La desviacin del cuartil.
97 72 87 57 39 81 70 84 93 79
84 81 65 97 75 72 84 96 94 77

x2
2704
3136
3600
4096
4624
5184
5776

f. x 2
18928
31360
57600
81920
83232
57024
46208
376272

SOLUCIN:
A)

Q3 Q1
= IQ
2
15
RQ =
2
= RQ = 7,5
RQ =

B)

IQ = Q 3 Q1
= 87 72
= IQ = 15

14. Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los
siguientes datos que se refieren al nmero de horas que permanecen en el
aparcamiento una serie de coches:

4 5 5 1 7 4 4 3 6 5
3 2 4 4 3 6 6 4 5 5
6 4 3 3 4 5 4 3 2 4
5 2 4 7 3 6 2 2 4 1
2 1 3 7 3 1 5 1 7 2
4 4 2 4 5 3 6 3 5 3
Se pide:
A- Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar
la tabla.
B- Obtener la tabla de frecuencias ascendente y descendente.
C- Determinar e interpretar la tercera cuartilla y el centil del 42%.
D- Calcular el tiempo medio de permanencia de los coches en el
aparcamiento. Interpretar el resultado y los elementos que intervienen.

SOLUCIN:
A- El primer paso para construir la tabla de frecuencias es determinar el nmero
de valores diferentes en observacin, k, que en este caso es 7. A continuacin
podemos ver que esos 7 valores van desde el 1, x 1 , al 7 7 , y podemos
determinar la frecuencia absoluta y relativa de cada uno de esos valores. Una vez
calculadas las frecuencias resulta la siguiente tabla de frecuencias.

x1 (n horas)
1
2
3 4
5
6
7
ni (n coches)
5
8
12 15 10
6
4
f i (%coches) 8.33 13.33 20 25 16.67 10 6.67

En esta tabla aparecen por filas el nmero de horas que permanecen los coches en
el aparcamiento, el nmero de coches que han aparcado durante cada nmero de
horas y la proporcin de coches en % que han estado aparcados durante cada
nmero de horas. Una de las columnas, por ejemplo la cuarta, nos dice que 15
coches, que representa el 25% de los coches analizados, han estado aparcados
durante 4 horas en el aparcamiento.
B- La tabla de frecuencias ascendente es

xi (n horas)

13

25

40

50

56

60

(n _ coches _ acumulados)

( proporcin _ acumulada) 8.33 21.67 41.67 66.67 83.33 93.33 100

j =1
i

j =1

La tabla de frecuencias descendente es:

xi (n horas)

60

55

47

35

20

10

(n coches _ acumulados)

( proprcin _ acumulada) 100 91.67 78.34 58.34 33.34 16.67 6.67

j =i
7

j =i

C- La tercera cuartilla es el centil 75%, luego el ser N = 60 calculamos


0.75*60=45 que al ser entereo, la frmula aplicada ser
c 0.75 =

x( 45) + x( 46 )
2

5+5
= 5 horas
2

Su significado es que el 75% de los coches analizados estacionan en el aparcamiento


a lo sumo, o como mximo, 5 horas.
Para calcular el centil 42% hallamos 0.42*60=25.2, que al no ser entero,
deberemos utilizar la otra frmula.

c 0.42 = x ([ 25.2 ]+1) = x ( 26 ) = 4 horas


Su significado es que el 42% de los coches analizados estacionan en el
aparcamiento a lo sumo, o como mximo, 4 horas.
D- Segn la primera frmula, el tiempo medio de permanencia de los coches en
el aparcamiento es
k

___

X =

n
i =1

* xi

231
= 3.85 horas
60

Se calcula dividiendo el tiempo total de permanencia de todos los coches en el


aparcamiento, 231 horas, entre los coches analizados, 60.
En la segunda frmula se calcula el tiempo medio como resultado de las
aportaciones que hacen a dicho valor los productos de los diferentes valores del
nmero de horas que han estado los coches aparcados, x i , por la proporcin de
lcoches, f i , que han estado aparcados durante cada nmero de horas. Por tanto,
___

X =
i =1

f * x = 3.85 horas
i

En promedio, cada coche ha estado estacionado 3 horas y 51 minutos, y el tiempo


total de permanencia en el aparcamiento de los 60 coches ha sido 231 horas.

15. Un fabricante de neumticos ha recabado, de los diferentes concesionarios,


informacin sobre la cantidad de miles de kilmetros recorridos por un modelo
concreto de esos neumticos hasta que se ha producido un pinchazo o un reventn
del neumtico. Los concesionarios la han proporcionado los siguientes datos:

52.452 50.432 37.748 51.831 73.808 61.065 35.807 57.277


48.698 65.854 75.850 36.949 75.548 69.010 61.477 65.585
44.411 41.886 34.754 59.888 59.449 67.632 89.116 69.483
63.692 70.003 65.996 55.989 49.677 46.502 67.467 64.398
84.588 40.709 50.238 61.390 85.720 45.313 46.724 61.752
55.643 55.912 46.681 66.519 59.168 66.313 35.884 28.625
47.012 71.360 78.635 41.715 72.635 41.463 48.996 48.172
79.426 67.662 53.324 49.011 29.480 41.128 30.252 33.412
48.240 57.884 55.257 84.656 48.662 10.504

60.951 38.420

74.239 60.727 56.155 86.070 90.565 53.751 76.580 68.629


51.179 74.582 58.708 48.035 67.124 41.830 61.030 58.267
61.979 4.3068 41.539 62.215 51.269 82.919 34.182 37.654
80.502 35.342 44.719 37.402

Se pide:
a- Construir una taba de frecuencias para esos datos tomando como
nmero de intervalos el que proporciona la frmula de Sturgess.
Interpretas la tabla.
b- Construir las tablas de frecuencias acumuladas ascendente y
descendente.
c- Dibujar el histograma de frecuencias relativas sin acumular y
acumulado.
d- Calcular las principales medidas de tendencia central e interpretarlas.
e- Obtener las medidas de dispersin ms importantes e interpretarlas.

f- Analizar la asimetra y el apuntamiento de la distribucin de frecuencias


resultante.
g- Si el fabricante quiere proponer un kilometraje para realizar el cambio
de neumticos, qu valor propondra para que solo 3 de cada 10 coches
hayan tenido un pinchazo o reventn antes de ese kilometraje?

SOLUCIN:
a- La frmula de Sturgess propone como nmero k de intervalos, para agrupar un
conjunto de N observaciones en intervalos.
k=1+ [3.3*log N]
En este caso N=100, luego k=7. ahora debemos propones el lmite inferior del
primer intervalo y el lmite superior del ltimo intervalo. Al ser el valor mnimo
4.3068 se propone 4 como lmite inferior del primer intervalo, y al ser 7
intervalos se propone como anchura 13 para cada uno de ellos, para que sea un
valor entero, con lo cual el lmite superior del ltimo intervalo es 95.
La tabla de frecuencias ser:

Intervalo _ I i
Frecuencia
absoluta _ ni
Frecuencia
relativa _ f i
Ii
ni
fi

4 < x 17 17 < x 30 30 < x 43


2

19

.02

.02

.19

43 < x 56 56 < x 69 69 < x 82 82 < x 95


27
29
14
7
.27
.29
.14
.07

En esta tabla aparecen por filas los intervalos, junto con la frecuncia absoluta y la
frecuencia relativa. Por ejemplo la cuarta columna se puede interpretar diciendo
que el 27% de estos neumticos han recorrido entre 43000 y 5600 Km hasta que
se ha producido un pinchazo o reventn.
b- La tabla de frecuencias acumuladas ascendente sera:

Intervalos _ I i
i

n
j =1

(4,17] (17,30] (30,43] (43,56] (56,69] (]69,82 (82,95]


2

23

50

79

93

100

y la tabla de frecuencias acumuladas descendente quedara

Intervalos _ I i
k

n
j =1

(4,17] (17,30] (30,43] (43,56] (56,69] (69,82] (82,985]


100

98

96

77

50

21

c- El histograma de frecuencias relativas se represena es la figura 1 y el de


frecuencias acumuladas en la figura 2.

Frecuencias relativas

Frecuencia

0,4
0,3
0,2
0,1

82
_9

2
69
_8

56
_6
9

43
_5
6

3
30
_4

17
_3
0

4_
17

Intervalo
Figura 1

_9
5
82

_8
2
69

_6
9
56

_5
6
43

_4
3
30

17

4_

_3
0

1,2
1
0,8
0,6
0,4
0,2
0

17

frecuencias acumuladas

Frecuencias relativas acumuladas

Intervalo
Figura 2
d- Para calcular las medidas de tendencia central trabajamos con la tabla de
frecuencias del apartado a. resulta que la media aritmtica es
___

X = 55870 Km

Se interpreta diciendo que son los 100 neumticos analizados se han recorrido
5587000 de Km antes de un pinchazo o reventn.

La mediana ser
Me = 56000 Km
Significa que la mitad de los neumticos han recorrido a lo sumo 56000 Km
antes de un pinchazo o reventn.
La moda ser
Mo = 56 + 13*

2
= 57529 Km
2 + 15

Significa que la cantidad ms frecuente, de kilmetros recorridos antes de un


pinchazo, a sido 57529 Km.
e- La desviacin tpica es
s = 16899 Km
y nos informa sobre lo que se dispersan los kilmetros recorridos por los
diferentes neumticos respecto del kilometraje medio.
El coeficiente de variacin de Pearson ser

g=

s
* 100% = 30.24
x

Al tomar un valor inferior al 100% resulta que la mediana es representativa, y al


ser dicho valor del 30% nos informa que el valor de la desviacin tpica es el
30% del valor de la media.
f- Los coeficientes de asimetra de Pearson son en este caso

V1 =

55.87 57.529
= 0.09817
16.899

V2 =

55.87 56.00
= 0.02308
16.899

Para calcular el coeficiente g 1 calculamos


7

__ 3

m3 = f i ( xi x ) = 421.39015
i =i

Luego g 1 =-0.08732, resultado de dividir m 3 entre s 3 . a la vista de este


coeficiente de asimetra la distribucin resulta ser ligeramente asimtrica a la
izquierda, lo que significa que algo menos de la mitad de los neumticos pinchan
o revientan antes de los 5600 Km, valor mediano de la distribucin.
Para el clculo del coeficiente de curtosis g 2 necesitamos
7

m4 =

i =1

Luego

__

f (x x )
i

= 234594.7408

g2 =

m4
3 = 0.12343
s4

Esto significa que la distribucin es de tupo platicrtica, algo menos apuntada


que la distribucin normal de media 55870 km y desviacin tpica 16899 km. Por
___

tanto, en los intervalos X ks con k habr menos proporcin de


observaciones que en dicha distribucin normal.
g- Propondra un kilometraje tal que el 70% de los neumticos no hayan
pinchado o reventado antes de este kilometraje. Por tanto, buscamos el centil
del 30%, que vendr dado por
c 0.3 = 43 + 13 *

7
= 46.37
27

Luego el fabricante propondra cambiar los neumticos a los 46370 km.


16. La tabla siguiente nos proporciona los valores de la media y la desviacin tpica
de dos variables as como su coeficiente de correlacin lineal para dos muestras
diferentes:

Muestra n de _ observaciones
1
600
2
400

__

__

x y sx
5 12 2
7 10 3

sy
3
4

rxy
0.6
0.7

Se pide:
a- Recta de regresin de Y sobre X en cada muestra.
b- Si consideramos la muestra que resulta de agrupar las dos muestras en
una sola de tamao 1000, obtener el nuevo coeficiente de correlacin
lineal de Pearson y explicar el hecho de que sea inferior a los de cada
una de las muestras tomadas por separado.

SOLUCIN:
a- La recta de regresin de Y sobre X en cada muestra es
__

y = y+

___
m11
(
x

X)
s x2

Como la informacin dada es la del coeficiente de correlacin lineal,

rxy =

m11
sx s y

se tiene que la recta de regresin es


___

y = Y + rxy

sy
sx

___

(x X )

Luego, sustituyendo, las rectas de regresin de Y sobre X en cada una de las dos
muestras son:
Muestra 1: y=12+0.9*(x-4)
Muestra 2: y=10+0.93*(x-7)
b- Se trata de calcular el coeficiente de correlacin lineal de Pearson en la nueva
muestra de tamao 1000, que notaremos por r xy,t y que ser
r xy ,t =

m11,T
s x ,T s y ,T

donde m 11,T es la covarianza en la muestra total y s x,T , s x,T las desviaciones


tpicas de X e Y en la muestra total. Para obtener estas cantidades necesitamos
___

___

e Y

, medias de X e Y en la muestra total, que se calculas como un


__

___

promedio entre las medias de X e Y en las muestras 1 y 2, notadas por X 1 , Y


___

___

2, Y

, segn las relaciones siguientes


___

___

XT

___

___

___

X * 600 + X 2 * 400
= 1
1000
___

Y 1 * 600 + Y 2 * 400
=
1000
___

___

Sustituyendo se obtiene que X T = 5.8 e Y T = 11.2 .


Por otra parte si m 11,h denota la covarianza en la muestra h, se tiene que
m 11,1 =2*3*0.6=3.6
m 11, 2 =3*4*0.7=8.4
Como

m 1,h =

resulta que:

ij , h

xi ,h y j ,h

Nh

___ ___

X h Yh

x y j ,1

ij ,1 i ,1

N1

= 3.6 + 5.12 = 63.6

x yl ,2

ij , 2 1, 2

N2

= 8.4 + 7 * 10 = 78.4

Luego en la muestra total con N=1000 se tiene que

ij

xi y j

x y j ,1 + nij , 2 xij , 2 xi , 2 y j , 2

ij ,1 i ,1

N
N
63.6 * 600 + 78.4 * 400
=
= 69.52
1000

Por tanto
m 11,T =

ij

xi y j

___ ___

XT Y

= 69.52 5 * 8 * 11.2 = 4.56

P ara obtener s x,t y s y,t utilizamos que

___ 2

___ 2

s x,T = a 2, xT X T y s y,T = a 2, yT Y

donde

a 2, xT =

a 2, yT =

a 2, x1 * 600 + a 2, x 2 * 400
1000

a 2, y1 * 600 + a 2, y 2 * 400
1000

siendo
___ 2

a 2, Xh = s X2 ,h + X h
___

a 2,Yh = sY2 ,h + Y

2
h

para h=1,2.

Operando se obtiene que a 2, X 1 =29, a 2 , X 2 =58, a 2 ,Y 1 =153 y a 2,Y 2 =116

Luego
a 2, XT =0.6*29+0.4*58=40.6
a 2,YT =0.6*153+0.4*116=138.2
de donde
s X ,T = 40.6 5.8 2 = 2.6382
s Y ,T = 138.2 11.2 2 = 3.5721
Luego resulta que
r xy,T =

4.56
= 0.4838
2.6382 * 3.5721

Con lo cual el coeficiente de correlacin lineal entre X e Y en la muestra total de


1000 observaciones es inferior al que hay en cada una de las dos muestras por
separado. La explicacin de este hecho es la siguiente: en cada muestra parcial se
puede dar un mayor grado de relacin lineal que en la muestra total porque las
observaciones se encuentran mas agrupadas en torno a una recta que cuando las
juntamos, ya que al formar la muestra total la nube de puntos resultante estar
formada por las nubes de puntos de las muestras parciales y presentar un menor
ajuste a una recta.

17. En una compaa area se sabe que, por trmino medio, el 65% de los vuelos
tiene retraso. La distribucin de los vuelos retrasados es la siguiente:
Duracin del retraso
(centsimas de hora)
0-10
10-20
20-30
30-50
50-100

Numero de vuelos
2000
3000
2500
2000
500

Se pide:
a- Determinas el retraso medio y la desviacin tpica del tiempo de retraso
para los vuelos retrasados.
b- Determinar el centil del 60% e interpretarlo.
c- La compaa ha determinado que por cada vuelo con retraso se producen
unas prdidas fijas de 17000 pts y unas prdidas variables de 10000 pts
por cada minuto de retraso. Entre qu cantidades se encuentran al
menos las tres cuartas partes de las prdidas generadas por cada vuelo
retrasado?
d- Resolver el apartado a- para el total de los vuelos. Es representativa la
nueva media? En caso negativo propones razonadamente otra medida de
centralizacin.

SOLUCIN:
a-

Sea la variable estadstica X: tiempo de retraso de un vuelo retrasado, y


consideremos la tabla de frecuencias siguiente obtenida a partir de la dada con
las marcas de clase
xi

15

25

40

75

fi

0.2

0.3

0.25

0.2

0.05

En esta tabla se verifica que


___

X = 23.5 centsimas de hora

s x =16.6658 centsimas de hora


b-

[a i 1 ,a i )

De la tabla de frecuencias acumuladas siguiente

[0,10)

[10,20)

[20,30)

[30,50)

[50,100)

0.2

0.5

0.75

0.95

f
j =1

se observa que el centil 60% se encuentra en el intervalo [20,30), luego


c 0.6 =20+z
por una regla de tres
10 0.25
z 0.1
z=

0.1 *10
=4
0.25

As c 0.6 =24 centsimas de hora y significa que el 60% de los vuelos retrasados
(con menos tiempo de retraso) han tenido un retraso de a lo sumo 24 centsimas de
hora y significa que el 60% de los vuelos retrasados (con menos tiempo de retraso)
han tenido un retraso de a lo sumo 24 centsimas de horas.
c-

Sea la variable estadstica Y: prdidas que se producen por un vuelo con


retraso, se verifica que
Y=17000+10000*

6
X
10

ya que X*: tiempo de retraso de un vuelo retrasado en minutos se relaciona con X


por la igualdad X*=

6
X.
10

Por aplicacin de la desigualdad de Chebyshev se sabe que al menos las tres


cuartas partes de las prdidas generadas por cada vuelo retrasado se encuentran
___

___

entre Y 2s y e Y + 2s y . Como
___

___

Y = 17000 + 6000 * X = 17000 + 6000 * 23.5 = 158000 pts


s y = 6000 * s x = 6000 * 16.6658 = 999948 pts
Resulta que: Entre 0 pts y 3579896 pts se encuentran al menos las tres cuartas
partes de las prdidas generadas por cada vuelo retrasado.
Como
gx=

x
___

16.6658
= 0.7092
23.5

99994.8
= 0.6329
158000

gy=

sy
___

se deduce que hay ms variabilidad en los tiempos de retraso.


d-

Al considerar el total de los vuelos hay que modificar la tabla del anunciado
por la tabla siguiente

Con la nueva variable estadstica X*: tiempo de retraso de un vuelo cualquiera en


centsimas de 1 hora.
Se verifica que
___

X * =15.275 centsimas de hora y s X * =17.5 centsimas de hora.

Como g X * =

17.5
= 1.1457 > 1 la nueva media no es representativa al existir
15.275

observaciones extremas. Una medida de centralizacin que evita este problema es la


mediana. Para esta distribucin se verifica que Me = 11.026 centsimas de hora.

18. En una clnica se han registrado durante un mes las longitudes en metros que los nios
andan el primer da que comienzan a caminar, obtenindose los siguientes resultados:

Nmero de metros 1 2 3 4 5 6 7 8
Nmero de nios
2 6 10 5 10 3 2 2
Construir la distribucin de frecuencias adecuada para la variable longitud y realizar los
grficos pertinentes que la representen.

SOLUCIN:
La tabla de frecuencias relativa a la variable se presenta a continuacin:
Xi
1
2
3
4
5
6
7
8

ni
2
6
10
5
10
3
2
2

Ni
2
8
18
23
33
36
38
40

fi
0.05
0.15
0.25
0.125
0.25
0.075
0.05
0.05

Fi
0.05
0.2
0.45
0.575
0.825
0.9
0.95
1

35

30

25

20

Comida
Transporte
Alojamiento

15

10

0
Ene

Feb

Mar

Abr

May

Jun

19.- La distribucin de los costes salariales de los 100000 empleados de una multinacional
se presenta en la tabla siguiente:
Salarios
0 15000
15000 20000
20000 25000
25000 30000
30000 35000
35000- 40000
4000 50000
50000 100000

N de empleados
2145
1520
840
955
1110
2342
610
328

100000 - 300000 150


Calcular el salario medio por trabajador, el salario ms frecuente y el salario tal
que la mitad de los restantes sea inferior a l. Calcular tambin el primer cuartel salarial y
el percentil 75.
SOLUCIN:
La tablas siguiente contiene los elementos relativos a la distribucin d frecuencias de la
variable salario (X) necesarios para realizar los clculos pedidos en el problema.
L(i 1)
0
15000
20000
25000
30000
35000
40000
50000
100000

Li
15000
20000
25000
30000
35000
40000
50000
100000
300000

ni
2145
1520
840
955
1110
2342
610
328
150
10000

Marcas = Xi
7500
17500
22500
27500
32500
37500
45000
75000
200000

Xi*ni
16087500
26600000
18900000
26262500
36075000
87825000
27450000
24600000
30000000
293800000

Ni
2145
3665
4505
5460
6570
8912
9522
9850
10000

ci
15000
5000
5000
5000
5000
5000
10000
50000
200000

Di = ni/ci
0.143
0.304
0.168
0.191
0.222
0.4684
0.061
0.00656
0.00075

Para hallar el salario medio por trabajador calculamos la medida de la variable X.

293800000 =29380
1000
Para hallar el salario ms frecuente se calcula la moda de la variable X. Para ello hemos de tener
presente que los intervalos de la distribucin de frecuencias son desiguales, por lo que l
intervalo modal ser el correspondiente al mayor valor de di, es decir ser el intervalo (3500040000).por lo tanto la moda se calcula como sigue:
M0 = Li-1 + __d+1__ ci = 35000 +
0,061___ 5000 = 36077,74
di-1+ di+1
0,222+0,061
Para hallar el salario tal que la mitad de los restantes sea inferior a l se calcula la
mediana. Para llo, como N/2 = 5000, el intervalo mediano ser (25000-3000) ya que
Ni-1<N/2>Ni es equivalente en este problema a 4505 < 50000< 5460.la mediana se calcular
como sigue:
Me=Li-1 + N/2 Ni-1 ci = 25000 + 1000/2 4505 5000 = 27591,62
ni
955
Para calcular el primer cuartil (primer cuartil de orden 4) observamos que como N/4 =
2500, el intervalo relativo al primer cuartel ser (15000-20000) ya que
Ni-1<2500<Ni es equivalente en este problema a 2145<2500<3655.El primer cuartel se calcular
como sigue:

Q1,4 = L i-1 + N/4 Ni-1 ci = 15000+ 10000/4 2145 5000 = 16167,76


ni
1520
El primer cuartil se interpreta como el valor de la variable para el que la cuarta parte de
los valores menores que l y las tres cuartas partes resultantes son superiores.
Para calcular el percentil 75 (cuantil 75 de orden 100), observamos que como 75N7100
= 7500, el intervalo al percentil 75 ser (3500 40000) ya que Ni-1<7500<ni es equivalente en
este problema a 6570<7500<8912.El percentil 75 se calcular como sigue:
Q75,100 = Li-1 + 75N/100 Ni-1 ci = 35000 + 75*10000/100 6570 5000 = 36985,48
ni
2342
El percentil 75 se interpreta como el valor de la variable para que el 75% de los valores
son inferiores a l y el 25% restante son superiores.

20. Los rendimientos de cinco inversiones distintas realizadas por un individuo y las
cantidades iniciales invertidas n unidades monetarias son los siguientes:
Cantidades iniciales
200.000
360.000
250.000
240.000
180.000

Rendimientos
1000
900
500
800
1200

Calcular el rendimiento medio por unidad monetaria invertida para el total de


inversiones del individuo.
SOLUCIN:
Como se trata d promediar rendimientos por unidad, estamos ante un caso de aplicacin
del concepto de media armnica. Calcularemos por tanto el rendimiento medio por unidad
monetaria invertida para el total de inversin del individuo como la media armnica de los
rendimientos de cada inversin ponderada de las cantidades iniciales desembolsadas en cada
inversin.
H=

N
(1 / xi ) * ni

200000 + 360000 + 250000 + 240000 + 180000


200000 + 360000 + 250000 + 240000 +180000

793,5

21. En el cuadro siguiente se presentan los consumos de electricidad en Espaa en miles de


millones de Kw/hora desde diciembre n 1985 hasta diciembre de 1986.
Meses
Dic Ene Feb Mar Abr May Jun Jul
Ago Sep Oct Nov
Consumo 10,1 10,7 9,96 9,46 9,54 8,92 8,95 9,58 7,86 8,96 9,57 9,57
A partir de los incrementos unitarios de consumo de cada mes calcular el incremento

unitario anual medio acumulativo.


SOLUCIN:
Al tratarse del clculo de una media acumulativa, el promedio ms adecuado es la
media geomtrica. Se trata por tanto de calcular la media geomtrica de los incrementos
unitarios mensuales. Estos incrementos se calculan a continuacin.
10,7 = 1,06
10,1

9,96 = 0,93 9,46 = 0,95 9,54 = 1,008


10,7
9,96
9,46

9,58 = 1,07
8,95

7,86 = 0,82
9,58

8,96 = 1,14
7,86

9,17 = 1,02
8,96

8,92 = 0,93
9,54
9,57 = 1,04
9,17

8,95 = 1,003
8,92
10,2 = 1,06
9,57

La media geomtrica de estos incrementos unitarios mensuales se calcula como sigue:


_______________________________________________________
G=121,06*0,93*0,95*1,008*0,93*1,003*1,07*0,82*1,14*1,02*1,04*1,06 = 1,01

22. En la siguiente tabla se muestran las diferentes cantidades de IVA que se imponen en
la compra de una obra de arte.
Pas
Espaa
Italia
Blgica
Holanda
Alemania
Portugal
Luxemburgo
Finlandia

IVA
0,16
0,20
0,06
0,06
0,07
0,17
0,06
0,22

Determine el recorrido, la varianza, la desviacin tpica, la cuasivarianza, la


cuasidesviacin tpica, el coeficiente de variacin de Pearson, el coeficiente de asimetra de
Pearson y el coeficiente de asimetra de Fisher.
SOLUCIN:
-

El recorrido:

La varianza:

R = ( x) max ( x) min = 0,22 0,06 = 0,16

s2 =
-

1 6 2
0,1586
x i ni a 2 =
= 0,125 2 = 0,0042

n i =1
8

De la misma forma la desviacin tpica se obtiene haciendo la raz cuadrada de la


varianza:

s = s 2 = 0,048 = 0,06481
-

La cuasivarianza:

S2 =
-

ns 2 8 * 0,0042
=
= 0,0048
n 1
7

De la misma forma la cuasidesviacin tpica:

S = S 2 = 0,0048 = 0,06928
-

El coeficiente de variacin de Pearson:

Vp =
-

El coeficiente de asimetra de pearson:

Ap =
-

s
0,06481
*100 =
*100 = 51,848
a
0,125
a M d 0,125 0,06
=
= 1,00293
s
0,06481

Por ultimo el coeficiente de asimetra de Fisher:


6

Af =

(x
i =1

a ) 3 * ni

n*S

0,000423
= 0,159
8 * 0,0003325

23. Dados los siguientes datos:


Tamao tabla
3-6
6-11
11-16
16-21
21-26
26-31
31-41
41-51
51-76
76-101
101-201
201-501
501-1000
Calcula la media aritmtica, la mediana.

n
37
198
191
149
79
46
55
51
26
25
25
11
2

SOLUCIN:
-

a=

La media aritmtica:

1 k
27678,5
x i * ni =
= 30,93

n i =1
895

- La mediana:
Para ello nos valemos del clculo de frecuencias absolutas acumuladas:
Este tipo de datos nos dice el nmero de datos que hay igual o inferiores a uno
determinado.
Se calcula con la siguiente formula: N i =
As de esta forma:
Tamao tabla
3-6
6-11

n
j =1

= N i =1 + n j

Frecuencia acumulada
37
235

11-16
16-21
21-26
26-31
31-41
41-51
51-76
76-101
101-201
201-501
501-1000

426
575
654
700
755
806
832
857
882
893
895

Respecto a esta tabla calculamos la mediana:

N 3 = 426 <

n 895
=
= 447,5 < 575 = N 4
2
2

Con lo que podemos decir que la mediana esta en el intervalo [16,21)siendo la mediana el
valor:

n
N j 1
447,5 426
M e = x j 1 + 2
* 5 = 16,72
* c j = 16 +
nj
149
24. Con los datos del ejercicio anterior calcular el primer cuartel y el sexto decil.
SOLUCIN:
a) El primer cuartil:

37 <

1
* n = 223,75 < 235
4

Ser p 1 [6,11) y, en concreto:


4

p1 / 4

1
1
* 895 37
* n N j 1
= x j 1 + 4
* 5 = 10,716
*cj = 6 + 4
nj
198

Que ser igual al centil 25


b) Calcular el sexto decil
Para ello acotamos el valor:

6
60
6
*n =
* n = * 895 = 537
10
100
10
Por las frecuencias absolutas acumuladas:

N 3 = 426 < 537 < 575 = N 4


6
* n N j 1
537 426
10
* c j = 16 +
* 5 = 19,72
p 6 / 10 = x j 1 +
149
nj

25. Mediante los datos del ejercicio numero 23 calcular las medidas de dispersin
SOLUCIN:
- El recorrido:

R = x max x min = 750,5 4,5 = 746


-

La varianza es:

s2 =

1 k
1 k
3713428,25
30,93 2 = 3192,47
( xi a ) 2 * ni = xi2 ni a 2 =

n i =1
n i =1
895

- La cuasivarianza

n * s 2 895 * 3192
S =
=
= 3195,988
n 1
894
2

- La desviacin tpica:

s = s 2 = 3192,417 = 56,50
-

La cuasidesviacin tpica:

S = S 2 = 3195,988 = 56,53
-

El coeficiente de variacin de Pearson:

Vp =
-

s
56,50
* 100 =
*100 = 182,67
a
30,93

El coeficiente de asimetra de Pearson:

Ap =

a Md 30,93 9,78
=
= 0,374
s
56,50

26. En un colegio de un pequeo pueblo de la comunidad valenciana se han recogido los


siguientes datos de informacin sobre cuantos nios se matriculan de cada sexo cada ao,
segn se muestra en la siguiente tabla:
Ao
Nios
Nias
1995
32
43
1996
27
24
1997
29
32
1998
29
31
1999
31
31
Se debe calcular la frecuencia absoluta y la frecuencia relativa para los datos
correspondientes a los nios y a las nias y disponer los datos mediante un diagrama
de sectores o de pastel en cada caso.
SOLUCIN:
1- Para empezar calcularemos las frecuencias correspondientes a los nios para esto
utilizaremos la siguiente formula:
- En el caso de la frecuencia absoluta contaremos el nmero de veces que se
repite un determinado valor, por lo que para x1=0 n1=32; x2= 0 n2=27; x3=1 n3=29; x4=0
n4=31;
- En el caso de las frecuencias relativas para hallar este valor dividiremos la
frecuencia absoluta por el nmero total de datos. As de esta forma la formula utilizada es:
fi=ni/n

Por lo que obtenemos al calcularlo: f1= 32/148= 0,216; f2= 27/148= 0,1824; f3= 58/148=
0,39; f4= 31/148= 0,20;
2- de la misma forma calcularemos las frecuencias correspondientes para las nias:
- Para las frecuencias absolutas: x1=0 n1=43; x2= 0 n2=24; x3=0 n3=32;
x4=1 n4=31;
- Para las frecuencias relativas: f1= 43/161= 0,267; f2= 24/161= 0,15; f3=
32/161= 0,20; f4= 62/161= 0,38;
3- Pasemos a la representacin grafica, para ello debemos partir de las frecuencias relativas
y calcular cada porcin del diagrama mediante esta formula:

1 360
as de esta forma obtenemos:
=
fi

diagrama nios

0,2; 20%

0,216; 22%
1

0,1824; 18%

2
3
4

0,39; 40%

diagrama nias

0,267; 27%
0,38; 38%

1
2
3
4
0,15; 15%
0,2; 20%

27. Establecido un balance de explotacin sobre las ocho sucursales de una cadena de
almacenes, result la siguiente estimacin:

Sucursal

Beneficios sobre ventas

Ventas totales

28

500

15

126

24

432

32

870

17

180

23

450

18

912

25

713

Obtngase el porcentaje medio de beneficios sobre las ventas totales de la cadena.


SOLUCIN:
El porcentaje medio se obtiene como media aritmtica ponderada de los beneficios,
siendo el peso respectivo la venta total de cada sucursal, es decir,
di

ji-pi

pi

28

500

14000

15

126

1890

24

432

10368

32

870

27840

17

180

3060

23

450

10350

18

912

16416

713

17825

4183

101479

De donde:

x=

101479
= 24,32%
4183

28. Una prestigiosa frutera tiene como norma clasificar los mangos segn su
tamao, de cara a la venta, en superiores y normales. Los superiores son aquellos
cuyo peso es superior a 450 g. De una partida, representativa de los mangos que
recibe normalmente, se ha obtenido la distribucin de frecuencias siguientes:
Peso
250-300
300-350
350-400
400-450

Nm. De mangos
3
10
15
25

450-500
500-550
550-600
600-650
650-700
a-

32
20
19
4
2

Un exquisito aristcrata ha acordado con el frutero quedarse con los


mangos cuyo peso sea superior a 625 gramos. Qu porcentaje de mangos
se destinarn a este aristcrata?
El frutero compra la partida de mangos a 300 pts el kg. Los normales se
venden a 600 pts/kg, os superiores a 800 pts /kg, mientras que el
aristcrata se os deja a 700 pts/kg. Cunto espera ganar este frutero es
esta partida?

b-

SOLUCIN:
a-

Primero habr que calcular el nmero de mangos cuyo peso es supereior a 625
gamos. Bajo la hiptesis de distribucin uniforme de la frecuencia en los
intervalos, resulta que en el intervalo (625-800] hay 5 mangos de la partida.
Por tanto se apartarn para el aristcrata el 3.85% de los mangos recibidos.
Ya que el frutero decide retirar de la venta aquellos cuyo peso sea a lo sumo
de 317.5 g, la distribucin del peso de los mangos normales, vaqriables notada
por X N , ser

b-

Peso

(317.5-350]

(350-400]

(400-450]

N de mangos

15

25

La distribucin del peso de los mangos superiores, excludos los destinados al


aristcrata, ser la de la variable notada por X S segn esta tabla

Peso

(450-500]

N
32
La del aristcrata es X A
Peso
N

(625-700]
3

(500-550]
20

(550600]
19

(600625]
1

(700-800]
2

El peso medio de los mangos normales se la media de la distribucin de


frecuencias de la variable X N , tomando como valores de las variable las marcas de
clase de los intervalos. RTesulta se la variable las marcas de clase de los intervalos.
Resulta ser la variable las marcar de clase de los intervalos. Resulta ser
___

333.75 * 6 + 375 *15 + 4 * 25


= 396.79 g.
46

De manera anloga se obtiene que


___

X S == 517.19 g. y

___

= 697.5 g.

Por lo tanto en esta partida el frutero espera tener 46*396.79 = 18.25 kg de mangos
normales, 72*517.19 =37.24 kg de mangos superiores y 5*697.5=3.49kg de mangos
destinados al aristcrata. Con lo cual espera ganar por esta partida la cantidad de
300*18*253+500*37.24+400*3.49=25490 pts.

29. En una ciudad, analizamos el nivel de vida a travs de la renta anual


familiar. Se recoge informacin sobre 50 familias. Los datos en millones de
pesetas, son los siguientes:
32
11
33
02
2
13
08
04
38
26
23
34
28
17
12
32
32
26
11
24
26
16
09
2
18
36
13
27
23
23
17
29
12
22
2
13
18
08
23
14
09
11
21
17
12
23
16
22
17
21
Obtener medidas que indiquen la localizacin, la dispersin, la asimetra
y la curtosis. Repetir el problema agrupando los datos en intervalos de
amplitud 05 y posteriormente en intervalos de amplitud 1. Comprobar si
existen grandes diferencias.
SOLUCIN:
En este problema deseamos comprobar si, al agrupar los datos en
intervalos, la informacin original aportada por los datos en cierta forma se
conserva, o por el contrario, hay diferencias relevantes.
Teniendo en cuenta los resultados concretos procedentes de diferentes
familias, recogemos esta informacin:
N de datos: 50
Mnimo: 02 millones
Mximo: 38 millones
Media: 1964
Moda: 23
Varianza: 07095
Desv. Tpica: 08423
Primer Cuartel: 13
Mediana: 2
Tercer Cuartel: 2,6
Asimetra: 01697
Curtosis: -05984
Coef. de Pearson: 04289

En este primer anlisis, las rentas son valores que oscilan entre 200.000 ptas.
y 38 millones; la renta media familiar es de 1.964.000 ptas.; es una distribucin
que tiende a ser simtrica (el coeficiente de asimetra es igual a 01697) y el
coeficiente de curtosis es negativo, que indica que la distribucin est por debajo de
la distribucin normal tipificada, es decir, es platicrtica.
Agrupemos los datos en intervalos de amplitud 05; como la renta toma
valores positivos y no superan el valor 4, podemos considerar rango 0-4.
Li-1-Li
00-05
05-10
10-15
15-20
20-25
25-30
30-35
35-40

xi
025
075
125
175
225
275
325
375

ni
2
4
10
8
13
6
5
2

Ni
2
6
16
24
37
43
48
50

Como esta informacin se puede calcular las siguientes medidas:


Media: 199
Varianza: 07324
Desv. Tpica: 08558
Moda: 22143
Mediana: 20385
Asimetra: 0046
Curtosis: -05888
ndice de Pearson: 04301
No hay mucha variacin respecto del caso anterior; lo ms significativo es
que la renta media ahora es 1990.000; si nos guiamos por este procedimiento,
comparando este valor medio con el primero, estaremos sustrayendo a cada familia
unas 26.000 ptas.

Los intervalos con mayor frecuencia estn situados en el centro; agrupar los
datos en un sentido u otro hace que el coeficiente de asimetra cambie (el nuevo
valor es 0046), aunque en todos los casos toma valores cercanos a cero.
A pesar de que el intervalo con marca 225 es el de mayor frecuencia (por
encima de la grfica de la distribucin normal), los intervalos adyacentes reflejan lo
contrario. Debido a esta situacin, el coeficiente de curtosis es negativo.
Si consideramos intervalos con mayor amplitud:
Li-1-Li
0-1
1-2
2-3
3-4

xi
05
15
25
35

ni
6
18
19
7

Ni
6
24
43
50

Media: 204
Varianza: 07684
Desviacin Tpica: 08766
Moda: 228
Mediana: 20526
Asimetra: -00331
Curtosis: - 06989
Coef. Pearson: 04297

De acuerdo con estos resultados, la renta media aumenta en 41000 ptas. de


los datos originales, siendo el resto de valores muy similares. Observar que ahora el
coeficiente de asimetra es negativo, pero en todos los casos muy prximo a cero,
con lo cual la distribucin se puede considerar prcticamente simtrica.
30. Se producen alteraciones en las medidas de posicin al realizar un cambio de origen?
SOLUCIN:
El cambio de origen supone una traslacin del tipo y = x + a. Las
medidas de posicin son afectadas de la siguiente forma:
Media

Y =

i =1

y i ni
n

i =1

(xi

+ a) ni

i =1

i =1

i =1

xi ni
n

i =1

i =1
n

i =1

Moda

Nk = mx. (n 1, n 2, __, n n ), M o (x ) = x k ;por consiguiente, la

moda de la variacin del valor correspondiente a la frecuencia nk:

M o (Y ) = y k = x k + a = M o (x ) + a

**Si el valor i-simo intervalo es el de mayor altura, tanto la moda de X


como la de Y estarn situadas en l:

M o (Y ) = Li 1 + a + ci

hi + 1
= M o (x ) + a
hi 1 + hi + 1

Mediana
*Si los datos estn sin agrupar en intervalos, por ser frecuencias de X y de Y
las mismas, la mediana de Y ser la mediana de X trasladada en a unidades.
**Si la distribucin esta agrupada en intervalos de clase N / 2 < N i
la mediana se encuentra en el i-simo intervalo tanto para X como para Y.

Me(Y ) = Li 1

N
N i 1
2
+ a + ci
= Me(x ) + a
ni

Cuartiles, deciles y percentiles


Podemos observar que en estas medidas se produce el mismo cambio que en
la variable. En el caso de los percentiles:

Pj (Y ) = Pj (x ) + a con j=1,___,99.
31. Para lanzar un nuevo producto al mercado, una empresa estudia el
tiempo de publicidad, en segundos, empleando en los medios audiovisuales por
otra empresa que produce un producto similar.
Duracin
0-20
20-25
25-30
30-40
40-60

N de
Anuncios
3
17
13
9
8

Cul es la duracin media aproximada de los anuncios?Es representativa?


Cul es la duracin ms frecuente?
A partir de que valor un anuncio es de los veinte ms largos?

= x + a

Estudiad la forma de la distribucin.


Si cada segundo cuesta mil cuatrocientas pesetas, cul es el gasto aproximado
que realiza la otra empresa en la publicidad de ese producto?
SOLUCIN:
a) X = 297 segundos. VX = 0358170667 moderadamente representativa.
b) Mo = 247273 segundos.
c) P60 = 288461538 segundos.
d) AP = 04675 > 0. AP = 07831 > 0. C = 03234 > 0.
g1 = 006454 > 0.
La distribucin presenta asimetra positiva o por la derecha.
g2 = -008595 > 0. La distribucin es moderada platicrtica.
El gasto aproximado ser de 2079000 ptas.
32. La distribucin del importe de las facturas por reparacin de
carrocera (en miles de ptas.) de una muestra de 80 vehculos en un taller,
viene dad por la siguiente tabla:

a)
b)
c)
d)
e)
f)

Importe
N de vehculos
0-60
10
60-80
20
80-120
40
120-180
10
Calcular el importe medio. Estudiar la representatividad en esta medida.
Calcular la mediana y estudiar su representatividad.
Cul es el importe ms habitual?
Qu interpretacin tiene en este caso los deciles? Calcular el tercer decil.
Cul es el importe mnimo pagado por las 75 reparaciones ms baratas.
Estudiar la concentracin del importe de las facturas.

SOLUCIN:
a) X = 90000 ptas. VX = 036. Es moderadamente representativa.
7 . Es representativa.
b) Me = 90000 ptas. DMe = 25. VMe = 0.2
c) Hay dos modas: Mo1 = 77143 ptas. y Mo2 = 85714 ptas.
d) D3 = 74000 ptas.
e) P75 = 110000 ptas.
2.
f) IG = 0
33. Dos compaas aseguradoras tienen formas diferentes de pagar a sus
empleados. La compaa A lo hace mediante un sueldo fijo mensual y la
compaa B a travs de un porcentaje sobre los seguros realizados. La
distribucin de los salarios por categoras es:
Compaa A
Sueldo
(miles ptas.)
50-80
80-100
100-150

Compaa B
N
empleados
35
21
14

Sueldo
(miles ptas.)
50-80
80-100
100-140
140-200

N
empleados
21
25
34
15

a) Por trmino medio,gana ms un empleado de la compaa A o de la B?


b) Calcular y comentar la representatividad de los sueldos medios.
c) Cul es el sueldo ms frecuente en la compaa A?
d) Aunque en la compaa B el sueldo se gana por mritos, crees que el
reparto de salarios por categoras es equitativo?
e) Si en la compaa B el salario fuese el anterior ms un fijo de 10000 pesetas,
cul sera el salario medio y la desviacin tpica?
SOLUCIN:
a)

Sean:

X = sueldo (en miles de pesetas) de los empleados de la compaa A.


Y = sueldo (en miles de pesetas) de los empleados de la compaa B

X = 84.5
Y = 107.842105
b)
VX = 0.27273876, VY = 0.31479111, los sueldos estn menos dispersos
en la empresa A.
c)
Mo = 80000 pesetas.
d)
IG(Y) = .200456171
e)
Z = Y + 10

Z = Y + 10 = 107.842105 + 10 = 117.842105

SZ =SY

34. Las notas finales de 100 estudiantes de una Escuela Superior son las
siguientes:
11
35
26
1
43
11
52
3
41
20

46
2
42
12
33
22
32
17
59
36

58
37
51
21
48
29
51
39
60
59

25
68
29
6
47
14
44
22
41
38

48
70
59
32
43
31
57
40
51
40

18
31
92
15
69
46
60
65
10
43

41
44
56
67
49
19
43
30
63
18

35
84
5
47
21
49
65
31
41
60

59
64
52
61
9
51
73
16
74
71

28
82
8
47
15
71
62.
80
81
44

Determinar:
1El nmero de estudiantes con nota superior a 80
2La nota del estudiante n 38 en orden a la peor puntuacin de la
distribucin del tipo III:
SOLUCIN:
Li-1 li
0-10
10-20
20-30
30-40
40-50

||||
||||
||||
||||
||||

|||
||||
||||
||||
||||

||
||||
||||

||||

ni
8
12
10
14
21

Ni
8
20
30
44
65

50-60
60-70
70-80
80-90
90-100

||||
||||
||||
|||
|

||||
||||

||||

16
10
5
3
1
100

81
91
96
99
100

Podemos decir que:


1 Nmero de estudiantes con nota superior a 50 e inferior a 80:

N 6 + N 7 + N8 = 16 + 10 + 5 = 31
2 Nota del estudiante nmero 38: De 30 a 40 puntos
35. Dada la siguiente distribucin de frecuencias:
Li-1 Li
-4 -2
-2 0
02
24
46

ni
4
3
2
4
1

1 Representarla grficamente
2 Obtener la serie de frecuencias acumuladas
3 Representar la distribucin de frecuencias acumuladas
SOLUCIN:
1 Representar grficamente el histograma:
Por tratarse de una distribucin con intervalos de igual amplitud, podemos
tomar la ni, como altura, obtenindose:
4,5
4
3,5
3
2,5

Serie1

2
1,5
1
0,5
0
[-4, -2]

[-2, 0]

[0, 2]

2 Serie de frecuencias acumuladas Ni:


Li-1 Li
-4 -2

ni
4

Ni
4

[2, 4]

[4, 6]

-2 0
02
24
46

3
2
4
1

7
9
13
14

3 Representacin grfica de la distribucin de frecuencias acumuladas:


16
14
12
10
8

Serie1

6
4
2
0
[-4, -2]

[-2, 0]

[0, 2]

[2, 4]

[4, 6]

Donde se han tomado hi=Ni por tratarse de una distribucin de intervalos de igual
amplitud.
36. Hallar la mediana de la siguiente distribucin de frecuencias:
Li-1 Li
01
12
23
34
45

ni
12
13
11
8
6

SOLUCIN:
Li-1 Li
01
12
23
34
45

ni
12
13
11
8
6
50

Ni
12
25
36
44
50

N 50
=
= 25
2
2
37. Se ha observado la vida de 280 bombillas obtenindose la siguiente distribucin:

Vida en horas
0 500
500 1000
1000 1500
1500 2000
2000 2500
2500 3000

N de bombillas
4
21
107
78
44
24
280

Hallar la moda.
SOLUCIN:
Se trata de una distribucin del tipo III con intervalos constantes.

Mo = Li 1 +

ni + 1
78
a1 = 1000 +
500 = 1000 + 394 = 1394
ni 1 + ni + 1
21 + 78

38. En una clnica se han registrado durante un mes las longitudes en


metros que los nios andan el primer dia que comienzan a caminar, obtenindose
los siguientes resultados.
Nmero de metros
Nmero de nios

1
2

2
6

3
10

4
5

5
10

6
3

7
2

8
2

Construir la distribucin de frecuencias adecuada para la variable longitud


y realizar los grficos pertinentes que la representen.
SOLUCIN:
Dado que se trata de una variable cuantitativa con valores sin agrupar, podemos
comenzar realizando su representacin mediante un diagrama de barras situado sobre el
eje de abscisas los valores de la variable X, y sobre el eje de ordenadas los valores de sus
frecuencias absolutas ni. Asimismo, si sobre el eje de ordenadas situamos las
frecuencias absolutas acumuladas Ni, obtenemos el diagrama de barras acumuladas. La
tabla de frecuencias relativas a la variable se presenta a continuacin.
La figura 1 muestra el diagrama de barras asociado a la variable y a la figura 2
muestra el diagrama de barras acumulado.
Distribucin de frecuencias.
Xi
1
2
3
4
5
6
7
8

ni
2
6
10
5
10
3
2
2

fk=nk/N
Fk=Nk/N

Ni
2
8
18
23
33
36
38
40

N=n1 ++nk=Nk

fi
0,05
0,15
0,25
0,125
0,25
0,075
0,05
0,05

Fi
0,05
0,2
0,45
0,575
0,825
0,9
0,95
1

Graficos.
Ni

ni
12

10

10
8

6
4
2

10

ni
3

0
1

45
40
35
30
25
20
15
10
5
0

Ni

FIGURA 1

FIGURA 2

39. La distribucin de los costes salariales de los 100 000 empleados de una
multinacional se presenta en la tabla siguiente:
Salarios
0-15000
15000-20000
20000-25000
25000-30000
30000-35000
35000-40000
40000-50000
50000-100000
100000-300000

N de empleados
2145
1520
840
955
1110
2342
610
328
150

Calcular el salario medio por trabajador, el salario ms frecuente y el


salario tal que la mitad de los restantes sea inferior a l. Calcular tambin el
primer cuartel salarial y el percentil 75.
SOLUCIN:
La tabla siguiente contiene los elementos relativos a la distribucin de frecuencia de
la variable salario (X) necesarios para realizar los clculos pedidos en el problema.
Salarios
0-15000
15000-20000
20000-25000

N de
empleados=
ni
2145
1520

Marcas = xi

xi* ni

Ni

ci

di= ni/ ci

7500
17500
22500

16087500
26600000
18900000

2145
3665
4505

15000
5000
5000

0,143
0,304
0,168

27500

26262500

5460

5000

0,191

32500

36075000

6570

5000

0,222

37500

87825000

8912

5000

0,4684

45000

27450000

9522

10000

0,061

75000

2460000

9850

50000

0,0056

200000

30000000

10000

200000

0,00075

40
25000-30000
55
30000-35000
110
35000-40000
342
40000-50000
10
50000-100000
28
100000-300000
50
293800000
0000

Para hallar el salario medio por trabajador calculamos la media de la variable X.

X=

1
N

i =1

xini=

293800000 29380
=
10000

Para hallar el salario ms frecuente se calcula la moda de la variable X. Para ello


hemos de tener presente que los intervalos de la distribucin de frecuencias son desiguales,
por lo que el intervalo modal ser el correspondiente al mayor valor de di, es decir ser el
intervalo (35000 40000). Por lo tanto la moda se calcula como sigue:
M0= Li-1 +

d i +1
0,061
ci=35000+
5000= 36077,74
di 1 + d i +1
0,222 + 0,061

Para hallar el salario tal que la mitad de los restantes sea inferior a l se calcula
la mediana. Para ello, como N/2 = 5000, el intervalo mediano ser (25000 3000) ya
que Ni-1 < N/2 < Ni es equivalente en este problema a 4505 < 5000 <5460. La mediana
se calcular como sigue:

N
10000
N i 1
2145
Me = Li-1 + 2
ci = 25000+ 2
5000 = 27591,62
ni
955
Para calcular el primer cuartel ( primer cuantil de orden 4) observamos que
como N/4 = 2500, el intervalo relativo al primer cuartel ser (15000-20000) ya que Ni1<2500<Ni es equivalente en este problema a 2145<2500<3665.El primer cuartel se
calcular como sigue:

N
10000
N i 1
2145
Q1,4 = Li-1+ 4
ci = 15000 + 4
5000 = 16167,76
1520
ni

El primer cuartel se interpreta como el valor de la variable para el que la cuarta


parte de los valores son menores que l y las tres cuartas partes restantes son superiores.
Para calcular el percentil 75 (cuantil 75 de orden 100), observamos que como
75N/100 = 7500, el intervalo relativo al percentil 75 ser (35000-40000) ya que Ni1<7500<Ni es equivalente en este problema a 6570<7500<8190. El percentil 75 se
calcular como sigue:
5,100 =Li-

75 N
75 *10000
N i 1
6570
100
100
1+
ci = 35000 +
5000 = 36985,48
ni
2342
El percentil 75 se interpreta como el valor de la variable para el que el 75% de
los valores son inferiores a l y el 25% restante son superiores.
El percentil 75 tambin podr haberse calculado como el tercer cuartil (cuantil
3de orden 4). Como 75N/100=7500=3N/4, el tercer cuartil se calculara como sigue:

Q3, 4

3N
3 * 10000
N i 1
6570
4
= Li 1 + 4
ci = 35000 +
5000 = 36985,48
ni
2342

El tercer cuartil se interpreta como el valor de la variable para el que las tres
cuartas partes de los valores son inferiores a l y la cuarta parte restante es superior.
Como las tres cuartas partes son el 75%, el percentil 75 coincide con el tercer cuartil.
40. Los rendimientos de cinco inversiones distintas realizadas por un
individuo y las cantidades iniciales invertidas en unidades monetarias son los
siguientes:
Cantidades iniciales
200 000
360 000
250 000
240 000
180 000

Rendimientos
1000
900
500
800
1200

Calcular el rendimiento medio por unidad monetaria invertida para el


total de inversiones del individuo.
SOLUCIN:
Como se trata de promediar rendimientos por unidad, estamos ante un caso de
aplicacin del concepto de media armnica. Calcularemos por tanto el rendimiento
medio pos unidad monetaria para el total de inversiones del individuo como la media
armnica de los rendimientos de cada inversin ponderada por las cantidades iniciales
desembolsadas en cada inversin.

H=
200000 + 360000 + 250000 + 240000 + 180000
N
= 793,5
=
k
200000 360000 250000 240000 180000
1
+
+
+
+

900
500
800
1200
i =1
xi 1000
Aunque en este problema es menos adecuada, podramos haber utilizado
tambin la media aritmtica ponderada, que se calcula como sigue:

X=
1
200000 *100 + 360000 * 900 + 250000 * 500 + 240000 * 800 + 180000 *120
=

x
i ni
N i =1
200000 + 360000 + 250000 + 240000 + 180000
k

X = 859,35
Tambin podra utilizarse la media geomtrica, ya que las cantidades a
promediar son no nulas y positivas. Para hallar esta media es conveniente aplicar
logaritmos (en este caso neperianos) y calcular el valor final como se indica a
continuacin:

G=

n1

n2

x x

nk

... x k ln(G ) =

1 k
ln( ) =
N i =1 ni xi

200000 * ln(100) + 360000 * ln(900) + 250000 * ln(500) + 240000 * ln(800) + 180000 * ln(120)
200000 + 360000 + 250000 + 240000 + 180000
=672 G=e6,72=828,82
41. En el cuadro siguiente se presentan los consumos de electricidad en
Espaa en miles de millones de de kw/hora desde diciembre en 1985 hasta
diciembre de 1986.
Meses
Dic
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Sep
Oct
Nov
Dic

Consumo
10.1
10.7
9.96
9.46
9.54
8.92
8.95
8.58
7.86
8.96
9.17
9.57
10.2

A partit de los incrementos unitarios de consumo de cada mes calcular el


incremento unitario anual medio acumulativo.
SOLUCIN:
Al tratarse de clculo de una media unitaria acumulativa, el promedio ms
adecuado es la media geomtrica. Se trata por tanto de calcular la media geomtrica de
los incrementos unitarios mensuales. Estos incrementos se calculan a continuacin.

10,7
= 1,06
10,1
9,58
= 1,07
8,95

9,96
= 0,93
10,7
7,86
= 0,82
9,58

9,46
= 0.95
9,96
8,96
= 1,14
7,86

9,54
= 1,008
9,45
9,17
= 1,02
8,96

8,92
= 0,93
9,54

8,95
= 1,003
8,92

9,57
10,2
= 1,04
= 1,06
9,17
9,57

La media geomtrica de estos incrementos unitarios mensuales se calcula como


sigue:

G = 12 1,06 * 0,93 * 0,95 * 1,008*,0,93 * 1,003 * 1,07 * 0,82 * 1,14 * 1,02 * 1,04 * 1.06 =1,01

42. Supongamos que un automvil recorre 60 km a una velocidad de 50 km/h y 40km/h a


una velocidad de 70 km/h Cul ser la velocidad media del automvil en todo el
recorrido?

SOLUCIN:
Al tratarse de clculo de una velocidad media utilizaremos la media armnica,
que se clcula como se indica a continuacin:

H=

N
60 + 40
=
= 56,45 km/h
60 40
1

n1 50 + 70
I =1 x1
k

En este caso, cualquier otro promedio que se utilice no produce la velocidad


media.
43. En una distribucin discreta de de 6 valores, a saber: -10, 3, a, 10, 1, 0, sabemos que su
desviacin tpica es igual al coeficiente de variacin de Pearson. Se pide:
a) hallar la media de la distribucin
b) hallar el valor desconocido de a
SOLUCIN:
a) como CV=s entonces se tiene que la media aritmtica vale 1, puesto que el
coeficiente de variacin de Pearson es el coeficiente entre la desviacin tpica y la
media aritmtica.
b) Aplicando el resultado obtenido en el apartado anterior se tiene que:
1= (-10+3+a+10+1+0) / 6
Despejando a de la expresin se tiene que a=2
44. Un examen consta de 5 preguntas en las que dos alumnos A y B obtienen las siguientes
calificaciones segn el orden de las preguntas:
A: 5,8,6,5,4
B: 3,7,8,6,3
a) Cul de los dos alumnos tuvo mejor nota sabiendo que los ejercicios 1, 3 y 4
puntan la mitad que los ejercicios 2 y 5?
b) si consideramos que todas las preguntas valen igual, Qu alumno obtendra
mejor calificacin si utilizamos la media geomtrica?
SOLUCIN:
a) se calcula la media ponderada con los pesos que se indican para cada uno de los
alumnos siendo el alumno con mayor media el que tuvo mejor nota.
Los pesos para los problemas 1, 3 y 4 ser 1 y para los problemas 2 y 5 ser 2. As obtendremos
los siguientes resultados:
A= (5*1 + 8*2 + 6*1 + 5*1 + 4*2) / (1+2+1+1+2)=5.714
B= (3*1 + 7*2 + 8*1 + 6*1 + 3*2) / (1+2+1+1+2)=5.286
Por tanto fue el alumno A el que obtuvo mejor calificacin.

b) Primero recordemos las expresiones de la media geomtrica


G=n ( xifi )
Si consideramos la media geomtrica, el alumno A obtiene una calificacin de 4.448 y el
alumno B una de 4.967
45. Una empresa ha realizado un test fsico entre sus empleados para comprobar la
capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que componen el
mismo es el nmero de pulsaciones despus de una determinada actividad fsica, que esta
altamente relacionada con las que se realizan a lo largo de una jornada laboral. Los datos
conseguidos han sido distribuidos en una tabla de frecuencias. La tabla resultante es la
que se presenta:
Numero de pulsaciones
70 75
75 80
80 85
85 90
90 95
95 100

Numero de empleados
3
3
7
10
12
8

Se pide:
a) media aritmtica, mediana, cuartil inferior, percentil 60 y desviacin tpica.
b) Qu tanto por cien de empleados tuvieron menos de 83 pulsaciones?
SOLUCIN:
a) media= 88.198
Me= 89.25
Q1= 83.393
P60= 91.167
b) 23.721%
46. En el marco de un estudio sobre la posible incidencia que tiene la religin profesada
por los distintos matrimonios en la presencia de una mayor menor frecuencia de
divorcios, se ha tomado una muestra aleatoria a nivel mundial de tamao 32000
Religin \ Divorcio
Catlicos
Ateos
Musulmanes
Protestantes
Otros

Divorcio
1435
845
160
610
1250

No divorcio
7565
2155
7840
4390
5750

SOLUCIN:
a) Basando tus razonamientos y afirmaciones en las frecuencias relativas que
resulten mas informativas para este estudio seala cual es la religin donde los
matrimonios presentan una mayor probabilidad de terminar en divorcio y cual es
en la que se dan menos.
En este caso las frecuencias que proporcionan ms informacin son las frecuencias relativas

condicionales de Divorcio/Religin.
Frec. Relativa (Divorcio/ Catlicos) = 1435/(1435+7565)=15.94% de los matrimonios
catlicos acaban en divorcio
Frec. Relativa (Divorcio/Ateos) = 845/(845+2155)=28.17% de los matrimonios ateos acaban
en divorcio
Frec. Relativa (Divorcio/Musulmanes) =160/(160+7840)=2% de los matrimonios
musulmanes acaban en divorcio
Frec. Relativa (Divorcio/Protestantes) = 610/(610+4390)= 12.2% de los matrimonios
musulmanes acaban en divorcio.
Frec. Relativa (Divorcio/ Otros) = 1250/(1250+5750)=17.9% de los otros matrimonios acaban
en divorcio
A partir de los datos se observa que en el caso de los ateos hay mas probabilidad de que los
matrimonios acaben en divorcio 28.17%. En la religin musulmana ocurrir justo lo contrario
con solo un 2% de divorcios.
b) Obtener las frecuencias marginales absolutas y relativas de la variable divorcio.
Frecuencias marginales de la variable divorcio:
Frecuencias absolutas marginales:
divorcio si: 4300
divorcio no: 27700
Frecuencias relativas marginales:
divorcio si: 4300/32000=13.44%
divorcio no:27700/32000=86.56%
47. Para estudiar la eficacia de un tratamiento sobre las resistencias de un determinado
hormign se ha realizado un ensayo sobre 15 probetas. Se han medido los das
transcurridos hasta que el hormign alcance la resistencia de 40MPa y los datos han sido
los siguientes:
15
15

13
9

10
16

28
13

12
10

17
19

18
11

14

SOLUCIN:
a)

Indicar la poblacin, la variable aleatoria implicada y de que tipo es esta


ultima.

La poblacin es todo el hormign de ese tipo. La variable aleatoria son el nmero de das
transcurridos hasta alcanzar los 40MPa.Cuantitativa y discreta
b)
9

Dibujar el diagrama Box-Whisker y comentar sus caractersticas principales


10
19

10
28

11

12

13

13

14

15

15

16

17

18

Mediana=14
Cuartil 1=11
Cuartil 3=17
IIC=Intervalo intercuartilico=17-11=6
C3+1.5*IIC=17+1.5*6=26
C1-1.5*IIC=11-1.5*6=2
El bigote de la izquierda llegar, como mucho a 2.Como el valor observado posterior es 9, el bigote
de la izquierda llegar a 9.
El bigote de la derecha llegar, como mucho a 26.Como el valor observado inmediatamente

anterior es 19,el bigote de la derecha llegara a 19


No existen puntos aislados por la izquierda.
Existe un valor observado superior a 26 (el valor 28), que se representar como un punto aislado en
el diagrama Box-whisker
c)
Qu signo cabe esperar que tenga el coeficiente de curtosis de los
datos?(Justifica la respuesta)
Se trata de una muestra con una distribucin simtrica y 1 dato aislado, probablemente dato
anmalo, pues dista mucho del resto de los datos, por lo tanto el coeficiente de curtosis ser
positivo.
48. La siguiente tabla muestra la cantidad de tierra de las regiones de un cierto pas, junto
con el porcentaje de tierra cultivada en cada region.
REGION
Norte
Sur
Este
Oeste

CANTIDAD DE TIERRA
421
350
259
80

% CULTIVADO
46.7
21.0
8.7
18.8

Calcula el porcentaje de tierra cultivada en la totalidad del pais


SOLUCIN:

xi = 421 + 350 + 259 + 80 = 1110


La tierra cultivada ser:

46.7 * 421 + 21 * 350 + 8.7 * 259 + 18.8 * 80


= 307.68
100
Por lo tanto, el porcentaje de tierra cultivada ser:

%=

307.68 *100
= 27.97
1100

49. Los alumnos de ltimo curso de Bachillerato de un Instituto eligen carrera segn los datos
de la tabla siguiente:
CARRERA MEDICINA DERECHO
250
176
ALUMNOS

CIENCIAS
127

LETRAS
314

INEF.
103

OTRAS
30

Construir la distribucin de frecuencias adecuada para la variable carrera elegida por los
alumnos y realizar los grficos pertinentes que la representen.
SOLUCIN:
Dado que se trata de una variable cualitativa, podemos comenzar realizando su representacin
mediante un diagrama de rectngulos, que se construye asignando a cada modalidad de la
variable cualitativa un rectngulo con altura igual (o proporcional) a su frecuencia absoluta ni y
con base constante. La tabla de frecuencias relativa a la variable se presenta a continuacin.

CARRERA
Medicina
Derecho
Ciencias
Letras
Inef
Otras

ALUMNOS
(ni)

fi = n i / N

250
176
127
314
103
30
N=1000

i=

0,25
0,176
0,127
0,314
0,103
0,03
1

360fi
90
63,36
45,72
113,04
37,08
10,8
360

El diagrama de barras se presenta en la siguiente Figura.


ESTUDIANTES POR CARRERAS

314
176
127

103

TR

AS

EF
IN

LE
TR

AS

30

M
ED
IC
IN
A
D
ER
EC
H
O
C
IE
N
C
IA
S

350
300 250
250
200
150
100
50
0

Figura
Tambin podra realizarse la representacin de la distribucin de frecuencias de muestra
variable cualitativa mediante el diagrama de sectores con porcentajes de la Figura 1-14. Los
porcentajes relativos a cada carrera se calculan mediante 100fi y los ngulos centrales de cada
sector se calculan mediante 360fi.
ESTUDIANTES POR CARRERAS

INEF
10%

LETRAS
31%

OTRAS
3%

CIENCIAS
13%

MEDICINA
25%
MEDICINA

DERECHO
18%

DERECHO
CIENCIAS
LETRAS
INEF
OTRAS

50. Las puntuaciones obtenidas por 100 opositores en el ltimo ejercicio se presentan en el
cuadro siguiente:
7
3
2
8
0
9
6
4
4
8
1.
2.
3.
4.
5.

3
2
5
6
2
7
1
6
7
5

2
4
6
3
1
3
0
2
6
2

4
9
5
4
5
4
5
1
3
7

5
8
4
0
6
3
7
1
5
1

1
1
7
10
4
5
8
2
0
4

8
0
1
2
3
7
5
6
2
6

6
2
3
5
5
4
2
7
8
3

1
4
0
7
2
6
3
4
2
5

5
1
5
4
3
5
10
5
7
6

Construir la distribucin de frecuencias adecuada para las puntuaciones.


Hallar el porcentaje de alumnos que aprob la oposicin.
Hallar el porcentaje de alumnos que sacaron notas superiores a 6.
Si slo hay 20 plazas En qu nota hay que situar el aprobado?
Realizar las representaciones grficas de la distribucin adecuadas para este problema.

SOLUCIN:
Para construir la distribucin de frecuencias de la variable aleatoria X que representa las
distintas calificaciones, tabulamos los datos haciendo un recuento de los opositores que obtienen
cada calificacin (frecuencias absolutas de cada calificacin) y derivando el resto de las
columnas de la tabla de frecuencias tal y como se indica a continuacin:
Xi

ni
0
1
2
3
4
5
6
7
8
9
10

6
10
13
11
13
16
11
10
6
2
2
N = 100

fi = n i / N
0,06
0,1
0,13
0,11
0,13
0,16
0,11
0,1
0,06
0,02
0,02
fi = 1

Ni
6
16
29
40
53
69
80
90
96
98
100

Fi = Ni /N
0,06
0,16
0,29
0,4
0,53
0,69
0,8
0,9
0,96
0,98
1

Puesto que las frecuencias relativas pueden interpretarse como el peso relativo de cada
valor en la distribucin, el porcentaje de alumnos que aprob la oposicin (o sea, que
obtuvieron un 5) ser la frecuencia relativa correspondiente al valor 5 de la variable, es decir, el
16 por ciento (0,16).
Puesto que las frecuencias absolutas acumuladas correspondientes a un valor dado de la
variable pueden interpretarse como el nmero de valores iguales o inferiores a ese valor dado,
resulta que para el valor 6 de la variable hay 80 opositores que obtuvieron una calificacin
inferior o igual a 6. Por lo tanto habr 20 opositores (100-80=20) que han obtenido una

calificacin superior a 6. Este resultado quiere decir que en caso de haber slo 20 plazas, la
nota mnima para superar la oposicin hay que situarla por encima del 6. Es decir, superarn la
oposicin los alumnos que obtengan ms de un 6.
El diagrama de barras y el polgono de frecuencias suelen ofrecer informacin sobre la
simetra y la normalidad de la distribucin. En este caso vemos que estas representaciones no se
desvan demasiado de una campana de Gauss, lo que indica que puede admitirse la normalidad
de los datos. En cuanto a la simetra se observa que la parte izquierda de la distribucin
aglomera ms frecuencia, por lo que podra haber una asimetra dbil en esa direccin. No
obstante, podra admitirse tambin la simetra, al igual que la normalidad con un margen de
error no muy elevado.

51. Los valores relativos al nmero de empresas y trabajadores en una determinada


regin son los siguientes:
1. Construir la distribucin de frecuencias adecuada a los datos.
2. Hallar el nmero de empresas con ms de 300 trabajadores.
3. Hallar el porcentaje de empresas con ms de 100 trabajadores y menos de 400
trabajadores
0-100
100-200
200-300
400-500
500-600
600-700
700-800
800-900
900-1000

N de empresas
25
37
12
22
21
13
5
3
2

SOLUCIN:
[Li-1;Li) ci
[0;100)
[100;200)
[200;300)
[400;500)
[500;600)
[600;700)
[700;800)
[800;900)
[900;1000)

ni
50
150
250
450
550
650
750
850
950

25
37
12
22
21
13
5
3
2

fi
Ni
0,178571
0,264286
0,085714
0,157143
0,15
0,092857
0,035714
0,021429
0,014286

25
62
74
96
117
130
135
138
140

Fi
0,178571
0,442857
0,528571
0,685714
0,835714
0,928571
0,964286
0,985714
1

Si observamos la columna de frecuencias absolutas acumuladas Ni de la tabla constatamos


que la frecuencia absoluta acumulada hasta empresas con 300 trabajadores es de 74 lo que
quiere decir que con ms de 300 trabajadores existen 140 74 = 66
Si observamos la columna de frecuencias relativas acumuladas fi de la tabla, tenemos que
el potcentaje de empresas con 400 trabajadores o menos es de 0,5286(52.865%), es decir,

el mismo que el correspondiente a 300 trabajadoreso menos (no se registraron empresas


con un nmero de trabajadores comprendido ente 300 y 400). Por otra parte, el
porcentaje de empresas con 100 trabajadores o menos es de 0,1786 (17,86%), lo que
indica que con ms de 100 y menos de 400 tenemos 0,5286 0,1786 = 0,35(35%).

52. Un examen consta de 5 preguntas en las que dos alumnos A y B obtienen las siguientes
calificaciones segun el orden de las preguntas:
A: 5, 8, 6, 5, 4.
B: 3, 7, 8, 6, 3.
a) cual de los dos alumnos tuvo mejor nota sabiendo que los ejercicios 1,3 y 4
puntuan la mitad que los ejercicios 2 y 5?
b) si consideramos que todas las preguntas valen igual, que alumno obtendra mejor
calificacion si utilizamos la media geometrica? y si usamos la media cuadratica?
SOLUCIN:
a) Se calcula la media ponderada con los pesos que se indican para cada uno de los alumnos
siendo el alumno con mayor media el que obtuvo mejor nota.
Los pesos para los problemas 1, 3 y 4 sera 1 y para los problemas 2 y 5 sera 2. asi, obtendremos
los siguientes resultados:

Por tanto fue el alumno A el que obtuvo mejor calificacion.


b) Primero recordemos las expresiones de la media geometrica y la media cuadratica:
k

G=

Xi fi
i 1

C=

1 k
fi Xi 2

n i 1

Si consideramos la media geometrica el alumno A obtiene una calificacion de 5.448 y el alumno


B una de 4.967.
Si consideramos la media cuadratica el alumno A obtiene un resultado de 5.762 y el alumno B
de 5.779.
53. En una distribucion discreta de 6 valores, a saber: -10,3,a,10,1,0, sabemos que su
desviacion tipica es igual al coeficiente de variacion de Pearson. Se pide:
a) Hallar la media de la distribucion
b) Hallar el valor desconocido de a.
SOLUCIN:
a)
Como CV=s entonces se tiene que la media aritmetica vale 1, puesto que el coeficiente de

variacion de Pearson es el cociente entre la desviacion tipica y la media aritmetica.


b)
Aplicando el resultado obtenido en el apartado anterior se tiene que:

Despejando a de la expresion anterior se tiene que a=2.


54. En un aparcamiento cobran por cada minuto que esta estacionado el vehiculo un euro
y veinte centimos. La ocupacin del parking en un dia fu:
TIEMPO DE ESTACIONAMIENTO
0-60
60-120
120-180
180-240
240-360
360-1440

NUMERO DE VEHICULOS
1240
3575
746
327
218
44

a) Obtener el tiempo medio de estacionamiento.


b)
A partir de que cantidad de tiempo un vehiculo esta estacionado mas que el 85%
de los vehiculos?
SOLUCIN:
LI-1- LI
0-60
60-120
120-180
180-240
240-360
360-1440

XI
30
90
150
210
300
900

NI
1240
3575
746
327
218
44
6150

XI.NI
37200
321750
111900
68670
65400
39600
644520

CI
60
60
60
60
120
1080

NI
1240
4815
5561
5888
6106
6150

Por lo tanto, el tiempo medio de aparcamiento es:

La medida de posicion que indica a partir de que cantidad de tiempo un vehiculo esta
estacioNado mas que el 85% de los vehiculos es el percentil 85.

Y la primera frecuncia acumulada que lo supera es N3=5561, con lo que el P85 esta en el
intervalo (120,180):

Es decir, a partir de 153.176944 minutos un vehiculo esta estacionado mas que el 85% de

los vehiculos.
55. Los porcentajes de participacin de los alumnos en las actividades extraescolares
durante los trimestres lectivos de los dos ltimos cursos sufri el siguiente aumento: el
primer trimestre 8%, el segundo 12%, el tercero 18%, el primer trimestre del ultimo
curso 27%, el segundo 40,5% , el tercero 60,75%. Calcular la media geomtrica del
porcentaje de participacin de los alumnos en esas actividades.
SOLUCIN:
n

Mg =

x
i =1

ni
i

Siendo en nuestro caso n = 6, x1 = 8, x2 = 12, x3 = 18, x4 = 27, x5 = 40,5, x6 = 60,75


y ni = 1 para todo i = 1,2,3,4,5,6, con lo que N = 6. Aplicando la formula anterior tenemos:
Mg =

8 * 12 * 18 * 27 * 40,5 * 60,75 = 6 114791256 = 22,04540769

Tambien se puede utilizar para el calculo de la media geometrica la formula anterior tomando
cualquier tipo de logaritmos. Usando logaritmos en base 10:

n log(x )
n

Mg = antilog

= antilog (

i =1

log(8) + log(12) + log(18) + log(27 ) + log(40,5) + log(60,75)


)
6

= antilog(1,343318135) = 22,04540769.
Entonces la media geometrica de la participacin de los alumnos es 22,0454%.
56. La cajera de una tienda va anotando los precios y las cantidades de los productos que
ha adquirido un cliente. En el ticket de compra aparece esta relacin:
Producto
Azcar
Aceite girasol
Leche
semidesnatada
Zumo
lata de refrescos
botella de vino

n
unidades

Precio/unidad
5
156
10
115

15
6
12
2

64
75
50
139

Cual ser el precio superado por la mitad de los productos?


SOLUCIN:
La pregunta se puede formular de otro modo: Cul es el valor que divide la distribucin en dos
partes?; es decir, Cul es el valor de la mediana?

Recordemos que para su clculo, los valores deben estar ordenados. La cajera, posiblemente por
comodidad o por falta de tiempo, no sigue esa estrategia. Va registrando segn llegan los
artculos. Colocando los precios de menor a mayor con el correspondiente numero de unidades
y hallamos las frecuencias absolutas acumuladas.
N
Producto
Precio
Ni
unidades
lata de refrescos
50
12
Leche semidesnatada
64
15
Zumo
75
6
aceite de girasol
115
10
botella de vino
169
2
Azcar
156
5

12
27
33
43
45
50

La mitad de los valores es N/2 = 50/2 =25. La primera frecuencia acumulada que lo supera es
N2 = 27. Esto significa que el precio correspondiente a la mediana es el de un litro de leche
semidesnatada: 64 pesetas
57. Completar la siguiente tabla para el estudio de la concentracin de una distribucin de
frecuencias y calcular el indice de gini. Comentar el resultado.
xi

ni
10
20
40
60
70

Ni
90
50
30
20
10

pi

si

90
140
170
190
200

Ai
900
1200
700

qi
900
1900
5000

0,86
1

SOLUCIN:
Los valores de pi se obtienen dividiendo las frecuencias acumuladas absolutas, Ni, entre el total
de datos, N:
Ni
90
140
170
190
200

pi = Ni/N
90/200 = 0,45
140/200 = 0,7
170/200 = 0,85
190/200 = 0,95
200/200 = 1

Los valores de si se calculan multiplicando los valores de la variable por las frecuencias
respectivas, si = xini , y los de Ai son los acumulados de la columna anterior, si:
i

Ai = s k
k =1

xi

ni
10
20
40
60
70

si = xi ni
90
900
900
50 20*50 = 1000
1900
30 40*30 = 1200
1900+1200 = 3100
20
1200 3100+1200 = 4300
10
700
5000

Dividiendo Ai entre An obtenemos qi:


Ai

qi = Ai/An
900 900/5000 = 0,18
1900 1900/5000 = 0,32
3100 3100/5000 = 0,62
4300
5000

0,86
1

Las diferencias pi qi:


pi

qi
0,45
0,7
0,85
0,95

0,18
0,38
0,62
0,86

pi -qi
0,45 - 0,18 = 0,27
0,70 - 0,38 = 0,32
0,85 - 0,62 = 0,23
0,95 - 0,86 = 0,09

2,95

0,91

Los valores de la ltima fila se han omitido, pues en la frmula del ndice de gini slo se suma
hasta el penltimo, n-1.
As, el ndice de Gini ser:

(p q )
n 1

IG =

i =1

n 1

p
i =1

0,91
= 0,30847458.
2,95

Podemos afirmar que la concentracin tiende a ser baja.


58. Cierta empresa se dedica a la elaboracin y a la venta directa de 4 productos. Estos
tienen diferentes precios y, cada dia, se venden determinadas cantidades.
Dicha informacin se recoge en la siguiente tabla:
Artculo
A
B
C
D

Precio
unitario
20
35
50
70

cantidad
300
225
150
50
725

Las condiciones del mercado provocan un aumento de la produccin en una unidad en


todos los productos, lo que hace bajar los precios segn aparece en la tabla:
Artculo
A
B
C
D

Precio
unitario
18
33
46
63

cantidad
301
226
151
51

729
Cmo varia el ingreso total, teniendo en cuenta estos cambios? Y el ingreso medio?
Desde el punto de vista de la dispersin, hay cambios significativos?
SOLUCIN:
Realizamos los clculos para los primeros datos en la tabla:
Precio
unitario

Artculo
A
B
C
D

20
35
50
70

Cantidad
pi qi
300
225
150
50
725

6000
7875
7500
3500
24875

pi qi
120000
275625
375000
245000
1015625

El volumen total de produccin es N = 725. El ingreso total es


n

p q = 24875,
i =1

Y el ingreso medio
n

X=

pq
i

i =1

24875
= 34,3103448 u.m.
725

Varianza:
n

S2 x =

p
i =1

2
i

1015625
- 34,31034482 = 223,662307,
725

Y la desviacin tpica
Sx =

223,662307 = 14,9553438.

Con las nuevas condiciones del mercado, construimos la siguiente tabla:


Artculo
A
B
C
D

Precio
unitario
18
33
46
63

Cantidad
pi qi
301
226
151
51
729

En este segundo caso, el ingreso total

pi qi
5418
7458
6946
3213
23035

97524
246114
319516
202419
865573

p q = 23035,
i

i =1

Y el ingreso medio
n

Y =

pq
i

i =1

23035
= 31,59808.
729

La varianza
n

S2 y =

p q
2

i =1

Y =

865573
31,59808 2 = 188,904304
729

y la desviacin tpica
Sy =

188,904304 = 13,744246.

De acuerdo con esto, el ingreso total y el medio es superior en el primer caso.


Desde el punto de vista de la dispersin, podemos comparar ambos resultados a traves del
coeficiente de variacin de pearson:
Vx =

Vy =

14,9553438
= 0,435884392
34,3103448

13,744246
= 0,434971.
31,59808

S
Y

Que indica que no han cambiado mucho los resultados en relacion con la media.
59. Una fbrica de coches desea estudiar el consumo de un nuevo modelo de coche que
quiere lanzar al mercado. Para ello realiza cien pruebas echando diez litros de gasolina y
viendo que distancia en kilmetros recorre el coche. Los resultados de las pruebas fueron
los siguientes:
85
91
91
92
89
90
92
91
89
89

90
87
87
90
88
88
88
88
90
87

91
88
90
90
91
88
92
88
93
88

88
88
84
90
89
94
92
92
89
88

91
90
91
93
90
91
88
89
91
93

91
90
88
90
90
90
89
87
92
90

86
89
90
89
88
92
88
88
89
95

92
90
88
92
90
87
91
88
85
89

90
90
88
91
89
90
89
91
86
92

89
89
88
92
86
91
91
88
91
89

a) obtener la distribucin de frecuencias y su representacin grafica.

b) Agrupar estos valores en los intervalos [83.5-86.5), [86.5-89.5), [89.5-92.5) y [92.595.5). Obtener la correspondiente distribucin de frecuencias con las marcas de
clase, las amplitudes de los intervalos y las alturas. Representar grficamente la
distribucin.
SOLUCIN:
a) la distribucin de frecuencias es:
xi
84
85
86
87
88
89
90
91
92
93
94
95

ni
1
2
4
5
21
16
20
15
11
3
1
1
100

fi
0.01
0.02
0.04
0.05
0.21
0.16
0.20
0.15
0.11
0.03
0.01
0.01
1

Ni
1
3
7
12
33
49
69
84
95
98
99
100

Fi
0.01
0.03
0.07
0.12
0.33
0.49
0.69
0.84
0.95
0.98
0.99
1

Para representar grficamente esta distribucin de frecuencias, usaremos un diagrama lineal de


barras con su correspondiente polgono de frecuencias.

25
20
ni

15
10
5
0
84

85

86

87 88

89

90 91
xi

92

93 94

95

b) agrupando los intervalos tenemos:


Li-1-Li
83.5-86.5
86.5-89.5
89.5-92.5
92.5-95.5

xi
85
88
91
94

ni
7
42
46
5
100

fi
0.07
0.42
0.46
0.05
1

Ni
7
49
95
100

Fi
0.07
0.49
0.95
1

ci
3
3
3
3

hi
2.333
14
15.333
1.667

50
40
ni

30
20
10
0
85

88

xi

91

95

60. Los resultados en el anlisis del valor calrico (Kcal/racin) de 20m marcas de galletas
normales y 12 integrales, considerando como racin 5 o 6 galletas (30 gramos) son los
siguientes:
Normales

Kcal

integrales

kcal

Canente
Cura
Curra
Dan
Desa
Erus
Fomesa
Foleda
Fura
Gafin
Gelo
Hela
Hipu
Les
Mali
Neria
Pros
Riz
Suno
Veras

125
125
150
135
150
130
130
145
135
145
130
150
140
150
140
145
130
130
130
140

cura
fomesa
dan
desa
erus
gafin
les
mali
naria
sanli
suno
veras

135
135
130
135
125
140
150
135
135
145
150
130

a) Escribir y representar la distribucin de frecuencias


b) Calcular la media aritmtica, mediana y moda
SOLUCIN:
a) sea X la variable caloras por racin de galletas y ni las frecuencias absolutas, o sea nmero
de veces que se repite cada dato xi de la variable la distribucin de frecuencias es:
xi
ni
Ni
fi
Fi
125
3
3
0.09375
0.09375
130
8
11
0.25
0.34375
135
7
18
0.21875
0.5625
140
4
22
0.125
0.6875
145
4
26
0.125
0.8125

150

6
32

32

0.1875
1

Donde Ni son las frecuencias absolutas acumuladas, fi son las frecuencias relativas y Fi son las
frecuencias relativas acumuladas.

8
7
6
5
ni 4
3
2
1
0

3
125

130

135

140

145

150

xi

b) completamos la tabla con xini para calcular la media X


xi
125
130
135
140
145
150

ni
3
8
7
4
4
6
32

xi ni
375
1040
945
560
580
900
4400

Media: 137.5
Para la mediana veamos entre que valores de la columna de frecuencias acumuladas Ni esta
N/2= 16:
xi
125
130
135
1140
145
150

ni
3
8
7
4
4
6
32

Ni
3
11
18
22
26
32

N/2 =16 esta entre N2 y N3 como la distribucin es de datos sin agrupar, Me = x3 = 135.
La moda, por ser datos sin agrupar es el valor de la variable que ms se repite, es decir, el dato
que mas frecuencia absoluta tenga. Como la ni mxima es n2 = 8, la moda
Mo = x2 = 130.

You might also like