You are on page 1of 36

Captulo 1

Medidas de Posicion y Dispersion


Los fenomenos biologicos no suelen ser constantes, por lo que sera necesario que junto
a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que reeje dicha uctuacion. En este sentido
pueden examinarse varias caractersticas, siendo las mas comunes:
La tendencia central de los datos;
La dispersion o variacion con respecto a este centro;
Los datos que ocupan ciertas posiciones.
La simetra de los datos.
La forma en la que los datos se agrupan.
1
A lo largo de este captulo, y siguiendo este orden, iremos estudiando los estadsticos
que nos van a orientar sobre cada uno de estos niveles de informacion: valores alrededor de
los cuales se agrupa la muestra, la mayor o menor uctuacion alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones caractersticas de una distribucion
de frecuencias as como su simetra y su forma.
1.1. Estadsticos de tendencia central
Las tres medidas mas usuales de tendencia central son:
La media,
La mediana,
La moda.
1.1.1. La media o media aritmetica X
La media aritmetica de una variable estadstica es la suma de todos sus posibles valores,
ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable
X es
X f
i
h
i
x
1
f
1
h
1
... ... ...
x
k
f
k
h
k
la media es el valor que podemos escribir de las siguientes formas equivalentes:
X = x
1
h
1
+... +x
k
h
k
=
1
n
(x
1
f
1
+... +x
k
f
k
)
=
1
n
k

i=1
x
i
f
i
Si los datos no estan ordenados en una tabla, entonces
X =
x
1
+... +x
n
n
Observacion
Hemos supuesto implcitamente en la denicion de media que tratabamos con una variable
X discreta. Si la variable es continua tendremos que cambiar los valores de x
i
por las
marcas de clase correspondientes. En general, la media aritmetica obtenida a partir de
las marcas de clase m
i
, diferira de la media obtenida con los valores reales, x
i
. Es decir,
2
habra una perdida de precision que sera tanto mayor cuanto mayor sea la diferencia entre
los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes a
i
, de
los intervalos.
Ejemplo 1.1. Calcular la media aritmetica de la distribucion de frecuencias de los 45
ingresos quincenales del ejemplo 1.6
Solucion
Del cuadro 1.6 tenemos:
X =
1
n
k

i=1
m
i
f
i
=
2702
45
= $60,04
Proposicion 1.1. Dados r grupos con n
1
, n
2
, ..., n
r
observaciones y siendo X
1
, X
2
,...,X
r
las respectivas medias de cada uno de ellos. Entonces la media de las n = n
1
+n
2
+... +n
r
observaciones es
X =
n
1
X
1
+... +n
r
X
r
n
1
+... +n
r
Observacion
A pesar de las buenas propiedades que ofrece la media, esta posee algunos inconvenientes:
a Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las
observaciones intervienen en el calculo de la media, la aparicion de una observacion
extrema, hara que la media se desplace en esa direccion. En consecuencia,
b No es recomendable usar la media como medida central en las distribuciones muy
asimetricas;
c Depende de la division en intervalos en el caso de variables continuas.
d Si consideramos una variable discreta, por ejemplo, el n umero de hijos en las familias
de Arequipa el valor de la media puede no pertenecer al conjunto de valores de la
variable; Por ejemplo X = 2,5 hijos.
1.1.2. La mediana M
ed
Consideramos una variable discreta X cuyas observaciones en una tabla estadstica
han sido ordenadas de menor a mayor. Llamaremos mediana, M
ed
, al primer valor de la
variable que deja por debajo de s al 50 % de las observaciones.
La mediana es la medida promedio que depende del n umero de datos ordenados y no
de los valores de estos datos.
Ejemplo 1.2. Calcular la mediana para la siguiente serie de datos
3
a 120 3 14 1 99 7 30 2000 16
b 30 77 3 300 36 11 10000 29
Solucion
a La serie ordenada de los nueve datos es:
1 3 7 14 16 30 99 120 2000
La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos
cada uno. Esto es M
ed
= 16.
b La serie ordenada de los ocho datos es:
3 11 29 30 36 77 300 10000
La mediana en este caso, puede ser cualquier n umero situado entre 30 y 36, ya que
este dividira a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la
innidad de valores, se elige como mediana la semisuma de los dos valores centrales.
Esto es, M
ed
=
30+36
2
.
Mediana de datos tabulados
- Si los valores de una variable se tabulan en una distribucion de frecuencias por intervalos
el calculo de la mediana se determina aproximadamente por interpolacion a partir de la
distribucion de frecuencias acumuladas
Para calcular la mediana.
Primero se determina el intervalo I
i
= [L
i1
, L
i
[ que contiene a la mediana. Para esto,
se determina las frecuencias acumuladas F
i
y F
i1
de manera que:
F
i1

n
2
< F
i
La mediana M
ed
[L
i1
, L
i
[ intervalo de amplitud A, cuya frecuencia absoluta acumulada
es F
i
y la frecuencia absoluta es f
i
.
Segundo Se aplica la siguiente formula para el calculo de la mediana:
M
ed
= L
i1
+
n
2
F
i1
f
i
A
4
Si en lugar de las frecuencias absolutas se utilizan las relativas (o porcentajes), enton-
ces, haciendo h
i
=
f
i
n
, H
i
=
F
i1
n
en la formula de la mediana, se tiene:
M
ed
= L
i1
+
1
2
H
i1
h
i
A
Observacion
Entre las propiedades de la mediana, vamos a destacar las siguientes:
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de
las mismas. Por ello es adecuado su uso en distribuciones asimetricas.
Es de calculo rapido y de interpretacion sencilla.
A diferencia de la media, la mediana de una variable discreta es siempre un valor de
la variable que estudiamos (ej. La mediana de una variable n umero de hijos toma
siempre valores enteros).
Es funcion de los intervalos escogidos.
Ejemplo 1.3. Obtener la media aritmetica y la mediana en la distribucion adjunta. De-
terminar gracamente cual de los dos promedios es mas signicativo.
5
[L
i1
, L
i
[ f
i
[ 0 , 10 [ 60
[ 10 , 20 [ 80
[ 20 , 30 [ 30
[ 30 , 100 [ 20
[ 100 , 500 ] 10
Solucion
[L
i1
, L
i
[ f
i
A m mf
i
F
i
[ 0 , 10 [ 60 10 5 300 60
[ 10 , 20 [ 80 10 15 1200 140
[ 20 , 30 [ 30 10 25 750 170
[ 30 , 100 [ 20 70 65 1300 190
[ 100 , 500 ] 10 400 300 3000 200
Total 200 6550
La media aritmetica es:
X =
1
n
k

i=1
m
i
f
i
=
6550
200
= 32,75
La primera frecuencia absoluta acumulada que supera el valor
n
2
= 100 es F
i
= 140. Por
ello el intervalo que contiene a la mediana es [10,20[.Asi:
M
ed
= L
i1
+
n
2
F
i1
f
i
A = 10 +
200
2
60
80
10 = 15
Para ver la representatividad de ambos promedios, realizamos el histograma en la siguiente
gura , y observamos que dada la forma de la distribucion, la mediana es mas representa-
tiva que la media.
6
1.1.3. La moda M
o
Llamaremos moda a cualquier maximo relativo de la distribucion de frecuencias, es
decir, cualquier valor de la variable que mas veces se repite.
La moda no siempre existe y si existe, no siempre es unica.
Ejemplo 1.4. La moda de los datos:
a 7 9 7 8 7 4 7 13 7 es igual a 7. Esta serie de datos es unimodal.
b 5 3 4 5 7 3 5 6 3 es igual tanto a 3, como a 5. Esta serie de datos es bimodal.
c 31 11 12 19 no existe. (Tambien vale decir que cada uno de los datos es una moda).
Moda de datos tabulados por intervalos
En el caso de variables continuas (o discretas por intervalos) es mas correcto hablar de
intervalos modales. Una vez que este intervalo, [l
i1
, L
i
[, se ha obtenido, se utiliza la
siguiente formula para calcular la moda:
M
o
= L
i1
+
(
d
1
d
1
+d
2
)
A,
donde:
L
i1
: es el limite inferior del intervalo modal
d
1
= f
i
f
i1
, esto es, d
1
es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente anterior.
d
2
= f
i
f
i+1
, esto es, d
2
es igual a la frecuencia absoluta modal menos la frecuencia
absoluta del intervalo inmediatamente posterior.
A: es la amplitud del intervalo modal.
Observacion
a Es muy facil de calcular.
b Puede no ser unica.
c Es funcion de los intervalos elegidos a traves de su amplitud, n umero y lmites de los
mismos.
d Aunque el primero o el ultimo de los intervalos no posean extremos inferior o superior
respectivamente, la moda puede ser calculada.
Relacion entre media, mediana y moda
En el caso de distribuciones unimodales, la mediana esta con frecuencia comprendida entre
la media y la moda (incluso mas cerca de la media). En distribuciones que presentan cierta
7
inclinacion, es mas aconsejable el uso de la mediana. Sin embargo en estudios relacionados
con propositos estadsticos y de inferencia suele ser mas apta la media.
Veamos un ejemplo de calculo de estas tres magnitudes.
Ejemplo 1.5. Consideramos una tabla estadstica relativa a una variable continua, de la
que nos dan los intervalos, las marcas de clase m
i
, y las frecuencias absolutas, f
i
.
[L
i1
, L
i
[ m
i
f
i
[ 0 , 2 [ 1 2
[ 2 , 4 [ 3 1
[ 4 , 6 [ 5 4
[ 6 , 8 [ 7 3
[ 8 , 10 ] 9 2
Solucion
Para calcular la media podemos a nadir una columna con las cantidades m
i
f
i
. La suma de
los terminos de esa columna dividida por n = 12 es la media:
[L
i1
, L
i
[ m
i
f
i
F
i
m
i
f
i
[ 0 , 2 [ 1 2 2 2
[ 2 , 4 [ 3 1 3 3
[ 4 , 6 [ 5 4 7 20
[ 6 , 8 [ 7 3 10 21
[ 8 , 10 ] 9 2 12 18
Total 12 64
X =
1
n
k

i=1
m
i
f
i
=
64
12
= 5,33
La mediana es el valor de la variable que deja por debajo de s a la mitad de las n obser-
vaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, F
i
, y
vemos que eso ocurre en la modalidad tercera, es decir,
i = 3
[L
i1
, L
i
[= [4, 6[ Intervalo donde se encuentra la mediana
M
ed
= L
i1
+
n
2
F
i1
f
i
A = 4 +
12
2
3
4
2 = 5,5
Para el calculo de la moda, lo primero es encontrar los intervalos modales, buscando
los maximos relativos en la columna de las frecuencias absolutas, f
i
. Vemos que hay dos
modas, correspondientes a las modalidades i = 1, i = 3. En el primer intervalo modal,
8
[L
0
, L
1
[= [0, 2[, la moda se calcula como
M
o
= L
i1
+
(
d
1
d
1
+d
2
)
A = 0 +
(
2 0
(2 0) + (2 1)
)
2 = 1,33
En el segundo intervalo modal, [L
2
, L
3
[= [4, 6[, la moda se calcula como
M
o
= L
i1
+
(
d
1
d
1
+d
2
)
A = 4 +
(
4 1
(4 1) + (4 3)
)
2 = 5,5
En este caso, como se ve en la siguiente gura, la moda no toma un valor unico, sino el
conjunto M
o
= {1,33, 5,5}
1.2. Estadsticos de posicion
Para una variable discreta, se dene el percentil de orden k, como la observacion, P
k
,
que deja por debajo de si el k % de la poblacion. Esta denicion nos recuerda a la mediana,
pues como consecuencia de la denicion es evidente que M
ed
= P
50
. En el caso de una
variable continua, el intervalo donde se encuentra P
k
[L
i1
, L
i
[, se calcula buscando el
que deja debajo de si al k % de las observaciones. Dentro de el, P
k
se obtiene seg un la
relacion:
P
k
= L
i1
+
n
k
100
F
i1
f
i
A
Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distri-
bucion, por lo que no puede considerarsele como una medida de tendencia central.
9
Los cuartiles, Q
i
, son un caso particular de los percentiles. Hay 3, y se denen como:
Q
1
= P
25
Q
2
= P
50
= M
ed
Q
3
= P
75
De forma analoga se denen los deciles como los valores de la variable que dividen a las
observaciones en 10 grupos de igual tama no. Mas precisamente, denimos D
1
, D
2
, ..., D
9
como:
D
i
= P
10
, i = 1, ..., 9
Los percentiles (que incluyen a la mediana, cuartiles y deciles) tambien son denominados
estadsticos de posicion.
Ejemplo 1.6. Dada la siguiente distribucion en el n umero de hijos de cien familias, hallar
sus cuartiles.
x
i
f
i
F
i
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
Total 100
Solucion
1. Primer cuartil:
n
4
= 25; Primer F
i
>
n
4
= 39; luego Q
1
= 2
2. Segundo cuartil:
2n
4
= 50; Primer F
i
>
2n
4
= 65; luego Q
2
= 3
3. Tercer cuartil:
3n
4
= 75; Primer F
i
>
3n
4
= 85; luego Q
3
= 4
Ejemplo 1.7. Calcular los cuartiles en la siguiente distribucion de una variable continua:
[L
i1
, L
i
[ f
i
F
i
[ 0 , 1 [ 10 10
[ 1 , 2 [ 12 22
[ 2 , 3 [ 12 34
[ 3 , 4 [ 10 44
[ 4 , 5 ] 7 51
Total 51
10
Solucion
1. Primer cuartil:
n
4
= 12,75; Primer F
i
>
n
4
= 22; luego la linea i es la del intervalo [1,2[
Q
1
= P
25
= L
i1
+
n
4
F
i1
f
i
A = 1 +
12,75 10
12
1 = 1,23
2. Segundo cuartil:
2n
4
= 25,5; Primer F
i
>
2n
4
= 34; luego la linea i es la del intervalo [2,3[
Q
2
= P
50
= L
i1
+
2n
4
F
i1
f
i
A = 2 +
25,5 22
12
1 = 2,29
3. Tercer cuartil:
3n
4
= 38,25; Primer F
i
>
3n
4
= 44; luego la linea i es la del intervalo [3,4[
Q
3
= P
75
= L
i1
+
3n
4
F
i1
f
i
A = 3 +
38,25 34
10
1 = 3,445
Ejemplo 1.8. Han sido ordenados los pesos de 21 personas en la siguiente tabla:
[L
i1
, L
i
[ f
i
[ 38 , 45 [ 3
[ 45 , 52 [ 2
[ 52 , 59 [ 7
[ 59 , 66 [ 3
[ 66 , 73 ] 6
Total 21
Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo n umero de
observaciones.
Solucion
Las cantidades que buscamos son los tres cuartiles: Q
1
, Q
2
y Q
3
. Para calcularlos, le
a nadimos a la tabla las columnas con las frecuencias acumuladas, para localizar que in-
tervalos son los que contienen a los cuartiles buscados:
[L
i1
, L
i
[ f
i
F
i
[ 38 , 45 [ 3 3
[ 45 , 52 [ 2 5
[ 52 , 59 [ 7 12 Q
1
, Q
2
[ 59 , 66 [ 3 15
[ 66 , 73 ] 6 21 Q
3
Total 21
11
Q
1
y Q
2
se encuentran en el intervalo [52,59[, ya que F
3
= 12 es la primera frecuencia de
distribucion acumulada que supera a
n
4
y
2n
4
.
Q
3
esta en [66,73[, pues F
5
= 21 es es la primera frecuencia de distribucion acumulada
que supera a
3n
4
As se tiene que::
Q
1
= P
25
= L
i1
+
n
4
F
i1
f
i
A = 52 +
5,25 5
7
7 = 52,25
Q
2
= P
50
= L
i1
+
2n
4
F
i1
f
i
A = 52 +
10,5 5
7
7 = 57,5
Q
3
= P
75
= L
i1
+
3n
4
F
i1
f
i
A = 66 +
15,75 15
6
7 = 66,875
Observese que Q
2
= M
ed
. Esto es logico, ya que la mediana divide a la distribucion en dos
partes con el mismo n umero de observaciones, y Q
2
, hace lo mismo, pues es deja a dos
cuartos de los datos por arriba y otros dos cuartos por abajo.
Ejemplo 1.9. La distribucion de una variable tiene por polgono acumulativo de frecuen-
cias el de la siguiente gura. Si el n umero total de observaciones es 50:
a Elaborar una tabla estadstica con los siguientes elementos: intervalos, marcas de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias
relativa acumulada
b Calcule la moda
c Determine los cuartiles
12
Solucion
a En la siguiente tabla se proporciona la informacion pedida y algunos calculos auxiliares
que nos permitiran responder a otras cuestiones
[L
i1
, L
i
[ f
i
F
i
h
i
H
i
m
i
A
[ 0 , 5 [ 10 10 0.2 0.3 2.5 5
[ 5 , 7 [ 25 35 0.5 0.7 6 2
[ 7 , 12 [ 5 40 0.1 0.8 9.5 5
[ 12 , 15 ] 10 50 0.2 1 13.5 7
Total 50
b Calculemos la moda:
M
o
= L
i1
+
(
d
1
d
1
+d
2
)
A = 5 +
(
1
2 + 1
)
2 = 5,66
c
Q
1
= P
25
= L
i1
+
n
4
F
i1
f
i
A = 5 +
12,5 10
25
2 = 5,2
Q
2
= P
50
= L
i1
+
2n
4
F
i1
f
i
A = 5 +
25 10
25
2 = 6,2
Q
3
= P
75
= L
i1
+
3n
4
F
i1
f
i
A = 7 +
37,5 35
5
5 = 9,5
1.3. Medidas de variabilidad o dispersion
Los estadsticos de tendencia central o posicion nos indican donde se sit ua un grupo de
puntuaciones. Los de variabilidad o dispersion nos indican si esas puntuaciones o valores
estan proximas entre s o si por el contrario estan o muy dispersas.
Una medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene
restando el valor mas bajo de un conjunto de observaciones del valor mas alto. Es facil
de calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:
No utiliza todas las observaciones (solo dos de ellas);
Se puede ver muy afectada por alguna observacion extrema;
El rango aumenta con el n umero de observaciones, o bien se queda igual. En cualquier
caso nunca disminuye.
13
En el transcurso de esta seccion, veremos medidas de dispersion mejores que la anterior.
Estas se determinan en funcion de la distancia entre las observaciones y algun estadstico
de tendencia central.
Las principales medidas de dispersion son:
El rango
El rango intercuartil
La varianza
La desviacion estandar
El coeciente de variacion
1.3.1. El Rango R
Denicion 1.1. El rango de variacion R, de una serie de datos, es la diferencia entre sus
valores maximo y mnimo. Esto es:
R = X
max
X
min
Siendo X
max
el valor maximo y X
min
el valor mnimo.
El rango es una medidad de dispersion muy facilmente calculable, pero es muy ines-
table, ya que depende unicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se a nade o elimina un solo dato.
Ejemplo 1.10. Dadas las dos series de datos
a 15 20 20 25; R = 25 15 = 10
b 195 200 200 200 200 200 200 200 205; R = 205 195 = 10
Claramente puede apreciarse que en la segunda serie los datos estan menos dispersos, Pues
en ella hay mayor cantidad de datos parecidos a su promedio.
1.3.2. Rango Intercuartil RI
Denicion 1.2. El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y
primero. Esto es
RI = Q
3
Q1
El Rango intercuartil es una medida que excluye el 25 % mas alto y el 25 % mas bajo,
dando un rango dentro del cual se encuentra el 50 % central de los datos observados y a
diferencia del rango total no se encuentra afectada por los valores extremos.
14
1.3.3. Varianza y desviacion estandar
1. Varianza de datos no tabulados
La varianza de n valores x
1
, x
2
, ..., x
n
de alguna variable cuntitativa X cuya media
es X, es el n umero:
S
2
=
n

i=1
(x
i
X)
2
n
Es facil ver que:
S
2
=
n

i=1
x
2
i
n
X
2
2. Varianza de datos tabulados
Variable disdreta
La varianza de n valores de una variable estadstica X que se clasican en k valores
distintos x
1
, x
2
, ..., x
k
con frecuencias absolutas respectivas f
1
, f
2
, ..., f
k
y cuya media
es X se calcula con la siguiente formula:
S
2
=
n

i=1
f
i
(x
i
X)
2
n
Se verica que:
S
2
=
n

i=1
f
i
x
2
i
n
X
2
Varinaza de datos tabulados por intervalos
La varianza de n valores de una variable estadstica X tabulados k intervalos con
marcas de clases m
1
, m
2
, ..., m
k
con frecuencias absolutas respectivas f
1
, f
2
, ..., f
k
y
cuya media es X se calcula con la siguiente formula:
S
2
=
n

i=1
f
i
(m
i
X)
2
n
Se verica que:
S
2
=
n

i=1
f
i
m
2
i
n
X
2
3. Desviacion estandar S
La desviacion estandar se dene como la raz cuadrada de la varianza, esto es:
S =

S
2
15
1.3.4. Coeciente de variaci on CV
Hemos visto que las medidas de centralizacion y dispersion nos dan informacion sobre
una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para compa-
rar dos poblaciones. Por ejemplo, si nos piden comparar la dispersion de los pesos de las
poblaciones de elefantes de dos circos diferentes, nos dara informacion util.
Pero que ocurre si lo que comparamos es la altura de unos elefantes con respecto a su
peso? Tanto la media como la desviacion tpica, y , se expresan en las mismas unidades
que la variable. Por ejemplo, en la variable altura podemos usar como unidad de longitud
el metro y en la variable peso, el kilogramo. Comparar una desviacion (con respecto a la
media) medida en metros con otra en kilogramos no tiene ning un sentido.
El problema no deriva solo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa, de
dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso
en toneladas de una poblacion de 100 elefantes con el correspondiente en miligramos de
una poblacion de 50 hormigas.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por
ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefan-
tes (toneladas). Si la ingeriera genetica no nos sorprende con alguna barbaridad, lo logico
es que la dispersion de la variable peso de las hormigas sea practicamente nula (Aunque
haya algunas que sean 1000 veces mayores que otras!)
En los dos primeros casos mencionados anteriormente, el problema viene de la dimen-
sionalidad de las variables, y en el tercero de la diferencia enorme entre las medias de
ambas poblaciones. El coeciente de variacion es lo que nos permite evitar estos pro-
blemas, pues elimina la dimensionalidad de las variables y tiene en cuenta la proporcion
existente entre medias y desviacion tpica. Se dene del siguiente modo:
CV =
S
X
Observacion
Es importante destacar que los coeentes de variacion sirven para comparar las variabi-
lidades de dos conjuntos de valores (muestras o poblaciones), mientras que si deseamos
comparar a dos individuos de cada uno de esos conjuntos, es necesario usar los valores
tipicados.
16
1.4. Valores Estandarizados o Tipicados Z
Se conoce por Estandarizacion al proceso de restar la media y dividir por su desviacion
tpica a una variable X. De este modo se obtiene una nueva variable:
Z =
X X
S
Donde Z = 0 y S
2
Z
= 1 Esta nueva variable carece de unidades y permite hacer compara-
bles dos medidas que en un principio no lo son, por aludir a conceptos diferentes. As por
ejemplo nos podemos preguntar si un elefante es mas grueso que una hormiga determina-
da, cada uno en relacion a su poblacion. Tambien es aplicable al caso en que se quieran
comparar individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos com-
parar el nivel academico de dos estudiantes de diferentes Universidades para la concesion
de una beca de estudios, en principio sera injusto concederla directamente al que posea
una nota media mas elevada, ya que la dicultad para conseguir una buena calicacion
puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de
uno de los estudiante y favorece al otro. En este caso, lo mas correcto es comparar las
calicaciones de ambos estudiantes, pero estandarizados cada una de ellas por las medias
y desviaciones estandar respectivas de las notas de los alumnos de cada Universidad.
Ejemplo 1.11. Dada la distribucion de edades (medidas en a nos) en un colectivo de 100
personas, obtener:
a La variable estandarizada Z.
b Valores de la media y varianza de Z.
c Coeciente de variacion de Z.
Horas trabajadas N umero de Empleados
[L
i1
, L
i
[ f
i
[ 0 , 4 [ 47
[ 4 , 10 [ 32
[ 10 , 20 [ 17
[ 20 , 40 ] 4
Total 100
Solucion
Para calcular la variable estandarizada:
Z =
X X
S
17
Partimos de los datos del enunciado. Sera necesario calcular en primer lugar la media y
desviacion tpica de la variable original (X).
[L
i1
, L
i
[ m
i
f
i
m
i
f
i
m
2
i
h
i
[ 0 , 4 [ 2 47 94 188
[ 4 , 10 [ 7 32 224 1568
[ 10 , 20 [ 15 17 255 3825
[ 20 , 40 ] 30 4 120 3600
Total 100 693 9181
X =
693
100
= 6,93
S
2
X
=
9,181
100
6,93
2
= 43,78
S
X
=

43,78 = 6,6
A partir de estos valores podremos calcular los valores tipicados para las marcas de clase
de cada intervalo y construir su distribucion de frecuencias:
z
1
=
2 6,93
6,6
= 0,745
z
2
=
7 6,93
6,6
= 0,011
z
3
=
15 6,93
6,6
= 1,22
z
4
=
30 6,93
6,6
= 3,486
z
i
f
i
z
i
f
i
z
2
i
f
i
-0.745 47 -35.015 26.086
0.011 32 0.352 0.004
1.220 17 20.720 25.303
3.486 4 13.944 48.609
Total 100 0.021 100.002
Z =
0,021
100
0
S
2
Z
=
100,02
100
0
2
1
S
Z
=

1 = 1
A pesar de que no se debe calcular el coeciente de variacion sobre variables que presenten
valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el porque:
CV =
S
Z
Z
=
1
0
=
18
Es decir, el coeciente de variacion no debe usarse nunca con variables estandarizadas.
1.5. Asimetra y apuntamiento
Sabemos como calcular valores alrededor de los cuales se distribuyen las observaciones
de una variable sobre una muestra y sabemos como calcular la dispersion que ofrecen
los mismos con respecto al valor de central. Nos proponemos dar un paso mas alla en
el analisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se
distribuyen de forma simetrica con respecto a un valor central, o si bien la graca que
representa la distribucion de frecuencias es de una forma diferente del lado derecho que
del lado izquierdo.
Si la simetra ha sido determinada, podemos preguntarnos si la curva es mas o menos
apuntada (larga y estrecha). Este apuntamiento habra que medirlo comparado a cierta
distribucion de frecuencias que consideramos normal (no por casualidad es este el nombre
que recibe la distribucion de referencia).
Estas ideas son las que vamos a desarrollar en lo que resta del captulo.
1.5.1. Estadsticos de asimetra
Para saber si una distribucion de frecuencias es simetrica, hay que precisar con res-
pecto a que. Un buen candidato es la mediana, ya que para variables continuas, divide
al histograma de frecuencias en dos partes de igual area. Podemos basarnos en ella para,
de forma natural, decir que una distribucion de frecuencias es simetrica si el lado
derecho de la graca (a partir de la mediana) es la imagen por un espejo del lado izquierdo
(como la siguiente gura).
19
Cuando la variable es discreta, decimos que es simetrica, si lo es con respecto a la media.
Observacion
Se podra pensar que denir la simetra con usando la mediana para variables con-
tinuas y usando la media para variables discretas es una eleccion arbitraria. En
realidad esto no es as, pues si una variable es continua, coinciden los ambos criterios
de simetra (con respecto a la media y a la mediana). Es mas, se tiene que media y
mediana coinciden para distribuciones continuas simetricas. Por otro lado,
en el caso de variables discretas, la distribucion es simetrica si el lado derecho del
diagrama se obtiene por imagen especular desde la media. En este caso coincide la
media con la mediana si el n umero de observaciones es impar.
Si la variable es continua simetrica y unimodal, coinciden la media, la mediana y la
moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales
(gura ):
Asimetra positiva:
Si las frecuencias mas altas se encuentran en el lado izquierdo de la media, mientras que
en derecho hay frecuencias mas peque nas (cola).
Asimetra negativa:
Cuando la cola esta en el lado izquierdo.
Cuando realizamos un estudio descriptivo es altamente improbable que la distribucion
de frecuencias sea totalmente simetrica. En la practica diremos que la distribucion de
frecuencias es simetrica si lo es de un modo aproximado. Por otro lado, a un observando
20
cuidadosamente la graca, podemos no ver claro de que lado estan las frecuencias mas
altas. Conviene denir entonces unos estadsticos que ayuden a interpretar la asimetra, a
los que llamaremos ndices de asimetra, y que denotaremos mediante A
s
. Vamos a denir
a continuacion algunos de los ndices de asimetra mas usuales como son el ndice basado
en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media
o la media y la mediana.
1.5.2.

Indice basado en los tres cuartiles
Si una distribucion es simetrica, es claro que deben haber tantas observaciones entre
la que deja por debajo de s las tres cuartas partes de la distribucion y la mediana, como
entre la mediana y la que deja por debajo de s un cuarto de todas las observaciones. De
forma abreviada esto es,
Q
3
Q
2
= Q
2
Q
1
Una pista para saber si una distribucion de frecuencias es asimetrica positiva tendremos :
Q
3
Q
2
> Q
2
Q
1
Por analoga, si es asimetrica negativa, se tendra
Q
3
Q
2
< Q
2
Q
1
Para quitar dimensionalidad al problema, utilizamos como ndice de asimetra la cantidad:
A
s
=
(Q
3
Q
2
) (Q
2
Q
1
)
Q
3
Q
1
El n umero obtenido, A
s
, es invariante ante cambios de origen de referencia y de escala.
Otros indices de asimetra
21
Basandonos en que si una distribucion de frecuencias es simetrica y unimodal, entonces
la media, la mediana y la moda coinciden, podemos denir otras medidas de asimetra,
como son:
A
s
=
X M
o
S
O bien,
A
s
=
3(X M
ed
)
S
Diremos que hay asimetra positiva si A
s
> 0 y negativa si A
s
< 0 (vease la siguiente
gura).
Ejemplo 1.12. Las edades de un grupo de personas se reejan en la tabla siguiente:
[L
i1
, L
i
[ f
i
[ 7 , 9 [ 4
[ 9 , 11 [ 18
[ 11 , 12 [ 14
[ 12 , 13 [ 27
[ 13 , 14 [ 42
[ 14 , 15 [ 31
[ 15 , 17 [ 20
[ 17 , 19 ] 1
Determinar la variabilidad de la edad mediante los estadsticos varianza, desviacion estandar,
coeciente de variacion y rango intercuartlico. Estudie la simetra de la variable.
Solucion
En primer lugar realizamos los calculos necesarios a partir de la tabla de frecuencias:
22
[L
i1
, L
i
[ f
i
m
i
F
i
mf
i
m
2
i
f
i
[ 7 , 9 [ 4 8 4 32 256
[ 9 , 11 [ 18 10 22 180 1800
[ 11 , 12 [ 14 11.5 36 161 1851.5
[ 12 , 13 [ 27 12.5 63 337.5 4218.75
[ 13 , 14 [ 42 13.5 105 567 7654.5
[ 14 , 15 [ 31 14.5 136 449.5 6517.75
[ 15 , 17 [ 20 16 156 320 5120
[ 17 , 19 ] 1 18 157 18 324
Total 157 2065 27742.25
La media es X =
2065
157
= 13,15 a nos. La varianza la calculamos a partir de la columna de
la x
2
i
f
i
como sigue:
S
2
=
27742,25
157
13,15
2
= 3,78 a nos
2
S =

3,78 = 1,94 a nos


El coeciente de variacion no posee unidades y es:
CV =
1,94
13,15
= 0,15 = 15 % de variabilidad
En lo que concierne a la simetra podemos utilizar el coeciente de asimetra para el cual
es preciso el calculo de los cuartiles:
Q
1
= 12 +
39,2536
27
1 = 12,12
M
ed
= Q
2
= 13 +
78,563
42
1 = 13,37
Q
3
= 14 +
117,75105
31
1 = 14,41
Lo que nos dice que aproximadamente en un rango de Q
3
Q
1
= 2,29 a nos se encuentra
el 50 % central del total de observaciones Ademas:
A
s
=
(Q
3
Q
2
) (Q
2
Q
1
)
Q
3
Q
1
=
(14,41 13,37) (13,37 12,12)
14,41 12,12
= 0,09
Este resultado nos indica que existe una ligera asimetra a la izquierda (negativa). Un
resultado similar se obtiene si observamos la siguiente gura (Figura ) veremos que la
distribucion de frecuencias es unimodal, siendo la moda
M
o
= 13 +
42 27
(42 27) + (42 31)
1 = 13,57
En cuyo caso podemos usar como medida del sesgo:
A
s
=
X M
o
S
=
13,15 13,57
1,94
= 0,21
23
1.6. Ejercicios Propuestos
1. Una empresa grande de equipos deportivos esta probando el efecto de dos planes
publicitarios sobre las ventas de los ultimos 4 meses. Dadas las ventas que se ven
aqu, cual programa de publicidad parece producir el crecimiento promedio mas
alto en ventas mensuales?
Mes Plan 1 Plan 2
Enero 1657.0 4735.0
Febrero 1998.0 5012.0
Marzo 2267,0 5479.0
Abril 3432,0 5589,0
2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos connados en casa, desean evaluar sus servicios.
El n umero de comidas diarias que suministran aparece en la siguiente tabla de fre-
cuencia. Calcular la media, mediana y la moda e interprete.
N umero de comidas por da N umero de das
[0 , 5 [ 3
[ 5, 10 [ 6
[ 10 , 15 [ 5
[ 15 , 20 [ 8
[ 20 , 25 [ 2
[ 25 , 30 ] 3
3. Bill Karl compro 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones
a $30 cada una y 75 acciones a $35 cada una. Cual es el precio promedio por accion?.
4. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nacion
reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la me-
dia, la mediana y la moda. Ademas, calcule e interprete: Q
1
, Q
2
, D
1
, D
6
, P
15
, P
90
.
Edades Frecuencia
[50 , 55 [ 8
[ 55, 60 [ 13
[ 60 , 65 [ 15
[ 65 , 70 [ 10
[ 70 , 75 [ 3
[ 75 , 80 ] 1
24
5. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20. Deter-
mine la media de los datos.
[L
i1
, L
i
[ m
i
f
i
F
i
mf
i
[ , [ 880
[ , [ 1950
[ , [ 35 1800
[ , [ 13
[ , 200 [
[ , ] 4 70
6. Dada la siguiente distribucion de frecuencias, calcular el valor de nsabiendo que
la moda es 60 y pertenece al tercer intervalo.
[L
i1
, L
i
[ f
i
[ 16 , 32 [ 6
[ 32 , 48 [ n
[ 48 , 64 [ 8
[ 64 , 80 [ 3n
[ 80 , 96] 3
7. En un examen de estadstica tomado el mismo da y hora a los tres grupos del tercer
ciclo de Ingeniera de Sistemas: A , B y C con un total de 150 alumnos se obtuvo
una nota promedio de 13,2 , las notas promedio de los grupos A y B fueron 12 y 14
respectivamente; los registros del grupo C se extraviaron pero se sabe que el grupo
A es el 36 % del total y que el n umero de alumnos del grupo B es la tercera parte
de las matriculadas en el grupo C.
a Hallar la nota promedio del grupo C.
b Calcular la nota promedio de los grupos A y C juntos.
8. La siguiente tabla de distribucion de frecuencias muestra la edad de un grupo de
personas. Si ademas se sabe que la moda es 27,5.
[L
i1
, L
i
[ [10,20[ [20,30[ [30,40[ [40,50]
f
i
a 30 a + 10 20
a Hallar el valor de a.
b Bajo que edad se encuentra el 35 % mas joven?
c Cuantas personas tienen como mnimo 20 a nos? Justique.
25
9. De un grupo de peque nas empresas se sabe que ninguna tiene mas de 5 trabajadores
ni menos de 2, la mayora tiene 3 trabajadores, el 20 % tiene 5 trabajadores, 2 de
cada 20 empresas tiene 4 trabajadores; la proporcion de empresas que tienen dos
trabajadores es 0,25. Calcular e interpretar la media aritmetica.
10. Dada la siguiente distribucion de frecuencias:
[L
i1
, L
i
[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70]
f
i
3 1 2 6 x
Hallar el valor de x si se sabe que la mediana es 61,6.
11. Los siguientes datos corresponden a los sueldos de los trabajadores de una compa na.
Sueldos N
ro
de trabajadores
[ 950 , 1000 [ 5
[ 1000 , 1050 [ 12
[ 1050 , 1100 [ 9
[ 1100 , 1150 [ 8
[1150 , 1200[ 4
[1200 , 1250[ 10
[1250 , 1300[ 6
a Calcular e interpretar la media aritmetico.
b Si a cada trabajador se le duplica el sueldo pero a la vez se le hace un descuento
de 150 soles, cual sera el nuevo sueldo promedio?
c Si cada trabajador recibe un incremento del 30 % de su sueldo, cual sera el nuevo
sueldo promedio?
d Si cada trabajador recibe un aumento de 270 soles y al mismo tiempo se decreta
un descuento del 3,5 % del nuevo haber, cual es el sueldo promedio?
12. En un examen tomado a tres secciones de un curso de estadstica de 91 alumnos,
el puntaje medio general fue de 69,3. Los puntajes medios de las secciones 1 y 2
fueron 70,4 y 64,2 respectivamente. Se perdieron los archivos con las notas de la
seccion 3 pero los ayudantes recuerdan que las secciones 1 y 2 tenan exactamente el
mismo n umero de alumnos, mientras que el ayudante de la seccion 3 menciona que
su seccion tena 5 estudiantes menos que la 1. Cual es el promedio de las notas de
la seccion 3?
26
13. Una fabrica de aparatos electronicos ha comenzado un estudio para mejorar su e-
ciencia. Efectuo para esto un relevamiento en las seccion de armado de visores para
computadora durante 10 das consecutivos. La cantidad de visores armados diaria-
mente fueron:
30 20 50 80 40 50 60 30 70 50
Calcule todas las medidas de tendencia central proporcionando un signicado a su
valor de manera que sirva para los nes propuestos en el estudio.
14. La siguiente informacion es relativa a los sueldos de un grupo de trabajadores en una
compa na donde, el 12 % de ellos ganan S/530, el 24 % ganan S/560, el 20 % ganan
S/600, el 15 % ganan S/650, el 13 % ganan S/680 y el resto ganan S/700. Cual es
el salario medio?
15. En un grupo hay 40 estudiantes varones con una edad promedio de 20 a nos, las
mujeres son en promedio mas jovenes en un 10 %; cuantas mujeres hay si la edad
promedio de la clase es de 19 a nos?
16. El salario promedio mensual pagado a los trabajadores de una compa na es de $200.
Los salarios promedios mensuales pagados a hombres y mujeres de la compa na son
210 y 150 respectivamente. Determinar el porcentaje de hombres y mujeres que
trabajan en la compa na.
17. Una compa na minera tiene 100 trabajadores. Para los nombrados el haber maximo
es $450 y el mnimo $60. Hay un 5 % de eventuales (en prueba) que trabajan ad-
honorem o perciben compensaciones inferiores a $60. Quince trabajadores nombrados
perciben haberes inferiores a $250 y el 85 % ganan haberes inferiores a $400. Con
esta informacion, calcule las medidas de tendencia central posibles.
18. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. Se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg.
Cuantos estudiantes hay en cada grupo?.
19. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15 % de su sueldo mas 10 soles a
cada uno. Si la empresa dispone a lo mas de S/. 94,000 para pagar sueldos, cual
alternativa es mas conveniente?.
20. De una central telefonica salieron 70 llamadas de menos de 3 minutos promediando
2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de 3 minutos,
promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos promediando 15
minutos. Calcular la duracion promedio de todas las llamadas.
27
21. El sueldo medio de los obreros de una fabrica es de $286.
a Que porcentajes de hombres y mujeres trabajan en la fabrica si sus sueldos medios
respectivos son $300 y $260?.
b Si el 60 % de los obreros tienen menos de 30 a nos y percibe el 20 % del total de
los sueldos, cuanto es el sueldo medio de los obreros de al menos 30 a nos?
22. En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al
25 % del ya existente con un sueldo medio igual al 60 % de los antiguos. Si 3 meses
mas tarde se incrementan cada sueldo en 20 %, mas $30, cuanto es el nuevo salario
medio?.
23. Calcular todas las medidas de dispersion para la siguiente distribucion
X
i
5 10 15 20 25
f
i
3 7 5 3 2
24. Calcular todas las medidas de dispersion para los datos de la siguiente distribucion
[L
i1
, L
i
[ [0,100[ [100,200[ [200,300[ [300,800]
f
i
90 140 150 120
25. Se sabe que la media aritmetica de la siguiente distribucion es 11,5.
[L
i1
, L
i
[ [4,6[ [6,10[ [10,16[ [16,20[ [20,30]
f
i
4 5 x 3 1
Calcular la desviacion estandar
26. Si X es una variable que tiene media 15 y varianza 25; hallar la media, varianza y
desviacion tpica de Y en los siguientes casos:
a Y = 4 + 16X
b Y = 16 4X
c Y =
1
4
+
1
4
X
27. La produccion de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el depar-
tamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn.
con 1440000 de variancia, en que departamento se puede decir que la produccion de
papa es mas homogenea
28
28. Un grupo de trescientos alumnos llevan el curso de Estadstica y Probabilidad dis-
tribuidos en cuatro secciones. Si se sabe que el n umero de alumnos por seccion estan
en una progresion aritmetica cuya razon es 20 y ademas se conoce que las notas
promedio de las secciones A , C y D son 12, 14 y 11 mientras que las varianzas de
los grupos A y C son 16 y 4 y las desviaciones estandar de B y D son 3 y 1 respecti-
vamente. Si la nota promedio en el curso es 12,37; hallar e interpretar la desviacion
estandar de las cuatro secciones juntas.
29. En una empresa donde los salarios tienen una media S/. 2500 y una desviacion
estandar de S/. 300 el Sindicato solicita que cada salario X
i
se transforme en Y
i
,
mediante la siguiente relacion:
Y
i
= 3,5X
i
+ 10
El directorio acoge parcialmente la peticion rebajando los salarios propuestos por el
Sindicato en un 20 %, lo que es aceptado. Se pide calcular la varianza de la nueva
distribucion de salarios.
30. Se tienen tres empresa con aproximadamente igual n umero de trabajadores. El n ume-
ro de inasistencias registradas durante los ultimos seis meses en cada una de las tres
empresas se da a continuacion: Empresa:
A : 3 19 4 5 15 6
B : 7 8 11 9 14 16
C : 10 17 12 2 18 13
En cual de estas tres empresas existe mayor variabilidad con respecto al n umero de
inasistencias?
31. Una empresa de fabricacion de productos ceramicos dispone de tres centros de pro-
duccion. En el centro A, el mas grande y moderno, se hace un estudio de los m
2
de
azulejo producidos al mes durante el a no pasado, obteniendose una media de pro-
duccion mensual X
A
= 250000m
2
, con una desviacion estandar S
A
= 15000m
2
. Se
sabe que el centro B, por tener maquinaria mas anticuada que A, produce cada mes
un tercio de la produccion de A, y que el centro C, por tener un horno menos que
B, produce cada mes 25000 m
2
menos que B Cual es la media y la varianza de la
produccion mensual de C?
32. Se utiliza dos maquinas diferentes para fabricar conductos de salida de papel desti-
nados a copiadoras Kodak. Los conductos de una m uestra de la primera maquina
medan:
12,2, 11,9, 11,8, 12,1, 11,9, 12,4, 11,3 12,3
29
pulgadas. Los conductos hechos con la segunda maquina medan:
12,2, 11,9, 11,5, 12,1, 12,2, 11,9, 11,8
pulgadas. Si se desea utilizar la maquina que produzca conductos de tama nos mas
uniformes; que maquina debera utilizarse?
33. Un entrenador de pista y campo debe decidir a cual de sus dos velocistas selec-
cionara para los cien metros planos en una proxima competencia. El entrenador
basara la decision en los resultados de cinco carreras entre los dos atletas, celebradas
en un periodo de una hora, con descanso de 15 minutos. Los siguientes tiempos (en
segundos) se registraron para las cinco carreras:
Atleta Carrera
1 2 3 4 5
Mendoza 11,1 11.0 11.0 15.8 11.1
Ramirez 11.3 11.4 11.4 11.5 11.4
Con base en estos datos, a cual de los dos velocistas debe seleccionar el entrenador?
por que?
34. Las secciones A , B y C del curso de Estadstica y Probabilidad rinden el mismo
examen parcial. Los resultados obtenidos se registran en las siguientes tablas:
A A B B C C
X
i
F
i
[L
i1
, L
i
[ m
i
f
i
H
i
h
i
X
2
i
2.5 3 [2,6[ 16 0.1 2.5
7.5 8 [6,10[ 144 0.2 10
12.5 22 [10,14[ 240 0.8 86.4
17.5 30 [14,18[ 240 1 45
a En cual de las secciones las notas son mas homogeneas?
b Calcular e interpretar la desviacion estandar para las tres secciones juntas.
35. Durante un periodo de diez a nos, los precios de un producto fueron en promedio
de $80 con una desviacion estandar de $12. En el periodo anterior de 10 a nos,
el promedio fue de $50 con una varianza de $36. En que periodo hubo mayor
estabilidad?
36. En la seccion nanciera de un diario aparecio la distribucion de la variable discreta
adjunta. Se deca en el texto del artculo que la media aritmetica era 120 y la varianza
25. Desafortunadamente la publicacion aparecio con dos manchas de tinta, lo cual
30
impeda comprobar directamente la armacion. Son admisibles dichos valores de la
media y la varianza, teniendo en cuenta lo que puede verse del cuadro? Justicar.
X
i
105 110 115 120 125 130 135 140
f
i
37 90 95 85 60
37. Los alumnos de un grupo obtuvieron en matematica II una nota media de 68.7
puntos con una desviacion estandar de 15.4 y los de otro grupo obtuvieron en la
misma asignatura un promedio de 50.9 puntos con una desviacion estandar de 19.6.
Cu al de los dos grupos tiene un rendimiento mas heterogeneo?
38. Si la nota media de unos estudiantes varones es 3 y la desviacion estandar de sus
notas es 0.25 en tanto que las correspondientes cifras para las estudiantes mujeres
son 3.2 y 0.25 muestran menor variabilidad las notas de los estudiantes varones?
por que?
39. En el siguiente conjunto de n umeros, se proporcionan los pesos (redondeados a la
libra mas proxima) de los bebes nacidos durante un cierto intervalo de tiempo en un
hospital:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8,
9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
a Calcular las medidas de tendencia central.
b Calcular las medidas de dispersion.
c Es esta una distribucion sesgada? De ser as, en que direccion?
d Encontrar el percentil 24.
40. Con el n de observar la relacion entre la inteligencia y el nivel socioeconomico
(medido por el salario mensual familiar) se tomaron dos grupos, uno formado con
sujetos de cociente intelectual inferior a 95 y otro formado por los demas; De cada
sujeto se anoto el salario mensual familiar. Teniendo en cuenta los resultados que se
indican en la tabla:
Nivel Socioeconomico Sujetos con CI< 95 Sujetos con CI 95
[L
i1
, L
i
[ f
i
f
i
[ 4 , 10 [ 75 19
[ 10 , 16 [ 35 26
[ 16 , 22 [ 20 25
[ 22 , 28 [ 30 30
[ 28 , 34 [ 25 54
[ 34, 40 ] 15 96
31
a Dibuje un graco que permita comparar ambos grupos.
b Calcule las medidas de tendencia central para aquellos sujetos con CI 95.
c Calcular las medidas de dispersion para aquellos sujetos con.
41. Un estudio consistio en anotar el n umero de palabras ledas en 15 segundos por un
grupo de 120 sujetos dislexicos y 120 individuos normales. Teniendo en cuenta los
resultados de la tabla
Nro de palabras ledas Dislexicos n
D
Normales n
N
25 o menos 56 1
26 24 9
27 16 21
28 12 29
29 10 28
30 o mas 2 32
Calcule
a Las medias aritmeticas de ambos grupos.
b Las medianas de ambos grupos.
c El porcentaje de sujetos dislexicos que superaron la mediana de los normales.
d Compare la variabilidad relativa de ambos grupos.
42. En un estudio comparativo del porcentaje de rendimiento de ciertos bonos se ela-
boro una distribucion de frecuencias de 5 intervalos de amplitudes iguales, siendo las
marcas de clase primera y quinta 15 y 55 respectivamente. Si el 65 % de los bonos
rinden menos del 40 %, el 25 % menos del 30 %, el 90 % menos del 50 % y el 95 % al
menos 20 %,
a) Calcule los promedios de rendimiento.
b) Si el 50 % de los bonos de mayor rendimiento deben pagar un impuesto, a partir
de que rendimiento corresponde pagar impuesto?
c) Es la mediana, el punto medio entre los cuartiles 1 y 3? Justique.
43. Las ganancias diarias de los establecimientos de un centro comercial se presentan en
una tabla de frecuencias con 6 intervalos de clase constante y se sabe que: la mnima
ganancia es de $6, el rango es 36, el 50 % de los establecimientos ganan mas de 25.58
dolares diarios, H
2
= 0,15, F
2
= 120, h
3
= 0,25, H
5
= 0,93, f
4
= 304, f
2
= 2f1.
a) Reconstruir la distribucion de todas las frecuencias.
32
b) Hallar la ganancia mas frecuente y la ganancia promedio
c) Hallar la desviacion estandar
44. En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desvia-
cion estandar de 20 puntos En el curso B los alumnos obtienen una media de 80
y desviacion estandar de 16. Ante un reclamo se decide subir en 5 % mas 5 puntos
adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias
en el curso B se decidio disminuir la quinta parte de la calicacion. Despues de los
mencionados ajustes Cual es el puntaje medio de los 50 alumnos?
45. Al calcular la media y la desviacion estandar de 80 datos, resultaron 30 y 4 respec-
tivamente. Un chequeo mostro que en lugar del valor 1.7 se introdujo 17. Corrija la
media y la desviacion estandar.
46. Un conjunto habitacional esta formado por 3 edicios de departamentos. Se tiene
los siguientes datos respecto al consumo mensual de electricidad de cada uno de los
edicios.
Edicio 1: Tiene 8 departamentos, la media y la desviacion estandar de los consumos
es S/. 85 y S/. 12, respectivamente.
Edicio 2: Tiene 9 departamentos cuyos consumos en soles son 88, 92, 106, 110,
93, 102, 91, 94, 80.
Edicio 3: Los consumos se dan en la siguiente tabla.
Consumo en soles Departamentos
[50, 60[ 1
[60, 70[ 2
[70, 80[ 4
[80, 90] 3
a) Cual de los edicios tiene el menor consumo de electricidad?
b) En cual de los edicios los valores que representa los consumos estan mas dis-
persos?
c) Cual es el consumo promedio en todo el conjunto habitacional?
47. El salario promedio en una ciudad es de 11000u.m. con una variancia de 2000u.m.
Cuales seran la nueva media y la nueva variancia si se efect uan los siguientes cam-
bios:
a) Se aumenta 810u.m a todos
b) Se aumenta el 15 % de su salario a cada trabajador
33
c) Si se duplican los sueldos
48. En el mes de enero el promedio de los salarios de una empresa era de 40 unidades
monetarias (u.m.). En el mes de febrero la empresa considero un incremento del
25 % en el n umero de empleados, con un salario igual al 80 % del promedio de los
antiguos empleados. En el mes de marzo la empresa hizo efectivo un aumento del
25 % en el salario de cada uno de los empleados, mas una bonicacion de 20 u.m.
por escolaridad.
a) Halle el sueldo promedio de los salarios de los empleados en el mes de marzo
b) Calcule la tasa promedio de crecimiento de las medias de los sueldos entre enero
y marzo
49. Ochocientos alumnos de la especialidad de Educacion Fsica fueron sometidos a una
prueba de resistencia en la cual se observo el n umero de kilometros que podan correr
sin detenerse. Los datos recogidos se organizan en la siguiente tabla.
N
ro
de klometros m
i
f
i
h
i
F
i
H
i
[ ; [ 0.5475
[ ; [ 6
[ ; [ 0.15625
[ ; 16 [
[ ; [ 9
Total
a) Si se sabe que solo el 3.875 % de los alumnos corrieron al menos 12 kilometros
sin detenerse, complete la tabla usando 5 decimales y determine la resistencia
promedio de los alumnos
b) Los 60 alumnos con mayor resistencia fueron seleccionados. Estime la resistencia
media de ese grupo.
50. Se toman las medidas de 80 personas las que tienen estatura media de 1.70m y
desviacion estandar de 3.4cm. Posteriormente se verico que la media usada tenia 4
cm de menos. Rectique los estadsticos mencionados.
51. Multiplicando cada n umero 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos
el conjunto 11, 17, 9 7, 19 15. Cual es la relacion entre la desviacion estandar de
ambos conjuntos? Y entre las medias?
52. La distribucion de edades del Censo de Residentes a 1 de enero de 2007 para las
comunidades autonomas de Aragon y Canarias, en miles de personas, es la siguiente:
34
Edades Aragon Canarias
[0, 20[ 3.54 4.35
[20, 40[ 21.56 29.99
[40, 60[ 31.63 35.21
[60, 80[ 28.14 21.97
[80, 100] 15.12 8.48
a) Representa sobre los mismos ejes de coordenadas los polgonos de frecuencias de
la distribucion de la edad para las dos CC.AA. (emplea distinto trazo o distintos
colores). Que conclusiones obtienes a la vista de los histogramas?
b) Calcula la edad mediana para las dos comunidades. Comparalas. Que indican
estos resultados?
c) Que comunidad tiene mayor variabilidad en la distribucion de su edad? Demues-
tralo con la media, mediana, desviacion y varianza.
53. El costo inicial de produccion, X, de una muestra de 50 objetos de cierto tipo, tiene
una desviacion estandar de $3. La media de costos de produccion es de 25 para 30
objetos de la muestra y de $20 para el resto. El costo nal de produccion Y es dado
por la relacion:
Y = 1,15X + 2
Suponga que el precio de venta de cada objeto de la muestra es proporcional al
cuadrado del costo nal de produccion, cuanto se recaudara por la venta total de
los 50 objetos?
54. Los siguientes datos corresponden a los sueldos mensuales de los obreros que trabajan
en una compa na.
Sueldos N
o
de Obreros
[390, 420[ 12
[420, 450[ 35
[450, 580[ 26
[580, 610[ 8
[610, 740[ 20
[740, 770[ 10
[770, 850] 6
a) Hallar el sueldo que es excedido por el 50 % de los obreros.
b) Calcular el sueldo que gana la mayora de los obreros.
35
c) Se desea agrupar a los obreros en tres categoras: A, B y C teniendo en cuenta
sus sueldos. El 20 % inferior estaran en la categora C, el 25 % superior en la
categora A. Hallar los lmites entre estas categoras.
36