You are on page 1of 113

MEDIDAS DE POSICIN Y

DE TENDENCIA
MEDIDAS DE DISPERSIN, DE FORMACIN Y
APUNTAMIENTO
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-1
Bibliografa
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-2
Estadstica y muestreo (13a. ed.)
Martnez Bencardino, Ciro
Pginas: 898
Editorial: Ecoe Ediciones
Ubicacin: Colombia
Fecha de publicacin: 2012
Idioma: es

Estadstica descriptiva
Monroy Saldvar, Salvador
Pginas: 326
Editorial: Instituto Politcnico Nacional
Ubicacin: Mxico
Fecha de publicacin: 2008
Idioma: es

Introduccin a la Estadstica
para los Negocios
Ronald M. Weiers
Pginas: 326
Quinta Edicin
Idioma: es
ESTADISTICA PARA LA INGENIERIA
Tendencia Central
Media
Mediana
Moda
Cuartiles
Media Ponderada
Medidas para resumen
numrico de los datos
Variacin
Varianza
Desviacin Estndar
Coeficiente de
Variacin
Rango
Tendencia Central
Cuartiles
Varianza
Chap 3-3
2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
No comer la media, ni la mediana,
ni siquiera el primer decil.
Chap 3-4 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Los mtodos de representacin grfica proporcionan un
punto de partida para el anlisis de los datos. Sin
embargo, tambin es necesario estar familiarizado con
medidas descriptivas que proveen un resumen sencillo de
un conjunto de datos.

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-5
INTRODUCCION
En este capitulo analizaremos los mtodos
para representar los datos con un solo valor
numrico.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-6
OBJETIVOS
El objetivo en este capitulo es:

Describir los datos a travs de medidas de
tendencia central y de dispersin.
Utilizar la computadora para obtener una
representacin grafica de los datos con un
diagrama de caja.

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-7
INDICE
Medidas de tendencia central.
Cuartiles.
Medidas de Variacin - Variacin


Existen 2 grandes categoras de medidas que
resumen numricamente los datos:
Las medidas de tendencia central o de
posicin
Las medidas de variabilidad o de dispersin.

Chap 3-8 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Las medidas de tendencia central describen
la localizacin central de un conjunto de
observaciones numricas
Chap 3-9 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Las medidas de variacin describen la
dispersin o el grado de
homogeneidad/heterogeneidad de un conjunto
de datos



Chap 3-10 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Tendencia Central
Media
Mediana
Moda
Cuartiles
Media
Ponderada
Medidas para resumen
numrico de los datos
Variacin
Varianza
Desviacin Estndar
Coeficiente
de Variacin
Rango
Chap 3-11 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Medidas de Tendencia Central
n
x
x
n
i
i
=
=
1
Tendencia Central
Media Mediana Moda
Media Ponderada
Chap 3-12 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-13
Medidas de Tendencia Central
Son aquellas que determinan los valores centrales de los datos de un
experimento. Existen varios tipos de medidas de tendencia central, aqu
estudiaremos la media, la mediana y la moda.
Fuente:
Matus, R.; Hernndez, Martha; Garca, E.. Estadstica.
Mxico: Instituto Politcnico Nacional, 2010. p 2.
Copyright 2010. Instituto Politcnico Nacional. All rights reserved.
Media
Conocido como Media Aritmtica
La media aritmtica es el valor que se obtiene al dividir
la suma total entre el nmero de datos.
Para n valores x
1
, x
2
,..., x
n,
la media es:





1 1 2
n
i
i n
X
X X X
X
n n
=
+ + +
= =

Chap 3-14 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013


Media
Es la medida de tendencia central mas utilizada
Afectada por valores extremos (Outliers)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Media = 5 Media = 6
Chap 3-15 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Media para datos agrupados
Chap 3-16 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Cuando los datos se presentan mediante una distribucin de clases y
frecuencias todos los valores caen dentro de unos intervalos de clase
dados, en estos casos hay que considerar el promedio de cada uno y por lo
tanto se utiliza la "marca de clase" o punto medio de cada intervalo que
podemos representar con la letra (gamma).

(Serie de clases y frecuencia)
Chap 3-17 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Ejemplo: Encontrar la altura media de los estudiantes que se presentan en la siguiente
tabla:
Media para datos agrupados
(Serie de clases y frecuencia)
Es una medida robusta de la tendencia central
No es afectada por valores extremos




En un conjunto de datos ordenado, la mediana es:
El valor central, si n es impar
El promedio de los 2 valores centrales, si n es par
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mediana = 5 Mediana = 5
Chap 3-18 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Mediana
Mediana para una serie simple y de
frecuencias
En resumen podemos decir que el procedimiento
para obtener la mediana es el siguiente:
Chap 3-19 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-20
Encontrar la mediana del grupo 5, 6 y 8.
Ejemplo 1:
Primero:

Definimos la posicin de la mediana con la
frmula (n + 1)/2, por tanto, para tres valores, el
lugar donde se encuentra la mediana es:

(3 + 1)/2 = 2, o sea

en la segunda posicin de la serie que
corresponde al valor de 6.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-21
Obtener la mediana de los siguientes valores:
7, 8, 9 y 10
Siguiendo la frmula, la mediana ocupa el lugar
(4+1)/2 = 2.5
que se encuentra entre los dos valores
intermedios, o sea entre 8 y 9 y, en este caso,
la mediana es igual al valor intermedio de los
dos valores, es decir, (8+9)/2 = 8.5.

Este resultado deja dos valores menores y dos mayores o dicho de
otra forma, divide a la serie en dos partes guales.
Ejemplo 2:
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-22
Ejercicios

Encontrar el lugar y el valor de la mediana de las siguientes series:
Fuente:
Estadstica descriptiva
Monroy Saldvar, Salvador
Mediana para una serie de clases
y frecuencias
Chap 3-23 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-24
Ejemplo

Hallar la mediana de las estaturas de los 40 estudiantes a partir de la
siguiente distribucin de clases y frecuencias:
Moda
Es una medida de tendencia central
Es el valor que ocurre con mayor frecuencia
No es afectado por valores extremos
Es utilizado tanto para datos numricos como
datos categricos
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
Chap 3-25 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-26
Veamos algunos ejemplos de casos posibles de la Moda:
Moda
La moda puede no existir (ejemplo anterior) o
pueden existir varias modas:
Chap 3-27 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-28
Hallar la media, mediana y la moda de los siguientes datos:

a. 3, 5, 2, 6, 5, 9, 5, 2, 8, 6

Ejemplo
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-29
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-30
Media Ponderada
En ciertas circunstancias no todas las
observaciones tienen igual peso. En general si
se tienen observaciones con valores
diferentes x
1
, x
2
, , x
n
con sus respectivos
pesos w
1
, w
2
, ,w
n
, la media ponderada se
calcula:

Chap 3-31 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Media Ponderada
Ejemplo: Notas MCI: 16, 18, 17, 14
50% nota prueba, 30% nota trabajo, 10% nota practica
1, 10% nota prctica 2

Promedio final:

= (5x16 + 3x18 + 17x1 + 14x1)/10
= (80 + 54 + 17 + 14)/10 = 16.5
W
X
Chap 3-32
2013 Ing. Jos Luis Tupac Yupanqui A.
La Forma de la Distribucin
Determina las posiciones relativas de la
media, la mediana, y la moda para un
conjunto de valores de datos.
Chap 3-33
2013 Ing. Jos Luis Tupac Yupanqui A.
O Distribucin Positivamente
Sesgada
O Distribucin Negativamente
Sesgada
El Sesgo
Es la tendencia de la distribucin a
acumularse a la derecha o a la izquierda .
Chap 3-34
2013 Ing. Jos Luis Tupac Yupanqui A.
Distribuciones
Chap 3-35
2013 Ing. Jos Luis Tupac Yupanqui A.
Distribucin simtrica
Distribucin positivamente sesgada
Distribucin negativamente sesgada
En este caso la mediana est a la derecha de la
moda y la media est a la derecha de la mediana.
En este caso la mediana est a la izquierda de
la moda y la media est a la izquierda de la
mediana.
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-36
Finalmente presentaremos una tabla donde se hace una comparacin
entre la media, mediana y moda.
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-37
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-38
Cunto es la Moda:?
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-39
Cunto es la Moda:?
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-40
Fuente: BCRP, SBS, Reuters y Datatec.
Elaboracin: Gerencia de Informacin y Anlisis Econmico - Subgerencia de Estadsticas Macroeconmicas.
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-41
Fuente: BCRP, SBS, Reuters y Datatec.
Elaboracin: Gerencia de Informacin y Anlisis Econmico - Subgerencia de Estadsticas Macroeconmicas.
Calcular:

La moda, media y mediana del Tipo de Cambio
tanto en la compra y venta para el ao de su
eleccin.
Divide a los datos ordenados en 4 cuartos



Posicin del i-simo cuartil

El segundo cuartil es la mediana de los datos.

25% 25% 25% 25%
( )
1
Q
( )
2
Q ( )
3
Q
( )
( )
1
4
i
i n
Q
+
=
Chap 3-42 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Cuartiles
Ejemplo: Determinar el primer cuartil del siguiente
conjunto de nueve datos ordenados


5 . 13
2
15 12
5 . 2
4
) 1 9 ( 1
1
1
=
+
=
=
+
=
Q
Q de Posicin
11 12 15 16 16 17 18 21 22
Chap 3-43
2013 Ing. Jos Luis Tupac Yupanqui A.
Cuartiles

2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-44
Medidas de Variacin
La variabilidad es inherente y estar siempre presente en todo:
Entre productos,
personas,
servicios,
procesos,
naturaleza,
etc.
Lo importante es intentar descubrir:
Qu indica esta variabilidad sobre los procesos?
Cules son las fuentes de variabilidad?
Cul es la comprensin que se tiene sobre los conceptos de probabilidad y
estadstica para entender, estudiar y controlar la variabilidad?
Chap 3-45
2013 Ing. Jos Luis Tupac Yupanqui A.
Medidas de Variacin
Sin entender la variabilidad puede suceder:
Dificultad en separar causas comunes de causas especiales
La comprensin del proceso es difcil
El gerenciamiento del proceso es ineficaz
La mejora de la calidad es lenta
No hay como reducir ni dimensionar las prdidas
El aprendizaje es lento
Sin medicin no hay observacin y ni posibilidad de evaluar el desempeo de
los procesos en relacin a:
Exigencias de los clientes
No se percibe donde estn las oportunidades y amenazas
No existen datos
Sin datos todos creen saber lo que est sucediendo, no hay anlisis
estadstico y la mejora no acontece
Chap 3-46
2013 Ing. Jos Luis Tupac Yupanqui A.
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-47
8 14 11 9 10 12 13
Onzas
A
C
B
Peso declarado en el
equipaje
Media de B = Media de C
[Dispersin de B]>[Dispersin de C]
Frecuencia
12 onz
Varianza Desviacin
Estndar
Coeficiente
de
Variacin
Rango Intercuartil
Rango
Chap 3-48 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Medidas de Variacin
Chap 3-49 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Una medida de ubicacin, como la media o la mediana, slo describe el
centro de la informacin. Desde este punto de vista, es valiosa, pero
no nos indica nada acerca de la extensin de los datos.

Por ejemplo, si en la gua del lugar dice que el ro que est ms
adelante tiene una profundidad promedio de 3 pies, estara dispuesto
a cruzarlo a pie sin contar con informacin adicional? Tal vez no.
Seguramente querr saber algo acerca de la variacin en la
profundidad. La profundidad mxima del ro es 3.25 pies y la mnima
es 2.75 pies? Si es as, tal vez se aventure a cruzarlo. Qu sucedera
si supiera que la profundidad del ro vara entre 0.50 y 5.5 pies?
Quiz su decisin sera no cruzar. Antes de tomar una decisin sobre
cruzar el ro o no, querr informacin sobre la profundidad tpica y la
dispersin en la profundidad del ro.
Medidas de Variacin
Chap 3-50 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Un valor menor para una medida de dispersin indica que los datos
estn agrupados de manera estrecha, digamos, alrededor de la
media aritmtica. Por tanto, la media se considera representativa
de la informacin.
Por el contrario, una medida de dispersin alta indica que la media
no es confiable.
Vea la siguiente grafica:
Medidas de Variacin
Chap 3-51 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Los 100 empleados de Hammond Iron Works, Inc., una compaa
fabricante de acero, est organizada en un histograma basado en
el nmero de aos de trabajar para la compaa. La media es 4.9
aos, pero la extensin de los datos es de 6 meses a 16.8 aos. La
media de 4.9 aos no es muy representativa de todos los
empleados.
Medidas de Variacin
Chap 3-52 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Una segunda razn para estudiar la dispersin de un conjunto de datos es
comparar la extensin en dos o ms distribuciones.
Por ejemplo, supongamos que la nueva computadora PDM/3 est armada
en Baton Rouge y tambin en Tucson.
La produccin media aritmtica por hora tanto en la planta de Baton
Rouge como en la de Tucson es 50.
Con base en las dos medias, podramos llegar a la conclusin de que las
distribuciones de las producciones por hora son idnticas.
Sin embargo, los registros de produccin durante 9 horas en ambas
plantas revelan que esta conclusin no es correcta (vea la siguiente
grfica).
La produccin de Baton Rouge vara de 48 a 52 ensamblajes por hora. La
produccin en la planta de Tucson es ms errtica, pues va de 40 a 60 por
hora. Por tanto, la produccin por hora para Baton Rouge se agrupa cerca
de la media de 50; la produccin por hora para Tucson es ms dispersa.

Medidas de Variacin
Chap 3-53 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Produccin de computadoras por hora en las plantas de Baton Rouge y Tucson

Medidas de Variacin
Chap 3-54 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
La medida de dispersin ms sencilla es el rango. ste es la diferencia entre
los valores ms alto y ms bajo en el conjunto de datos. En la forma de una
ecuacin:
El rango se utiliza con mucha frecuencia en las aplicaciones de control de
procesos estadsticos (CPE) porque es muy fcil de calcular y entender.
Consulte la Grfica Anterior. Encuentre el rango en el nmero de
computadoras que se producen cada hora en las plantas de Baton Rouge y
Tucson. Interprete los dos rangos.
Rango
Chap 3-55 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Produccin de computadoras por hora en las plantas de Baton Rouge y Tucson
El rango de la produccin de computadoras por hora en la planta de Baton Rouge
es 4, calculado por la diferencia entre la produccin por hora ms alta de 52 y la
ms baja de 48. El rango en la produccin por hora para la planta de Tucson es 20
computadoras, calculado al restar 60 - 40. Por tanto, llegamos a la conclusin de
que: (1) hay menos dispersin en la produccin por hora en la planta de Baton
Rouge que en la de Tucson porque el rango de 4 computadoras es menor que el
rango de 20 computadoras y (2) la produccin se agrupa de manera ms estrecha
alrededor de la media de 50 en la planta de Baton Rouge que en la de Tucson
Rango

Medida de variacin
Diferencia entre el valor mximo y mnimo de un
conjunto de datos



7 8 9 10 11 12
Rango = 12 - 7 = 5
7 8 9 10 11 12
Rango = 12 - 7 = 5
Rango = X
max
- X
min
Chap 3-56 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Rango
Ventajas:
Es fcil de calcular y sus unidades son las
mismas que las de la variable.
Desventajas:
No utiliza todas las observaciones (slo dos de ellas)
Se puede ver muy afectada por alguna observacin extrema
El rango aumenta con el nmero de observaciones, o bien
se queda igual. En cualquier caso nunca disminuye.
Ignora como los datos estn distribuidos

Chap 3-57 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Rango
Rango Intercuartil
Medida de variacin
Diferencia entre el tercer y primer cuartil
No es afectado por valores extremos


Ejemplo:


Pos. Q
1
= (11+1)/4=3
Pos. Q
3
= 3(11+1)/4=9

RIC = Q
3
Q
1
Datos ordenados: 11 12 13 16 16 16 17 17 17 18 20
RIC = Q3 Q1=17-13= 4
Q
1
Q
3
Chap 3-58 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Desviacin Media
Chap 3-59 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Un defecto del rango es que se basa slo en dos valores,
el ms alto y el ms bajo; no toma en cuenta todos los
valores.
La desviacin media s lo hace. Mide la cantidad media
por la cual los valores en una poblacin o muestra varan
de su media.
En trminos de una definicin:
DESVIACIN MEDIA. La media aritmtica de los valores absolutos
de las desviaciones de la media aritmtica.
Varianza
Chap 3-60 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
En trminos de una frmula:
La desviacin media, abreviada MD, se calcula para una
muestra como sigue:

DESVIACIN
MEDIA
donde:
es el valor de cada observacin.
es la media aritmtica de los valores.
es el nmero de observaciones en la muestra.
indica el valor absoluto.
n
x x
DM


=
Desviacin Media
Varianza
Ejemplo
Desviacin Media
Chap 3-61 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Determine la desviacin media e
interprete los resultados. La desviacin
media es la media de las cantidades
donde las observaciones individuales
difieren de la media aritmtica. Para
calcular la desviacin media de un
conjunto de datos, empezamos por
encontrar la media aritmtica.

El nmero medio de capuchinos vendidos
es 12, calculado as: (103 + 97-+ 101 +
106 + 103)/5.

A continuacin, encontramos la cantidad
en la cual cada observacin difiere de la
media.
El nmero de capuchinos vendidos
en la tienda Starbucks del
aeropuerto de Orange County
entre las 4 y las 7 P . M . en una
muestra de 5 das el ao pasado
fue: 103, 97, 101, 106 y 103.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-62
Luego, sumamos estas diferencias, ignorando los signos
y dividimos la suma entre el nmero de observaciones.
El resultado es la cantidad media en que las
observaciones difieren de la media.
Un valor bajo para la desviacin media indica que los
datos estn agrupados cerca de la media, mientras que
un valor alto para la desviacin media indica una mayor
dispersin en la informacin.
stos son los detalles de los clculos realizados con la
frmula:
n
x x
DM


=
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-63
n
x x
DM


=
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-64
Para los datos de salarios diarios que se presentan en la Tabla, la media
aritmtica es $2 949.50
Medida importante de la variacin
Muestra la variabilidad de los datos al rededor de la
media
La varianza de n datos x
1
x
2
x
n
es:


1
) (
1
2
2

=

=
n
x x
S
n
i
i
Chap 3-65 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
N
x
n
i
i
=

=
1
2
2
) (
o
Varianza para una Muestra Varianza para una Poblacin
Varianza
Chap 3-66 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Ejemplo
Varianza
1
) (
2
2
2

=

n
x n fx
S
Chap 3-67 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
N
N fx


=
2 2
2
) (
o
Varianza para una Muestra Varianza para una Poblacin
Varianza para Datos Agrupados
Chap 3-68 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Ejemplo
Varianza
Para los datos de salarios diarios que se presentan en el tabla, la media muestral es
$2 949.50, Determinar la desviacin estndar muestral para los datos agrupados:
1
) (
2
2
2

=

n
x n fx
S
(x) (f) x*f
2499,5 7 17496,5
2699,5 20 53990
2899,5 33 95683,5
3099,5 25 77487,5
3299,5 11 36294,5
3499,5 4 13998
Sumatoria = 294950
Media Muestral = 2949,5
Chap 3-69 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Varianza
Propiedades de la Varianza
Chap 3-70 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Varianza
Formulas Adicionales
Chap 3-71 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Por lo general, la desviacin estndar se utiliza como una medida para
comparar la extensin en dos o ms grupos de observaciones.

Por ejemplo, la desviacin estndar de las cantidades quincenales
invertidas en el plan de reparto de utilidades de Dupree Paint Company
se calcula en $7.51.
Supongamos que estos empleados se encuentran en Georgia. Si la
desviacin estndar para un grupo de empleados en Texas es $10.47, y
las medias son casi iguales, quiere decir que las cantidades invertidas
por los empleados de Georgia no son tan dispersas como aquellas que se
invierten en Texas (porque $7.51 < $10.47).
Ya que las cantidades invertidas por los empleados de Georgia se
agrupan de manera ms estrecha alrededor de la media, la media para
los empleados de Georgia es una medida ms confiable que aquella para
el grupo de Texas.
Desviacin Estndar
Es la medida de variabilidad mas importante
Muestra la variacin alrededor de la media
Se expresa en las mismas unidades de los datos
originales



Chap 3-72 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Varianza para una Muestra Varianza para una Poblacin
2
S s =
2
o o =
Desviacin Estndar
Datos 3, 3, 4, 4, 5 (metros)

Chap 3-73 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
E
j
e
r
c
i
c
i
o

1

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-74
E
j
e
r
c
i
c
i
o

2

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-75
E
j
e
r
c
i
c
i
o

2

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-76
E
j
e
r
c
i
c
i
o

3

Los pesos de los contenedores enviados a Irlanda son (en miles de libras):


95 103 105 110 104 105 112 90


a) Cul es el rango de los pesos?
b) Calcule el peso medio aritmtico.
c) Calcule la desviacin media de los pesos.

1) Durante la venta del fin de semana pasado en Electronic Super Store,
estuvieron trabajan do cinco representantes de servicios al cliente. Los
nmeros de HDTV que vendieron estos representantes son: 5, 8, 4, 10 y 3.
2) El Departamento de Estadstica de Western State University ofrece ocho
secciones de es tadstica bsica. Los siguientes son los nmeros de
estudiantes inscritos en estas seccio nes: 34, 46, 52, 29, 41, 38, 36 y 28.
3) Dave's Automatic Door instala puertas automticas en las cocheras. La
siguiente lista indi ca el nmero de minutos que se necesitan para instalar una
muestra de 10 puertas: 28, 32, 24, 46, 44, 40, 54, 38, 32 y 42.
4) Una muestra de ocho compaas en la industria aeroespacial participaron en
una encuesta sobre la recuperacin de la inversin que tuvieron el ao pasado.
Los resultados son (en porcentajes): 10.6, 12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y
15.6.
5) Diez expertos calificaron el sabor de una pizza sushi recin creada preparada
con atn, arroz y algas marinas, en una escala de 1 a 50. Las calificaciones
fueron: 34, 35, 41, 28, 26, 29, 32, 36, 38 y 40.
6) Una muestra de los archivos de personal de ocho empleados de Acm Carpet
Cleaners, Inc., revel que durante un periodo de seis meses, perdieron los
siguientes das debido a enfermedades: 2, 0, 6, 3, 10, 4, 1 y 2.
Para los siguientes ejercicios calcule: (a) el rango de los pesos, (b) la
media aritmtica y (c) la desviacin media, e interprete el rango y la
desviacin media.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-77
P
r
o
p
u
e
s
t
o
s

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-78
E
j
e
r
c
i
c
i
o

4

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-79
E
j
e
r
c
i
c
i
o

5

La oficina en Filadelfia de Price Waterhouse Coopers LLP contrat
cinco aprendices de contador en este ao. Sus salarios mensuales
iniciales fueron: $3 536, $3 173, $3 448, $3 121 y $3 622.
(a) Calcule la media de la poblacin.
(b) Calcule la varianza de la poblacin.
(c) Calcule la desviacin estndar de la poblacin.
(d) La oficina en Pittsburgh contrat a seis aprendices. El salario
mensual medio fue de $3 550, y la desviacin estndar $250.
Compare ambos grupos.

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-80
P
r
o
p
u
e
s
t
o
s

1) Considere estos cinco valores como una poblacin: 8, 3, 7, 3 y 4.
a. Determine la media de la poblacin.
b. Determine la varianza.
2) Considere estos seis valores como una poblacin: 13, 3, 8, 10, 8 y 6.
a. Determine la media de la poblacin.
b. Determine la varianza.
3) El informe anual de Dennis Industries menciona estas ganancias
primarias por accin co mn durante los ltimos 5 aos: $2.68,
$1.03, $2.26, $4.30 y $3.58. Si suponemos que s tos son los
valores poblacionales,
a. Cules son las ganancias medias aritmticas primarias por
accin comn?
b. Cul es la varianza?
4) Haciendo referencia al Ejercicio 39, el informe anual de Denis
Industries tambin presenta estas ganancias sobre el capital
accionario durante el mismo periodo de cinco aos (en por
centajes): 13.2, 5.0, 10.2, 17.5 y 12.9.
a. Cul es la ganancia media aritmtica?
b. Cul es la varianza?
D
e
s
v
i
a
c
i

n

E
s
t

n
d
a
r

d
e

l
a

P
o
b
l
a
c
i

n

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-81
P
r
o
p
u
e
s
t
o
s

5) Plywood, Inc., report estas ganancias sobre el capital accionario
durante los ltimos 5 aos: 4.3, 4.9, 7.2, 6.7 y 11.6. Considere
stos como valores poblacionales.
a. Calcule el rango, la media aritmtica, la varianza y la
desviacin estndar. b. Compare las ganancias sobre el capital
accionario de Plywood, Inc. con aquellas de Den nis Industries
que mencionamos en el Ejercicio 40.
6) Los ingresos anuales de los cinco vicepresidentes de TMV
Industries son: $125 000; $128 000; $122 000; $133 000, y
$140 000. Considere este grupo como una poblacin.
a. Cul es el rango?
b. Cul es el ingreso medio aritmtico?
c. Cul es la varianza de la poblacin? La desviacin
estndar?
d. Tambin se estudiaron los ingresos anuales de los
funcionarios de otra empresa similar a TMV Industries. La
media fue $129 000 y la desviacin estndar $8 612.
Compare las medias y las dispersiones de ambas compaas.

D
e
s
v
i
a
c
i

n

E
s
t

n
d
a
r

d
e

l
a

P
o
b
l
a
c
i

n

Medida relativa de variacin
Se expresa en porcentaje (%)
Muestra la variacin en unidades de media
Se utiliza para comparar 2 mas conjuntos de datos
medidos en mtricas diferentes o diferentes unidades de
medida.
100%
S
CV
X
| |
=
|
\ .
Chap 3-82 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Coeficiente de Variacin
Ejemplo (cotizacin del dlar)

Ao Mes
Per
(soles)
Chile
(pesos)
Enero 3.401 524
Febrero 3.289 526
Marzo 3.335 529
Abril 3.334 517
Mayo 3.280 521
Junio 3.261 542
Julio 3.244 541
Agosto 3.231 539
Septiembre 3.242 539
Octubre 3.236 531
Noviembre 3.218 528
2006
Diciembre 3.209 528
Enero 3.193 541 2007
Febrero 3.192 547

Chap 3-83 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Ejemplo (cotizacin del dlar)

Ao Mes
Per
(soles)
Chile
(pesos)
Enero 3.401 524
Febrero 3.289 526
Marzo 3.335 529
Abril 3.334 517
Mayo 3.280 521
Junio 3.261 542
Julio 3.244 541
Agosto 3.231 539
Septiembre 3.242 539
Octubre 3.236 531
Noviembre 3.218 528
2006
Diciembre 3.209 528
Enero 3.193 541 2007
Febrero 3.192 547

Per
X
=3.26soles

S
Peru
= 0.061soles

CV
Per
= (0.061/3.262)x 100= 1.9%

=532.29 pesos

S
Chile
= 9.044 pesos

CV
Chile
= (9.044/532.288)x 100= 1.7%

Chile
X
Chap 3-84
2013 Ing. Jos Luis Tupac Yupanqui A.
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-85
Ejemplo de Variacin
A. RESIDUOS SLIDOS

5.1 MUNICIPALIDADES QUE INFORMARON SOBRE LA CANTIDAD PROMEDIO DIARIO DE BASURA RECOLECTADA,
SEGN DEPARTAMENTO, 2010
(Toneladas mtricas)
Departamento
Munici-
palidades
informantes

Total 1,834

Amazonas 84
ncash 166
Apurmac 80
Arequipa 109
Ayacucho 111
Cajamarca 127
Callao 1/ 6
Cusco 108
Huancavelica 94
Hunuco 76
Ica 43
Junn 123
La Libertad 83
Lambayeque 38
Lima 171
Loreto 51
Madre de Dios 11
Moquegua 20
Pasco 28
Piura 64
Puno 109
San Martn 77
Tacna 27
Tumbes 13
Ucayali 15

Lima Metropolitana 2/ 49
Regin Lima 3/ 128

2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-86
Medidas de Variacin
Varianza Desviacin
Estndar
Coeficiente de
Variacin
Rango
Rango Intercuartil
Ejemplo de Variacin
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-87
Medidas de Variacin
Varianza Desviacin
Estndar
Coeficiente de
Variacin
Rango
Rango Intercuartil
Ejemplo de Variacin
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-88
Medidas de Variacin
Varianza Desviacin
Estndar
Coeficiente de
Variacin
Rango
Rango Intercuartil
Ejemplo de Variacin
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-89
Medidas de Variacin
Varianza Desviacin
Estndar
Coeficiente de
Variacin
Rango
Rango Intercuartil
Ejemplo de Variacin
2013 Ing. Jos Luis Tupac Yupanqui A.
Chap 3-90
Medidas de Variacin
Varianza Desviacin
Estndar
Coeficiente de
Variacin
Rango
Rango Intercuartil
Ejemplo de Variacin
Relacin entre Media, Mediana y
Moda

Media = Mediana =Moda

Media < Mediana < Moda Moda < Mediana < Media
Asimtrica a la
derecha
Asimtrica a la
izquierda
Simtrica
En general, para la mayora de las distribuciones se cumple:
Chap 3-91 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-92
TEOREMA DE CHEBYSHEV
En las secciones anteriores hemos estudiado medidas de
tendencia central (media, moda y mediana), y medidas de
dispersin (varianza y desviacin estndar).
Tambin estudiamos el grado de asimetra (sesgo) de una
distribucin y su curtosis (altura).
Es decir, ya podemos describir, en trminos generales, el
comportamiento de un conjunto de valores que estemos
estudiando.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-93
TEOREMA DE CHEBYSHEV
Retomando el concepto de desviacin estndar, diremos
que una de las aplicaciones que tiene es que podemos
utilizarlo para conocer aproximadamente cuntas de las
puntuaciones se agrupan en ciertos intervalos de la serie
formados por la suma y la resta de una, dos o tres veces el
valor de la desviacin estndar con respecto al valor medio.
Para esto es que estudiaremos el Teorema de Tchebyshev.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-94
TEOREMA DE CHEBYSHEV
Ya sealamos que:

Una () baja para un conjunto de valores indica que
stos se localizan cerca de la media.
Por el contrario, una () muy alta revela que las
observaciones se encuentran dispersas en relacin
con la media.

El matemtico ruso P. L. Chebyshev (1821 -1894)
desarroll un teorema que nos permite determinar la
proporcin mnima de los valores que se encuentran
en un nmero especfico de desviaciones estndar de
la media.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-95
TEOREMA DE CHEBYSHEV
Adems, por lo menos ocho de nueve valores, u
88.9%, estarn entre ms tres desviaciones estndar
y menos tres desviaciones estndar de la media.
Por lo menos 24 de 25 valores, o 96%, estarn entre
ms y menos cinco desviaciones estndar de la media.
Por ejemplo:

Segn el teorema de Chebyshev, por lo menos tres
de cuatro valores, o 75%, deben estar entre la media
ms dos desviaciones estndar y la media menos dos
desviaciones estndar. Esta relacin se aplica sin
importar la forma de la distribucin.

18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-96
Para cualquier grupo de
observaciones (muestra o poblacin),
la proporcin de los valores que se
encuentra dentro de k desviaciones
estndar de la media es por lo menos
donde k es cualquier constante mayor
que 1.
El teorema de Chebyshev establece:
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-97
TEOREMA DE CHEBYSHEV
si los datos fueran simtricos y acampaados, es decir, de
tipo normal, exactamente 68.26% de todas las
observaciones estaran contenidas dentro de distancias de
1 desviacin estndar alrededor de la media.

Mientras que 95.44, 99.73 y 99.99% de las
observaciones estaran incluidas, respectivamente, dentro
de distancias de 2, 3, 4 desviaciones estndar
alrededor de la media; grficamente se ve de la siguiente
forma:
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-98
Los resultados del porcentaje de puntuaciones que se
concentran en torno a la media, para cualquier tipo de
distribucin y para distribuciones de tipo normal los
podemos resumir en la siguiente tabla:
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-99
Ejercicio 1
Supongamos que se tiene una poblacin normalmente
distribuida, con media:



De acuerdo con la desigualdad de Tchebycheff, puede
deducirse para cualquier distribucin normal o
simtrica que la media aritmtica es ms o menos

Si se toma una sola vez la desviacin tpica al lado y
lado de la media, el intervalo obtenido, incluye el
68,3% de las observaciones.


18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-100
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-101
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-102
La cantidad media aritmtica quincenal con la que
contribuyen los empleados de Dupree Paint al plan de
participacin de utilidades de la compaa fue $51.54 y la
desviacin estndar es $7.51. Qu porcentaje de las
contribuciones se encuentra entre ms 3.5 desviaciones
estndar y menos 3.5 desviaciones estndar de la
media?
100
1
1
2
x
R
|
.
|

\
|
=
Alrededor de 92%
Ejercicio 2
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-103
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-104
Estado Viviendas Estado Viviendas Estado Viviendas Estado Viviendas Estado Viviendas
AL 17,2 HI 7,3 MA 39,2 NM 11,8 SD 2,5
AK 4,0 ID 4,3 MI 37,6 NY 61,9 TN 38,1
AZ 71,8 IL 38,7 MN 28,6 NC 70,7 TX 143,1
AR 9,9 IN 23,0 MS 8,8 ND 2,6 UT 16,5
CA 271,4 IA 5,2 MO 27,2 OH 33,0 VT 4,1
CO 32,8 KS 13,3 MT 2,0 OK 10,7 VA 64,1
CT 24,5 KY 13,8 NE 5,0 OR 11,3 WA 35,5
DE 4,6 LA 18,8 NV 14,0 PA 43,6 WV 1,5
FL 202,6 ME 8,1 NH 17,8 RI 5,4 WI 20,2
GA 73,1 MD 42,1 NJ 55,0 SC 32,8 WY 1,2
(a) Datos bsicos (Viviendas comenzadas a construir, en miles)
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-105
(a) Datos bsicos (Viviendas comenzadas a construir, en miles)
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-106
(a) Datos bsicos (Viviendas comenzadas a construir, en miles)
Con el Teorema de ChebyShev encontramos el porcentaje de valores que
debe caer dentro de R=2 y R=3 desviaciones estndar de la media.
Por Ejemplo, si R=2, este porcentaje debe ser 75%, expresado de otro
modo, debemos encontrar que al menos el 75% de los estados tienen una
cantidad de viviendas comenzadas a construir que cae en el intervalo
descrito como 34.9+-2(49.3).
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-107
El Teorema de ChebyShev afirma que al menos [1-(1/k2)]*100% de los valores de
los datos caern dentro de K desviaciones estndar de la media (Cuando K es mayor
que 1 y para cualquier forma de la Distribucin). Para los datos de vivienda s
comenzadas a construir en 50 estados , el porcentaje de estados dentro de cada
intervalo excede por mucho el porcentaje mnimo especificado por el teorema.
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-108
Diagrama de Caja
Para su construccin se usan 5 estadsticas:
Mnimo, Mximo, Q
1
, Q
2
= Mediana y Q
3


4 6 8 10
12
X
max
X
min
1
Q
3
Q
2
Q
Chap 3-109 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Forma de la Distribucin y Diagrama
de Caja
Asimtrica a la derecha Asimtrica a la izquierda
Simtrica
1
Q
1
Q
1
Q
2
Q
2
Q
2
Q
3
Q
3
Q
3
Q
Chap 3-110 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
Cuidados en el anlisis descriptivo
de los datos y problemas ticos
El anlisis de los datos es objetivo
Por lo tanto deben reportarse las medidas resumen que mejor
reflejen las caractersticas de los datos
La interpretacin es Subjetiva
Ella debe ser hecha de una manera clara, imparcial y simple
Problemas ticos
Deben documentarse tanto los resultados buenos como los malos
La presentacin debe ser imparcial, objetiva y clara
Los resultados no deben utilizarse inadecuadamente,
distorsionando los hechos
Chap 3-111 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013
18/09/2013 2013 Ing. Jos Luis Tupac Yupanqui A. Chap 3-112
PERU: TASAS DE CRECIMIENTO GEOMETRICO MEDIO ANUAL SEGUN
DEPARTAMENTOS, 1995-2015
Fuente: http://www.inei.gob.pe/biblioineipub/bancopub/Est/Lib0005/CAP-52.htm
Resumen
Adems de resumirse mediante tablas de distribucin de
frecuencias y representarse grficamente, los datos
originales se pueden describir en forma estadstica a
travs de medidas de tendencia central y de dispersin.
Chap 3-113 2013 Ing. Jos Luis Tupac Yupanqui A. 18/09/2013

You might also like