You are on page 1of 49

1-1

Descripción de los datos:
Medidas de tendencia central
y Medidas de Dispersión

Universidad Católica de Santa María
Programa Profesional de Ingeniería Industrial
Control
de Procesos
Medidas de Tendencia Central
• Un único valor que resume un conjunto de
datos. Señala el centro de los valores.
• Las medidas de tendencia central de común
uso son:
• La media aritmético
• La mediana
• La moda

Media de la población
• Para datos no agrupados, la media de la
población es la suma de todos los valores en
ella dividida entre el total de valores en la
población:

• donde µ representa la media de la población.
• N es el número total de elementos en la
población.
• X representa cualquier valor en particular.
• E indica la operación de sumar.
µ = EX N /
EJEMPLO 1
• Parámetro: cualquier característica
medible de una población es un
parámetro.
• La familia Kiers posee cuatro carros. Los
datos son las millas recorridas por cada
uno:
56 000, 23 000, 42 000 y 73 000.
Encuentre el promedio de millas de los
cuatro carros.
• Esto es (56 000 + 23 000 + 42 000 + 73
000)/4 = 48 500
3-3
Media de una muestra
• Para datos no agrupados, la media de una
muestra es la suma de todos los valores
divididos entre el número total de los
mismos:


• donde X denota la media muestral
• n es el número total de valores en la
muestra.
X X n = E /
3-4
EJEMPLO 2
• Dato estadístico: se llama así a cualquier medida
basada en datos muestrales
• Una muestra de cinco ejecutivos recibió la
siguiente cantidad en bonos el año pasado:
$14 000, $15 000, $17 000, $16 000 y
$15 000. Encuentre el promedio en bonos para
los cinco ejecutivos.
• Como estos valores representan la muestra de 5
ejecutivos, la media de la muestra es
(14 000 + 15 000 + 17 000 + 16 000 +
15 000) / 5 = $15 400.
Propiedades de la media aritmética
• Todo conjunto de datos de nivel de intervalo y de
nivel de razón tiene un valor medio.
• Al evaluar la media se incluyen todos los valores.
• Un conjunto de valores sólo tiene una media.
• La media es una medida muy útil para comparar
dos o más poblaciones.
• La media es la única medida de ubicación donde
la suma de las desviaciones de cada valor con
respecto a la media, siempre es cero.
EJEMPLO 3
• Considere el conjunto de valores: 3, 8 y 4.
La media es 5. Para ilustrar la quinta
propiedad, (3 - 5) + (8 - 5) + (4 - 5) = - 2 + 3 -
1 = 0. En otras palabras,





• La media es afectada de modo notable por
valores extraordinariamente grandes o
pequeños
E( ) X X ÷ = 0
Mediana
• Mediana: es el punto medio de los
valores después de ordenarlos de menor
a mayor, o de mayor a menor. La misma
cantidad de valores se encuentra por
arriba de la mediana que por debajo de
ella.
• Nota: para un conjunto con un número
par de números, la mediana será el
promedio aritmético de los dos números
medios.
EJEMPLO 4
• Calcule la mediana para los siguientes datos.
• La edad de una muestra de cinco estudiantes
es: 21, 25, 19, 20 y 22.
• Al ordenar los datos de manera ascendente
quedan: 19, 20, 21, 22, 25. La mediana es 21.
• La altura, en pulgadas, de cuatro jugadores de
basquetbol es 76, 73, 80 y 75.
• Al ordenar los datos de manera ascendente
quedan: 73, 75, 76, 80. La mediana es 75.5.
Propiedades de la mediana
• La mediana es única para cada conjunto de
datos.
• No se ve afectada por valores muy grandes
o muy pequeños, y por lo tanto es una
medida valiosa de tendencia central
cuando ocurren.
• Puede obtenerse para datos de nivel de
razón, de intervalo y ordinal.
Propiedades de la mediana
• Ejemplo: Supóngase que intenta adquirir una casa en Yanahuara. El
vendedor le indicó que el precio promedio de las casas disponibles
en este momento es de 4225 UM.

• Si tuviera 2800 UM, podría pensar que está fuera de sus
posibilidades. Sin embargo al verificar los precios individuales de las
casas podría cambiar de idea. Los precios son 2300 UM, 2600 UM,
3500 UM y 8500 UM.

• El precio de 8500 UM esta haciendo que la media se incline hacia
arriba, por lo que es un promedio no representativo. Un precio entre
2600 y 3500 es un promedio más representativo.
Moda
• La moda es el valor de la observación que
aparece con más frecuencia.
• Es especial para describir niveles
nominales y ordinales de medición.

• EJEMPLO 5: las calificaciones de un
examen de diez estudiantes son: 81, 93,
84, 75, 68, 87, 81, 75, 81, 87. Como la
calificación 81 es la que más ocurre, la
calificación modal es 81.
Media de datos agrupados
• La media de una muestra de datos
organizados en una distribución de
frecuencias se calcula mediante la
siguiente fórmula:
X
Xf
f
Xf
n
= =
E
E
E
X = es el valor central o punto medio de cada
clase
f = es la frecuencia de cada clase
EJEMPLO 9
• Una muestra de diez cines en una gran
área metropolitana dio el número total de
películas exhibidas la semana anterior.
Calcule la media de las películas
proyectadas.


X
Xf
f
Xf
n
= =
E
E
E
EJEMPLO 9 continuación
Películas
exhibidas
frecuencia
f
punto medio
de clase X
(f)(X)
1-2 1 1.5 1.5
3-4 2 3.5 7.0
5-6 3 5.5 16.5
7-8 1 7.5 7.5
9-10 3 9.5 28.5
Total 10 61
61/10 = 6.1 películas
Mediana de datos agrupados
• La mediana de una muestra de datos organizados en
una distribución de frecuencias se calcula mediante
la siguiente fórmula:




• donde L es el límite inferior de la clase que contiene
a la mediana, FA es la frecuencia acumulada que
precede a la clase de la mediana, f es la frecuencia
de clase de la mediana e i es el intervalo de clase de
la mediana.
) (
2
i
f
FA
n
L Mediana
÷
+ =
Cálculo de la clase de la mediana
Para determinar la clase de la mediana de
datos agrupados:
• Elabore una distribución de frecuencias
acumulada.
• Divida el número total de datos entre 2.
• Determine qué clase contiene este valor. Por
ejemplo, si n=50, 50/2 = 25, después
determine qué clase contiene el 25° valor (la
clase de la mediana).
EJEMPLO 10
• La clase de la mediana es 5 - 6, ya
que contiene el 5° valor (n/2 = 5)
Películas
exhibidas
Frecuencia Frecuencia
acumulada
1-2 1 1
3-4 2 3
5-6 3 6
7-8 1 7
9-10 3 10
EJEMPLO 10 continuación
• De la tabla, L = 5, n = 10, f = 3, i = 2, FA
= 3.
• Así, mediana = 5 + [((10/2) - 4)/3](2) =
6.33
Moda de datos agrupados
• La moda de los datos agrupados se
aproxima por el punto medio de la clase
que contiene la frecuencia de clase mayor.
• Las modas en el EJEMPLO 10 son 5.5 y
9.5. Cuando dos valores ocurren una gran
cantidad de veces, la distribución se llama
bimodal, como en el ejemplo 10.
Distribución simétrica
• sesgo cero moda = mediana =
media
Distribución con asimetría positiva
• sesgo a la derecha: media y mediana se
encuentran a la
derecha de la moda.





• moda < mediana < media
Distribución con asimetría negativa
• sesgo a la izquierda: media y mediana
están a la izquierda de la moda.






• media < mediana < moda
Dispersión
Supóngase que usted es un agente de compras
de una empresa, y que con regularidad coloca
pedidos con dos proveedores distintos.
Ambos le indican que necesitan alrededor de
10 días hábiles para surtir sus pedidos.
Después de meses de trabajar se encuentra
que el promedio de días necesarios para surtir
los pedidos es realmente unos 10 para cada
proveedor.
Los histogramas que resumen la cantidad de
días hábiles requeridos para surtir los pedidos
se ven en la siguiente figura.
Dispersión
5
Aunque la cantidad promedio de 10 en ambos casos ¿tienen éstos el
mismo grado de confiabilidad para entregar a tiempo? ¿qué proveedor
prefiere usted?
9 10 11
Días hábiles
1
2
3
4
Proveedor A
5
9 10 11
Días hábiles
1
2
3
4
Proveedor B
15
7
Amplitud de Variación
• Amplitud de Variación: Se trata de la
diferencia entre el valor más grande y el más
pequeño de un conjunto de datos.

Amplitud = Valor más grande – Valor más pequeño

• Un defecto importante es que se basa sólo
en dos valores, el máximo y el mínimo; no
considera todos los datos.

Amplitud de Variación
• Ejemplo: La amplitud de la producción diaria
en la planta A es 4, obtenida de la diferencia
entra la producción diaria más alta, que es 52
y las más baja que es 48.
• En la planta B la amplitud es de 20, obtenida
entre 60 y 40.
• Hay menos dispersión en la planta A
• La producción de la planta A se acumula más
cerca de la media que es 50
Desviación media
• Desviación media: media aritmética de los
valores absolutos de las desviaciones
respecto a la media aritmética.






• Mide el valor en promedio en que varían los
valores de una población, o muestra, con
respecto a su media.
MD
X X
n
=
÷ E
Desviación media
• Su principal ventaja es que se utiliza en su
cálculo todos los valores en la muestra, a
diferencia de la amplitud.

• Es fácil de comprender, pues es el promedio
en que los valores se desvían con respecto a
la media.

• Su principal desventaja es el uso de valores
absolutos.

• Por lo tanto, la DM no se usa tan
frecuentemente como las otras medidas de
dispersión.
Varianza de la población
• La varianza de la población para datos
no agrupados es la media aritmética de
las desviaciones cuadráticas respecto a
la media de la población.


o
µ
2
2
=
÷ E( ) X
N
EJEMPLO 2
• Las edades de la familia Dunn son 2, 18,
34, y 42 años. ¿Cuál es la variancia de la
población?
µ = = = EX N / / 96 4 24
o µ
2 2
944 4 236 = ÷ = = E( ) / / X N
Varianza poblacional continuación
• Una fórmula alternativa para la variancia
poblacional es:




• En general, es más difícil interpretar la
varianza, porque las unidades en las que se
expresa son valores elevados al cuadrado.
Es más frecuente el uso de la raíz cuadrada.
o
2
2
2
= ÷
E E X
N
X
N
( )
Desviación estándar poblacional
• La desviación estándar poblacional (o) es la
raíz cuadrada de la variancia de la población.

• Para el EJEMPLO 2, la desviación estándar
poblacional es 15.19 (raíz cuadrada de
230.81).

• Una desviación estándar pequeña indica que
los datos se encuentran localizados cerca de
la media.
Desviación estándar poblacional
( )
N
X
¿
÷
=
2
µ
o
Varianza muestral
• La variancia muestral estima la variancia
de la población.
1
) Σ (
Σ
= = operativa Fórmula
1
) ( Σ
= = conceptual Fórmula
2
2
2
2
2
n
n
X
X
S
n
X X
S
EJEMPLO 3
• Una muestra de cinco salarios por hora
para varios trabajos en el área es: $7, $5,
$11, $8, $6. Encuentre la variancia.
• X = 37/5 = 7.40
• = 21.2/(5-1) = 5.3
s
2
Desviación estándar muestral
• La desviación estándar muestral es la
raíz cuadrada de la variancia
muestral.
• En el EJEMPLO 3, la desviación
estándar de la muestra es = 2.30
1
2
÷
|
.
|

\
|
÷
=
¿
÷
n
X X
S
Varianza muestral para datos agrupados
• La fórmula de la variancia para datos
agrupados usada como estimador de la
variancia poblacional es:



• donde f es la frecuencia de clase y X es el
punto medio de la clase.
S
fX
fX
n
n
2
2
2
1
=
÷
÷
E
E ( )
Interpretación y usos de la desviación estándar
• Teorema de Chebyshev: para cualquier
conjunto de observaciones, la proporción
mínima de valores que está dentro de k
desviaciones estándar desde la media
es al menos 1 - 1/k , donde k
2
es una
constante mayor que 1.
Interpretación y usos de la desviación estándar
• Ejemplo: Ejemplo: Suponga que la cantidad
media quincenal depositada por los
empleados de una empresa en el plan de
participación de utilidades de la empresa fue
$51,04 y se obtuvo una desviación estándar
de $7,51.
• Al menos ¿Qué porcentaje de las
contribuciones se encuentran a una distancia
de +/- 2 desviaciones estándares de la
media?

• Aproximadamente el 75%
• 1 – 1/K
2
= 1-1/2
2
= 1-1/4 = 0.75

Interpretación y usos de la desviación estándar
• Regla empírica: Para una distribución de
frecuencia simétrica de campana,
aproximadamente 68% de las observaciones
se encontrará a más y menos una
desviación estándar de la media;
aproximadamente 95% de las observaciones
se encontrarán a más y menos dos
desviaciones estándares desde la media; y
prácticamente todas las observaciones
99,7% se encontrarán a más y menos tres
desviaciones estándares de la media.
Interpretación y usos de la desviación estándar
÷
X
-1s
-2s -3s 1s 2s 3s
68%
95%
99,7%
Asimetría
• Asimetría (sesgo) es la medida de la falta
de simetría en una distribución.
• El coeficiente de asimetría se calcula
mediante la siguiente fórmula:

3(media - mediana)
desviación estándar
Sk =
Curtosis
Mide el grado de agudeza de una distribución
Cuando la curtosis es cero, significa que se
trata de una curva normal. Si es positiva,
quiere decir que la curva o distribución es más
levantada. Si es negativa, quiere decir que la
curva es más plana.
Curva
Leptocúrtica
Curva
Mesocúrtica
Curva
Platicúrtica
Asimetría
Custosis
Curtosis
3
1
3
_
*
3
s
n
fi x xi
a
h
i
¿
=
|
.
|

\
|
÷
=
Asimetría
Curtosis
4
1
4
_
*
4
s
n
fi x xi
a
h
i
¿
=
|
.
|

\
|
÷
=
Curtosis
Asimetría
Curtosis