Professional Documents
Culture Documents
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Principales Medidas de dispersión
Rango
Rango Intercuartil
Varianza
Desviación estándar
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Rango
Máximo: 22
Mínimo: -10 También llamado de alcance, amplitud o
Rango: 32 recorrido, de un conjunto de datos
observados, se define:
Máximo: 30
Mínimo: -20
Rango: 50
R = dato máximo – dato mínimo
En R
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Rango
R = dato máximo – dato mínimo
Características
Aplicable a variables cuantitativas
Solo depende del máximo y del mínimo
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Rango Intercuartil
Q3: 8
Q1: 0 Es la diferencia entre el tercer y el
RIC: 8 primer cuartil.
En R
Q3: 8 x = c(126, 130, 130, 133, 136, 148,
Q1: 2 148, 157, 189, 199)
RIC: 6 IQR(x)
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Rango Intercuartil
Q3: 8
Q1: 0
RIC= Q3 – Q1 = P75 – P25
RIC: 8 Características
Aplicable a variables con escala de intervalo o de razón.
Q3: 10 No se ve afectado por valores extremos.
Q1: 0
RIC: 10
**
**
*
*
*
Diagrama de cajas (Box Plot) – ejercicio
Se desea comparar los resultados de la primera práctica en tres
horarios de Estadística de EEGGLL, para lo cual se ha registrado las
notas de una muestra de alumnos de cada horario.
H1 0 2 3 11 11 11 12 12 12 12 12 12 12 13 13 13 14 14 15 15 15 15 15 15 15 20
H2 11 11 11 12 12 12 13 14 14 14 14 14 15 15 16 16 16 16 16 17 17 18 18 18 18
H3 0 1 8 8 8 9 10 10 11 11 12 12 13 13 13 14 15 15 16 16 16 17 17 17
Identifique:
*
H1 H2 H3
a) Horario con mayor
mediana de notas Mediana 12.5 15 12.5
b) Horario con mayor Q1 12 13 9.5
dispersión Q3 15 16 15.5
c) Horario con valores RIC 3 3 6
atípicos
Li 7.5 8.5 0.5
d) Horario con **
distribución de notas Ls 19.5 20 20
* *
asimétrica
Tarea – Prueba de Aptitud
Tarea - Consumo de Energía Eléctrica
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Desviación Estándar
Dados 𝑛 datos cuantitativos 𝑥1, 𝑥2, … , 𝑥𝑛 la
desviación estándar muestral de los datos se
define como la raíz cuadrada de la varianza.
Desviación Estándar
x x 2
Poblacional
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
n i x i x 2
n
k
SX i
1
n 1
n 1 i 1
f i x i x 2
Ejemplo – Calidad del aire
Una forma de evaluar la calidad del aire en un ambiente es medir la cantidad de material particulado
menor de 10 micrómetros, el cual puede ser nocivo. Suponga que se tienen las siguientes mediciones en
μ𝑔/𝑚3 (microgramo/metro cúbico), durante 6 días en una ciudad:
39.39 39.12 32.08 29.85 48.25 36.09
La varianza muestral será:
En R:
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Propiedades de la varianza y la desviación
estándar
Para datos cuantitativos.
Son números no negativos.
Son sensibles a valores atípicos.
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Propiedades de la varianza y la desviación
estándar
La varianza en unidades de los datos elevadas
al cuadrado.
La desviación estándar en las mismas unidades
que los datos.
Por ejemplo, Si los datos están expresados en kilos:
la varianza estará expresada en kilos2
la desviación estándar en kilos.
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Propiedades de la varianza y la desviación
estándar
Si se aplica la transformación 𝑋 en 𝑌 tal que:
𝑌 = 𝑎 𝑋 + 𝑏 , con 𝑎 y 𝑏 constantes,
entonces, la media, la varianza y la desviación
estándar de los 𝑛 valores 𝑦𝑖 son
respectivamente:
𝑦ത = 𝑎𝑥ҧ + 𝑏
2 2 2
𝑆𝑌 = 𝑎 𝑆𝑋
𝑆𝑌 = 𝑎 𝑆𝑋
Medidas de Dispersión
Las medidas de dispersión indican cuán alejados están los datos del
valor que los representa.
Propiedades de la varianza y la desviación
estándar
Si dos conjuntos de tamaño 𝑛1 y 𝑛2 , tienen
medias 𝑥1 y 𝑥2 y varianzas 𝑆12 y 𝑆22 , la unión de
ambos grupos tiene:
Ejercicio
En una muestra de ferreterías se ha registrado el precio de las varillas
de acero de 12 mm, encontrándose un precio medio de 19.80 nuevos
soles y una desviación estándar de 0.85 nuevos soles.
Si los precios se redujeran en un 5% en todas las tiendas, calcule el
nuevo precio medio y la nueva desviación estándar de los precios.
𝑋 = precio de una varilla de acero de 12 mm, 𝑋 ത = 19.8, 𝑆𝑋 = 0.85
𝑌 = precio reducido en 5%, 𝑌 = 0.950ถ.95 𝑋 + ณ
0
𝑎 𝑏
xi x
zi
sx
donde:
i = 1, 2,…, n
Puntuación Estandarizada Z
Ejemplo:
xi = Peso de niños varones de 5 años
x 18 .5
s x 2 .5
xi x
zi
11.0 13.5 16.0 18.5 21.0 23.5 26.0 sx
Peso (Kg)
zi = Peso estandarizado
z0
Fuente: reporte de la OMS sz 1
Tabla Valores de referencia…
el peso para la edad a los 5 años… -3 -2 -1 0 1 2 3
http://www.who.int/growthref
Peso estandarizado
Puntuación Estandarizada Z
Ejemplo:
xi = Peso de niños varones de 5 años
xi x
x 18 .5 zi
s x 2 .5 sx
Peso considerado
bajo para varones
de 5 años
11.0 13.5 16.0 18.5 21.0 23.5 26.0 10.5 13.2 15.9 18.6 21.3 24.0 26.7
Peso (Kg) Peso (Kg)
zi = Peso estandarizado
-3 -2 -1 0 1 2 3
Peso estandarizado
Fuente: reporte de la OMS. Tabla Valores de referencia… el peso para la edad a los 5 años…
http://www.who.int/growthref
Puntuación Estandarizada Z
Características:
Si los datos son: x1 x2, …. , xn
zi de xi indica a cuántas desviaciones estándar,
los datos estandarizados: por arriba o por debajo de la media, se
encuentra el dato xi observado.
xi x En la práctica, el puntaje z sirve para evaluar si
zi
sx un dato es grande o pequeño respecto a los
demás.
Por ejemplo, un dato cuyo puntaje
donde i = 1, 2,…, n estandarizado es menor que -3 o mayor que 3
se considera un dato extremo o atípico.
Se cumple: z 0 Para poder comparar unidades estadísticas (u
sz 1 observaciones) de una misma variable que
pertenecen a dos o más clases (o categorías),
se puede usar la puntuación estandarizada
dentro de cada conjunto de datos.
Ejemplo (pág. 51)
Un conjunto de alumnos rindió dos exámenes. Primer examen, nota media: 13.4 y la
desviación estándar: 2.3, segundo examen, nota media: 15.4 y la desviación
estándar: 4.3. Una persona obtuvo 14 en el primer examen y 16 en el segundo
examen. En términos relativos a los resultados de cada examen, ¿en cuál de ambas
situaciones el alumno tuvo mejor desempeño?
x' 13 .4
x' x' 14 13 .4
1er examen: s x ' 2.3 z' 0.26
x' 14 sx' 2.3
f1 f k , f 2 f k 1 , f 3 f k 2 , ...
Simétrica
As 0
Asimétrica a la derecha, Cola a la
x Q2 derecha
As 3 Los datos están concentrados
sx
As 0 a la izquierda de la mediana
y dispersos a su derecha
donde : Q2 P50 mediana
Asimétrica a la izquierda, Cola a
la izquierda
As 0 Los datos están concentrados
a la derecha de la mediana
y dispersos a su izquierda
Indicadores de Asimetría
Mide si los datos están ubicados simétricamente o no respecto a una
medida de tendencia central.
Coeficiente de asimetría de Fisher 𝜸𝟏
Simétrica
As 0
Asimétrica a la derecha, Cola a la
derecha
Los datos están concentrados
As 0 a la izquierda de la mediana
y dispersos a su derecha
Los datos se
concentran a la
izquierda de la
mediana y se
n 17, x 20. 88, Q 2 16, S x 9. 92 dispersan a la
Asimétrica a la derecha
Sesgo a la derecha derecha
x Q2 20. 88 16
As 3 3 1. 476 Cola a la derecha
s x 9 . 92
Ejercicio
El siguiente cuadro muestra la distribución del sueldo mensual de los empleados de dos
empresas A y B en diciembre del 2017.
Empresas A y B: Sueldos mensuales en julio del 2011
Empresa A Empresa B
Sueldos (en Marca
Número de Número de
nuevos soles) de clase
trabajadores trabajadores
[1 500 – 2 500] 2000 2 1
]2 500 – 3 500] 3000 40 6
]3 500 – 4 500] 4000 12 25
]4 500 – 5 500] 5000 3 6
]5 500 – 6 500] 6000 1 1
Fuente: Gerencia de Recursos Humanos Empresas A y B.
En un mismo plano, muestre los polígonos de frecuencias para los sueldos de los trabajadores
de las empresas A y B. Compare la simetría de las distribuciones de los sueldos en las
empresas gráficamente y usando el coeficiente de asimetría de Pearson. Comente.
Indicador de Curtosis
Leptocúrtica
Indicador de Curtosis