You are on page 1of 23

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

(Universidad del Perú, DECANA DE AMERICA


FACULTAD DE EDUCACIÓN

ESTADÍSTICA APLICADA A LA EDUCACIONI

ANÁLISIS EXPLORATORIO DE DATOS

Dr. SALOMÓN MARCOS BERROCAL VILLEGAS


ANÁLISIS EXPLORATORIO DE DATOS

•DIAGRAMA DE TALLO Y HOJAS


•GRÁFICO DE CAJAS
•GRÁFICO DE PARETO
DIAGRAMA DE TALLO Y HOJAS
Constituye una forma de representación gráfica que facilita la obtención
simultánea de la distribución de frecuencias de la variable y su
representación gráfica. Donde cada valor numérico se divide en dos
partes.

Es decir, los dígitos principales formarán el tallo (eje vertical) y los


dígitos secundarios las hojas (eje horizontal).
DIAGRAMA DE TALLO Y HOJAS
Ejemplo 1.
Construir un diagrama de tallo y hojas para el siguiente conjunto de datos
82 74 86 68 56 78 82 96 78 88
66 68 72 98 86 78 58 76 84 78

Solución
Para elaborar el diagrama de tallo y hojas se empieza seleccionando los
valores que conformaran el tallo, que en nuestro caso son: 8, 7, 6, 5, 9, que
reordenados son: 5, 6, 7, 8 y 9.
Luego vamos añadiendo a cada hoja a su tallo.

POR ÚLTIMO REORDENAMOS LAS HOJAS


Tallo Hojas Tallo Hojas
5 6 8 5 6 8
6 8 6 8 6 6 8 8
7 4 8 8 2 8 6 8 7 2 4 6 8 8 8 8
8 2 6 2 8 6 4 8 2 2 4 6 6 8
9 6 8 9 6 8
GRÁFICO DE CAJAS
Constituye una forma de representación gráfica en forma de cajas
basado en los cuartiles. Se presenta mediante cajas rectangulares,
donde se representa el valor mínimo y máximo, los cuartiles; Q1, Q2,
Q3 y los valores atípicos.

Muestra visualmente como


se distribuyen los datos. Su
utilidad radica en que
facilita la comparación de la
distribución de los datos
entre diferentes grupos.
CONSTRUCCIÓN DEL GRÁFICO DE CAJAS
 Se ordenan los datos
 Calcular los cuartiles (Q1, Q2, Q3)
 Calcular el rango intercuartílico (IQR)

IQR = Q3 – Q1

 Calcular el límite inferior (LI) y el límite superior (LS)

LI = Q1 – 1.5 x IQR
LS = Q3 + 1.5 x IQR
 Los límites marcarán los datos atípicos de la variable. Todos
aquellos puntos que sean menores que LI (x < LI) o mayores
que LS (x > LS) son valores extremos. Es decir, son todos
aquellos valores que no están en el intervalo [LI,LS].
 El mínimo es el menor valor del conjunto que sea mayor o igual
que LI. El máximo es el mayor valor del conjunto que es menor o
igual que LS.
EJEMPLO 2:
En un bosque plantaron veinte (N=20) árboles y, al cabo de unos años,
se mide la altura para ver su evolución
7.13 5.35 10.14 4.15 5.85 4.69 6.84 0.94 3.45 5.79
5.64 4.92 5.32 6.56 6.17 4.33 6.18 6.50 3.74 2.98

Solución
Primero se ordenan los datos
0.94 2.98 3.45 3.74 4.15 4.33 4.69 4.92 5.32 5.35
5.64 5.79 5.85 6.17 6.18 6.5 6.56 6.84 7.13 10.14
A partir del conjunto ordenado calculamos los cuartiles

n 20 2 n 2 (20) 3 n 3 (20 )
Q1    5 Q2    10 Q3    15
4 4 4 4 4 4
Luego, los tres cuartiles son:

Q1  4.15 Q2  5.35 Q3  6.18


EJEMPLO 2:
Luego calculamos el rango intercuartílico (IQR)
IQR = Q3 – Q1
IQR = 6.18 - 4.15 = 2.03
IQR = 2.03

A partir del rango intercuartilico (IQR), calculamos el LI y el LS


LI = Q1 – 1.5 x IQR LS = Q3 + 1.5 x IQR
LI = 4.15 - 3.045 LS = 6.18 + 3.045
LI = 1.105 LS = 9.225

Luego, los valores extremos serán todos los árboles que midan menos
de 1.105m o más de 9.225m. Tenemos dos árboles, uno de 0,94m y
otro de 10.14m que serán valores extremos. Estos valores los
representamos con puntos en el diagrama de caja.
El Xmínimo es el menor elemento del conjunto que sea mayor o igual
al límite inferior. El Xmáximo es el mayor elemento que sea menor o
igual al límite superior. En este caso, el mínimo es 2,98 y el máximo
CÁLCULO DEL GRÀFICO DE CAJAS
EJEMPLO 3:
Dado el siguiente conjunto de datos hallar e interpretar a través de un
diagrama de cajas

7 11 14 11 9 13 14 13 6 16 13

Solución
Primero se ordenan los datos

6 7 9 11 11 13 13 13 14 14 16

A partir del conjunto ordenado calculamos los cuartiles

n  1 11  1 2 (n  1) 2 (11 1) 3 (n  1) 3 (111)


Q1   3 Q2   6 Q3   9
4 4 4 4 4 4

Luego, los tres cuartiles son:

Q1  9 Q2  13 Q3  14
CÁLCULO DEL GRÀFICO DE CAJAS
CÁLCULO DEL GRÀFICO DE CAJAS
Dado el siguiente conjunto de datos hallar e interpretar la distribución de
los datos a través de un diagrama de cajas
Primer ejercicio:

Segundo ejercicio:

Tercer ejercicio:
GRÁFICO DE PARETO
Es una representación gráfica de los datos obtenidos sobre un
determinado problema para identificar sus causas más importantes.
Su fundamento parte de considerar que un pequeño porcentaje de
las causas, el 20%, producen la mayoría de los defectos, el 80%.
La idea central es
localizar los pocos
defectos, problemas o
fallas vitales para
concentrar los
esfuerzos en la solución
o mejora de éstos.
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
Un Gráfico estadístico no sustituye
a una tabla estadística, la
complementa.

¡Gracias!

You might also like