You are on page 1of 8

ARMANDO SOTELO UBALDO

IT-301 INGENERÍA ELECTROMECÁNICA


“PROBABILIDAD Y ESTADISTICA”
Diagrama de Caja y Bigotes
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.

Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde
se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos
que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de
este rango es marcado e identificado individualmente

EJEMPLO DISTRIBUCIÓN DE EDADES


Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de
un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS


Para calcular los parámetros estadísticos, lo primero es ordenar la distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable


que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la
media aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”
DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).

INFORMACIÓN DEL DIAGRAMA


Podemos obtener abundante información de una distribución a partir de estas representaciones.
Veamos alguna:

 La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre el 50% y
el 75%.

 El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por ello el 25% de
los más jóvenes están más concentrados que el 25% de los mayores.

 El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está comprendido


en 14,5 años.

Seguro que tú podrás obtener más información (¡Utiliza la mediana!)

Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos de
datos.
COMPARACIÓN DISTRIBUCIÓN DE EDADES
Análogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos
diagramas, esta distribución con la del otro ejemplo de distribución de edades.

35 38 32 28 30 29 27 19 48 40

39 24 24 34 26 41 29 48 28 22
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”

A partir de dicha comparación puede obtenerse bastante información de ambas distribuciones.

COMPARACIÓN ENTRENAMIENTOS DE UN CORREDOR


Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para
recorrer los 200 m, durante 10 días consecutivos (cada día se toman varios tiempos y se calculan
mediana, cuartiles, valores mínimo y máximo)

Observamos que el desplazamiento de las gráficas de caja hacia la izquierda indica que el
entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma distancia,
siendo la diferencia entre el máximo y el mínimo menor, como así también la diferencia intercuartílica.

COMPARACIÓN CLASIFICACIÓN LIGA


Las puntuaciones de los equipos de la liga de futbol BBVA de las temporadas 10/110 y
11/12 se pueden comparar con un diagrama caja y bigotes, como aparece aquí,
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”

Comparación de tres ligas europeas de futbol de la temporada 11/12


ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”
DIAGRAMA DE PARETO
El Diagrama de Pareto constituye un sencillo y gráfico método de análisis que permite discriminar
entre las causas más importantes de un problema (los pocos y vitales), y las que lo son menos (los
muchos y triviales).
Las ventajas del Diagrama de Pareto pueden resumirse en:

 Permite centrarse en los aspectos cuya mejora tendrá más impacto, optimizando por tanto los
esfuerzos.
 Proporciona una visión simple y rápida de la importancia relativa de los problemas.
 Ayuda a evitar que se empeoren algunas causas al tratar de solucionar otras y ser resueltas.
 Su visión gráfica del análisis es fácil de comprender y estimula al equipo para continuar con la
mejora.

Origen del Diagrama de Pareto


En 1909 el economista y sociólogo Vilfredo Pareto (1848 – 1923) publicó los resultados de sus
estudios sobre la distribución de la riqueza, observando que el 80% de la misma se encontraba
concentrada en el 20% de la población.
A finales de los años 30, durante una visita a la central de General Motors Corporation para el
intercambio de buenas prácticas de ingeniería industrial, Juran tuvo la oportunidad de conocer los
trabajos de Pareto sobre la distribución de la riqueza.

Más adelante Juran, mientras preparaba la primera edición de su obra Manual de Control de la
Calidad, se vio ante la necesidad de dar un nombre corto al principio de “los pocos vitales los muchos
triviales”. Bajo el título “La mala distribución de las pérdidas de calidad”, en el que figuraban
numerosos ejemplos de mala distribución, señaló que Pareto había encontrado mal distribuida la
riqueza.
Asimismo, mostró ejemplos de curvas acumulativas para la desigual distribución de la riqueza y la
desigual distribución de las pérdidas de calidad. Tituló esas curvas como principio de Pareto de la
distribución desigual aplicado a la distribución de la riqueza y la distribución de las pérdidas
de calidad.

Este título dio a entender, de forma involuntaria, que el principio de los “pocos vitales” con carácter
universal fue formulado por Pareto. Como el mismo Juran reconoce en The Non-Pareto Principle:
Mea Culpa, esta implicación es errónea. La que la primera exposición del principio como universal
corresponde al propio Juran, no a Pareto. También reconoce que, si lo hubiera expuesto de otro
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”
modo, seguramente se habría denominado principio de Juran. Consecuentemente, hoy se
denominaría diagrama de Juran, en lugar de diagrama de Pareto. Sin embargo, Juran tenía
necesidad de una denominación abreviada, y no tuvo reparos aplicar el nombre de principio de
Pareto.
Un apunte más. Incluso las curvas acumulativas características del diagrama de Pareto, no se
deben a él, sino al economista norteamericano Max Otto Lorenz (1905). Éste dedujo la curva de
Lorenz: una medida de la desigualdad en los ingresos de una sociedad.
La relación 80/20 se ha encontrado en distintos campos. Por ejemplo, el 80% de los problemas de
una organización son debidos a un 20% de las causas posibles. El 80% de los defectos de un
producto se debe al 20% de causas potenciales. El 80% del absentismo, es causado por un 20% de
empleados… Evidentemente, la relación no debe ser exactamente 80/20. Pero sí se puede aventurar
que unas pocas causas son responsables de la mayor parte de los problemas.

Una importante aplicación del Principio de Juran (o de Pareto), está en el diseño de programas de
mejora de la Calidad. Una acción de mejora deberá tener como objetivo a los pocos vitales.

Elaboración del Diagrama de Pareto


Los pasos a seguir para la elaboración de un diagrama de Pareto son.

1. Seleccionar los datos que se van a analizar. Así como el periodo de tiempo al que se refieren
dichos datos.
2. Agrupar los datos por categorías De acuerdo con un criterio determinado.
3. Tabular los datos.
Comenzando por la categoría que contenga más elementos y, siguiendo en orden descendente,
calcular las frecuencias:

 Absoluta.
 Absoluta acumulada.
 Relativa unitaria.
 Relativa acumulada.
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”

4. Dibujar el diagrama de Pareto.


5. Representar el gráfico de barras correspondiente que, en el eje horizontal, aparecerá también
en orden descendente.

6. Delinear la curva acumulativa.


Se dibuja un punto que represente el total de cada categoría. Tras la conexión de estos puntos se
formará una línea poligonal.

7. Identificar el diagrama, etiquetándolo con datos como: título, fehca de realización, periodo
estudiado,…
8. Analizar el diagrama de Pareto.
ARMANDO SOTELO UBALDO
IT-301 INGENERÍA ELECTROMECÁNICA
“PROBABILIDAD Y ESTADISTICA”

En el diagrama de Pareto anterior puede observarse como dos tipos de incidencias comprenden el
49,73% de los requerimientos de asistencia: Reponer papel (30,60%) y Requiere limpieza (19,13%).

You might also like