You are on page 1of 2
9.5.2. Diagrama de caja El diagrama de caja constituye una potente herramienta gréfica que permite el estudio de ciertas caracteristicas de la distribucién y, simultaneamente, facilita la visualizacién de valores andmalos en caso de que existan. Puede conceptuarse como ‘el andlogo visual de la representacién de valores letra al traspasar a un nivel gr: co la informacién numérica contenida en los valores letra. En su version mas sim- ple, el diagrama de caja se construye de la forma siguiente: 1. Sobre un eje graduado se dibuja un recténgulo, una caja, cerrado por los dos cuartiles, 2. Enel interior de la caja se identifica una medida de tendencia central, habi- tualmente la mediana o la media aritmética, mediante una linea horizontal 0 cualquier otro simbolo. 3, Finalmente, desde la parte inferior de la caja, correspondiente al primer cuartil, se traza una linea hasta el valor minimo de la distribucién. Anéloga- mente, desde la parte superior de la caja, correspondiente al tercer cuartil, se traza una linea hasta el valor maximo. El procedimiento anterior presenta el problema de que, por su excesiva simplici- dad, no permite la visualizacién de los posibles valores anémalos y puede ocultar aspectos relevantes de la distribucién, Debido a ello, el procedimiento constructivo aconsejado e implementado en la mayor parte de los programas informaticos consis- te en lo siguiente: 1. Dibujar el recténgulo o caja limitado por los dos euartiles y sefialar, dentro de Ja caja, la posicién que ocupa la mediana. 2. Desde la parte inferior del rectdngulo, desde el primer cuartil, trazar una 1inea perpendicular hasta el valor adyacente situado en la parte izquierda de la distribucién (por debajo del primer cuartil). Andlogamente, trazar una Iinea desde la parte superior del recténgulo, desde el tercer cuartil, hasta el valor adyacente situado en la parte derecha de la distribucién (por encima del tercer cuartil). En el easo de que la distribucién no tenga valores anéma- los, los valores adyacentes coineidiran con el valor minimo y maximo de la distribucién. 8, Identificar los valores anémalos de la distribucién, si los hay, ¢ indicarlos en el diagrama diferenciando claramente los valores atipicos de los extremos. Frecuentemente, los valores atfpicos se representan mediante un punto y los extremos con un asterisco. En el procedimiento presentado, la caja del diagrama ha quedado delimitada por los dos cuartiles de la distribucién. No obstante, determinados programas de ordena- dor, por defecto, construyen el diagrama de caja empleando el método empirico de ‘Tukey, por lo que la caja queda delimitada por los dos cuartos. La Figura 9.6 recoge los coneeptos principales que participan en la construccién de un diagrama de caja. Fundamentalmente, los objetivos del diagrama de caja pueden resumirse como sigue: 1, Localizar el centro de la distribucién definido por la mediana. 2, Evaluar la dispersién en el 50% central de la distribucién, definido por la lon- gitud de la caja y que se corresponde con la amplitud intercuartil o el F-spread. © ITES-Paraninfo DPESCRIPCION UNIVARIANTE DE DATOS CUANTITATIVOS: INDICES BASADOS EN ORDENAGIONES | 365 Fraura 9.7 Diagrama de caja de los datos del estudio sobre actitudes alimentarias, En el 50% central, drea delimitada por la caja, puede aceptarse un patrén ligera- mente asimétrico definido por la posicién précticamente centrada de la mediana. Sin embargo, el nivel de asimetria incrementa a medida que el interés se desplaza hacia las eolas, detecténdose diversos valores anémalos on la zona alta de la distri, bucién. Respecto a la parte inferior de la distribucién es importante destacar que no se detectan valores andmalos, concentrandose el 25% en un intervalo de 3 (valor mfnimo) a 8 puntos (primer cuartil). En este sentido, el rango de variacién observa. doentre el primer cuartil y la mediana queda definido por el intervalo de 8 a 14 pun. tos, esto es, 6 puntos. Asi pues, el 50% de los datos con valores inferiores se concen. tra en el intervalo de 3 a 14 puntos, definiéndose una amplitud en dicho intervalo de 11 puntos. Por otro lado, en la parte alta de la distribucion, el 25% de las obser. vaciones situadas entre la mediana y el tercer cuartil se distribuyen en el intervalo de 14 a 22 puntos, lo que define un rango en ese intervalo de 8 puntos, Este resul., tado es cereano al obtenido entre el primer cuartil y la mediana (6 puntos), y la lige. ta discrepancia observada es la responsable de la asimetria moderada en el centro de la distribucién. En cambio, a partir del tercer cuartil se observa la mayor desvia. ci6n de la simetria. En particular, el grafico revela la presencia de cuatro valores atipicos (representados mediante 4 puntos) y un valor extremo (representado por un asterisco), Estos resultados son coincidentes con los obtenidos numérieamente en el apartado anterior: los cuatro valores atipicos son los correspondientes a los casos 122, 114, 82 y 101, mientras que el valor extremo corresponde a la puntuacién de 64 puntos obtenida por los casos 111 y 118. © TES Paraninfo

You might also like