You are on page 1of 15

UNIVERSIDAD DE COSTA RICA ESCUELA DE ESTADSTICA Prof.

Olman Ramrez Moreira

DISTRIBUCIN DE FRECUENCIAS

FUENTE:
Gmez, Elementos de Estadstica Descriptiva Levin & Rubin. Estadstica para Administradores

DEFINICIN Y USO
Necesidad de resumir la informacin. Para que los datos sean tiles deben organizarse para distinguir patrones y tendencias y llegar as a conclusiones lgicas Una forma de organizar un conjunto de datos es clasificarlos en categoras o clases y luego contar cuntas observaciones quedan dentro de cada categora. Para el anlisis e interpretacin de datos es valioso conocer:
La forma o patrn de distribucin de los datos La posicin de la distribucin: alrededor de qu valor se tienden a concentrar los datos Variabilidad: la dispersin de los datos alrededor de los valores centrales

Ordenamiento o arreglo de los datos en clases o categoras indicando para cada una de ellas, el nmero de elementos que contiene o frecuencia

VISITAS DIARIAS HECHAS AL SITIO WEB DE ESTUDIOS SOBRE DIVERSIDAD CULTURAL EN EL PRIMER CUATRIMESTRE DEL 2007
22 22 23 24 25 26 26 26 27 27 27 28 28 28 29 30 30 30 30 30 30 30 31 31 31 31 31 32 32 33 33 33 33 34 34 34 34 35 35 35 35 35 35 35 35 35 35 35 35 36 36 36 37 37 37 37 38 38 38 38 38 38 38 38 38 38 39 39 39 40 40 40 40 40 40 40 41 41 42 42 42 42 43 43 43 44 44 45 45 45 45 45 45 46 46 47 47 47 47 47 48 48 48 49 49 49 50 50 52 52 52 52 53 53 54 55 61 62 64 72

MANIPULACIN DE LOS DATOS


Conclusiones obtenidas de estos datos: Edad mxima: 72 Edad mnima: 22 Amplitud general: 50 Mayora de valores est entre 30 y 50 Una visin ms clara se puede obtener construyendo una distribucin de frecuencias. Requiere definir: Valor de inicio de la primer clase Amplitud o intervalo a usar Conociendo ambas queda definida la cantidad de clases a contruir

EL NMERO DE CLASES
Depende de la cantidad de datos u observaciones y de la amplitud general Muchas observaciones Pocos datos permiten un mayor nmero de clases no conviene hacer muchas clases

Buscar un balance entre necesidad de resumir la informacin y mantener suficientes detalles para apreciar las caractersticas de los datos Partir de la amplitud general y probar con diferente nmero de clases hasta alcanzar un nmero de clases y un intervalo adecuado (rango / # clases) Decidir si usar clases iguales o desiguales El nmero de clases recomendable est asociado con la cantidad de datos.

Clases abiertas:

Ubicadas al principio o al final de la distribucin de frecuencias, Necesarias cuando unos pocos datos se alejan mucho de la mayora (hacia arriba o hacia abajo), Evitar construir clases intermedias vacas (para clases de igual amplitud)

Recomendaciones:

Las clases deben ser exhaustivas y mutuamente excluyentes Procurar que el nmero de clases oscile entre 5 y 10 Evitar, hasta donde sea posible, clases de diferente amplitud

COMPONENTES DE LA DISTRIBUCIN DE FRECUENCIAS


FRECUENCIAS ABSOLUTAS: Nmero de elementos u observaciones pertenecientes a una misma clase. FRECUENCIA RELATIVA: Se obtiene dividiendo la frecuencia absoluta por el nmero de observaciones Denota la importancia de la clase, al expresarse en trminos porcentuales Facilitan el anlisis de los datos, en especial para comparar distribuciones de frecuencias basadas en diferentes nmero de observaciones FRECUENCIA ACUMULADA Nmero de observaciones que son menores que el lmite superior de la clase Se obtiene sumando las frecuencias (absolutas o relativas) en sentido descendente PUNTO MEDIO: Valor central de la clase Promedio entre el lmite inferior de entre dos clases sucesivas Es el valor representativo de la clase

CLASIFICACIN VISITAS DIARIAS AL SITIO WEB ESTUDIOS SOBRE DIVERSIDAD. PRIMER CUATRIMESTRE 2007.
VISITAS DIARIAS
Punto medio

FRECUENCIA Absoluta Relativa

ACUMULADA Absoluta Relativa

20 30 40 50 60 70 Total

29 39 49 59 69 79

25 35 45 55 65 75

15 54 37 10 3 1 120

12,5 45,0 30,8 8,3 2,5 0,8 100,0

15 69 106 116 119 120

12,5 57,5 88,3 96,7 99,2 100,0

Interpretacin: f3: en 37 das del primer cuatrimestre del 2007 las visitas diarias al sitio WEB estuvieron entre 40 y 49 f%3: el 30.8% de los das del primer cuatrimestre de 2007 las visitas diarias al sitio WEB oscilaron entre 40 y 49 aos F3: 106 das del primer cuatrimestre del 2007 las visitas diarias al sitio WEB fueron 59 visitas o menos F%3: el 88.3% de los das del primer cuatrimestre del 2007 las visitas diarias al sitio WEB fueron 59 visitas o menos

REPRESENTACIN GRFICA

La representacin grfica contribuye a un mejor anlisis de los datos Facilita la comprensin del fenmeno considerado Pierde detalle de informacin pero se obtiene otro tipo de informacin Grficos utilizados: histograma, polgono de frecuencia y ojiva son tiles pues resaltan los patrones de los datos y atraen la atencin

HISTOGRAMA
Grfico de barras verticales, las barras no guardan separacin entre s Definidas las escalas en el eje cartesiano se dibuja un rectngulo acorde a la frecuencia de la clase (altura) En clases de igual amplitud las barras son proporcionales a la frecuencia de la clase

POLGONO DE FRECUENCIAS
La altura de cada punto la determina el punto medio (abscisa) y la frecuencia simple (ordenada) de la clase Los puntos se unen con secciones de rectas Se procede como si existiera una clase adicional al principio y al final, ambas con frecuencia cero tiles para representar dos distribuciones de frecuencia en un mismo grfico

OJIVAS
Para representar la frecuencia acumulada La ordenada se levanta sobre el lmite superior Tiene forma de S alargada

TENGA PRESENTE QUE:


HISTOGRAMA:
La altura debe ser proporcional al nmero de elementos de la clase En ocasiones puede resultar ms til el histograma elaborado con la frecuencia relativa porque permite comparar conjuntos de datos de tamao diferente

POLIGONO DE FRECUENCIAS
Es ms sencillo que el histograma correspondiente Traza con mayor claridad el perfil del patrn de los datos Se vuelve cada vez ms liso y parecido a una curva al agregar cada vez ms y ms datos

SUGERENCIA
Aadir siempre dos clases en los grficos: una al inicio y otra al final con frecuencia cero

EJERCICIO PRCTICO
En el Hospital de la Mujer se dispone de los siguientes datos del peso en libras de 200 bebs prematuros nacidos en 2006.
0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 0,9 1,4 1,9 2,4 2,9 3,4 3,9 4,4 10 19 24 27 29 34 40 17

Construya una distribucin de frecuencias completa:


Cul es el valor medio aproximado del conjunto de datos original? Si los bebs prematuros que pesan menos de 3.0 libras se les suele mantener en incubadora durante varios das como medida precautoria, aproximadamente qu porcentaje de bebs prematuros nacidos en el Hospital de la Mujer en 2006 necesitaron incubadora? Qu forma (patrn) tiene la distribucin de los datos?

DISTRIBUCIN DE LOS PESOS DE LOS 200 BEBES PREMATUROS NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006 PESO (lbs) 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 0,9 1,4 1,9 2,4 2,9 3,4 3,9 4,4
P unt o m e d io

FRECUENCIA
A b s o lut a R e la t i v a

ACUMULADA
A b s o lut a R e lat iv a

0,8 1,3 1,8 2,3 2,8 3,3 3,8 4,3

10 19 24 27 29 34 40 17 200

5,0 9,5 12,0 13,5 14,5 17,0 20,0 8,5 100,0

10 29 53 80 109 143 183 200

5,0 14,5 26,5 40,0 54,5 71,5 91,5 100,0

TOTAL

Promedio:

547,35 / 200 = 2,74

PESO EN LIBRAS DE LOS 200 BEBES PREMATUROS NACIDOS EN EL HOSPITAL DE LA MUJER EN 2006
25

20

FRECUENCIA

15

10

0 0,3 0,8 1,3 1,8 2,3 2,8 3,3 3,8 4,3 5,3
PESO EN LIBRAS

Related Interests