You are on page 1of 8

Estadística I

Prof. Edmundo Peña Rozas

1

DISTRIBUCIÓN DE FRECUENCIAS
Cuando se toma una muestra de n observaciones de una variable X, las distintas observaciones se
designan por x1, x2, x3,…, xn, conforme al orden en que se han obtenido. En general xi representa la iésima observación. La n-ésima observación (xn) constituye la última observación.
La representación de las observaciones en forma de lista no resulta cómoda y tampoco permite
visualizar de manera rápida y clara los elementos importantes, por lo cual es necesario confeccionar
un cuadro que presente la información en forma resumida. Este cuadro se denomina cuadro o tabla
de distribución de frecuencias.
Las tablas estadísticas deben tener un título que indique QUE información se presenta, DONDE
fueron recolectados los datos, CUANDO se obtuvo la información. Cuando el título sea muy extenso
se puede acompañar con un llamado a pie de página.
En general, la tabla de distribución de frecuencias permite observar con rapidez y facilidad:
 Los distintos grupos o categorías en que se clasifican los datos (k grupos o categorías).
 Frecuencias absolutas (ni), que corresponde al número de observaciones que se clasifica en
cada uno de los k grupos, donde
k

n

0  ni  n

i

n

Frecuencias relativas (fi), que corresponde a la fracción de observaciones (respecto del total)
que se clasifican en cada grupo o categoría, donde

fi  ni / n

i 1

0  fi  1

n

f
i 1

i

1

Frecuencia absoluta acumulada (Ni), es el número de observaciones menores o iguales a las
que se clasifican en el grupo o categoría i, donde:
i

Ni   n j
j 1

donde:

0  Ni  n

Nk  n

N1  n1
N 2  n1  n2
N 3  n1  n2  n3
N k  n1  n2  n3  ..

 nk  n

Frecuencia relativa acumulada (Fi), corresponde a la fracción de observaciones (respecto del
total) menores o iguales a las que se clasifican en el grupo o categoría i, donde:
i

Fi   f j
j 1

donde:

13/03/2016

0  Fi  1

Fk  1

029 personales Hogares privados con servicio domésticos 53.018 Industrias manufactureras 120.57 0.99 0. si se trata de una variable en escala nominal solo son aplicables las frecuencias absoluta y relativa. Ejemplo: La tabla siguiente muestra la distribución de ocupados por rama de la región del Bíobío (miles de personas) en el trimestre Octubre – Diciembre de 2012 Ocupados por Rama de Actividad Económica en Región del Bíobío Trimestre Octubre.58 0.Noviembre-Diciembre 2012 (miles de personas) Frec. sociales y 24.48 0.00 Fuente: Compendio Estadístico 2013. almacenamiento y comunicaciones 45. Edmundo Peña Rozas 2 F1  f1 F2  f1  f 2 F3  f1  f 2  f3 Fk  f1  f 2  f3  .87 0.82 0.16 0.85 0.126 Pesca 6.079 Comercio 158. Rama de Actividad Frec. INE.51 0..008 Explotación de minas y canteras 14.028 Transporte. Agricultura.rel Abs.009 Actividades inmobiliarias.  fk  1 Caso Variable Cualitativa La tabla de distribución de frecuencias en el caso de una variable cualitativa se debe tener muy presente la escala en que se encuentre la variable.95 0. ganadería.90 0.77 0. y organismos extraterritoriales 0.050 Otras actividades de servicios comunitarios. Chile 13/03/2016 . gas y agua 11.063 Org.39 1.035 Administración pública 58.Estadística I Prof.188 Hoteles y Restaurantes 23.054 Intermediación financiera 7. caza y silvicultura 106.143 Suministro de electricidad. empresariales y de alquiler 29.49 0.29 0.087 Servicios sociales y de salud 42. Las frecuencias acumuladas carecen de significado a menos que la variable se encuentre medida al menos en escala ordinal.069 Enseñanza 73.014 Construcción 66.000 Total 845.3 0.00 0.86 0.

11 Total 500.11 Visual 81.29 0.00 Caso Variable Cuantitativa Discreta Ejemplo: frecuencias.16 Auditiva 36.96 1. efectuado el año 2004.20 Múltiple 53.720 0. de acuerdo al “Primer Estudio Nacional de la Discapacidad en Chile”.21 0. Según Tipo.04 0.900 0.07 Siquiátrica 29.250 1.Estadística I Prof.710 0. Distribución de Personas con Discapacidad en la VIII Región. Edmundo Peña Rozas 3 Ejemplo: La información contenida en la tabla siguiente corresponde a.13 0.456 0.75 0. la distribución de los habitantes de la VIII Región que sufren algún tipo de discapacidad.54 0. 2004 ni fi Discapacidad Física 141.092 0.88 0.29 Intelectual 56.00 . Dado el siguiente conjunto de observaciones construir una tabla de distribución de Datos 1 2 4 7 0 8 3 5 13/03/2016 6 7 2 5 1 5 4 4 5 3 1 6 5 3 6 2 xi ni 0 1 2 3 4 5 6 7 8 1 3 3 3 3 5 3 2 1 fi Ni Fi 0.04 1 4 7 10 13 18 21 23 24 0.13 0.08 0.17 0.06 Viscerales 100.532 0.13 0.13 0.42 0.13 0.840 0.04 0.

denotados como Li 1  Li . sin embargo.D15:D23) Caso Variable Continua Cuando se tiene una variable continua y se desea construir una tabla de distribución de frecuencias.SI($A$2:$C$9. absoluta acumulada y relativa acumulada.  La marca de clase (xi). a diferencia del caso de las variables discretas. La marca de clase se calcula como la semi-suma entre el límite superior e inferior de cada intervalo de clase. sin embargo. se debe agregar:  El límite inferior y superior de cada intervalo de clase. mientras que para la frecuencia absoluta se puede utilizar la función “CONTAR. esto último no es una condición estricta. Usualmente se construyen m intervalos. de tal manera que si la situación lo amerita se pueden construir intervalos de distinta longitud o incluso dejar abierto el intervalo superior o inferior (o ambos) La estructura de la tabla es esencialmente la misma que la utilizada en el caso de la variable discreta pero. existen algunas recomendaciones que es conveniente tener en cuenta debido a que si bien las tablas de distribución de frecuencias permiten resumir los datos. La construcción de los intervalos de clase se debe hacer siguiendo las pautas que se indican a continuación pero sin dejar de lado el sentido común y la participación directa de los investigadores.D8) =FRECUENCIA(A2:C9.Estadística I Prof. todos de igual longitud.SI” o bien la función “FRECUENCIA”. Edmundo Peña Rozas 4 La construcción de este tipo de tabla utilizando Excel se puede realizar escribiendo directamente la fórmula para la frecuencia relativa. también provocan una pérdida de información. 13/03/2016 . debiendo tener presente que esta función se debe ingresar como una matriz. xi  Li 1  Li 2 Construcción de Intervalos de Clase No existe una regla fija que permita la construcción de los intervalos de clase que resulten óptimos en número y amplitud. =G3/$G$11 fi Fi =E6/$G$11 =E7+G6 =CONTAR. a objeto de que la pérdida de información no sea significativa. que representa al valor que caracteriza a cada intervalo. por tal razón es necesario agruparlos en intervalos. nos encontramos un rango de valores demasiado amplio.

asegurándose de que estos incluyan el mínimo y máximo reales y que estos no se alejen demasiado de los observados. Calcular la amplitud de cada intervalo. Mientras mayor sea la amplitud del intervalo de clase. Rx  x 'máx  x 'mín En esta etapa es recomendable calcular el recorrido utilizando valores mínimos y máximos que sean cómodos de utilizar. Calcular el límite inferior de cada intervalo de clase como: Li 1  x 'mín  a  (i  1) donde i  1. en tanto que el último será cerrado tanto en su límite superior como inferior1. no es una condición estricta. Calcular el límite superior como Li  x 'mín  a  i donde i  1. o ambos 13/03/2016 .32193  log n Nota: Considerar la parte entera regla de Norcliffe regla de Sturges 2. Si n  100  k  1  3.. k 6.. Si n  100  k 2 n b.Estadística I Prof. Determinar el recorrido de la variable. Se sugiere considerar entre 5 y 10 intervalos de clase. por ejemplo: a la inversa o cerrando el límite inferior del primer intervalo o el superior del último. Pasos a Seguir 1. a. a objeto de asegurar que los intervalos sean contiguos y evitar que una observación pertenezca a más de un intervalo al mismo tiempo. siendo posible adoptar un criterio distinto. se debe calcular la diferencia entre el valor máximo y mínimo observado. mientras menor sea la amplitud del intervalo de clase. mayor será la pérdida de información. menor deberá ser la pérdida de información. 3. Determinar el número de intervalos (k). donde k es el número de intervalos a Rx k Aproximar la amplitud a un valor cómodo 4. es decir. Edmundo Peña Rozas     5 Considerar como límite inferior del primer intervalo un valor menor o igual que el mínimo observado en el conjunto de datos y considerar como límite superior del último intervalo un valor mayor o igual que el máximo observado. k 5. por el contrario. Los intervalos de clase serán cerrados por la izquierda y abiertos por la derecha. sin embargo un número excesivo de intervalos atenta contra la capacidad de resumen de la tabla de distribución de frecuencias.. Calcular la marca de clase como: xi  1 Li 1  Li 2 Este criterio se adopta para el trabajo en este curso pero.

entonces: Rx  x 'máx  x 'mín a  Rx  112  40  72 Rx 72 a  12 6 k xi  ( Li 1  Li ) / 2 i Li 1  x 'mín  a  (i  1) Li  x 'mín  a  i 1 L0  40  12(1  1)  40 L1  40  12(2  1)  52 L2  40  12(3  1)  64 L3  40  12(4  1)  76 L4  40  12(5  1)  88 L5  40  12(6  1)  100 L1  40  12 1  52 L2  40  12(2)  64 L3  40  12(3)  76 L4  40  12(4)  88 L5  40  12(5)  100 x5  (88  100 ) / 2  94 L6  40  12(6)  112 x6  (100  112 ) / 2  106 2 3 4 5 6 Li 1 - Li xi 40.100 0.250 0.0 70.5 81.5 79.6 84.0 76.000 La construcción de la tabla utilizando Excel es esencialmente igual al caso anterior.5 51.0 56.0 - 52.6 40.6 47.9 100.1 64.4 87.0 ni fj 6 4 12 10 5 3 40 0.0 58.150 0.32  6 El mínimo y el máximo son 40 y 110 respectivamente.0 67.5 78.9 75.075 1.4 83.250 0.2 64.2 73.0 88.3 63.000 x1  (40  52) / 2  46 x 2  (52  64) / 2  58 x3  (64  76) / 2  70 x 4  (76  88) / 2  82 Ni 6 10 22 32 37 40 Fi 0.1 68. no es múltiplo de 6.925 1.5 103.5 88.3 51. de tal forma que el recorrido (110-40).800 0. difiriendo solamente en el cálculo de la frecuencia absoluta simple y acumulada 13/03/2016 .9 59.0 112.0 100.2 68.0 46.7 94.Estadística I Prof.7 110.3 77.1 89.0 100.9 96.0 88.0 82.300 0.0 86.3 47. Edmundo Peña Rozas 6 Ejemplo: Consideremos las siguientes observaciones correspondientes a los kilómetros recorridos por un chofer en el turno de la mañana en una línea de colectivos de la comuna de Concepción: 43.0 64.0 76.125 0.550 0.4 66.8 68.7 74.1 69.6 52.0 94. siendo más cómodo utilizar como mínimo y máximo 40 y 112 respectivamente.2 64.1 79.0 106.0 76.7 Desarrollo Como n=40  k  2 40  6.150 0.0 64.0 52.0 90.

Estadística I Prof. Así. utilizando un procedimiento similar al caso de las variables continuas.. es posible agruparlos en intervalos de clase.MAS(L4/L6. una vez que se ha establecido la amplitud del intervalo: Calcular el límite superior de cada intervalo de clase como Li  x 'mín  a  i donde i  1. siendo más intuitiva y simple su construcción pues no es necesario generar la sensación de continuidad de un intervalo a otro. Edmundo Peña Rozas 7 =MIN(A2:J5) =MAX(A2:J5) =L3-L2 =REDONDEAR.0) Caso Variable Discreta Agrupada en Intervalos Si se trata de una variable discreta que adopta un rango muy amplio de valores. k El límite inferior del primer intervalo corresponde a x 'mín ( L0  x 'mín ) mientras que los límites inferiores de los intervalos siguientes se obtienen sumándole 1 (UNO) al límite superior del intervalo anterior Calcular la marca de clase como: xi  13/03/2016 Li 1  Li 2 .

37 24 11 76 66 97 53 38 11 18 64 5 88 80 78 19 94 48 27 74 9 57 51 99 79 14 39 70 56 28 94 99 50 68 35 79 49 70 34 64 Li 1 0 11 21 31 41 51 61 71 81 91 47 76 26 30 32 3 74 29 53 48 - 17 51 15 32 16 66 73 64 91 89 Li 10 20 30 40 50 60 70 80 90 100 62 91 29 56 77 90 54 36 32 99 xi 5.073 0.107 0.5 65.100 0.5 55.280 0.927 1.5 85.113 0.080 0.5 35.5 54 83 19 47 51 77 48 53 20 0 ni 11 15 16 17 16 20 17 15 12 11 150 24 36 47 49 54 34 88 44 54 37 fj 0.113 0.Estadística I Prof.747 0.173 0.107 0.500 0.133 0.393 0.5 75.633 0.073 0.000 Variable Discreta Variable Continua Pocos valores Muchos valores distintos distintos Agrupar en intervalos Muchas No agrupar en Agrupar en Observaciones intervalos intervalos Pocas No agrupar en Agrupar en Observaciones intervalos intervalos 13/03/2016 8 87 75 11 100 29 89 73 16 25 78 69 34 82 90 43 51 39 8 64 .100 0.5 25. Edmundo Peña Rozas 8 Ejemplo: Los datos que se presentan a continuación corresponden al número de clientes atendidos en un día por cada uno de los integrantes de la fuerza de ventas de una multitienda.847 0.000 80 39 52 18 58 33 48 89 15 67 88 56 41 68 70 49 28 3 11 51 Ni 11 26 42 59 75 95 112 127 139 150 9 83 50 28 31 53 1 27 96 1 98 65 53 68 0 24 46 28 27 63 Fi 0.5 95.5 45.0 15.073 1.