You are on page 1of 12

Distribucin de frecuencia

Es una ordenacin tabulada de los datos recopilados en una investigacin o estudio, de


acuerdo a la clase o intervalo a que pertenece y con el nmero de veces o frecuencias que se
repite. Una distribucin de frecuencias se represente por medio de tablas de frecuencia y
grficas.

Clases de frecuencias

o Frecuencia absoluta.

La frecuencia absoluta de una variable estadstica, es el nmero de veces que


aparece en la muestra dicho valor de la variable, la representaremos por fi

o Frecuencia relativa.

Es una medida til para poder comparar. La frecuencia relativa es el


cociente entre la frecuencia absoluta y el tamao de la muestra.
Generalmente se expresa en porcentaje. Se denota por fr

Donde n = Tamao de la muestra fi = frecuencia absoluta

o Frecuencia Absoluta Acumulada.

Para poder calcular este tipo de frecuencias hay que tener en cuenta que la
variable estadstica ha de ser cuantitativa. La frecuencia absoluta acumulada
de un valor de la variable, es el nmero de veces que ha aparecido en la
muestra un valor menor o igual que el de la variable y lo representaremos
por Fi.

o Frecuencia Relativa Acumulada.

Al igual que en el caso anterior la frecuencia relativa acumulada es la


frecuencia absoluta acumulada dividido por el tamao de la muestra, y la
denotaremos por Fr

Ejemplo
Tomamos para ello los datos relativos a las notas de una prueba de
matemticas.

Rango de las Nmero de notas Frecuencia Frecuencia


Frecuencia
notas( (Frecuencia Absoluta Relativa
Relativa (%)
Intervalos) Absoluta) Acumulada Acumulada (%)
fi Fi fr Fr
1-2 16 16 16/50 = 32% 32%
32% + 40% =
2-3 20 16 + 20 = 36 20/50 = 40%
72%
72% + 18% =
3-4 9 36 + 9 = 45 9/50 = 18%
90%
90% + 10% =
4-5 5 45 + 5 = 50 5/50 = 10%
100%
Total 50 100%

Pasos para elaborar una distribucin de frecuencias

1. Ordenar los datos u observaciones, desde el menor hasta el mayor o viceversa

2. Se determina el rango o amplitud de la serie de datos, que es la diferencia entre el


valor mayor y el valor menor.

Rango o Amplitud = C = Xmax. Xmin.

3. Se determina el nmero de intervalos o clases (K) que se utilizan para agrupar los
datos.

4. En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20


intervalos o clases. Sin embargo, si no se tiene seguridad del nmero de intervalos
a utilizar, se puede aplicar la regla de Sturges, con la cual se obtiene una
aproximacin aceptable sobre el nmero de intervalos necesarios para agruparlos.

Nmero de Intervalos = K = 1 + 3.322 log. n

5. Una vez escogido el nmero de intervalos se determina la amplitud de cada clase


o intervalo (C). Esta amplitud es igual al rango de los datos dividida en el nmero
de intervalos. El primer intervalo debe contener el menor valor de los datos y el
ltimo intervalo debe contener el mayor valor de los datos.

6. Se calcula la marca de clase (Xi), que es el valor medio o promedio de cada


intervalo. el cual sirve para facilitar el clculo de algunas medidas de posicin y de
dispersin.

Ejemplo Se determinaron las ventas en millones de pesos durante el mes de junio, en 34


almacenes de la ciudad de Bogot, obtenindose los siguientes datos:

Almac Ventas Almac Ventas Almac Ventas Almac Ventas Almac Ventas
n * n * n * n * n *
1 10.6 8 11.6 15 16.5 22 12.3 29 8.6
2 12.5 9 14.9 16 15.0 23 9.7 30 8.5
3 11.1 10 12.5 17 10.3 24 12.0 31 10.1
4 9.2 11 12.5 18 12.4 25 11.8 32 12.4
5 11.5 12 12.3 19 9.1 26 12.7 33 11.1
6 9.9 13 12.2 20 7.8 27 11.4 34 10.2
7 11.9 14 10.8 21 11.3 28 9.3

* Ventas en millones de pesos.

Aplicando la frmula de Sturges para el clculo del nmero de intervalos en que se


dividen las observaciones obtenemos:
k = 1 + 3,322 log 34 = 1 + 3,322 1,53148 = 6,08757

Es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(max) = 16.5 y el menor
x(min) = 7.8, la amplitud sugerida es:
Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como intervalos en los
que clasificar los datos

[7'5 - 9), [9 - 10'5), [10'5 - 12), [12 - 13'5), [13'5 - 15), [15 - 16'5]

Los datos agrupados en los intervalos obtenidos, proporcionan la siguiente tabla de


distribucin de frecuencia.

No de intervalos Intervalos fi Fi fr Fr Xi
1 7'5 - 9'0 3 3 8.8% 8.8% 8.25
2 9'0 - 10'5 8 11 23.6% 32.4% 9.75
3 10'5 12' 10 21 29.4% 61.8% 11.25
4 12' - 13'5 10 31 29.4% 91.2% 12.75
5 13'5 15' 1 32 2.9% 94.1% 14.25
6 15' - 16'5 2 34 5.9% 100% 15.75

Representacin grfica

Los grficos que representan de manera adecuada una distribucin de frecuencias son:

Histograma de frecuencia

Est formado por un conjunto de rectngulos, cada uno levantado para cada
intervalo, de tal manera que la base ser igual a la amplitud C y la altura est
dado, ya sea por la frecuencia absoluta o por la relativa. En el ejemplo de las
ventas, (tabla anterior) tenemos:

Polgono de frecuencia

Con la misma informacin que fue utilizada para elaborar el histograma de


frecuencia se puede dibujar el polgono de frecuencia. Se establece los puntos
medios del intervalo, denominados marca de clase, que se colocan en el eje
horizontal o abscisa. Para cada valor de la variable corresponder un valor de la
frecuencia sealndose en el plano cartesiano por un punto; luego de establecidos
todos los puntos, se unen mediante lneas rectas, las que en conjunto forman el
polgono. El polgono de frecuencia para el ejemplo anterior es:

Ojiva

Es el grfico de las frecuencias acumuladas. Para el trazado de esta


grafica, en primer lugar, se ubican los puntos en el plano cartesiano.
Dichos puntos se determinan teniendo en cuenta la marca de clase (eje x)
y las frecuencias absolutas o relativas acumuladas (eje y) tal como se
presenta a continuacin:
Medidas de tendencia central: Media, Mediana, Moda
Supngase que un determinado alumno obtiene 35
puntos en una prueba de matemtica. Este puntaje, por
s mismo tiene muy poco significado a menos que
podamos conocer el total de puntos que obtiene una
persona promedio al participar en esa prueba, saber
cul es la calificacin menor y mayor que se obtiene, y
cun variadas son esas calificaciones.

En otras palabras, para que una calificacin tenga


significado hay que contar con elementos de referencia
generalmente relacionados con ciertos criterios El promedio de notas es muy
estadsticos. importante.

Las medidas de tendencia central (media, mediana y


moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen
en una prueba.

Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se
ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos,
entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del
promedio de la clase.

En resumen, el propsito de las medidas de tendencia central es:

Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.

Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.

Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.

Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms
grupos.

Las medidas de tendencia central ms comunes son:

La media aritmtica: comnmente conocida como media o promedio. Se representa por


medio de una letra M o por una X con una lnea en la parte superior.

La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se


representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se
representa Mo.

De estas tres medidas de tendencia central, la media es


reconocida como la mejor y ms til. Sin embargo,
cuando en una distribucin se presentan casos cuyos
puntajes son muy bajos o muy altos respecto al resto
del grupo, es recomendable utilizar la mediana o la
moda. (Porque dadas las caractersticas de la media,
esta es afectada por los valores extremos).

La media es considerada como la mejor medida de


tendencia central, por las siguientes razones:
La media, el mejor dato.
Los puntajes contribuyen de manera proporcional al
hacer el cmputo de la media.

Es la medida de tendencia central ms conocida y utilizada.

Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que
las medianas y las modas de las distribuciones no se promedian.

La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la


mediana y la moda en muy pocos casos.

Cmo calcular, la media, la moda y la mediana

Media aritmtica o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable
por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto de
datos dividida por el nmero total de dichos datos.

Ejemplo 1:

En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3

n = 6 (nmero total de datos)


La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el
promedio.

Ejemplo 2:

Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias


y luego calcular la media aritmtica. El siguiente cuadro con las medidas de 63 varas de
pino lo ilustra.

Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta


5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63 430

Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor, por
lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia absoluta es
10, significa que el valor a que corresponde se repite 10 veces).

Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de


nias de un Jardn Infantil.

5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

20, 12, 14, 23, 78, 56, 96


En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.

Mediana (Med)

Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor
o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde
al nmero del caso que representa la mediana de la distribucin.

Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.


Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores
antes y despus de l en un conjunto de datos agrupados.

Segn el nmero de valores que se tengan se pueden presentar dos casos:

Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho


conjunto de datos.

Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores


centrales (los valores centrales se suman y se dividen por 2).

Ejemplo 1:

Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10

El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Ejemplo 2:

El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y


corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los
valores centrales.

21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Ejemplo 3:
Interpretando el grfico de barras podemos deducir que:

5 alumnos obtienen puntaje de 62

5 alumnos obtienen puntaje de 67

8 alumnos obtienen puntaje de 72

12 alumnos obtienen puntaje de 77

16 alumnos obtienen puntaje de 82

4 alumnos obtienen puntaje de 87

lo que hace un total de 50 alumnos

Sabemos que la mediana se obtiene haciendo

lo cual significa que la mediana se ubica en la posicin intermedia entre los alumnos 25 y
26 (cuyo promedio es 25,5), lo cual vemos en el siguiente cuadro:
puntaje alumnos
62 1
62 2
62 3
62 4
62 5
67 6
67 7
67 8
67 9
67 10
72 11
72 12
72 13
72 14
72 15
72 16
72 17
72 18
77 19
77 20
77 21
77 22
77 23
77 24
77 25
77 26
77 27
77 28
77 29
77 30
82 31
82 32
82 33
82 34
82 35
82 36
82 37
82 38
82 39
82 40
82 41
82 42
82 43
82 44
82 45
82 46
87 47
87 48
87 49
87 50

El alumno 25 obtuvo puntaje de 77

El alumno 26 obtuvo puntaje de 77

Entonces, como el total de alumnos es par debemos promediar esos puntajes:

La mediana es 77, lo cual significa que 25 alumnos obtuvieron puntaje desde 77 hacia abajo
(alumnos 25 hasta el 1 en el cuadro) y 25 alumnos obtuvieron puntaje de 77 hacia arriba
(alumnos 26 hasta el 50 en el cuadro).