Tema 2

Distribuciones de frecuencias y
representaciones gráficas
1. Recogida y organización de datos.
2. Datos individuales y agrupados.
3. Distribuciones de frecuencias: frecuencias absolutas,
relativas.
4. Función de distribución: frecuencias acumuladas.
5. Representaciones gráficas: diagrama de dispersión,
diagrama de barras, histograma.
6. Aplicaciones a la Ingeniería Informática.

Tema 2: Representación

1

.
Frecuencias y distribuciones de frecuencias
Definición. Una distribución de frecuencias es
una lista o una tabla . . .
conteniendo agrupaciones de clases (categorías o intervalos
donde toman valor los datos) . . .
y las correspondientes frecuencias mediante las cuales los
datos toman valor dentro de cada clase o categoría.
Frecuencias:
frecuencia absoluta es el (número de veces que el valor
aparece en la muestra).
frecuencia relativa es el (proporción de veces que el valor
aparece en la muestra).

Tema 1: Introducción

2

. . La distribución condensa los datos primarios en una forma más útil .¢¯Por qué usar distribuciones de frecuencias? Una distribución de frecuencias es una forma de resumir los datos. Tema 1: Introducción 3 . y permite una interpretación visual rápida de los datos.

Frec. . xk nk fk = nk n Nk = n Fk = 1 Total n 1 vacío vacío Nota: ni = número de xi en la muestra.. Ni Acumul. Fi x1 n1 f1 = n1 n N1 = n1 F1 = f1 x2 n2 f2 = n2 n N2 = N1 + n2 F2 = F1 + f2 . Frec.. Clase.1 + fi 0 ¡Â fi . Fi = Fi.Agrupaciones por clases: datos categóricos y discretos Frec... fi Acumul.. fi = número de xi n Ni = Ni... .1 + ni .. Fi ¡Â 1 Fi y Ni no tienen sentido para variables categóricas nominales Tema 1: Introducción 4 .. . Relat. . Frec. xi Absol.... ni Relat.. Absol..

A. A. AB ¢¯Qué tipo de variable es grupo sanguíneo? Obtén la distribución de frecuencias de los datos. A. B. A. O. B. B. B. AB. O. AB. AB. A. B. A. A. B. O. AB. B.Agrupaciones por clases Ejemplo 1: Los datos inferiores muestran el grupo sanguíneo al que pertenecen los 40 individuos de una muestra. AB. A. A. AB. AB. O. A. O. B. A.O. B. A. B. B. O. ¢¯Qué porcentaje de la gente de la muestra pertenece al grupo sanguíneo A? ¢¯Qué porcentaje de la gente de la muestra pertenece a un grupo sanguíneo diferente de O? Tema 1: Introducción 5 . O. O.

nominal con 4 clases diferentes.: Categórica. 22. La distribución de frecuencias es: Frecuencia Frecuencia Clase Absoluta Relativa A 12 0.200 O 9 0.225 Total 40 1 30% 100% .5% = 77.Agrupaciones por clases Ejemplo 1 cont.275 AB 8 0.300 B 11 0.5% Tema 1: Introducción 6 .

¢¯Qué porcentaje de la gente muestreada está satisfecha? ¢¯Cuántos individuos están insatisfechos o peor? ¢¯En %? ¢¯Cuántos individuos están al menos satisfechos? ¢¯En %? Tema 1: Introducción 7 . Frecuencia Clase Absoluta MI 62 I 108 S 319 MS 412 Total 901 ¢¯Qué tipo de variable se está estudiando? Obtén la distribución de frecuencias de los datos. M=muy. S=satisfecho) en relación a 901 empleados.Agrupaciones por clases Ejemplo 2: La tabla inferior muestra diferentes niveles de satisfacción (I=insatisfecho.

46 901 1 Total 901 1 35% 170. 35% + 46% = 81% ó 100% . 170 = 731.19 S 319 0.Ejemplo 2 cont.: Categórica. La distribución de frecuencias es: Frecuencia Frecuencia Frecuencia Frecuencia Absoluta Relativa Clase Absoluta Relativa Acumulada Acumulada MI 62 0.54 MS 412 0.12 170 0.07 62 0.07 I 108 0.35 489 0. 19% = 81% Tema 1: Introducción 8 . 19% 319 + 412 = 731 ó 901 . ordinal con 4 clases diferentes.

El resultado se muestra a continuación. En cada una de las plantas muestreadas se contó el número de hojas atacadas por un hongo.Agrupaciones por clases Agrupaciones por clases Ejemplo 3: De entre las plantas que han sido tratadas con un nuevo pesticida. Frecuencia xi Absoluta 06 1 10 2 12 38 45 54 63 81 10 1 Total 50 Tema 1: Introducción 9 . se seleccionaron 50 para evaluar el comportamiento del nuevo pesticida.

Agrupaciones por clases Ejemplo 3 cont.: ¢¯Qué puedes decir acerca de la variable en estudio? Obtén su distribución de frecuencias. ¢¯Qué porcentaje de las plantas muestreadas tuvo sólo 3 hojas atacadas? ¢¯Cuántas plantas muestreadas tuvieron no más de 3 hojas atacadas? ¢¯Cuántas plantas muestreadas tuvieron al menos 6 hojas atacadas? ¢¯Qué porcentaje de las plantas muestreadas tuvo entre 3 y 5 hojas atacadas? ¢¯Qué porcentaje de las plantas muestreadas tuvo al menos 8 hojas atacadas? ¢¯Qué porcentaje de las plantas muestreadas tuvo a lo sumo 2 hojas atacadas? Tema 1: Introducción 10 .

16 36 0.02 49 0.02 50 1 Total 50 1 Tema 1: Introducción 11 .56 3 8 0.10 41 0.Agrupaciones por clases Ejemplo 3 cont.96 8 1 0.08 45 0.06 48 0.90 6 3 0. discreta con 9 valores diferentes.98 10 1 0. La distribución de frecuencias es: Frecuencia Frecuencia Frecuencia Frecuencia Absoluta Relativa xi Absoluta Relativa Acumulada Acumulada 0 6 0.12 1 10 0.32 2 12 0.: Numérica.12 6 0.24 28 0.82 5 4 0.20 16 0.72 4 5 0.

: 16% 36 3 + 1 + 1 ó 50 . 45 = 5 16% + 10% + 8% = 34% ó (8 + 5 + 4)/50 = 34% 2%+2% = 4% ó 100% .Agrupaciones por clases Ejemplo 3 cont. 96% = 4% 56% Tema 1: Introducción 12 .

... [lk. pero se excluye el extremo derecho (convención típica)..1 2 ni fi Ni Fi [l0...verifica su definición en el software. . l1) x1 n1 f1 N1 F1 [l1. l2) x2 n2 f2 N2 F2 . li ) xi = li+li. útil para tabular datos discretos si X toma muchos valores diferentes..Agrupaciones por clases que son intervalos: datos continuos (y discretos) Intervalo Marca de clase [li. . Es posible aplicar la convención en sentido opuesto . .. .. Tema 1: Introducción 13 .1..1... lk ) xk nk fk n 1 Total n 1 vacío vacío Nota: Se incluye el extremo izquierdo. .

Fórmula Sturges: K @ 1+log2 (n) = 1+ 3.Agrupaciones por clases que son intervalos: datos continuos (y discretos) Muy frecuentemente los intervalos tomados como clases poseen la misma amplitud.22 log10(n) k . Tema 1: Introducción 14 . Determinar la amplitud a para cada intervalo mediante a= número mayor . Redondea la amplitud del intervalo para obtener los extremos de los intervalos deseados.22 log(n) si n es grande.no. ¡î n side n es peque. 1 + 3. Más concretamente: k. Los intervalos nunca se solapan.número menor número de intervalos deseados ¢¯Cuántos intervalos? Aproximadamente entre 5 y 20.

etc. 38. 35. Se cuentan las observaciones que corresponden a cada clase. 38. 32. 37. Se ordenan los datos primarios en orden ascendente: 12. 27. 35. valor menor): 58 . 32. 20 pero menor que 30. 43. 24. 27.Agrupaciones por clases que son intervalos: datos continuos (y discretos) Ejemplo 4: Un fabricante de aislantes selecciona al azar 20 días de invierno y anota la temperatura más elevada del día (en grados Fahrenheit) 24. 26. Se determinan los extremos: 10 pero menor que 20. 43. 44. 26. 12. 21. 46. 17. 27 Obtén la distribución de frecuencias de los datos. 17. 12 = 46 Se selecciona el número de clases: es decir k = 5 Se calcula la amplitud de los intervalos: 10 (46/5 ¢¡ redondeo). 24. Tema 1: Introducción 15 . 27. 37. 58 Se obtiene el rango (valor mayor . 46. 13. 21. 53. 41. 30. 24. 13. 44. 53. 58. 41. 30.

30) 25 6 0.45 [30. 60) 55 2 0.Agrupaciones por clases que son intervalos: datos continuos (y discretos) Ejemplo 4 cont.20 18 0.70 [40.: Intervalo Marca de clase ni fi Ni Fi [10.10 20 1 Total 20 1 ¢¯En cuántos días la temperatura se encontraba por debajo de 30oF? ¢¯En %? (3 + 6 = 9.40 50. 40) 35 5 0. 20) 15 3 0. que es el 45 %) ¢¯En cuántos días la temperatura se encontraba en al menos 45oF? ¢¯En %? (2 + 445. que es el 20 %) Tema 1: Introducción 16 . 50) 45 4 0.25 14 0.15 [20.30 9 0.90 [50.40 = 4.15 3 0.

Representaci´on gr´afica de datos Una vez obtenida la distribuci´on de frecuencias de los datos. se pueden determinar las siguientes representaciones gr´aficas: Categ´orico Num´erico ⇓⇓ • diagrama de sectores • histograma • diagrama de barras • pol´ıgono de frecuencias • diagrama de caja Tema 2: Representación 17 .

300 B 11 0.Gr´aficos para datos cualitativos: diagrama de sectores Ejemplo 1: La siguiente tabla de frecuencias corresponde a los datos de grupos sangu´ıneos obtenidos de una muestra de 40 individuos.200 O 9 0. Frecuencia Frecuencia Clase Absoluta Relativa A 12 0.275 AB 8 0.225 Total 40 1 Tema 2: Representación 18 .

ya que los sectores traseros tienden a parecer menores que los sectores delanteros. _ Muchos programas ordenan las clases en orden alfab´etico.: _ Cada sector es una fracci´on del total del c´ırculo. _ Aunque es vistoso. es m´as complejo de leer que el diagrama de barras. _ Evitar los diagramas de sectores en 3D. Tema 2: Representación 19 .Diagrama de sectores Ejemplo 1 cont. _ Los sectores est´an etiquetados con los nombres de las clases.

Frecuencia Frecuencia Frecuencia Frecuencia Absoluta Relativa Clase Absoluta Relativa Acumulada Acumulada MI 62 0.35 489 0.Gr´aficos para datos cualitativos: diagrama de barras Ejemplo 2: La tabla inferior muestra diferentes niveles de satisfacci´on en relaci´on a 901 empleados.12 170 0.07 I 108 0.54 MS 412 0.19 S 319 0.46 901 1 Total 901 1 Tema 2: Representación 20 .07 62 0.

: _ Las barras tienen la misma amplitud y son equidistantes. Tema 2: Representación 21 . _ Las barras est´an etiquetadas con los nombres de las clases.Diagrama de barras Ejemplo 2 cont. _ Existen huecos entre las barras. _ Muchos programas ordenan las clases en orden alfab´etico. con alturas correspondientes a las frecuencias (absolutas).

donde se consideraba el n´umero de hojas infectadas por un hongo en una muestra de 50 plantas. _ Este es el diagrama de barras para el Ejemplo 3 del Tema 1.Diagrama de barras _ Los diagramas de barras pueden construirse tambi´en para datos discretos si no existen demasiados valores diferentes. 0 1 2 3 4 5 6 7 8 9 10 FRECUENCIAS 0 2 4 6 8 10 12 Tema 2: Representación 22 .

Cartograma Tema 2: Representación 23 .

25 8.5 14.37 14.32 9.02 16.37 13.32 13.50 16.50 20.32 12.02 19.02 12.37 21.02 18.2 13.20 19.38 6.32 9.02 19.32 10.07 21.51 11.02 Se separan los últimos dígitos.07 7.37 18.32 Tema 2: Representación 21.37 12.32 17.02 20.32 20.02 18.32 19.2 14.32 16.20 15.02 12.50 9.37 6.02 16.37 10.07 11.37 11.37 24 22.07 19.37 19.07 14.18 7.55 8.50 6.20 6.37 14.32 8.32 18.32 17.02 14.07 16.07 16.02 7.07 11.07 9.32 11.50 21.02 15.5 Distribución de frecuencias 8.18 6.02 7.32 12.37 7.37 20.20 16.5 20.07 14.24 9.2 20.55 7.50 19.24 10.05 8.38 .32 18.37 10.02 6.07 15.37 20.2 16.02 8.20 7.20 21.02 17.07 20.32 15.50 17.32 19.32 16.50 15.5 18.2 17.2 21.20 18.37 15.5 16.37 16.37 19.51 9.02 11.07 20.07 22.5 17.02 5.24 8.02 20.32 14.05 9.07 10.02 21.03 7.32 13.07 7.2 15.32 10.37 11.03 6.20 17.02 9.37 Histograma 8.50 18.37 17.25 7.32 21.32 7.32 13.07 13.37 15.24 11.37 13.07 13.5 15.37 9.5 19.07 15.07 17.02 14.Diagrama de tallos y hojas (Stem-and-Leaf Diagram) 5.02 13.48 8.07 8.37 8.37 17.32 7.20 8.07 18.2 8.32 14.02 14.02 21.07 19.02 13.02 9.37 13.02 17.37 12.2 7. 10.32 6.32 20.48 6.20 20.5 21.37 13.07 12.2 19.37 16.37 18.02 15.07 14.20 10.32 15.07 18.2 18.02 8.02 7.37 6.07 12.07 17.

45 [30.30 9 0.Gr´aficos para datos cuantitativos: histograma y pol´ıgono de frecuencias Ejemplo 4: La distribuci´on de frecuencias de la temperatura m´as alta del d´ıa (en grados oF) tomada en 20 d´ıas de invierno es como sigue: Intervalo Marca de clase ni fi Ni Fi [10. 30) 25 6 0.70 [40.20 18 0.90 [50. 40) 35 5 0.10 20 1 Total 20 1 Tema 2: Representación 25 .15 3 0.15 [20. 60) 15 2 0. 50) 45 4 0.25 14 0. 20) 15 3 0.

_ Amplitud de cajas ≡ amplitud de intervalos (id´enticos) y los l´ımites de las clases se marcan en el eje horizontal. absoluta). _ Las ´areas de cajas son proporcionales a las frecuencias.Histograma y pol´ıgono de frecuencias _ No hay huecos entre las barras/cajas. Tema 2: Representación 26 . _ Alturas de cajas ≡ frecuencias (aqu´ı.

. _ alturas de cajas = fi li−li−1 _ ´areas de cajas = fi Tema 2: Representación 27 . Histogramas de ´area 1 (sobre una escala de densidad) _ Amplitud de cajas ≡ amplitud de intervalos (no necesariamente id´enticos).

Pirámide de población Tema 2: Representación 28 .

Pictograma Tema 2: Representación 29 .