You are on page 1of 58

Profesor: Jorge José Esponda Véliz

Segunda semana
Profesor: Jorge José Esponda Véliz
DISTRIBUCIÓN DE FRECUENCIAS
En un estudio estadístico una vez que se recopilan los
datos del caso, es necesario clasificarlos y ordenarlos
antes de intentar su interpretación. Generalmente se
tienen números grandes de observaciones que se anotan
simplemente en el orden en que esas observaciones se
vayan haciendo. La clasificación adecuada de esas
observaciones es necesaria y de
gran importancia para poder llegar
a conclusiones mediante su análisis.
ELABORACIÓN DE UNA DISTRIBUCIÓN DE
FRECUENCIAS
Es el agrupamiento de datos en categorías que muestren
el número de observaciones en cada categoría
mutuamente excluyente.
EJEMPLO:
Se tiene las edades de 30 obreros
de una cierta compañía
33 34 43 30 47 38 34 40 31 33
42 28 42 39 30 32 47 37 32 35
41 35 37 33 39 34 32 43 40 38

SOLUCIÓN:
:
CALCULAMOS EL RANGO (R):
R = Máximo - Mínimo
La edad mínima es: 28 y la edad máxima es: 47.
Entonces el rango es: R = 47 – 28 = 19.

CALCULAMOS EL NÚMERO DE CLASES O
INTERVALOS (K):
Hay varios métodos para hallar el número de clases, estos son sólo una
sugerencia.
Primer método:
 
) 2 ( Ln
n Ln
K 
Donde “n” es el número total de datos. Para nuestro
ejemplo:
 
4. 91
Ln(2)
30 Ln
K  
Segundo método:
Log(n) * 3.322 1 K  
Para nuestro ejemplo por la fórmula de Sturges:
5.91 ) Log(30 * 3.322 1 K   
Tercer método:
Este es una sugerencia
de los expertos:
N K
n < 50 5 a 7
50 ≤ n < 100 6 a 7
100 ≤ n <250 7 a 12
n ≥ 250 10 a 20

K = 5
K = 6
Cuarto método:
La experiencia profesional puede determinar el número de clases.
Demasiadas clases o muy pocas no podrían dar a conocer la forma
básica del conjunto de datos. Por regla general, es mejor no utilizar
menos de 5, ni más de 15 clases en la elaboración
de una distribución de frecuencias.
Quinto método:
También se puede utilizar la regla de “la potencia de 2” para
determinar el número de clase. Seleccionamos el número entero
más pequeño tal que 2^k ≥ n, donde “n” es el número total de
observaciones. Veamos una pequeña tabla con esta regla:
Nº total de observaciones Nº recomendado de clases K
9 – 16 4 2
4
= 16
17 – 32 5 2
5
= 32
33 – 64 6 2
6
= 64
65 – 128 7 2
7
= 128
129 – 256 8 2
8
= 256
257 – 512 9 2
9
= 512
513 – 1024 10 2
10
= 1024

Para nuestro ejemplo haremos caso del primer método,
es decir: K = 5
CALCULANDO LA AMPLITUD DE INTERVALO (A):
La amplitud de una clase, se llama intervalos de clase.
Generalmente los intervalos de clase son de igual
amplitud. En este caso la amplitud de un intervalo de
clase es la diferencia entre dos marcas de clase
sucesivas, o límites superiores (o inferiores) de dos
clases sucesivas.
La amplitud de los intervalos de clase a tabular de un
determinado conjunto de datos, depende de la naturaleza
de esos datos y del uso que de ellos se piense hacer.
K
R
A 
Para nuestro caso:
3. 8
5
19
A  
Tomaremos como nuestro intervalo como A = 4
Si los intervalos son muy amplios contendrán
observaciones de magnitudes bastante variables, las
que estaremos considerando como un grupo
homogéneo, al hacer la distribución de frecuencias.
La fórmula para hallar la amplitud es:
CONSTRUIR LOS LÍMITES DE CLASES:
Vemos que cada intervalo debe tener 4 números:
Entonces 28 + 4 -1 = 31. Contiene al 28, 29, 30 y 31.
Entonces las clases serán:
Límite Inferior Límite Superior
28 31
32 35
36 39
40 43
44 47
CALCULANDO LOS LÍMITES REALES:
Sumamos o restamos la mitad de la unidad de medida:
Es decir: ½ = 0.5.
Límites Límites Reales
Inferior Superior Inferior Superior
28 31 27.5 31.5
32 35 31.5 35.5
36 39 35.5 39.5
40 43 39.5 43.5
44 47 43.5 47.5
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.
Límites Límites Reales
Marca de Clase
( Xi )
Inferior Superior Inferior Superior
28 31 27.5 31.5 29.5
32 35 31.5 35.5 33.5
36 39 35.5 39.5 37.5
40 43 39.5 43.5 41.5
44 47 43.5 47.5 45.5
TABLA DE FRECUENCIA
Límites Límites Reales
Marca de Clase
(Xi)
Frecuencia
(n
i
)
Inferior Superior Inferior Superior
28 31 27.5 31.5 29.5 4
32 35 31.5 35.5 33.5 11
36 39 35.5 39.5 37.5 6
40 43 39.5 43.5 41.5 7
44 47 43.5 47.5 45.5 2
Xi Marca de clase
n
i
Frecuencia absoluta
Ni Frecuencia absoluta acumulada
f
i
Frecuencia relativa
F
i
Frecuencia relativa acumulada
Puede resultar conveniente convertir las frecuencias
de clase a frecuencia de clase relativas para mostrar
el porcentaje del número total de observaciones en
cada clase.
Límites Límites Reales
Xi n
i
Ni f
i
Fi
Li Ls Lr
i
Lr
s

28 31 27.5 31.5
2
5 . 31 5 . 27 
29.5 4 4
30
4

0.13 0.13
32 35 31.5 35.5
2
5 . 35 5 . 31 
33.5 11 15
30
11

0.37 0.50
36 39 35.5 39.5
2
5 . 31 5 . 27 
37.5 6 21
30
6

0.20 0.70
40 43 39.5 43.5
2
5 . 43 5 . 39 
41.5 7 28
30
7

0.23 0.93
44 47 43.5 47.5
2
5 . 47 5 . 43 
45.5 2 30
30
2

0.07 1.00

Hallamos las frecuencias acumuladas y las frecuencias
relativas:
EJEMPLO:
Tenemos el puntaje de un concurso de matemática en un
colegio, que participaron 170 estudiantes (la nota máxima
es 100 y la nota mínima es 0).
54.5 52.0 88.0 45.0 68.9 40.0 84.1 71.9 89.0 75.5
69.0 77.4 74.0 60.0 70.2 71.4 30.0 59.8 77.1 58.5
15.1 52.3 80.0 74.5 53.0 70.5 63.0 90.4 67.2 81.4
25.3 70.0 60.5 89.5 41.0 63.5 58.0 56.4 62.3 64.7
73.8 85.2 45.0 56.5 72.2 69.5 80.1 24.0 58.6 75.8
54.0 94.1 70.5 61.5 30.0 54.5 72.2 69.0 55.4 72.9
91.2 99.0 47.6 51.5 64.0 64.2 56.6 60.0 80.1 75.3
63.1 66.9 58.0 51.5 50.6 68.2 65.5 55.0 98.2 62.5
63.0 66.0 69.2 36.5 88.6 53.2 77.5 52.0 64.0 67.4
70.0 87.0 95.6 37.3 74.4 85.1 78.5 71.0 68.0 84.7
79.0 61.0 79.0 66.2 60.6 37.6 65.1 77.7 82.3 84.8
76.9 64.0 25.6 73.0 48.3 82.4 8.0 50.5 58.0 55.8
59.5 83.0 86.0 45.1 41.2 60.4 77.0 76.5 65.8 87.9
95.6 68.1 67.0 68.2 77.2 69.4 56.0 84.6 65.9 55.5
26.0 42.8 58.0 74.3 84.4 45.5 78.1 95.2 63.7 58.5
17.2 62.6 63.0 76.0 41.0 73.5 67.1 59.0 91.7 64.0
63.3 68.5 72.0 55.5 57.0 46.6 76.5 53.0 46.7 95.0
PASO 1: Estableceremos
grupos más conocidos
como clases. En este
problema la primera clase
puede incluir a todos las
notas que estén entre 0 –
10, es decir las notas que
van de 0 hasta antes del
10 (no incluye el 10 pero
si incluye el 9.999).
Intervalo de Clase
Limite
Inferior
Limite
Superior
0 - 10
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90
90 - 100
Vamos a organizar los datos en 3 pasos:
PASO 2: Vamos a distribuir en clases las notas de los
estudiantes, sólo haremos las 7 primeras para mostrar
como se hace:
54.5
Pertenece a la clase de 50 – 60
52.0
Pertenece a la clase de 50 – 60
88.0
Pertenece a la clase de 80 – 90
45.0
Pertenece a la clase de 40 – 50
68.9
Pertenece a la clase de 60 – 70
40.0
Pertenece a la clase de 40 – 50
84.1
Pertenece a la clase de 80 – 90
Intervalo de Clase
Frecuencia
Limite
Inferior
Limite
Superior
0 - 10 1
10 - 20 2
20 - 30 4
30 - 40 5
40 - 50 13
50 - 60 33
60 - 70 45
70 - 80 36
80 - 90 21
90 - 100 10
PASO 3:
Contamos las
notas que
pertenecen a cada
clase:
HALLANDO INTERVALO DE CLASE Y PUNTOS
MEDIOS DE CLASE:
En el ejemplo de las notas, hay 10 clases, todas con
intervalos de clases de 10 unidades y las marcas de clase
o puntos medios son sucesivamente 5, 15, 25, 35,…
Intervalo de Clase
Xi
Frecuencia
Absoluta
Frecuencia
Absoluta
Acumulada
Frecuencia
Relativa
Frecuencia
Relativa
Acumulada
Limite
Inferior
Limite
Superior
0 10 5 1 1 0.0059 0.0059
10 20 15 2 3 0.0118 0.0177
20 30 25 4 7 0.0235 0.0412
30 40 35 5 12 0.0294 0.0706
40 50 45 13 25 0.0765 0.1471
50 60 55 33 58 0.1941 0.3412
60 70 65 45 103 0.2647 0.6059
70 80 75 36 139 0.2118 0.8177
80 90 85 21 160 0.1235 0.9412
90 100 95 10 170 0.0588 1
CALCULANDO LAS FRECUENCIAS RELATIVAS:
SUPONGAMOS:
En el ejemplo de las notas en vez de las 10
clases consideradas, tomáramos sólo las 4
siguientes:
0 – 25
25 – 50
50 – 75
75 – 100
Vemos que no estaríamos diferenciando entre
calificaciones como 50 y 74. Si los intervalos de clase son
muy pequeños (y por lo tanto el número de clases grande)
también tiene sus inconvenientes. Una distribución hecha
en esa forma, revelaría demasiado detalle para poder
obtener rápidamente una idea clara de los aspectos
importantes del estudio. Nótese, que esa es la razón por la
que el cuadro de los datos originales no se usa.
SUGERENCIAS PARA ELABORAR UNA
DISTRIBUCIÓN DE FRECUENCIAS
A continuación se presenta algunas pautas o guías:
Los intervalos de clase utilizados deben ser iguales.
Los intervalos de clase desiguales ofrecen problemas al
representar en forma gráfica la distribución. Sin
embargo, en algunos casos pueden ser necesarios
intervalos de clase desiguales para evitar un gran
número de clases vacías, o casi vacías.
Intervalo de Clase
Frecuencia
Limite Inferior Limite Superior
0 - 10 0
10 - 20 2
20 - 30 3
30 - 40 15
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
EJEMPLO:
Veamos el ejemplo
de las notas de
otro concurso
de matemática en
donde participaron
1000 estudiantes:
Entonces vemos que las clases de 0-10, 10-20, 20-30, no hay
casi estudiantes. Entonces podemos juntar con la clase 30 -
40:
Intervalo de Clase
Frecuencia
Limite
Inferior
Limite
Superior
0 - 40 20
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
Trate de evitar tener clases abiertas. Este
tipo de clases ocasiona problemas al hacer gráficos, y al
determinar ciertas medidas de tendencia
central y de dispersión.
EJEMPLO:
Los gastos de publicidad son un componente importante
en el costo de mercancías vendidas. A continuación se
presenta una distribución de frecuencias que muestran
los gastos de publicidad de 60 compañías productoras.
Evite la superposición de límite de clases establecidas. No deben
utilizarse límites de clase como 10 – 20 y 20 – 30. Las clases
establecidas de esta manera no son mutuamente excluyentes, lo que
infringe la definición de distribución de frecuencias. Con la
superposición de clases no estaría claro dónde clasificar un valor de
20.
Estos son sólo para no complicarnos, como en el ejemplo anterior.
Gasto de publicidad (millones de $)
Número de compañías
( f )
Menos de 35 7
35 – 45 10
45 – 55 21
55 – 65 16
Más de 65 10
Total 64
REPRESENTACIONES GRÁFICAS DE UNA
DISTRIBUCIÓN DE FRECUENCIAS

HISTOGRAMA:
Son barras verticales presentadas una a continuación de otra. Permite
presentar datos cuantitativos continuos. Es un gráfico muy utilizado.
Propiedades:
El ancho de cada columna es igual en todo el
gráfico y representa la amplitud de clase.
La altura está en función a la frecuencia de la clase.
Intervalo de Clase
Punto
Medio
Frecuencia
Limite Inferior Limite Superior
0 10 5 1
10 20 15 2
20 30 25 4
30 40 35 5
40 50 45 13
50 60 55 33
60 70 65 45
70 80 75 36
80 90 85 21
90 100 95 10
0
10
20
30
40
50
Serie1
1 2 4 5 13 33 45 36 21 10
10 20 30 40 50 60 70 80 90 100
0 10 20 30 40 50 60 70 80 90
POLÍGONOS DE FRECUENCIAS:
Es otra forma de conocer la distribución de los datos. Se
construye uniendo los puntos medios del lado superior
de las barras del histograma.
0
10
20
30
40
50
5 15 25 35 45 55 65 75 85 95
Notas
f
r
e
c
u
e
n
c
i
a
POLÍGONO DE FRECUENCIAS ACUMULADAS:
0
20
40
60
80
100
120
140
160
180
5 15 25 35 45 55 65 75 85 95
EJERCICIO 1:
Un conjunto de datos consta de 38 observaciones.
¿Cuántas clases recomendaría para la distribución de
frecuencias?


SOLUCIÓN:


Para esto tomaremos el quinto método:

entonces seria 2^5 < 38 < 2^6

es decir sugeriríamos 6 clases.

o también puede ser el
segundo método:

1 + 3.322 * log(38) = 6.24
EJERCICIO 2:
Un conjunto de datos consta de 230 observaciones
que oscilan desde 235 a 567. ¿Qué intervalo de clase
recomendaría?
37. 53
8. 846
332
l og(230) * 3. 322 1
235 567
K
R
A  


 
Entonces sugerimos un intervalo de 40.
SOLUCIÓN:
EJERCICIO 3:
La tienda CABRERA Y ASOCIADOS estaba interesada en
efectuar un análisis de sus cuentas por comprar. Uno de
los factores que más interesaba a la administración de la
tienda era el de los saldos de las cuentas de crédito. Se
escogió al azar una muestra aleatoria de 30 cuentas y se
anotó el saldo de cada cuenta (en unidades de soles) como
sigue:
77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99
43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Elaborar un reporte para la gerencia.
Encontrar en número de clases "K" , según la fórmula de
Sturges:
14. 415
6
86. 49
K
R
A   
Determinar la amplitud de la clase :
SOLUCION:

Efectuar el arreglo ordenado de la población o muestra:
7.42, 8.15, …, …, …, 90.99, 93.91
Encontrar el rango:
R = valor mayor – valor menor = 93.91 – 7.42 = 86.49
6 5.9069 Log(30) * 3.322 1 K    
Clases X
i
n f N F
7.420 – 21.835 14.628 10 0.33 10 0.33
21.835 – 36.250 29.043 4 0.13 14 0.46
36.250 – 50.665 43.458 5 0.17 19 0.63
50.665 – 65.080 57.873 3 0.10 22 0.73
65.080 – 79.495 72.288 3 0.10 25 0.83
79.495 – 93.910 86.703 5 0.17 30 1.00
Total 30 1.00
EJEMPLO:
La siguiente data representa al número de alumnos que
asistió a la clase de sociología, se ha pasado lista por 40
días. (el 1er día asistieron 3 cachimbos, el 2do día
asistieron 15 cachimbos, el 3ro 24 cachimbos…)
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,
36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribución.
En este caso son 3 y 48.
R = Máximo - Mínimo
R =48 – 3 = 45.
CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS
(K):
) ( * 322 . 3 1 n Log K  
322 . 6 ) 40 ( * 322 . 3 1    Log K
Para nuestro ejemplo:
Para nuestro ejemplo, vamos a trabajar con: K = 6
K
R
A 
Calculamos la amplitud de la distribución:
7. 5
6
45
A  
Entonces la amplitud sería 8.
Límite Inferior Límite Superior
3 (valor mínimo) 3+8 = 11
11 19
19 27
27 35
35 43
43 51
CONSTRUIR
LOS LÍMITES
DE CLASES:
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.
Límite Inferior Límite Superior Xi
3 11 (3+11)/2 = 7
11 19 (3+11)/2 = 15
19 27 (19+27)/2 = 23
27 35 (27+35)/2 = 31
35 43 (35+43)/2 = 39
43 51 (43+51)/2 = 47
Linf Lsup Xi fi Fi
3 11
7 2 2 = 2
11 19
15 6 2+6 = 8
19 27
23 5 8+5 = 13
27 35
31 11 13+11 = 24
35 43
39 12 24+12 = 36
43 51
47 4 36+4 = 40
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.
Linf Lsup Xi fi Fi hi
3 11
7 2 2 2/40 = 0.05
11 19
15 6 8 6/40 = 0.15
19 27
23 5 13 5/40 = 0.13
27 35
31 11 24 11/40 = 0.27
35 43
39 12 36 12/40 = 0.30
43 51
47 4 40 4/40 = 0.10
Hallando la frecuencia relativa:
Linf Lsup Xi fi Fi hi Hi
3 11
7 2 2 0.05 0.05
11 19
15 6 8 0.15 0.20
19 27
23 5 13 0.13 0.33
27 35
31 11 24 0.27 0.60
35 43
39 12 36 0.30 0.90
43 51
47 4 40 0.10 1.00
TOTAL 40 1
Calculando la frecuencia relativa
acumulada:
EJEMPLO: Suponga que usted es el estadístico oficial de
la línea aérea TACA y que el presidente del consejo
de administración le ha pedido que recoja y organice
datos relativos a las operaciones de vuelo. Su interés
principal a partir de los valores diarios se centra en la
variable de número de pasajeros. Ha obtenido estos datos
de los vuelos diarios de los últimos 50 días y ha reflejado
esta información:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribución.
En este caso son 50 y 102.
R = Máximo - Mínimo
R =102 – 50 = 52.
CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS
(K):
) ( * 322 . 3 1 n Log K  
644 . 6 ) 50 ( * 322 . 3 1    Log K
Para nuestro ejemplo:
Para nuestro ejemplo, vamos a trabajar con: K = 7
K
R
A 
Calculamos la amplitud de la distribución:
7. 43
7
52
A  
Entonces la amplitud sería 8.
Límite Inferior Límite Superior
50 (valor mínimo) 50+8 = 58
58 64
64 72
72 80
80 88
88 96
96 104
CONSTRUIR
LOS LÍMITES
DE CLASES:
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.
Límite Inferior Límite Superior Xi
50 58
(50+58)/2 = 54
58 66
(58+66)/2 = 62
66 74
(66+74)/2 = 70
74 82
(74+82)/2 = 78
82 90
(82+90)/2 = 86
90 98
(90+98)/2 = 94
98 106
(98+106)/2 = 102
Linf Lsup Xi fi Fi
50 58
54 2 2
58 66
62 3 5
66 74
70 12 17
74 82
78 14 31
82 90
86 9 40
90 98
94 8 48
98 106
102 2 50
TOTAL 50
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.
Linf Lsup Xi fi Fi hi Hi
50 58
54 2 2 0.04 0.04
58 66
62 3 5 0.06 0.10
66 74
70 12 17 0.24 0.34
74 82
78 14 31 0.28 0.62
82 90
86 9 40 0.18 0.80
90 98
94 8 48 0.16 0.96
98 106
102 2 50 0.04 1.00
TOTAL 50 1
Calculando la frecuencia relativa absoluta
y acumulada:
Asistencia de pasajeros
0
2
4
6
8
10
12
14
16
50-58 58-66 66-74 74-82 82-90 90-98 98-106
# Pasajeros
D
i
a
s
Poligono de Frecuencias
0
2
4
6
8
10
12
14
16
54 62 70 78 86 94 102
# Pasajeros (Xi)
D
i
a
s
POLÍGONOS DE FRECUENCIAS: Es otra forma de
conocer la distribución de los datos. Se construye
uniendo los puntos medios del lado superior de las
barras del histograma.
0
10
20
30
40
50
60
54 62 70 78 86 94 102
D
i
a
s
# Pajajeros (Xi)
poligano de frecuencias acumulado
“Una visión sin
acción es un sueño.
Una acción sin
visión es perdida de
tiempo.
Una visión con
acción puede
cambiar al mundo”.

Joel Baker
Muchas gracias