You are on page 1of 6

UNIVERSIDAD NACIONAL DE JUJUY

FACULTAD DE HUMANIDADES Y CIENCIAS SOCIALES

ESTADSTICA

GUIA DE APRENDIZAJE - UNIDAD 3

Introduccin:

Distribuciones de Frecuencias

Ejemplo 1

El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto a la
dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos y ha obtenido
los siguientes datos:

2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1

Observando los datos del ejemplo es fcil adivinar cual ser el primer paso en la
organizacin de los datos; consistir en agrupar aquellos datos que se repiten varias veces.
Tenemos las siguientes definiciones:

FRECUENCIA ABSOLUTA (fi): es el nmero de veces que se repite un determinado valor (xi) de
la variable. Ej1: para el dato x1=0 n1=2, para el dato x4=3 n4=15.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al tamao muestral.

FRECUENCIA RELATIVA (ri): es igual a la frecuencia absoluta dividida por el nmero total de
datos, es decir por el tamao muestral ri=fi/n. Ei1.: r1=2/50=0.04, r4=15/50=0.3

PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.

FRECUENCIA ACUMULADA (Fi): Nos dice el nmero de datos que hay igual o inferiores a uno
i
determinado. Se calcula: Fi n j Fi 1 f i
j 1
Ej1: N1=2, N4=42.

PROPIEDAD: La ltima frecuencia acumulada absoluta es el tamao muestral.

FRECUENCIA RELATIVA ACUMULADA (Ri): Es el resultado de dividir cada frecuencia


i
F
acumulada por el nmero total de datos Ri i
n
fj
j 1
Ej1: R1=0.04, R4=42/50=0.84.

PROPIEDAD: La ltima frecuencia relativa acumulada es la unidad.

1
TABLA DE FRECUENCIAS:
Llamamos as a una tabla que presenta todas las clases o categoras de la variable y sus
respectivas frecuencias, que puede estar ordenada o no.
Ejemplo 1:

xi fi ri Fi Ri
0 2 0,04 2 0,04
1 4 0,08 6 0,12
2 21 0,42 27 0,54
3 15 0,3 42 0,84
4 6 0,12 48 0,96
5 1 0,02 49 0,98
6 1 0,02 50 1
50 1

Cul es el nmero de familias que tiene como mximo dos hijos?


en la columna de las ni: 2+4+21=27 en la columna de las Ni: N2= 27
Cuntas familias tienen ms de 1 hijo pero como mximo 3?
en la columna de las ni: 21+15=36 en la columna de las Ni: 42-6=36
Qu porcentaje de familias tiene ms de 3 hijos?
en la columna de las fj: 0.12+0.02+0.02=0.16, que supone un 16% en la columna de las Fi: 1-
0.84=0.16, 16%

DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Hemos visto en el caso anterior que los valores distintos que tomaba la variable eran muchos,
es decir k era grande y eso haca que la tabla obtenida fuera muy poco manejable y por tanto poco
clarificadora. Esto nos va a ocurrir frecuentemente en el caso en que la variable a estudiar sea
continua. La solucin es agrupar los diferentes valores de la variable en intervalos o
intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en
informacin, con lo que los resultados sern aproximados.
Agrupar en intervalos de clase consiste en agrupar los datos en un nmero relativamente pequeo
de intervalos que cumplan:

No se superpongan entre s, de forma que no exista ambigedad con respecto a la clase a


que pertenece una observacin particular.
Cubran todo el rango de valores que tenemos en la muestra.

Llamaremos:
A las fronteras del intervalo, lmites inferior y superior de la clase y los denotaremos por
Li, Ls.
Marca de clase (xi) al punto medio del intervalo, es decir, al promedio aritmtico entre el
L L
lmite inferior y superior: x i i s .Es el valor que tomamos como representativo.
2
Amplitud (ai) a la diferencia entre el extremo superior e inferior: a i= Ls - Li .

Al nmero de observaciones de una clase se le llama frecuencia de clase (fi), si dividimos


esta frecuencia por el nmero total de observaciones, se llama frecuencia relativa de
clase (ri), y del mismo modo que lo hacamos para datos sin agrupar definiramos Fi, y Ri.

Nota: como construir una distribucin de frecuencias agrupada en intervalos:

2
1. Empezamos determinando el recorrido de la variable o rango de valores que tenemos en
la muestra. Se define como la diferencia entre el mayor y el menor valor de la variable.
Re=xmax-xmin
2. Nmero de clases: depende del tamao de la muestra. Para muestras de tamao

moderado, n <50, se suele elegir un nmero de clases igual a n , o bien se usa la formula
de Sturtges, (se toma el resultado de calcular el logaritmo de n, dividir por el logaritmo de 2

y sumar 1: K log(n ) 1 ); en casos de muestras muy grandes no debe pasar de 15 20.


log( 2)

3. Determinamos la amplitud de lo intervalos. Es ms cmodo que la amplitud de todas las


Re
clases sea la misma (siempre que sea posible), si es ai
n de intervalos
4. Hacer una lista con los lmites de cada intervalo colocando primero al intervalo que
contenga el dato ms pequeo (mnimo), el lmite inferior ms pequeo debe ser
exactamente divisible en la amplitud del intervalo. (por ejemplo si el valor mnimo es 46 y la
amplitud 5, mi primer intervalo ser de 45-49, porque 46 no es divisible en 5, esto se aplica
para variables discretas.
5. Palotear los datos en bruto contenidos en los intervalos de clase correspondientes.
6. Sumar las cuentas de cada intervalo para obtener la frecuencia del intervalo.

Clculo de la moda para datos agrupados

Todos los intervalos tienen la misma amplitud.


Frmula:

fi - fi - 1
Mo Li .ai

(fi - fi - 1) (fi - fi 1)

Li es el lmite inferior del intervalo que contiene a la moda.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Ejemplo

Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:

Intervalos fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100

3
(42 - 18)
Mo 66 .3 67,846 68
(42 - 18) (42 - 27)

Clculo de los percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.

En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias


acumuladas o sea la posicin o nmero de orden en la escala total:

K .N
, K 1,2,...99
100
En segundo lugar utilizo la frmula para saber su valor ms aproximado

K.n
- Fj - 1
PK Lj 100 .aj
fj

Lj es el lmite inferior del intervalo donde se encuentra el percentil.


n es la suma de las frecuencias absolutas.
Fj-1 es la frecuencia acumulada anterior a la clase del percentil.
fj es la frecuencia absoluta de la clase
aj es la amplitud de la clase.

Ejemplo
Calcular el percentil 35 y 60 de la distribucin de la tabla:

35. 65
Intervalos fi Fi fi% Fi%
Posicin Percentil 35, 22,75
[50, 60) 8 8 12,31% 12,31% 100
[60, 70) 10 18 15,38% 27,69%
22,75 18
[70, 80) 16 34 24,62% 52,31% P35 70 . 10 72, 97 73
[80, 90) 14 48 21,54% 73,85% 16
[90, 100) 10 58 15,38% 89,23%
[100, 110) 5 63 7,69% 96,92%
60. 65
[110, 120) 2 65 3,08% 100,00% Posicin Percentil 60, 39
100
65 100,0%

39 34
P60 80 . 10 83,57 84
14

4
Contenidos:

Primera sntesis de la informacin. Anlisis univariado. Medidas de Distribucin. Frecuencias.


Series simples y series de frecuencias para variables discretas y continas. Distribuciones de
frecuencias absolutas y relativas. Variables cualitativas. Amplitud y marca de la clase. Moda.
Significado, propiedades, aplicaciones, Clculo. Medidas de Posicin. Cuartiles y percentiles,
concepto, clculo, aplicaciones. Significado. Representaciones grficas.

Cuestionario orientador para la bsqueda bibliogrfica:

1. A que se llama Distribucin de Frecuencias?


2. Diferencie los siguientes conceptos: Distribucin de Frecuencias Absolutas, Distribucin de
Frecuencias Relativas, Distribucin de Frecuencias acumuladas, Distribucin de
Frecuencias relativas acumuladas.
3. Distribucin de porcentajes acumulados
4. Distribucin de frecuencias de datos agrupados.
5. Defina Rango, Amplitud y Marca de clase.
6. Otra medida de distribucin: Moda, utilidad, forma de obtener con datos agrupados o no.
7. Medidas de Posicin: cuartiles, percentiles, definicin, utilidad, forma de obtener con datos
agrupados o no agrupados.

Ejercicios Propuestos:
1. Los resultados electorales para Gobernador en la Provincia de Jujuy en el ao 2011 se
registraron los siguientes resultados: Frente para la Victoria: 160.402 votos, Unin para el
Desarrollo Social: 73.276 votos, Frente Primero Jujuy: 29.039 votos, Frente Amplio
Progresista: 8.951 votos, Frente de Izquierda y de los Trabajadores: 5.583 votos y otros:
3483 votos.

a. Elabora una Tabla de Distribucin de Frecuencias absolutas y acumuladas.


b. Dibujar un grfico adecuado a los valores observados.
c. Qu conclusiones puede extraerse de sta tabla y grfico?
d. Cul es la moda? Y el P45?

2. Las siguientes observaciones expresan el nmero de veces que veintids consumidores


compraron una determinada marca de un producto en los ltimos dos meses.

0 2 5 0 3 1 8 0 3 1 1
9 2 4 0 2 9 3 0 1 9 8
a. Construir la distribucin de frecuencias relativas y la de frecuencias relativas
acumuladas.
b. Representar ambas distribuciones
c. Qu proporcin de personas no compraron nunca dicha marca?
d. Qu porcentaje de consumidores adquirieron dicha marca menos de cinco veces?
e. Se puede obtener alguna conclusin del estudio?
f. Cul es el P60 y el valor del Q3?

3. Considerando la condicin de los lesionados durante noviembre y diciembre del ao 2010


en un municipio de la provincia de Jujuy, (tabla de datos en la hoja lesionados del archivo
Excel Unidad 3), elabore una tabla de frecuencias relativas y relativas acumuladas.

a. Qu porcentaje son conductores?


b. Cul es la categora ms afectada?
5
c. Trabajando sobre la categora ms importante cul es el mecanismo de la lesin
sufrida ms relevante?
d. Cul es el valor del P70?

4. Una universidad utiliza el sistema de calificaciones de 0 a 7.0, donde 7.0 es la calificacin


ms alta posible. Las calificaciones que aparecen a continuacin son los promedios de las
calificaciones de los inscriptos actualmente en una licenciatura de esa universidad.

3.9 4.7 3.7 5.6 4.3 4.9 5.0 6.1 5.1 4.5
5.3 3.9 4.3 5.0 6.0 4.7 5.1 4.2 4.4 5.8
3.3 4.3 4.1 5.8 4.4 3.8 6.1 4.3 5.3 4.5
4.0 5.4 3.9 4.7 3.3 4.5 4.7 4.2 4.5 4.8

a. Haga una distribucin de frecuencias para los datos agrupados, elija el nmero de
intervalos adecuados.
b. Segn la poltica de la Universidad el estudiante debe tener un promedio de
calificaciones de 5.0 o mayor como requisito para aprobar la asignatura, en virtud de
ello Qu porcentaje de los estudiantes necesita mejorar sus calificaciones?
c. Qu porcentaje de los estudiantes necesita mejorar sus calificaciones partiendo de
los datos sin agrupar?
d. Qu diferencia encuentra en las respuestas a los dos tems anteriores?, puede
justificar la diferencia?
e. Cul es el valor del P80?

5. Los siguientes datos corresponden a las edades de 40 personas que sufrieron lesiones
viales en un municipio de la Provincia de Jujuy Nov y Dic/2010:
7 11 20 27 31 18 20 30
22 28 45 25 7 13 15 5
1 27 8 25 17 17 19 17
19 25 4 33 22 43 25 18
32 22 40 56 62 23 27 24

a. Realice una distribucin de frecuencias para los datos agrupados, elija el nmero de
intervalos adecuados.
b. El 80% de los lesionados entre que edades se encuentran?
c. Cul es el intervalo de edad ms afectado? Y el menos?
d. Determine el 65% de edades ms involucradas en las lesiones viales.
e. Determine el valor de Q1, Q2, y Q3.

Bibliografa:

Cap. 2 - "Estadstica Para Las Ciencias Sociales", Ferris J. Ritchey, 2008, Ed. Mc. Graw
Hill. Mxico.
Cap. 3 - "Estadstica para las Ciencias del Comportamiento". Robert R. Pagano, 2006, Ed.
Internacional Thomson Editores
Cap. 2 y 3 Introduccin a la Estadstica para las Ciencias Sociales. Pea et al., 2000,
Ed. Mc Graw Hill. Espaa.
Apuntes de la Ctedra