PASOS PARA AGRUPAR DATOS
Para agrupar datos se debe cumplir con los siguientes pasos:
1. Primer paso:
Eleccién del numero de intervalos:
Se hacen a través de un proceso matematico llamado regla
de Sturges en honor al matematico Herbert Sturges.
Regla de Sturges:
K= 1+ 3,32. Log (n)
Donde:
K = numero de intervalos
n= tamajio de la muestra
>» Elcalculo de K siempre se redondea por encima
» Si algun intervalo no tiene frecuencia absoluta, entonces para
ece intervalo ni-02. Segundo paso:
Calculo del rango de los datos:
R = valor maximo — valor minimo
3. Tercer paso:
Calculo de la amplitud:
1. A’ =amplitud sin redondear
wk
~K
2. A=amplitud redondeada
Se redondea siempre por encima de la amplitud sin redondear.
A continuacion veremos el proceso de la construccién de una tabla
de frecuencias para datos agrupados.DISTRIBUCION DE FRECUENCIAS
2. Para datos agrupados.
SITUACION DE ESTUDIO
La siguiente tabla muestra el numero de horas de suefio de 45
pacientes de un hospital como consecuencia de la
administracion de cierto anestésico.
7 10 12 4 8 7 3 8 5
12 a1 3 8 1 1 13 10 4
4 5 5 8 7 7 3 2 3
8 13 1 7 17 3 4 Ss 5
3 1 17 10 4 7 7 11 8A partir de estos datos;
1. Ordene la informacién de menor a mayor.
2. Introduzca la informacion en una tabla de frecuencias para
datos agrupados.
3. Calcule marca de clase y distribucion de frecuencias.
4. Halle las medidas descriptivas de una muestra para datos
agrupados.
HORAS DE SUENO DE 45 PACIENTES DE UN HOSPITAL COMO CONSECUENCIA
DE LA ADMINISTRACION DE CIERTO ANESTESICO.
DATOS ORDENADOS
rfijfiafijf2]3]3]3]3
3[3l[4l[4[4l[4a[4a][s [5
s|/s|/s|7]/7|7/7|7]7
7|/a{sj|sal|s {als | 10/10
to [11 | 11 | 12) 12,].13 | 13 | 17 | 17PASOS PARA AGRUPAR DATOS
1. Calculo de la eleccién del numero de intervalos :
K =1+3,32 log(n)
K =1+3,32 log(45)
K =1+43,32 (1,65)
K =1+5,49
kK =6,49
K=7
2. Calculo del rango de los datos:
R = valor maximo — valor minimo
R=17-1
R=163. Calculo de la amplitud:
A. Amplitud sin redondear
R
A=
K
16
A= 7= 2,29
B. Amplitud redondeada
A=3
Entonces:
K=7 > significa que la tabla de distribucidn de frecuencias
debe tener 7 filas
A=3>- significa que la distancia entre los limites de cada
intervalo debe ser 3
Un intervalo tiene dos limites asi:> Limite inferior (Li)
8 —12—> Limite superior (Ls)
Intervalo
HORAS DE SUENIO DE PACIENTES EN UN HOSPITAL COMO
CONSECUENCIA DE LA ADMINISTRACION DE CIERTO
ANESTESICO.
Ct) X, ni Ni fi FI
1-4 | 250) 11 11__| 24,44%| 24,44
4-7 | 5,50] 10 21 22,22| 46,66
7-10| 8,50] 413 34 28,89] 75,55
10-13] 11,50] 7 41 15,56, 91,11
13-16] 14,50| 2 43 4,44) 95,55
16-19] 17,50| 2 45 4,44) 100
19-22] 20,50} 0 0] 100%
ce eeMarcas de clase:
X; = 2,50
Con base en la distribucidén de frecuencia anterior responda
lo siguiente y justifique la respuesta:1. éCudntos pacientes durmieron mas de 7 horas en un hospital
como consecuencia de la administracion de cierto anestésico?
Rta.
13+7+2+2+0 = 24
2. dentre que numero de horas se localiza el 50% y mas de las
observaciones ?
Rta.
entre 7 y 22 horas
3. dentre que limites se localiza exactamente el 90% del numero de
horas de suefio de los pacientes?
Rta.
entre 10 y 13 horas
4. éCuantos apacientes durmieron a lo sum 13 horas en un hospital
como consecuencia de la administracion de cierto anestésico?
Rta.
11+10+13 = 34 horas5. éCudntos pacientes durmieron en un_ hospital como
consecuencia de la administracién de cierto anestésico entre
10 y 19 horas inclusive?
Rta.
7+2+2 = 11 pacientes
MEDIDAS DE RESUMEN O DESCRIPTIVAS DE UNA MUESTRA
DATOS AGRUPADOS
Cuando los datos se agrupan, las observaciones individuales
pierden su identidad, por esta razon se deben hacer ciertas
suposiciones respecto a los valores cuando se calcula una medida
de resumen o descriptiva de una muestra a partir de los datos
agrupados.
Como consecuencia de estas suposiciones, los resultados son
unicamente aproximaciones a los valores reales.A. MEDIDAS DE TENDENCIA CENTRAL CALCULADAS A PARTIR
DE DATOS AGRUPADOS
1. La media aritmética:
Es el valor que tendrian los datos, si todos ellos fueran
iguales, o también, el valor que corresponderia a cada uno
de los datos de la distribucidn si su suma total se repartiera
por igual.
Ventajas:
> Es de facil comprension
» Rapidez en el calculo
Desventajas:
es muy sensible a los valores extremos de la variable, ya que,
todas las observaciones intervienen en el calculo de la media,
la aparicion de una observacion extrema, hard que la media se
desplace en esa direccién.> Se simboliza como (X)
> La formula para su calculo es;
DXj.ni
n
x=
Donde:
X;: marca de clase
ni : frecuencia absoluta
n : tamaiio de la muestra
Ejemplo:
Calcular la media aritmética para la situacion de estudio
referenciada.
DXj.ni
n
X=c) X; ni Y X;.ni
-4 2,50| 11 27,50
-7 5,50] 10 55,00
7-10 8,50| 13 110,50
10-13 | 11,50| 7 80,50
13-16 | 14,50{ 2 29,00
16-19 | 17,50] 2 35,00
19-22 | 20,50] 0 0
TOTAL 45 337,50
DX,.ni 337,50
n 45 7750INTERPRETACION
Si no hubiese variabilidad en el numero de horas de suefio
de pacientes en un hospital como consecuencia de la
administracién de cierto anestésico, se podria decir que
todos los pacientes durmieron 7,50 horas, o
aproximadamente 8 horas.
2. La mediana:
Es el valor abajo del cual se encuentra la mitad de los datos y
arriba del cual se halla la otra mitad.
> Se simboliza como (Me) o (Md)
> La formula para su calculo es:
5+ MR 1.
Me = Li+>_— «ic
niDonde:
n= tamafio de la muestra.
n . . . ae .
on indica la ubicacidn en la tabla de frecuencias de la clase
medianal (es decir en donde esta la media)
Son valores que se encuentran
ubicados en la tabla de frecuencias,
mas exactamente en la fila donde
esta la clase medianal o la mediana.
Li = limite inferior
ic = intervalo de clase
ni = frecuencia absoluta
Nj-1 = es la frecuencia absoluta acumulada en la tabla de
frecuencias que esta ubicada en la parte superior de la fila
donde esta la mediana.
ic =A (intervalo de clase es la misma amplitud)Ejemplo:
Calcular la mediana para la situacion de estudio referenciada.
2_w,
ZT Ni-
zoNes
ni
Me=Li+
Recordemos que: n=45
ic
45
7 = = 22,50 = Este valor se busca en la frecuencia absoluta
acumulada (Ni) de la tabla de distribucién
de frecuencias, y en la fila donde se
encuentre e valor alli esta la mediana (Me)
0 Xi ni Ni
4-7 5,50 10 21 La Ni aun no llega a
22,50
ZaiLO, 8,50 13 34 Ni ya incluye a 22,50
entonces en esta fila se
encuentra la medianaEntonces:
U=75 5=22,50 Ni-1=21; ni=13; ic=3
n
Zz N-1
Me = Li+>—— + ic
ne
22,50 — 21
———"_ *
Me=7+ 13
Me a7 ong
e=T+ay*
Me =7 + (0,12 * 3)
Me=7+0,36 > Me=7,363. Lamoda:
Se define como el valor que se presenta con mayor frecuencia.
Para datos agrupados en una distribucién de frecuencias, es
posible aproximar la moda usando la marca de clase que
contiene el mayor numero de datos.
> se simboliza como (Mo)
Ejemplo:
Calcular la moda para la situacién de estudio referenciada.
La marca de clase del intervalo cuya frecuencia absoluta es
mayor es 8,50, por tanto podemos decir que:
Mo = 8,50 (con 13 repeticiones)C. MEDIDAS DE DISPERSION CALCULADAS A PARTIR DE
DATOS AGRUPADOS.
1. La varianza:
Es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribucidn estadistica. Cuando
se calcula la varianza a partir de datos agrupados se supone
que todos los valores que caen en un intervalo de clase
especifica se localizan en un punto medio del intervalo.> Se simboliza como (S?)
> La formula para su calculo es :
_ YX — X)?.ni
~ n-1
2
Donde:
Xj; = marcas de clase (puntos medios del intervalo)
X =media aritmética
ni = frecuencia absoluta
n =tamafio de la muestra
Ejemplo:
Calcular la varianza para la situacién de estudio referenciada.
_ YX — X)?.ni
~ n-1
S2
Recordemos que:
X = 7,50 m= 45i) X; ni (%,-X) (XX)? Ye —X)?.ni
1-4 2,50 11 -5,00 25,00 275,00
4-7 5,50 10 -2,00 4,00 40,00
7-10 8,50 13 -1,00 1,00 13,00
10-13 | 11,50 7 4,00 16,00 112,00
13-16 | 14,50 2 7,00 49,00 98,00
16-19 | 17,50 2 10,00 100,00 200,00
19-22 |20,50| oO 13,00 _| 169,00 0
TOTAL 738,00
ge Y(X;, — X)?.ni
n-1
2 __738 _ 738
“45-1 4
S?, =.1.6,.7.72. La desviacién tipica o desviacién estandar:
Esta medida nos permite proporcionar el promedio aritmético
de fluctuacién de los datos respecto a su punto central o media.
La desviacidn estandar nos da como resultado un valor
numérico que representa el promedio de diferencia que hay
entre los datos y la media.
» Se simboliza como (S)
» La formula para su calculo es:
S= VS?
Ejemplo:
Calcular la desviacién estandar para la situacién de estudio
referenciada.
Recordemos que:
S? = 16,77Ss
S= 16,77
Ss
INTERPRETACION
Se podria concluir que: el tiempo promedio en horas de suefio de
45 pacientes de un hospital como consecuencia de la
administracién de cierto anestésico es 7,50 horas, con una
tendencia a variar por debajo o por encima d dicho tiempo en
4,10 horas.eo
racide