You are on page 1of 24
PASOS PARA AGRUPAR DATOS Para agrupar datos se debe cumplir con los siguientes pasos: 1. Primer paso: Eleccién del numero de intervalos: Se hacen a través de un proceso matematico llamado regla de Sturges en honor al matematico Herbert Sturges. Regla de Sturges: K= 1+ 3,32. Log (n) Donde: K = numero de intervalos n= tamajio de la muestra >» Elcalculo de K siempre se redondea por encima » Si algun intervalo no tiene frecuencia absoluta, entonces para ece intervalo ni-0 2. Segundo paso: Calculo del rango de los datos: R = valor maximo — valor minimo 3. Tercer paso: Calculo de la amplitud: 1. A’ =amplitud sin redondear wk ~K 2. A=amplitud redondeada Se redondea siempre por encima de la amplitud sin redondear. A continuacion veremos el proceso de la construccién de una tabla de frecuencias para datos agrupados. DISTRIBUCION DE FRECUENCIAS 2. Para datos agrupados. SITUACION DE ESTUDIO La siguiente tabla muestra el numero de horas de suefio de 45 pacientes de un hospital como consecuencia de la administracion de cierto anestésico. 7 10 12 4 8 7 3 8 5 12 a1 3 8 1 1 13 10 4 4 5 5 8 7 7 3 2 3 8 13 1 7 17 3 4 Ss 5 3 1 17 10 4 7 7 11 8 A partir de estos datos; 1. Ordene la informacién de menor a mayor. 2. Introduzca la informacion en una tabla de frecuencias para datos agrupados. 3. Calcule marca de clase y distribucion de frecuencias. 4. Halle las medidas descriptivas de una muestra para datos agrupados. HORAS DE SUENO DE 45 PACIENTES DE UN HOSPITAL COMO CONSECUENCIA DE LA ADMINISTRACION DE CIERTO ANESTESICO. DATOS ORDENADOS rfijfiafijf2]3]3]3]3 3[3l[4l[4[4l[4a[4a][s [5 s|/s|/s|7]/7|7/7|7]7 7|/a{sj|sal|s {als | 10/10 to [11 | 11 | 12) 12,].13 | 13 | 17 | 17 PASOS PARA AGRUPAR DATOS 1. Calculo de la eleccién del numero de intervalos : K =1+3,32 log(n) K =1+3,32 log(45) K =1+43,32 (1,65) K =1+5,49 kK =6,49 K=7 2. Calculo del rango de los datos: R = valor maximo — valor minimo R=17-1 R=16 3. Calculo de la amplitud: A. Amplitud sin redondear R A= K 16 A= 7= 2,29 B. Amplitud redondeada A=3 Entonces: K=7 > significa que la tabla de distribucidn de frecuencias debe tener 7 filas A=3>- significa que la distancia entre los limites de cada intervalo debe ser 3 Un intervalo tiene dos limites asi: > Limite inferior (Li) 8 —12—> Limite superior (Ls) Intervalo HORAS DE SUENIO DE PACIENTES EN UN HOSPITAL COMO CONSECUENCIA DE LA ADMINISTRACION DE CIERTO ANESTESICO. Ct) X, ni Ni fi FI 1-4 | 250) 11 11__| 24,44%| 24,44 4-7 | 5,50] 10 21 22,22| 46,66 7-10| 8,50] 413 34 28,89] 75,55 10-13] 11,50] 7 41 15,56, 91,11 13-16] 14,50| 2 43 4,44) 95,55 16-19] 17,50| 2 45 4,44) 100 19-22] 20,50} 0 0] 100% ce ee Marcas de clase: X; = 2,50 Con base en la distribucidén de frecuencia anterior responda lo siguiente y justifique la respuesta: 1. éCudntos pacientes durmieron mas de 7 horas en un hospital como consecuencia de la administracion de cierto anestésico? Rta. 13+7+2+2+0 = 24 2. dentre que numero de horas se localiza el 50% y mas de las observaciones ? Rta. entre 7 y 22 horas 3. dentre que limites se localiza exactamente el 90% del numero de horas de suefio de los pacientes? Rta. entre 10 y 13 horas 4. éCuantos apacientes durmieron a lo sum 13 horas en un hospital como consecuencia de la administracion de cierto anestésico? Rta. 11+10+13 = 34 horas 5. éCudntos pacientes durmieron en un_ hospital como consecuencia de la administracién de cierto anestésico entre 10 y 19 horas inclusive? Rta. 7+2+2 = 11 pacientes MEDIDAS DE RESUMEN O DESCRIPTIVAS DE UNA MUESTRA DATOS AGRUPADOS Cuando los datos se agrupan, las observaciones individuales pierden su identidad, por esta razon se deben hacer ciertas suposiciones respecto a los valores cuando se calcula una medida de resumen o descriptiva de una muestra a partir de los datos agrupados. Como consecuencia de estas suposiciones, los resultados son unicamente aproximaciones a los valores reales. A. MEDIDAS DE TENDENCIA CENTRAL CALCULADAS A PARTIR DE DATOS AGRUPADOS 1. La media aritmética: Es el valor que tendrian los datos, si todos ellos fueran iguales, o también, el valor que corresponderia a cada uno de los datos de la distribucidn si su suma total se repartiera por igual. Ventajas: > Es de facil comprension » Rapidez en el calculo Desventajas: es muy sensible a los valores extremos de la variable, ya que, todas las observaciones intervienen en el calculo de la media, la aparicion de una observacion extrema, hard que la media se desplace en esa direccién. > Se simboliza como (X) > La formula para su calculo es; DXj.ni n x= Donde: X;: marca de clase ni : frecuencia absoluta n : tamaiio de la muestra Ejemplo: Calcular la media aritmética para la situacion de estudio referenciada. DXj.ni n X= c) X; ni Y X;.ni -4 2,50| 11 27,50 -7 5,50] 10 55,00 7-10 8,50| 13 110,50 10-13 | 11,50| 7 80,50 13-16 | 14,50{ 2 29,00 16-19 | 17,50] 2 35,00 19-22 | 20,50] 0 0 TOTAL 45 337,50 DX,.ni 337,50 n 45 7750 INTERPRETACION Si no hubiese variabilidad en el numero de horas de suefio de pacientes en un hospital como consecuencia de la administracién de cierto anestésico, se podria decir que todos los pacientes durmieron 7,50 horas, o aproximadamente 8 horas. 2. La mediana: Es el valor abajo del cual se encuentra la mitad de los datos y arriba del cual se halla la otra mitad. > Se simboliza como (Me) o (Md) > La formula para su calculo es: 5+ MR 1. Me = Li+>_— «ic ni Donde: n= tamafio de la muestra. n . . . ae . on indica la ubicacidn en la tabla de frecuencias de la clase medianal (es decir en donde esta la media) Son valores que se encuentran ubicados en la tabla de frecuencias, mas exactamente en la fila donde esta la clase medianal o la mediana. Li = limite inferior ic = intervalo de clase ni = frecuencia absoluta Nj-1 = es la frecuencia absoluta acumulada en la tabla de frecuencias que esta ubicada en la parte superior de la fila donde esta la mediana. ic =A (intervalo de clase es la misma amplitud) Ejemplo: Calcular la mediana para la situacion de estudio referenciada. 2_w, ZT Ni- zoNes ni Me=Li+ Recordemos que: n=45 ic 45 7 = = 22,50 = Este valor se busca en la frecuencia absoluta acumulada (Ni) de la tabla de distribucién de frecuencias, y en la fila donde se encuentre e valor alli esta la mediana (Me) 0 Xi ni Ni 4-7 5,50 10 21 La Ni aun no llega a 22,50 ZaiLO, 8,50 13 34 Ni ya incluye a 22,50 entonces en esta fila se encuentra la mediana Entonces: U=75 5=22,50 Ni-1=21; ni=13; ic=3 n Zz N-1 Me = Li+>—— + ic ne 22,50 — 21 ———"_ * Me=7+ 13 Me a7 ong e=T+ay* Me =7 + (0,12 * 3) Me=7+0,36 > Me=7,36 3. Lamoda: Se define como el valor que se presenta con mayor frecuencia. Para datos agrupados en una distribucién de frecuencias, es posible aproximar la moda usando la marca de clase que contiene el mayor numero de datos. > se simboliza como (Mo) Ejemplo: Calcular la moda para la situacién de estudio referenciada. La marca de clase del intervalo cuya frecuencia absoluta es mayor es 8,50, por tanto podemos decir que: Mo = 8,50 (con 13 repeticiones) C. MEDIDAS DE DISPERSION CALCULADAS A PARTIR DE DATOS AGRUPADOS. 1. La varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribucidn estadistica. Cuando se calcula la varianza a partir de datos agrupados se supone que todos los valores que caen en un intervalo de clase especifica se localizan en un punto medio del intervalo. > Se simboliza como (S?) > La formula para su calculo es : _ YX — X)?.ni ~ n-1 2 Donde: Xj; = marcas de clase (puntos medios del intervalo) X =media aritmética ni = frecuencia absoluta n =tamafio de la muestra Ejemplo: Calcular la varianza para la situacién de estudio referenciada. _ YX — X)?.ni ~ n-1 S2 Recordemos que: X = 7,50 m= 45 i) X; ni (%,-X) (XX)? Ye —X)?.ni 1-4 2,50 11 -5,00 25,00 275,00 4-7 5,50 10 -2,00 4,00 40,00 7-10 8,50 13 -1,00 1,00 13,00 10-13 | 11,50 7 4,00 16,00 112,00 13-16 | 14,50 2 7,00 49,00 98,00 16-19 | 17,50 2 10,00 100,00 200,00 19-22 |20,50| oO 13,00 _| 169,00 0 TOTAL 738,00 ge Y(X;, — X)?.ni n-1 2 __738 _ 738 “45-1 4 S?, =.1.6,.7.7 2. La desviacién tipica o desviacién estandar: Esta medida nos permite proporcionar el promedio aritmético de fluctuacién de los datos respecto a su punto central o media. La desviacidn estandar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. » Se simboliza como (S) » La formula para su calculo es: S= VS? Ejemplo: Calcular la desviacién estandar para la situacién de estudio referenciada. Recordemos que: S? = 16,77 Ss S= 16,77 Ss INTERPRETACION Se podria concluir que: el tiempo promedio en horas de suefio de 45 pacientes de un hospital como consecuencia de la administracién de cierto anestésico es 7,50 horas, con una tendencia a variar por debajo o por encima d dicho tiempo en 4,10 horas. eo racide

You might also like