You are on page 1of 11

1 Hernn Daro Toro - 8

Datos Agrupados

Las caractersticas de los elementos de una poblacin pueden ser de tipo cualitativo o de tipo cuantitativo. En el primero caso se trata de cualidades que distinguen un elemento de otro y lo ubican en clases independientes y separadas. Las propiedades de tipo cuantitativo son aquellas que pueden medirse o contarse. Ejercicio 1 Clasica las siguientes variables de una poblacin en cualitativas y cuantitativas. Familia de un rbol Color favorito Tipo de hojas Mximo grosor de un tronco Nmero de hojas de un libro Peso Estatura Promedio de goles Sueldo mensual Estrato Nmero de hermanos Deporte favorito Nombre Tiempo que tardo en hacr una tarea Sexo Una caracterstica cuantitativa que toma datos aislados de modo que no acepta valores intermedios entre dos consecutivos, se llama Cuantitativa Discreta. Si se trata de una caracterstica que puede tomar valores consecutivos, se dice que es una variable Cuantitativa Continua. Las diferentes caractersticas de los elementos de una poblacin pueden representarse de diversas maneras: tablas, diagramas de barras o diagramas circulares.

1.1

Agrupacin voluntaria

La representacin de una variable continua puede hacerse mediante tablas, en donde la variable se presenta agrupada en clases o intervalos numricos, por medio de diagramas de barras unidas, llamadas histogramas o usando diagramas lineales. Ejemplo 2 En la clase de educacin fsica el profesor tom la medida de la estatura de los alumnos del grado octavo; l apunt los datos aproximando en centmetros, as: si meda entre 154.1 cm. y 154.4 cm. anotaba 154 cm.; pero si meda entre 154.5 cm. y 154.9 cm. anotaba 155 cm. En una primera presentacin el profesor agrup los datos como se dan en la siguiente tabla: Estatura en cm. 146 148 150 152 153 155 157 161 163 166 168 170 No de alumnos 1 2 2 3 5 9 7 4 3 2 1 1

2 Hernn Daro Toro - 8

Como la estatura es una variable continua ( por qu?), es posible agrupar los datos, considerar intervalos de cinco cm. y reunir, en cada uno, los alumnos cuya estatura est en ese intervalo, as Ejemplo 3 Como el rango de la estatura est entre 146 cm. y 170 cm. podemos agrupar en cinco intervalos de 5 cm. cada uno. El profesor agrupa asi: en el primer intervalo incluye a los alumnos con 145.5 cm. o ms hasta 150.4 cm. y as sucesivamente. Qu estudiantes estn en el cuarto intervalo? Estatura (fi ) [145, 150) 5 [150, 155) 17 [155, 160) 7 [160, 165) 7 [165, 170) 4 De acuerdo con la tabla el maestro observa que 17 de sus estudiantes tienen una estatura superior a 150 cm. hasta 155 cm., y que los alumnos con estatura inferior son apenas 4. La grca correspondiente a la tabla anterior se muestra en la gura 1.

Figure 1: Histograma correspondiente a la distribucin de frecuencias para las estaturas.

Si una caracterstica o variable es continua, los datos pueden aproximarse y agruparse en intervalos llamados Intervalos de clase o simplemente clases. Para conocer la longitud de un intervalo se encuentra la diferencia entre los valores extremos superiores (o inferiores) de dos intervalos consecutivos. La representacin grca

3 Hernn Daro Toro - 8

llamada histograma Se realiza mediante barras unidas, con base proporsional a la longitud del intervalo y altura proporsional a la frecuencia del intervalo. El diagrama lineal se obtiene uniendo con segmentos los puntos medios de las bases superiores de las barras del histograma, stos puntos se llaman marcas de clase. Las marcas de clase se calculan mediante la frmula: yi = Ls + Li 2

Ejercicio 4 En una ciudad costera, un sbado de agosto, se midi con radar la velocidad, en kilometros por hora, de 50 motocicletas que pasaron frente a un paso de nivel ( es un qu paso de nivel?). Los datos se encuentran en la siguiente tabla: 90 96 132 121 102 85 110 80 75 120 105 100 103 98 89 135 108 125 130 120 102 97 86 128 115 142 106 102 95 89 96 107 132 126 128 134 138 139 110 123 108 98 92 90 128 135 138 143 109 133

i. Agrupa los datos en 10 intervalos de clase de igual longitud. Elabora la tabla y el histograma correspondientes. ii. Agrupa los datos en intervalos de clase de longitud 10. Elabora la tabla y el histograma correspondientes. Solucin 5 (i.) El menor dato es 75 y el mayor es 143, por lo tanto podemos considerar que los datos varan entre 70 y 150, es decir que estn todos en el intervalo (70; 150). Para encontrar la longitud de cada intervalo de clase aplicamos la siguiente frmula: l= Ls m Li

l : longitud del intervalo de clase (la que debemos determinar). Li : lmite inferior del intervalo de variacin de los datos. Ls : lmite superior del intervalo de variacin de los datos. m : nmero de intervalos que se desea construir. Teniendo en cuenta la frmula anterior es fcil ver que Li = 70, Ls = 150 y adems el ejercicio plantea agrupar en 10 intervalos, por lo tanto m = 10. Se tiene entonces: l= 150 70 )l=8 10

4 Hernn Daro Toro - 8

Es decir que los intervalos de clase tendrn una longitud igual a 8. La tabla queda entonces de la siguiente manera: Intervalo de clase Frecuencia [70; 78) 1 [78; 86) 2 [86; 94) 6 [94; 102) 7 [102; 110) 10 [110; 118) 3 [118; 126) 5 [126; 134) 8 [134; 142) 6 [142; 150) 2 Con esta tabla ya es posible contruir el histograma, el cual se ver como el de la gura 2.

Figure 2: Histograma correspondiente a la distribucin de frecuencias para la velocidad

1.2

Frecuencia

En un par de ocasiones hemos mensionado el trmino frecuencia aunque no hemos dado una denicin precisa. Entendemos por frecuencia el nmero de veces que se repite cierta accin,

5 Hernn Daro Toro - 8

como por ejemplo en la expresin: Con qu frecuencia vas al odontlogo? En estadstica las cosas no son diferentes, dada una variable que toma diferentes valores, cada uno de stos valores puede presentarse cierto nmero de veces, esa en la frecuencia, el nmero de veces que se presenta (o se repite) un dato. Diferenciaremos los siguientes tipos de frecuencia, los cuales explicaremos usando un ejemplo: Ejemplo 6 Treinta estudiantes se presentaron a un concurso de Biologa y estos fueron sus resultados: Intervalos de clase fi Fi hi Hi yi 70 74 4 4 13; 3% 13; 3% 72 75 79 5 9 16; 7% 30% 77 80 84 6 15 20% 50% 82 85 89 7 22 23; 3% 73; 3% 87 90 94 8 30 26; 7% 100% 92 donde fi es la frecuencia absoluta, es decir, el nmero de estudiantes que hay en el intervalo i, por ejemplo en el intervalo 4, la frecuencia es f4 = 7. Fi representa la frecuencia absoluta acumulada hasta el intervalo i, por ejemplo, para encontrar la frecuencia acumulada correspondiente al intervalo 4, se hace F4 = f1 + f2 + f3 + f4 = 4+5+6+7 = 22 Por otro lado, hi corresponde al porcentaje de estudiantes que hay en el intervalo de clase i (o frecuencia relativa) se calcula mediante la frmula: fi n por ejemplo el porcentaje de estudiantes que hay en la clase 3 es: hi = 100 h3 = 100 f3 = 100 n 6 30 = 100 (0; 2) = 20

por lo tanto el valor es h3 = 20% La frecuencia relativa acumulada es Hi y se calcula igual que la Fi solo que usando ls frecuencias relativas. Por ejemplo, la frecuencia relativa acumulada de la clase 3 es: H3 = h1 + h2 + h3 = 13; 3 + 16; 7 + 20 = 50

6 Hernn Daro Toro - 8

y, nalmente yi es la marce de clase de cada intervalo. Ejercicio 7 La velocidad de 50 vehculos esta agrupada en la siguiente tabla. Intervalo de clase fi [70; 78) 1 [78; 86) 2 [86; 94) 6 [94; 102) 7 [102; 110) 10 [110; 118) 3 [118; 126) 5 [126; 134) 8 [134; 142) 6 [142; 150) 2 Total 50 Fi hi Hi yi

Completa la tabla y responde la siguientes preguntas: i. Cuntos vehculos llevan una velocidad menor a 110 km/h? ii. Qu porcentaje se encuentra por debajo de 120 km/h? 1. Qu porcentaje supera los 110 km/h? 2. Si se estableciera una velocidad mxima de 120 km/h, cuntos vehculos seran sancionados? que porcentaje corresponde? A 3. Si se estableciera una velocidad mnima de 94 km/h, cuntos vehculos seran sancionados? que porcentaje corresponde? A

1.3

Notacin Sigma

La notacin sigma se utiliza para escribir de forma abreviada sumas que involucran muchos sumandos. Considere por ejemplo que se quieren sumar las edades de 100 personas, de manera que x1 es la edad de la primera persona, x2 es la edad de la segunda persona y asi sucesivamente hasta que x100 es la edad de la ltima persona.

7 Hernn Daro Toro - 8

Usemos la variable n para contar estas personas, entonces n = 1; : : : ; 100, de esta forma, n se llama un contador o un ndice. Tenemos entonces que xn es la edad de la n sima persona. La suma la podemos escribir de la siguiente forma: x1 + x2 + P + x100 =
100 X n=1

xn

El smbolo se es la letra griega sigma mayscula, y representa la operacion de suma. Debe interpretarse como la repeticin del proceso de sumar, es decir, n toma el primer valor, 1, luego 2, luego 3 y as sucesivamente hasta llegar al ltimo: 100. En cada uno de estos P pasos se obtiene un resultado, y lo que hace es sumar todos estos resultados. Ejemplo 8 Sea n = 1; : : : ; 10, de manera que xn son los primeros 10 nmeros primos. P Calcular la suma 10 xn . n=1 Solucin 9 Si xn son los primeros 10 nmeros primos, entonces: x1 = 2, x2 = 3, x3 = 5, x4 = 7, x5 = 11, x6 = 13, x7 = 17, x8 = 19, x9 = 23, x10 = 29. Se tiene entonces,
10 X n=1

xn = x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10 = 2 + 3 + 5 + 7 + 11 + 13 + 17 + 19 + 23 + 29 = 129
100 X n=1

Considere ahora que se quieren sumar los nmeros del 1 al 100. En ese caso se tiene, n=1+2+3+ + 100

De forma similar si se quieren sumar los mltiplos de 3 expresin queda:


100 X n=1

3n = 1 + 2 + 3 +

+ 300

Ejercicio 10 Calcula las siguientes sumas, considerando que xn son los primeros 10 mltiplos de 3 P10 1. n=1 xn P10 2 2. n=1 (xn + 3) P10 2 3. n=1 (3xn + xn ) P10 p 3 (xn xn ) 4. n=1

8 Hernn Daro Toro - 8

Grcos en datos agrupados

Una forma alternativa a las tablas, para resumir los datos de una variable es la utilizacin de un dibujo o grca que permita interpretar mejor algunas de sus caractersticas principales. Es importante tener en cuenta que las representaciones grcas ayudan a comprender mejor como se comportan los datos, pero de ninguna manera reemplazan el anlisis cuantitativo de la informacin. Son slo ayudas visuales.

2.1

Diagrama circular

Los diagramas circulares resaltan el porcentaje en que aparece una caracterstica o atributo respecto al total. Este tipo de grca es til para representar variables que tienen pocas categoras, ya que en el caso de una variable con muchas categoras hay un exceso de sectores Ejemplo 11 Durante el mes de abril se tom la temperatura registrada al medio da. La informacin fue organizada en la siguiente tabla. Temperatura 10o C fi 5 11o C 7 12o C 4 13o C 1 14o C 1 15o C 3 16o C 0 17o C 0 18o C 18 19o C 19

Representemos en un diagrama circular la temperatura del mes de abril. Solucin 12 Son en total 30 das y un circulo tiene en total 360o , por tanto a cada tempero atura que se present le corresponde un sector de 360 fi = 12o fi : 30 En general, cuando se tienen n datos y se desea hacer un diagrama circular se divide 360o entre n para determinar el nmero de grados correspondientes a cada parte; nalmente se multiplica ese valor por las frecuencias absolutas y eso nos da al ngulo de cada sector del crculo. Se colorea el diagrama segn el nmero de datos de cada especie. Ejercicio 13 Representa en un diagrama circular las edades de 20 estudiantes de grado octavo. Edad 13 14 15 fi 7 11 2 Ejercicio 14 A continuacin se presenta la informacin sobre la categora en es escalafn docente de un grupo de profesores universitarios y para simplicar la escritura se adopta la

9 Hernn Daro Toro - 8

Figure 3: Diagrama circular correspondiente al la temperatura observada durante el mes de abril

siguiente codocacin: 1: Auxiliar, 2: Asistente, 3: Asociado y 4: Titular. Los valores de la variable "Categora del escalafn docente" para 40 profesores es el siguiente. 1 3 4 4 3 3 1 1 2 4 4 1 2 3 2 1 3 4 2 2 1 1 3 2 2 4 1 2 3 4 2 4 1 1 4 2 3 2 1 1

a. Determina la distribucin de frecuencias (fi ; Fi ; hi ; Hi ). b. Elabora el diagrama circular correspondiente a fi

2.2

Ojiva

La ojiva es la grca de la frecuencia (absoluta o relativa) acumulada. Usualmente se utiliza la frecuencia relativa expresada en trminos de porcentaje. El intervalo (o el lmite superior del intervalo) aparece en el eje horizontal y la frecuencia absoluta o relativa en el eje vertical. La ojiva indica la frecuencia acumulada en y por debajo de un intervalo dado. Esta grca facilita la comparacin dos grupos de datos de forma visual y de manera mucho ms efectiva

10 Hernn Daro Toro - 8

que el polgono de frecuencia, puesto que permite comparar los porcentajes acumulados de dos distribuciones con respecto al mismo intervalo. Construccin: a. En el lmite superior de cada clase se traza el punto que corresponda en altura a la frecuencia absoluta o relativa acumulada. b. Se conectan estos puntos con segmentos. Ejemplo 15 Treinta estudiantes se presentaron a un concurso de Biologa y estos fueron sus resultados: Intervalos de clase fi [70; 75) 4 [75; 80) 5 [80; 85) 6 [85; 90) 7 [90; 95) 8 La ojiva correspondiente es Fi 4 9 15 22 30 hi Hi xi 13; 3% 13; 3% 72 16; 7% 30% 77 20% 50% 82 23; 3% 73; 3% 87 26; 7% 100% 92

Figure 4: scanear para trazar ojiva

11 Hernn Daro Toro - 8

Ejemplo 16 Un concesionario de autos realiz una prueba para vehculos de gama media, con el propsito de medir el rendimiento de combustible. Para esto seleccion 20 automviles al azar y realiz con cada uno de ellos el mismo viaje. Los resultados de su investigacin son los siguientes: Km/gal fi [15; 25) 5 [25; 35) 9 [35; 45) 4 [45; 55) 2 Fi hi Hi yi

a. Cul es la longitud de los intervalos de clase? b. Cul es la marca de clase de cada intervalo de clase? c. Un automvil adicional present un rendimiento e 36,5 kilmetros por galn. que en intervalo de clase lo ubicaras? Cul es ahora la frecuencia para este intervalo de clase? Elabora la nueva tabla. d. Elabora el histograma para la distribucin de frecuencias de la tabla que construiste en el literal c. e. Completa la tabla y traza la ojiva y el diagrama circular correspondientes.