You are on page 1of 33

TRABAJO COLABORATIVO NUMERO 2

JHON SEBASTIAN CALLE CORTES
CC 1088285332
JORDAN ANDRES CALLE CORTES
CC 1088310524
NATHALIA MARIA RENDON
CC 1089745976

TUTOR: ROBERTO MARIO DE LEON

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA
ESTADÍSTICA DESCRIPTIVA
22/05/2013

Introducción

En este segundo trabajo colaborativo se desarrolló un taller con base en el manejo del
contenido visto en el módulo de estadística descriptiva unidad 2, con la finalidad de
profundizar sobre los temas y teorías planteados y observar la total comprensión de los
temas propuestos en la unidad 2 por los estudiantes del curso estadística descriptiva.

1. Realizar un mentefacto conceptual sobre las medidas de dispersión.

2. Las estaturas en centímetros de los socios de un club juvenil de Bogotá, son las
siguientes:

153
138
152
145
152

123
128
128
124
156

129
134
146
132
160

132
148
143
138
159

147
125
138
144
157

138
139
138
141
168

137
146
122
137
178

134
145
146
146
142

131
148
137
138
113

147
135
151
146
130

Realizar una tabla de distribución de frecuencias para datos agrupados dado que la variable
es estatura (cuantitativa continua), Calcular varianza, desviación estándar y coeficiente de
variación. Interprete los resultados.
Rango = xm´ax−xm´ın
Rango: 178 – 113 = 65
K = 1 + 322.3 log n
Número de intervalos de clase: 1 + 3.322Log50 = 6,6 = 7
Amplitud de los intervalos= A = R
k
A = 65= 9,28 = 10
7
R* = (A) (K)
R* = 10 x 7 = 70
Exceso = R – R*
Exceso =70 – 65 = 5

143 143 – 152 152 – 161 161 – 170 170 .179 Total Frecuencia 5 9 14 15 5 1 1 50 FRECUENCIAS Frecuencia Frecuencia absoluta relativa (%) acumulada 10% 5 18% 14 28% 28 30% 43 10% 48 2% 49 2% 50 100%  MEDIA n = cantidad de elementos Xi = valor de cada elemento X = media aritmética.Limites de clase: LCI – Limite de Clase Inferior: 113 LCS – Limite de Clase Superior: 178 LCI = 113 + 3 = 116 LCS = 178 .2 = 176 Intervalos de Clase Se agrega (A-1) = 10 – 1 = 9 116 + 9 = 125 125 + 9 = 134 134 + 9 = 143 143 + 9 = 152 152 + 9 = 161 161 + 9 = 170 170 + 9 = 179 Estatura en cms 116 – 125 125 – 134 134 .3 50 Frecuencia relativa acumulada 10% 28% 56% 86% 96% 98% 100% . o simplemente media x X= Xi n X = 7.064 = 141.

3 141.3 141.3 -0.3 -12.3 -9.3 141.3 141.3 -3.29 127.3 141.3 0.3 141.3 141.3 -17.3 -2.3 141.49 53.7 4.3 141.3 141.89 372.89 176.7 4.89 10.89 10.3 -4.3 -16.29 53.69 18.69 106.3 -11.3 -10.3 141.3 141.7 3.3 141.3 -18.3 141. VARIANZA Varianza: 7206.89 10.09 .3 141.89 10.09 22.3 -7.3 141.29 13.3 -13.3 -7.7 3.3 -9.29 265.3 141.89 299.3 141.3 -4.3 -13.49 2.3 141.3 141.89 151.3 -19.3 -3.69 13.7 1.3 -3.69 176.29 0.7 2.89 7.49 18.3 141.7 (Xi – X)2 800.3 -6.12 50 Xi 113 122 123 124 125 128 128 129 130 131 132 132 134 134 135 137 137 137 138 138 138 138 138 138 139 141 142 143 144 145 145 146 146 X 141.3 141.49 334.89 10.3 -4.09 86.3 141.3 141.09 0.3 141.3 141.3 141.29 39.3 -3.3 141.89 5.49 18.3 141.69 22.3 141.3 141.3 (Xi – X) -28.49 10.49 86.3 -3.10 = 144.3 -3.3 141.

3 141.3 141.3 141.3 141.49 136.89 44.09 22.3 141.3 141.7 4.3 141.89 7206.3 141.3 141.7 6.7 22.09 114.09 32.7 14.12 Raíz cuadrada: 12 50 Desviación estándar o típica = 12 Coeficiente de Variación CV = Desviación estándar * 100% Media CV = 12 * 100% = 8.3 141.49 114.7 9.5 % 4.7 4.3 141.69 712.7 18.49 313.7 6.7 10.29 349.09 22.09 246.7 17.49 44.89 216.10 .3 141.7 26.3 141.146 146 146 147 147 148 148 151 152 152 153 156 157 159 160 168 178 141.7 11.1 = 144.5% 141.3 141.3 7064 Desviación estándar o típica Varianza: 7206.89 1346.3 141.7 5.7 15.3 141.7 5.49 32.7 10.3 Coeficiente de variación = 8.7 36.89 94.

5 Desviación estándar o típica Raíz cuadrada de 3. X= 94 = 1. La varianza y su desviación típica Varianza: 356 60 -.6 60 b. El coeficiente de variación.(157)2= 3. El promedio de reclamos.9 c. CV = 1. Un empleado de la empresa de Acueducto de la ciudad de Cartagena.7 % 1.6 . para ello elige una muestra de 60 personas.9 *100 = 118. realiza un estudio sobre los reclamos realizados en los 2 últimos años. con los siguientes resultados: Nº Reclamaciones 0 1 2 3 4 5 6 7 Nº De usuarios 26 10 8 6 4 3 2 1 Calcular: a.3.5 = 1.

6. En un examen final de Estadística la puntuación media de un grupo de 150 estudiantes fue de 78 y la varianza 64. EXAMEN DE ESTADISTICA Puntuación media: 78 Varianza: 64 Desviación típica: Raíz cuadrada de 64 = 8 Coeficiente de variación: CV = 8 *100 = 10. desviación estándar de Algebra. Dispersión relativa Para saber en cuál hubo mayor dispersión relativa.76 Coeficiente de variación: CV = 7.6 * 100 = 10. Dispersión absoluta Para determinar la dispersión absoluta.25 % 78 EXAMEN EN ALGEBRA Media final: 73 Desviación típica 7.6 Se tiene entonces que en Estadística hubo una mayor dispersión absoluta.41 73 La dispersión Relativa muestra que el Coeficiente de Variación de los exámenes de Algebra es mayor que el de Estadística 10.6. basta con hacer una comparación entre sus desviaciones estándar. b. En álgebra. Entonces de manera absoluta hay mayor dispersión entre los resultados de los exámenes de estadística pero de manera relativa hay mayor dispersión en los resultados de .41 % 73 Estadística = Desviación Estándar = s = 8 Algebra = Desviación Estándar = s = 7.6 *100 = 10. pues la desviación estándar de estadística es de 8 > 7. En que asignatura hubo mayor: a. sin embargo.25 78 Algebra = CV = 7.6 Varianza: 57.4.25. la media final del grupo fue de 73 y la desviación tipica7.41 > 10. se recurre al coeficiente de variación: Estadística = CV = 8 * 100 = 10.

c.media) desviación Estadística Z = (75-78) = -0.2632 se encuentra más cerca a 0 (la media de la variable estandarizada).2632 7.Exámenes de algebra.6 La puntuación relativa mayor fue en Álgebra (-0.375 8 Algebra Z = (71-73) = -0. . se dice que la puntuación relativa del estudiante fue superior Algebra. Si el estudiante consiguió 75 en estadística y 71 en álgebra. Dado que -0. ¿En qué asignatura fue su puntuación relativa superior? Estandarizamos con Z= (valor .2632) Estos valores de puntuación Z negativos indican que ambas calificaciones se encuentran por debajo de la media.

2 3. ¿Cuál es la tensión arterial esperada? .5 4 4. A una serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión arterial un tiempo después. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. Ingresar al blog de Estadística Descriptiva que se encuentra en la página principal del curso en el TOPICO DE CONTENIDOS. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Si a un paciente se le administra una dosis de sal de 6.8 2. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables b.5.3 5 Y (PRESION) 100 98 105 110 112 120 a.5. d. X (SAL) 1. posteriormente buscar el LABORATORIO (RERESIÓN Y CORRELACIÓN LINEAL –EXCELL) y realizar el ejercicio número 1 que se encuentra al final del laboratorio. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. Es confiable? c.

4 2001 6. Obtenga un índice simple para las ventas nacionales utilizando una base variable: Año Ventas (millones $) 1992 8.2 2002 5.7 es el 100% 7.3*100)/9.2 1998 9.5 1997 9.7 1996 8.7 ____ X X= (9.2577 .2272 Si 9.3 ____X Si 7.6.8= 110.8 1993 9.3 es el 100% X=(7.6 Si 8.7= 72.4 2000 6.2 1999 8.7 2004 7. A continuación Se presentan las ventas nacionales de móviles nuevos de 1992 a 2004 en la siguiente tabla.7 1994 7.7*100)/8.8 es el 100% 9.0 2003 6.3 1995 6.

0= 134 Si 6.7 ____X X=(6.2 ____X X=(9.7 ____X X=(6.7 es el 100% 7.5 ____X X=(8.5 es el 100% 9.2*100)/6.3= 91.4 ____X X=(6.2= 80.0*100)/6.6 ____X X=(7.4 es el 100% 6.6.30437 Si 8.7*100)/7.2352 Si 9.5= 108.0 ____X X=(5.875 Si 6.7*100)/5.7= 126.1904 Si 6.2 es el 100% 8.7 es el 100% 8.4 es el 100% 6.4328 .8656 Si 8.5*100)/6.4 ____X X=(8.7808 Si 6.2 es el 100% 5.4= 96.2*100)/8.7= 113.2 ____X X=(6.6*100)/6.4= 76.2= 91.6451 Si 5.4*100)/9.4*100)/8.0 es el 100% 6.

91 407.42 423.16 Desviación estándar 20. Media aritmética Es la medida más conocida y la más fácil de calcular.37 Varianza 415. y es el de mostrar una tendencia a agruparse alrededor de los datos más frecuentes.18 20. haciendo de esta forma que estas representaciones adquieran una forma de campana.Medidas de dispersión Total Hombres Mujeres Media 28.00 29.69 28.39 20. n X X n i i Σ= =1 Donde: n = cantidad de elementos .57 Coeficiente de variación 71% 72% 70% MEDIDAS ESTADÍSTICAS UNIVARIANTES MEDIDAS DE TENDENCIA CENTRAL Al ver la forma de representar los conjuntos de datos en histogramas y polígonos de frecuencia se puso de relieve un comportamiento peculiar de estos. Se define como la suma de los valores de una cantidad dada de números dividido entre la cantidad de números.

0 3.15.2.0 y calculemos nuevamente la media aritmética. El promedio de las notas es de 3.0 ¿Cuál es el promedio de notas de los alumnos de la clase? SOLUCIÓN Aplicando la fórmula para datos no agrupados tenemos: Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de la clase (10 alumnos en total).47. o simplemente media Media aritmética para datos no agrupados Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muéstrales: Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la población. .5 3.0 y 4.47 a 3.8 4. Modifiquemos la primera nota por 0. Las notas de los alumnos son: 3.2 3.0 es una nota atípica comparada con las demás.2 4.4 4. mientras que n el de la muestra).1 2. Esta variación notoria se debió a que la media aritmética es sensible a los valores extremos cuando tratamos con pocos datos. El 0.5 3. Ejemplo: la media aritmética para datos no agrupados El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase. que están ubicadas entre 3. En este caso la media pasa de 3.0 3.Xi = valor de cada elemento x = media aritmética.

Las marcas de clases (Mc) cumple la función de representar los intervalos de clase. Preguntas Buenas Personas 1 15 2 13 3 8 . La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el último (Nc). el cálculo de la media varía un poco. siendo X i la clase del intervalo i. desconociendo el valor exacto de cada uno de ellos).Media aritmética para datos agrupados En el capitulo 2 explicábamos dos tipos de tablas de frecuencias (A y B). la media aritmética es igual a la división de la sumatoria del producto de las clases por la frecuencia sobre el número de datos. ya que existe una pérdida de información en el momento en que se trabaja con intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo. Ejemplo: media aritmética para datos agrupados en tablas tipo A La siguiente tabla de frecuencia muestra el número de preguntas de 81 encuestados sobre un Test que consta de solo seis preguntas. Cuando los datos se agrupan en tablas de frecuencias tipo B. Cuando los datos se agrupan en tablas tipo A.

8 veces el valor 3. hasta llegar a la última clase: PASO 2: Dividir la sumatoria sobre el número total de datos.1 3 44.4 19 5 21 6 5 SOLUCIÓN PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta.1 . Ejemplo: media aritmética para datos agrupados en tablas tipo B Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia: Ni Lm Ls f Mc 1 40. 13 veces el valor 2.0 48.41) preguntas buenas. Para efectos del cálculo de la media. En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3. deberíamos sumar 15 veces el valor 1.

por ejemplo.1 32 68.1 11 60.1 5 72.1 104.1 72.1 SOLUCIÓN Las marcas de clase representan a los intervalos de clase.2 48.1 3 56.1 7 88. . suponemos que la marca de clase para el primer intervalo (44.1 18 84.1 8 52.1 21 76.1) se repite 3 veces.1 4 64.1 6 80.0 1 100.1 14 92. PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta. PASO 2: Dividir la sumatoria sobre el número total de datos.1 64.1 88.1 96. al desconocer los 3 valores exactos que están dentro de dicho intervalo.1 56.1 80.1 8 96.

0 26.1 18.1 12.8 43.9 15.1 21.2 48.6 11.0 SOLUCIÓN Calculemos la media para los datos sin agrupar: .4 33.3 11.1 16.0 12.4 35.6 21.0 32.2 37.1 38.4 49.0 26.4 18.Ejemplo: comparativa entre el cálculo de la media aritmética para datos no agrupados y datos agrupados en tablas tipo B Calcular la media aritmética a los siguientes datos sin agrupar y agrupándolos en una tabla de frecuencia tipo B (suponga que los datos son poblacionales): 47.8 12.4 30.6 40.2 18.4 41.8 23.6 12.2 33.4 44.

Podemos ver claramente una diferencia entre ambas medias: 27.61 5 33.00 17.61 43.21 Total 30 PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia absoluta.81 6 20.40 5 46.74 para los datos no agrupados y 28.01 4 39.29 para los datos agrupados.81 6 43.Luego construyamos la tabla tipo B y calculemos su media aritmética con el fin de comparar ambos resultados: Ni Lm Ls f Mc 1 11.01 4 30.81 30.41 8 14. PASO 2: Dividir la sumatoria sobre el número total de datos.41 5 36.21 2 17.01 49. Esta diferencia radica que en la tabla tipo B .41 23.21 36.21 2 27.61 3 23.

la mediana se calcula hallando el valor medio entre los dos valores centrales y no coincidirá con ninguno de los valores del conjunto de datos. Cuando la cantidad de datos es impar. se encuentra en el centro de la distribución. Solo es aplicable para el tratamiento de datos cuantitativos. al agrupar los datos en los intervalos de clase. . es decir. Mediana Se define como el valor que divide una distribución de datos ordenados en dos mitades. Cálculo de la mediana para datos agrupados La med iana se encuentra en el interva lo donde la frecu encia acu mu lada llega hasta la mit ad de la s u ma de las frecuen cias abs olut as .existe una perdida de información. La mediana se simboliza como Me. fácilmente se identifica la mediana. Para su cálculo es necesario que los datos estén ordenados. . Media aritmética (µ o): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Es decir tenemos que buscar el intervalo en el que se encuentre L i es el límite inferior de la clase donde se encuentra la mediana. El valor de la media exacta es el calculado para los datos no agrupados. pero cuando el número de datos es par. pero dada la proximidad de la media para los datos agrupados. Es menos usada que la media aritmética. se tomar esta última como cierta.

a i es la amplitud de la clase. 75) 8 100 100 100/2 = 50 .Es la semisuma de las frecuencias absolutas. La med iana es independi ente de las a mp litud es de los int ervalos . 66) 18 23 [66.1 es la frecuenc ia acu mulad a anterior a la clase mediana. Ejem plo: Calcu lar la m edian a de una dis tr ibución es tadís ti ca que vi ene dada por la s iguiente tabla: fi Fi [60. 72) 27 92 [72. F i . 69) 42 65 [69. 63) 5 5 [63.

Si una persona duerme ocho horas y media. b. ¿cuánto cabe esperar que vea la televisión? X Y F XY X2 Y2 6 4 3 24 36 16 7 3 16 21 49 9 8 3 20 24 64 9 9 2 10 18 81 4 10 1 1 10 100 1 40 13 50 97 330 39 Hallamos las medias: . La clasificación de las respuestas ha permitido elaborar la siente tabla: Nº de horas dormidas (X) 6 7 8 9 10 Nº de horas de televisión (Y) 4 3 3 2 Frecuencias absolutas (fi) 3 16 20 10 1 1 a. 69) Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que dedican diariamente a dormir y ver la televisión. Determinar la ecuación de la recta de regresión de Y sobre X. Calcular el coeficiente de correlación.Clas e de la med iana: [66. c.

44*0.26 Calculamos la covarianza Covarianza= 97/50 – (0.059=0.208 = 1.262 Desviación estándar Y=√0.78.8440 Coeficiente de correlación= 1.64=65.8440= Coeficiente de correlación= 1.36 .94 – 0.8411 Coeficiente de correlación= 0.96 = 2.8411 Recta de regresión de Y sobre X Calculamos las varianzas X= 330/5-0.732 Ahora calculamos las desviaciones estándar Desviación estándar X=√330/50 – 0.8*0.0676 Desviación estándar Y=√0.82 Desviación estándar= √6.8 Y=13/50=0.732/2.82= X=66-0.6 – 0.8440 Desviación estándar Y=0.7124= 0.26) = Covarianza= 1.X=40/50= 0.64 Desviación estándar= √5.732/2.44 Desviación estándar X=2.0.44 Desviación estándar Y= √39/50 – 0.

26 = 2.732 Y=2.26 Y=2.36 Y=39/5-0262 Y=7.8 (x-0.26 = 1.168X-1.47200 .8) Y-0.732+0.7324 Varianza de Y= 7.Varianza de X= 65.168X-1.0676=7.8-0.7324 Y-0.168X-1.165 (x-0.26=2.8) Y-0.732/0.

Medidas de dispersión. El grupo entregara una conclusión acerca del tema escogido con base en los resultados Obtenidos. deberán escoger previo acuerdo entre los integrantes del grupo.7. de los temas que presenta la página del censo. ingresando a la página Web del DANE: ACTIVIDAD A REALIZAR: En este segundo trabajo colaborativo. Medidas de regresión y correlación 2. . un grupo de datos para los cuales se pide Calcular: 1. II-ACTIVIDAD DE INVESTIGACIÓN Realizar un recorrido a través de los resultados del Censo General 2005. Interpretar los resultados obtenidos 3.

Marca de clase 2 Frecuencia Fx Fx2 4108861 8217722 16435444 7 4295913 30071391 210499737 12 4339046 52068552 624822624 17 3933754 66873818 1136854906 22 3641839 80120458 1762650076 27 3280767 88580709 2391679143 32 2917290 93353280 2987304960 37 2919161 108008957 3996331409 42 2732504 114765168 4820137056 47 2291308 107691476 5061499372 52 1835340 95437680 4962759360 57 1450658 82687506 4713187842 62 1104733 68493446 4246593652 67 921054 61710618 4134611406 72 702518 50581296 3641853312 77 504438 38841726 2990812902 82 278875 22867750 1875155500 87 210325 18298275 1591949925 Total 41468384 1188669828 51165138626 .

Medias de dispersión Media Varianza Desviación estándar Coeficiente de variación Desviación media .1.

2. X Y XY X2 2 4108861 8217722 4 7 4295913 30071391 49 12 4339046 52068552 144 17 3933754 66873818 289 22 3641839 80120458 484 27 3280767 88580709 729 32 2917290 93353280 1024 37 2919161 108008957 1369 42 2732504 114765168 1764 47 2291308 107691476 2209 52 1835340 95437680 2704 57 1450658 82687506 3249 62 1104733 68493446 3844 67 921054 61710618 4489 72 702518 50581296 5184 77 504438 38841726 5929 82 278875 22867750 6724 87 210325 18298275 7569 . Medidas de regresión y correlación.

Coeficiente de correlación .

31 que por lo tanto es caracterizada como una suma elevada.2. 3.66 años. Conclusiones    De acuerdo a los resultados de la varianza podemos ver que hay menor dispersión en el año 2010 con respecto al 2011. Según la desviación típica en el año 2010 hay menor estabilidad en los grupos de edades con respecto a la media. También estos resultados nos permiten ver que hay una gran variación en el grupo de datos. . o sea que hay datos muy distantes o mucha diferencia entre las edades de los estudiantes. Analizando de los resultados obtenidos El promedio de edad en Colombia es de un 28.83%. Con un coeficiente de variación de un 70. con un estándar del 20. es decir que hay menor diferencia de edad entre los grupos de personas que recibieron asistencia escolar. esto es debido a que la mayoría de las personas de Colombia son menores de 44 años. esto significa que hay una gran variación de edades en los colombianos por lo tanto (la media no representa la variación).

Objetivos. . - Que los estudiantes comprendan y interioricen todos los temas que la unidad 2 presenta.

Conclusión. todos los integrantes del grupo hemos puesto en práctica lo que se ha aprendido al leer y estudiar el modulo y la unidad 2 de el mismo. Se evidencia la satisfactoria comprensión y entendimiento de la unidad 2 del módulo de estadística descriptiva al concluir este trabajo colaborativo satisfactoria mente. también hemos realizado un trabajo en grupo el cual ha dado buenos resultados siendo este documento la prueba de ello. .

175.pdf http://www.244/campus05_20131/file.gov.Bibliografía     http://estadisticadescriptivaunad100105.blogspot.co/#twoj_fragment1-4 MODULOS .165.php/23/2013-1-_2C/Nuevo_TC2-20131.com/ http://66.dane.CONTENIDO DIDÁCTICO DEL CURSO: 100105 – Estadística Descriptiva .