You are on page 1of 17

Universidad de Buenos Aires Facultad de Ciencias Sociales Carrera de Sociologa

Documento de Ctedra 68: Gua de ejercicios de estadstica (revisin 2013) Autores (2010): Otamendi, Mara Alejandra; Ballesteros, Matas; Paredes, Diego y Almendros, Teresa. (incluye ejercicios de la Gua elaborada por Martnez Mendoza, Ramiro y Griselli, Lucia, 2007).
Ctedra de Metodologa y Tcnicas de la Investigacin Social, Profesora Titular: Ruth Sautu, Carrera de Sociologa, Facultad de Ciencias Sociales, Universidad de Buenos Aires (UBA)

Este Documento de Ctedra forma parte de una serie que tiene como propsito contribuir a la formacin de los alumnos de la Carrera de Sociologa de la Universidad de Buenos Aires en cuestiones vinculadas al diseo y realizacin de investigaciones cientficas en el campo de las ciencias sociales. Su contenido complementa los textos de metodologa de lectura obligatoria y optativa incluidos en cada uno de los tres cursos que se dictan en la Carrera. Estos documentos son material de uso interno y no pueden ser incorporados a ediciones impresas ni reproducidos comercialmente. La Ctedra solicita a los usuarios de estos Documentos que citen a sus autores indicando las referencias completas, es decir: autores, fecha, ttulo y nmero del documento (traduccin, resumen, elaboracin propia, etc.). En los casos en que el usuario utilice slo parte del documento, haciendo referencia a algunos de los autores/obras originales all incluidos, consignar que fue tomado de nuestro Documento de Ctedra. Por ejemplo: E.O Wrigth (1985), Classes, London: Verso, citado en Documento de Ctedra II.1., Plotno, G., Lederman, F. & Krause, M. (2007) Escalas Ocupacionales.

LA MATRIZ DE DATOS: VARIABLES Y CATEGORAS


El departamento de Investigacin Educativa de la Universidad XX est interesado en estudiar el problema de la enseanza y el aprendizaje de la lectura en el EGB.1 Se trata de encontrar el mtodo o los mtodos de enseanza de la lectura que mejor se adapten a alumnos varones, que son las unidades de anlisis de este estudio. Son muchos los factores que influyen en las dificultades de aprendizaje lector, por ejemplo: biolgicos, sociales, psicolgicos, y educativos. Para el presente estudio las variables implicadas se definen de la siguiente manera:
N: Nmero de identificacin de las unidades de anlisis V1: Mtodo de enseanza de la lectura: El estudio incluye tres mtodos, cada uno de los cuales representa un enfoque terico- didctico muy diferente 1) mtodo sinttico 2) mtodo global 3) mtodo mixto V2: Asistencia al preescolar 1) s asisti 2) no asisti V3: Madurez lectora Puntuacin total obtenida por un sujeto en un test ABC, dicha puntuacin oscila entre 0 y 20 puntos V4: Ambiente familiar Dado por el nivel de interaccin del nio en el seno de la familia 1) mayor interaccin en el seno de la familia 2) media interaccin en el seno de la familia 3) menor interaccin en el seno de la familia V5: Nivel socioeconmico 1) alto 2) medio 3) bajo V6: Nivel de vocabulario previo al entrar al EGB La prueba utilizada fue el test de conceptos bsicos. El objetivo del test es medir tanto los preconceptos como el vocabulario en uso. Vara entre 0 y 30 puntos V7: Nivel intelectual Se midi inteligencia general a travs de un test de inteligencia. Vara entre 0 y 43 puntos. V8: Velocidad lectora La puntuacin vara entre 0 y 70 puntos V9: Memoria general Se utiliz una escala que mide la capacidad de memorizar contenidos. La puntuacin mxima es de 37 puntos. V10: Comprensin lectora Test que mide comprensin, exactitud y velocidad lectora. Puntuacin mxima 30 puntos. V11: Clculo Se utiliz una prueba de clculo que mide bsicamente clculo aritmtico y es de aplicacin colectiva. La puntuacin mxima es de 28 puntos.

1 La matriz de datos utilizada para algunos ejercicios fue extrada de: Fernndez Daz; Garca Ramos; Asensio Muoz y Fuentes Vicente (1990) Problemas de estadstica aplicados a las ciencias sociales, Madrid, Ed. Sntesis.

V12: Estilo cognitivo La puntuacin mxima que poda obtenerse es de 18 puntos. Se aplic un test que en el que se les peda a los nios que reconocieran figuras simples de entre un conjunto de 18 figuras complejas. V13: Adaptacin escolar La puntuacin mxima es 10 = mxima adaptacin y la mnima es 1= mnima adaptacin. V14: Aspiraciones de los padres Aspiraciones con respecto a la formacin de sus hijos, especialmente acerca del nivel de estudios que pretenden que sus hijos alcancen. Medido a travs de la pregunta: Se ha planteado que su hijo termine estudios superiores? 1) s 2) no

Modelo de anlisis propuesto. Orden temporal de las variables


I Nivel socioeconmico II Ambiente familiar Nivel intelectual Aspiraciones de los padres
(1)

III Asistencia al preescolar Mtodo de enseanza

IV (2) Madurez lectora Nivel de vocabulario Velocidad Lectora Memoria general Clculo Estilo cognitivo Adaptacin escolar

(1) (2)

El nivel intelectual se desarrolla en el hogar y en el mbito escolar Existe interaccin entre las variables

Matriz de datos N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 V1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 V2 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 1 1 2 2 2 2 2 2 1 1 1 1 1 1 2 2 2 2 2 2 V3 18 17 7 12 15 6 7 10 9 4 2 7 20 9 10 13 11 2 16 8 3 9 4 2 19 14 15 9 8 11 10 13 10 4 10 3 V4 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 V5 1 2 3 2 1 3 3 2 1 3 2 1 1 3 2 2 1 3 1 2 3 2 3 1 2 3 1 3 2 1 3 1 2 3 1 2 V6 28 27 14 23 24 14 14 18 14 10 5 14 30 18 15 20 16 8 22 18 7 12 9 8 27 24 24 17 12 18 14 18 17 10 16 12 V7 43 30 18 23 19 22 26 20 19 18 12 17 29 22 20 25 15 11 33 28 24 20 13 14 27 22 28 19 18 20 20 24 21 18 10 14 V8 69 68 38 50 57 33 30 38 39 22 20 37 62 35 41 50 43 19 55 30 24 47 21 23 68 60 70 31 28 46 50 48 37 35 42 17 V9 30 20 30 26 37 15 21 27 20 32 16 27 30 30 25 22 21 12 29 16 10 19 30 22 34 32 30 24 20 19 12 19 26 14 18 22 V10 V11 V12 V13 V14 29 28 17 9 1 30 22 16 8 1 10 15 9 6 1 21 25 14 5 1 24 19 8 3 1 11 20 11 4 2 12 27 13 7 1 8 19 12 6 2 7 16 10 4 2 5 12 8 5 2 3 9 4 1 2 6 14 9 3 2 28 25 15 7 1 12 21 11 8 2 9 24 6 7 1 20 22 16 4 1 16 11 8 2 2 2 8 10 1 2 28 26 18 5 2 11 19 16 7 1 4 23 12 5 2 7 20 7 2 1 5 10 5 4 2 3 12 6 1 2 25 21 13 7 1 23 16 8 6 1 22 18 13 4 1 10 16 6 7 1 7 13 5 2 2 15 17 7 2 2 6 14 8 5 1 18 20 14 4 2 18 19 12 3 1 6 10 5 2 1 10 7 3 1 1 2 9 4 2 2

CONSTRUCCIN DE DISTRIBUCIONES DE FRECUENCIAS


1.- Cul es la unidad de anlisis del estudio? 2.- Indique cada una de las variables que componen la matriz de datos y su nivel de medicin 3.- Construya las distribuciones de frecuencias de las siguientes variables:
Ambiente familiar (V4) Nivel socioeconmico (V5) Nivel de vocabulario previo al entrar al EGB (V6) Nivel intelectual (V7) Aspiraciones de los padres (V14)

4.- Agrupe en 5 intervalos iguales las distribuciones de frecuencias de las siguientes variables, indicando la amplitud de cada intervalo y los puntos medios:
Nivel de vocabulario previo al entrar al EGB (V6) Nivel intelectual (V7)

5.- Dada la siguiente distribucin de frecuencias de la variable comprensin lectora (V10) realizada con el software SPSS: a) Agrpela en 6 intervalos. b) Indique la amplitud de cada intervalo y los puntos medios.
Cuadro N 1. Comprensin lectora de los alumnos varones que cursan el EGB
Frequency 2 2 1 2 3 3 1 1 3 2 2 1 1 2 1 1 1 1 1 1 2 1 1 36 Percent 5,6 5,6 2,8 5,6 8,3 8,3 2,8 2,8 8,3 5,6 5,6 2,8 2,8 5,6 2,8 2,8 2,8 2,8 2,8 2,8 5,6 2,8 2,8 100,0 Cumulative Percent 5,6 11,1 13,9 19,4 27,8 36,1 38,9 41,7 50,0 55,6 61,1 63,9 66,7 72,2 75,0 77,8 80,6 83,3 86,1 88,9 94,4 97,2 100,0

Valid

2 3 4 5 6 7 8 9 10 11 12 15 16 18 20 21 22 23 24 25 28 29 30 Total

Fuente: elaboracin propia.

6.a. Indique el nivel de medicin de las siguientes variables:


I. Auto percepcin del estado de salud: Excelente, muy bueno, bueno, regular, malo o muy malo. II. Consumo de Remedios sin prescripcin mdica durante los ltimos 6 meses: S, No. III. Peso al nacer: expresado en kilogramos. IV. Gasto mensual en salud: expresado en pesos.

6.b. Agrupe los sistemas de categoras para las variables III y IV, modificando su nivel de medicin. Justifique el nuevo sistema de categoras. 7.a. En la Ciudad de Buenos Aires en el ao 2008 se llev a cabo un estudio sobre la situacin de dependencia de personas de la tercera edad: se estudi en particular a aquellas personas mayores cuyo cuidado se encontraba a cargo de un familiar. Se realizaron entrevistas con el objetivo de conocer las caractersticas tanto de la persona mayor cuidada como del cuidador. Indique el sistema de categoras y el nivel de medicin para cada una de las siguientes variables del estudio:
Variables del cuidador Distancia (en cuadras) entre la casa y el trabajo Sexo Nivel de educacin alcanzado Variables de la persona mayor cuidada Edad Peso Nivel de severidad de la enfermedad

7.b. Proponga dos variables para medir caractersticas del cuidador y dos para medir caractersticas de la persona cuidada, con sus respectivos sistemas de categoras, indicando el nivel de medicin. Justifique su propuesta. 8.- Seale si el sistema de categoras propuesto para cada una da la variables abajo mencionadas, cumple con los criterios de ser exhaustivos y excluyentes. Si no es as, corrija el sistema de categoras para estar de acuerdo con dichos principios. A. Tiempo transcurrido desde la ltima consulta mdica Entre 1 y 4 meses. Entre 6 meses y 9 meses Entre 9 meses y 1 ao. B. Cantidad de consultas realizadas a un profesional de la salud en el ltimo ao: De 1 a 3 De 3 a 5 De 6 a 7 De 9 a 11 C. Religin de la persona atendida en la sala de urgencias de un hospital: Catlica Protestante Juda Ninguna 9.- Qu nivel de medicin corresponde a la variable mximo nivel de educacin alcanzado cuando es medido como: a) Nmero de aos de estudio realizados (0, 1, 2, 3, ) b) Nivel educativo completado (primario, secundario, universitario, posgrado)

10. En las siguientes distribuciones de frecuencias calcule los porcentajes y realice la lectura univariada de cada cuadro:
Cuadro N 2. Presencia de enfermedades crnicas diagnosticadas por un mdico S No Total
Fuente: elaboracin propia. Datos ficticios.

180 971 1151

Cuadro N 3. Frecuencia en la compra de medicamentos con receta mdica durante el ltimo ao No compra bajo receta 50 Entre 1 y 4 veces 211 Entre 5 y 8 veces 575 Entre 9 y 12 veces 240 Ms de 12 veces 75 Total 1151
Fuente: elaboracin propia. Datos ficticios.

Cuadro N 4. Tipo de establecimiento en el que le recetaron su ltimo medicamento este ao No le recetaron medicamentos este ao 100 Salita o centro de salud 210 Hospital pblico 430 Clnica privada 311 Consultorio particular 80 Otros 18 NS/NC 2 Total 1151
Fuente: elaboracin propia. Datos ficticios.

Cuadro N 5. Sexo del paciente Varn Mujer Total


Fuente: elaboracin propia. Datos ficticios.

572 579 1151

11.- Se realiz una encuesta a 639 usuarios de hospitales pblicos de la Ciudad de Buenos Aires para determinar el nivel de satisfaccin de los mismos con respecto a los servicios brindados por los hospitales. Para ello, se les consult a los encuestados el nivel de satisfaccin que tenan con relacin a 10 aspectos del hospital. Para cada aspecto, el entrevistado poda indicar su nivel de satisfaccin entre 0 y 10. A partir de ellos se construy la variable nivel de satisfaccin con el hospital, con un valor mnimo de 0 y un valor mximo de 100. Los resultados son los siguientes:
Cuadro N 6. Nivel de satisfaccin con el hospital de usuarios de hospitales de la Ciudad de Bs. As. Nivel de satisfaccin con el hospital Frecuencias 00-10 11 11-20 25 21-30 35 31-40 47 41-50 70 51-60 116 61-70 141 71-80 113 81-90 59 91-100 22 Total 639
Fuente: Elaboracin propia. Datos Ficticios.

Incluya en la tabla los puntos medios de los intervalos, las frecuencias absolutas acumuladas, las frecuencias porcentuales, las frecuencias porcentuales acumuladas. 12.- A continuacin se presenta la distribucin del parentesco de los familiares cuidadores de pacientes con Alzheimer. Calcule la razn de mujeres a hombres cuidadores.
Cuadro N 7. Tipo de parentesco del familiar cuidador de paciente con Alzheimer Parentesco del familiar con el paciente Frecuencias Esposa Esposo Hija Hijo Hermana Hermano Madre Nuera Otros parientes femeninos Otros parientes masculinos TOTAL
Fuente: elaboracin propia. Datos ficticios.

114 17 37 4 8 1 2 13 9 2 207

13.- La Organizacin Mundial de la Salud (OMS) ha realizado una encuesta, durante el ao 2006, dirigida a conocer la opinin de una muestra aleatoria de 2900 mdicos de cuatro pases distintos. Una de las preguntas del cuestionario se encontraba formulada de la siguiente manera: En su opinin, cul es el nivel de familiaridad que tienen los legisladores en salud pblica de su pas con la Estrategia Global de Salud de la OMS? Los resultados se presentan en el siguiente cuadro.

TITULO Muy familiarizados Bastante familiarizados Para nada familiarizados No sabe / No responde
Fuente: elaboracin propia. Datos ficticios.

EEUU 188 326 116 53

Espaa 149 241 151 32

Argentina 334 475 92 23

Rusia 194 455 56 17

a) b) c)

A partir de los sistemas de categora presentados, indique el nombre de las variables del cuadro, sealando su nivel de medicin. Coloque el ttulo correspondiente. Responda a las siguientes preguntas, construyendo las distribuciones de frecuencia necesarias para poder responderlas: c.1 Qu porcentaje de encuestados considera que los legisladores estn muy familiarizados con la Estrategia Global de la OMS? c.2 Qu porcentaje de encuestados considera que los legisladores estn para nada familiarizados con dicha estrategia? c.3 Para cada pas, Qu porcentaje considera que los legisladores estn bastante familiarizados con la estrategia? c.4 Cul es el pas con mayor proporcin de encuestados que no sabe o no responde la pregunta?

14.- Teniendo en cuenta las distintas definiciones de envejecimiento demogrfico y los datos que figuran a continuacin, calcule e interprete para los distintos aos: la proporcin de personas mayores de 65 aos. la tasa de mayores de 65 aos cada 100.000 habitantes. la razn entre la poblacin adulta mayor y joven.
7

Envejecimiento demogrfico (envejecimiento poblacional): proceso por el cual una poblacin llega a ser ms vieja, de acuerdo con ciertos criterios, tales como incremento en la proporcin de personas mayores de 60 / 65 aos, en relacin con la poblacin total. Otros criterios son: expectativa promedio de vida, edad promedio de una poblacin, proporcin comparada de poblacin vieja y joven. (En Glosario de la Red Latinoamericana de Gerontologa: http://www.gerontologia.org/portal/glosario.php ).
Cuadro N 9. Indicadores demogrficos seleccionados para fechas censales Total del pas. Aos 1869-2001

Aos 1869 1895 1914 1947 1960 1970 1980 1991 2001

Porcentaje de Adultos Jvenes (2) mayores 2,2 42,8 2,5 40,3 2,3 38,4 3,9 30,9 5,6 30,8 7,0 29,3 8,2 30,3 8,9 30,6 9,9 28,3

Esperanza de vida al nacer, en aos (3) 32,9 40,0 48,5 61,1 66,4 65,6 68,9 71,9 73,8

Poblacin Total (en millones) 1,8 4,0 7,9 15,8 20,0 23,3 27,8 32,6 36,2

(1) Adultos mayores: poblacin de 65 aos y ms de edad. (2) Jvenes: poblacin de 0 a 14 aos de edad. (3) Los valores de 1869 y 1895 corresponden a los dos primeros perodos intercensales, mientras que los valores sucesivos provienen de Tablas de Vida elaboradas para cada fecha censal. Fuente: INDEC, Censos Nacionales de Poblacin. INDEC (1975), La poblacin de Argentina, Buenos Aires, Serie Investigaciones Demogrficas N 1. INDEC (1988), Tabla de mortalidad 1980-1981, total y jurisdicciones. Buenos Aires, Estudios 10. INDEC (1995), Tabla completa de Mortalidad de la Argentina por sexo.1990-1992. Buenos Aires, Serie Anlisis Demogrfico N 3. INDEC (2004), Estimaciones y proyecciones de poblacin. Total del pas. 1950-2015, Buenos Aires, Serie Anlisis Demogrfico N 30. Pantelides E.A. (1989), La fecundidad argentina desde mediados del siglo XX, Buenos Aires, CENEP, Cuadernos del CENEP N 41.

GRFICOS
15.a) Grafique cada uno de los cuatro cuadros que figuran en el ejercicio 10 de la presente gua (cuadros 2, 3, 4 y 5). Justifique su eleccin de tipo de grfico (segn el nivel de medicin de las variables). b) Repita el ejercicio para el cuadro 6 del ejercicio 11. Justifique el tipo de grfico elegido. c) Repita el ejercicio para el cuadro 7 del ejercicio 12. Justifique el tipo de grfico elegido. NOTA: recuerden todos los elementos que deben estar presentes en los grficos (ttulo, fuente, etc.)

MEDIDAS DE TENDENCIA CENTRAL Y POSICIN


16.- Defina la media, mediana y modo. Especifique las limitaciones y ventajas potenciales de cada medida. 17.- Cmo afecta un sesgo a la izquierda a la media, mediana y modo de una distribucin de frecuencias? Y un sesgo a la derecha? 18.- Utilizando la matriz de alumnos varones de EGB, se necesita conocer los valores de la mediana, la moda y la media aritmtica de las siguientes variables:
V9: Memoria general V12: Estilo cognitivo V6: Nivel de vocabulario previo al entrar al EGB. Para esta variable realice los clculos utilizando la matriz de datos y el cuadro confeccionado en el ejercicio 3.

19.- Deseamos saber la media aritmtica de la muestra de 36 alumnos en la variable madurez lectora a partir de las medias que han obtenido en las tres submuestras de la variable mtodos de enseanza:
el que sigui el mtodo 1: media 9,50 puntos el que sigui el mtodo 2: media 8,92 puntos el que sigui el mtodo 3: media 10,50 puntos

20.- Supongamos que la prueba de madurez lectora la hubiramos aplicado adems a otras tres muestras de 40, 45 y 55 sujetos y hubiramos obtenido respectivamente las siguientes medias: 14,8; 10 y 12,8 Cul sera en este caso la media total? 21.- Cul es el valor del Cuartil 3, Decil 6 y Percentil 45 de la variable madurez lectora? 22.- Se relevaron las edades de los pacientes adultos mayores que recibi el Hospital Ramos Meja durante la primera semana del mes de noviembre del ao 2008. a) Indique la unidad de anlisis. b) Realice un anlisis univariado utilizando las medidas de tendencia central. c) Calcule el valor del decil 8, percentil 30 y 70. Formule conclusiones. d) Reagrupe la variable edad siguiendo el criterio terico expuesto a continuacin. e) Calcule la moda, la media y la mediana una vez agrupados los datos. Qu diferencias encuentra con los resultados del punto b? Cules son las ventajas y los inconvenientes de agrupar los datos?
Clasificacin terica: Hoy se pueden delimitar tres subgrupos, en orden a criterios de actividad econmica, intelectual-cognoscitivo, cultural, de salud y de esperanza de vida a esas edades. Los umbrales son flexibles, aunque dependen de esas variables y hay problemas claros de denominacin. En una primera aproximacin cabe distinguir: 1. Vejez inicial o incipiente, entre los 60 y 69 aos de edad, en que an hay muchas personas activas que no han salido del mercado de trabajo y conservan en general buenas condiciones de salud. 2. Vejez intermedia, entre el 70 y el 84 aniversario, en que ya casi todas las personas han salido del mercado de trabajo, salvo ciertos trabajadores por cuenta propia: agricultores, empresarios, intelectuales, etc., que guardan ciertas condiciones de salud mental y fsica y que observan y perciben la muerte an como un fenmeno no obligatoriamente prximo. 3. Vejez avanzada, de ms de 85 aos de edad, que corresponde a las personas al final de su lnea o ciclo de vida. Fuente: Martin Ruiz, J. F. (2005) Los factores definitorios de los grandes grupos de edad de la poblacin: tipos, subgrupos y umbrales. Revista electrnica de geografa y ciencias sociales, Vol. IX, nm. 190.

Cuadro 10. Distribucin de frecuencia de la variable edad de los adultos mayores atendidos en el Hospital Ramos Meja durante la primera semana de Noviembre, 2008. Edad 60-64 Aos 65-69 Aos 70-74 Aos 75-79 Aos 80-84 Aos 85-89 Aos 90-94 Aos 95 y ms Aos Total Frecuencia 702 471 502 468 268 125 65 25 2626 Porcentaje* 26,7 17,9 19,1 17,8 10,2 4,8 2,5 0,9 100 Porcentaje acumulado 26,7 44,6 63,7 81,5 91,7 96,5 99,0 99,9

*Nota: el clculo no es exacto debido a redondeo. Fuente: elaboracin propia

23.- Suponga que se realiz una encuesta en Octubre del 2001 en La Matanza para determinar el gasto en medicamentos de los residentes de la misma. Se publican los resultados indicando que los menores de 65 aos tenan un gasto promedio de $125 por mes, mientras que quienes tenan 65 aos o ms gastaban un promedio de $210 por mes. Usted necesita saber cunto es el gasto promedio de todos los residentes de La Matanza, pero esos datos no estn disponibles. Sin embargo, cuenta con los siguientes datos del Censo 2001:
Cuadro 11. Habitantes por edad Agrupada. La Matanza, 2001. Edad Agrupada Frecuencia 0-14 Aos 353416 15-64 Aos 795301 65 y ms Aos 106571 Total 1255288
Fuente: Elaboracin propia en base a Censo Nacional de Poblacin, Hogares y Viviendas 2001. Instituto Nacional de Estadstica y Censos (INDEC) Procesado con Redatam+SP

Segn estos datos, cunto fue el gasto promedio en medicamentos de los habitantes de La Matanza en el mes de Octubre del 2001? 24.- La media de las edades de un grupo de 20 personas es de 22 aos, y la de otro grupo de 15 personas es de 26 aos. Cul es la media de ambos grupos? 25.- Se realiz una muestra aleatoria de 20 hogares de la Ciudad de Tandil en Mayo del 2010. Se le consult al Jefe de hogar la cantidad de veces que en el ltimo ao visit a un mdico. Las respuestas fueron las siguientes: 2, 1, 2, 4, 2, 3, 4, 2, 1, 4, 2, 1, 0, 3, 2, 4, 3, 4, 2, 2 a) Compile los datos en una tabla de distribucin de frecuencias b) Indique la unidad de anlisis, el nombre de la variable y su nivel de medicin c) Realice el anlisis univariado, utilizando las medidas de tendencia central. d) Realice el anlisis tomando los cuartiles de la distribucin.

10

MEDIDAS DE VARIABILIDAD
26.- La media para una muestra de conjunto de datos equivale a 80. Cul de los siguientes valores es un valor imposible para la desviacin estndar? Por qu? 200, 0, -20 27.- Utilizando la matriz de alumnos varones del EGB indique: a. Cul es el rango o amplitud total de la variable madurez lectora en la muestra n=36? b. Cul es la desviacin estndar de la variable madurez lectora? 28.- Los siguientes son los coeficientes de variacin de la muestra de los 36 alumnos varones en las siguientes variables:
Comprensin lectora (V10): 65,60 Velocidad lectora (V 8): 37,31

Segn estos valores: Cul es la variable ms homognea? Por qu? 29.- Dados los siguientes valores obtenidos de las medias y los desvos estndar, calculados a partir de la matriz de alumnos varones de EGB, para las variables Nivel intelectual (V 7) y Clculo (V11), Indique cul de estas distribuciones es la ms heterognea. Justifique su respuesta.
Cuadro 12. Medias y desvos estndar para las diversas variables Variable Nivel intelectual Clculo N 36 36

X
21.17 17,42

DS
6,64 5,78

30.- A partir de las estadsticas vitales recopiladas por el GCBA, obtenemos la edad promedio de las muertes por SIDA de varones y mujeres en el ao 2008. Indique cul subgrupo es ms homogneo en la edad de muerte por SIDA.
Cuadro 13. Edad promedio de las muertes por SIDA, por sexo. Ciudad de Buenos Aires, 2008 Media Desvo estndar* Varones 44,1 3,2 Mujeres 40,8 3,0 Fuente: Direccin General de Estadstica y Censos, Ministerio de Hacienda, GCBA. Estadsticas vitales. * datos ficticios.

31.- Con el fin de estimar los gastos anuales, se hizo un relevamiento para conocer la cantidad de das que los pacientes pasaban internados en la unidad de terapia intensiva (UTI) antes de transferirlos a otra sala del hospital Zubizarreta de la Ciudad de Buenos Aires. Se le pide que realice un anlisis univariado, calculando la moda, la mediana, la media aritmtica, y el desvo standard.
Cuadro 14. Distribucin de frecuencias del tiempo de internacin (en das a la fecha del relevamiento) de los pacientes de la UTI del hospital Zubizarreta de la Ciudad de Bs. As., 2004 Das de internacin Frecuencia 1 34 2 23 3 45 4 50 5 31 6 34 7 22 8 9 9 6 10 2 N 256
Fuente: Elaboracin propia. Datos ficticios.

11

32.- En una muestra de pacientes del Servicio de traumatologa del Hospital de Clnicas, la media aritmtica de la edad para el total de 20 mujeres es de 50 aos y para el total de 20 varones es igual a 30 aos. La desviacin estndar de los 40 pacientes considerados conjuntamente es igual a 10. Calcular el coeficiente de variacin para el total de los pacientes. 33.- En un conjunto de 150 alumnos, la media obtenida en la prueba de evaluacin fue de 60 puntos y el desvo de 5 puntos. Si a cada uno de los puntajes originales se les suma 10 puntos: a. Cul es el valor de la media de la nueva distribucin de puntajes? b. Cul es el desvo estndar de la misma distribucin? c. Qu sucede con el coeficiente de variacin al sumarle los puntajes? 34.- Una empresa lleva a cabo un estudio de la cantidad de kilmetros recorridos usando transporte pblico por sus empleados en un da tpico. Una muestra aleatoria de diez empleados arroja los siguientes valores (en km.) 0,0,4,0,0,0,10,0,6,0 a) Calcule e interprete la media, mediana, modo, rango, varianza y desviacin estndar para esos valores. b) Una nueva persona incluida en la muestra vive en una ciudad distinta y viaja 90 kilmetros por da en transporte pblico. Vuelva a calcular la media, mediana, y desviacin estndar, y describa el efecto de la observacin extrema. 35.- A mediados de 1980 la Encuesta Social General pregunt a sus encuestados cuntos amigos cercanos tenan. Para una muestra de tamao 1467, la media fue 7,4 y la desviacin estndar fue 11,0. La distribucin tena una mediana de 5 y un modo de 4. Basndose en estos estadsticos, qu puede ud. conjeturar acerca de la forma de la distribucin? Por qu? 36.- Para cada caso, decida cul es el conjunto de puntuaciones ms homogneo: a. C1: X = 5 , S =1
C2: X = 5 , S =2

b. C1: X = 5 , S =1
C2: X = 0,01 , S =1

c. C1: X = 128 , S =5
C2: X = 4 , S =3

d. C1: X = 1.200 , S =58


C2: X = 1.000 , S =58

12

CURVA NORMAL 37.- Utilizando los datos de la matriz de alumnos varones del EGB, suponga que la distribucin de las puntuaciones en la variable Velocidad lectora (V8) siguiera la distribucin normal. Con una Media de V8: 41,19 puntos y un Desvo estndar de V8: 15,37 a) Qu puntuacin habra obtenido un sujeto que tiene debajo de l al 30 % de casos? b) Qu porcentaje de sujetos ha obtenido una puntuacin superior a 26 puntos? c) Entre qu puntajes se encuentra el 90% central de la distribucin? d) Cul es la probabilidad de obtener un puntaje superior a 67 puntos? 38.- Un problema central en la salud de los mayores es el nivel de colesterol en sangre porque puede producir un infarto o derrame cerebral. Se considera que el valor deseable es de 200 mg/dl. Una encuesta realizada entre enfermos coronarios indic que el colesterol promedio era de 240 mg/dl con una desviacin standard de 30 mg/dl. Suponiendo una distribucin normal para la variable nivel de colesterol calcule: a) Porcentaje de enfermos coronarios por encima del valor de colesterol deseable b) Porcentaje de los enfermos con niveles de colesterol entre 180 y 200 mg/dl. c) Nivel tope correspondiente al 30% de los enfermos coronarios con menor nivel de colesterol. 39.- Segn el Censo de 2009 en las Villas 31 y 31bis el promedio de edad de los habitantes es de 23,3 aos (casi 16 aos ms jvenes que en el resto de la Ciudad) con una desviacin standard de 3 aos. Suponga que la distribucin de las edades es normal: a) Cul es el percentil de un residente de 35 aos? b) Cul es la edad del residente que ocupa el percentil 68? 40.- En una encuesta del CEDOP-UBA del 2005, se obtuvo una muestra de 3000 familias y se midi la cantidad de dinero gastado anualmente en medicamentos (datos ficticios). La variable se distribuy en forma normal. La media es de $235 y la desviacin standard de $80. a) La familia Rodrguez destina $220 a la compra de medicamentos Cuntas familias de la muestra destinan a este rubro ms dinero que la familia Rodrguez? b) Cul es el gasto tope en medicamentos por el 70% inferior de la muestra? 41.- La Encuesta Social General de 1990 pregunt a los encuestados, Durante los ltimos 12 meses, cuntas personas que usted conoca personalmente fueron vctimas de homicidio? El siguiente cuadro corresponde al anlisis de las respuestas de 1370 personas.
Cuadro 15. Frecuencia de personas que conocen personalmente vctimas de homicidios, 1990
2

Vctimas 0 1 2 3 4 5 6 N 1370 Media 0,146 Desv. Est. 0,546

Frecuencia 1244 81 27 11 4 2 1 100% mx 6 75% Q3 0

Porcentaje 90,8 5,9 2,0 0,8 0,3 0,1 0,1 25% Q1 0 0% Mn 0

Fuente: Encuesta Social General de 1990, EEUU, datos seleccionados.

50% Med 0

a) Calcule la distribucin de frecuencias relativas. b) Construya el histograma correspondiente. La distribucin es acampanada, sesgada a la derecha, o sesgada a la izquierda? c) Calcule la media, mediana y modo e interprete sus valores. d) Calcule y analice el desvo estndar se aplica la regla emprica a esta distribucin, por qu?

Ver http://estatico.buenosaires.gov.ar/areas/hacienda/sis_estadistico/villa_31_y_31_bis.pdf 13

CUADROS Y GRFICOS BIVARIADOS


42.- A partir de los datos de la matriz incluida al principio de esta gua, construya los cuadros bivariados correspondientes para comprobar o refutar las hiptesis de trabajo planteadas a continuacin, y realice su lectura. a) El nivel socioeconmico familiar incide en el nivel de aspiraciones de los padres de tal manera que a mayor nivel socioeconmico de la familia los padres s quieren que sus hijos terminen los estudios superiores. b) El ambiente familiar incide sobre el estilo cognitivo, de tal forma que para aquellos nios en cuyo ambiente familiar se da una mayor interaccin, el estilo cognitivo es mayor. c) La asistencia al preescolar incide en el estilo cognitivo de los nios, de tal forma que en aquellos nios que han asistido al preescolar el nivel cognitivo es mayor. d) Compare las conclusiones de los cuadros b y c. 43.- Dado el siguiente cuadro bivariado, elaborado utilizando la informacin de la matriz de datos de alumnos varones del EGB: a) Identifique las variables que intervienen, sus categoras y su nivel de medicin. b) Postule una relacin o hiptesis de trabajo entre las variables, indique cul es la variable independiente y cul la variable dependiente. c) Realice la lectura correspondiente, enuncie si se comprueba o si se refuta la relacin planteada. Justifique su respuesta. d) Grafique el cuadro.
Cuadro N 16. Nivel de vocabulario previo al entrar al EGB, segn asistencia al preescolar
Nivel de vocabulario previo * Asistencia al preescolar Crosstabulation Asistencia al preescolar si no 5 12 27,8% 66,7% 5 6 27,8% 33,3% 8 44,4% 18 18 100,0% 100,0%

Total 17 47,2% 11 30,6% 8 22,2% 36 100,0%

Nivel de vocabulario previo

nivel bajo nivel medio nivel alto

Total

Fuente: elaboracin propia.

44.- El Ministerio de Salud de la Ciudad de Buenos Aires llev acabo una investigacin sobre la opinin de mdicos que trabajan tanto en hospitales pblicos como en clnicas privadas de la ciudad durante el ao 2009 con respecto a diversos temas de salud. Una de las preguntas fue Cun de acuerdo est usted con que el Estado subsidie las instituciones de salud privadas? a partir de la cual se obtuvo el siguiente cuadro:

Clnicas privadas Nada de acuerdo Algo de acuerdo Muy de acuerdo Total 30 85 110 225

Hospitales pblicos 51 90 74 215

Total 81 175 184 440

14

a) Indique las variables que componen el cuadro (si no estn explcitas colqueles el nombre dentro del cuadro); el nivel de medicin de cada una de las variables y sus correspondientes categoras. b) Indique la unidad de anlisis. c) Agregue el ttulo y la fuente al cuadro. d) Postule una hiptesis a poner a prueba, indicando el status que cumple en este cuadro cada una de las variables (VD, VI). e) Conclusiones de la lectura del cuadro la hiptesis se refuta o no? f) Grafique el cuadro. 45.- En base al Censo Nacional de Poblacin, Hogares y Viviendas 2001, realizado por el Instituto Nacional de Estadstica y Censos (INDEC) se obtuvo el siguiente cuadro sobre la poblacin de la provincia del Chaco.
TITULO Chaco Edad Posee plan mdico 98149 200982 40400 339531 No posee plan mdico 256842 368057 20016 644915 Total 354991 569039 60416 984446

0-14 15-64 65 y ms Total

a) b) c) d) e) f)

Identifique las variables del cuadro y sus categoras. Qu papel juega cada una de ellas (VD, VI)? Coloque el ttulo y la fuente correspondiente al cuadro. Calcule los porcentajes en el sentido de la variable independiente. Realice una lectura del cuadro y extraiga conclusiones. Grafique el cuadro.

46.- A partir del siguiente cuadro sobre la poblacin con necesidades bsicas insatisfechas (NBI) de la Provincia de Buenos Aires, responda las siguientes preguntas:
Cuadro 19. Porcentaje de la poblacin con NBI segn grupos de edad de la Provincia de Buenos Aires, 2001 Grupos de edad 0-14 Aos 15-64 Aos 65 y ms Aos Total % con NBI 23,9 % 13,0 % 11,2 % 15,8 % Total en absolutos (3669075) (8617116) (1422711) (13708902)

Nota: Base poblacin de la provincia de Buenos Aires Fuente: Censo Nacional de Poblacin, Hogares y Viviendas 2001, INDEC, Procesado con Redatam+SP

a) b) c) d) e) f)

Cules son las variables y sus respectivas categoras en el cuadro? Qu datos se muestran y cules se ocultan en el cuadro? Por qu ocurre esto? En qu sentido estn calculados los %? Interprete. Complete el cuadro colocando la categoria ausente. Qu conclusiones puede extraer comparando la distribucin con NBI en cada grupo etario? Cul es el nmero total de personas con NBI en la provincia de Buenos Aires en el 2001?

15

47.- A partir de una encuesta acerca de la salud mental en la tercera edad, realizada en la Provincia de Buenos Aires en el ao 2008, se intenta poner a prueba la hiptesis que seala que en adultos mayores el nivel de autoestima se encuentra asociada a su condicin de actividad, tendiendo los que son activos a tener un mayor nivel de autoestima que los que no lo son y viceversa. a) Identifique la variable dependiente y la variable independiente, con sus categoras y nivel de medicin. b) Seale la unidad de anlisis. c) Agregue un ttulo al cuadro. d) A partir del cuadro, compruebe la hiptesis enunciada, extraiga conclusiones. e) Grafique el cuadro.
TITULO Nivel de autoestima Condicin de Actividad (%) Bajo 27% 40% Medio 32% 25% Alto 41% 35%

Econmicamente No Activo Econmicamente Activo


Fuente: elaboracin propia

Total (650) (688)

48.- Dada las variables que configuran el cuadro 21 (estado civil y condicin de actividad): a) Formule una hiptesis indicando el rol que juega cada una. b) Calcule los porcentajes en funcin de dicha hiptesis. c) Realice la lectura del cuadro en funcin de la hiptesis citando los porcentajes. d) Extraiga las conclusiones pertinentes.
Cuadro 21. Condicin de actividad de las mujeres segn estado civil (en absolutos) Condicin de actividad Estado Civil Total Econmicamente Econmicamente Activa No Activa 55 73 128 69 54 10 27 215 Total 276 180 75 18 622 345 234 85 45 837

Soltera Casada

Unida de hecho Viuda Separada / Divorciada

Fuente: Muestra del Censo Nacional de Poblacin y Vivienda de 1991

16

You might also like