You are on page 1of 46

<

Biometra
Ciencias Biolgicas Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

Gua de Trabajos Prcticos


Primer cuatrimestre

2012

UNIVERSIDAD DE BUENOS AIRES FACULTAD DE CIENCIAS EXACTAS Y NATURALES DEPARTAMENTO DE ECOLOGA, GENTICA Y EVOLUCIN ASIGNATURA: BIOMETRA PROFESOR: Dr. G. R. Cueto CLASES TERICAS: 6 horas semanales CLASES PRCTICAS: 8 horas semanales DURACION: 16 SEMANAS PRIMER CUATRIMESTRE DE 2012 PROGRAMA 1.- Introduccin. La Estadstica. Desarrollo de la Biometra. Ejemplos de conceptos y tcnicas estadsticos. Su utilizacin. Software estadstico. 2.- Manejo de datos. Muestra y poblacin. Muestreo con y sin reemplazo. Idea de algunas tcnicas de muestreo. Relacin entre tamao de muestra y de poblacin. Unidad experimental. Poblacin estadstica, poblacin y alcance de la experiencia. Alcance de las observaciones Error muestral. Variables aleatorias: sus distintos tipos. Escalas. Frecuencias absoluta y relativa. Presentacin, resumen y caracterizacin de la informacin. Distribucin de frecuencias: agrupadas y sin agrupar. Grficos: diagrama de barras, histograma comn y de reas. Frecuencia acumulada. Polgonos de frecuencias y de frecuencias acumuladas. Grfico de perfiles. 3.- Estadstica Descriptiva. Medidas de posicin: media, moda, mediana, cuartiles. Propiedades y relaciones. Medidas de dispersin: amplitud muestral, desviacin intercuartil, varianza, desviacin estndar. Propiedades. La varianza como un cuadrado medio. Coeficiente de variacin muestral. Datos aberrantes. 4.- Teora de Probabilidades. Experimento aleatorio: sus resultados posibles. Espacio muestral. Sucesos. Frecuencia relativa: su estabilidad (Ley de los Grandes Nmeros). Equiprobabilidad. Axiomas de probabilidad. Espacio de probabilidad. Probabilidad condicional. Sucesos independientes. Prueba de diagnstico. Concepto de variable aleatoria unidimensional y bidimensional. Distribucin en probabilidades. Funcin de densidad y de distribucin. Esperanza y varianza de una variable aleatoria. Covarianza. 5.- Distribuciones Bsicas. Distribucin binomial, hipergeomtrica, de Poisson, binomial negativa. Determinacin de la naturaleza aleatoria de una disposicin espacial en el caso binomial y en el de Poisson. Distribucin al azar, en contagio, en repulsin. Distribucin normal. Aproximacin normal a las distribuciones binomial y de Poisson. Mtodos para estudiar las desviaciones con respecto a la normalidad. Coeficiente de asimetra y de aplanamiento. Distribucin log-normal. Distribucin uniforme. Distribucin exponencial. 6.- Distribuciones Muestrales. Distribucin muestral de un estadstico. Error estndar. Distribucin muestral de medias, de proporciones, de varianzas, de diferencia de medias y de diferencia de proporciones. Distribucin de la suma de variables aleatorias independientes: Teorema Central del Lmite (enunciado). 7.- Estimacin Estadstica. Estimadores. Estimador puntual. Estimador insesgado y de mnima varianza. Sesgo de un estimador. Error cuadrtico medio. Estimacin por intervalos de confianza. Nivel de confianza. Distribucin "t" de Student. Distribucin 2 (Chi-cuadrado) de Pearson. Distribucin de Fisher. Propiedades. Intervalo de confianza para medias, proporciones, varianzas, diferencia de medias, diferencia de proporciones y cociente de varianzas. Suposiciones

para la validez de las estimaciones en cada caso. Estimacin del tamao muestral. Uso de los intervalos de confianza para inferir cuestiones acerca de la poblacin. 8.- Inferencia Estadstica. Prueba de hiptesis: sus elementos. Error de tipo I y II. Nivel de significacin. Potencia. Prueba de hiptesis para una muestra. Estimacin del tamao de la muestra para una potencia dada. Clculo del valor p de significacin. Pruebas de hiptesis para dos muestras independientes y dos muestras pareadas. 9.-Anlisis de Frecuencias. Prueba Chi-cuadrado de bondad de ajuste. Tablas de contingencia. Prueba Chi-cuadrado de independencia. Estadsticos X2 y G. Caso de marginales: ambas fijas, ambas aleatorias, una fija y una aleatoria. Correcciones de Yates y de Williams. Medidas de asociacin. Prueba de homogeneidad. Riesgo relativo. Prueba exacta de Fisher. Pruebas de bondad de ajuste: Kolmogorov-Smirnov para el caso de hiptesis intrnsecas y de Lilliefors para el caso de hiptesis extrnsecas . 10.- Anlisis de la Varianza. Introduccin: ejemplos de los distintos diseos. Anova de un factor fijo. Modelo lineal. Suposiciones. Descomposicin de la suma de cuadrados total y de los grados de libertad. Comparaciones planeadas y no planeadas. Mtodos de comparaciones de Bonferroni, Scheff, Tukey, Dunnett. Comparaciones ortogonales. Caso particular de dos muestras independientes. Validez de las suposiciones del Anova. Transformacin de datos. Anova de dos factores fijos. Modelo lineal. Suposiciones. Interaccin. Pruebas de efectos principales y de efectos simples. Diseo completamente aleatorizado (DCA). Diseo en bloques al azar (DBA). Caso particular de dos muestras pareadas. Prueba de Tukey de no aditividad. Idea de modelos aleatorios. Componentes de la varianza. 11.- Regresin y Correlacin. Ajuste de una curva a los datos. Diagrama de dispersin. Modelo de regresin lineal simple. Suposiciones. Ejemplo de regresiones no lineales que pueden linealizarse: curva logstica, curvas de crecimiento. Alometra, isometra. Recta de mnimos cuadrados. Estimadores de mnimos cuadrados de los parmetros de la recta de regresin. Varianza de los estimadores. Evaluacin de la regresin. Coeficiente de determinacin R 2. Comparacin de las rectas de regresin: prueba de igualdad de pendientes. Prediccin. Intervalo de prediccin. Intervalo de confianza para E(Y). Banda de confianza para la recta de regresin poblacional. Caso de ms de un valor de la variable dependiente para cada valor de la independiente. Prueba de falta de ajuste. Modelo de correlacin lineal. Coeficiente de correlacin lineal () de Pearson. Prueba de significacin de la correlacin. Intervalo de confianza para el coeficiente de correlacin (). Prueba de homogeneidad de los coeficientes de correlacin. BIBLIOGRAFA COCHRAN, W. 1979. Tcnicas de Muestreo. Editorial Continental S.A. DANIEL, W. W. 2002. Bioestadstica. 4TA ed. Ed. Limusa - Wiley, Mxico. PAGANO, M. Y GAUVREAU, J. 2001. Fundamentos de Bioestadistica. 2da ed. Thompson Learning, Mxico. MEYER, P. 1992. Probabilidades y Aplicaciones Estadsticas. Fondo Educativo Interamericano. MILTON, J. S. 1994. Estadstica para Biologa y Ciencias de la salud . Interamericana McGraw - Hill, Madrid. MOTULSKY, H. 1995. Intuitive Bioestatistics. Oxford University Press, New York. SNEDECOR, G. y W. COCHRAN. 1978. Mtodos Estadsticos. Editorial Continental, Mxico. SOKAL, R. y F. J. ROHLF. 1995. Biometry. Third Edition. W. H. Freedman and Company, New York. STEEL, R. G. y J. H. TORRIE. 1986. Bioestadstica: Principios y Procedimientos. Mc GrawHill, Bogot.

STEEL, R. G. , J. H. TORRIE and D. A. DICKEY. 1997. Principles and Procedures of Statistical Biometrical Approach. Third edition. Mc Grw-Hill, Inc, New York. ZAR, J. H. 1996. Biostatistical Analysis. Third Edition. Prentice-Hall, Inc., Englewood Cliffs, N.J., New Jersey. USA. Rgimen de aprobacin de la materia como alumno regular: La aprobacin de la asignatura como alumno regular se puede lograr mediante dos modalidades diferentes: a) Aprobacin por Promocin directa: Para promocionar la materia en forma directa es necesario aprobar dos parciales terico-prcticos con una nota mnima de 7 puntos en cada parcial, un promedio (entre los dos parciales) de 8 puntos y una asistencia mnima al 80% de las clases prcticas. b) Aprobacin con Examen final: Aquellos alumnos que aprueben los dos parciales terico-prcticos con una nota mnima de 6 puntos en cada parcial, posean una asistencia mnima al 80% de las clases prcticas y que no alcancen los requisitos para la promocin directa debern rendir un examen final terico para aprobar la materia. Por otra parte, los alumnos que no alcancen la nota de 6 puntos, en alguno o ambos parciales, podrn recuperarlos al final de la materia. Para eso se dispondr de dos fechas, en la primera de las cuales slo se podr recuperar el primer parcial y en la segunda, slo el segundo parcial.

Lista de Alumnos EGE: es una lista de distribucin de informacin para alumnos del Departamento de Ecologa, Gentica y Evolucin, acerca de becas, cursos y otras cuestiones de inters. No es una lista de discusin. Puede Ud. suscribirse a la lista en:

http://www.ege.fcen.uba.ar/mailman/listinfo/alumnos
o accediendo desde el link en la pgina del Departamento. Tambin en esta pgina encontrar los correos electrnicos de los representantes estudiantiles del EGE, para realizar cualquier consulta.

TRABAJO PRCTICO N 1 MANEJO DE DATOS Y ESTADSTICA DESCRIPTIVA Problema 1. Definir variables aleatorias que permitan estudiar las siguientes situaciones experimentales. Indicar cmo podran obtenerse los valores correspondientes a cada una de ellas y cmo podran tabularse. Indicar la unidad experimental; cmo podra extraerse la muestra y cul es la poblacin estadstica. 1.1.- En una zona de la Provincia de Buenos Aires se desea estimar la cantidad media de gallinas parasitadas por granja. 1.2.- Para una campaa publicitaria se est interesado en estudiar la relacin entre el hbito de fumar (no fumador, ex fumador o fumador) y el infarto de miocardio, en individuos mayores de 50 aos 1.3.- Para un estudio gentico se determina la fecundidad diaria (cantidad de huevos depositados por hembra y por da durante los primeros 14 das de vida) para cada una de las hembras de un grupo de 50. De las mismas, 25 pertenecen a una cepa (SS) y 25 a otra (NS) de Drosophila melanogaster. 1.4.- Se quiere estudiar la hiptesis respecto a que el tamao de la caparazn de ejemplares de tortuga Testudo chilensis es isomtrico. Para ello se estudia la relacin entre el ancho y el alto del caparazn. 1.5.- Un entomlogo est interesado en estimar la cantidad media de especimenes deteriorados en cajas entomolgicas con cinco ejemplares cada una. 1.6.- Para un estudio nutricional se quiere comparar el efecto de tres dietas con distinto suplemento proteico, sobre la ganancia de peso en cerdos de la raza A. Problema 2. Se siembran semillas de una especie de araucaria en bandejas con slo seis lugares (una semilla por lugar). El trabajo se realiza en un vivero experimental. Al cabo de un tiempo se toma una muestra aleatoria de 50 bandejas y se cuenta la cantidad de semillas germinadas por bandeja con los siguientes resultados: 1 2 6 4 0 3 4 3 3 6 2 3 4 3 5 0 1 3 3 3 5 2 6 1 6 1 3 4 5 3 5 4 3 4 2 2 0 2 3 4 5 2 1 2 3 3 3 4 5 4

2.1.- Indicar la unidad experimental, variable aleatoria (y clasificarla), la poblacin, la muestra, y la poblacin estadstica. 2.2.- Agrupar los datos en una tabla de frecuencias. 2.3.- En qu porcentaje de macetas germinaron a lo sumo 2 semillas? Y en qu porcentaje germin alguna semilla? 2.4.- Graficar un diagrama de barras con porcentajes y un polgono de frecuencias acumuladas. 2.5.- Calcular los estadsticos de tendencia central y de variabilidad, indicando sus unidades. 2.6.- Calcular el percentil 30 e interpretar. Problema 3. En un estudio diseado para correlacionar el cambio estacional de testosterona en plasma con el ciclo reproductivo de los lagartos, se obtuvieron los siguientes datos de una muestra de 33 Tupinambis sp. capturados en Santiago del Estero durante el mes de mayo. Los niveles de testosterona estn registrados en nanogramos por mililitro y han sido ordenados de menor a mayor.

2,1 3,0 3,5 4,5 6,0 6,1 6,7 6,8 7,2 7,2 7,5 7,6 7,9 8,1 8,2 8,3 8,4 9,0 9,3 9,4 9,5 10,7 11,5 11,8 12,1 12,1 12,4 12,5 13,2 13,2 13,2 13,6 15,1 En octubre una muestra de 40 lagartos de la misma especie revel los siguientes niveles de testosterona en plasma: 22,0 29,8 36,1 43,2 25,1 30,2 36,9 43,7 26,2 30,3 36,9 44,5 26,4 30,5 37,2 45,0 27,0 31,5 37,2 45,2 27,2 31,6 37,4 45,4 28,6 32,5 37,5 46,1 28,7 34,3 38,3 47,5 29,0 35,9 41,8 48,3 29,7 35,9 42,7 50,5

Para ambos conjuntos de datos: 3.1.- Definir y clasificar la variable aleatoria, identificar la unidad experimental, muestra y poblacin. Se trata de un estudio experimental u observacional? 3.2.- Construir la distribucin de frecuencias considerando 6 intervalos. Graficar mediante un histograma. Comentar el tipo de simetra de la distribucin. 3.3.- Construir el polgono de frecuencias acumuladas relativas. Ubicar grficamente a la mediana. 3.4.- Calcular la media, la mediana, la moda, el desvo estndar y el coeficiente de variacin con los datos agrupados y sin agrupar. Cules valores son ms exactos? Por qu? Calcular el coeficiente de asimetra y el de curtosis utilizando algn software. 3.5.- Calcular el percentil 75 e interpretar el resultado. 3.6.- Utilizando los grficos y estadsticos obtenidos comparar ambos conjuntos de datos, teniendo en cuenta que el perodo reproductivo abarca primavera y verano. En cul de los dos meses son ms variables los niveles de testosterona? La siguiente es la salida generada por Excel, para los niveles de testosterona de Tupinambis sp en el mes de mayo. Para ello: a- Instalar el complemento de Herramientas para anlisis. En Herramientas > Complementos > Herramientas para Anlisis. Al abrir nuevamente el men Herramientas aparecer la opcin Anlisis de datos b- En Anlisis de datos > Estadstica Descriptiva c- Para generar la tabla de frecuencias e histogramas: En Anlisis de datos > Histograma La siguiente es la salida generada por Infostat. Para ello: a- Descargar la demo de www.infostat.com.ar b- En Estadsticas > Medidas Resumen c- Para generar la tabla de frecuencias: En Estadsticas > Tabla de frecuencias d- Para generar histogramas: En Grficos > Histograma Media 9,02 Error tpico 0,57 Mediana 8,4 Moda 13,20 Desviacin estndar 3,30 Varianza de la muestra 10,89 Curtosis -0,60 Coeficiente de asimetra -0,17 Rango 13 Mnimo 2,1 Mximo 15,1 Suma 297,8 Cuenta 33
Estadstica descriptiva Resumen testosterona n 33,00 Media 9,02 D.E. 3,30 Var(n-1) 10,86 CV 36,54 Mn 2,10 Mx 15,10 Mediana 8,40 Asimetra -0,17 Kurtosis -0,59 P(75) 12,10

Problema 4. En una investigacin publicada en una revista de la Asociacin Mdica Norteamericana del ao 1932 se incluy la siguiente tabla, que registra la cantidad de casos de carcinoma de cuello de tero clasificados por edad del paciente: Edad (aos) N de casos 22-30 18 30-35 45 35-40 79 40-55 225 55-60 63 60-70 45 70-90 13

4.1.- Definir la variable aleatoria, la unidad experimental y la poblacin. 4.2.- En qu intervalo de edades es mayor el porcentaje de casos? 4.3.- Construir el histograma de reas. 4.4.- En qu intervalo de edades es mayor el porcentaje de casos por ao de edad? Problema 5. En una experiencia con Drosophila melanogaster se extraen al azar 50 de estas moscas de una caja experimental. A cada una de las moscas se le determina el sexo, el genotipo (AA, Aa, aa) con respecto a un determinado carcter y se le mide la longitud del ala y del cuerpo. 5.1.- Identificar: unidad experimental, variables relevadas y su clasificacin. Qu tipo de grfico utilizara para representar a cada una? 5.2.- Supongamos que se han observado las siguientes frecuencias: Genotipo AA Aa aa Machos 6 11 5 Hembras 7 13 8 5.2.1.- Graficar los diagramas de barras para: i) los tres genotipos de machos; ii) los tres genotipos de hembras; iii) los tres genotipos sin discriminacin de sexo. 5.2.2.- Qu conclusiones pueden sacarse de la observacin de los grficos anteriores? 5.2.3.- Se puede concluir a partir de esta muestra que en la poblacin hay ms hembras que machos para cada uno de los genotipos? 5.2.4.- Se puede concluir a partir de esta muestra que en la poblacin lo ms abundante es hembras con genotipo Aa? Problema 6. Veinte hombres adultos sanos de entre 30 y 40 aos de edad participaron en un estudio en un centro asistencial para evaluar el efecto de cierto rgimen de salud, que incluye dieta y ejercicio, en el colesterol sanguneo. Se eligieron 10 en forma aleatoria para el grupo control mientras que los otros 10 fueron asignados al tratamiento durante un perodo de 6 meses. Los siguientes datos muestran la reduccin en el colesterol que experimentaron los 20 individuos en ese perodo (en dg/ml). Los valores positivos indican por lo tanto una disminucin en el colesterol al final del ensayo, mientras que los negativos indican un aumento del mismo.
Control Tratados 6 5 1 -2 4 7 5 5 3 6 2 6 0 5 5 4 5 -37 -1 7

1- Para ambos conjuntos de datos definir y clasificar la variable aleatoria, identificar la unidad experimental, muestra y poblacin. Se trata de un estudio experimental u observacional? 2- Explique por qu la diferencia entre las medias de ambos grupos sugiere una conclusin acerca del efecto del rgimen mientras que la diferencia entre las medianas sugiere otra. Problema 7. A un investigador le piden que calcule la tasa global de fecundidad promedio en ciudad de Buenos Aires y provincia de Buenos Aires. Basndose en la siguiente informacin obtuvo un valor de 2,15 hijos por mujer. Est de acuerdo con dicho valor? Justifique su respuesta.
Provincia Ciudad de Buenos Aires Buenos Aires Total de habitantes 2.776.138 13.827.203 Tasa global de fecundidad (hijos por mujer) 1.8 2.5

Fuente: INDEC, Censo Nacional de Poblacin, Hogares y Viviendas 2001.

Problema 8. En una empresa hay 600 empleados que cobran $2200; 400 que cobran $2600; 100 que perciben $3000 y los 5 gerentes que perciben $100.000 cada uno. Calcular la media, la mediana y la moda. Discutir qu estadstico estima mejor cunto cobran en general los empleados de la empresa. Problema 9. Un docente de Biometra tiene que corregir 20 exmenes. Como el primer ejercicio, a pesar de ser sencillo, demanda demasiadas cuentas, decide no hacerlo y estima el resultado verdadero a partir de los resultados de los 20 alumnos. Qu estadstico de tendencia central debera utilizar? Problema 10. Discutir la frase "La Estadstica ensea que si Pedro se come dos pollos y Juan ninguno, esto equivale a que se coman un pollo cada uno". (Sugerencia: calcular la desviacin estndar cuando uno come dos pollos y el otro ninguno y comparar con la situacin en la cual ambos comen un pollo). Problema 11. En una localidad del GBA, que carece de agua potable, se determin la cantidad de bacterias coliformes en muestras de 100 ml de agua extrada de pozos para uso domstico. Los resultados fueron: # de bacterias Cant.de pozos 0 12 1 38 2 28 3 16 4 13 5 11 6 9 7 7 8 5 9 1

11.1.- Defina la variable, clasifquela, determine cul es la unidad experimental y si se trata de una muestra o de una poblacin, justificando su respuesta. Complete la tabla de frecuencias y grafique. 11.2.- Se considera potable aquella agua que posea a lo sumo 3 bacterias coliformes/100 ml. Qu porcentaje de pozos en esta localidad no estarn aptos para el consumo humano? 11.3.- Cul es el promedio de coliformes en los pozos con agua potable? Y en los no potables? Cul es el promedio general? 11.4.- En que tipo de pozo (potable/no potable) la cantidad de bacterias/100 ml es ms homognea? 11.5.- Cul es la cantidad de bacterias/100 ml ms frecuente? 11.6.- Determine el tipo de asimetra de la distribucin. Problema 12. Como parte de un estudio para comparar la variabilidad del peso de semillas de cierta especie vegetal en un hbitat restringido con el de otra especie caracterizada por sobrevivir en un amplio rango de ambientes, se obtuvieron los siguientes datos: ver enunciado Hbitat restringido Media 60 g Varianza 9,06 g2 Tamao muestral 536 Son las dos muestras igualmente variables? Justifique. Hbitat variable 15 g 8,29 g2 342

Problema 13. Para la determinacin de DDT en muestras de zumo de fruta se realiz un experimento en colaboracin entre laboratorios. Para ello se envi una muestra estndar conteniendo 42 ppm a 5 laboratorios (A-E) Cada laboratorio efecto simultneamente seis determinaciones de la concentracin de DDT (en ppm). Comente la exactitud y precisin de cada una de estas series de resultados. A B C D E 42.5 39.8 43.5 35.0 42.2 41.6 43.6 42.8 43.0 41.6 42.1 42.1 43.8 37.1 42.0 41.9 40.1 43.1 40.5 41.8 41.1 43.9 42.7 36.8 42.6 42.2 41.9 43.3 42.2 39.0

Problema 14: Para las siguientes distribuciones de frecuencias: 1- Sin efectuar clculos, ordnelas en orden creciente segn su media, mediana, modo y desvo estndar. Clasifquelas segn su asimetra. 2- Repita el ejercicio anterior, pero calculando los estadsticos.
Serie A Serie B
7 7 6 5 4 f 3 2 1 0 1 2 3 4 5 x 6 7 8 9 7 6 5 4 f 3 2 1 0 1 2 3 4 5 x 6 7 8 9 6 5 4 f 3 2 1 0 1 2 3 4 5 x 6 7 8 9

Serie C

Serie D
7 6 5 4 f 3 2 1 0 1 2 3 4 5 x 6 7 8 9 7 6 5 4 f 3 2 1 0 1 2 3

Serie E

Serie F

7 6 5 4 f 3 2 1 0
4 5 x 6 7 8 9

5 x

TRABAJO PRCTICO N 2 PROBABILIDADES


Problema 1. Describir el conjunto de los resultados posibles (espacio muestral) de los siguientes experimentos aleatorios, asignando probabilidades a cada uno de sus elementos (espacio de probabilidades). 1.1.- De un estanque donde slo habitan truchas arco iris se extrae un pez al azar y se determina la especie a la que pertenece. 1.2.- Una jaula del Zoolgico contiene tres tordos, tres palomas y tres jilgueros. Se extrae un pjaro al azar de esa jaula y se determina la especie a la que pertenece. 1.3.- De la jaula anterior se escapa un tordo y se sustituye por un jilguero, a continuacin se extrae un pjaro al azar de esa jaula y se observa a qu especie corresponde. 1.4.- En una bolsa hay cuatro bolitas idnticas, numeradas de 1 a 4. Sea el juego que consiste en extraer una bolita al azar, anotar el nmero de la misma y devolverla a la bolsa; luego sacar una nueva bolita y anotar su nmero a continuacin del primero, obtenindose as un nmero de dos dgitos. 1.5.- El mismo juego que en (1.4.), pero la primera bolita no se devuelve a la bolsa. Problema 2. A partir de los experimentos citados en el problema 1: 2.1.- En el experimento 1.1, calcular la probabilidad de que el pez extrado sea una trucha arco iris. 2.2.- En el experimento 1.2, calcular la probabilidad de que al repetir la experiencia dos veces, devolviendo el pjaro capturado a la jaula, se obtengan: i) dos tordos; ii) dos pjaros de la misma especie; iii) un tordo y un jilguero. 2.3.- En el juego planteado en 1.4, calcular la probabilidad de que el nmero de dos dgitos que se forma sea: i) capica; ii) par; iii) impar 2.4.- Repetir (2.3) en el juego de (1.5), siempre que sea posible. Problema 3. En una jaula del Bioterio de la Ciudad Universitaria hay 25 ratas de dos especies: 10 de Rattus rattus y 15 de Rattus novegicus. Sea el experimento que consiste en extraer al azar dos ratas de dicha jaula. Suponiendo que los experimentos se realizan: (a) con reposicin; (b) sin reposicin pero en orden; (c) simultneamente (sin reposicin, sin importar el orden). 3.1.- Describir el espacio muestral (resultados posibles) Los resultados posibles son equiprobables? Asignar probabilidades a cada uno de los elementos del espacio muestral. 3.2.- Calcular, para cada tipo de extraccin, la probabilidad de que las dos ratas extradas sean de la misma especie. 3.3.- Calcular, para cada tipo de extraccin (cuando sea posible), la probabilidad de que la primera rata extrada sea R. rattus. Problema 4. En dos frascos (A y B) hay moscas Drosophila sp pertenecientes a dos cepas diferentes, mutantes y salvajes. En el frasco A el 30% de las moscas son mutantes y en el B lo son el 20%. Si se extrae una mosca de cada frasco, calcular la probabilidad de que sean: i) una mutante y una salvaje ; ii) ambas salvajes Problema 5. Los cuatro grupos sanguneos se reparten en una poblacin de la siguiente manera: 0 = 45%, A = 43%, B = 8%, AB = 4%. Suponga que se eligen dos personas al azar. Cul es la probabilidad de que: 1- las dos pertenezcan al grupo 0? 2- una sea del grupo A y la otra del B? 3- las dos pertenezcan al mismo grupo sanguneo? 4- Se necesitan dadores del grupo AB. Cul es la probabilidad de que ninguna de estas dos personas pueda ser donante? (suponer que no existe compatibilidad entre grupos)

10

Problema 6. En un laboratorio de comportamiento hay dos peceras conteniendo 5 y 10 ejemplares respectivamente de carpa dorada ( Carassius auratus). Aunque el investigador no lo sabe, un ejemplar de la primera pecera y tres de la segunda estn parasitados por el coppodo Ergasilus sp. El acuarista elige un ejemplar cualquiera para una experiencia. 6.1.- Cul es la probabilidad de que haya elegido uno de los parasitados? 6.2.- Si el ejemplar elegido fue uno de los parasitados por Ergasilus sp, cul es la probabilidad de que haya sido sacado de la primera pecera?

Problema 7. Un test de diagnstico tiene una probabilidad 0,9 de detectar la presencia de Escherichia coli, en caso de haberla (sensibilidad del test). Si no est presente, detecta su ausencia con una probabilidad de 0,8 ( especificidad del test). La probabilidad de que una muestra de agua contenga Escherichia coli es 0,20 (prevalencia) (las aclaraciones entre parntesis corresponden a la terminologa utilizada en Epidemiologa). 1- Cul es la probabilidad de que el test de un resultado positivo? 2- Cul ser la proporcin de resultados positivos en muestras de agua contaminadas con esta bacteria? 3- Cul es la proporcin de resultados negativos en muestras de agua pura? 4- Qu indican estas proporciones con respecto al total? Es correcto que sus valores sean altos? Por qu? 5- Suponiendo que el test dio un resultado positivo, cul es la probabilidad de que realmente la muestra de agua contenga E. coli? (Valor predictivo positivo del test) 6- Por otro lado, si el test da un resultado negativo,cul es la probabilidad de que realmente el agua est libre de bacterias? (Valor predictivo negativo del test) 7- Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria est ausente) 8- Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria s est presente) Problema 8. En una laguna, el 92% de las algas pertenece al fitoplancton (algas que flotan libremente), mientras que el 8% restante corresponde al perifiton (algas que crecen sobre plantas acuticas). Dentro de las algas fitoplanctnicas, el 56% son diatomeas. En el perifiton, las diatomeas componen el 40%. 8.1.- Habindose tomado una muestra al azar, asignar una probabilidad a cada uno de los resultados posibles. 8.2.- Calcular la probabilidad de que un alga elegida al azar sea una diatomea. 8.3.- Calcular la probabilidad de que un alga elegida al azar sea una diatomea o pertenezca al perifiton. 8.4.- De las diatomeas, qu porcentaje corresponde a perifiton? 8.5.- Qu proporcin de las algas son diatomeas fitoplanctnicas? Problema 9. Una determinada especie de gorgojo contrae una enfermedad virsica slo al salir del huevo. Esta enfermedad mata al 100% de los animales en la ltima muda, es decir cuando van a pasar al estado adulto. Se sabe que, en un granero, el 50% de los gorgojos son adultos y el 30% de las larvas estn enfermas. 9.1.- Construir la tabla de contingencia. 9.2.- Calcular el porcentaje de ejemplares enfermos. 9.3.- Son independientes las dos variables relevadas? Justificar. Problema 10. Un seor muy precavido que deseaba volar en avin a Nueva York pregunt a su amigo estadstico: "Cul es la chance de que haya una bomba en el avin?". Al contestrsele que esa probabilidad era de 1/ 1000 qued perplejo y sumamente ansioso. Entonces volvi a preguntar a su amigo: "Cul es la chance de que haya dos bombas en el avin?". El estadstico le contest

11

que esa probabilidad era de 1/ 1.000.000. "Ah, - dijo el seor - sabiendo esto llevar una bomba conmigo". Cul es la falacia del razonamiento del seor? Problema 11. Supongamos que el color de ojos est determinado por un nico gen. Sea B el alelo dominante (ojos marrones) y b el recesivo (ojos azules). Un individuo con genotipo BB tendr ojos marrones y un individuo con genotipo Bb tambin tendr ojos marrones. Slo tendrn ojos azules los individuos con genotipo bb. En un matrimonio entre heterocigotas, 11.1.- Indicar las probabilidades en la descendencia (F1) para cada uno de los genotipos posibles. 11.2.- Indicar las probabilidades en la descendencia (F1) para cada uno de los fenotipos posibles. 11.3.- Dado que el primer hijo tiene ojos marrones, calcular la probabilidad de que su genotipo sea BB. Problema 12. Muchas veces se realizan estudios para investigar la asociacin entre un factor, llamado de riesgo, y el desarrollo de una condicin especfica, por ejemplo, una enfermedad. Para ello se seleccionan dos muestras, una de sujetos que han estado expuestos al factor de riesgo ( R) y otra de sujetos que no lo estuvieron ( R ). Los sujetos de cada una de las muestras se clasifican segn hayan contrado una enfermedad (E) o no ( E ). Entonces el riesgo relativo se estima como: RR = P (E / R) / P (E / R ) y es una medida de impacto del factor de riesgo. Si el valor obtenido es 1 sugiere que el pretendido factor de riesgo no es tal. Cmo se interpretaran valores superiores a 1? Y los inferiores a 1? Encuesta de Factores de Riesgo: En la Argentina, al igual que en los pases ms desarrollados, las enfermedades no transmisibles (enfermedades cardiovasculares, cncer y lesiones) (ENT) ya han conquistado el primer lugar como causantes de dolencias y de muerte. Sin embargo, las ENT son prevenibles y se cuenta con evidencia consistente sobre la efectividad de intervenciones de promocin, prevencin y tratamiento, que justifican llevar a cabo acciones de poltica pblica. Para poder realizar estas intervenciones se necesita disponer de informacin relevante relacionada con las principales causas de las ENT. Los principales determinantes de las ENT son los llamados Factores de Riesgo, como el tabaco, el alcohol, la inactividad fsica, la presin arterial elevada, el colesterol elevado, la diabetes y la alimentacin no saludable. Es por ello que el Ministerio de Salud de la Nacin realiz en 2006 la primera Encuesta de Factores de Riesgo (disponible en http://www.msal.gov.ar/htm/Site/enfr/index.asp), que presenta la situacin de los principales determinantes del riesgo de enfermedades no transmisibles. La encuesta fue domiciliaria. Los resultados que se presentan corresponden la ciudad de Buenos Aires, en donde se encuestaron un total de 2000 habitantes de 18 aos y ms. Para ello se efectu un muestreo probabilstico de viviendas y de cada una se seleccion al azar un individuo, que complet el cuestionario. Algunos resultados fueron:
Tabla 1: Consumo de tabaco segn edad
Consumo de tabaco Edad 18 a 25 25 a 35 35 a 50 50 a 65 65 a 85 Fumador 37,3% 34,3% 34,0% 23,6% 8,1% Ex-fumador 5,9% 18,5% 23,9% 36,6% 30,7% Nunca fumador 56,8% 47,2% 42,1% 39,8% 61,2% Total 100% 100% 100% 100% 100% Total encuestados 14,9% 20,9% 23,4% 22,0% 18,8% 100,0%

Tabla 2. No fumadores expuestos al humo ambiental de tabaco


Lugar de exposicin al humo Hogar Trabajo Lugar de estudio Otros lugares 41,0% 50,4% 15,0% 23,0%

12

1- Identifique para los datos proporcionados de la Encuesta Nacional de Factores de Riesgo los siguientes tems: poblacin, muestra, individuo, variables estudiadas y su clasificacin. 2- Interprete el valor 34.3% de la Tabla 1. 3- Construya la tabla de doble entrada (en porcentajes) para consumo de tabaco x edad. Identifique en dicha tabla dos sucesos compatibles y dos incompatibles, justificando su eleccin. 4- Determine la proporcin de fumadores en la ciudad de Buenos Aires. 5- Es independiente el consumo de tabaco de la edad del individuo? Justifique exponiendo datos de la encuesta. 6- Reagrupe la informacin para construir una tabla de doble entrada con las categoras fumador---no fumador (incluyendo en esta categora a los exfumadores) y 18 a 25 aos-mayor de 25 aos. Constituye el primer rango de edad un factor de riesgo para el tabaquismo? Justifique. 7- Qu porcentaje de los individuos no fumadores estn expuestos a humo ambiental de tabaco en el hogar o en el lugar de estudio? Y qu porcentaje no est expuesto en el trabajo? Indique qu grafico utilizara para presentar los resultados de la Tabla 2. 8- Comente los resultados de la encuesta en la ciudad de Buenos Aires. Sobre qu grupos enfocara una eventual campaa contra el tabaquismo?

13

TRABAJO PRCTICO N3 DISTRIBUCIONES DISCRETAS Problema 1. Se estudia la presencia o ausencia de krill en el contenido estomacal de pinginos Adelia elegidos al azar. Para ello se toma una muestra aleatoria de 10 pinginos y se observan sus contenidos estomacales. Suponiendo que la probabilidad de presencia de krill en el estmago es 3/5, 1- Calcular la probabilidad de que en al menos tres de los estmagos se encuentre krill. 2- Calcular la probabilidad de que a lo sumo dos no contengan krill. 3- Identificar la variable aleatoria, su dominio o campo de variacin y los parmetros de su distribucin de probabilidades. 4- Calcular la cantidad esperada de estmagos con krill y su varianza. 5- Qu suposiciones acerca del fenmeno analizado est realizando para efectuar los clculos? Problema 2. Mediante la irradiacin del vulo o del espermatozoide pueden causarse mutaciones que conducen a abortos, defectos de nacimiento u otras deficiencias genticas. La probabilidad de que tales mutaciones se produzcan es de 1 en 10. Si se irradian 15 vulos, 1- cuntos esperara que presenten mutaciones? 2- Cul es la probabilidad de que solamente 2 presenten mutaciones? 3- Cul es la probabilidad de que a lo sumo dos presenten mutaciones? 4- Definir la variable en estudio y construir su distribucin de probabilidades. Graficar. Calcular su esperanza y varianza y determinar el tipo de asimetra. Problema 3. Se planea construir una planta nuclear y se quiere conocer la opinin de la poblacin al respecto. Se piensa que el 30% de los habitantes de la localidad estarn a favor del proyecto. Se selecciona una muestra aleatoria de 20 individuos y se realiza un sondeo. Si la suposicin es cierta, 3.1.- cuntos deberan expresar una opinin favorable? 3.2.- Calcular la probabilidad de que a lo sumo 4 sean de opinin favorable. 3.3.- Calcular la probabilidad de que 18 o ms estn en contra. Problema 4. Se realiz un muestreo en un rea en el NE de la provincia de Formosa, y encontraron un promedio de 300 hormigueros de "hormiga colorada" por hectrea. Si se supone que los hormigueros se disponen al azar en el rea muestreada: 4.1.- Calcular la probabilidad de que en una subrea cualquiera de 25 m 2 elegida al azar en el rea muestreada: a.- no se encuentren hormigueros b.- se encuentre al menos un hormiguero. c.- se encuentren a lo sumo dos hormigueros. 4.2.- Calcular la probabilidad de que en una subrea cualquiera de 150 m2, elegida al azar: a.- no se encuentren hormigueros b.- se encuentren al menos cinco hormigueros. c.- se encuentren a lo sumo cuatro hormigueros. 4.3.- Por qu se necesitaba la suposicin de disposicin al azar de los hormigueros en el rea de muestreo? 4.4.- Definir la unidad experimental, la variable aleatoria e indicar el rango de valores que puede tomar. Construir su distribucin de probabilidades. Graficar. Calcular su esperanza y varianza y determinar el tipo de asimetra. Problema 5. Un espectrofotmetro produce, en promedio, un error en la determinacin cada 100 horas de trabajo. 5.1.- Cul es la probabilidad de que en el prximo mes (8 hs diarias, 5 das hbiles/semana, 4 semanas) el aparato no cometa un error?

14

5.2.- Si en los prximos 3 meses de trabajo el aparato comete errores en ms de 5 determinaciones, ser reemplazado por otro modelo. Cul es la probabilidad de que esto ocurra? Problema 6. Para un trabajo de epidemiologa del dengue se necesitan larvas del mosquito Aedes aegipty, que se sabe se disponen al azar en cierto cuerpo de agua, a razn de 1.9 larvas por cada 2 ml de agua, en promedio. 6.1.- Si se extrae una muestra de 2 ml de agua, cul es la probabilidad de que contenga exactamente 2 larvas? 6.2.- En una muestra de 4 ml, cul es la probabilidad de encontrar exactamente 4 larvas? 6.3.- En una muestra de 3 ml, cul es la probabilidad de encontrar a lo sumo 4 larvas? 6.4.- Defina la variable en estudio y determine su esperanza y varianza. Problema 7. Doscientos alumnos de Biologa van a la Reserva de Costanera Sur a realizar un muestreo de vegetacin para un trabajo prctico. En ese lugar crece una ortiga que produce comezn en el 2% de los casos. La comezn es tan fuerte que el atacado debe recibir una dosis de antihistamnico inyectable a la brevedad. Todos los alumnos se encuentran entre las ortigas. 7.1.- Calcular la probabilidad de que deban ser inyectados: i) al menos ocho alumnos; ii) exactamente dos alumnos; iii) ms de cuatro alumnos. 7.2.- Ese da slo se llevaron a la Reserva doce dosis de antihistamnico. Cul ser la probabilidad de tener que declarar emergencia y correr al hospital ms cercano a buscar otras dosis? Problema 8. En un embalse conviven 50 castores, de los cuales 15 son capturados, marcados y reintegrados a su medio. 8.1.- Calcular la probabilidad de que en una segunda captura haya que capturar 6 antes de encontrar uno marcado, suponiendo que cada ejemplar, una vez observado, es devuelto a la poblacin. 8.2.- Suponiendo que en una segunda captura se obtienen 8 ejemplares, cul es la probabilidad de que tres de ellos estn marcados? 8.3.- En los puntos (8.1) y (8.2) debe suponerse que todos los castores tienen la misma probabilidad de ser capturados. Por qu? 8.4.- Mtodo de captura y recaptura: Este mtodo se utiliza para estimar el tamao de una poblacin. Se toma una primera muestra de la poblacin, se marcan de alguna forma los individuos, se sueltan y al tiempo se toma una segunda muestra en la que se registra la cantidad de marcados y sin marcar. Suponiendo que no se conoce la cantidad de castores en el embalse, como se estimara el tamao de la poblacin? Problema 9: Las especificaciones microbiolgicas del Cdigo Alimentario Argentino establecen para la aceptacin de una partida de queso fresco, la toma de 5 muestras, que deben resultar negativas para Salmonella. Si una partida de 30 piezas de queso fresco contiene 2 contaminadas con Salmonella, calcular la probabilidad de que dicha partida sea aceptada. Problema 10. Un seor, vuelve una noche a su casa en estado de ebriedad y pretende abrir la puerta probando en cualquier orden, las 10 llaves de su llavero. 10.1.- Qu probabilidad tiene de abrir en el sptimo intento? 10.2.- Qu probabilidad tiene de quedarse afuera? Generalizar y especular. 10.3.- Calcular la probabilidad de (10.1) para un da en que el mencionado seor est sobrio pero a oscuras. Problema 11. En los siguientes ejemplos se definen variables aleatorias. Indicar para cada una de ellas cul podra ser su distribucin en probabilidades, su dominio, cules son los parmetros correspondientes (en trminos del problema) y cul es la unidad experimental o de muestreo (segn corresponda), el alcance y la poblacin estadstica. Especificar, cuando sea necesario, condiciones para la validez de la respuesta.

15

11.1.- Se lleva a cabo un experimento para probar la eficacia de una dosis letal de morfina en ratones. Se supone que esta dosis tiene una efectividad del 80 %. La experiencia consiste en inyectar la dosis a un lote de 10 ratones. Sea X: cantidad de ratones muertos al cabo de dos das. 11.2.- Una pareja se ha propuesto tener una hija. Decide continuar teniendo hijos hasta que nazca una mujer, momento en el que ya no tendrn ms descendencia. X es la cantidad de hijos nacidos antes del nacimiento de la primera hija. 11.3.- En el estudio de los hbitos migratorios del ganso canadiense se ha anillado aproximadamente el 5% de la poblacin total de aves. En un da determinado se capturan 8 gansos. X es la cantidad de gansos anillados. 11.4.- Suponer que en 11.3 el tamao de la poblacin de gansos canadienses es de 120 y resolver en esta situacin. 11.5.- Se quiere estimar la cantidad de gorgojos machos en 5 gramos de muestra de harina leudante. 11.6.- En una secuencia de ARN, UGG codifica el triptofano y UGA codifica una seal de parada. En un determinado segmento de ARN aparece cinco veces la palabra UGA. Supngase que los nucletidos U y G no sufrieron mutacin, pero que el nucletido A (adenina) mutara a G (guanina) el 1 % de las veces. X es la cantidad de mutaciones de la secuencia en que la seal de parada (UGA) se muta a triptofano (UGG). 11.7.- Se estima que slo uno de cada 50 loros capturados en la cuenca del Amazonas, para su utilizacin como animales domsticos sobrevive al cambio. X es la cantidad de loros que sobreviven en una captura de 200 animales. 11.8.- Hay un torneo infantil de pesca de mojarrita en la laguna Truchimus. Cada nio debe pescar 6 ejemplares. Sea X: cantidad de mojarritas con peso entre 10,5 y 15,5 gramos. 11.9.- Un mdico de un hospital del conurbano est interesado en estimar la cantidad media diaria de pacientes que ingresan por intoxicacin con alcohol (etlico) a la Guardia. Y: cantidad de intoxicados / da.

Uso de software para clculo de probabilidades Excel: En Insertar > Funciones > Estadsticas DISTR.BINOM POISSON DISTR.HIPERGEOM Infostat: En Estadsticas > Probabilidades y cuantiles Binomial (n,p) Poisson (lambda) Hipergeomtrica (m,k,n)

16

TRABAJO PRCTICO N 4 DISTRIBUCIONES CONTINUAS Problema 1. Un criador de ranas toro afirma que al llegar al ao de vida, el peso promedio de stas es de 160 g. Si el peso de las ranas toro al ao de vida se distribuye normalmente con un desvo de 11 g, 1.1.- Qu porcentaje de ranas de un ao pesa menos de 150 gramos? 1.2- Qu porcentaje de ranas pesa ms de 200 gramos? 1.3.- Qu porcentaje de ranas pesa exactamente 180 gramos al ao? 1.4.- Del 10% de las ranas toro de un ao de vida con mayor peso, cul es el peso mnimo? 1.5- Calcule el percentil 25 e interprete el resultado. 1.6.- En un lote de 200 ranas toro de un ao, cuntas esperara que pesen entre 150 y 170 g? 1.7- Calcular la probabilidad de que en un lote de 10 ranas solo una pese menos de 150 g. Indicar con que variable aleatoria se est trabajando y cul es su distribucin de probabilidades. Problema 2. Un tambero est al borde de la quiebra, y todas sus esperanzas estn puestas en la produccin del prximo mes. Los alumnos de Biometra quieren ayudarlo, y estudian la distribucin de la produccin mensual de las vacas del tambo utilizando datos anteriores del propio tambero. Llegan a la conclusin que el tambo de este seor produce en promedio 3000 litros de leche por mes, con una desviacin estndar de 300 litros. 2.1.- El tambero se salvara de la quiebra si su tambo produjera ms de 3250 litros de leche en el prximo mes. Cul es la probabilidad de que esto ocurra? 2.2.- El tambero est tan desesperado que se suicidar si su tambo produjera menos de 2400 litros de leche en el prximo mes. Cul es la probabilidad de que quiebre sin que tengamos que lamentar su muerte? 2.3.- En cuntos de 10 meses elegidos al azar, es de esperar que el tambero est en la situacin de 2.1? Indicar con que variable aleatoria se est trabajando y cul es su distribucin en probabilidades. Problema 3. Los errores aleatorios que se cometen en las pesadas de una balanza siguen una distribucin normal con media 0 dg y desvo estndar 1.5 dg. 3.1.- Calcular la pb de que el error cometido en una pesada sea a lo sumo de 1.5 dg. 3.2.- Calcular la pb de que el error subestime como mximo en 1 dg al verdadero valor. 3.3.- Calcular la pb de que el error cometido sea de ms de 2 dg (en ambos sentidos). 3.4.- Calcular el error mximo (en mdulo) en una pesada con una probabilidad de 0.95. Problema 4. Para un estudio de comportamiento se necesita comprar cobayos que no pesen ms de 300 g. Un nuevo criadero desea participar en el mercado; sabe que el peso medio de los animales que ellos cran es de 280 gramos con una desviacin estndar de 16 gramos. 1- Qu proporcin de sus ejemplares no llenarn las especificaciones? 2- El veterinario a cargo del criadero sabe que mediante una dieta adecuada es posible reducir la varianza manteniendo una media de 280 g. Adems, desea que slo el 2 % de los cobayos sea rechazado. Qu valor debe tomar la desviacin estndar? Problema 5. Se supone que la glucemia basal en individuos sanos sigue una distribucin normal con una media de 80mg% y un desvo estndar de 10mg%, mientras que en los diabticos tambin sigue una distribucin normal siendo su media de 160mg% y su desvo estndar de 31mg%. 1- Si se conviene en clasificar como sanos al 2% de los diabticos: Por debajo de qu valor se considera sano a un individuo? Cuntos sanos sern clasificados como diabticos? 2- Se sabe que en la poblacin en general el 10% de los individuos es diabtico. Cul es la probabilidad de que un individuo elegido al azar y diagnosticado como diabtico, realmente lo sea?

17

Problema 6. Para un determinado estudio etolgico se necesitan cangrejos que posean pinzas de ms de 5 cm de longitud. Por estudios realizados con anterioridad, se sabe que el 35 % de la poblacin posee esa caracterstica. Si se toma una muestra aleatoria de 50 cangrejos en el cangrejal de Samborombn, cul ser la probabilidad de obtener: 6.1.- exactamente 10 ejemplares como los deseados 6.2.- al menos 18 ejemplares como los deseados. Problema 7. Al someterse a un tratamiento con antibiticos cajas de Petri en las que se han sembrado bacterias, resulta que la cantidad de colonias resistentes se distribuye al azar con una frecuencia promedio de 15 por caja. 7.1.- Calcular la probabilidad de que la cantidad de colonias resistentes en una caja tratada elegida al azar se encuentre entre 10 y 16 inclusive. 7.2.- Para una cierta experiencia con antibiticos se necesitan cajas con por lo menos 13 colonias resistentes. Cuntas cajas debern prepararse para esperar 20 cajas tiles?

Uso de software para clculo de probabilidades Excel: En Insertar > Funciones > Estadsticas DISTR.NORM (para clculo de probabilidades en una distribucin normal) DISTR.NORM.INV (para clculo de percentiles en una distribucin normal) DISTR.NORM.ESTAND (para clculo de probabilidades en una distribucin normal estndar) DISTR.NORM.ESTAND.INV (para clculo de percentiles en una distribucin normal estndar) Infostat: En Estadsticas > Probabilidades y cuantiles Normal (media, varianza) (para clculo de probabilidades y percentiles en una distribucin normal)

18

TRABAJO PRCTICO N 5 DISTRIBUCIN MUESTRAL. ESTIMACIN Problema 1. Sea una poblacin P formada por fichas marcadas con los nmeros 2, 4, 6 y 8 en proporciones iguales. 1.1.- Calcular la media , la varianza 2, el extremo inferior xmin y la amplitud w para la poblacin. 1.2.- Construir una tabla con todas las muestras que puedan formarse extrayendo y reponiendo sucesivamente y en cualquier orden dos fichas de la poblacin. 1.3.- Sea la variable aleatoria T2 = f (muestra de tamao 2). Indicar la unidad experimental, la muestra y el alcance de las observaciones 1.4.- Para cada una de las muestras de tamao dos, calcular la media muestral x 2, el extremo inferior xmim, la amplitud muestral w y la varianza s2. 1.5.- Hallar la distribucin en el muestreo del x 2 y representarla mediante un diagrama de barras. Calcular el valor medio E( x 2) y la varianza Var( x 2) de esta distribucin . 1.6.- Trabajar como en (1.3) con los estadsticos xmin, w y s2. Hay diferencias entre sus distribuciones en el muestreo y la de xmedia? 1.7.- Comparar el valor medio y la varianza obtenidos en (1.3) con el valor medio = 5 y la varianza 2 = 5 de la poblacin (que fueron obtenidos en 1.1). Problema 2. Teorema Central del lmite. Simulacin. Suponga que de cierto fsil existen solamente 100 ejemplares en todo el mundo. Interesa conocer la edad promedio de los mismos y esto es posible mediante datacin por C 14. Supongamos que los verdaderos valores de antigedad de los 100 fsiles (que Ud. desconoce) son los siguientes (en miles de aos):
Fsil Edad Fsil Edad Fsil Edad Fsil Edad Fsil Edad Fsil Edad Fsil Edad

1 103.7 2 3 4 5 6 7 8 77.7 88.8 86.7 71.8 87.7 65.8 88.1

9 109.3 10 68.7 11 87.0 12 81.0 13 103.0 14 103.5 15 101.0

1 99.8 6 1 95.2 7 1 98.7 8 1 91.3 9 2 108.4 0 2 94.2 1 2 89.7 2 2 99.6 3 2 84.6 4 2 101.5 5 2 78.4 6 2 96.6 7 2 105.3 8 2 98.3 9 3 79.9 0

3 1 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 4 0 4 1 4 2 4 3 4 4 4 5

91.2 89.8 104.9 98.7 95.8 108.0 93.6 89.2 62.1 88.2 76.0 95.4 107.9 107.7 82.1

4 6 4 7 4 8 4 9 5 0 5 1 5 2 5 3 5 4 5 5 5 6 5 7 5 8 5 9 6 0

80.4 88.5 93.7 95.8 88.8 113.7 72.2 107.4 102.6 99.7 53.9 79.3 113.8 108.6 103.7

6 1 6 2 6 3 6 4 6 5 6 6 6 7 6 8 6 9 7 0 7 1 7 2 7 3 7 4 7 5

109.6 87.9 91.7 78.4 95.2 89.5 82.9 102.7 114.2 72.1 104.4 95.6 87.9 93.0 88.5

7 74.5 6 7 98.4 7 7 50.0 8 7 85.6 9 8 88.5 0 8 98.8 1 8 52.7 2 8 91.7 3 8 85.3 4 8 76.7 5 8 108.6 6 8 87.7 7 8 88.2 8 8 71.7 9 9 65.7 0

91

70.6

92 104.0 93 116.3 94 95 96 97 98 99 88.6 83.3 88.6 80.0 71.0 95.7

10 108.3 0

19

El promedio de estos datos es 90,621 con un desvo estndar de 13,9421 miles de aos. 2.1.- Supongamos que Ud dispone de recursos para datar solamente 5 fsiles. Extraiga una muestra al azar de 5 de ellos (puede utilizar la tecla #RAN de la calculadora) y calcule el promedio y el desvo estndar para la antigedad. El promedio obtenido en base a los 100 datos es un .........................., habitualmente es desconocido y toma ................ valor/es, por lo tanto se comporta como una...................................; en este caso vale ...................... El promedio obtenido en base a los 10 datos es un ........................, habitualmente es con la nica informacin con que se cuenta y toma ................. valores, por lo tanto se comporta como una ........................................................; en este caso vale ....................... La diferencia entre el promedio poblacional y el promedio muestral se conoce como error muestral. En este caso vale: ...................... 2.2.- Repita el procedimiento anterior pero extrayendo una muestra de 15 fsiles (no descarte los datos anteriores, solo agregue 10 datos ms). 2.3.- Si el promedio muestral es una variable aleatoria, podemos deducir qu distribucin de probabilidades tendr y cul ser su promedio y su variabilidad? Para ello analice la informacin obtenida por todo el curso y complete los siguientes grficos:

Distribucin de x
35 30

Frecuencia

25 20 15 10 5 0
50 60 70 80 90 10 0 11 0 12 0

x = Edad del fsil

Distribucin de x , n= 5
35 30

Frecuencia

25 20 15 10 35 5 30 0 25 20 15 10 5 0

Distribucin de x , n= 15

Frecuencia

50 50

x = Edad promedio de 5 fsiles

x = Edad promedio de 15 fsiles

60 60

70 70

80 80

90 90

10 0 0 10

11 0 0 11

20

12 0 0 12

NOTA: La extraccin de la muestra debera ser con reposicin para mantener la aleatoriedad de la misma. Sin embargo, en general las muestras se extraen sin reposicin. Esto es porque cuando el tamao muestral es inferior al 5% del tamao de la poblacin, el efecto por la falta de reposicin es mnimo y puede obviarse. Es decir que en poblaciones grandes con muestras pequeas no sera necesario reponer los elementos muestreados. De hecho no se reponen las unidades experimentales en trabajos biolgicos, por ejemplo de campo. Problema 3. El dimetro medido a la altura del pecho de una poblacin fueguina de lengas sigue una distribucin normal con media de 1 m y desviacin estndar de 0,40 m. Un rodal (conjunto de rboles) se considera maderable (apto para la fabricacin de listones) si el promedio de los dimetros de los ejemplares es superior a 0,95 m. 3.1.- Calcular la probabilidad de que un rodal de 100 lengas elegido al azar sea maderable. 3.2.- Qu tamao mnimo (nmero de lengas) deber tener un rodal para ser maderable, con una probabilidad del 85 %? Problema 4. Despus de su fabricacin y envasado, las latas de tomate de una conocida marca tienen una duracin que se distribuye en forma aproximadamente normal con media 180 das y desviacin estndar 40 das. Un grupo de investigacin tiene que salir de campaa y se preguntan cuntas latas tendrn que llevar para que, con una probabilidad del 95 %, la duracin promedio no sea inferior a los 170 das. Podemos ayudarlos a decidir? Problema 5. El contenido de riboflavina (vitamina B12) en la yerba mate, sigue una distribucin normal con media de 4.4mg/100g de yerba mate y desvo estndar de 1.31mg/100g. Calcular: 5.1.- la probabilidad de que una muestra al azar de 16 mediciones contenga en promedio entre 3.8 y 4.2mg de riboflavina /100g de yerba mate. 5.2.- la probabilidad de que una muestra de 20 mediciones contenga en promedio ms de 4.7mg de riboflavina /100g de yerba mate. 5.3.- el contenido promedio de riboflavina mnimo del 10% de las muestras ms nutritivas (n=20). Problema 6. Cierta marca de jugos comercializa jugo de anan con una acidez media (medida como g de cido ctrico/100 ml de jugo) de 0.41 g /100 ml, con un desvo estndar de 0.21 g/100 ml, pero se desconoce su ley de distribucin. Un control rutinario sobre el proceso productivo arroja, sobre un total de 30 determinaciones realizadas, un promedio de 0,5 g de cido ctrico/100 ml de jugo. Calcule la probabilidad de obtener como mnimo dicho valor. Aconsejara detener el proceso productivo? Problema 7. Un bilogo selecciona una muestra aleatoria de 50 ejemplares de Celtis tala de un bosque en Magdalena y les mide el dimetro a la altura del pecho (DAP), obteniendo un valor promedio de 21 cm. El bilogo afirma que ese ser el DAP promedio de todos los talas de dicho bosque, ya que el promedio muestral es un estimador insesgado de la media de la poblacin. Est de acuerdo con dicha afirmacin? Justifique su respuesta.

21

PRACTICO N 6 INTERVALOS DE CONFIANZA Problema 1. Para realizar un estudio de explotacin del erizo de mar se determin el volumen gonadal de 25 ejemplares elegidos al azar y obtuvo un volumen promedio de 160 ml. Supongamos que la variable volumen gonadal se distribuye en forma aproximadamente normal con desviacin estndar 40 ml. 1.1.- Estimar el volumen gonadal medio de la poblacin con una confianza del 95 %. 1.2.- Cuntos ejemplares de erizo de mar deber muestrear el investigador para estimar el volumen gonadal medio 14 ml con una probabilidad del 95 %? 1.3.- Resolver los tems anteriores suponiendo que la varianza poblacional no es conocida y que de la muestra de 25 ejemplares se obtiene un desvo estndar de 41.38 ml. Problema 2. Usando la muestra de 15 fsiles de la simulacin del TP anterior (problema 2), construya el IC90 para la media de la edad de todos los fsiles. Compare con los resultados de todo el curso y deduzca el significado del nivel de confianza. Problema 3. Se lleva a cabo un estudio a fin de determinar la concentracin de propionatos, utilizados como conservantes, en cierta marca de pan lactal. Con tal fin se seleccionaron al azar 70 lotes de pan lactal de dicha marca, se obtuvo una muestra representativa de cada lote y se determin el contenido de propionatos (en gramos de propionatos/100 g de pan lactal). Los resultados fueron: Propionatos (mg/100g) 0.10-0.15 0.15-0.20 0.20-0.25 0.25-0.30 0.30-0.35 0.35-0.40 0.40-.0.45 Cantidad de lotes 2 5 10 16 23 11 3

1- Estime puntualmente el promedio y el desvo estndar del contenido de propionatos de este pan lactal. 2- Estime el promedio del contenido de propionatos de este pan lactal con una confianza del 90%. 3- dem anterior, pero con una confianza del 99%. Compare con el intervalo anterior y extraiga conclusiones. 4- Cuntos lotes ms debern muestrearse si se desea disminuir el error muestral de la estimacin anterior en un 14%? 5- Indique los supuestos necesarios para la validez de la estimacin. Problema 4. Utilizando algn paquete estadstico o una planilla de clculo junto con las frmulas del error estndar para algunos estadsticos que se encuentran en la gua de tablas: 4.1- Calcular los intervalos de confianza para la media y la varianza para los datos de niveles testosterona en plasma de los lagartos muestreados en mayo (problema 3 de la prctica 1).

22

La siguiente es la salida generada por Excel, para los niveles de testosterona de Tupinambis sp en el mes de mayo. Para ello en Anlisis de datos > Estadstica Descriptiva > Nivel de confianza para la media (so calcula el error muestral) La siguiente es la salida generada por Infostat. Para ello en Estadsticas > Inferencia basada en una muestra > Intervalos de confianza

Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Cuenta Nivel de confianza (95,0%) Intervalos de confianza Bilateral Estimacin paramtrica

9,02 0,57 8,40 13,20 3,30 10,86 -0,59 -0,17 13 2,1 15,1 33 1,169

Variable Parmetro Estimacin testosterona Media 9,02

E.E. 0,57

n 33

LI(95%) LS(95%) 7,85 10,19

4.2.- Estudiar el supuesto de normalidad mediante la construccin de un intervalo de confianza para los coeficientes de asimetra y curtosis. Nota: Si una variable sigue una distribucin normal los coeficientes de asimetra (1) y curtosis (2) estimados por g1 y g2 respectivamente deben ser nulos. Si los intervalos incluyen el valor cero no se rechaza la hiptesis de que la distribucin de la variable es simtrica. Y la curva es una campana. Este resultado se podra utilizar para suponer que la distribucin de la variable no se aparta de la normalidad. En base a los datos del mes de mayo se obtiene: Estadstico Lmite inferior Lmite superior Coef. de asimetra (g1) -0.9759 0.6262 Coef. de curtosis (g2) -2.1588 0.9716 Conclusin: con un 95 % de confianza se puede suponer que el nivel de testosterona en lagartos durante el mes de octubre no se aparta de la normalidad. 4.3.- Repetir para los datos de los lagartos del mes de octubre. Problema 5. Para estudiar la proporcin de plantas de Dentaria sp, se siembran en un vivero 300 semillas de Dentaria sp; todas las plantas emergen y al cabo de un tiempo se observa que 69 plantas estn florecidas y las restantes no lo estn. 5.1.- Estimar mediante un intervalo de confianza del 95% la proporcin de Dentaria sp. que florecen. 5.2.- Qu supuestos deben cumplirse para la validez de la estimacin anterior? 5.3.- Calcular la cantidad mnima de plantas de Dentaria que se debera sembrar para estimar la proporcin de plantas con flor en 0,04 con una probabilidad del 95%. Problema 6: La toxoplasmosis se adquiere principalmente por contacto con heces de gatos y, en menor medida, por la ingestin de carne mal cocida o productos lcteos conteniendo Toxoplasma gondii. La gran mayora de las toxoplasmosis adquiridas son asintomticas; slo una fraccin menor de los individuos infectados desarrolla sntomas. Un estudio epidemiolgico llevado a cabo en 755 adultos aparentemente sanos revel que 203 de ellos presentaban evidencia serolgica de infeccin con T. gondii.

23

6.1.- Estime la proporcin de adultos infectados con T. gondii pero sin manifestaciones clnicas de toxoplasmosis con un 95% de confianza. 6.2.- Cuntos individuos debern analizarse si se quiere disminuir el error de la estimacin anterior en un 50%? Problema 7. Se desea estimar la prevalencia de la hipertensin arterial en el embarazo. Determine la cantidad de embarazadas que se deberan observar para, con una confianza del 95%, estimar dicha prevalencia con un error muestral del 2% en los siguientes casos: 7.1- Sabiendo que un sondeo previo se ha observado un 9% de hipertensas. 7.2.- Sin ninguna informacin previa. Problema 8. Para estimar la relacin entre la edad de ejemplares de R. rattus y el contenido de nitrgeno en su plasma sanguneo, se tomaron grupos de animales en condiciones similares pero de distinta edad, y se les determin el contenido de nitrgeno en g/cm 3. Para un grupo de 9 ratas de 37 das de vida se obtuvo una media de 0,9 y una varianza de 0,004, mientras que para otro grupo de 8 ratas de 180 das de vida se obtuvo una media de 1,18 con una varianza de 0,006 (g/cm3)2. 8.1.- Estimar la diferencia promedio entre los contenidos de nitrgeno de ambos grupos con una confianza del 90%, 8.2.- Cul sera la respuesta a (7.1) si las varianzas poblacionales fueran: 37 das = 0,003 180 das = 0,005? 8.3.- Indicar las suposiciones para la validez de las estimaciones realizadas. Problema 9. Supongamos que en otro vivero se realiza la misma experiencia que la propuesta en el problema 5 pero se siembran 1000 plantas, de las cuales florecen slo 200. Estimar la diferencia entre las proporciones de Dentaria sp. florecida en ambas reas con una confianza del 95%. Indicar las suposiciones para la validez de la estimacin realizada. Problema 10. Holopterus chilensis es un coleptero barrenador que infesta a Nothofagus obliqua (roble pelln). Se extrajo una muestra aleatoria de 30 ejemplares en el lago Lacar, con la que se estim la longitud corporal promedio, obtenindose IC95: 40-45 mm. Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta: 1. El 95% de los ejemplares mide entre 40 y 45 mm. 2. La longitud corporal promedio de los ejemplares del lago Lacar se encuentra entre 40 y 45 mm. 3. El promedio de la especie se encuentra entre 40 y 45 mm. 4. El 95% de las muestras de 30 ejemplares tienen un promedio entre 40 y 45 mm. 5. Si se aumenta la confianza el intervalo de confianza se achica (es ms preciso) 6. Si se quiere achicar el intervalo de confianza se debera aumentar el tamao de la muestra

24

TRABAJO PRCTICO N 7 PRUEBA DE HIPTESIS Problema 1. Las orugas de cierta especie de mariposa acumulan glucsidos que las hacen repugnantes a los pjaros, por lo cual stos tienden a evitarlas despus de un primer encuentro. En la zona de Punta Indio, provincia de Bs. As., se recolectaron 64 de tales orugas y se les determin la concentracin de glucsidos en relacin a sus pesos, resultando un valor medio de 0,18 g glucsido / kg gusano. Estudios anteriores aseguran que la poblacin en estudio sigue una distribucin aproximadamente normal con media de 0,19 g glucsido / kg gusano y varianza 0,0036 g Glucsido / kg gusano. 1.1.- Poner a prueba la hiptesis de que en este campo la concentracin media de glucsidos en las orugas es menor que la media previamente estimada. Calcular el valor p de la prueba. 1.2.- Indicar en qu consisten el error de tipo I y el de tipo II en trminos del problema. 1.3.- Calcular la potencia de la prueba para la H a: = 0,17, suponiendo que la varianza no se modifica. 1.4.- Indicar cul es la poblacin de la que se habla y las suposiciones sobre esta poblacin para la validez de las estimaciones realizadas. 1.5.- Si la concentracin de glucsidos de las mariposas de Punta Indio fuera de 0.18 g glucsido / kg gusano, estimar la cantidad de orugas que habra que examinar para detectar la disminucin con una probabilidad del 90%. Problema 2. Las jarillas son arbustos del gnero Larrea caractersticos de la provincia fitogeogrfica del monte. La resina que producen estas plantas posee alcaloides, que funcionan como insecticidas naturales contra los insectos desfoliadores. Se ha determinado que la concentracin media de alcaloides en Larrea divaricata es de 1,2mg/ml de resina con una varianza de 0,4 (mg/ml)2. En los llanos de La Rioja se ha encontrado una poblacin de la misma especie con plantas muy poco desarrolladas y con las hojas muy atacadas. Los cientficos proponen las dos hiptesis siguientes como las nicas posibles: i) Las plantas de ese lugar producen menos alcaloides. ii) En esa zona existe una poblacin endmica de insectos que ha desarrollado resistencia al nivel normal de alcaloides producido por la planta. 2.1.- Ayude a esta gente, que poco sabe de estadstica, a dilucidar cul de las dos hiptesis es la ms potable, sabiendo que de una muestra de 12 plantas de esa zona se obtuvo una concentracin media de alcaloides de 1,0mg/ml. Grafique la distribucin de probabilidades del estimador y calcule el valor p de la prueba. Concluya utilizando un nivel de significacin del 5%. 2.2.- En funcin de la decisin tomada en el punto anterior, qu error podra estar cometiendo? 2.3.- Indique las suposiciones para la validez de la prueba. 2.4.- Si la concentracin media real de alcaloides de los arbustos de esa poblacin fuese de 0.9 mg/ml, cul sera la potencia de la prueba? Exprsela en trminos del problema. Problema 3. Los murcilagos al volar localizan un objeto slido emitiendo chillidos agudos y escuchando el eco. Se piensa que el alcance medio mximo para este sistema de localizacin por eco es de ms de 6 metros. Para confirmar la hiptesis se seleccion una muestra aleatoria de 16 murcilagos. Cada ejemplar fue soltado en un rea grande y cercada, que contena solo un obstculo y se anot la distancia entre el obstculo y el murcilago al momento del viraje. El experimento fue repetido varias veces con cada animal, y para cada uno de ellos se determin la distancia media del viraje, con los siguientes resultados: 6,2 6,8 6,1 5,7 6,1 6,3 5,8 6,3 5,9 6,3 6,4 6,0 6,3 6,2 5,9 6,1 3.1.- Qu conclusin puede extraerse de los datos? Qu tipo de error se puede estar cometiendo? 3.2.- Estime con una confianza del 95% la distancia media de viraje de los murcilagos. Problema 4. En un trabajo de parasitologa se desea comprobar si la proporcin de palomas infestadas por un parsito intestinal en la Ciudad de Buenos Aires es mayor al 70 %, en cuyo caso

25

habra que desinfestarlas. Para ello se toma una muestra aleatoria de 200 palomas y se encuentra que 145 estn parasitadas. 4.1.- Aconsejara, en base a estos datos, desinfestar la poblacin de palomas de la ciudad de Bs. As.? Grafique la distribucin de probabilidades y calcule el p-valor. 4.2.- En qu consisten el error de tipo I y de tipo II en este ejemplo? Cul es ms peligroso? 4.3.- Indicar las suposiciones para la validez de la prueba realizada. Problema 5. La Unidad de Plantas Aromticas del INTA Castelar lleva a cabo un estudio a fin de comparar dos especies de menta: Mentha piperita y M. arvensis. De las reas sembradas con cada una de las dos especies, se eligen al azar 15 parcelas en cada una, se cosechan en su totalidad, y se determina por cromatografa gaseosa el rendimiento porcentual en esencia sobre el material hmedo. M. piperita mostr un rendimiento promedio del 0.21mg con un desvo del 0.08mg, mientras que para M. arvensis, el rendimiento fue del 0.25mg con un desvo del 0.07mg. M. piperita ha sido cultivada histricamente por los productores de la zona. 1- Sobre la base de estos resultados y suponiendo que los rendimientos de ambas especies se distribuyen normalmente, el INTA debera recomendar a los productores cambiar de especie a un nivel de significacin del 5%? 2- Cul hubiera sido la respuesta del punto anterior si los desvos del rendimiento de M. piperita y M. arvensis hubieran sido 0.04 y 0.035mg. respectivamente? 3- Cul hubiera sido la respuesta del punto 1) si se hubieran analizado 40 parcelas para cada especie? (suponer que no se modifican ni las medias ni los desvos) 4- Cul hubiera sido la respuesta al punto 1 si se hubiese planteado una prueba bilateral? 5- Cul hubiera sido la respuesta al punto 3 si el nivel de significacin elegido fuese del 1%? 6- Compare los resultados y explique la razn de las diferencias en las conclusiones y en los p-valor obtenidos. Problema 6. Segn el principio de exclusin competitiva, dos poblaciones de especies distintas que hagan uso de los mismos recursos no pueden coexistir. La consecuencia evolutiva de este fenmeno es que las poblaciones de dos especies afines desarrollan diferencias morfolgicas y/o comportamentales cuando coexisten en una misma rea, de forma tal que evitan la competencia. Brown (1973) estudi los patrones del uso de semillas para dos especies de ratones granvoros (gro. Dipodomys) del desierto de Sonora en cuanto a tamao de grano recogido (en mm) y distancia con respecto a los arbustos de los cuales recogen los granos (en cm). En base a los resultados resumidos en la tabla que se adjunta, poner a prueba las siguientes hiptesis: (a) D. ordi y D. deserti comen semillas de distinto tamao. (b) D. deserti cosecha semillas a mayor distancia que D. ordi. D. ordi D. deserti 100 100 Xmedio 3,50 4,50 s 2,00 2,50 Distancia del N 6 5 arbusto 284 348 x a la guarida (cm) 14 472 25 163 x2 Con los resultados obtenidos, comentar qu estrategias siguen las dos especies para evitar la competencia. Calcular el valor p de la prueba. Tamao de semilla cosechada (mm) N Problema 7. Efecte la prueba de hiptesis correspondiente a los datos del problema 3 del TP 1. Problema 8. En base a los datos del problema 9 del TP 6 difiere significativamente la proporcin de Dentaria sp. florecida en ambos viveros? Indique las suposiciones necesarias para la validez de la prueba.

26

Problema 9. Recientes estudios sugieren que la incorporacin de bifidobacterias a ciertos productos lcteos podra contribuir a un mejor mantenimiento de la flora intestinal y una mayor tolerancia a la lactosa. Un grupo de investigacin especula que esto podra reducir los casos de diarrea infantil. A fin de demostrarlo, a 115 nios se les suministr yogur conteniendo B. bifidum por un lapso de tres meses, mientras que un grupo de 120 nios fue dejado como control (en qu consistira?). Al cabo del experimento se registraron 8 casos de diarrea en el primer grupo y 12 en el segundo. Puede asegurarse, con un riesgo mximo del 5%, que la incorporacin de bifidobacterias al yogur fue efectiva? Estime con una confianza del 95% la reduccin en la incidencia de diarrea infantil. Problema 10. En un trabajo prctico de Botnica se utilizaron seis parcelas experimentales con dos plantas de avena cada una para estudiar el efecto promotor del crecimiento de una solucin de potasio. En cada parcela, una planta elegida al azar fue tratada con la solucin de potasio y la otra no (control). Al cabo de cierto tiempo, se midi la altura de cada planta (en cm): Parcela Plantas sin tratar Plantas tratadas 1 24,8 22,6 2 21,6 21,0 3 27,8 29,4 4 30,0 39,0 5 23,0 20,0 6 25,4 26,3

Existen evidencias de que el potasio ejerce un efecto promotor del crecimiento? Indique en trminos del problema en qu consisten el error tipo I y tipo II. Cul de los dos podra estar cometiendo? Indique adems los supuestos para la validez de la prueba utilizada. Problema 11. En un programa de Control de Enfermedades Crnicas, la hipertensin est incluida como la primera patologa a controlar. Quince pacientes hipertensos son sometidos al programa y controlados en su tensin sistlica antes y despus de 6 meses de tratamiento. Los datos son los siguientes: Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Inicial 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220 Final 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150 Es efectivo el tratamiento? La siguiente es la salida de Excel.
Media Varianza Observaciones Coeficiente de correlacin de Pearson Diferencia hipottica de las medias Grados de libertad Estadstico t P(T<=t) una cola Valor crtico de t (una cola) P(T<=t) dos colas Valor crtico de t (dos colas) Inicial 186,00 297,14 15 0,2303 0 14 5,786 2,36E-05 1,7613 4,72E-05 2,1448 Final 153,33 323,81 15

Problema 12. Haretche y colaboradores (2006) efectuaron una investigacin a fin de determinar el efecto del pastoreo sobre el banco de semillas de un pastizal uruguayo ( Ecologa Austral 16:105113). Con tal fin seleccionaron dos reas de 1000 m 2 cada una, una sometida a un rgimen de pastoreo moderado por ganado bovino (menos de 0.5 bovinos/ha) y otra clausurada al ganado desde haca 9 aos. En cada parcela, con el uso de un barreno, se tomaron en puntos elegidos al azar 10 muestras de suelo de 5 cm de profundidad y 8 cm de dimetro y se determin la densidad total de semillas/m2.

27

1- Identifique la variable respuesta, la unidad experimental, cantidad de rplicas y tratamientos. Se trata de un estudio observacional o experimental? 2- Los investigadores obtuvieron t = 2.2. Con un nivel de significacin del 5%, qu podran haber concluido? Cual es la la poblacin de referencia?

Problema 13. Se sabe que elevados niveles en sangre de colesterol LDL son perjudiciales para la salud. Se llev a cabo un estudio a fin de determinar el impacto de una dieta rica en huevo sobre los niveles de colesterol LDL en 20 individuos sanos. Los individuos fueron divididos al azar en dos grupos: I) dieta sin huevo, II) dieta con el equivalente a un huevo cada dos das. Se midieron los valores de LDL luego de 30 das de tratamiento (en mg/ml). 1- Identifique en el experimento la variable respuesta, la unidad experimental, cantidad de rplicas y tratamientos. Se trata de un estudio observacional o experimental? 2- Suponga que los investigadores no encontraron diferencias significativas entre ambos grupos (nivel de significacin de 5%). Eso los habilita a concluir con un margen de error de 5% que la ingesta de un huevo cada dos das es inocua? 3- Se sabe que la variabilidad en los niveles de colesterol es de 3mg/ml. Cuntos individuos deberan incluirse en la investigacin para detectar un aumento en el colesterol de 4mg/ml con una probabilidad del 90%? Problema 14. Se desea testear la hiptesis el agua del lago est contaminada. Indique cules seran, en trminos del problema, los dos errores posibles, cul sera el ms grave y cmo planteara en consecuencia las hiptesis. Uso de software para pruebas de hiptesis Excel: En Herramientas > Anlisis de datos Prueba t para dos muestras suponiendo varianzas iguales Prueba t para dos muestras suponiendo varianzas distintas Prueba t para dos muestras emparejadas Prueba F para varianzas de dos muestras Infostat: En Estadsticas > Inferencia basada en una muestra > Prueba t para un parmetro Inferencia basada en dos muestras > Prueba t > Prueba t apareada > Prueba F para igualdad de varianzas > Diferencia de proporciones

28

TRABAJO PRCTICO N 8 ANLISIS DE FRECUENCIAS Problema 1. Se cruzan dos dihbridos con dominancia completa. Suponiendo que no existe ligamiento, se tendr el modelo gentico: Aa Bb x Aa Bb F2: 9 A-B- 3 A-bb 3 aaB- 1 aabb que es la razn clsica de fenotipos, 9:3:3:1. En la experiencia realizada, la generacin F 2 present las siguientes frecuencias: 85 A-B- , 28 A-bb, 35 aaB-, 12 aabb Se desea saber si esta distribucin de frecuencias se aparta del modelo gentico postulado. Indicar las hiptesis, los supuestos y el valor de p de la prueba. Problema 2. Se arroja 50 veces un dado con los siguientes resultados: Resultado Frecuencia 1 11 2 5 3 8 4 15 5 3 6 8

Hay evidencias de que el dado est desequilibrado? Indicar las hiptesis y decidir en base al valor p de la prueba. Qu estara indicando este valor? Problema 3. Considerar los datos del problema 2 de la prctica 1 (nmero de semillas germinadas por bandeja) y probar la hiptesis de ajuste a una distribucin binomial: 3.1.- con un valor de p (proporcin de semillas germinadas) estimado a partir de la muestra. 3.2.- bajo la hiptesis de suponer p (proporcin de semillas germinadas) = 0,6. 3.3.- En ambos casos indicar las hiptesis y dar las conclusiones en base al valor p de la prueba. Problema 4. Un eclogo se propone investigar si las plantas de "vara de oro" con una o ms agallas tienden a estar dispuestas al azar o se agrupan. Razona que el agrupamiento podra sugerir que las avispas que producen las agallas recorren la mnima distancia posible. Por consiguiente, elige un terreno en el que las varas estn dispuestas uniformemente y arroja al azar 100 veces un cuadrante con el fin de contar el nmero de plantas con agallas por cuadrante. Los resultados son los siguientes: 44 cuadrantes con 0 plantas con agallas 24 cuadrantes con 1 planta con agallas 18 cuadrantes con 2 plantas con agallas 14 cuadrantes con 3 plantas con agallas Estudiar la bondad del ajuste a una distribucin de Poisson. Dar el valor p de la prueba. Las agallas se encuentran agrupadas? Problema 5. Para un trabajo de epidemiologa se necesitan larvas de mosquito, pero se desconoce si stas se disponen al azar o no, por lo que no se sabe cmo encarar el muestreo. Se decide entonces tomar una muestra piloto en el estanque del que se sacar la muestra definitiva, obtenindose la siguiente distribucin del nmero de larvas de mosquito por 2 cm3 de agua: N larvas / 2 cm3 N de muestras 0 15 1 30 2 25 3 20 4 5 5 4 6 1 7 0

Estudiar la bondad del ajuste a una distribucin de Poisson. Dar el valor p de la prueba.

29

Problema 6. La regin noroccidental de la estepa patagnica est sometida a un rgimen recurrente de fuego. Gittins y cols (2001) efectuaron un estudio a fin de estimar la tasa de supervivencia post-fuego de dos especies de coirones: Festuca pallescens y Stipa speciosa en un pastizal ubicado en Pilcaniyeu, Ro Negro. Se tiraron puntos al azar en distintos sectores del rea y se seleccion el resto de coirn ms cercano cada punto. Se registr la especie a la que perteneca y la presencia (vivo) o no (muerto) de rebrotes. Los resultados fueron: Festuca Stipa Vivo 80 141 Muerto 45 42 1- Identifique individuo, variables relevadas, muestra y poblacin. Determine si la tasa de supervivencia post-fuego difiere entre ambas especies ( = 0.05). Resuelva aplicando la prueba 2 y la prueba Z para diferencia de proporciones. Compare los p-valor de ambas pruebas y concluya. 2- Estime con una confianza del 95% la tasa de supervivencia post-fuego de coirones en el rea bajo estudio. Problema 7. En un estudio sobre factores de riesgo en recin nacidos, se extrajo una muestra aleatoria de 1100 recin nacidos, observndose que 178 presentaban bajo peso al nacer (menos de 2,5kg). Por otro lado, 270 de las madres eran fumadoras. Finalmente, la mitad de los recin nacidos de bajo peso provena de madres fumadoras. 1- Podra afirmar en base a estos datos que el hbito de fumar constituye un factor de riesgo en el embarazo? Indique las hiptesis, el p de la prueba y calcule el riesgo relativo del hbito de fumar. 2- Suponga que el muestreo se efectu de la siguiente manera: se extrajo una muestra aleatoria de 270 madres fumadores y otra de 830 no fumadoras, y en cada caso se determin la presencia de bajo peso en los recin nacidos. Qu cambia con respecto a la situacin anterior? Podra estimar la prevalencia de bajo peso al nacer? Problema 8.- Resuelva el problema 8 del TP7 utilizando la prueba . Compare los resultados con los obtenidos en el TP7. Problema 9: En un estudio que analiza diversos factores de riesgo en enfermedades cardacas, se examin la relacin entre hipertensin y enfermedad arterial coronaria (EAC) en un grupo de 4513 individuos (Applegate WB et al, 1991, J. Clin. Epidem 44(5):409). Los resultados fueron: EAC S No Total Hipertensin S No 1654 1959 299 601 1953 2560 Total 3613 900 4513 = 46.28 p=10-11

Sin embargo, cuando los datos se desagregaron para individuos menores de 50 aos e individuos mayores de 65 aos de edad, los resultados fueron: Menores de 50 aos Mayores de 65 aos Hipertensin Hipertensin EAC Total EAC Total S No S No S 552 941 1493 S 14 29 43 No 212 495 707 No 19 47 66 Total 764 1436 2200 Total 33 76 109 = 10.33 = p= p=

30

Este constituye un ejemplo de la paradoja de Simpson, que ocurre cuando la presencia de una tercera variable influye en la relacin entre otras dos variables. Cmo evitarlo? Cules seran las conclusiones de la experiencia? Calcule el riesgo relativo de la hipertensin en EAC para los dos grupos de edad.

Problema 10. Un grupo de eclogos estudia la distribucin de frecuencias de edad en tres especies de roedores asociados a un curso de agua. Se muestrearon 83 ejemplares de cada especie, obtenindose la siguiente tabla de frecuencias:
Especie 1 Especie 2 Especie 3 1 1 2 3 Edades (en meses) 2 3 4 5 5 30 17 22 5 19 28 23 9 18 24 18 6 8 6 9 7 0 0 2

Poner a prueba la hiptesis de que las especies poseen una distribucin de edades semejante (recordar que gran parte de la informacin de la distribucin est asociada a las colas, por lo tanto combinar slo las edades 6 y 7 meses de ser necesario). Problema 11. Una curandera de la zona de Pringles afirma que con ciertas yerbas cura el empacho. En la ltima temporada, por ejemplo, suministr tres preparaciones diferentes a 152 paisanos empachados, a los cuales previamente separ en tres grupos al azar, con los siguientes resultados: Curados No curados Revienta caballo 20 35 Yerba de pollo 22 30 Paja brava 25 20 11.1- Son los tres preparados igualmente efectivos como medicamento? Estimar la probabilidad de efectividad de cada uno. 11.2- En los clasificados del domingo la curandera afirma que sus preparados curan a 6 de cada 10 paisanos empachados. Puede considerarse cierta esta afirmacin? Problema 12. Pedro dice que el veneno A es ms mortfero que el B porque sobrevivieron 15 ratones tratados con B y slo 9 tratados con A. En cambio, Juan afirma que B es ms mortfero porque murieron 18 de los ratones tratados con B mientras que murieron slo 13 de los tratados con A. Si los dos estn hablando del mismo experimento, quin tiene razn? Uso de software Excel: En Funciones PRUEBA.CHI Proporciona el p-valor, pero deben ingresarse la matriz de FE y la de FO Infostat: En Estadsticas > Tablas de frecuencias > Ajustes: Para probar buen ajuste a distribucin normal, binomial, Poisson o normal Inferencia basada en una muestra > Prueba de Normalidad (Shapiro-Wilks modificado) Inferencia basada en una muestra > Bondad de ajuste (Kolmogorov): Para probar ajuste a distribucin normal. Determinar la significacin utilizando Tabla 7 de Lilliefors Datos categorizados > Tablas de contingencia

31

TRABAJO PRCTICO N 9 ANLISIS DE LA VARIANZA Problema 1. Se hicieron crecer cortes de coleoptile de arveja en cultivos con auxina. El propsito de la investigacin fue probar los efectos del agregado de diversos azcares sobre el crecimiento. Se obtuvieron los siguientes resultados expresados en unidades oculares (1u.o. = 0,114mm): Control 71 69 70 75 68 71 67 67 73 68 69,9 6,99 +2% Glucosa 57 58 60 59 62 60 60 57 59 61 59,3 2,678 +2% Fructosa 58 61 56 58 57 56 61 60 57 58 58,2 3,511 +1% glu +1% fruc 58 59 58 61 57 56 58 57 57 59 58,0 2 +2% sacarosa 62 66 65 63 64 62 65 65 62 67 64,1 3,211

y S2

61,90 24,70

1.1.- Identificar la unidad experimental, la variable respuesta, la variable explicatoria o factor o tratamiento, sus niveles y la cantidad de rplicas. Dnde interviene el azar? Indicar cul es el modelo estadstico y el diseo experimental. 1.2.- Calcule el residuo e24. Qu unidades posee? Qu mide? 1.3.-Verificar los supuestos del modelo. 1.4.- Estudiar la significacin entre: 1.- los tratamientos 4.- azcares monosacridos y disacridos 2.- el control y los azcares 5.- todos los pares posibles 3.- azcares puros y mezclas Dato til: y2 = 192791 1.5.- Cules son las conclusiones de la experiencia? Represente grficamente los resultados (media y ES), indicando la significacin con respecto al control. Calcule la magnitud de algn efecto que considere relevante. Problema 2. Se sabe que el dixido de carbono tiene un efecto crtico en el crecimiento microbiolgico. Cantidades pequeas de CO2 estimulan el crecimiento de la mayora de los organismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Este ltimo efecto se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. Se realiz un estudio para investigar el efecto de CO 2 sobre la tasa de crecimiento del Pseudomonas fragii, un corruptor de alimentos. Se administr dixido de carbono a cinco presiones atmosfricas diferentes. Se tom como respuesta el cambio porcentual (crecimiento) en la masa celular, despus de una hora de crecimiento. Se utilizaron diez cultivos en cada nivel y se obtuvieron los siguientes datos: Presin en atmsferas de CO2 0,0 0,083 0,29 0,50 0,86 62,6 59,6 50,9 44,3 45,5 41,1 29,5 22,8 24,9 17,2 64,5 59,3 37,5 49,5 29,8 38,3 19,2 20,6 7,8 10,5 58,6 64,6 48,5 50,4 40,2 38,5 29,2 24,1 17,8 22,1 50,9 56,2 35,2 49,9 30,2 27,7 22,6 32,7 22,6 16,8 52,3 62,8 42,6 41,6 40,0 33,9 24,4 29,6 15,9 8,8 y 59.14 45.04 36.52 25.47 16.44 36.528 S 4,8 5,66 5,81 4,48 5,89 15.913

32

2.1.- Identificar la unidad experimental, la variable respuesta y los tratamientos con sus niveles. 2.2.- Plantear y resolver las hiptesis planteadas en el problema. Explicar su significacin en base al valor p de la prueba. 2.3.- Suponiendo que H0 es rechazada, qu otras hiptesis podran plantearse? 2.4.- Qu suposiciones se estn haciendo sobre las cinco poblaciones muestreadas? Problema 3. En Misiones coexisten tres especies de boyeros (Aves, Icteridae). Se midi la longitud del pico (en mm) para poner a prueba la hiptesis de que las especies de boyeros (Cacicus spp) difieren significativamente en el largo de sus picos. Los datos obtenidos fueron: C. haemorrhous C. solitarius 22,8 23,4 20,6 20,9 18,9 21,5 23,6 21,6 23,1 24,5 21,3 24,6 20,2 medias 19,15 21,5 22,75 varianzas 2,17 2,993 2,643 Cules son las conclusiones de la experiencia? Dato til: SC total = 68,9376 mm2 Problema 4: La densidad mineral sea (DMO), el principal determinante de riesgo de fractura, tiene un fuerte componente gentico. Distintas evidencias sugieren que la presencia de cierto alelo del gen del receptor de estrgenos alfa (RE) constituira un factor de riesgo o susceptibilidad de osteoporosis. Se investig la relacin entre la DMO y la presencia de dicho alelo en 125 mujeres postmenopusicas elegidas al azar, a las cules se les determin adems la edad, con los siguientes resultados (media, desvo estndar): Cantidad de 0 1 2 alelos presentes F x -S x -S x -S Edad promedio 59.5 - 3.3 60.6 - 3.5 60.2 - 3.6 1.25 DMO promedio 11.8 - 1.5 8.5 - 1.7 8.4 - 1.6 Ver tabla Cant. Mujeres 43 57 25 4.1.- Antes de analizar los valores de DMO se efectu un Anova de un factor entre los 3 grupos para la variable edad, resultando una F=1.25. Qu conclusiones extraeran de este resultado y por qu es necesario efectuar dicha prueba? 4.2.- Por otro lado la Prueba de Bartlett para la variable DMO arroj un 2=0.75 y la prueba de Shapiro-Willks arroj un valor al que le corresponde un p=0.18. Qu hiptesis se estn poniendo a prueba con estos estadsticos y cules son las conclusiones? 4.3.- La salida de Excel para los datos de DMO es la siguiente:
Grupos Cuenta Suma Promedio Varianza 0 43 507,4 11,8 2,25 1 57 484,5 8,5 2,89 2 25 210 8,4 2,56 ANLISIS DE VARIANZA Origen de las Suma de Grados de Promedio de F variaciones cuadrados libertad los cuadrados Entre grupos Dentro de los grupos 2,60 Total 630,84

C chrysoterus 17,5 18,5 20,9 19,7

Probabilidad <10-4

Valor crtico para F

33

Presentan estos datos evidencia de que el alelo estudiado podra constituir un factor de riesgo de osteoporosis? Efecte todas las pruebas que considere necesarias. Problema 5. Se estudi la capacidad del compuesto 4NP para efectuar cambios en la capacidad reproductiva de Salmonella sp. Para ello se cont el nmero de colonias visibles en placas tratadas con cuatro dosis de 4NP. Los resultados obtenidos utilizando 28 placas fueron:
yi

0 0.3 Dosis (g/placa) 1 3

11 39 88 222

14 43 92 251

15 46 104 259

17 50 113 283

18 52 119 299

21 61 120 312

25 17,29 67 51,14 130 109,43 337 280,43

Si2 21,57 98,48 238,62 1547,95

1- Como los datos incluyen recuentos de colonias, puede suponerse distribucin normal? Observe la relacin entre el promedio y la varianza de los tratamientos. Puede suponerse homocedacia? 2- Aplique una transformacin a los datos de manera tal de satisfacer los supuestos del modelo de Anova. Realice el anlisis para los datos transformados. Problema 6. Los siguientes datos corresponden a un estudio realizado en el Bioterio de la Ciudad Universitaria para estudiar la ganancia en peso de ratas Wistar sometidas a seis dietas diferentes. Alta en protena Baja en protena 79 107 102 100 118 90 51 76 72 90 87 104 117 81 111 90 64 95 86 78 107 74 95 74 80 49 79 64 72 101 89 97 67 98 58 76 46 78 85 82 94 102 79 108 96 106 49 97 82 73 91 98 120 102 105 70 86 61 81 82 Baja en protena 79.2 73.2 78.7 77.03
y i.

Carne de vaca Cereal Carne de cerdo

Tabla de medias Alta en protena Carne de vaca Cereal Carne de cerdo


y. j

100.6 83.9 99.5 94.67

89.9 78.55 89.1 85.85

6.1.- Indicar como podra ser realizada esta investigacin, o sea el muestreo, el diseo experimental, la asignacin de las unidades experimentales, los tratamientos, etc. 6.2.- Comprobar los supuestos del modelo. 6.3.- Efectuar un grfico de perfiles. 6.4.- Escribir las hiptesis nulas correspondientes a los siguientes enunciados y poner a prueba aquellas que puedan ser evaluadas con esta experiencia: 6.4.1.- al menos un tratamiento difiere del resto 6.4.2.- los valores de protena actan en forma diferente. 6.4.3.- la carne vacuna y la de cerdo actan en forma diferente. 6.4.4.- la fuente animal y la vegetal actan en forma diferente. 6.5.- Cul es la conclusin biolgica final? Datos tiles: y2 = 460573; SC entre = 6630,55; Bartlett 2=1.96 Problema 7. Un laboratorio medicinal quiere lanzar un nuevo producto, supuesto antagonista de la androsterona. Para comprobar este efecto, se midi el largo de los cuernos (en cm) de 16 capones elegidos al azar, la mitad de los cuales haba sido tratada (tambin al azar) con esa

34

droga, en presencia y en ausencia de androsterona. La otra mitad fue tratada con un placebo, tambin en presencia y en ausencia de la hormona. Los resultados obtenidos fueron:
Androsterona sin Con Sin antagonista 8 9 7 9 6 7 6 4 13 16 12 17 12 10 9 11 Tabla de medias Sin antagonista Androsterona sin con
y i.

8.25

14.5

11.375

Con antagonista

Con antagonista
y. j

5.75

10.5

8.125

7.00

12.50

9.75

7.1.- Indicar el diseo experimental, el modelo estadstico (y sus factores), las unidades experimentales, los tratamientos y el alcance. Cmo podra controlarse la homogeneidad de las unidades experimentales? 7.2.- Estudiar los supuestos del Anova. 7.3.- Graficar los perfiles. Completar la siguiente tabla de Anova:
Origen de las variaciones Antagonista Androsterona Interaccin Dentro del grupo Total Suma de cuadrado s Grados de libertad Promedio de los cuadrados F Probabilida d 0,00136 0,00001 0,35760 Valor crtico para F

2,25 195

2,25 2,4583

7.4.- Estudiar la significacin de las siguientes hiptesis y dar la conclusin biolgica 7.4.1- La utilizacin de la droga disminuye el largo de los cuernos. 7.4.2.- La aplicacin de androsterona produce diferencias en el largo de los cuernos. 7.4.3.- La androsterona y el supuesto antagonista producen efectos antagnicos. Problema 8: Las radiaciones ionizantes utilizadas con fines teraputicos tienen efectos secundarios a nivel vascular, como dao endotelial, fibrosis, etc. Se sospecha adems que estos efectos pueden ser ms profundos si se combinan con hipercolesterolemia. A fin de estudiarlo, se utilizaron 120 ratones que se dividieron en 3 grupos de igual tamao. Un grupo fue sometido a una irradiacin de 4Gy, otro a una de 8Gy, mientras que el resto fue sometido a una simulacin de irradiacin. Luego de este tratamiento, cada grupo de ratones fue divido en forma balanceada y mientras que un grupo fue alimentado en forma estndar, al restante se lo aliment con una dieta rica en grasas. El tratamiento se prolong durante 18 semanas, al cabo de las cuales los ratones fueron sacrificados, la aorta extrada y analizada histolgicamente. En cada corte se determin el rea artica lesionada (en m2). Los resultados fueron:

35

Tabla de medias: Dieta Estndar Rica en grasas

0Gy 0.20 1.80

Radiacin 4Gy 8Gy 0.21 0.22 3.51 4.80

F de V Radiacin Dieta error total

SC 45.896 299.568 142.08 1282.344

8.1- Indicar el modelo estadstico utilizado, sus hiptesis y supuestos. 8.2- Completar la tabla de Anova. Cules seran las conclusiones? Se comprueba la hiptesis planteada? 8.3- Existen diferencias en la respuesta entre las dosis de 4 y 8Gy en los ratones sometidos a la dieta rica en grasas? Problema 9. Se realiz una experiencia para evaluar la eficacia de los insecticidas Clordane y Aldrin sobre la cochinilla cerlea en ciruelos. Para ello, en un rea plantada con ciruelos atacados por cochinilla se definieron 10 sectores ms o menos homogneos en cuanto al grado de infestacin. Cada sector fue subdividido en 3 reas, y cada una de ellas fue asignada, al azar, a uno de los insecticidas. Se determin el porcentaje de cochinillas adultas vivas luego de una semana del tratamiento, con los siguientes resultados: Sector 1 2 3 4 5 6 7 8 9 10 Media Aldrin Clordane Control 6 37 80 4 13 40 10 31 85 15 80 100 7 50 45 8 20 50 10 40 70 9 60 90 11 40 90 10 51 50 9 42.2 70.0 Media 41 19 42 65 34 26 40 53 47 37 40.4

9.1- Indicar cul es la variable respuesta, las unidades experimentales, los factores y sus niveles. En qu cree que consiste el control? 9.2- Poner a prueba la hiptesis de no aditividad y resolver. Datos tiles: Prueba de no aditividad: Datos crudos: SCNN = 1383,7592; SCerror = 3238,46; SCtotal = 26477,2 Datos transformados en logaritmos: FNN = 0,0001 9.3- Qu insecticida recomendara? Problema 10. En el Laboratorio de Fisiologa Animal ensayan el efecto de una anfetamina en la aceleracin del ritmo cardaco en cobayos jvenes. Utilizan dosis de 0, 10 y 100 unidades. Disponen de diez camadas de tres animales cada una, y para la experiencia asignan al azar las dosis a cada uno de los integrantes de la camada. Obtienen los siguientes resultados (en latidos/5 seg): Camadas Dosis 1 2 3 4 5 6 7 8 9 10 0 5 4 5 6 5 4 6 5 4 6 10 10 9 9 8 11 9 10 10 9 9 100 16 13 14 14 15 13 14 15 15 15

36

Comprobar las suposiciones del modelo. Poner a prueba la hiptesis de que el ritmo cardaco aumenta con las dosis. Comprobar las suposiciones del modelo (Dato til: F NN = 0,9491. SCcamadas = 10,53). Dar las conclusiones en base al valor p de la prueba. Problema 11. Se quiere estudiar el efecto de la exposicin de flores de alfalfa a distintas condiciones ambientales, pero debe decidir sobre el diseo estadstico ms eficaz: muestras independientes o muestras pareadas. Toma como observacin el peso seco de las flores para cada una de las plantas utilizadas. Diseo 1: Elegir 6 plantas vigorosas al azar con flores libremente expuestas en la parte alta y flores escondidas cerca de la base. Tomar el peso seco de ambas en cada planta. Diseo 2: Elegir 12 plantas vigorosas al azar y dividirlas, tambin al azar, en dos grupos iguales. En uno de los grupos considerar las flores expuestas y en el otro las escondidas. En ambos casos observar el peso seco. Ayudarlo a decidir, suponiendo que los datos fueran: Diseo 1 SCexposiciones = 2,71 SCplantas = 2,94 SCtotal = 6,2425 Diseo 2 SCexposiciones = 2,98 SCtotal = 4,58

Problema 12. Resolver los problemas 10 y 11 del TP 7 como un DBA. Comparar los resultados con la prueba de t para muestras pareadas. Problema 13. Un investigador dise un experimento para estudiar el efecto del pastoreo ovino sobre la cobertura vegetal de la gramnea Stipa speciosa. Para ello distribuy ganado ovino de forma de generar zonas sin pastoreo, con bajo nivel de pastoreo y con alto nivel de pastoreo. Al ao siguiente (tiempo suficiente para detectar el efecto del pastoreo), ubic 5 parcelas al azar en cada una de las 3 zonas y registr el porcentaje de cobertura de la especie. 1- Identifique la unidad experimental, la variable respuesta, los factores y sus niveles, la cantidad de tratamientos y la cantidad de rplicas. 2- Al analizar los datos el investigador encontr diferencias significativas entre las tres zonas. Puede concluirse que el pastoreo afecta al porcentaje de cobertura medio de las gramneas del gnero Stipa? Problema 14. Los siguientes ejemplos corresponden a diseos experimentales cuyo modelo estadstico es un Anova. Para cada uno de ellos indicar unidades experimentales, variable respuesta, el o los factores y sus niveles, su condicin de ser fijos o aleatorios, los tratamientos y el alcance. Explicar cmo podra realizarse la experiencia (sobre todo para no caer en seudorplicas) y en qu instancias debera intervenir el azar. 14.1.- Se esta interesado en estudiar el efecto que produce en la funcin pulmonar respiratoria el hbito de fumar, en mujeres embarazadas. El tabaquismo se mide sobre la capacidad total forzada (CTF). Para el estudio se consideran mujeres embarazadas que no fuman, que fuman poco y que fuman mucho. 14.2.- Se quiere estudiar el efecto de la ingesta de cocana en casos de comportamiento violento que degenera en muerte violenta (homicidio, accidente, suicidio). Se considera como variable de inters la concentracin de cocana (g/ml) en sangre 14.3.- Se cree que la cantidad de luz influye sobre rendimiento de dos variedades de maz. Se consideran tres condiciones de luz 14.4.- Se quiere comparar el efecto de tres mtodos de liberacin nerviosa en individuos con cuadro de nerviosismo agudo (individuos estresados), mediante un diseo que controle la variabilidad individual. 14.5.- En una investigacin cientfica se desea determinar si la actividad de cierta metaloproteasa se ve afectada en la enfermedad de Alzheimer, en individuos adultos pertenecientes a 3 grupos de edades.

37

14.6.- En una zona de Tierra del Fuego se quiere estudiar el efecto de la profundidad y el tipo de suelo sobre el pH. 14.7.- Se quieren probar tres fertilizantes foliares sobre el contenido de aceite del grano de soja. Se dispone de un campo con un gradiente de fertilidad norte-sur.

Uso de software Excel: En Herramientas > Anlisis de datos Anlisis de la varianza de un factor Anlisis de la varianza de dos factores Infostat: En Estadsticas > Anlisis de la varianza

38

TRABAJO PRCTICO N 10 REGRESIN Y CORRELACIN Problema 1. Para un estudio embriolgico se desea analizar la relacin entre la temperatura del agua y el ritmo cardaco de la rana comn (Rana pipiens). Se eligen 9 ejemplares al azar y a cada uno de ellos se le registra el ritmo cardaco despus de exponerlo a distintas temperaturas del agua, con los siguientes resultados: Animal Temperatura (0C) Frec. (latidos/minuto) 1 2 5 2 4 11 3 6 14 4 8 22 5 10 22 6 12 23 7 14 32 8 16 29 9 18 32

1.1.- Representar los datos mediante un diagrama de dispersin y analizar grficamente la regresin de la frecuencia cardaca en la temperatura del agua. 1.2.- Establecer la relacin funcional entre frecuencia cardaca y temperatura del agua (es decir estimar y = + x + ). 1.3.- Estudiar la significacin de la regresin mediante ANOVA. Indicar las hiptesis. Interpretar cada una de las fuentes de variacin utilizando la siguiente tabla (completarla previamente): Tempefrec. ratura Cardaca 2 5 4 11 6 14 8 22 10 22 12 23 14 32 16 29 18 32 SC
y y y

( y y )2 8,11 0,23 17,64 0,78 2,06 18,05 4,28 5,70 56,87

y - y

(y2

y y

( y y )
2

7,85 14,48 17,80 21,12 24,43 27,75 31,07 34,39

-2,85 -0,48 4,20 0,88 -1,43 4,25 -2,07 -2,39

-13,26 -6,63 -3,31 0,01 3,32 6,64 9,96 13,28

175,92 43,94 10,97 0,00 11,04 44,10 99,17 176,24 660,31

-16,11 -7,11 0,89 0,89 1,89 10,89 7,89 10,89

259,56 50,57 0,79 0,79 3,57 118,57 62,24 118,57 716,89

1.4.- Cul es el residuo para la observacin obtenida al someter a un ejemplar a 12C? Qu mide? Verificar los supuestos del modelo mediante el estudio de los residuos. 1.5.- Calcular un intervalo de confianza para la pendiente. Indicar cul es el significado biolgico de la pendiente y de su intervalo de confianza. 1.6.- Hallar la banda de confianza del 95 % para la recta de regresin y graficar. 1.7.- Pronosticar la frecuencia cardaca para una temperatura del agua de 5C, con un intervalo del 90 %. 1.8.- Calcular el coeficiente de determinacin R2 Qu indica en este caso? 1.9.- Compare sus resultados con la salida obtenida con Infostat:
Anlisis de regresin lineal Variable N R R Aj ECMP frec. Cardaca 9 0,92 0,91 13,91 Coeficientes de regresin y estadsticos asociados Coef Est. EE LI(95%) LS(95%) T const 4,53 2,07 -0,37 9,42 2,19 Temperatura 1,66 0,18 1,22 2,09 9,01 p-valor 0,0650 <0,0001

39

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 660,02 1 660,02 81,24 <0,0001 Temperatura 660,02 1 660,02 81,24 <0,0001 Error 56,87 7 8,12 Total 716,89 8

Problema 2: Se sospecha que la emisin de monxido de carbono de los caos de escape de los autos se incrementa con el kilometraje de un automvil. A fin de verificar dicha hiptesis se registraron las emisiones de monxido de carbono (en gramos) de 8 autos de la misma marca y modelo, pero de distinto kilometraje. Los resultados fueron: Kilometraje Emisin 0 48 1000 1200 3000 3500 5000 6000 7000 49 55 51 67 63 82 73

Datos tiles: x = 26700; y = 488; Sxx =44578750; Syy = 1074; Sxy = 191800 1- Indique cul es la variable independiente y la dependiente. Halle la ecuacin de la recta e interprete la ordenada al origen y la pendiente en trminos del problema. 2- Se comprueba la hiptesis? Asuma un riesgo del 5%. 3- Cul ser con una confianza del 95% la emisin de un auto con 5000 km? Y cul la de un auto con 12000 km? Problema 3. Un tcnico desea poner a punto un enzimoinmunoensayo a fin de determinar la concentracin de cierta toxina en alimentos. Para ello, disea una curva de calibracin con cantidades conocidas de toxina. Luego de la reaccin especfica, obtiene los siguientes valores de absorbancia: Endotoxina (ng/ml) Absorbancia 0 45 250 280 500 684 750 875 1000 1005

1.- Representar grficamente los datos. 2.- Establecer la relacin funcional entre la concentracin de toxina y la absorbancia y estudiar la significacin de la regresin. Para ello, complete la siguiente salida de Excel:
Estadsticas de la regresin Coeficiente de correlacin 0,983 Coeficiente de determinacin R^2 Error tpico 85,915 Observaciones ANLISIS DE VARIANZA Grados de libertad Regresin Residuos Total Coeficiente s 74,8 1,006 Suma de cuadrado s Promedio de los cuadrados 7381,43 654666,80 Error tpico 66,5497 0,1087 Estadstic ot Probabilida d 0,3428 0,0027 Inferior 95% -136,991 Superior 95% 286,591 1,352 F Valor crtico de F 0,003

Intercepcin Temperatura

40

4.- Cul es el lmite de deteccin de este ensayo? 5.- Con un 95% de confianza, estimar la absorbancia promedio si la concentracin de toxina es de 800ng/ml. Problema 4. Algunos analistas aseguran que en unas pocas generaciones las mujeres podrn superar a los hombres en rapidez en competencias mundiales. En efecto, un anlisis de records mundiales demuestra que para numerosas distancias las mujeres han mejorado su velocidad mucho ms rpido que los hombres. Y si esto contina, las mujeres igualarn a los hombres en los prximos aos. Sin embargo, otros investigadores dudan de estas proyecciones ya que aseguran que en el futuro la velocidad de las mujeres mejorar ms lentamente. A continuacin se dan los tiempos (en seg.) de los ganadores de los 200 m llanos en carreras olmpicas:
Ao Hombres Tiempo 1900 Walter Tewksbury, USA 22.2 1904 Archie Hahn, USA 21.6 1908 Robert Kerr, Canad 22.6 1912 Ralph Craig, USA 21.7 1920 Allan Woodring, USA 22 1924 Jackson Scholz, USA 21.6 1928 Percy Williams, Canad 21.6 1932 Eddie Tolan, USA 21.2 1936 Jesse Owens, USA 20.7 1948 Mel Patton, USA 21.1 1952 Andrew Stanfield, USA 20.7 1956 Bobby Morrow, USA 20.6 1960 Livio Berruti, Italia 20.5 1964 Harry Car, USA 20.3 1968 Tommie Smith, USA 19.83 1972 Valeri Borzov, URSS 20.00 1976 Donald Quarrie, Jamaica 20.23 1980 Pletro Mennes, Italia 20.19 1984 Carl Lewis, USA 19.80 1988 Joe Deloach, USA 19.75 1992 Mike Marsh, USA 20.01 1996 Michael Johnson, USA 19.32 2000 Konstantinos Kenteris, Grecia 21.84 2004 Shawn Crawford, USA 19.79 Mujeres Tiempo

F. Blankers-Koen, Holanda Marjorie Jackson, Australia Betty Cuthbert, Australia Wilma Rudolph, USA Edith McGuire, USA Irena Szewinska, Polonia Renate Stecher, E. Alemania Barbel Eckert, E. . Alemania Barbel Wockel, E. . Alemania Valerie Brisco-Hooks, USA Florence Griffith-Joyner, USA Gwen Torrence, USA Marie-Jose Perec, Francia Marion Jones, USA Vernica Campbell, Jamaica

24.4 23.7 23.4 24.0 23.0 22.5 22.40 22.37 22.03 21.81 21.34 21.81 22.12 21.84 22.05

Nota: datos similares a estos se discutieron en el artculo de Totem et al, publicado en Nature (2004) 431(7008):525
1- Construya un diagrama de dispersin de las marcas para los 200 m llanos segn el ao para

los datos de los hombres. Construya un diagrama aparte para las mujeres.

41

2- Calcule el coeficiente de determinacin para hombres y mujeres. Cul de los dos sexos

exhibe un mejor ajuste?


3- Calcule la recta de regresin para los hombres. Grafquela sobre el diagrama de dispersin.

dem para las mujeres.


4- Interprete la pendiente en ambos casos. Se verifican las aseveraciones de los analistas? 5- Utilice las rectas de regresin para hombres y mujeres para efectuar predicciones de las

marcas en los 200m llanos para las Olimpadas de 2000, 2004 y 2008. Compare con los datos de 2000. A qu se deben las diferencias?
6- En los juegos olmpicos de Atlanta de 1996, Michael Johnson marc 19.32 seg. en los 200 m

llanos. Calcule la prediccin de 1996 para calcular el residuo de la marca de Johnson. Ahora calcule en las mujeres la prediccin para 1988, cuando Florence Griffith-Joyner marc 21.34 seg. Calcule el residuo para la marca de Joyner. Utilice los dos residuos calculados para concluir cul de las dos marcas fue ms sorprendente.
7- Construya un tercer grfico con los datos de las marcas masculinas junto con las femeninas y

trace ambas lneas de regresin.


8- Utilice el grfico para determinar en qu ao las mujeres y los hombres corrern los 200 m

llanos en el mismo tiempo. Qu opina acerca de esta proyeccin? Problema 5. La curva de mortalidad de un pez cualquiera est dada por la ecuacin: Nt = N0 e-zt donde: Nt es el nmero de individuos en el tiempo t; N0 es el nmero inicial de individuos y z es el coeficiente de mortalidad. En un trabajo prctico de la materia Oceanografa Biolgica se tom una muestra de merluzas con los siguientes resultados: Edad (aos) Nt 4 2353 5 1751 6 786 7 339 8 159 9 70

5.1.- Estimar el coeficiente de mortalidad y el nmero inicial de individuos en la poblacin aplicando un modelo de regresin lineal. (Ayuda: ln Nt = ln N0 - zt). 5.2.- Estudiar la significacin de la regresin. 5.3.- Calcular el coeficiente de determinacin R. Qu indica? Problema 6. Los datos que se dan a continuacin corresponden a cuatro conjuntos de datos conocidos como el cuarteto de Anscombe (1973). Para cada serie calcular: 1- La media de las X y su desvo estndar 2- La media de las Y y su desvo estndar 3- El coeficiente de determinacin 4- La recta de regresin 5- El anlisis de varianza para la regresin Graficar e interpretar los resultados obtenidos, determinando si alguna serie de datos se ajusta realmente a un modelo de regresin lineal simple. Serie 1 Y 8,04 6,95 7,58 8,81 Serie 2 Y 9,14 8,14 8,74 8,77 Serie 3 Y 7,46 6,77 12,74 7,11 Serie 4 X 8 8 8 8 Y 6,58 5,76 7,71 8,84

X 10 8 13 9

X 10 8 13 9

X 10 8 13 9

42

11 14 6 4 12 7 5

8,33 9,96 7,24 4,26 10,84 4,82 5,68

11 14 6 4 12 7 5

9,26 8,1 6,13 3,1 9,13 7,26 4,74

11 14 6 4 12 7 5

7,81 8,84 6,08 5,39 8,15 6,42 5,73

8 8 8 19 8 8 8

8,47 7,04 5,25 12,5 5,56 7,91 6,89

Problema 7. En un laboratorio qumico se quiere estudiar la influencia de un nutriente sobre el crecimiento de un cultivo microbiano en tubos de ensayo. Para ello, en cada tubo se vierte un volumen constante de cultivo y se le adiciona una de las tres dosis disponibles de nutriente (0,2, 0,4 y 0,6 unidades). Se utilizan seis tubos para cada nivel de dosis. Despus de cuatro horas de cultivo se mide la densidad ptica de cada tubo mediante un espectrofotmetro. Los resultados fueron: Dosis 0,2 0,4 0,6 13 60 94 15 62 93

Densidad ptica
10 60 92 17 60 97 10 60 90 12 65 92

Media 13 61 93

7.1.- Estudiar el ajuste del modelo y = + x + . Analizar el valor p de la prueba. Datos tiles: x = 7.2; y = 1002; x2 = 3.36; y2 = 75324; xy = 496.8 7.2.- Estudiar el ajuste del modelo y = '+ '(log x) + . Graficar los puntos y la nueva recta de regresin. Datos tiles: x = -7,91255; y = 1002; Sxx= 0,69854; Syy = 19546; Sxy= 116,50812 7.3.- Comprobar la validez de los supuestos de ambos modelos. Utilice el grfico de los residuos en ambos modelos:
Grfico de los residuales datos originales
10 8 6 4 Residuos 2 0 -2 -4 -6 -8 Absorbancia Absorbancia 0 0,2 0,4 0,6 0,8 Residuos 6 4 2 0 -0,8 -0,6 -0,4 -0,2 -2 -4 -6 0

Grfico de los residuales datos transformados x=log(x)


8

7.4.- La transformacin hecha en (7.2), obliga a modificar las suposiciones para la validez del modelo de regresin lineal aplicado? Por qu? 7.5.- Qu densidad ptica se podr esperar si se agregan 0,3 unidades de nutriente? Y si se agregan 0,8? Decida cul es el mejor modelo para efectuar las predicciones. Problema 8. Para un estudio gentico se necesitaban hembras adultas de Drosophila permisilis, pero al observarse que los pesos de los ejemplares resultaban afectados por la densidad en que haban sido criadas las larvas, se decide realizar un anlisis estadstico previo para determinar el grado de densodependencia de la variable en cuestin. Se registra la densidad larval (nmero de larvas/ cm3 de medio de cultivo y el peso medio, en gramos, de los adultos en base a N i cultivos con los siguientes resultados: Densidad larval 1 Peso medio de adultos 1,356 si2 de pesos 0,180 Ni 9

43

3 5 6 10 20 40

1,356 1,284 1,252 0,989 0,664 0,475

0,133 0,130 0,105 0,130 0,141 0,083

34 50 63 83 144 24

8.1.- Representar los datos con la recta de regresin ajustada a las medias. Interpretar los resultados. 8.2.- Completar la tabla de Anova:

Grados de libertad Entre Regresin Residual Dentro o error Total

Suma de cuadrados 35,70 51,44

Cuadrados medios

Estimar la regresin del peso de los adultos en la densidad larval. Indicar las hiptesis. Ayuda: SC error = (Ni-1) si2; x= 5409; y= 390.49; x2=108133; b= -0,0246 Problema 9. Se desea estudiar las curvas de respuesta a los logaritmos de las dosis 2,5, 5, 10 y 20 g/da de vitamina B2 en ratas destetadas e inyectadas diariamente. Para ello, a cada una de las ratas utilizadas se le determina la tasa de crecimiento (en g/semana) durante las cuatro semanas que dura la experiencia. Los resultados obtenidos son: Sexo Machos Dosis 2,5 5 10 20 2,5 5 10 20 11,0 9,3 16,3 22,8 6,2 14,3 15,9 21,2 Tasa de crecimiento (gr / semana) 6,0 3,4 7,9 6,1 14,5 9,1 14,2 13,0 13,8 18,5 20,3 25,8 23,0 21,9 23,0 8,2 10,0 6,0 9,0 13,1 13,2 10,5 16,3 17,0 19,4 23,8 23,5 24,3 22,2 Medias

13,2

Hembras

6.88 11.775 15.85 23.3 7.88 12.775 17.15 23

9.1.- Graficar los datos. 9.2.- Estudiar la curva respuesta al log de la dosis para cada sexo. 9.3.- Estudiar el paralelismo de las curvas respuesta. 9.4.- En base a los resultados de 9.2 y 9.3 dar la conclusin biolgica final. 9.5.- Comprobar los supuestos del modelo de regresin utilizado en 9.2 y los de la prueba de paralelismo de 9.3. Problema 10. Resolver el problema 2 del trabajo prctico 9 utilizando un modelo de regresin lineal simple. Qu ventaja ofrece este abordaje con respecto al Anova de un factor? Problema 11. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro y plomo. Participan en el estudio 10 sujetos. A cada uno se le da una dosis oral idntica de hierro y plomo. Despus de 12 das se mide la cantidad de cada componente retenida en el sistema corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo. Se obtuvieron los siguientes datos:

44

Individuo % de hierro % de plomo

1 17 8

2 22 17

3 35 18

4 43 25

5 80 58

6 85 59

7 91 41

8 92 30

9 96 43

10 100 58

Se encuentran relacionadas la absorcin de estos dos metales pesados? De qu manera? Problema 12. Con el fin de estudiar cual es la relacin existente entre el peso de las branquias del cangrejo ermitao Pagurus comptus que habita los fondos rocosos de Monte Len y el peso de su cuerpo, se extrajo una muestra aleatoria de 12 animales. Para cada ejemplar se obtuvo el peso de las branquias (X) y el peso total del cuerpo (Y) con los siguientes resultados:
X (mg) Y (g) 210 9,52 320 17,25 220 80 320 15,39 4,19 15,81 100 1,41 230 14,9 384 22,7 45 2,5 100 11,3 179 15,2 159 14,4

12.1. Informar la hiptesis planteada y concluir como se relacionan ambas variables (= 0.01). 12.2. Confeccionar un intervalo de confianza para el coeficiente de correlacin. Problema 13. Se llev a cabo un ensayo en un campo experimental ubicado en Venado Tuerto. Se sembr soja, variedad DM 4800, buscndose una densidad de 300000 plantas/ha. Del rea sembrada se eligieron al azar 28 parcelas de 2m2 cada una, que se cosecharon a mano y luego se trillaron. Las variables analizadas fueron el rendimiento, expresado en kg/ha, peso de 1000 granos (P1000), cantidad de chauchas por planta, cantidad de plantas/ha, cantidad de granos/ha, contenido de aceite (en %) y contenido de protena (en %). Se obtuvo la siguiente matriz de correlacin (en negrita las correlaciones significativas):
ACEITE 1.000 -0.698 0.346 -0.258 0.467 0.344 0.445 PROT 1.000 -0.270 0.143 -0.524 -0.431 -0.510 P1000 PLANTA CHAUCHA GRANOS RINDE

ACEITE PROT P1000 PLANTA CHAUCHA GRANOS RINDE

1.000 -0.190 0.207 -0.003 0.388

1.000 -0.381 -0.115 -0.077

1.000 0.143 0.431

1.000 0.775

1.000

Interprete los resultados. Problema 14. Se realiza un estudio con el fin de detectar alguna relacin entre la edad de una madre primeriza y el peso de su beb. Diseo 1: Se toman al azar 10 madres primerizas en cada uno de cinco grupos de edades crecientes y se registran los pesos de sus bebs: a) Cmo se estudiara una posible relacin funcional? Indicar el modelo y las variables a considerar. b) Si para la significacin del modelo propuesto result un valor p=0,038, qu se decide? Indicar las hiptesis puestas a prueba. Diseo 2: Se toma una muestra de 50 madres primerizas y se registra su edad y el peso de sus bebs. a) Cmo se estudiara la relacin entre ambas variables? Indicar el modelo y los supuestos para su validez. b) Si para la significacin del modelo result un valor p= 0,10, qu se decide? Indicar las hiptesis a probar.

45

Uso de software Excel: En Herramientas > Anlisis de datos > Regresin Infostat: En Estadsticas > Regresin lineal

46