Bioestadística Elemental en el Área de la Salud

Miguel Ángel Rodríguez Feliciano

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

1

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

INTRODUCCIÓN

¿Por qué la Bioestadística?

¿Usaron la estadística Galileo, Newton y Einstein? En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria. Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el mismo resultado) está caracterizada por un valor para cada condición. Una variable aleatoria está caracterizada por la llamada función densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condición. De manera general, se considera que la bioestadística, es el conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. Arte de la decisión en presencia de incertidumbre. La Bioestadística es la ciencia que estudia los métodos que permiten realizar los procesos de encontrar y describir las variables aleatorias de interés y las relaciones entre ellas, para el problema en estudio. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar).

2

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

JUSTIFICACION

En el area de la salud y en particular en el trabajo que se realiza en el Laboratorio Clínico, la Bioestadística es una de las herramientas indispensables en el quehacer cotidiano del laboratorio. La interpretación correcta de los resultados se debe en gran medida a la estandarización de valores de referencia de pacientes sanos y de significancia diagnóstica. Siendo la bioestadística quien se encarga de ello.

3

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

CONTENIDO

Distribuciones muestrales Inferencia Estadística Análisis de Varianza Regresión y Correlación Estadística no Paramétrica

4

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Universidad Autónoma de Chiapas Facultad de Ciencias Químicas Campus IV
Asignatura Semestre Carrera Prerrequisitos Bioestadística Cuarto Químico Farmacobiólogo Estadística Créditos 8 Clave QFDD43020819 Hrs./Teoría 3 Hrs./Práctica 2 Hrs./Semana 5 Hrs./Semestre 75 SEPTIEMBRE 2001

Elaborado Mtro. Miguel Ángel Rosales por: Guerrero

INTRODUCCION El conocimiento que se imparte en la materia permitirá desarrollar habilidades a los alumnos en áreas específicas como Control de calidad de las materias primas, Control de Procesos y Productos terminados, Establecimiento de Normas y Sistemas, Interpretación de datos generados por pruebas rutinarias de laboratorio, o más general, por las ciencias de la Salud, así como proporcionarles las bases para Diseñar Experimentos, crear nuevos productos o para mejorar los procesos nuevos o ya existentes. Se requiere del desarrollo de un pensamiento matemático, necesita de la comprensión, de la habilidad para el Procesamiento de información, del Razonamiento, de la capacidad de Análisis e interpretación de resultados. UBICACIÓN DE LA MATERIA La materia de Bioestadística se encuentra insertada en el cuarto semestre del plan de estudios de la carrera de Químico Farmacobiólogo de la Facultad de Ciencias Químicas de la Universidad Autónoma de Chiapas. El plan de estudios consta de 9 semestres. El contenido de la materia es de formación básica de orden práctico y que tienen como objetivo principal el de enlazar conocimientos para que se apliquen en las materias de especialización de las dos carreras. Le anteceden la materia de Estadística, donde se estudió la parte descriptiva de la materia. ESTRATEGIAS DIDÁCTICAS SUGERIDAS El curso será implantado a partir del aprendizaje grupal y se combinarán las sesiones teóricas con las prácticas de taller, así como eventualmente trabajos de investigación o de campo. En las dos primeras, la resolución de problemas tipo será interactiva. El avance del programa será determinado por la clase, de acuerdo al entendimiento de los temas.

5

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

OBJETIVO GENERAL Al finalizar el curso, el alumno será capaz de aplicar diferentes técnicas de Inferencia estadística para el análisis de información experimental.

UNIDADES TEMÁTICAS UNIDAD I.- INFERENCIA ESTADÍSTICA Objetivo Específico: Al finalizar la unidad, el alumno generalizará sobre poblaciones a partir de datos muéstrales, empleando para ello los métodos inferenciales de la estimación y de las hipótesis. 1.1 Conceptos de Inferencia Estadística 1.2 Técnicas de Inferencia Estadística 1.2.1 Estimadores y sus propiedades 1.2.2 Estimación puntual y por intervalo 1.2.3 factor de confianza y error estándar 1.2.4 Estimación de Medias Poblacionales 1.2.5 Estimación de Proporciones Poblacionales 1.2.6 Estimación de Varianzas Poblacionales 1.1.7 Estimación del Tamaño Muestral 1.3 Hipótesis 1.3.1 Planteamiento de Hipótesis 1.3.2 Tipos de Hipótesis 1.3.3 Decisión estadística 1.3.4 Errores tipo I y II 1.3.5 Hipótesis sobre las Medias Poblacionales 1.3.6 Hipótesis sobre las Proporciones Poblacionales 1.3.7 Hipótesis sobre las Varianzas Poblacionales 1.3.8 Pruebas de Bondad, Independencia y Homogeneidad Tiempo Estimado: UNIDAD II.- ANÁLISIS DE VARIANCIA Objetivo Específico: Al finalizar la unidad, el alumno detectará diferencias significativas entre mas de dos poblaciones, mediante la técnica de análisis de la VARIANCIA. 2.1 Conceptos de Diseño de experimentos 2.2 Comparación de mas de dos poblaciones 2.2.1 Diseños experimentales 2.2.1.1 Modelo matemático 2.2.1.2 Suposiciones 2.2.1.3 Cuadro de ANDEVA 2.2.2 Pruebas de diferencias significativas entre pares de medias Tiempo Estimado: 12 hrs.

6

16 hrs.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

UNIDAD III.- REGRESIÓN Y CORRELACIÓN LINEAL Objetivo Específico: Al finalizar la unidad, el alumno determinará la asociación entre variables, mediante las técnicas de regresión y correlación, evaluando la validez de los modelos propuestos 3.1 Regresión y Correlación Lineal simple 3.2 Modelo matemático 3.2 Predicción por el método de Mínimos Cuadrados 3.3 Pruebas de Validez. 3.3.1 Coeficientes de Relación y Determinación 3.3.2 Análisis de Varianza 3.3.3 Pruebas de Linealidad 3.4 Regresión y Correlación Lineal múltiple 3.5 Modelo Matemático 3.6 Estimación de los Coeficientes 3.7 Pruebas de Hipótesis Tiempo Estimado: UNIDAD IV.- ESTADÍSTICA NO PARAMETRICA Objetivo Específico: Al finalizar la unidad, el alumno diferenciará las estadísticas no paramétricas de las paramétricas y hará inferencias sobre datos cualitativos o de escala de medición débil. 4.1 Introducción 4.2 Prueba de Signos 4.4 Prueba de Rangos 4.5 Prueba de Bondad 4.6 Análisis de Varianza por rangos (Kruskal-Wallis y Friedman) Tiempo Estimado:

12 hrs.

7

6 hrs.

FORMA DE EVALUACIÓN Y ACREDITACIÓN: Se tomarán en cuenta para la calificación final, los siguientes indicadores ponderados: 1. 2. 3. 4. 5. EXÁMENES PARCIALES EXAMEN FINAL PRACTICAS DE TALLER TRABAJOS DE INVESTIGACIÓN CALIFICACION CUALITATIVA 30% 30% 15% 10% 15% 100%

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

RELACION DE PRACTICAS DE BIOESTADÍSTICA Práctica 1 2 3 4 5 6 7 8 9 Nombre Repaso del manejo del Statgraphics Estimación por intervalo Hipótesis Tamaño de la muestra Microstat Ajuste de modelos Regresión no lineal Estadística no paramétrica Análisis de varianza Tiempo Estimado: 29 hrs.

BIBLIOGRAFÍA
• • • • • • • • • • BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS. DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA. ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA. MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V. JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS. MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL. MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL. PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS, TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V. SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO INTERAMERICANO. STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS, MÉXICO, ED. MC GRAW HILL, WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED. MCGRAW-HILL.

8

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Capítulo I:
Distribuciones Muestrales

POBLACION Y MUESTRA Población Se le llama así al conjunto de unidades que poseen la característica en estudio. “El conjunto de elementos que poseen la variable por investigar, que han llenado las condiciones de inclusión y que se encuentran disponibles para la investigación en tiempo y espacio” Existen 2 tipos de poblaciones: 1) Finita 2) Infinita

Muestra Es aquella porción o subconjunto de elementos de la población en el cual el número (tamaño) y calidad de los elementos representan fielmente a la población. Mientras la población es más homogénea se requerirá de una muestra menor y si la población es más heterogénea se necesitara mayor muestra.

9

UNIDADES ESTADÍSTICAS DE MUESTREO Investigació Unidad de Investigación: Es la unidad mínima que mantiene la integridad de los datos que interesan estudiar y analizar. Es decir, el ente que contiene las partes que se van a analizar. Muestreo: Unidades de Muestreo Son aquellas que contienen las unidades de análisis de la población y que se utilizarán para confeccionar o seleccionar la muestra. En general, es la selección de los conjuntos que serán tomados en cuenta para la conformar la muestra final en la investigación. Observació Unidad de Observación: Se denomina a la unidad a través de la cual se obtiene la información, esta puede o no coincidir con el elemento. También se denomina unidad respondiente.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Aná Unidad de Análisis: Está definida como el elemento que se examina y del que se busca la información dentro de la unidad de investigación.

TIPOS DE MUESTREO Cuando seleccionamos algunos elementos con la intención de averiguar algo sobre una población determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la población en su conjunto. La exactitud de la información recolectada depende en gran manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir cada uno de los individuos de una población, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las características que definen la población de la que fue extraída, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalización depende de la validez y tamaño de la muestra.

10

LEYES DEL MÉTODO DE MUESTREO LEYES El método de muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las cuales son:

Ley de los grandes números: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si éste se repite una gran cantidad de veces, la relación entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez más a la probabilidad P. Cálculo de probabilidades: La probabilidad de un hecho o suceso es la relación entre el número de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El método de establecer la probabilidad es lo que se denomina cálculo de probabilidad.

De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más directamente al método de muestreo:

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las características del grupo más grande. Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte igual del mismo grupo, varíe en dirección opuesta. Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra

MARCO MUESTRAL Es el proceso de definir y enumerar los elementos sobre los cuales se realizan las inferencias estadísticas en el muestreo probabilístico. Es importante la construcción de un marco muestral lo más perfecto posible a fin de que exista una correspondencia biunívoca entre las unidades muestrales poblacionales y las listas físicas que lo conforman. Entre los factores que contribuyen a distorsionar la calidad de un buen marco muestral están: a) Elementos faltantes, b) Unidades ocultas por estar pareadas con otras, c) Unidades muestrales repetidas y d) Elementos extraños.

11

TIPOS DE MUESTREO Muestreo Probabilístico: Es cuando se puede determinar de antemano la Probabilí probabilidad de selección de cada uno de los elementos de la población siendo esta distinta de cero. Este muestreo está basado en la teoría de la aleatoriedad o del azar, en la cual se fundamenta la estadística matemática. Algunos tipos de muestreo son:
-

Aleatorio simple Estratificado Por conglomerado Sistemático Proporcional al tamaño de cada grupo

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Muestreo Muestreo Aleatorio Simple: La forma más común de obtener una muestra es la selección al azar. es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitución una tabla de números aleatorios o una tómbola de números aleatorios. Muestreo Estratificado: Una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la población. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo aleatorio, tomando elementos de cada estrato. Muestreo Por Conglomerado: Este método divide a toda la población en “K” muestras conteniendo “n” unidades originales, posteriormente se escoge una muestra de manera aleatoria de las “K” muestras realizadas al inicio. Muestreo Sistemático: Es un proceso diferente a los anteriores. Si la población tiene “N” unidades, estos se enumeran del 1 a “N” en algun orden (tamaño, edad, pesos, etc..). Para seleccionar una muestra de “n” unidades, tomamos una unidad al azar de las primeras “K” unidades y de ahí en adelante cada K-esima unidad.

12

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

CARACTERISTICAS Aleatorio simple Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.

VENTAJAS
• • •

INCONVENIENTES Requiere que se posea de antemano un listado completo de toda la población. Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente.

Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas. Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos Fácil de aplicar. No siempre es necesario tener un listado de toda la población. Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos. Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas. Se obtienen estimaciones más precisa Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las

Sistemático

Conseguir un listado de los N elementos de la población Determinar tamaño muestral n. Definir un intervalo k= N/n. Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio). Seleccionar los elementos de la lista.

• •

Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección

13

Estratificado

En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.

Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.

• •

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

variables estratificadoras se refiere. Conglomerado Se realizan varias fases de muestreo sucesivas (polietápico) La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.

El error estándar es mayor que en el muestreo aleatorio simple o estratificado. El cálculo del error estándar es complejo.

Muestreo No Probabilístico: Es aquel utilizado en forma empírica, es decir, no se Probabilí efectúa bajo normas probabilística de selección, por lo que sus procesos intervienen opiniones y criterios personales del investigador o muestrista o no existe norma bien definida o validada. Normalmente se acude a este tipo de muestreo cuando es difícil enumerar, listar o precisar el universo objeto de estudio o cuando no existen registros de los datos. Algunos de estos tipos de muestreo son:
-

14

Por cuotas Por criterio Accidental

Muestreo por Cuotas: Se divide a la población en estratos o categorías, y se asigna una cuota para las diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las categorías. Muestreo Intencionado: También recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la población que se investiga.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Muestreo Mixto: Se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas. Muestreo Tipo: La muestra tipo (master simple) es una aplicación combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada investigación.

TIPOS DE ERRORES Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra.

15

Error Muestral o Error de Muestreo: La diferencia entre el resultado obtenido de Muestral una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error de las muestras, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

MUESTRA TAMAÑO DE MUESTRA Esta va a variar en relación al tipo de estudio y de los objetivos a alcanzar

1.- Promedios 1.-

2.- Proporción de una 2.población

3.3.Asociación variables

entre

Como esta asociación se determina por medio del estadístico de prueba X2, el tamaño se estima en función al número de elementos en cada casilla (deberán de ser de 5 o más)

16
TIPOS DE VARIABLES Por su Estructura Simple Compleja Mide un solo indicador Se requiere de 2 o más indicadores Nominales (nombres).- Nombra la modalidad de una característica sin compararla con grados de intensidad (Ej.: procedencia, religión, ocupación, etc.). Ordinales.- Expresa que elementos pueden poseer características en distintos grados o intensidades (Ej.: bacterias por campo, color de orina, grado de estudios, etc.) Enteras (Ej.: 3, 5, 7, etc.) Fraccionadas (Ej.: 3.1416, 9.7, etc.) (X) (Y)

Cualitativas Por la Forma de Medirse

Cuantitativas Por Dependencia Independientes Dependientes

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

TIPOS DE ESTUDIOS
CARACTERÍSTICAS DEL ESTUDIO Interferencia del Investigador Observacional Periodo de captación de información Prospectivo o Retrospectivo Evolución del fenómeno estudiado Transversal Comparación de las poblaciones de estudio Descriptivo Comparativo Observacional Observacional Observacional Observacional Retrospectivo Retrospectivo Retrospectivo Prospectivo Longitudinal Longitudinal Longitudinal Longitudinal Descriptivo Comparativo de Efecto-Causa Comparativo de Causa-Efecto Descriptivo Comparativo
• • • • • • •

Tipo de estudio

Encuesta Descriptiva Encuesta Comparativa Revisión de casos Casos y controles Perspectiva histórica Estudio de una cohorte Estudio de varias cohortes Experimento

Experimental

Prospectivo

Longitudinal

Comparativo

17

CUESTIONARIO Es el instrumento por medio del cual, el investigador recoge la información de la realidad; dicho instrumento cuenta con 2 tipos de preguntas: a) abiertas y b) cerradas

PROCESAMIENTO DE LA INFORMACION Recolección de Datos Observación Experimentación Encuestas Organización de Datos Ordenación Tabulación Clasificación Presentación de Datos Gráficos Cuadros Descripción Análisis e Interpretación Conclusiones y Recomendaciones

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

TITULOS DE CUADROS Y GRAFICAS En el caso de los títulos de cuadros, estos van en la parte superior de estos, mientras que las figuras lo llevan en la parte inferior Elementos que debe contener un titulo de cuadros o gráficas: 1.- Naturaleza de la presentación (Cuadro o gráfico) 2.- Número de la presentación 3.- naturaleza de los datos (pesos, tallas, etc..) 4.- Unidades utilizadas (Kg., cm., etc..) 5.- Origen de los datos (personas, cultivos, etc..) 6.- Espacio: lugar de donde se obtuvieron 7.- Tiempo: periodo en el que se obtuvieron los datos

18

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Capítulo II:
Inferencia Estadística
La inferencia Estadística, es el procedimiento mediante el cual se toman decisiones sobre una población en base al estudio de una muestra extraída de ella.

19

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

DISTRIBUCIÓN NORMAL

Representación gráfica de esta función de densidad

20

a) Distribuciones normales con distinta b) Distribuciones normales con desviación estándar e igual media diferentes medias e igual desviación estándar Función de Distribución
• • • •

Puede tomar cualquier valor (- α, + α) Son más probables los valores cercanos a uno central que llamamos media ( ) Conforme nos separamos de ese valor , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica). Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro σ , que es la desviación típica.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Función de distribución

F(x) es el área sombreada de esta gráfica

Tipificación Si la variable X tiene ~N ( , σ) entonces la variable tipificada de X es sigue una distribución normal pero con =0 y σ =0, es decir ~N(0, 1) y

Representación gráfica la función Z

21

a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.

Característica de la distribución normal tipificada (reducida, estándar)
• • • • •

No depende de ningún parámetro Su media es 0, su varianza es 1 y su desviación típica es 1. La curva f(x) es simétrica respecto del eje OY Tiene un máximo en este eje Tiene dos puntos de inflexión en z =1 y z = -1

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Frecuentes— Manejo de Tablas —Casos Más Frecuentes— Las ecuaciones consideran que se cuenta con tablas de una sola cola y valores de +Z

22

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

INTERVALOS DE CONFIANZA
Se llama intervalo de confianza en estadística a un intervalo de valores alrededor de un parámetro poblacional (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-. α, en donde α es la probabilidad de equivocarnos, y se le conoce como nivel de significancia. Generalmente se construyen intervalos con confianza al 95% es decir que se tiene una significancia del 5%. Menos frecuentes son los intervalos del 10% y el 1%.

Intervalos de confianza para la Media de una Población –Varianza Conocida– Conocida– Ecuación que describe el intervalo de confianza:

23

Formula para calcular el intervalo de confianza:

EJEMPLO: Un laboratorio desea estimar con el 99% de confianza la media del Volumen Corpuscular en una población del municipio de Frontera Hidalgo. Se considera que se tiene una distribución normal y una varianza poblacional de 144 144. En un muestreo de 15 individuos se obtuvo una media de 84.3 3. 84.3µ

84.3 ± 2.58(3.10) 84.3 ± 8.0

84.3 − 8 = 76.3 84.3 + 8 = 92.3

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Intervalos de confianza para Proporciones de una Población Ecuación que describe el intervalo de confianza:

Formula para calcular el intervalo de confianza:

EJEMPLO: Se realiza un estudio sobre el uso del preservativo en jóvenes universitarios sexualmente activos; para lo cual se tomo una muestra de 300 estudiantes de la Facultad de Ciencias Químicas, encontrándose que solo 123 lo usaban en cada relación. Con un 95% de confianza cual es la proporción de individuos, que usan el preservativo en cada relación?

24

Intervalos de confianza para la Media de una Población con Varianza Desconocida Ecuación que describe el intervalo de confianza:

Fórmula para calcular el intervalo de confianza: EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se desea estimar el volumen medio de todos los recipientes que contienen este ácido, considerando que los valores tienen una distribución normal.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

S = 0.283

Intervalos de confianza para la Varianza de una Población Ecuación que describe el intervalo de confianza:


Formulas para calcular el intervalo de confianza:

25

EJEMPLO: En el muestreo a 10 persona de la población de Unión Juárez se les determino su hematocrito obteniéndose los siguientes resultados: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46.0. Cual es la variación del hematocrito en esta población con un 95% de confianza. S2= 0.286

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

PRUEBAS DE HIPÓTESIS

Una prueba de hipótesis estadística es una conjetura sobre un parámetro de una o más poblaciones. Para tener la certeza sobre una hipótesis, se debe examinar a la población entera, resultando en la mayoría de las veces difícil de poder hacer; por lo que se procede a tomar una muestra aleatoria de la población de interés y se utilizan los datos que contiene la muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia encontrada permite la aceptación o el rechazo de la hipótesis, a través de un estadístico de prueba.

Por lo que, para cada tipo de prueba de hipótesis se debe calcular una prueba estadística apropiada. Además de que los datos deben de mostrar una distribución normal para que se pueda a proceder a la verificación de una hipótesis.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula.

26

Antes de continuar, es necesario mencionar que existen muchos tipos de hipótesis, pero las que competen a este material son las hipótesis estadísticas, las cuales son 2: Hipótesis alterna (Ha) e Hipótesis nula (Ho), siendo en la primera donde el investigador plantea su idea y la segunda es la que contiene la parte opuesta y complementaría, siendo la que se utiliza para evaluar de manera indirecta la hipótesis del investigador (Ha). De manera que contrario a lo que muchos piensan la primera hipótesis que se debe plantear es la alterna (Ha) por ser ahí donde se encuentra la idea original del investigador, y sin la formulación de la hipótesis alterna (Ha) no puede existir la Hipótesis nula (Ho), por esta tan solo el complemento opuesto dela alterna (Ha).

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Tipos de planteamientos 1.- Ho: µ = µo Z 0.995 => p = 2.58 Z 0.975 => p = 1.96 Ha: µ ≠ µo

2.- Ho: µ ≥ µo Z 0.01 => p = -2.33 Z 0.05 => p = -1.65

Ha: µ < µo

3.- Ho: µ ≤ µo Z 0.99 => p = 2.33 Z 0.95 => p = 1.65

Ha: µ > µo

27

Prueba de Hipótesis para: Media Poblacional con Varianza Conocida EJEMPLO: Un laboratorio estima con el 99% de confianza que la media del Volumen Corpuscular en una población del municipio de Frontera Hidalgo es diferente de 90 µ3. Se considera que se tiene una distribución normal y una varianza poblacional de 144. En un 144 3. muestreo de 15 individuos se obtuvo una media de 84.3µ 84.3 Ho: µ = 90 Ha: µ ≠ 90

Z 0.01 = 2.58
2

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Prueba de Hipótesis para: Media Poblacional con Varianza Desconocida

Formula:

EJEMPLO: El contenido en litros de7 recipientes de H2SO4 son: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6. Con un intervalo de confianza del 95% se estima que el volumen medio de todos los recipientes que contienen este ácido es diferente de 11lts, considerando que los valores tienen una distribución normal.

Ho: µ = 11

Ha: µ ≠ 11

= 10

S = 0.283

28
No se acepta Ho, hay evidencia que indica que la media del volumen de los recipientes es diferente de 11lts.

Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con Varianzas Conocidas 1.- Ho: µ1 – µ2 = 0 2.- Ho: µ1 – µ2 ≥ 0 3.- Ho: µ1 – µ2 ≤ 0 Ha: µ1 – µ2 ≠ 0 Ha: µ1 – µ2 < 0 Ha: µ1 – µ2 > 0

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

EJEMPLO: Se realiza un estudio en la comunidad de Mazatán, Chiapas, sobre los niveles de ac. Úrico en los habitantes de la población; y se considera que las concentraciones de hombres y mujeres no son iguales. Se toman muestras de 12 varones y 15 mujeres encontrándose ambas poblaciones con valores distribuidos normalmente con una media 4.5 y 3.4 mg/ml, respectivamente. Ho: µhombres = µmujeres Ha: µhombres ≠ µmujeres

Prueba de Hipótesis para: Diferencia entre Dos Poblaciones Normales con Varianzas Desconocidas Antes que nada se debe conocer, si las poblaciones tienen varianzas iguales o diferentes por lo que se procede a se una prueba de hipótesis para las varianzas con el estadístico de prueba “F”. Siendo la formula a utilizar: Las hipótesis son: Ho: Las varianzas son iguales Ha: Las varianzas son diferentes

29

Dependiendo de la aceptación o no aceptación de la Hipótesis nula (Ho), será la formula que se utilice:

Varianzas Con Varianzas Iguales

Varianzas Con Varianzas Diferentes

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

EJEMPLO (Varianzas Iguales): Se realiza un estudio sobre el funcionamiento hepático de perros y gatos mediante la enzima aminoaspartato transferasa (AST), contando con 22 perros y 15 gatos, con una media de 120 y 96 U/l respectivamente y una desviación estándar de 40 y 35 respectivamente. Se puede considerar que ambas especies de animales tienen los niveles de AST. Ho: Las varianzas son iguales Ha: Las varianzas son diferentes 2 2 S mayor (40) F= 2 = = 1.3061 La F de Tablas 1.90 (se acepta Ho para varianzas) 2 S menor (35) Ho: Las medias son iguales Ha: Las medias son diferentes

La “t” de tablas 2.301 (se acepta Ho para medias)

30

EJEMPLO (Varianzas distintas): En el ganado bovino los niveles de glucosa oscilan entre los 45 y 75 mg/dl. Un grupo de investigadores desea saber si dos razas (lechera y productora de carne), difieren con respecto al valor medio de la glucosa. Se toman 10 animales productores de leche (n1) y 20 productores de carne (n2), siendo sus medias de 62.6 y 47.2 respectivamente y las desviaciones estándar de 33.8 y 10.1. Ho: Las medias son iguales Ha: Las medias son diferentes

T(28)0.05/2=2.0484 -2.0484 < 1.41 < 2.0484 Se acepta Ho.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Prueba de Hipótesis para: Muestreo a Partir de Poblaciones que no Presentan Distribución Normal Cuando el muestreo se realiza a partir de poblaciones que no presentan distribución normal, es posible utilizar los resultados del teorema del limite central si la magnitud de las muestras es grande (n ≥ 30).

Cuando se extraen dos muestras aleatorias simple independientes de gran magnitud de una población que no sigue una distribución normal se pueden utilizar las varianzas poblacionales si se conocen, de lo contrario se utilizan como estimaciones las varianzas de las muestras, las cuales necesariamente deben de ser grandes.

31

EJEMPLO: Se realiza un estudio en 75 pacientes con infecciones gastrointestinales con sintomatología teniendo una lectura media de leucocitos de 6800, y 80 pacientes con infecciones gastrointestinales sin sintomatología aparente con una lectura media de leucocitos de 5450, con desviaciones estándar de 600 y 500 respectivamente. Se considera que las poblaciones de donde se extraen las muestras no siguen una distribución normal, siendo el muestreo aleatorio e independiente. ¿Se puede considerar que las lecturas de ambas poblaciones es la misma? Ho: µc/sintomas = µs/sintomas Ha: µc/sintomas = µs/sintomas

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Prueba de Hipótesis para: Comparaciones por Parejas Se utiliza cuando las poblaciones a comparar, son dependientes una de la otra. La formula es:

Una población con distintas mediciones

EJEMPLO: Se evalúan dos distintas dietas para ver con cual se gana más peso siendo peso, los resultados en kg ganados: ganados

32

t0.05/2,7 = 2.841 t0.01/2,7 =4.029

como tc > t0.05/2,7 ==> Se rechaza Ho como tc > t0.01/2,7 ==> Se rechaza Ho

El efecto de las dietas no es el mismo en el incremento de peso de las personas.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Prueba de Hipótesis para: Proporciones –una población– población– Su formula es: EJEMPLO: Un estudio para evaluar la eficacia de un nuevo tratamiento contra la Encefalitis Equina Venezolana, da como resultado que de 300 animales vacunados 123 presentaron la enfermedad. ¿Es posible concluir a partir de estos datos que en la población de animales muestreados, la proporción de animales que se protegen de la infección no es del 50% Ho: p = 0.50 Ha: p ≠ 0.50

Z=

0.41 − 0.50 − 0.09 = = −3.11 (0.50)(0.50) 0.0289 300
Se rechaza la Hipótesis nula.

33
Prueba de Hipótesis para: Proporciones –dos Poblaciones– para: Poblaciones– Sus formulas son:

EJEMPLO: Un estudio para comparar la eficacia de un nuevo tratamiento contra la malaria arroja el resultado de 78 individuos de 100 se alivian, mientras que con la cloroquina que es el método tradicional se alivian 90 de cada 100.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Capítulo III: II:
Análisis de Varianza
El análisis de la varianza, es un método que es necesario cuando se quieren comparar más de dos medias. Sin embargo debido a que es un método que permite comparar varias medias en diversas situaciones; se encuentra ligado, al diseño de experimentos y, de alguna manera, es la base del análisis multivariado.

Los modelos Estadísticos y el Análisis de la Varianza Se conoce como Modelo a la representación de un fenómeno de la vida real. Y un modelo matemático es aquel en el que se relaciona variables. Siendo de dos tipos: DETERMINÍSTICO: Establece una relación exacta entre las variables ESTADÍSTICO: Establece la relación entre las variables depende del aspecto : aleatorio de los fenómenos –Siendo este el modelo con el que trabajaremos este capítulo–.

34

MODELO MATEMÁTICO BASE DEL ANÁLISIS DE VARIANZA En el muestreo, las observaciones (yi) provenientes de una población normal pueden ser representados por: µ: Es una constante, la cual depende de un conjunto de factores con el mismo efecto para todos los valores de la población. Es la media de todos los yi de la población εi: Es la parte aleatoria, la cual depende de un conjunto de factores que influyen en diferente forma sobre el fenómeno. Es el error de muestreo para cada yi En el modelo anterior, los εi son aleatorios y pueden tomar valores tanto positivos como negativos, debido a que los yi también son aleatorios; y µ es una constante. De manera que cualquier inferencia sobre µ –media poblacional dependerá del modelo probabilístico que se suponga para la variable εi –error de muestro–

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

ESQUEMA DE MUESTREO En el esquema de muestreo se tiene:

Siendo µ una constante las gráficas yi y εi son:

La importancia del modelo, reside en la representación de la variable yi como la suma de un parámetro µ y una variable aleatoria no observable εi, dando origen a una ecuación que pretende explicar el comportamiento de la variable aleatoria yi. Para el análisis estadístico del modelo puede utilizarse el método del Análisis de la Varianza (ANVA), el cual es un procedimiento aritmético, que consiste en descomponer la Suma de Cuadrados Total (Variación Total) en fuentes de variación reconocidas, incluyendo la variación que no se ha podido medir, que es el ERROR EXPERIMENTAL. EXPERIMENTAL

35

SUPUESTOS DE APLICACION En la aplicación del ANVA se suponen: 1. Los efectos de los tratamientos y los ambientales son aditivos. 2. El Error Experimental constituye un elemento al azar, normal e independiente, con una distribución normal con una media 0 y una varianza σ2 . CONCEPTOS DE APLICACIÓN 3. Dos conceptos en la aplicación del ANVA. 4. Grados de Libertad (G.L.): Es el número de contrastes o comparaciones ortogonales (datos independientes) menos el número de restricciones (son las medias de las hipótesis) impuestas que se realiza en un grupo de datos. 5. Cuadrado Medio (C.M.): Es el cociente de una suma de cuadrados (SC) entre su respectivo grado de libertad. [CM = SC / GL]

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Por lo tanto se utiliza Fo para probar el juego de hipótesis planteado al inicio.

REGLA DE DESICION La regla de decisión para la prueba con un nivel de significancía α es de: Rechazar Ho si Fo > F1n-1, α Siendo Fo la calculada y la F1n-1, α la de tablas

TABLA DE ANÁLISIS DE VARIANZA Todo el proceso antes descrito se resume en una tabla llamada Tabla de Análisis de Varianza (ANVA), que a continuación se detalla:

36
La estadística Fo, bajo la hipótesis nula, tiene una distribución F1n-1, la Regla de F1n1n-1, α Decisión consiste en: Rechazar Ho si Fo > F EJEMPLO: En un estudio de sobre los niveles de hemoglobina de una comunidad que abita sobre los 1000 m.s.n.m se cuantificaron los niveles de Hb de 28 personas que participaron de manera voluntaria, siendo los valores obtenidos: 12.72 14.11 18.92 13.62 13.38 13.01 17.65 11.49 13.94 17.53 12.13 14.75 17.34 19.25 13.90 13.68 15.74 13.72 10.41 14.81 14.60 12.26 15.03 5.21 19.03 13.29 14.44 17.03

De estudios previos se sabe que de una población parecida, el porcentaje de hemoglobina es de 13.23.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

a) ¿Cual es la población de interés en este estudio? b) ¿Se puede considerar que el promedio del porcentaje de hemoglobina es igual a 13.23. si es así a que nivel de significancía? Solución: a) El nivel de hemoglobina de la población de estudio b) µo=13.23 El juego de hipótesis a probar es: Ho: µ=µo VS Ha: µ≠µo Como µo = Porcentaje de proteínas en la leguminosa “Leucaena” Entonces Ho: µ=13.23 VS Ha: µ≠13.23 Este juego de hipótesis se probará mediante ANVA. En donde la suma de cuadrados es: S.C. Media = n(ÿ - µo)2 S.C. Error = Σni=1(yi-ÿ)2 = Σni=1y2i- (Σni=1yi)2/n S.C. Total = Σni=1(yi-µo)2 De los datos obtenidos tenemos: n=28 Σy = 402.93 Σy2 = 6029.9671 Σy/n = ÿ = 14.39

37

Sustituyendo en las formulas tenemos: S.C. Media = n(ÿ - µo)2 = 28 (14.39 - 13.23)2 = 37.67 231.66 S.C. Error = Σni=1y2i- (Σni=1yi)2/n = 6029.9671-(402.93)2/28=

S.C. Total = Σni=1(yi-µo)2 = S.C. Error+S.C. Media = 231.66+37.67= 269.33

F127,0.05 = 4.17

Fo > Ft

F127,0.01 = 7.56

Fo < Ft

Existe diferencia significativa al 5% por lo que a ese nivel se rechaza Ho. No así al 1% donde se acepta Ho.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

DISEÑOS DISEÑOS EXPERIMENTALES Diseño Completamente al Azar (una entrada) Es el tipo de arreglo más sencillo; los tratamientos están asignados completamente al azar a las unidades experimentales; por lo que la variabilidad total de las observaciones del experimento se divide en:
• •

Una debido al efecto de los tratamientos Otra debido al error experimental

El análisis de la varianza contiene únicamente dos fuentes de variación y se caracteriza por:
• • •

Puede aplicarse cuando se estudian dos o más tratamientos Las unidades experimentales deben ser homogéneas homogéneas Los tratamientos deben asignarse a las unidades experimentales totalmente al azar.

Ventajas:
• • • •

Puede utilizarse cuando las repeticiones por tratamiento son diferentes Cuando sea probable que parte del experimento, ya sean unidades experimentales o tratamientos se pierdan o se rechacen por alguna razón. El análisis estadístico que se desarrolla es fácil En experimentos pequeños, se tiene mayor precisión, ya que contiene más grados de libertad para estimar el error experimental.

38

Desventajas:
• •

Cuando las unidades experimentales son heterogéneas pierde precisión. La variación que existe entre las unidades experimentales forma parte del error experimental.

Si todos los tratamientos tienen el mismo número de repeticiones entonces: n1=n2=n3=.....=nk=r.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

En la tabla, se tiene que las observaciones se denotan con una letra con dos subíndices, el primero indica el tratamiento ( i ) y el segundo la repetición ( j ).

La tabla del ANVA, para cuando se tiene diferente número de repeticiones por tratamiento es la siguiente:

39

Si los tratamientos tienen igual número de repeticiones, entonces el ANVA resulta ser:

Ft-1n.- t(rRegla de decisión: Rechazar Ho, si Fc > Ft-1n.-t ó t(r-1), α

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Ejemplo Se evaluó el incremento de tamaño de ratas de laboratorio, por efecto de tres dosis de una hormona sintética T4. El experimento se realizo a nivel de laboratorio en donde las U.E. fueron ratones recién nacidos, después de 30 días se midió el tamaño de los ratones desde las patas traseras a las patas delanteras, estirando al ratón sin forzarlo ni lastimarlo. El resultado de la medición del tamaño de cada ratón se hizo en Mm. y dio como resultado los valores que en siguiente cuadro se presentan: Pruebe la hipótesis de que los incrementos de tamaño de los ratones no se ven afectados por los diferentes niveles de T4. Ho: µ1=µ2=µ3 V.S. Ha: al menos un µi es diferente

40

Ft 0.05=3.81 ==> Fc > Ft

Ft 0.01=6.70 ==> Fc > Ft

Se rechaza la hipótesis nula. Si hay diferencias altamente significativas en el crecieminto de los ratones con las tres diferentes dosis de la hormona T4.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Diseño de Bloques al Azar (Doble entrda) Este diseño es utilizado cuando las U.E. son heterogéneas, por lo que la varianza dentro de los tratamientos es muy alta, la cual está medida por el cuadrado medio del Error, que en este caso es grande, por lo que es más difícil rechazar la hipótesis de igualdad de medias de tratamientos. Bajo la situación antes mencionada, es conveniente dividir el material experimental en grupos (BLOQUES), de tal forma que las U.E. sean homogéneas dentro de bloques y heterogéneas entre bloques. Cada tratamiento a ensayar está representado una sola vez en cada bloque, estos se asignan al azar a las U.E. de cada bloque y posteriormente cada bloque se distribuye al azar en su establecimiento. Con la asignación de los tratamientos y los bloques al azar, es posible estimar la varianza entre bloques por separado y tener un Error Experimental pequeño. Características Las U.E. deben de ser homogéneas dentro de cada bloque, salvo por pequeñas variaciones aleatorias; puede haber cierta heterogenicidad, el propósito de los bloques es: absorber en máximo grado la variabilidad del material experimental. Es el más utilizado en trabajos experimentales Aunque no es particularmente una característica, los grados de libertad para el Error no debe ser menor de 12 Es fácil de planear y el procedimiento de cálculo es fácil La disposición de tratamientos y bloques es ortogonal entre sí. El establecimiento del Diseño en Campo, los Bloques se colocan perpendicularmente al gradiente de variabilidad.

41

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

En la tabla, se tiene que las observaciones se denotan con una letra con dos subíndices, el primero indica el tratamiento ( i ) y el segundo el bloque ( j ). Ventajas:
• • •

Es más preciso que el DCA cuando hay un factor que causa variación en las U.E. Es flexible, debido a que puede tener cualquier número de tratamientos y de bloques (mínimo dos) Es posible estimar datos perdidos

Desventajas:
• •

Cuando el número de tratamientos es muy grande, es difícil mantener la homogeneidad dentro de bloques, se pierde precisión. Estima el Error Experimental con menos grados de libertad que el D.C.A. gl t (r-1) (t-1) (r-1)

Diseño DCA DBA

42

El criterio de decisión es: Ft-1(t-1)(rRechazar Ho1, si Fc > Ft-1(t-1)(r-1), α Rechazar Ho2, si Fc > Fr-1(t-1)(r-1), α Fr- 1(t- 1)(rPara tratamientos Para Bloques

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Ejemplo: Se evalúa la eficiencia de un complemento alimenticio a 4 diferentes dosis para elevar los niveles del volumen sanguíneo en personas que sufren de anemia ferropénica e hipovolemía. Dada la variabilidad de pesos y sexos, se decidió agrupar en bloque de personas por pesos lo más semejantes posibles. Se les dio el tratamiento durante 4 meses y se procedió a determinar su volumen sanguíneo dando los siguientes resultados: Las hipótesis a probar son: Ho1: T1=T2=T3=T4 VS Ha1: Al menos un tratamiento es diferente

Ho2: B1=B2=B3=B4=B5 VS Ha2: Al menos un bloque es diferente

43

Para Tratamientos Fc > Ft0.05 y Fc > Ft0.01 Para Bloques Fc < Ft0.05 y Fc < Ft0.01

Se rechaza Ho1 para tratamientos. Hay diferencias altamente significativas entre los tratamientos. Algunas dosis funcionan mejor que otras del complemento. Ho2. Se acepta Ho2 No hay diferencias significativas entre bloques.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Diseño Cuadrado Latino (Triple entrada) Se utiliza cuando hay dos factores que afectan sistemáticamente a las unidades experimentales. Para evitar que el efecto de los factores se acumule en el error experimental se hace un doble bloqueo. Esta asignación de ortogonalidad (independencia) a los efectos de los tratamientos respecto a los dos factores de variabilidad asociados con el experimento, requiere que cada tratamiento aparezca una vez en cada una de esas variantes, denominados: HILERAS Y COLUMNAS. Características: Características: Se genera cuando los tratamientos se agrupan en bloques homogéneos en dos direcciones: hileras y columnas quienes constituyen una repetición completa de los tratamientos. Cualquier tratamiento aparece una sola vez en la misma columna o en la misma hilera. Se impone a las U.E. una restricción de doble bloqueo. El número de repeticiones es igual al número de tratamientos a evaluar. Esto es, si hay t tratamientos, el total de U.E. será t2. t es mayor de 2. t2 Ventajas: Reduce el error experimental al introducir el doble bloqueo. El análisis estadístico es simple, ligeramente más complicado que DBA. Puede utilizarse cuando las U.E. forman una línea continua. Proporciona una comparación más precisa de los efectos de los tratamientos. Aún con datos perdidos, el análisis estadístico es simple. Es más preciso que el DBA. Desventajas: Es poco flexible, ya que el No. de Hileras o Columnas dependen del No. de tratamientos. No se pueden comparar muchos tratamientos, el rango es 4-10 Con pocos tratamientos, se tienen demasiados parámetros en el modelo con pocas observaciones, siendo ineficiente la estimación de la varianza del error.

44

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

En la tabla, se tiene que las observaciones se denotan con una letra con tres subíndices, el primero indica el tratamiento ( i ), el segundo el bloque ( j ) y el tercero ( k ) la columna.

45

El criterio de decisión es: Ft-1(t-1)(tRechazar Ho1, si Fc > Ft-1(t-1)(t-2), α Fr-1(t-1)(tRechazar Ho2, si Fc > Fr-1(t-1)(t-2), α Rechazar Ho3, si Fc > Fr-1(t-1)(t-2), α Fr-1(t-1)(tPara tratamientos Para Hileras Para Columnas

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Ejemplo: Se desea evaluar en un experimento el efecto en la ganancia de peso de cuatro complementos alimenticios en la dieta de ratones recién nacidos de diferentes razas. Se pesaron los ratones al nacer y se pesaron después de 15 días de estarles dando el complemento alimenticio; obteniendo de la diferencias de pesos la ganancia del mismo, obteniéndose los siguientes resultados en gr.: Ho1:t1=t2 = t3 Ho2:H1=H2 H3 Ho3:C1=C2 =C3 VS VS VS Ha1:al menos un ti es diferente (ti≠ti’) Ha2:al menos un Hi es diferente (Hi≠Hi’) Ha3:al menos un Ci es diferente (Ci≠Ci’)

46

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

No existe diferencia significativa en la ganancia de pesos por efecto de los complementos alimenticios, ni por las especies y pesos al nacer.

47

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Capítulo IV:
Correlación y Regresión
En la práctica con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe una relación inherente entre ellas. El aspecto estadístico del problema consiste en lograr la mejor estimación de la relación entre las variables

El análisis de regresión es útil para encontrar la forma probable de las relaciones entre las variables , siendo el objetivo final cuando se emplea este método de análisis, el de predecir o estimar el valor de una variable en función al valor tomado por otra variable.

El análisis de correlación se refiere a la medición de la intensidad de la relación entre las variables. Cuando se calculan mediciones de correlación a partir de un conjunto de datos, el interés recae en el grado de correlación entre las variables.

48

Ecuaciones de curvas Línea recta Y = ao + a1X

Parábola (curva cuadratica)Y = ao + a1X + a2X2 Curva cúbica Curva Cuartica Curva de grado n Curva exponencial Curva geométrica Hiperbola Y = ao + a1X + a2X2 + a3X3 Y = ao + a1X + a2X2 + a3X3 + a4X4 Y = ao + a1X + a2X2 + …… + anXn Y = abx Y = aXb 1 Y = ----------------------ao + a1X

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Gráficas de Funciones

49
REGRESIÓN LINEAL SIMPLE En este modelo, se considera a la variable “X” como la variable independiente, ya que se encuentra bajo el control del investigador, es decir los valores de “X” son seleccionados para obtener valores de “Y” por lo que se le conoce como variable “Y”, dependiente; por lo que se habla de una regresión de “Y” sobre “X”.

Supuestos que fundamentan el modelo de Regresión lineal simple 1.- Los valores de “X” son seleccionados previamente por el investigador. 2.- La variable “X” se midce sin error (la magnitud del error en la medición es insignificante). 3.- Para cada valor de “X” existe una subpoblaciones de valores de “Y” 4.- Los valores de “Y” siguen una distribución normal 5.- Todas las varianzas de las subpoblaciones de “Y” son iguales 6.- Todas las medias de las subpoblaciones de “Y” se encuentran sobre la misma linea recta (supocisión de linealidad). µy/x = α + βx 7.- Los valores de “Y” son estadisticamente independientes entre ellas

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

L I N I

Linealidad Independencia Normalidad Igualdad de varianzas a: Es el punto donde la recta cruza el eje vertical. Es el punto de inicio del valor de los datos de la pendiente. b: Es el valor de la pendiente. Indica la cantidad con la cual “y” cambia por cada unidad que cambia “X”.

50

Evaluación de la ecuación de regresión regresión Hipótesis a probar: Conclusiones: Si se acepta Ho, el modelo lineal no proporciona un buen ajuste para los datos. Ho: β = 0 Fuente de variación Regresión lineal Residual v.s. g.l. 1 n-2 n-1 S.C. SCR SCr
Ha: β ≠ 0 C.M. SCR/1 SCr/n-2 F CMR/CMr

Si se rechaza Ho, el Total modelo lineal proporciona un buen ajuste para los datos.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Formulas

x

y

x2

y2

xy

51
Totales

CORRELACIÓN LINEAL SIMPLE En el modelo clasico de regresión solo “y” es la variable dependiente (aleatoria), siendo “x” una variable fija determinada por el investigador. Sin embargo, cuando “x” y “y” son variables aleatorias, se tiene lo que se conoce como modelo de correlación. Por lo que el análisis de regresión puede llevarse a cabo bajo el modelo de llevarse correlación. Pudiendo hacerse una regresión de “x” sobre “y”, así como una regresión de “y” sobre “x”. El objetivo es únicamente obtener una medida de la intensidad de la relación entre las 2 variables, no importa que recta se ajuste, ya que la medida que por lo general se calcula será la misma en cualquier caso.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Supuestos que fundamentan el modelo de Correlación lineal simple Se supone que “x” y “y”, varian conjuntamente en lo que se conoce como distribución conjunta, y si además esta distribución sigue una distribución normal, recibe el nombre de distribución normal bivariada. 1.- Para cada valor de “X” existe una subpoblaciones de valores de “Y” con una distribución normal. 2.- Para cada valor de “y” existe una subpoblaciones de valores de “x” con una distribución normal. 3.- La distribución conjunta de “x” y “y” es una distribución normal bivariada. 4.- Todas las subpoblaciones de los valores de “Y” tiene la misma varianza 5.- Todas las subpoblaciones de los valores de “X” tiene la misma varianza

r: Coeficiente de correlación. –Mide la intensidad de la asociación entre las variables “X” y “Y”. r= 0.6 = 60%. Existe una asociación entre las variables del 60%. r2: Coeficiente de determinación. – Representa la variación total de los valores de la variable “Y” que se pueden contabilizar o explicar por una relación lineal con los valores de la variable aleatoria “X”.– r2=0.36 = 36%. El 36% de la variación de los valores de “Y”, se deben a una relación lineal con los valores de “X”.

52

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Capítulo V: Capítulo V:
Estadística No Paramétrica
La estadística paramétrica “Estima” o “Prueba Hipótesis” acerca de uno ó más Población. Parametros de la Población Necesitandose para esto conocer la forma en que se distribuye la población de donde se tomarón las muestras para la Inferencia (aproximadamente normal). La estadística no paramétrica, estudia procedimientos que no se refieren a parámetros poblacionales, que además no dependen del conocimiento del comportamiento de la distribución de la población en estudio. Son procedimientos que no son afirmaciones acerca de los parámetros de la población.

53
Ventajas de la estadística no paramétrica 1.- Permiten probar hipótesis que no son afirmaciones acerca de valores de los parámetros poblacionales. 2.- Se pueden utilizar cuando se desconoce la forma de la distribución de la población muestreada. 3.- Son fáciles de calcular, aplicándose más fácil y rápidamente. 4.- Pueden aplicarse cuando los datos son solo categorías o clasificaciones.

Desventajas de la estadística no paramétrica 1.- Analizar información mediante estadística no parametrica, pudiendo usarse la estadística parametrica, produce un desperdicio de información. 2.- En muestras grandes la aplicación de la estadística no parametrica puede ser muy laboriosa.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

PRUEBA DEL SIGNO Esta prueba utiliza a la mediana como medida de tendencia central. Toma su nombre de la utilización de los signos “+” y “-” en lugar de los valores numéricos. En esta prueba se deben de evaluar los datos de tal forma que los que sean superiores a la mediana hipotética se les sustituye con el signo “+” y los que sean inferiores se les sustituye con el signo “-” y a los que tienen el exactamente mismo valor que la mediana se les asigna el valor de “0” (cero). Por lo que los valores “0” se eliminan del analisis y de la muestra -reduciendose el tamaño de la muestra (n). Las hipótesis alternas que pueden ocurrir son: Ha: P(+) > P(-) Ha: P(+) < P(-) Ha: P(+) ≠ P(-) Regla de decisión: Ha: P(+) > P(-). Se rechaza Ho, cuando la probabilidad de observar k, o menos signos menos es menor o igual que α. Ha: P(+) < P(-). Se rechaza Ho, cuando la probabilidad de observar k, o menos signos mas es menor o igual que α. Ha: P(+) ≠ P(-). Se rechaza Ho, cuando la probabilidad de obtener un valor k, tanto o más extremo como el calculado es menor o igual a α/2. La probabilidad se calcula mediante la siguiente fórmula:

54

Ejemplo: Se tomó una muestra aleatoria de 10 alumnos que llevan el curso de verano de bioestadística arrojando los siguientes resultados

HIPÓTESIS Ho: La mediana de la población es de 5 Ha: La mediana de la población es diferente de 5 α = 0.05

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Alum. 1 2 3 4 5 6 7 8 9 10

Calif. 4 5 8 8 9 6 10 7 6 6

Alum. 1 2 3 4 5 6 7 8 9 10

Calif. 0 + + + + + + + + HIPÓTESIS Ho: mediana = 5 Ha: mediana ≠ 5

El valor encontrado cae en la zona de rechazo de la Hipótesis nula (Ho), por lo tanto la mediana tiene un valor diferente de 5.

55

Cuando se tienen parejas de datos, el procedimiento funciona asignando un signo “+” cuando la diferencia “x-y” es mayor y un signo “-” cuando es menor, y “0” cuando la diferencia es de cero.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Ejemplo: Se desea conocer si existe diferencia entre los niveles de ac. Úrico de hombres y mujeres habitantes de la ciudad de San Cristóbal de las Casas. HIPÓTESIS Ho: Las medianas de la población de hombres y mujeres son iguales Ha: Las medianas de la población de hombres y mujeres son diferentes α = 0.05

X ♀ 1.5 2 3.5 3 3.5 2.5 2 1.5 1.5 2 3 2

Y ♂ 2 2 4 2.5 4 3 3.5 3 2.5 2.5 2.5 2.5

signo 0 + + La probabilidad cae dentro de la zona de aceptación de la hipótesis nula (Ho), por lo que se concluye que los niveles de ácido úrico de hombres y mujeres son iguales. HIPÓTESIS Ho: mediana = mediana♂ mediana♀ Ha: mediana♀ ≠ mediana♂ mediana

56

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

PRUEBA DE WILCOXON de calificación con signo Cuando los datos para el análisis son medidos al menos en una escala de intervalos, la prueba del SIGNO no es la más aconsejable; debido a que se desperdicia mucha información contenida en los datos. En estos casos la prueba de WILCOXON puede ser más adecuada, debido a que utiliza las magnitudes de las diferencias entre las mediciones y un parámetro de ubicación dada por una HIPÓTESIS en lugar de los signos de las diferencias. Esta prueba se basa en las siguientes suposiciones sobre los datos: 1.- La muestra es aleatoria 2.- La variable es continua 3.- Los datos se distribuyen simétricamente alrededor de la MEDIA. 4.-La escala de medición es al menos de intervalos Ejemplo: En una investigación en varones con problemas de calvicie, se les midio los niveles de androsterona la cual tiene valores de referencia de (2.0-5.0 mg/dl). Se sospecha que estas personas tienen niveles altos de la hormona por lo que se considera que tienen niveles de 5.05. Los resultados obtenidos fueron los siguientes: Andros. 4.91 4.10 6.74 7.27 7.42 7.50 6.56 4.64 5.98 3.14 3.23 5.80 6.17 5.39 5.77 di=xi-µo -0.14 -0.95 1.69 2.22 2.37 2.45 1.51 -0.41 0.93 -1.91 -1.82 0.75 1.12 0.34 0.72 di 1 7 10 13 14 15 9 3 6 12 11 5 8 2 4 di c/signo -1 -7 10 13 14 15 9 -3 6 -12 -11 5 8 2 4 T+ = 86 T- = 34 T=34 El valor en tabla con n=15 y α/2= 0.0240 (es el valor más cercano en la tabla) es de 25 Por lo que 34 > 25 y no se rechaza Ho Ho: µ=5.05 Ha: µ≠5.05

57

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

MANNPRUEBA DE MANN-WHITNEY Esta prueba utiliza una mayor cantidad de información inherente a los datos y se basa en los rangos de las observaciones. Los supuestos de esta prueba son: 1.- Las muestras (n y m) son extraídas de manera independiente y aleatoria. 2.- La escala de medición es por lo menos ordinal. 3.- Si las poblaciones son diferentes, difieren solo en lo que respecta a sus medianas.

T =S−

n(n + 1) 2

S = suma de los rangos asignados a los valores de “x” n = número de observaciones de la muestra “x”.

Ejemplo: Se desea evaluar si existen diferencias entre los niveles de hemoglobina de personas fumadoras y no fumadoras. Ho: Mx = My Ha: Mx ≠ My

58

T =S−

n(n + 1) 2 15(15 + 1) = 25 2

S = 145

T = 145 −

El valor en tablas (k) con n=15, m=10 y a=0.025 es de 40.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

HIPÓTESIS Ho: mediana x = mediana y Ha: mediana x ≠ mediana y

Se rechaza Ho. La mediana de la hemoglobina de fumadores y no fumadores es diferente.

59

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

PRUEBAS DE ASOCIACIÓN Este estadístico de prueba, permite evaluar la asociación entre 2 variables mediante: independencia: Prueba de independencia: Prueba hipótesis nula para 2 criterios de clasificación y ver si son independientes cuando se aplican al mismo conjunto de entidades. homogeneidad: Prueba de homogeneidad: Se utiliza para evaluar si las muestras extraídas provienen de poblaciones homogéneas con respecto a algún criterio de clasificación.

Vo= Valores Observados Ve= Valores Esperados:

Ha: Hay asociación Ho: No hay asociación Rechazar Ho, si X2calc. ≥ X2tabla Grados de Libertad (g.l.) = (Columnas -1) (Hileras-1)

60

Ejemplo: A 2 grupos de 100 personas de hombres y mujeres cada uno, con diabetes mellitus, se les suministra un nuevo medicamento a ambos grupos, encontrándose en el grupo de los hombres 75 recuperados y en el de las mujeres 65. ¿Existe asociación entre el sexo y la recuperación?

G.L.= (2-1)(2-1)= 1 X20.01/2=7.879 X20.05/2=5.024

Rechazar Ho, si X2calc. ≥ X2tabla De acuerdo a la regla de decisión, se acepta Ho, por lo que no hay asociación entre el sexo y la recuperación del paciente.

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Prueba Exacta de “Fisher” Cuando las frecuencias esperadas son pequeñas (aunque los estadísticos no se ponen de acuerdo se recomienda el criterio de menor de 5 o 3 en una celda), no debe usarse la prueba de chi cuadrada; debiéndose usar un procedimiento alterno llamado “Prueba Exacta de Fisher”. Se considera la suposición INDEPENDENCIA, y se utiliza para la tabla de contingencia de 2x2

MEDICION DE LA ASOCIACION Razón de Riesgo

Razón de Momios

INDICE DE CONCORDANCIA

61

-Escala KappaKappa-

Ejemplo: Se realiza una prueba de concordancia entre el laboratorio A con 14 casos de 100 positivos y el laboratorio B con 10 casos de 100 positivos. Ambos trabajaron las mismas muestras. ¿Cual es el nivel de concordancia de los resultados entre ambos laboratorios?

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Conclusión: La concordancia entre ambos laboratorios es discreta

MULTINOMINALESINDICE DE CONCORDANCIA -MULTINOMINALESEjemplo: Dos patólogos desean saber la concordancia entre el diagnóstico de ambos, por lo que se procedió a que con las mismas muestras ambos procedieran a dar su diagnóstico siendo los resultados los que se muestran en la tabla:

62

INDICES DE VALIDEZ

a *100 a+c d Esp. = *100 b+d a Vp (+) = *100 a +b Sen. = Vp (−) = d *100 c+d

Sen.= Sensibilidad Esp.= Especificidad Vp(+)= Valor predictivo positivo Vp(-)= Vaor predictivo negativo

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

TABLAS

63

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

64

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

65

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

66

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

EJERCICIOS • Supóngase que un investigador está interesado en obtener una estimación del nivel promedio de una enzima en cierta población de seres humanos con un 95% de confianza. El investigador toma una muestra de 10 individuos, determina el nivel de la enzima en cada uno de ellos y calcula la media muestral X= 22. Además, se sabe que la variable de interés sigue una distribución aproximadamente normal con una varianza de 45. Se desea estimar el valor de • Se desea estimar la concentración media de amilasa en suero de una población sana. Las mediciones se efectuaron en una muestra de 15 individuos aparentemente saludables, con una distribución normal. La muestra proporcionó una media de 96 unidades/100ml y una desviación estándar de 35 unidades/100ml la varianza poblacional se desconoce. • Suponiendo que la población de las concentraciones de amilasa en suero, a partir de la cual se extrajo una muestra de tamaño 15, tiene una distribución normal. Construir el intervalo de confianza del 95% para σ2, sabiendo que el valor de s2 = 1225. • El IMSS realizó investigaciones sobre los tipos de circulación sanguínea en el miocardio a personas en el ejido el Edén en el que obtuvo datos con una muestra representativa de n=25 con enfermedad de la arteria coronaria encontrando una desviación estandar de 1.03, presentando una distribución normal. Construir intervalos de confianza para la desviación estandar poblacional • Suponer que se conoce que en una población de mujeres el 90% de las que comienzan su tercer mes de embarazo han tenido algún cuidado prenatal. Si se extrae de esta población una muestra aleatoria de tamaño 200 con distribución normal, ¿Cual es la probabilidad que hayan tenido cuidados prenatales? • Los datos que presentó un laboratorio de análisis clínicos respecto a la fórmula eritrocitica requieren de parámetros que sean representativos de la población a la que prestan sus servicios tanto el químico como el médico, ya que de ello depende que la población reciba la atención y tratamiento adecuado en caso de ser necesario. Estos parámetros son diferentes para cada población considerando que cada uno posee características propias como son la estructura socioeconómica, su educación, su cultura, sus hábitos, sus costumbres y su situación geográfica. • El recuento de glóbulos blancos de una muestra de 10 hombres con algún tipo de leucemia produjo una varianza de 25,000,000. Construir los intervalos de confianza del 95% para δ2 y δ. • Se midieron las concentraciones de hemoglobina en 16 animales infestados con garrapata, registrándose los siguientes valores: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8, 17.5. Construir los intervalos de confianza del 95% para δ2 y δ.

67

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

• En un estudio sobre los tiempos de circulación sanguínea en el miocardio, obteniéndose los tiempos de circulación aparente en una muestra de 30 pacientes con patología en la artería coronaria. La varianza de la muestra fue de 1.03. Construir los intervalos de confianza del 95% para δ2 y δ. • Se llevo a cabo el estudio en 16 municipios de la costa de Chiapas; se tomó una población de 30 individuos para cada sexo escogiendo 2 de cada municipio, prsentando una distribución normal. Las x y la s en la muestra en hombres y mujeres fueron: x 4.9x106 4.2x106 s 357,771 312,418 SEXO Hombres Mujeres

Se desea conocer el intervalo de confianza para la población tomando en cuenta los datos de la muestras en hombres y mujeres (se tiene un 99% de confianza). • Como parte de una investigación nutricional se desean saber cuales son los valores en los que se encuentra la media de glucosa, colesterol, triglicéridos y ac. Urico, en estudiantes de la facultad de Ciencias Químicas. Para lo cual se tomo un na muestra de 24 personas completamente al azar. Suponiendo que los datos presentan una distribución normal, ¿cual es el intervalo de confianza para la media poblacional de cada analito?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 glucosa colesterol trigliceridos ac. Urico 86 187 28 6 81 166 115 7 80 179 189 6 95 197 126 1 84 166 150 3 99 186 111 5 110 145 83 8 108 191 80 6 102 179 155 5 98 184 155 2 97 172 47 6 103 190 56 1 81 193 148 1 86 170 18 6 96 183 53 7 107 144 149 6 81 178 61 2 87 160 120 4 95 146 139 1 103 181 150 6 108 174 10 8 87 151 54 3 102 165 24 6 86 185 47 1

68

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

• El hospital de cancerología en la Ciudad de México ha realizado un estudio acerca del peso en onzas de tumores malignos extraídos a 37 pacientes, con distribución normal. Se desea saber si la media poblacional de hombres y la media poblacional de mujeres son diferentes. Cuando se considera un 95% de confianza y la σ1 = 4.85 y la σ2 = 2.65, respectivamente. HOMBRES 30 35 25 28 27 31 32 25 33 36 32 31 29 28 30 29 31 33 27 28 n1 = 20 30 29 27 26 34 33 28 29 30 31 MUJERES 33 26 32 25 27 28 27 n2 = 17

• Los pacientes con artritis reumatoide presentan el mayor riesgo de desarrollar osteoporosis, la razón de ello no se conocen en parte a las dificultades para evaluar cuantitativamente el metabolismo y contenido mineral del huso. Weisman y sus colaboradores (1986) midieron los valores de calcitocina humana (HCT) en varones y mujeres con artritis reumatoide y en sujetos control igualados en cuanto a edad y sexo que se eligieron entre un grupo de voluntarios sanos. Se quiere comprobar que la media poblacional de mujeres y la de hombres son diferentes (ambas presentan distribución normal). HOMBRES MUJERES 35 35 45 46 46 45 35 35 45 47 47 48 34 35 48 48 45 47 35 47 49 48 37 45 45 49 35 45 46 45 33 48 48 46 32 48 49 47 32 49 47 49 33 47 45 48 n1 = 33 n2 = 33 • En una población se ha padecido, de problemas en niveles sanguíneos (leucocitos) entre el año 2003 y 2004 dicho mal afecta a jóvenes de 18 – 25 años de edad, dicho estudio hecho en la ciudad de Tapachula a los márgenes de esta. Se desea saber si la µ es > a 4000 , con un 95 % de confianza. La población presenta una distribución normal 33 35 31 33 32 35 34 31 31 35 35 31 33 34 32 35 34 33 31 35 Niveles de leucocitos 3500 1500 2500 2500 2500 4500 2500 4500 3500 2500 3500 4500 4500 4500 4500 3500 4500 3500 3500 2500 4500 2500 3500 4500 3500 2500 4500 3500 3500 2500

69

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

• A continuación se muestra una tabla indicando la variación de la Temperatura en algunas regiones del estado de Chiapas de hace varios años a la fecha la temperatura de la tierra a aumentado su temperatura debido a cambios externos climáticos como el fenómeno del niño por tal motivo un grupo de climatólogos predice que la variación de hace unos años al actual de que aumenta. Las lecturas presentan una distribución normal • Helmerich y colaboradores (1987) dirigieron un estudio para evaluar el riesgo de trombosis venosa profunda en relación con el uso de anticonceptivos orales. Mostraron interés especial en el riesgo relacionado con una dosificación baja (menos de 50 MG de estrógeno) y circunscribieron sus estudios a 30 mujeres menores de 50 años de edad, de las cuales 12 presentaron la enfermedad. Los datos arrojados por la Secretaria de Salud indican que 9 de cada 30 mujeres encuestadas han presentado la enfermedad. La población presento ua distribución normal • En trescientos pacientes deseamos investigar los efectos de dos tratamientos sobre los tiempos medios de recuperación de pacientes con cierta enfermedad. Estos 300 pacientes se dividieron aleatoria mente en 2 grupos iguales, presentandouna distribución normal. El primer grupo de 150 pacientes, cuyos elementos recibieron un tratamiento normal, 110 se recuperaron en un plazo de 5 días. El otro grupo de 150 personas que se trato con un nuevo método, 86 se recuperaron en 5 días • Se estudia a dos poblaciones de diferentes grupos etnicos en el estado de Chiapas (altos y costa) y se desea saber si sus niveles de colesterol son iguales, para lo cual se hizo el estudio que arrojo los siguientes resultados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Altos 187 166 179 197 166 186 145 191 179 184 172 190 193 170 183 144 178 Costa 194 155 172 140 181 141 179 188 156 152 170 171 174 174 173 168 168

70

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

18 19 20 21 22 23 24

160 146 181 174 151 165 185

149 176 165 165 160 142 142

Diseño Completamente al Azar 1. Los niveles de estrógenos (E4) en mujeres durante la ovulación es de 280 pg/ml en promedio. En un estudio se les determino los niveles de E4 a mujeres de 3 distintas edades (20, 30 y 40 años aprox.), dando como resultado los valores que en la siguiente tabla se presentan: 20: 30: 40: 437, 380, 400, 420, 350, 370, 400. 250, 300, 320, 325, 290, 270. 122, 180, 200, 150, 190.

¿Influye de alguna forma la edad en la producción de E4? Explique 2. Se evalúa un tratamiento con la hormona T3 en pacientes con problemas de estatura a 3 diferentes dosis. La población fueron varones con edades de los 18 a los 25 años. se midió en “cm” el aumento de estatura dando como resultado los siguientes datos al año de estar con el tratamiento T1 T2 T3 5, 7, 4, 5, 5. 4, 4, 5, 6, 6, 4. 4, 5, 7, 6, 7.

71

¿Existen diferencias significativas en la ganancia de altura entre los tratamientos? Explique 3. El ruido producido por el motor de un vehículo no debe de exceder los 30 decibeles. 4 compañías indican que sus motores son los que poseen los índices más bajos de contaminación sonora (ruido), para tal efecto se tomaron muestras de varios automóviles y los resultados se presentan en la siguiente tabla: A 40, 45, 48, 36, 32. B 38, 30, 47, 43. C 48, 40, 40, 39, 35. D 42, 41, 47, 48, 40 A que conclusión puede llegar. Explique 4. Se considera que la población joven de los países latinoamericanos se concentra en los lugares más urbanizados. En un estudio en la República Mexicana, se seleccionaron 3 sitios al azar siendo estos: Campeche, Guadalajara y Veracruz. En los cuales se muestreo gente al azar, a la cual se les pregunto su edad, siendo los resultados:

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Guadalajara: 22, 36, 40, 18, 25. Campeche: 32, 41, 56, 28, 37, 43. Veracruz: 18, 25, 32, 14, 29. A que conclusión llega con este estudio. Explique. 5. El promedio de la frecuencia respiratoria es de 12/min. en reposo. Se estudia a un grupo de personas para determinar si la complexión es un factor en la frecuencia respiratoria. Se tomaron muestras al azar de los 3 tipos de complexiones y los resultados fueron los siguientes: Delgados: 12, 13, 14, 15, 14. Medianos: 13, 12, 12, 14, 13. Gruesos: 16, 15, 14, 15. Cual es su conclusión. Explique.

Diseño de Bloques al Azar 1. Tres empresas (A, B y C) concursan para venderle a la policía un equipo para la determinación de alcohol en el aliento. Los equipos son de diferentes precios, por lo que se hace una prueba con un equipo de cada compañía para determinar si existe diferencia entre estos. La prueba consiste en la medición de metanol (Valor de Referencia < 0.80 p.p.m.) al personal de oficina de la policía de diferentes edades. Los resultados obtenidos fueron: Empresas A B C I 0.90 0.80 0.70 II 0.70 0.70 0.60 III 0.70 0.60 0.80 IV 0.60 0.70 0.70 Existen diferencias en las mediciones de metanol con los equipos. Explique Edades

72

2. El nivel máximo en la atmósfera de dióxido de azufre (SO2) recomendado por la OMS es de 40 gr/m3. Se considera al Distrito Federal la ciudad más contaminada del país; para comprobarlo se toman muestras de 4 de las ciudades con mayor número de habitantes del país (Distrito Federal, Monterrey, Guadalajara, Tijuana) durante una semana y se obtuvieron los siguientes resultados: Días 1 2 3 4 5 6 7 D.F. 82 90 71 60 75 100 110 Ciudades MTY GDA 70 74 82 68 75 90 88 TJA 67 49 54 72 94 98 85 61 53 48 45 67 62 49

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

En base a los resultados obtenidos concluya. Explique

3. La presión arterial promedio de un individuo es de 100 (80-120). Se toman muestras de las tres zonas del estado (Altos, Centro y Costa) a individuos seleccionados al azar de diversas edades y se les mide la presión arterial para determinar si la altitud a la que viven influye en está presión. Los resultados obtenidos son: Edades I II III IV V • ¿Es la altitud un Explique. Zonas ALT CEN COS 110 95 100 115 98 98 105 102 94 108 104 99 104 100 92 factor que influya en la presión arterial de los individuos?

• ¿Es la edad un factor que influya en la presión arterial de los individuos? Explique. En base a lo anterior concluya. 4. En la Ciudad de México el número de defunciones por mes atribuidas a la contaminación ambiental son de aproximadamente 1000. Se hace un estudio en tres ciudades del país (Mérida, Oaxaca y Tijuana) para determinar si el índice de mortalidad por efecto de la contaminación es el mismo entre las diferentes regiones del país. Para tal efecto se registraron el número de defunciones (por contaminación) por mes durante cinco meses, obteniéndose los siguientes datos: Ciudades MDA OAX TJA I 400 357 800 II 300 421 725 III 600 480 1005 IV 457 300 930 V 525 500 915 • ¿Fuera de la Ciudad de México los índices de mortandad son parecidos entre las diferentes regiones de la República? Explique y concluya. 5. Un experimento sobre adicciones se realizo en una población de adultos farmacodependientes con diferentes niveles de adicción y de diferentes edades a los cuales se les retiro la droga para establecer el número de días que lograban aguantar sin el consumo de esta. Los resultados fueron los siguientes: Meses

73

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

Niveles de Adicción Alt Med I 12 14 II 10 8 III 12 10 IV 8 8 V 4 5 • ¿Existe diferencia para aguantar la abstinencia del acuerdo a los niveles de adicción? Explique.

Edades

Baj 15 13 10 9 7 consumo de droga de

• ¿Existe diferencia para aguantar la abstinencia del consumo de droga de acuerdo a las diferentes edades considerando que se tienen agrupadas de menor a mayor edad? Explique En base a lo anterior concluya.

Diseño en Cuadrado Latino 1. Se evalúa un nuevo combustible (gasolina + alcohol) para automóviles, por lo que se hace una evaluación con tres marcas distintas de autos (A, B y C), con tres diferentes motores (I, II y III) por marca. Para la prueba se usan 3 diferentes concentraciones (t1, t2 y t3) de alcohol en la gasolina. Obteniéndose los resultados en rendimiento (km/lt), siendo estos: Marcas A B C I t1-12.0 t2-14.0 t3-13.0 II t2-13.5 t3-14.2 t1-13.6 III t3-12.0 t1-10.0 t2-14.2 • ¿Existen diferencias entre las diferentes concentraciones de alcohol en el rendimiento (km/lt)? Explique. • ¿Existen diferencias entre las diferentes marcas de los autos en el rendimiento (km/lt)? Explique. • ¿Existen diferencias entre los diferentes motores en el rendimiento (km/lt)? Explique. En base a lo anterior concluya. 2. Se evalúan cuatro vacunas (t1, t2, t3 y t4) contra la brucelosis en ganado bovino de diferentes razas (A, B, C y D) y edades (I, II, III y IV). Se manejaron lotes de 25 animales por raza y edad. Se evaluaron al año de la aplicación de las vacunas, habiendo recibido un manejo Sanitario y Zootécnico normal. Se procedió a cuantificar el número de animales vacunados que contrajeron la enfermedad, obteniéndose los siguientes resultados Motor

74

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

• • •

Razas A B C I t1-18 t2-16 t3-12 II t4-22 t1-17 t2-18 III t3-11 t4-17 t1-19 IV t2-19 t3-18 t4-19 ¿Existen diferencias entre las diferentes Vacunas? Explique. ¿Existen diferencias entre las diferentes Razas? Explique. ¿Existen diferencias entre las diferentes Edades? Explique. En base a lo anterior concluya.

Edad

D t4-21 t3-19 t2-17 t1-20

3. Se evalúan 4 diferentes insecticidas (t1, t2, t3 y t4) durante 4 semanas (I, II, III y IV) en 4 especies de Triatominos (A, B, C y D). Los resultados obtenidos se dieron en relación al número de triatominos encontrados muertos, siendo estos: Especies A B C I t1-12 t2-9 t3-6 II t4-6 t1-14 t2-10 III t3-5 t4-7 t1-11 IV t2-9 t3-5 t4-7 ¿Existen diferencias entre los diferentes Insecticidas? Explique. ¿Existen diferencias entre las diferentes Especies? Explique. ¿Existen diferencias entre las diferentes Semanas? Explique. En base a lo anterior concluya. 4. Se evalúan 3 medidas contra la contaminación ambiental (t1, t2, y t3), en diversas ciudades del país (A, B y C), durante 3 semanas (I, II y III). El parámetro a medir fue el S02 en g/m3, (Índice recomendado 40g/m3) los resultados obtenidos fueron los siguientes: Ciudad A B C I t1-80 t2-69 t3-71 II t3-93 t1-83 t2-72 III t2-85 t3-88 t1-69 • ¿Existen diferencias entre las diferentes Medidas contra la contaminación? Explique. • • ¿Existen diferencias entre las diferentes Ciudades? Explique. ¿Existen diferencias entre las diferentes Semanas? Explique. En base a lo anterior concluya. Semanas Semanas D t4-7 t3-4 t2-8 t1-12

75

• • •

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

5. Se prueba una hormona sintética de la somatotropina bovina (STB), la cual es inductora de la producción de leche. Se prueba en un lote de vacas cebú con edades de 3, 4 y 5 años y con pesos de 400, 450 y 500 kg a 3 dosis diferentes de la STB. Los resultados fueron los aumentos en la producción de leche en Kg., siendo estos: Edad Pesos 400 450 500 3 t1-0.5 t2-0.8 t3-1.2 4 t3-1.3 t1-1.6 t2-1.8 5 t2-2.0 t3-2.5 t1-2.5 ¿Existen diferencias entre las diferentes Dosis de STB? Explique. ¿Existen diferencias entre las diferentes Edades? Explique. ¿Existen diferencias entre los diferentes Pesos? Explique.

• • •

En base a lo anterior concluya.

PRUEBAS DE ASOCIACIÓN 1.Una industria farmacéutica probó Vo curados No curados un nuevo fármaco para el control de la 20 30 Machos fiebre causado por el resfriado en 100 28 22 Hembras ratones. Se está interesado saber si el 48 52 sexo influye en el metabolismo del fármaco, para ello se dividió la población equivalentemente obteniéndose:

50 50 100

76

2.Un químico realiza la prueba para la Vo Plantas Plantas certificación de un nuevo agroquímico para logradas no logradass 81 300 el control de la plaga de la sigatoca en el EQ-730 219 ZR-1 201 99 300 plátano de la variedad gran enano. Para ello 420 180 600 la comparó con otro agroquímico ya certificado, el EQ-730. En un sembradío de 300 plantas para cada agroquímico se arrojaron los siguientes resultados:

3.Se desea saber si el síndrome de Down está en función del sexo, para ello se realizó un estudio en un hospital de los Estados Unidos de América, encontrándose que en los nacimientos de este año:

Vo Hombres Mujeres

Con S.Down 19 23 42

Sin S.Down 31 27 58

50 50 100

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

4.Se desea saber si la sensibilidad y especificidad de la prueba de brucelosis, por el metodo rosa de bengala, comparandola con la prueba confirmativa de rivanol, los resultados ueron los siguientes:

Rosa de Bengala Positivo Negativo

Rivanol Positivo 6 2 8 Negativo 6 11 17

12 13 25

5.Se desea saber la concordancia entre el resultado de 2 laboratorios de patología animal, uno en Tapachula y otro en Huixtla, sobre la prueba de tuberculosis, los resultados fueron los siguientes:

Huixtla

Tapachula Positivo 12 3 15 Negativo 6 9 15

Positivo Negativo

18 12 30

6.- Un estudio de 190 embarazos proporcionó los siguientes datos sobre la relación que existe entre la hipertensión de la madre y cierta complicación del embarazo. 7.- Una muestra de 150 portadores de Hepatitis C, y una muestra de 500 no portadores, revelaron la siguiente distribución de los grupos sanguíneos.

77

8.- A un grupo de 350 adultos, se les con problemas de sobrepeso se les pregunto si llevaban o no dieta. Las repuestas en base al sexo son las siguientes:

Bioestadística Elemental en el Área de la Salud
Miguel Ángel Rodríguez Feliciano

BIBLIOGRAFÍA
• • • • • • • • • • BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS. DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA. ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA. MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V. JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS. MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL. MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL. PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS, TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V. SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO INTERAMERICANO. STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS, MÉXICO, ED. MC GRAW HILL, WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED. MCGRAW-HILL.

78