You are on page 1of 7

5.

ESTADISTICA APLICADA A RIESGO Y PREVENCIN


Analizar la distribucin de una variable con relacin a otra u otras, es una tarea corriente en Medicina y Salud Pblica, vinculada, la mayora de las veces, a la bsqueda de un patrn que indique la relacin, entre las variables estudiadas. Este es un proceso clave en la identificacin de las posibles causas de los problemas de salud, y tambin de factores que, aun cuando no puedan ser finalmente considerados causales, resulten estar asociados a estos daos y constituyan importantes elementos prcticos para la identificacin de grupos con mayores riesgos de padecerlo. El estudio de la influencia de una variable (variable independiente) sobre la forma en que se modifica otra (variable dependiente) es un estudio comparativo que se denominar bivariado cuando slo se relacionen dos variables, una independiente y una dependiente y multivariados cuando el mismo estudio se evalen de forma simultnea el efecto de ms de dos variables.

5.1 Estudios Bivariados


Los tpicos estudios bivariados evalan el efecto de una variable que se denominara factor de exposicin (variable independiente) sobre una segunda que expresar el evento producido o relacionado con la anterior (variable dependiente).Esta relacin se puede presentar de manera muy clara en una tpica tabla de contingencia ya que en el caso ms comn ambas variables se expresan en escala nominal, (presencia o ausencia del factor causal y presencia o ausencia del evento).

5.1.1 Tablas de 2 x 2
Las tablas de contingencia (tablas de doble entrada) son una herramienta fundamental para este tipo de anlisis. Estn compuestas por filas (horizontales), para la informacin de una variable y columnas (verticales) para la informacin de otra variable. Estas filas y columnas delimitan celdas donde se vuelcan las frecuencias de cada combinacin de las variables analizadas. En el EPIDAT 3.1 estas tablas se construyen considerando que en las filas identifican el nivel de exposicin a la variable en estudio y las columnas la categora en relacin a la enfermedad (y las personas-tiempo en el caso de utilizar tasas de incidencia). El investigador plantea las dos hiptesis, la hiptesis nula que indica que no existe asociacin entre ambos factores (factor de exposicin y evento) y ambas variables son independientes entre si. Esto significara tambin que ambos grupos con o sin ese factor responden igual en relacin con ese evento, ya que presentan una frecuencia que no es muy diferente entre ambos grupos. Por otro lado la hiptesis alternativa postulara lo contrario. Una vez cargados los datos en la tabla de contingencia podemos encontrar diversos resultados que nos informan acerca de esta relacin, algunos como simples frecuencias con sus intervalos de confianza que pueden darnos una respuesta al comparar la posibilidad de encontrar cifras muy diferentes entre ambos grupos y tambin medidas de asociacin tpicas. Estas ltimas medidas, estn basadas en la comparacin entre las frecuencias del dao en diferentes grupos, pueden realizarse a travs de razones (razn de prevalencias, riesgo relativo, odds ratio) cuya eleccin depende del diseo utilizado en el trabajo.

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

27

Las diferencias de porcentaje entre los dos grupos y la probabilidad de encontrarla se mide como siempre en base al estadstico adecuado que trasforma los resultados en probabilidades. En este caso el estadstico que se utiliza dado ya que son dos grupos independiente con variables medidas en escala nominal es el Test de Chi cuadrado. Dado que se usa una tabla de 2 x 2 se comete un error que se subsana gracias a la Correccin de Yates que es el resultado que debe elegirse cuando se trabaja con tablas de 2 x 2. En general, la mayora de los investigadores trabajan con un nivel de significacin del 5% (equivalentemente, con un nivel de confianza del 95%), por lo que aceptan que existe asociacin entre las variables estudiadas cuando el valor de p es menor que 0,05. Surge un problema especial cuando las muestras son muy pequeas pueden darse dos situaciones que alguna celda tuviera un valor igual a cero, lo cual impedira hacer las cuentas para determinar el Chi cuadrado. El EPIDAT 3.1 permite, de forma opcional, sumar 0,5 a todas las frecuencias de la tabla en el caso de que alguna de ellas sea igual a cero. Si no se activa esta opcin, el programa slo presentar aquellos resultados susceptibles de ser computados.Otra situacin puede darse en caso de muestras muy pequeas. Puede ser que alguna celda no complete el valor esperado necesario para aplicar el Chi cuadrado. Todo paquete estadstico avisa de esta situacin y en ese caso debe usarse el resultado del Test exacto de Fisher. El resultado obtenido se evala de manera similar al Chi indicando diferencia ms all del azar si se obtienen una p menor de 0,05. Las medidas de asociacin (razn de prevalencias, riesgo relativo, odds ratio) son razones que indican cuantas veces ms o menos aparece ese evento en un grupo, que en el otro frente al cual se compara. Para ello, ya que todo se mide en muestras extractadas de la poblacin, es necesario que el intervalo de esa medida de asociacin elegida no contenga al 1, que en una razn es el valor nulo. Es el resultado que se obtendra de la divisin de ambas frecuencias si estas fueran iguales, y lo que aqu se quiere demostrar es que un grupo es diferentes del otro. Estos diseos de exposicinenfermedad, son muy utilizados para evaluar riesgos e implementar medidas de prevencin, pero tambin pueden utilizarse para evaluar la relacin con un factor beneficioso como una medida preventiva positiva o inclusive un tratamiento y comprobar si se producen cambios en el grupo tratado, en mayor proporcin que en el no tratado. La diferencia es que aqu en vez de encontrarse el evento en mayor proporcin en el grupo con el factor, se encontrara al contrario en menor proporcin y la medida de asociacin en vez de tener un valor mayor que 1, tendra un valor menor que 1. Los paquetes estadsticos propios del rea de salud permiten incorporar los datos mediante tablas, lo cual facilita la comprensin de la situacin, algunos dan todas las respuestas posibles y el investigador debe elegir la medida de frecuencia o de asociacin adecuada en relacin al diseo que utiliz para obtener esos datos. El EPIDAT acta en forma diferente, solicita esa informacin al principio y luego entrega los resultados utilizando ya la medida correspondiente de acuerdo al diseo utilizado. Previamente el investigador elige la opcin de acuerdo al diseo de su investigacin El EPIDAT diferencia cuatro opciones de tablas 2x2 destinadas a cuatro diseos de estudios epidemiolgicos: Estudio transversal Estudio de cohortes Para tasas de incidencia Para incidencia acumulada Estudio de casos y controles Estudio de casos y controles emparejados

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

28

Presentaran dos clases de resultados de hedidas de frecuencia y de medidas de asociacin y medidas de avocacin. Las medidas de asociacin se explican en el primer cuatrimestre, as que ahora solo nos avocaremos a las otras dos Medidas de frecuencia - Casos (Prevalencia o incidencia) de enfermedad en expuestos y no expuestos. - Casos (Prevalencia o incidencia) de exposicin en enfermos y no enfermos. Estas tasas miden el nmero de personas que presentan y no presentan el factor de exposicin y las que presentan y no presentan el dao en el momento del estudio en cada grupo (expuestos y no expuestos) en comparacin con el total de la poblacin en ambos grupo. El resultado se obtendr en incidencia en el caso de diseos prospectivos porque son casos nuevos que van a apareciendo y en prevalencia en el caso de diseos retroprospectivos. Medidas de significacin estadstica Test Ji-cuadrado de asociacin, con y sin correccin. Prueba exacto de Fisher y valor de p unilateral y bilateral. Se encontrar concordancia con el hecho que el intervalo contenga al valor 1, con un resultado de la medida de asociacin que no indique diferencia significativa (p>0,05), lo cual es lgico porque ambos significan que no hay diferencia entre los dos grupos. Cuando ambos extremos del intervalo de confianza estn a uno u otro lado de 1, el valor de p ser menor que 0,05, en tanto que si un extremo est por debajo de 1 y el otro por arriba, p ser superior a 0,05. Segn los valores se usar Chi 2 o el Test de Fisher.

5.1.2 Tablas de 2 x N
Puede ser que el factor de exposicin variable independiente, fuera medida en escala ordinal y tuviera varias categoras: En este caso donde se evala el nmero de enfermos y sanos pero en diferentes niveles de exposicin se pueden utilizar las tablas de 2 x N. Es necesario elegir un nivel como de referencia que generalmente se toma el nivel 1 Por ejemplo con un nivel bajo, medio y alto de exposicin cual sera las tasas de afectados en cada caso. En este caso se supone que ira aumentando partir del nivel 1. Podra encontrarse que si uno divide en muchos niveles no se encontrar diferencia significativa entre cada uno de los grupos pero se viera que cada vez se va ampliando la diferencia entre los grupos de los diferentes niveles, para eso el EPIDAT realiza el Test de Chi 2 de tendencia lineal El test de Chi2 de homogenidad me informa si se encuentra diferencia entre los niveles y el test de Chi2 de tendencia lineal, si existe una relacin lineal con respecto al nivel tomado como referencia, dando un resultado ms significativo cuando ms lineal es esa tendencia. Ciertas exposiciones presentan una asociacin con un dao determinado en forma de J o de U. La forma de J se encuentra por ejemplo, cuando aumenta la proporcin del evento a medida que aumenta el nivel de exposicin, pero luego se detiene o disminuye el aumento. En el caso de estar evaluando un factor protector se detendra la disminucin lineal que se estaba obteniendo sobre el efecto adverso o la curva se estabilizara en un valor determinado a pesar de seguir aumentando el nivel o dosis de ese factor.

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

29

Una asociacin en forma de U significa que ambos extremos en los niveles de exposicin presentan mayor mortalidad que alguno de los valores intermedios. Los nios de bajo peso al nacer, y tambin los de alto peso, tienen mayor mortalidad que los de peso adecuado, o las madres muy jvenes y tambin las ms adultas. En estos dos casos se buscar usar como referencia aquel nivel que represente la situacin de menor riesgo. Tambin se podra en forma adicional, dar un peso a cada categora de exposicin para el clculo de la prueba de tendencia lineal, que permitira valorar la hiptesis de ausencia de tendencia lineal en el crecimiento del riesgo a medida que aumenta la exposicin. El mtodo usual para definir las puntuaciones consiste en asignar los valores 1,2, ..., N, respectivamente, a los N niveles; si la exposicin est medida en escala continua, otra posibilidad es asignar a cada categora de exposicin el punto medio del intervalo. Recordar que ms que de las puntuaciones asignadas a cada nivel, la prueba de tendencia depende de la distancia entre los valores numricos definidos. Por ejemplo, en el caso de 3 niveles de exposicin, la prueba produce el mismo resultado con puntuaciones 1, 2 y 3 que con 10, 20 y 30, porque en ambos casos la distancia entre valores es constante; sin embargo, se obtendra un valor diferente si se asignaran los valores 1, 10 y 100 (diferencia de distancia entre las puntuaciones). Cuando el resultado de esta prueba genera una p con un valor pequeo (menor que 0,05) se considera que hay una alta posibilidad de que exista una tendencia lineal en la que a mayor exposicin aumente el riesgo o la proteccin, segn lo que se est evaluando.

5.1.3 Tablas M x N
Una tabla de contingencia M x N se obtiene cuando se clasifican los individuos de una muestra con respecto a dos variables cualitativas con M y N categoras respectivamente. Esta clasificacin debe ser exhaustiva y mutuamente exclusiva, lo que significa que cada individuo ha de poder asignarse a una de estas M x N categoras, y slo a una. El submdulo de Tablas M x N del EPIDAT, permite analizar 2 variables nominales u ordinales en tablas de hasta 20 columnas por 20 filas. En general, la cuestin ms importante que se plantea ante una tabla de contingencia es si las variables son independientes o no. Para resolver esta cuestin se han propuesto diversas prueba entre ellas el Chi 2 y el de Fisher, de los cuales ya hablamos y el test de tendencia lineal, que contrasta la hiptesis de que los porcentajes, calculados para cada columna, tienden a aumentar o disminuir a lo largo de la primera fila o, equivalentemente, de la segunda fila.

5.2 Estudios multivariados


Es comn sobre todo en caso de riesgo que para determinado evento se evale ms de un factor de exposicin, inclusive para observar la incidencia de alguna variable confusora. Si se trata slo de un factor se pueden utilizar las tablas estratificadas, si se van a evaluar varios factores ya se debera utilizar un anlisis multivariado, del tipo de una regresin mltiple o logstica.

5.2.1 Tablas 2x2 estratificadas


La relacin ente dos variables de estudios la independiente (factor de exposicin) y la dependiente (evento o dao) es en ocasiones modificada por la presencia de un tercer factor, conocido como factor de confusin.

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

30

Existen diferentes estrategias para controlar este efecto y una de ellas es la estratificacin. Donde se dividira a los individuos del estudio en dos estratos (con y sin la variable confusora) y se observara si se modifica la relacin, al cual puede disminuir o incluso desaparecer. El anlisis por estratos hace evidente que esa variable confusora ha distorsionado la relacin entre las otra dos variables que se queran relacionar .El anlisis individual de cada estrato debe ser complementado con un anlisis que estime el efecto general considerando los valores de cada estrato. Este puede realizarse por el mtodo de Mantel-Haenszel que es uno de los ms tiles para esta clase anlisis. La existencia de diferencias entre los resultados de un anlisis no estratificado y uno estratificado estar mostrando que el factor por el que se estratific ejercera un efecto de confusin en la relacin. Si bien es posible la estratificacin conjunta de varios factores con el objetivo de controlarlos o ajustarlos simultneamente la generacin de varios estratos disminuye notablemente el tamao muestral de cada estrato, lo que hace en extremo inestables las estimaciones realizadas al interior de cada estrato y por eso slo se utiliza en el caso de evaluar una sola variable confusota EL EPIDAT 3.1 permite la realizacin de tablas 2x2 estratificadas para estudios transversales, de cohortes (con incidencia acumulada o con tasas de incidencia), y de casos y controles. Estos resultados incluyen una tabla global (suma de los estratos), el odds ratio e intervalo de confianza (calculado segn el mtodo de Woolf) para cada estrato, el odds ratio de la tabla global (odds ratio crudo) y el odds ratio combinado (mtodo de Mantel-Haenszel) y ponderado por el mtodo del inverso de la varianza. Adems, se presentan las pruebas de homogeneidad entre estratos y de asociacin de Mantel-Haenszel. La diferencia entre el odds ratio crudo y el combinado de Mantel-Haenszel confirma el efecto de confusin que ejerce la variable por la que se estratifica. La prueba de homogeneidad permite examinar las diferencias entre los odds ratio de los estratos. Finalmente, la Prueba de asociacin de Mantel-Haenszel, con un valor de p por arriba de 0,05, seala la falta de asociacin entre la exposicin y el dao. 5.2.2 Regresin mltiple y logstica Conceptos generales Entre los propsitos de muchas investigaciones epidemiolgicas se halla el establecimiento de factores causales o relacionados con el evento que se quiere investigar. El examen se realiza tpicamente en un marco complejo, donde la coexistencia de factores mutuamente relacionados determina el comportamiento de otros. Para sondear o incluso desentraar la naturaleza de tales relaciones, el investigador puede auxiliarse, entre otras alternativas, del anlisis de regresin.

Puede utilizar dos mtodos la Regresin mltiple y la Regresin logstica. En ambas el investigador trata de construir un modelo explicativo proponiendo diferentes variables independientes para ver cual es su peso en la produccin de la variable dependiente o desenlace. Cuando la variable desenlace se mide en escala cuantitativa se utiliza la Regresin lineal mltiple, cuando la variable desenlace se mide en una escala nominal, ya sea politmica (admite varias categoras de respuesta, tales como mejora mucho, mejora, se mantiene igual, empeora, empeora mucho) o dicotmica que es caso ms usual (admite slo dos categora de respuesta, por ejemplo enferm o no se enferm) se utiliza una Regresin Logstica. La primera se usa mucho en variables clnicas, por ejemplo se arma un modelo incluyendo variables para ver como inciden en la variable desenlace que podrir ser el valor de colesterol medido en

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

31

escala cuantitativa. Sin embargo en Epidemiologa y Salud Pblica se utiliza mas la regresin logstica porque se usa medir los eventos en escala nominal dicotmica. Por ejemplo averiguar que variables inciden en determinado desenlace, ya sea vida o muerte, enfermedad o no enfermedad, rechazo de un rgano o no rechazo, etc. En ambos modelos las variables causales cuantitativa. El investigador va probando independientes hasta conseguir el modelo variables, desechando del mismo aquellas variable desenlace. peuden estar medidas en escala nominal, ordinal o diferentes modelos donde va incluyendo variables mas capacidad explicativa con menor cantidad de variables que demuestran no tener relacin con la

Conceptos nuevos Factor de exposicin evento o dao Tablas de 2x2- 2xN y MxN Tablas simples y estratificadas Mtodo de Mantel-Haenszel Tablas de contingencia Razn de prevalencias, riesgo relativo, odds ratio Test de Chi cuadrado Chi2 de homogenidad y de tendencia lineal Test exacto de Fisher Coeficiente de correlacin por rangos de Spearman Regresin lineal mltiple Regresin logstica

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

32

PROHIBIDA SU REPRODUCCIN- Dra. Laura Moratal Ibaez

33

You might also like