You are on page 1of 247
Metodologia de la investigacién epidemiolégica Juan Luis Londofio Fernéndez Editorial Universidad de Antioquia _ . Totroduccién E libro que oftezco ;2 los lectores interesados en la metodologia de la investigacién epidemiiglégice es el fruto de mis aflos de labor como inves- tigador y como aie in las cdtedras de epidemiologia y metodologia de la investigacién en la Facultad Nacional de Salud Péblica de la Universi- dad de Antioquia y de varias facuitades de medicina. La obra tiene como motivacién y como objetivo principai contribuic a la formacién de investigndores para que, con una sélida fiindayiitntacién cientifica, puedan aproximarse al estudio de la realidad epidemiolégica de los paises de habla hispana. Esté dirigido en particular a profesionales del 4rea de ta salud que descen profundizar en la metodologfa basica de la investigacion epidemioidgica: no obstante, los métodos que en él se descri- ben pueden ser utilizados productivamente por profesionales que. desarro~ an su labor investigativa en otros campos del saber. La metodologia que se presenta en el texto es, en buena parte, aque- la que ha susgido como fruto del proceso de desarrollo de Ia epidemiclo- ga como disciplina cientffica en ¢] tascurso de los afios y que todo docente o investigator en epidemiolog{a debe conoces. Sin embargo, ella no cubre todos los aspectos relacionades con Ja investigacién epidemiolé- gica; en particular, no incluye métodos propios de las ciencias sociales ta- les como la sociologfs, 1a antropclogfa o la comunicacién, disciplinas importantes en e] esmdio de muchas situaciones en salud piiblica. Debidc a 1a naturaleza misma de la investigacién epidemiolégica y a In clara dependencia de ésia del lenguaje estadistico, para la comprension del texto se hace imprescindible una capacitacién previa en estadistica bé- sica; la obra se desnrrolla desde un nivel general hacia uno més cepectfico que demanda ¢] dominio de algunos conceptos de mayor complejidad. Los capitulos 1 y 2 preseatan una visién general de la investigacién epidemiolégica wadicional y de Jos concepios fundamentales en los que ella se sustenta; en los capftulos 3, 4 y 5 se describen las principales estra- tegias o disefios que han caracterizado la investigacin epidemiolégica —es- tudios experimentales, de seguimiento y de casos y contrales— y para cuya cabal comprensién se requiere un nivel bésico de estadistica con énfasis en et manejo de Jas distribuciones muestrales de medias y de proporciones. Bn e] capftulo 6 se sefialan los errores més importantes que pueden afectar Ja investigacién epidemiolégica, y cn los capitulos 7, 8 y 9 sc de- tallan importantes estrategias para el control de Jos ernores debidos a fac- tores extraiios: el ajuste de tasas, el andlisis estratificado y el equiparamiento, Estos capitulos suponen un buen conocimiento de la esta- distica inferencial por parte del lector. Para Ja total comprensién de] capftulo 10, que se refiere al anélisis multivariado se requieren conocimientos previos de los fundamentos del anflisis multivariado clisico y del andlisis de Ja varianza; al igual que para Jos modelos multivariados aplicados a jos estudios de supervivencia, que se presentan en el capitulo 12, * El capfewlo 11, en el que se discuten los estudios ecolégicos, supone una buena comprensién de los conceptos de regresién y correlacién, y el ifltimo capftulo, que se refiere al problema del tamaiio muestral, supone un buen conocimiento de las principales distribuciones probabilfsticas, tema comin en los cursos bsicos de estadistica. Quiero agradecer a Jas istituciones y a las personas que contribuye- ron a mi formacién en el campo de Ja epidemiologia y a las que me ayu- daron y animaron para la publicacién de esta obra. En particular, al doctor Luis Fernando Duque Ramirez. quien inicialmente me invité a formar parte del cuerpo de profesores de la Facultad y me oftecié Ja posibilidad de realizar investigacién epidemiol6gica; a la Universidad de Antioquia y a la Organizacién Panamericana de la Salud que hicieron posibles mis estudios de posgrado en salud publica en Ja Universidad de Carolina del ‘None (Chapel Hill) y al doctor Luciano Vélez Arroyave quien desde la decana- tura de la Facultad respald tal inicintiva; a la doctora Helena Espinosa de Restrepo quien contribuy6 a mi capacitacién como asistente de investiga~ cién en la Universidad de Lousiana en New Orleans y a los dociores Her- nando Molina Saldarriaga y Francisco Yepes Lujan quienes, junto con la Organizacién Panamericana de 1a Salud, apoyaron un programa de trabajo en investigacién que realicé en la Universidad de. Cambridge, Inglaterra. De manera especial deseo agradecer al doctor Kahl Martin Colimén Por su amable y permanente estimule-y por el trabajo que se tomé al re- visar el bortador del libro, al cual hizo valiosas sugerencias. A Ja licenciada Gabriela Ospina de Arboleda por su noble y desinteresado apoyo, a la li- Senciada Marfa Eugenia Mazuera del Hierro y al profesor Alvaro Mufoz de la Universidad de Johns Hopkins quienes revisaron el borrador y tam-. bién aportaron valiosos y estimulantes comentarios. Agradezco también a los profesores y estudiantes que a través de mi Carrera hag contribuido con su labor al desarrollo de muchas de las ideas que forman parte de la obra. Deseo también agradecer a mi secretaria, se- fora Doris Cardona Arango, por la esmerada trasctipcién de algunos capi- tulos. Es mi mayor’ deseo que ei libro que aqui presento sea una ayuda para todos los que desde la invéstigacién epidemiclégica pretenden contsi- buir al bienestar de rivestras’ poblaciones. Medellin, diciembre de 1994 Juan Luis Landoito F. investigacion epidemiologica En el presente capttiio se describe el campo de acci¢n de 1a epidemio- {ogia y, en particular, el de 1a investigacién epidemiolégica; se propo- ne una clasificatién de los factores que son objeto de esta iiltima: se Sefialan las propiedades de ia investigacién etiol6gica y, finalmente, se resenta una tipologia de los estudios cpidemioKigicas. L. epidemiologia es una rama aplicada de la ciencia que estudia la salud y a enfermedad de la poblacién ‘humana, Su objetivo. es mejorar Ia salud de Ia poblacién, El objeto de interés de la epidemiologia es a salud colectiva, a di- ferencia de la medicina clinica que tiene como interés inmediato Ja salud del individuo; por 1al ruzén puede afirmarse que la poblacién es para fa primera lo que el paciente es Para Ja segunda. El interés colectivo sirda a la epidemiologia en un contexto multidimensional ¢ interdisciplinario. 18s Weodolopta de la invenigactén... No resulta extraiio entonces que en el trascurso de su desarrollo la epidemiologia haya incorporade teorias, métodos y conceptos pertenecien- tes a diferentes campos del saber dentro de los cuales es importante desta- car Jos aportes de las ciencias biomédicas como 1a medicina, la patclogia, Ja fisiologia, la microbiologia y la inmunologfa; de las disciplinas matems- ticas como Ja estadistica y la investigacién de operaciones y de las ciencias sociales como la psicologia, 1a sociologia, la antropologia, 1a sociodemo- grafia y las ciencias politicas. EI logro de! propésito de la epidemiologia es consecuencia de un proceso en el cual conviene distinguir tres ctapas secuenciales: 1. Descripcién de) estado de salud de Ja poblacién de interés 2, Identificaci6n de los factores relacionados con la presencia de la enfer- medad. 3, Prevencién de Ja presentacién de nuevos casos mediante la disminucién en la exposicidn a tales factores, curacién de los ya existentes y prolonga- cidn de Ja vida de aquellos incurables. Factores de riesgo El propésito vltimo de Ia epidemiologia es In identificacién de los factores que contribuyen al desarrollo de Ja enfermedad con el fin de prevenir 1a aparicién de ésta; ellos se conocen como faciores de riesgo porque a mayor exposiciOn de Ja poblacién comesponde una mayor incidencia de la enfermedad, lo cual implica un mayor riesgo de enfermar. De acuerdo con esie concepto el taba- quismo es entonces un factor de riesgo para cl eiacer de pulmén, el cfincer oral, el cncer de la vejiga, la enfermedad coronaria, 1a arterioesclerosis y ¢l bajo peso al nacer (The Health Consequences af Smoking, 1984). La epidemiologta estudia, en ocasiones, aquellos factores que previe~ nen la aparicién de la enfermedad y que contribuyen de manera positiva a un mejor estado de salud de la poblacién, por ejemplo las vacunas, a los cuales se les conace como projectores. Algunos factiies de riesgo son intrinsecos propios del individuo y otros son extrinsecas © propios del ambiente. Entre los primeros sc encuen- tran los factores genéticos y los inmunoldgicos; por ejemplo, las personas que poscen el tipo sanguineo A terien un mayor ricsge de desarrollar can- cer de est6mago, en tanta que quienes poscen el tipo O estén mas propensas ‘al desarrollo de ticera péptica (Aird y colaboradores, 1953). La personali- dad también es un factor de riesgo intrinseco importante para ciertas enfer- medades; por ejemplo el patrén de conducta tipo A, caracterizado por la La est gacton epidemtoldgtca/19 competitividad, la agresividad, la intolerancia y la urgencia del tiempo, se ha identificado como un factor de Tiesgo para la enfermedad coronaria (Ro- Senman y colaboradores, 1964; The Review Panel on Coronary-prone Be- haviour and Coronary Heart Disease, 1981), Entre los factores de riesgo extrfasecos cabe distinguir los facto- tes biolégicos tales como los virus circulantes en ef ambiente y los ani- males portadores de mictoorganismos patégenos: los factores sociales dentro de los cuales estén los econémicos, los cuiturales y los palftices y los factores fisicos como el agua, el aire, la radiacién y los agentes quimicos. Aunque esta clasificacién es util para identificar la naturaleza de los factores de riesgo, muchos de estos fesuitan a su vez de la inte- raccidn de varios de ellos; por ejemplo, las caracteristicas inmunolégi- cas son el resultado de Ja exposicién a miltiples Factores bioldgicos, sociales y fisicos; de igual forma el estilo de vida —que Ultimamente ha recibido gran: atencién en ef enfoque preventivo de la salud publica— es el resultado de le interaccién de una gran diversidad de factores in- trinsecos y extrinsecos, Asociacién y causalidad ‘Una de Jas tareas fundamentales de la investigaci6n epidemiolégica consis- te en esclarecer Ia funcién de los distintos factores en el desarrollo de la ‘snfermedad. Esta tarea es el objetivo de is investigacién eticlégica la cual estudia la asociacién causal que Presentan Jos factores de riesgo con la enfermedad, Aunque ef problema de la causalidad de la enfermedad se puede ana- lizar desde una concepcién filoséfica, con lo cual se pretende identificar la causa Gltima de los efectos, por limitaciones de espacio una discusién en tal sentido se omite en el presente texto. El lector puede encontrar va- Tiosos argumentos en os escritos de Hill (1953, 1965), Corfield (1954), Yerushalmy y Palmer (1959), Sarrwell (1960), MacMahon y Pugh (1970), Susser (1973) y Buck (1975), entre otros, Para ¢] enfoque epidemiolégico y preventive es més itil identificar agnellos factores cuya modificacién trae como consecuencia una disminn- cién en fa morbimortalidad de Ja poblacién: un factor de riesgo es causal Sn el desarrollo de una enfermedad si una variacién cn a frecuencia o en Ja intensidad con que éste se presenta produce un cambio en la frecuencia de dicha enfermedad. Buena parte de la investigacion epidemiolégica estd dirigida a la detecciéa de asociaciones causales, 207 stesodologia de ta tavestigacitn... Para identificar asociaciones causales ¢] epidemidlogo debe conside- rat que un mismo factor de riesgo puede actuar como tal para varias en- fermedades y que una de ¢stas puede ser causada por miiltiples de ellos; asi, el consumo excesivo de alcohol se ha identificado como factor de ries- go para el céncer de la laringe, la cinrosis hepatica y el delirium tremens (US. Department of Health and Human Service, 1990) y la enfermedad coronaria se ba asociado causalmente con la hipertensién arterial, el tabs- quismo y la hipercolesterolemia, entre ottos (Kannel y Gordon, 1974; American Heart Association, 1980), En las relaciones causales conviene distinguir las causas suficientes, cuys presencia garantiza la aparicién de la enfermedad, de aquéilas sin las cuales no os posible que ésta se presente, o causas necesarias. As{ el plas- modium es un factor causal necesatio para la malaria pero su sola presen- cia no gerantiza la aparicién de la enfermedad, o sea, no es una causa suficiente (Covell, 1961). Desde una posicién més realista es mejor habler de complejos cau- sales conformados por varios factores cuya concurrencia los convierte en suficientes (Rothman, 1976); asi, en el ejemplo propuesto anteriormente ¢] plasmodium serfa un factor que, jumo con condiciones inmunitarins defi- Cientes y quizés con otras condiciones conformarfa un complejo causal su- ficiente. Es posible también que para una enfermedad existan varios complejos causales suficientes; la malaria, por ¢jemplo, puede presentarse siempre que se dé la concurrencia de tos factores a, b y c, pero puede hacerlo también cuando se presente el complejo a, d ye; en este caso el plasmodium como factor causal necesario serfa Ja causa a. No todas Jas asociaciones que logra establecer el epirlemiélogo sefialan Ja existencia de factores caussles; algunos de estos dltimos estén relacionados con determinadas enfermedades en las que la modificacién de la exposicién no implica una variacidn cn le frecuencia con que ac presenta, lo cual se conoce como asociacién meramente estadfstica en contraposicién a aquélla que es causal. Asi, la asociacién observada entre el consumo de café y el cancer de pulm6n ¢s meramente estadistica, porque si se suprime el consumo Gel primero no disminnye la incidencia del segundo; por el contrario, la as0- ciacién enme Ja concentracién sangufnea de colesterol y Ja enfermedad coro- naria es causal porque el descenso en las concentraciones de éste dismiauye el aimero dc casos de diche enfermedad, \ Por otra parte, conviene distinguir las asociaciones directas y las. indirectas, Bs claro que entre a variable independiente almra sobre el nivel Lainvvestigucién epidemialdgica 2] - del mar y la dependiente, frecuencia de casos de malaria, existe una aso- Ciacién claramente definida; ésta es consecuencia de Ja relaciéa que pre- senta con el clima la presencia del vector que trasmite Ja enfermedad, el cual s6lo se encuentra en climas célidos; se dice entonces que tal asocia- cién es indirecta y que Ia asociacién con la presencia del mosquito ¢s ci- recta, Aunque el hecho de que una asociacién se clasifique de esta manera @s una cuestién de grado, para la epidemiologia la identificacién de las directas es mAs importante para la prevencién de la enfermedad que [a identificacin de las indirectas. Existen también las denominadas azocia- clones espurias que se obtiencn o bien debido al azar o a la presencia de S€8g0s. . Una situacién para considerar os que el establecimiento de una pre- Sunta asociaciOn entre un factor de riesgo y una enfermedad suele hacerse sobre los resultados obtenidos en muestras seleccionadas aleatoriamente, Por tanto es posible que en algunos casos se obtenga, por simple azar, una asociacién que en realidad no existe:' ésta también se puede presentar por errores en la informacién, en ia selecci6n de las unidades observadas 0 por falta de control en owas variables extrafias al fenémeno que se estudia pero que de alguna manera se relacionan con 61.2 Como resultado de la biisqueda de factores de Tiesgo se han identi- ficado muchos cuya modificacién es virtualmente imposible denominados no modificables y su conocimieato sdlo oftece posibilidades limitadas para la prevenciGn, por ejemplo los genéticos; por su parte. la identificacién de factores niodificables, tales como el tabaquismo, la obesidad y la hiperten- sién en cl caso de la enfermedad coronaria, ha aportado los mayores bene- ficios sociales. Es importante notar que et establecimiento definitive de una asociacién como causal exige la realizacién de estudios experimentales, que dificilmente se pueden bacer en seres humanos debido a consideracio. nes éticas. Por tal motive, la mayorfa de las investigaciones epidemiokigicas se realizan en eondiciones que. distan mucho de ser las Gptimnas del laborato- | En Fifos caios se conchye equivocadamente a favor de lx exisieocia de la asagincidn, 1a ews se sonoce en estadistica coma error tipo L La frecvencia con que ocurren estos reanlisdos ap In conespondienie al nivel de sigificaciin fiiado por el investigacor para la peueba de hipévesis. 2 Néate lo relaclommdo con sesgos ex cl capitulo 6 Fuentes de error en [a investigocién pidemiolégica, y con la determinacién del bmaao ‘™uestral en 10s eavxdios amalfticos en ef ‘saptulo 13, Tamafio de Ia mauesica, 22 sMetadologia de la bevestigacién.. rio, por lo cual s¢ hace dificil establecer clarameme 1g naturaleza causal de muchas de las asociaciones asf detectadas. No obstante, el cumpli- miento de algunos requisites por estas fihimas es un argumento & favor de la naturaleza causal de dicha asociacion (Hill, 1965; Breslow y Day, 1980); tales requisitos estén relacionados con los conceptos que ‘se ana- lizan a continuacién. Secuencia temporal causa antecedente-efecto consecuente. Segin ei principio de que la causa antecede al efecto, para que un factor sea consi- derado como causa de una enfermedad la exposicién a este debe darse _ Decesariamente antes del inicio de ella. El aumento innsitado en la inciden- sia de anomalias congénitas observado en los descendicntes de quienes re- sidfan en Hiroshima y Nagasaki con posterioridad a Jas explosiones atémicas de 1945 ha fortalecido la naturaleza causal de Ja asociacién en- contrada entre la exposicién a radiaciones in utero y Ja incidencia de estas anomalfas. . Consistencia de la asociacién, EI establecimiento de una misma aso- ciaci6n en diferentes lugares, consistencia espacial, y en diferentes momen- tos, consistencia temporal, tiende a fortalecer ia naruraleza causal de ésta. En este sentido, la observacién de un aumento o una disminucién consis- tente del riesgo de enfermar a medida que varia Ja desis de exposici6n 4 un factor —o efecto dosis respussta— tiende a fortalecer la naturaleza cav- sal de la asociacién observada, o sea ja consistencia interna. Fuerza de la asociacion. Aquellas asociaciones fuertes, en Jas cnales se observan grandes diferencias en la frecuencia con que se presenta una enfermedad entre los expuestos y los no expuestos a un factor de riesgo, tienen un mayor sustento causal que aquéllas numéricamente débiles. Especificidad de ta asociacién. Las asociaciones entre factores de riesgo especificos y enfermedades espectficas tienen un mayor peso causal que aquélias entre factores genéricos y gnipos de enfermedades. La natu- raleza causal de la asociacién establecida entre hipercolesterolemia e inci- dencia de enfermedad coronaria es mAs firme que la asaciaciéa observada entre consumo per capita de grasas samradas y mortalidad por enfermeda- des cardiovasculares. A este respecto es importante recordar que la especificidad de mu- chos factores de riesgo no es absoluta debido a que muchos de estos lo son para multiples enfermedades, por ejemplo, el tabaquisme como factor de riesgo para el céncer de pulmdn, el céncer de la vejige, la enfermedad coronaria y el bajo peso el nacer; al ticmpo que una misma enfermedad woe La investigacitn spidemioldgica f23 puede ser causada por diferentes de ellos, tal como se observa en la enfer- medad coronaria como consecuencia de la hipercolesterolemia, Ia hiperten- sida y el tabaquismo, entre otros. Coherencia de Jos hallazgos. La coherencia de ios resultados obte- nidos ea la biisqueda de una asociacién con el eonocimiento existents es otro argumento a favor de la naturaleza causal de ésta. La asociacién ob- servada entre el consumo de estrégenos en la posmenopausia y la aparicién de céncer de endometrio est4 acorde con los conccimientos ya existentes sobre la fisiologia y la patologfa relacionados con dicho evento; esta con- condancia permite presumir que la asociacién cs: causal. En la busqueda del conocimiento epidemiolégico se pueden identifi- car dos objetos de atencién complementarios: 1. El conccimiento de aquellos factores relacionados con el estado de salud de la poblacién, o sea el conocimiento etiokigico. 2. La intervencién dirigida a ia modificacién de la exposicién a tales fac- tores por medio del disefio y la ejecucién de programas para modificar los conocimientos, las actitudes y las practices de la poblacién. En el conocimiento ctiolégico se sinian todas Aqueilas investigacio- es realizadas para. conocer 1a historia natural y social de la enfermedad, mientras que en la intervencién se agrupan todas las realizadas para evaluar el impacto poblacional togrado por la disminucién de la exposicién a di- versos factores 0 por 1a ejécucidn de programas preventivos, Tipologia de la investigacién epidemiolégica De acuerdo con las diferentes esirategias metodoldgicas empleadas en la bitsqueda-del conocimiento, los estudios epidemiolégicos pueden agruparse en dos grandes tipos: fos experimentales y los observacionales. Los estudios experimentales son aquellos en los cuales es posible maniputar la variable independiente exposicién y asignar aleatoriamente los participantes a los grapos definidos por ella, categorfa a la cual pertenecen la mayorfa de los. ‘nsayos de laboratorio en fos cuales Jas unidades de observaci6n se asignan aleatoriamente a tratamientos definidos o manipu- lados por ei investigador de acuerdo con el interés del estudio. Por ejem- plo, un investigador purde asignar al azar ratones a dos Brupos de tratamiento con el fin do probar ci poder oncogénico de un virus, hipdtesis que podré demostrar si la incidencia de tumores resulta ser significativa- mente mayor enel grupo que recibe el virus cuando se compara con la observada en el grupo que no lo recibe, 24 /Merodologia de iainvesigacito. Los ensayos clinicos son también estudios experimentales realizados en pacientes con el fin de evaluar la respuesta de los mismos a diferentes exposiciones; por ejemplo, en una unidad de salud mental un investigador puede asignar aleatoriamente los pacientes esquizofrénicos a dos grupos de tratamiento, hospitalario y ambulatorio, con el fin de conocer cdl de los dos beneficia mis a tales pacientes. ‘Uns derivacién de los estudios experimentales son ‘os estudios cua- siexperimentales en los que la atignacién no es aleatoria aunque-el factor de exposicién es manipulado por e! investigador, a este tipo perisnecen as investigaciones que se hacen en ciertas comunidades para evaluar !a dismi- mucin de la incidencia de detcrminada enfermedad después ‘de realizar programas educativos, Las condiciones naturales de algunas localidades pueden proporciouar cierta ventaja lo cual permite preseindir de la asigna- cién aleatoria, tal como sucede en el estudio de] efecto preventivo que con- fiere el consumo de aguas naturalmente fluoradas sobre Ya caries dental, ‘Los estudios observacionales son aquellos en los cuales no existe msnipulacién del factor de exposicién por el investigador, ellos costituyen una buena parte dc la investigacién epidemiolégica. Aunque los subtipos principales de los estudios observacionales son presentados con detalle en capftulos posteriores es importante indicar aquf una clasificacién de ellos de acuerdo con su objetivo y con la estrategia metodoligica empleada para su ejecucién; de esta forma, segin el propdsito se pueden clasificar como descriptives 0 como analiticos. ‘Los estudios descriptivos se realizan cuando el conocimiento exis- tente acerca de Ia etivlogia o de las caracteristicas de una enfermedad eg escaso, por tanto, son la primera aproximecién al conocimiento de sta; en muchas ocasiones son diagnésticos de morbimortalidad, encues- tas de frecuencia o series de tempo que muestran la evolucién croncl6- gica de la morbimortalidad. Estos estudios suelen generat hipotesis ctiolégicas que deben ser probadas mediante estudios analiticos, como Jo es la prevencién ofrecida por e! agua fiuorada la cual fue formulada ante ¢ hallazgo de una baja frecuencia de caries dental en un estudio descriptive de Ja' morbilidad oral que presentaban varias comunidades que se abastecfan con aguas ricas en fitior, en este caso, se trata de un estudio descriptive ecoldgico, cuyo tratamiento se expone de manera de- tallada en el capitulo 11. Un estudio analftico so realiza para probar hipétesis espectficas re- Jecionadas con los factores que presumiblemente estén asociados cansal- La iavestigacin epidemialigica /25 mente con ia presencia de una enfermedad, caso en el cual s6lo un cono- cimiento ya existente con respecto al probleme estadiado permite formular dichas hipétesis. La hipétesis sobre 1a asociacién existente entre tabaquismo y céncer pulmonar se formulé a partir de los hallazgos informados por varios estadics descriptivos que seflalaban 1x alta frecuencia de fumadores entre los pacientes con cancer palmonsr, lo cual, junto con los conocimientos referentes a la pa- tologia y a la fisiologis del sistema reapiratorio, permitié forruular Ia hipotesis mencionada, confirmada més tarde por mulltiples estudios analfticos (U.S. Pu- blic Service, 1964). Los subtipos mas importantes de estos estudios son los de seguimiento 0 de cohorie y los de casos y controler, con estrategias que se tevisan detalladamente en capftulos posteriores. Aunque las estrategias de los estudios descriptives y analiticos son diferentes, con frecuencia se combinan ambes en una misma investigacién Jo cual subraya Ja continuidad’ y 1a dindmica del conocimiento cientifico. Los estudios epidemiolégicos también se suclen clasificar como re- trospectivos, prospectivos o de corte, de acuerdo con la presentacién de los eventos en el tiempo. Un estudio retrospective se basa en eventos ya acae- sidos relacionados con 1a enfermedad o con la exposici6n: con frecuencia estos toman Ja informacién necesaria de registros rutinarios de mortalidad 0 de morbilidad o retinen informacion por medio de encuestas, tal como curtis con los estudios realizados sobre el sida com los primeros pacientes que presentaron la cnfcrmedad. Los estudios prospectivos, en cambio, ob- servan la presentacidn de eventos futuros, como es el estudio del impacto que tiene en la poblacién un programa de inmunizacién que se inicia en el momento. : Los estudios retrospectivos y tos prospectivos reciber 1a denomina- cién comin de ongitudinates debido a que los eventos de interés se obser- van en el tascurso del tiempo. En contraposicién 2 estos existen los estudios de corte 0 irasversales que miran eventos presentes como son las encuesias dé prevalencia que muestran la frecuencia y las caracteristicas con las que se presenta una enfermedad en el momento. Referencias bibliograficas 1. Aird L, Bentall HH, ef al. Relationship berween cancer of stomach and ABO blood groups. British Journal of Medicine. 1953; (1): 799. 2, American Heart Associttion, Risk factors and coronary heart disease. Circulation, 1980; (62): dD A-d55A, 26 1 hsedoiogta da ivestigatica. 3. Breslow NE. Day NE. Statistical Methods in Cancer Reacarch, Val. I: The Analysis of Case-Control Study. Lyon, International Agcncy for Research on Cancer, 1980. 4. Buck C. Popper's philosophy for epidemiologists. international Jeurnal of Epidemiology. 1975; (4): 159-168. s& Combed 1 Suaiticl selationships and proof in medicine. American Statistician. 1954; (8): 19-28, 6. Covel G. Reiaciones snire la parasitemia malérica y Jos sintomes de Ja enfermedad. Boletin de la Oficina Sanitaria Penamericana. 1961; L (3): 273-240. 7, Hill AB. Observation and experiment. New England Journal af Medicine. 1953; (248): 995-1001. 8, Hill AB. The environmeat and disease: association of causation? Proceedings of the Royal Society of Medicine. 1965, (50): 295-300, 9. Runnel WE, Gondon'T. The Framinghara Sindy: an epidemiological investigation af car diovascular disease. Department of Health, Education and Wetfare, Public Health Ses- vice, Nationa? Insrute of Health, DHEW Publication, 1974; 574-599, 10. MacMahon B, Pugh TF. Epidemiology. Principles and Methods. Boston, Lite, Brown, and Co,, 1970. U1. Rosenman RH, Friedman M, Straum R, et al, A predictive smidy of coronary heart disease: the Western Collaborative Group Study, Jaraa. 1964; (189): 15-22. 12. Rothman KI. Causes, American Jour! of Epidemiology. 1976; (104): 587-592. 13, Sartwell PE, “On the methodology of investigations of stiologic factors in chronic dis ease”. Aurther comments. Journal of chronic dixeases. 1960; (11): 61-63. 44. Susser M, Causal Thinking in the Health Sclencies: Concepts ond Strategies of Epidersiology. New York, Oxford University Press, 1973. 45, Susser M. Judgment and causal inference: criteria in epidemiologic studies. American Journal of Epidemioiogy. 1971: (105): 1-15. 16. The Heatth Consecusnces of Smoking: a teport of the Surgeon General. Washington, D.C. Government Priming Office. 1984. 17. The Review Pane! on Corunary-prove Behaviour and Coronary Heart Disease. Coronsry- Prone behaviour and coroaary heart disease, Circulation, 1981; (63); 1199-1215. 18. US. Department of Heakh and Human Service, Public Health Service. Seventh Special Report to the U.S. Congres: on Aleohol and Health from the Secretary of Health and Human Services. Ianvary, 1990. , 19, US. Public Health Service. Smoking and Health. Report of the Advisory Comittee 10 the Surgeon General of the Public Health Service. U.S. Deparment of Health, Education and Welfare, Public Health Service, Center for Disease Control, PHS Publication No. 1103, 1984, 20, Yerushalmy J, Palmer CE. On the methodology of investigations of etiologic factors in chronic diseases. Journal of Chronic Diseases. 1959; (10): 27-40. a medicion en epidemiologia En este capitulo se presontan algunos ‘conceptos importantes relaciona- dos con lag variables; se describen lag medidas principales utilizadas por ia epidemioiogta para mostrar la morbilidad y 1a mortelidad obser- vadas en una poblaciGn; se diferencian los concepios de incidencia y de provalencia y tes mediciones reslizadas por medio de proporciones, de razones y de tasas y, por Siltimo, se enuncian las principales medi- das de azociacién atilizadas en Ia investigacin epidemiolégica. E. Ja tarea de conocer ta realidad pera trasformarla de una manera efi- Giente el cientffico observa los fenémenos que se presenten, identifica sus Componentes principales y las relaciones entre estos ¥ formula, finaimente, uma explicacién de la misma. La observacién de ella debe hacerse de acuerdo con criterios claramente definidos, de tal modo que la interpreta- cién de los hallazgos sea inequivoca y universal; por tal raz6n el\investi~ 287 Metodaloyla de ta investigacion.. gador, obligado a medir de una manera sistemética squellas propiedades o variables que son objeto de.su estudio, debe acercarse en algdin momento al pmblema de la medicién, tema del presente capitulo. Variable La epidemiologia estudia el comportamiento de aquellas propiedades re- lacionadas con Ja salud y con ja enfermedad tales como el diagnéstico, la edad, el sexo, la procedencia, las condiciones socioeconémicas y cl nivel educativo, entre otras; éstas se conocen con el nombre de varia- bles porque cambian de un individuo a otro o en el mismo individuo de acuerdo con el momento. El estudio cientifico del comportamiento de una variable exige su observacién, su medicién y el anélisis de la infor- macidn recopilada. Las variables que estudia el epidemidiogo presentan diferentes esta- dos o valores; por ejemplo, et sexo presenta dos valores, masculino y fe- menino, mientras que la presién arterial se expresa en milimetros de mercurio; €¢ evidente que la naturaleza de los valores masculine y feme- nino es diferente de Ia de aquellos que indican la cantidad de mil{metros de mercurio. Esta diferencia en la naturaleza de la informacién obtenida permite identificar cuatro niveles basicos de medicién: nominal, ordinal, intervale y de raz6n (Stevens, 1946; Kerlinger, 1973; Loether y McTavish, 1974). . Niveles de medicién de las variables Nivel nominal Cuando los valores con los cuales se mide una variable son cédigos de identificacién que denotan Ja presencia o ausencia de una cualidad, la me- dicién se efectiia a nivel nominal; entonces se dice que dicha variable es de tipo categérico. Si para estudiar el comportamiento de la variable sexo. en una poblacién se adoptan los cSdigos masculino y femeltino, ésta se mide a nivel nominal, o sea que cada individuo se clasifica de acuerdo con Ja presencia de un atributo; a este nivel pertenecen todas las mediciones de tipo cualitativo tales como la cansa diagnéstica, e} estado civil, la proce- dencia, la ocupacién y el grupo sanguinco. Para facilitar el manejo de la informacién obtenida es posible asignar valores numeéricos @ codigos nominales, tal como sucede cuando e¢] inves- tigador identifica al sexo masculino con el mimero } y al femenino con el Hoos La medicién en epidemiologia! 29 2; no obstante, dichos valores no representan cantidades sino que determi- nan Ja presencia de un atributo; por tal motivo se comete un error ldgico Cuando se trata de obtener un promedio de tos valores que identifican el Sexo en un grupo de personas: en este caso 2 no es mayor que I ni 2 cs el doble de 1. Con valores nominaies sélo se puede observar ta frecuencia absoluta o retativa con la cual se presenta cada o6digo y afirmar, por ejem- plo, que el 30% de la personas afectadas por un brote son de sexo mascu- lino 0 que ef 20% de las mujeres afectadas son solteras. Asi, el tratamiento numérico propio de las mediciones nominales es el de contar bien sea por medio de frecuencies absotutas, o niimero de casos, 0 por frecuencias re- lativas, o porcentajes. En epidemiologia es frecuente tratar la enfermedad como una varia- ble nominal que séio presenta dos valores: su-ausencia G su presencia; tam- bién es comin medir la exposicién a factores de tiesgo en dos categorias exeluyentes, sf 0 no, tal como sucede con la exposiciéa a un medicamento en on, determinado periodo. A este tipo de variables se les conoce como dicotémicas, o también, de respuesta todo o nada. Nivel ordinal Cuando los valores que presenta una variable informan acerca de un onten © jerarquia, la medicidn se realiza a nivel ordinal, ejemplos de esto son los valores 1, 2 y 3 para determinar el grado de una quemadura, Jos afimeros 1, 2, 3, 4, $ que informan el resultado de una citologta y los del I al 10 del indice de Apgar con el cual’ se evaltia el estado del recién nacido. La informacin suministrada por una medici6n ordinal es més completa que la de una nominal porque en Ja primera el 3 es mayor que el 2 y el 2 es mayor que él 1, lo cual no sucede en la segunda; por este motivo, con tmediciones ordinaley no sélo es posible conocer Ja frecuencia absoluta o relativa que presentan los diferentes valores de Ia variable, tal como se hace con las mediciones de un nivel nominal, sino que, ademis, se pucden analizar aspectos relacionados con la secuencia o jerarquia de los valores ‘observados. 3. . Las medidas estad{sticas conocidas como coeficientes de correlacién de rango utilizan la posicién relativa de las observaciones Pera establecer asociaciones entre variables medidas ordinalmente; un ejemplo de esta si- twacién ce encuentra on un estudio qus tata de establecer Ja relaci6n exis- tente enme ¢l nivel educative de la madre —bajo, medio y alto— yel estado del recién nacido valorado mediante el indice de Apgar. 307 Merodologta de la invesiigacion... Nivel de intervalo A este nivel pertenecen todas las mediciones de natoraleza cuantitativa que s¢ hacen con escalas que tienen como base un valor cero, cl cual no es ‘absoluto sino arbitrario. Por ejemplo, las mediciones que se hacen con base en Ja escala cent(grada de temperatura son mediciones de nivel de intervalo porque 0 °C-no indica la ausencia total de ésta ya que un cuerpo que se eneuentra en estas condiciones tienc una temperatura absoluta de 273 °K; por este motivo un cuerpo que tiene 40 °C no tiene ¢] doble de temperatura que wa0 que se encuentra a 20 °C, aunqué la cantidad que hay ‘entre 0 y 20 °C es la misma que existe entre 20 y 40. Es cata ditima posibilidad de establecer relaciones entre intervalos de la escala es Ja que le da el nombre a este nivel de medicién. Nivel de raz6n Las mediciones de nivel de razén son aquellas que se realizan con base una escala que tiene como punto de partida un cero absolute; un ejemplo de éstas es la medicién de variables tales como la Jongitud,.e] tiempo, ‘el ‘peso y la presion. Dado que en éstas Jos valores observadas tienen como referencia un cero absoluto es posible establecer comparaciones en térmi- nos de razones: 10 horas es el doble de 5 horas y 60 mmHg indican una presién que es Ja tercera parte de 180 mmHg. Con respecio a los niveles de medicién conviene considerar Jas si- guientes observaciones: 1. A medida que Ja medicién de una variable se hace a un nivel mds alto —+s decir desde el nominal, més imperfecto, hasta el de raz6n, més per- fecto— la informacién acerca de la variable es m4s completa y permite enriquecer e] andlisis; por ejemplo, si la hipertensién arterial se mide sola- mente a nivel nominal como s{ 0 no s6lo se puede establecer el ntimero de hipertensos, pero si dicha variable se mide en milimetros de mercurio, o sea a nivel de razén, es posible conocér también el promedio, la mediana, los valores méximos y mfnimos.y la desviacién esténdar, medidas que mnuestran de una manera més completa su comportamiento, Es importante noiar que hay variables que por su naturaleza s6lo admiten mediciones de nivel nominal como el sexo, la ocupacién y el estado civil. 2. La agrupaci6n de valores en intervalos més 0 menos amplios con el peopésito de resumir la informacién no esté relacionada con ¢l nivel de qnedicién de la variable, Asi, la decisién de establecer intervalos para agru- . a mediciin en epiemiotagia (31 Par mediciones relativas a 1a edad en categorias de 0, 1 a4 y 3 a 14 afios esti relactonada con el problema de la categorizaci6n, pero no modifica ta naturaleza o ef nivel de medicién de los valores; en cualquier caso la va- Hable est4 medida a nivel de caz6n y no de intervalo, Categorizacién de las variables od Con el fin de estudiar el comportamiento de una variable el epidemidlogo debe definir las categarfas 0 intervalos que ha de utilizar pare agrupar Ia informacién obtenida (Kerlinger, 1973; Kleinbaum y Kupper, 1978). Este Problema no se presenta usualmente en variables discretas! que presentan pocos valores, como el sexo y el grupo sanguineo, porque las categorias Para st tratamicnio ya estin definidas por los valores individuales de la variable: masculino y femenino; A, B, AB y 0. Por el contrario, con varia- bles como la edad en aiios o Ja presién arterial medida en milfmetros de mercurio, el investigador debe definir 10s intervalos en los cuales ha de agrupar la informacién obtenida. . Aunque para tomar tal decisién no hay reglas definidas se deben Considerar las siguientes normas generales: 1, La categorizacién debe incluir todos los valores que puede presemtar la variable, lo cual corresponde a una clasificacién exhaustive; en tal caso, si para tratar la informacién relacionada con el grupo sanguineo no se incluye como posible valor el grupo AB, la categorizecién n0 ¢s de este tipo. 2, La categorizacién debe posibilitar la clasificacién de cada uno de los valores abservados en uno y s6lo uno de los grupos establecides con el fin de conformar categorias mumamente excluyentes. Si para clasificar la edad - se establecen intervalos de Oa 4,5 a 10 y 10a 14 afios, la categorizacién que se hace no ¢s extiuyenre por cuanto no se sabe a qué intervalo perte- nece un individuo con diez afios. 3. La categorizacién debe permitir la identificacién de diferencias impor- tantes en cl anflisis segén el fenémeno que se estudia, 10 cual se conoce como clasificaci6n discriminante. Por ejemplo, si se estudia un fenémeno relacionado con'el tempo de lactancia matema y se establece una primera categoria entre cero:y mes meses, la informacién correspondiente a madres que no han amamantado a aus hijos, o sex un valor cera, se confunde con + Umm variable diserem eo aquetls qus slo prescnia valorcs arieros, a diferevcla de una continua (que adrnite valores fraccionsrios. 32 /Metedalogia de ia tavestigacion... aquellas que lo han hecho por un periods entre cero y tes meses, hecho que imposibilita Ja identificacién dc diferencias impoctantes con respecto a esta variable. Funciones de las variables En un estudio de la relacién existente entre wna causa y un efecto la va- tiable que ‘supuestamente acta como cauisa cumple la funcién de variable independiente-y el efecto producido, la de variable dependiente. Por cjem- plo, en un estudio de la relaci6n existente entre la coacentraciOn sanguines de colesterol y Ja enfermedad coronaria Ja primera se comporta como la variable independiente y la segunda como dependiente. El que una variable se considere como una u olya se relaciona con ¢l probicma particular que se estudia: el colesterol, que en el ejemplo anterior se desempefia como variable independiente, en un estudio de la relacién entre su concentracién como producto de la dieta achia core una variable dependiente. Medicion de la morbimortalidad La epidemiologia, come disciplina cientffica, observa los fenémenos rela- cionados con la morbimortalidad que se presenta en grupos humanos y los describe por medio de medidas, tas cuales denen diferentes connotaciones y adoptan formas particulares de acuerdo com el propésito de cada situacién. En ‘una primera aproximaciGn al problema de la medicién de los fendmenos epi- demiolégicos se perciben dos maneras distintas y complementarias que imvesiran su magnitud desde dos dimensiones temporales diferentes: la pre- valencia y Ja incideacia; la primera de ellas estudia 1a frecuencia con que determinados eventos se presentan o prevalecen en un cierto momento y la segunda, la frecuencia con que estos se presentan o inciden en un periodo de tiempo. Prevalencia ‘Una medida de prevalencia de un evento de salud o enfermedad intenta mostrar la frecuencia con que ésie existe en ef momento, inde- pendientemente de codndo se haya originado. Por ejemplo, si la prevalen- cia de mberculosis en una cicrta poblacién ¢s del 0,3% se entiende que de cada mil personas tres padecen actualmente le enfermedad; sin embargo la medida no informa sobre cufindo sc hizo el diagnéstico ni sobre el mimero de casos nuevos que se han presentado en Ja poblacién durante ese alio, pero sf lo hace con respecto a la cantidad de casos existentes o prevalentes Lawedicién on epidenioleglas 33 de tuberculosis en el momento actual, raz6n por la cual a esta medida se le conoce como prevalencia de punio. Otra medida utilizada es la prevalencia de Periodo o ldpsica, la cual mMuestra el ntimero de casos existentes durante un periodo determinado; por tanto, incluye a las personas enfermas al Principio de éste y a las que se enferman en su trascurso (Coliméa, 1990). Sin embargo debido a los fac- tores que pueden modificar 1a morbitidad a io largo de un periodo, esta medida es menos utilizada en 1a investigacién epidemiolégica que la pre~ valencia de punto, La informacion suministrada por la prevalencia acerca de la frecuen- Cia con 1a cual existen ciertas enfermedades o, también, ciertos factores de riesgo es itil para ¢l establecimienta de Programas preventivos, asistencia- jes y de control y es en muchas ocasiones un Punto de partida para la ‘investigaci6n causal en epidemiologta; por ejemplo, una alta prevalencia de tuberculosis en una poblacién puede alertar a las autoridades sanitarias acerca de un deficiente funcionamicnto de los programas establecidos para el control y el taiamiento de esta enfermedad. Del mismo modo, el conocimiento de una alta Prevalencia de hiper- tensidn arterial en grupos especfficos de poblacion puede ser un argumento importante para el establecimiento de un programa de prevenci6n y de con- trol de dicha enfermedad dirigido a tales grupos de la pobiacitn y una alta Prevalencia del habito de fumar en los adolescentes puede ser el punto de partida para el establecimiento de un programa preventivo dirigido a la poblacién escolar de la localidad, Para medir la prevalencia de cierto evento hay que determinar el numero de sujetos en quienes se presenta el evento estudiado y telacionar dicho nimero con el total de individuos que forman el grupo observado; Por tal motivo, la pievalencia se suele expresar por medio de Proporciones 9 poreentajes. Asi, si'én una clerta poblacién de 10.000 habitantes 1500 Personas sufren de hipertensién arterial, se dice que fa prevalencia de tal enfermedad es del 15%, Incidencia La segunda dimensign desde la cual Se pueden estudiar fos fenémenos epi- demiolégicos es la relacionada con Ia frecuencia con que se presentan 0 inciden Jos eventos cn cl tiempo, la cual corresponde a una medida de incidencia. Sup6ngase, a manera de ejemplo, que en un grupo de 300 mu- Jeres inicialmente con presién arterial normal que utilizan anticonceptivos 34 / Metodotogia de to investigacién.. orales con alto contenido de estrSgenos se diagnostican 60 casos de hiper- tensién arterial en el trascurso de un aio; la frecuencia con Ja cual incidié Ja enfermedad durante ‘ese aiio fue de 60/300, 0 sea del 20%, cifra que moestra la incidencia anual de la hipertensién en tal grupo. Como se puede observar, 1a medicién de Ja incidencia de un evento en un cierto periodo sé logra por medio de una proporcién en Ja cual et numerador.es ¢) némero de eventos observados durante ese tiempo y el denominador es el atimero total de sujetos estudiados. Cuando se utiliza una proporcién para medir la‘iacidencia de un evento en un cicrto periode se quiere indicar con ella la incidencia acumulada, a partir de] denomina- dor inicial en el trascurso de ese tiempo, lo cual corresponde a una medida de incidencia acumulada. Por ejemplo, si se estudia un grupo de 200 gestantes para conocer la.incidencia de hipertensién inducida por e] embarazo y si durante el pe- tiodo de la gestacién se diagnostican 30 casos de esta enfermedad, su in- cidencia se obtiene por medio de Ja proporcién 30/200 y se dice finalmente que el 15% de las gestantes presentaron la enfermedad. Nétese que el de- nominador est4 costituide por un grupo estable cuyas unidades se observan por un periodo de nueve meses. A diferencia de Ja situacion anterior, cuando el prupo observado es inestable en €] tiempo Ja incidencia se mide por medio de una fase de incidencia, cuyo denominador es el tiempo durante e! cual Jos individoos han estado expuestos In ocurrencia:del evento observado. Por ejemplo, supéngase que un epidemidlogo estd interesado en estudiar Ja incidencia de uma enfermedad en ios trabajadores de’ una empresa los cuales se compor- tan como un grupo mévil que cambia durante el periodo de observacién debido al ingreso y egreso de individuos; entonces, la contribucién que cada uno hace al denominsdor es diferente porque la que aporta un empleado que permanece en la empresa por un periodo de seis meses es diferente a la de otro que permanece durante dos aiios; por tal razdn tales contribuciones no deben contabilizarse como si fueran iguales ene) denominador. Por tal circustancia, cuando se mide ta incidencia de un evento en an grupo o cohorte mévil se debe observar el niimero de casos que se presentan en el periodo estudiado y el tiempo durante el cual han estado expuestos los sujetos observados; el primer dato correspande al numerador y el segundo a] denominador, con base en ellos se calewa wna tasa de incidencia en vex de una proporcién (Elant-Johnson, 1975; Kleinbaum y colaboradores, 1982; Rothman, 1986). Asi, si en un tempo-exposicién de ‘La mediciOn en epidemiologia / 35 trescientos afios se presentan treinta casos se dice que la tasa de incidencia es de diez casos por cada cien aflos-persone-exposicién. Incidencta, prevolencia y duracién La incidencia cuantifica eventos que se presentan o suceden por primera vez durante un determinado periodo, a diferencia de la prevalencia que ignora ¢1 momento inicial de la ocurrencia del evento y sélo se ocupa del numero de eventos existentes en un determinado momento. La incidencis es una medida dinfmica de la ocurrencia de los hechos, en tanto que la prevalencia es una medida estética de los mismos, Aunque son medidas de naturaleza distinta, existe una relaci6n im- portante entre ellas determinada por la duracion del evento que se mide, Por ejemplo, si se trata de una enfermedad que tiene a Ja vez una elevada incidencia y una larga duracién, la prevalencia de ella on un determinado momento serd elevada por el efecto acumulative de la frecuencia de casos en el tiempo; por el contrario, si se trata de otra enfermedad que tiene Ja misma incidencia que la primera pero que es de muy corta duracién, su prevalencia en un determinado momento ser4 mds baja que la de la primera. Cuando se interpretan medidas de prévalencia se deben considerar los factores que afectan no sélo ia incidencia sino también Ia duracién de Ja enfermedad; asf, la prevalencia de una enfermedad puede ser elevada, bien porque la incidencia es alta o porque los snjetos permanecen enfermos durante mucho tiempo por falta de atencién médica, porque se evita la mortatidad o por otras causas. Por ejempio, la prevalencia de sida en una Poblacién puede aumentar por el descubrimiento de un buen tratamiento que prolonga la vida; de igual manera, la prevalencia de malaria en una regién puede aumentar porque los enfermos no son tratados oportunamente 9, también, por un aumerito ex la incidencia. Naturaleza de las medidas epidemiolégicas El propésito iiltimo de la epidemiologia es el de aportar conocimientos cientificos que permitan la prevencién de la morbimortalidad y el logro de un mejor estado de salud para Ja poblacida, De este modo, 1 epidemioio- gia observa y mide tanto ia frecnencia como las caracterfsticas de la enfer- medad, ademés de los factores relacionados con su prescutacién, La medicién que se hace con este propésito se expresa casi siempre por medio de tres'formas bésicas: razones, proporciones y tasas. 36 /Merodotogta ds ta invertigacifn.. Rawnes En un sentido amplio, toda razén es una medida que compara una cantidad con ota por medio de una divisién y en un sentido restringido, es una operacién mediante la cual se comparan por medio de una divisién dos cantidades de maturaleza difcrente con cl propSsito de expresar una relacion existemie entre ellas, Sila raz6n por sexo, hombre/mujer, de personas in- fectadas por cl vinus de inomnodeficiencia humana en une determinada po- blacién es de 10/1 en tanto que en una segunda poblacién es de 10/5 se dispone de una informacién que puede reflejar la existencia de distintas conductas sexuales en las poblaciones comparadas y, por este motivo, di- ferentes vias de trasmisi6n de! virus del sida; de esta forma pueden propo- nesse diferentes ‘estrategias de atencién y de prevenciin para ambas comunidades. - Proporciones Una proporeién es una medida que expresa la frecuencia con la cual se Bresenta cierto hecho o evento con respecto al total de unidades observa- das; en otras palabras es una medida que expresa Ja relacién de wna parte con el todo. Per ejemplo, si en una poblacién de 500 tabajadores de una fébrica se presentan en el mascurso de un mes 25 casos de intoxicacién por inhalacién de un gas, la proporcién de incidencia durante el tiempo obser- vado es de 25/500, o sea de.0,05. Del mismo modo, si en 200 mujeres obesas se encuentran en el momento 40 hipestensas, la prevalencia de la hipertensién en este grupo se puede expresar claramente. por la proporcién 40/200, o sea 0,20. Una proporcién es, con toda propiedad, una medida de frecuencia porque para hallar su valor es necesario contur, a diferencia de otras me- didas como el. promedio que se utiliza para describir cl comportamiento de variables continuas tales como e] peso, la presién y la temperatura, entre otras; por otra parte, convienc advertir que siempre toma valores compren- didos entre 0 y 1. Es wsval y conveniente expresar el resultado de una proporcién como un porcentaje, o sea el resultado que se obtendria si el ndmero total de observaciones hubiera sido cien, para la cual basta mul- tiplicar el resultado obtenido por este niimero; asf, si de un grupo de-80 adolescentes observados durante un periodo 20 desarrollan adiccién a jas drogas en un afio, la incidencia anual de ésta es del 25%, © sea, (20/80)x100. . La weedicitn en epidemiologigs 37 Los porcentajes son medidas muy tities para el andlisis de la infor: maci6n epidemiologica porque tienen como base comin el mémero cica, Io cual permite hacer com jones de la frecuencia con que se presenta un sicrte hecho ex grupos 0 poblaciones de diferente tamaiio; por ejemplo, si on una poblacién de 400 personas se encuentran 40 hipertensas y otra de 600 se encuentran 60 sc puede afirmar que Ja prevalencia de hipertensi6n €8 igual en ambos grupos, 10%, o lo que es igual, que en ambos grupos 10 de cada 100 personas sufren hipertensidn, De modo similar, si la inci- dencia de linfomas en un ‘grupo. de 200 personas expucstas durante cierto tiempo a las radiaciones ionizantes es de 10 casos y cn un grupo de 300 Personas no expussias es de 9 casos, ia incidencia habré sido mayor en el grupo expuesto que en el grupo no expuesto La cual cormesponde al 5% y al 3%, respectivamente, Las proporciones 0 los Porcentajes son medidas que se utilizan fre- Cuentemente en epidemiologfa porque permiten expresar la frecuencia de Ja enfermedad en sérminos de incidencis 0 Prevalencia; también mostrar en qué medida una poblacién esté expuesta a un determinado factor de riesgo Y comparar los riesgos dc enfermar o de morir de diferentes grupos, entre omos usos, La proporcién de incidencia de una enfermedad en un cierto. Periodo mide el riesgo de enfermar, nocién supremamente dtil en Ja inves. tigacién epidemioldgica; supéngase que en un grupo de 300 profesionales * expuestos durante un periodo de 10 afos a las tadiaciones ionizames se. observa una incidencia de 15 caéos de linfoma, se dice entonces que en tal poblacicn ei riesgo de desarrollar un tumor de esta naturaleza, en un pe- tiodo de 10 afios, es de 15/300, 0 sea del 5%, La comparacién de los riesgos de enfermar que tienen las personas expuestas y Jas no expuestas a un factor de riesgo tiene especial importan- ¢ia ex: los estudios epidemiolégicos de tipo etioldgico, tal como se presenta més adelante, . Tazas Aunque el término tasa se he utilizado frecucmtemente en el area de la salud para deaominar a cualquier medida relativa, incluso las proporciones, en la terminologfa modema se reserva Para una medida que expresa Ia frecuencia con la cual se presenta determinado evento en el tiempo. BI numerador de una tasa es él ntimero de eventos y el denominador es ¢l tiempo hfbil duranie el cual estos han ocurride; por ejemplo, en una em- Presa en Ia cual se utiliza tn colorante que causa lesiones en la piel se- 387 Mesodotogia de lo lnvestigaciérs. ‘desea extimar 1a incidencia anual de casas por medio de una tase, entonces, el numerador de ésta serd el mimero de obreros afectados en un afio y et denominador el tiempo total durante el cual se presentaron las lesiones o tiempo total de exposicion, el cual resulta de la suma de los tiempos en que los obreros pudieron saftir las lesiones. Asi, si un obrero no present 1s enfermedad durante todo ¢] afio su contribucién al denominador de Ja tasa ser de un afio, $} otro se enferma alos seis moses y permanece como tal comtribuye con medio alio-exposi- cién y-si uno se retira de la empresa sl tercer mes a partir de su ingreso contribuye con un cuarto de avio-exposicién al denominador de la tasa de ineidencia; de modo similar se calcula Ja contribucién que cada persona expuesta hace al tiempo total de exposicién para determinar finalmente ¢1 denominador de ella en términos del nimero de afios durante los cuales las personas pemanecieron expuestas o simplemente e] mimero de. afios-persona- exposicién, Por tanto, una tasa expresa el mimero de casos que ocurren por unidad de tiempo y, de modo similar.a como lo hace una proporcién, también ‘expresa el riesgo que tenen les personas de enfermar o de mori. Cuando se trata de grupos numerosos, por ejemplo una ciudad, es précticamente imposible medir con exactitud el tiempo total de exposicién de 1as personas al evento estudiado; no obstante el niimero de personas vivas, si se trata de mortalidad, o sanas, si se trata de morbilidad, que se encuentran a mitad del periodo estudiado es «itil como una aproximaci6n __ al tiempo total doramte el cual ellas ban estado expuestas al riesgo de merir o de enfermar; por esta raz6n, con el fin de estimar e] tiempo de exposi- cin se usa con frecuencia como denominador de las tasas a Ja poblacién existente a mitad de periodo. Muchas veces el valor de una tasa es una cifta muy pequefia com- puesta por un niimero fraccionario que tiene varias cifras decimales debido a que la incidencia de ciertos eventos es relativamente baja y los grupos en los que sc preseatan son numerosos; asi, si en diez mil afios-exposicién se presentan 20 casos de una enfermedad, 1a tasa anual de incidencia es de 0,0020. Con el fin de facilitar la interpretacin se suele expresar el valor de las tasas en multipios de diez de acuerdo con ¢l evento por ellas refe- Fido; por ejemplo, las tasas de natalided y de mortalidad convencionalmen- te se expresan por mil, en tanto que las tazas de incidencia de cfncer se expresan por cien mil. Se debe notar ademés que una tasa, a diferencia de una proporcién, puede tomar valores superiores a 1,0 ei se utilizan unida- des amplias de tiempo en el denominador. “ Lamedicién en epldemotogta 739. Presto que ta ides que expresa una proporcion es diferente de la que Gomusion una tasacl valor de ésta casi siempre difter del de aquélla ssf tes ligeramente, raz6n por Ja cual ef investigador debe clegir la medida que ex- frecuencia en el primer caso es Mayor que en e] segundo, se concluye que tal factor estd’ asociado Positivamente con la enfermedad Y por tanto, se una diferencia tal como se €xXpone 2 continuacidn, Riesgo relativo Le comparacién de Ja incidencia de la enfermedad del grupo expuesto con la del grupo no Expuesto s¢ hace, a menudo, por medio de una razon en Ja cual ef numerador es Ia Proporcién o Ja tasa de incidencia Pl o TI que Se observa en el grapo Expuesto y ¢l denominador es Ja proporcién o tasa tos al factor de tiesgo por medio de una divisién, por tanto se denomina viesgo relative o simplemente razén de riesgos y se‘expresa asi: 40 rhiesadolegia de ta tventigocion.. R, Pi, R, Ti, Rea tee Ph también: | RR = ai = = Ro Phy’ ° Ry To Por ejemplo, si sc comoce que el riesgo Ry que tienen las mujeres no expuestas a los anticonceptivos crales con alto contenido de estrégencs de sufir hipertensién durante su periodo reproductive es de 0,15 y que et riesgo K, que tienen las expuestas a dicho factor es de 0,23, la asociacién entre el uso de anticonceptivos orales e hipertensién se puede expresar por medio de la relaci6n Ry/Ry 0 icsgo relative RR: R,_ 023 as Tal resultado expresa ja idea de que por cada caso de hipertension que ocurre contre las mujeres no expuestas'a Jos anticonceptivos orales se presentan 1,53 casos entre las expuestas. En general, si el riesgo de enfer- mar de los expuestos es mayor que el de lor no expuestos, es decir si ef Tiesgo relative es mayor que 1,0, s¢ puede afirmar que existe una asocia~ ci6n positiva entre fa exposicién al factor y la incidencia de la enfermedad... Por su parte, un resultado de tal divisién igual a 1,0 indicarfa inexistencia de asociacién y un resultado menor de 1,0 que la exposicion al factor es- tudiado confiere un efecto protector, EI riesgo relative expresa e! grado de asociacién cxistente entre la exposicién a un factor de riesgo y la incidencia de la enfermedad, razén por la cual es una medida muy iraportante paré los esmudios epidemiolégi- cos que pretenden identificar factores causales o etiolégicos. Sin embargo, es una medida que no considera la frecuencia con la cual la poblacién est expuesia a un factor de riesgo y, por tanto, no es itil para la cuantificacién del impacto que la exposicién ‘a un determinado factor tiene sobre 1a mor- bimortalidad de una poblecién; para tal propésito Ja cpidemiclogia recumre a la medicisn del riesgo atribuible, concepto que se expone a continuacién (Walicr, 1978). ‘La comparacin de Ja incidencia de la enfermedad que se presenta en los expucstos & un determinado factor de riesgo con la que se presanta en los no expuesios a dicho factor se puede esiablecer mediante Ja diferencia de las proporciones de incidencia o entre las tasas de incidencia. En el primer RR= La medicién en epidemologia 47 caso, si denotamos como PI, a la proporci6n de incidencia observada en jos expuestos al factor de Tiesgo y como Pl, ala observada cn cl Btupo de los no expuestos, al calcular Pl; < Ply se tended una medida de Ja diferen- cia en la incidencia entre expuestos y no expuestos al factor de riesgo, es decir, de Ja incidencia que se debe a la exposicién al factor —ton el su- puesto de que los grupos somparados se encuentran en igualdad de condi- ciones con tespecto a los demis factores causales—; a esta medida se Je conoce como riesgo atribuible en expuesios RAE, Por ejemplo, si se conoce que Ia proporcién de incidencia de hiperten- arterial observaca durante un aio entre quiencs utilizan anticonceptivos orales con alto contenido de estrdgenos es del 20% y entre quienes no los utilizan del 12%, entonces, la diferencia absoluta 0,20 - 0,12 = 0.08 muestra que la incidencia de hipertensin entre las primeres es mayor en un 8% que la incidencia de la enfermedad entre las segundas. Tal diferencia sefiala a tales anticonceptives como un factor de Tiesgo para la hipertensi6n ¢ indica que quisnes estfn expucsias tienen un riesgo de desarrollar la enfermedad que es 8% més elevado que quienes no Jos utilizan; el exceso de riesgo se debe 8 la exposicién al factor o sca es atribuible a éstc, De modo similar, la diferencia en la incidencia entre expuestos yao expuesios se puede medir por medio de una SustracciGn entre las respecti- ‘vas tasas cuando se utilizan éstas como medidas de incidencia; en tal caso, 1a diferencia absoluta cntre las tasas adopta Ia forma TH, - Tig, la cual es atribuible a la exposicién al factor de riesgo. No obstante Ja claridad y simplicidad de estas diferencias absolutas, ellas ofrecen alguna dificuitad en su interpretacida por cuanto no se refie- ren a la misma base de comparacin; por ejemplo, una diferencia entre las Proporciones de incidencia de expuestos y de no expuestos con un valor tes 2 0,15 - 0,35 y 0.05 - 6,25: por tal motivo ex preferible establecer estas Giferencias en términos relatives a una cierta base de comparacién, Jo cual Permite expresarlas con Tespecto a Ja incidencia propia del STLPO no ex- PUESTO © con respecto a Ia incidencia Propia del grupo expuesto. Exceso del riesgo relative Para tal fin se tiene entonces Ia medida relativa: Pl, ~ PI, Ph, 42 ( Matndotoysa deta treenigacitn. 0 tambiéa, cuando se ulilizan tases como medida de frecuencia: Th, - Ty Ty Al efectuar ja divisién de cada uno de los téminos del numerador por ei denominador se obtienen, respectivamente, las medidas: Pl, Tl, mm! que se conocen como medidas del exceso del riesgo relativo porque indican Ja diferencia que existe en dicha medida entre los expuestos y los ho expuestos quienes por definicién presentan un riesgo relativo igual a 1,0. Si en un estmdio de la asociaci6n emtre un factor de riesgo y una cn- fermedad se obtiene una estimacién del riesgo retativo igual 2 3,0 se puede conocer que la estimacién del exceso del riesgo comespondiente al factor es de 2,0; o sea, los expuestos tienen un riesgo que excede en 2 unidades al que tienen de enfermar quienes no lo estén. Riesge atribuible en el grapo expuesto Esta expresion st obtiene al dividir el resultado de la diferencia enwe las proporciones o tasas de incidencia de expuestos y no expuestos entre Ia. incidencia propia del grupo expucsio, medida a Ja cual se le conoce como ‘proporcién. del riesgo atribuible en expuestos PRAE 0 fraccién etiolégica del grupo expuesto. A manera de ejemplo, sup6ngase que la proporcién de incidencia anual de bronguitis en personas expuestas al tabaquismo es de 0,30 y que dicho valor en no expuestos es de 0,10; si se quiere conocer Ia Proporcién de la incidencia de bronquitis debida al mabaquismo entre los fumadores se divide la diferencia Plj ~ Pio entre la proporcién de inciden- cia del grupo expvesto: ® 0,30 - 0,10 0,30 9.67 lo cual muestra que el 67% de ta incidencia de bronquitis que se presente entre quienes estén expuesios al tabaquismo se debe a dicho factor y que el 33% se debe a otros. ‘Le medicin en epidemtologla 43 En algunas situaciones particulares conviene cxpresar la proporcién del riesgo atribuible mediante ta Siguiente trasformaci6n, la cual se obtiene al dividir cada uno de sus términos entre Ja incidencia relotiva del grupo Ro expuesto sin que se altcre el valor de la relacion: pRag = Ph- Plo. Ply (Ply - Ply Pla _ RR-1 RAE = Fr PPh, RR Si se estudia, en cambio, el efecto de la exposici6n a un factor pro- tector, por ejempio una vacuna, la magnitud relativa de éste se expresa como la diferencia entre la proporcién de la incidencia que ocurre en los no expuestos al factor Ply y la proporcién de incidencia propia de los ex- Puestos al factor PJ, con respecto a la incidencia propia de los no expucs- tos, Esta medida recibe cl nombre de fraccion prevenible FP, la cual refleja fa magnitud de la disminucién en la incidencia te ia enfermedad que se lograria‘en los sujetos no expuestos al factor Protector si-tal grupo recibiera el beneficio de la exposicién: PI, - PI, Fp woth Poe, Riesgo atribuible en ia pobiacion Ademas de las diferencias antes mencionadas, exisie una importante en epidemiologfa que muestra la parte de Ia incidencia de una enfermedad que en la poblacién total ocurre como consecuencia de ta exposicién a un fac- tor de riesgo, la ual se denomina riesgo atribwible poblacional RAP que en términos absoldtos es siraplemente la diferencia Pl, - Ply, en donde PI, 6s la proporcidn de incidencia de la enfermedad en Ja poblacién total, expuestos y no expuestos, y Pi, es la proporcién de incidencia entre los nO expuestos, . ; En términos relativos, el riesgo atribuibie poblacional se expresa co- mo la proporeién de la incidencia toial que se atribuye al factor de riesgo © proporcién del riesgo atribuible poblacional PRAP. medida que se co- Roce también como la fraccién etiolégica poblacional: PI, - Ply PRAP = 44 sMetodologia de ta trresrigacion.. Asi, si Ja proporcién de incidencia anux] de infarto del miocardio en Ja poblacién adulta'de cierta localidad es de 0,06 y en los no fumadores adiuitos es de 0,03 1a proporcién de la -incidencia total de tal evento atri- Dbuible al tabaquismo es: 0.06 - 0.03 _ PRAP = 006 6,50 lo cual muestra que e] 50% de la incidencia de infarto de} miccardio que se presenta en Ja poblacién adulta se debe al tabaquismo o, lo que es igual, que si se euprimiera este factor en dicha poblaci6n se reduciria Ja incidencia de la enfermedad en un 50%. Nétese que cl 50% restante de la incidencia se debe a otros factores. En algunas situaciones conviene expresar a proporeién del riesgo atribuible poblacional en funcién de 1a proporcién dela poblacién que se encuentra expuesta al factor de riesgo p, y del riesgo relativo que caracte- tiza a asociacién mediante Js siguiente expresidn, en Ja cual se advierte que el impacto preventive que se lograrfa en la poblacion al suprimir la exposicién a ua determinado factor de riesgo depende tanto de la magnitud del riesgo relative como de Ja exposicion a dicho facor:? _ Pr (RR- J) PRAP = "RR - 1) +7 Como se puede advertir, el conjunto de las diferencias que muestran el riesgo atribuible miden el impacto que tendria le prevenciGn de 1a expo- sickén & los factores de riesgo y son, por tanto, medidas de gran importan- 2 Latresformacién se logra mediante les siguientes sustiraciones: Ph~ Plo fps Phi (1+ pe) Plo} - Plo PRAP = —_ Ph, pEPl + (1 - pe) Plo Pa (Plo RR) + (t + ps} Plo» Plo pe (Plo RR) + {1 - pa Plo PEARR- 1) PECRR- Hed Lamedicion m epidemioiogia/ 45 sia como criterios oriemadares en la toma de decisiones en el sistema de la salud publica, Ademfs de las medidas que se discuten en las paginas precedentes, en el capitulo 12 se prescata la medicion de Ja mottalidad en términos de afios de vida potencialmente perdidos y la de la pérdida de aiios de vida saludable por mortalidad prematura ¥ por discapacidad, conceptos que de algén modo estén relacionados con la supervivencis. Referencias bibliogrdficas 1. Coliméa KM, Fumdamentos de epidemiologia. Madtid, Diaz de Sanios, 1990, 2. Blandt Johnson R. Definition of ras: some remarks on their use and misuse. American Journal of Epicemioiogy. 1975; (102); 267-271. 4. Kerlinges FN. Foundations of Rehavioral Research, Now York, Holt, Rinehart and Winston, 1973. 4. Wdsinbaum DG, Kupper LL. Applied Regression Analysis and other Muliveriable Methods, Belmont, California, Wadsworth Publishing Co.. 1978 5. Keinbaum DG, Kupper LL, Morgensiem H. Epidemiologic Research, Belmont, Califor- nia, Lifetime Learaing Publications, 1982, & Lociher HL, McTavish DG. Descrpsive Siatistice for Sociologists. Boston, Allyn and Bacon Inc., 1974, 7. Rothman KJ, Modern Epidemiology. Boston, Linle, Brown, und Co’, 1986. 8. Stevens $8. On the theory of scaes.of measurement, Science, 1946; (103): 677-680, 9. Waltec'SD. Calculation of attributable tisk ftom epidemiological data. Inlersationdl Jour- nal of Epidemiology. 1978: (7): 157-182. 3 E. udios experimentales En este capitulo se presentan los principios de la investigacién expe- Timental. ios cuales son a su vez el punto de partida de la investigacion ‘observacional cn cpidemiologta; se precisan sus posibilidades y sus limiuctones ¥ se exponen algunas consideraciones éticas importantes. L. adopcién de la estrategia propia de los estudios experimentales por la investigacién epidemiolégica y su progresivo perfeccionamiento se ban da- do en forma paralela con ef desarrollo de la metodologia cientifica que caracteriza a los dltimos cuatro siglos. A este respecto es importante mencioner, entre otros, los trabajos comparativos de Graunt en Inglaterra con basc cn los registros de mortali- dad (Grauat, 1662); los de Lind en el siglo XVII sobre la ingesta de ci- (icos como tratamiento para el escorbuto (Lind, 1753); los de Joseph Lister en el siglo XIX sobre el efecto de los antisépticos en la mortalidad 48/ Mevodologia de la investigacién.— debida a Jas amputaciones (Lister, 1870), los aportes metodologicos de Claude Bernard y de John Stuart Mill.a finales del siglo XIX @ernard, 1865: Boring, 1954); los de Goldberger y colaboradores a principios del siglo XX acerca de ia prevencién de Ja pelagra y los importantes traba- jos de Ronald Fisher que en el decenio de Jos veinte fijaron definitive. mente las bases metodolégicas de la investigacién experimental (Fisher, 1926). Estrategia La estrategia que curacteriza ala investigacién experimental consiste en la asignacién aleatoria de unidades de observacién como semillas, per- sonas o comunidades a diferentes grupos o tratamientos definidos por el investigador con el propésito de evaluar diferencias en un efecto de in- terés. Un investigador, por ejemplo, puede repartir aleatoriamente un grupo de pacientes con diagnéstico de hipertensién moderada en dos © més grupos definidos por diferentes esquemas de tratamiento, con el fin de comparar la disminucién on Ja presién arterial producida por estos después de un tiempo prudencial. De este modo, la estrategie fundamen: tal de los estudios experimentales se puede esquematizar como se mues- tra en la figura 3.1. Asignaciin slestoria Participantes B —-~-— Y2 Figura 3.1 Estrategia bésica de los estudios experimentales Los dos elementos fundamentales de la estrategia de los estudios ex- perimentales son: Estudios experimeniates/49 1, La asignacién aleatoria de las unidades de observacién a los tra~ tamiestos, con lo cual se busca conformar grupos que estén en igualdad de condiciones con respecto a las dems variables relacionadas con el efecto. * En el ejemplo citado, la asignacién aleatoria —de acuerdo con el compor- tamiento usual del azar— deberia formar grupos de pacientes hipertensos similares con respecto a la edad, al sexo, a la obesidad y 4 las demis variables asociadas con la enfermedad. Al conjumto de variables asociadas con el efecto estudiado se les denomina caractertsticas de base, los valores que ellas toman al momento de conformar los grupos se suelen presentar como Parte importante de la jecuciGn y del informe de cada trabajo experimental. 2. La definicién de los grupos o tratamientos por parte def investi- gedor, lo cual Je permite ejercer un control sobre la variable inde- pendiente, En el ejemplo. citado, el investigador puede definir los tratamientos que han de ser evaluados y aplicarlos a los grupos observados, Por ejemplo dieta sola y ésta mAs actividad fisica. En muchos estudios experimentales de caricter epidemioldgico los grupos o tratamientos estén definidos por ia exposicién de interés; mientras que en los estudios observacionales, tal como se verd mds adelante, el in- vestigador est4 limitado a observar la exposici6n o. ei tratamiento en e] Cual, por uno u otro motivo, se coloca a cada snjeto pacticipante. Ademds en los primeros la comparacién del efecto estudiado se hace usualmente. Saire dos grupos: ¢] que recibe un tratamiento de interés, el cual se deno- mina grupo experimental, y el que recibe un tratamiento diferente o un placebo, con el fin de tener un punto de comparacion o de referencia, el cual se conace como grupo control. Debido a'las consideraciones éticas que se imponen 2 la experi- meniacién con seres humanos —que exigen el consentimiento de las personas y ciertas condiciones favorables para su participacién en deter- minado estudio— la poblacién de Sujetos en la cual se realize el expe- nimento suele reducirse como consecuencia del-rechazo voluntario de algunos y a la exclusin de otvos a criterio del investigador; por ejem- plo, debide a la inconveniencia de someterios a tratamientos que pueden producir los efectos negatives o porque ya no son susceptibles de recibir el beneficio buscado. El conjunto de sujetos que finalmente participan en el estudia, vo- iuntsrios y elegibles, conforman Ja poblacidn de estudio. La figura 3.2 ilustra el proceso de seleccién de los Participantes desde fa identifica- 50/ Metodalogta de ia ivvestigaciin— cién de la poblacién de referencia, aquélla a ja cual se pueden genera- lizar los resultados del experimento, hasta la conformacién de jos gru- ‘pos © tratamientos. . Poblacién de referencia Informacion relaconada con el }+-—_———_ propiisito, los procedimientos, _—____ Exclusion voluntaria, ‘No particpantas exclusion de personas ro aptas Poblacién de estudio: voluntarios y elegibles Akeatorizacién Tratamiento t Tratamiento 2 Figura 3.2 Proceso secuencial para la seleccién de los participantes y defini én de los grupos comparacios en ia investigacién experimental Conviene advertir que no siempre es f4cil definir con precision ia poblaciém de referencia ya que eh proceso do generulizacién de resultados implica la abstraccién de caracteristicas y condiciones que son propias de se Estustios experimentates ¢ 51 la poblacion experimental. Los resultados de un estudio experimental rea- lizade con personas de raza blanca con miras a establecer la superioridad de un esquema de tratamiento para Ja hipertensi6n moderada posiblemente RO pueden ser aplicados a personas de otras razas; sin embargo, los resul- tados de un estudio experimental realizado en persones de un cierto grupo racial para demostrar La efectividad de una vacuna como medio para pre- venir una enfermedad, posiblemente puede generalizarse a personas de di- ferentes grupos étnicos, En el estudio experimental conocido como Programa para la de- teccién y el seguimiento de la hipertensidn realizado en Estados Unidos (Hipertension Detection and Follow-up Program Cooperative Group, 1979), se identificaron 14 comunidades de diversas caracteristicas con una poblacién de 178.009 personas de ambos sexos, con edadex com- Prendidas entre las 30 y- los 69 afios, que fueron consideradas como poblacién experimental. Mediante un proceso secuencial de tamizacién se detectaron finalmente 10,940 hipertensos. con un promedio_de pre- sién arterial diastélica igual o superior a 90 mmHg, los cuales confor- maron la poblacién de estudio y fueron asignados aleatoriamente a dos grupos de tratamiento: el grupo experimental, terapia antihipertensiva escalonada, y el grupo control, terapia antihipertensiva tradicional. La abservacién de estos durante un periodo de cinco aiios mostré una me- nor mortalidad en el grupo sometide o una terapia.escalonada que aquél que recibié la terapia usual. A manera de ilustracién, en Ja tabla 3.1 se presentan los valores ini- ciales de-las caracterfsticas de base de los Participates en el estudio men- cionado, los cuales -permiten apreciar la similitud de los dos grupos comparados. wu Como resultado de} proceso de seleccién de tos sujetos que deciden cooperar asi como de aquellos que son elegibies para participar en el estu- dio, es posible que la poblacién de estudio difiera notablemente de la po- blacién experimental con lo cual se dificillta la aplicacién de los resultados a esta tiltima (Wilhelsmem y colaboradores, 1976), En un estudio de imervencién de caricter preventive para fa enfer- medad coronaria realizado en Suecia se demostré que los participantes en 1 grupo experimental n = 7455 diferfan en factores Pronésticos asociados a la enfermedad con regpecto a quienes fueron seleccionadas inicialmente Para participar en ét pero que por diferentes motivos se negaron a huceclo n = 2501. En condiciones como ésta la generalizacién de los resultados ‘52 s:desodologta de la iorestigacion.. Tabla 3.1 Caracteristicas de los participantes en el Programa pare la detec+ cién y el seguimiento de fe hipertensién, Estados Unidos, 1979 Carecteristicas de base ‘Grupo experimental Grupo placebo Nimero 588s $455 Promedic de edad en afios 508 * 50,8 Hombres blancos 345% 341% Mujeres blancas 21,6% 21,2% ‘Hombres negros 194% 19,9% » Mujeres negras 245% 24.8% ‘Promedio de presién sistblica 159.0 mmby 158.5 mmHg Promedio de presién diastblica 401.1 mmHg 101,1 mmHg Pulo. 81,7 pu/min 82.2 pul/min Promedio de colestero! 235.0 mg/dl 235,4 mg/dl Fumadores > 10 cigarrilles diarios 256% 26.2% Promedio de peso desaable 1244 125,0!b Promedio de creatinina sérica 1,1 mg/dl 1A mgt Promedio de giueosa plasmética 1785 mg/dl 1789 mg/d Hipertiofia ventricular izquierda por ECG 8% 5.1% Historia de accidente cerebrovascular 2.5% 2.5% Hisioria de infarto del miocardio 51% 5.2% Historia de diabetes 6.6% 7.5% Medicacion antihipertensiva 26.3% 25.7% fuente; Hipertensién Detection and Foltow-up Program Cooperative Group. Five-year findings of the hipertension detection and follow-up program: |. Reduction in mortality of persons with high blood pressure, including rilld hipertersion. JAMA, 1979; (242): 2564, obtenidos a Ia poblacién experimental es cuestionable, no obstante si se comprueba que las caracteristicas de base de los sujetos que se niegan a participar y de aquellos que no son elegibies son similares a tas de la po- blaci6n de estudio, ¢s posible la aplicacién de los resultados obtenidos a la poblaci6n experimental. Clasificacion Los estudios experimentales en epidemiologfa pueden clasificarse segin su propésito en dos grandes grupos: terapéuticos y preventivos, Los estudios terapéuticos tienen como finalidad evaluar tratamientos para enfermedades ya diagnosticadas y recibsn cominmente el nombre de ensayos clinices, aunque estos no pretenden aporar.un conocimiento que $4 /tdmodetogla de la evventigacisa... a 1 2 3 4 5 Ano No. en & 2,565 484 308 184 104 62 Riesgo @: 586 496 340 24 134 76 Figura 3.3. Andlisis de lp table de supervivencia que muestra el porcentaje de pacientes libre de un tumor de mama con posterioridad a la mastectomia parcial MP, 0 a la mastectomia parcial con irradia- cidn MP + RX Fuente: Fisher et al. Five-years results of a randomized dinical tial comparing total mas- tectomy and segmental mastectomy with or without radiation in the treatment of breast cancer. Mew Englend Journal of Medicine. 1985; (312); 669. con la adopeién formal de esta vacuna por el sistema de salud publica de Estados Unidos (Francis y colaboradores, 1955}. En el estudio conocido como Programa de clinicas de investigacién en lipidos (Lipid Research Clinica Program, 1984), con el fin de contar con un niimero de eventos que permitiera establecer resultados conclayentes, se asignaron aleatoriamente 3806 personas consideradas como de alto riesgo, Jas cuales eran hombres de mediana edad con hipercolesterolemia, a doz grupos que fueron observados durante 7.4 aiios; el grapo experimental re- Cibié un tratamiento con colestiramina con el fin de redurir los niveles 56 /Meodologta de ta tevestigacion.. Tamaiio muestral ‘Uno de jos aspectos metodolégicos de mayor importancia en Ia realizacién de un estudio experimental ¢2 el relacionado con el tamaito muestral. Mu- chos estudios experimentales no logran demostrar las hip6tesis que preten- don debido el insuficiente tamailo de la poblacién de estudio, a este respecto es de suma importancia advertir que los estndios realizados con im tamefio muestral insuficient: implican, ademis de los inconvenientes causados a los participantes, un despilfarre inti] y casi.siempre cuantioso de tiempo y de recursos materiales y humanos (Freiman, 1978, Altman, 1980). El tamafio muestral depende de Ia frecuencia con que ocurre el even- to observado —por ejemplo el infarto del miocardio en un ‘estudio pare prevenir la enfermedad coronaria—- y de la magnitd de Is diferencia an- ficipads en el efecto entre los grupos de tratamiento, es claro, que ta de~ teccién de diferencias pequefias exige muestras numerosas. Asi, un estudio experimental realizado pars anslizar cl efecto del consumo diario de aspi- rina en Ja prevencién del infarto del miccardio realizado en sujetos con edades comprendidas cote los veinte y los cuarenta afios requiere un 12- ‘mafio muestral mayor que si se realiza en sujetos con cdades entre los cuarenta y los sesenta sites, debido a que tal evento ocmrre Con mei05 frecuencia en.el grupo de snjetos mis jévenes, Este hecho es un argumento a favor de los extudios de campo que se realizan en poblaciones de alto riesgo. ‘La imposibilidad de contar con un mdmero suficiente de participantes en una sola localidad sugiere a conveniencia de realizar el estudio con Ia panicipacién de varias poblaciones, estrategia que da lugar a Jos denomi- nados estudios mulsicentro (Lilienfeld, 1981). En el estudio conocido como Ensayo de intervencién sobre milktiples factores de riesgo para la morta- Hdad por enfermedad coronaria patticiparon 22 centros clfnicos para el seguimiento durante 7 afios de 12.866 hombres entre 45 y 57 aftos de edad considerados como de alto riesgo por tener hipertensidn, niveles altos de colesterol y ser fumadiores, quienes se asignaron aleatoriamente a dos gru- pos de tratamiento: atencién médica usual y medidas preventivas para el control de los factores de riesgo (Multiple Risk Factor Intervention, Trial Research Group, 1982). Los condicionantes del tamaiio mucstral sc reflejan en 1a formule que guia la estimaciéa del tamaiic requerido para !a realizecién de la ma- on Esuiosexpermensaies/ 57 yorla de los estudios experimentales, on los que sc pretende probar la hi- Pétesis de la existencia de una diferencia entre dos proparciones o hipétesis alternativa contra la hip6tesis de la inexistencia de dicha diferencia o hips- tesis nule (Donner, 1984); (2, IOP (1 ~ PY + VEPs (1 - Pp) + Pel - Poll F en donde: nes el tamaiio de cada grupo 2a ¥ Z, son los valores de la variable normal estandar correspon- dientes a las probabilidades de errores tipo I y tipo I], respectivamente, y que son definidas por el investigador (Véase el capitulo 13 para una defi- nicién de los errores tipo I y 1) Pe ¢5 la proporcién anticipada en el grupo control de acuerdo con conocimientos previos P, es la proporcién anticipada en el grupo experimental Pes igual a (P; + Poy2 5 es igual a Pg - Po, Ja diferencia minima en las Proporciones que se considera importante detectar desde una mirada clfnica o cientéfica y que también es definida por el investigador. Fara la correcta aplicacién de tal formula es importante considerar las siguientes observaciones: 1. En Ia prastica sdlo se conoce el valor de P- con él cual se puede estimar P= Pe + 6, esta iiltima definida por el investigador. 2, La expresiéa permite obtener el tamaflo muestral n de manera aprozi- 3. Si el disefio del experimento contempla Ja asignacién de los sujetos a Jos grupos de tatumiento de manera equiparada, la f6rmula anterior pro- duce un tamafio muestral algo mayor que el requerido.? Ante las dificulta- des prdcticas que surgen para cstimar por anticipado el efecto del 48 desea incorporar Je sorreccign de continuidad las pruebas astadsicns conreapondientes ‘poods iacromestar el valor obteaide mediante Iz aplicaciin de dicho férmala cn et valor resuhame de ‘2Pe - Pol 2 Véate 22 al capitulo 9 to relacionde con el equiparamiente, 58 /Meindoiopinde Ia invemigacion. equiparamiento sobre ¢] tamafio muestral, algunos autores recomicndan ig- norar este efecto y calcularlo mediante Ja formula citada (Schlesselman, 1974), ‘La sigionte situaciGn ilustea Ia aplicacién de la determinacién del temaiio muestral en un ensayo clinico en el cual se trataba de probar la hipétesis de la superioridad de un tratamiento alternativo pars los pacientes con diagnéatico de sida frente a una terapin ya conocida que producia una mejoria de los afntomas en el 40% de los tratados. Los investigadores con- sideraron que el estudio sc justificaba si el tratamiento alternative incre- ‘mentaba la mejoria de los paciemes en un 20% o més; ademds, aceptaron exponerse #1 riesgo de eqnivocarse en las conclusiones del estudio segin mn error de tipo I del 5% y de tipo Ti, del 20% De acuerdo con la frecuencia de In mejoria observade en Jos pacien- les watados con la terapia ya conocida y con los criterios fijados por los investigadores, se tiene que: 0,40 + 0,60 2,2 1,04; Z, = 0,84; Pe = 050; 8 = 0,20 __ {1,64 N12(0,30P} + 0,84 F0,60{0.40) + 0,4040,60))F n= (0,207 = 75,83 sujetos en cada grupo Con respecto a otros aspectos relacionados con ¢} célculo del tamafio mesial en los estudios experimentales el lector puede consultar obras més especializadas sobte el tema (Feinstein, 1977; Fleiss, 1981; Friedman y co- laboradores, 1981; Donner, 1984; Meinert, 1986). Agrupamiento a Ep situaciones en. tas cuales sc desea ascgurar qué Ja distribucién de los grupos de tratamiento sea homogénea con respecio a un factor 0 grupo de factores —en vez de suponer que Ja aleatorizacién produzca tal efecto— 0 cuando se quiere aumentar la eficiencia de la jnformacién —lo cual per- 5 Véape en e) capil 13 lo elacinado con la detenmiacia dol umaato meer en lor estaioe Estudios experimeniales /S9 mitiria reducir ¢] tamaiio muestral requeride bajo otras modalidades de! diseho— es posible equiparar los sujetos asignados a los grupos de trata- miento de acuerdo con los valores observados en tales factores, Ast, si se Guiere asegurar que la composicién por scxo de dos grupos comparados sea homogénea se puede aleatorizar un Brupo de hombres y otro de muje- Tes con una asignacidn altema de los participantes a los tratamientos, ¢s- trategia 2 la cual se conoce como agrupamiento. Estratificacién de los resultados En algunas ocasiones es aconsejable realizar el andlisis de los resultados Por estratos de uno o mas factores, tal como ocurre con los estudios mul- ticentro en los cuales el andlisis debe Tealizarse de acuerdo con los estratos, correspondientes a los centros participantes: con este Pprocedimiento no sélo 8¢ pueden detectar diferencias en los resultados obtenidos entre estos iilti- mos, sino que puede conttibuirse a ia explicacién de tales diferencias en términos del problema analizado con io cual se porta un mayor conoci- miento al respecto. Suspensiin del estudio Cuando en un periodo menor que ¢l inicialmente previsto para la duracién del estudio experimental un tratamiento demuesire ser notablemente ‘supe- Tior a los demés, o cuando la administraci6n de un tratamiento resulte ser claramente lesiva para los que lo seciben, éste debe terminarse. Un gjemplo de esto es el estudio denominado Ensayo del betabloqueador para el atu. que cardiaco €1 cual se observaba el efecto del Propanolol sobre Ia mortalidad subsecuente a on primer infarto del miocardio que fue suspen- dido nueve meses antes de la fecha prevista debido a ios claros beneficios de su administracién (DeMets y colaboradores, 1984). Adherencia Otro aspecio metodolégico de Primordial interés es el referente a Ia adhe- vencia de 16s pacientes al tratamiento, Es previsible que por diversas 1270. nes algunos de los participantes no se adhieran al régimen del grupo al cual han sido asignados como el yechazo a los medicamentos 0 a 1a aparicign de efectos secundarios. La falta de adherencia de un Participante al tratamiento que le co- ‘mreeponde tiende a dismainuir las diferencias observadas entre los grupos y Por ello, disminuye la capacidad del experimento para detectar las diferen- 60 aesodologia de ta brvettigacisn.— cias existentes, circustancia que inrplica una disminucién del poder de las tectar una diferencia significativa ea la mortalidad por esta enfermedad entre al grupo tratado —19,3/1000— y al gmopo no tratado —17,9/1000— se atri- toys a la modificacion de la exposicién a los factores de rieego como €l colesterol, el rabaquiamo y Ia hipertensiGa durante ci periodo de estudio. 'Si a pesar de las medidas tomadas por los investigadores para #86- gmat ln adherencia de los parieipantes al régimen de tatamiento prescrito 65 inevitable que. algunos gxjetos se aparten de 41, en el momento de! and- isis tales individuos deben incluirse en su respectivo grupo de tratamiento; de otra manera se asumiia el riesgo de introducir un sesgo en los resulta” dios por cuanto la no adbereacie al tratamiento pusde estar asociada con ¢] efecto evaluado; en estos casos convient cbrar segin el principio de una Ver aleatorizado, siempre analizado, el cual se conooe como Ja intencién de tratar. ‘Pérdides Durante e) periodo de realizacién del experimento es posible que on algin momento se doje de recibir informacién de slgunos participantes, por efemplo pore emigran a oira cidad, hecho qne se conace como pértida al segu mento de todos los participantes hasta la finalizacién del experimento. Para lograr este propésito no sélo es indispensable contar con bue- nos mecanismos para la Jocalizacién y evaluacién de los participantes, sino ademés establecer incentives que mantcngan en estos una buena motive- cidn, De lo dicho anterjormente con respecto & Jas péndidas al seguimiento y ala no adherencia al régimen del tratamiento prescrito se deduce que s¢ eben reducir ambas al minimo so pena de incurrir on sesgos apreciables que puedan invalidar las conclusiones del estudio. 4 poder do von praca esta eb su capacidad pant etetat me ena difeencin Oe co propos enmparaor: diche capeidad se conch por medie de ls. probatlind que dene in prosba para proccir resulaados etadisticamcate siguiicasivos, * Estidios experimentales/61 Exclusiones En casi todos los estudios experimentales que sc realizan con seres humanos se deben excluir aquellos sujetos que por sus caracterfsticas personales otras Tazones NO garanticen una continuidad o una buena adherencia a los tratamien- tos considerados, Motives tales como connaindicaciones médias, la presen- ‘uciéa previa de eventos que pueden invalidar las conclusiones o la necesidad de recibir determinado tratamiento son argumentos a favor de Ja exclusion de determinados sujetos de Participar en un estudio experimental. Con respecto a tales exclusiones es importante advertic que si bien deben ser hechas con base en criterios claramente expresados en el proto- colo que gufa al estudio y con anterioridad a le asignacidn de los pacientes a los grupos de tratamiento, no amenazan la validez de la investigacién aunque pucden limiter la generalizacién de sus resultados, por ejemplo si las exclusiones son numerosas y differen apreciablemente cn sus caracte- risticas de base de‘las de Ja poblacién de estudio, Estudios doble ciego Con el fin de evitar los posibles sesgos que puede originar el conocimiento det grupo al cual pertenecen los Patticipantes se debe buscar, en lo posible, que tanto estos como quienes evalian el efecto desconozcan el tratamicnto recibido, estrategia a la cual se denomina doble ciego. Es posible que el conocimiento por parte de! investigador dei grupo de tratamiento al cual ha sido asignado un participante induzca conductas, concientes 9 inconcientes, cuyo efecto final se refleje en Sesgos que afecten los resitltados del estudio, lo cual se observa cuando un investigador que pretende demostrar el bene- ficio de un tratamienta hipotensor puede inadvertidamente favorecer el re- sultado deseado al recomendar medidas terapéuticas adicionales a quienes Perterecen al grupo experimental. Aunque en muchos estudios no es posible asegurar el desconoci- ‘Miento por parte de los investigadores —debido, entre otras razones, a con- sideraciones de cardcter ético— ovasiones ¢s posible delegar el seguimiemto de los participantes —y Particularmente la evaluacién del cfecto— 2 personas que ignoren ef tratamiento al cual estin sometidos. Placebos conocimiento del tratamiento Por los participantes puede aiterar las res- Puestas de estos, lo cual introduce sesgos en los resultados obtenidos de- 62 /Metodologia de ta invesrigaciin... bido a mecanismos psicolégicos, de resistencia Bl tratamiento o.dc otra fodole. Para solucionar esta dificultad se recurre 2 Ja administracién de ratamientns con una apariencit idéntica de tal modo que los participan- tes no pucdan identificar lo que reciben, conducta que es comin en los ensayos clinicos. Es importante advertir que Ja utilizacin de un placebo tiende a climinar lo que se conece COMO éfecio placebo 1 cual con siste en la respuesta favorable debida al conocimients real o supucs- to de que se recibe cierto fratamiento, independientemente de los efectos de éste. ‘En -el estudio denominado Aspirina ¢ infarto del miocardio e) 14,9% de quienes recibfan placebo presentaron sintomas. relacionados con erosion de la mucosa géstrica, gastritis 0 Glcera péptica lo cual representa un efecto placebo. La comperacion de tal porcentaje con el correspondiente a} abservado en el grupo control del 23.7% permitio estimar Ja frecuencia de efectos colaterales gasticos atribuibles a la dro- ga cn el 8.8% (Aspirin Myocardial Infarction Study Research Group, 4980). Consideraciones éticas Aunque no es la intencién detallar aqui los aspectos éticos relacionados con la investigacion experimental en Ja que participan seres humanos, sf se pueden destacar algunos principios fundamentales que deben orientar todo trabajo experimental. La asignacién aleatoria de un posible participante a uno de los grupos de tratamiento no es ética si entre quiencs se proponen realizar el estudio existe cl convencimiento de que uno de ellos es mejor que otro; en este caso al sujeto se le debe ofrecer el tratamiento que se con- sidere mejor. Por otra parte, si quienes se proponen realizar un experi- mento con seres humanes creen conocer de antemano la respuesta al estiidio deben abstenerse de realizarlo, de igual forma los investigadores que dirigen 1a realizacién de un estudio experimental deben suspender su ejecucién en e] momento en et que un ratamicnto se evidencie como superior a otro. ‘No. obstante, es importante advertir que cuando existe la duda con respecto al beneficio que puede aportar determinado tratamiento, no es ét- co suspender el estudio experimental porque si éste produce resultados fa- vorables el no realizarlo implicarfa el que muchas personas S© priven de sus beneficios y si, por el contrario, no produce resultados favorables 0 ” Estudios experimentales/63 catos son nocivos, quienes se someten a él seguirén recibiendo sus efectos negativos; casos en los cuales existe la obligacién ética de aclarar Ja duda existente, Las consideraciones éticas que deben orientar la realizacién de un estudio experimental est4n relacionadas con la naturaleza del problema es- tudiedo, con Jos riesgos inherentes al tratamiento evaluado y con Tas cir- custancias en las cuales se realiza. Es claro, por ejemplo, que las implicaciones éticas de un experimenio que wata de evaluar las ventajas relativas de Ja irradiacién frente a la quimioterepia para el tratamiento de Ja leucemia son mayores que as relacionadas con Ja. comparacién de dos ‘tratamientos para cl resfriado comin, . Otras consideraciones exigen Ja exelusiGn de ciertos estudios experi- mentales de personas cuyas condiciones puedan implicar un riesgo para su salud, por ejemplo, pacientes con determinados antecedentes, extremada- mente fragiles, ancianos o mujeres embarazadas. Por Tazones metodelégi- eas ya mencionadas dichas exclusiones se deben hacer antes de la asignaciéa de los sujetos a los grupos de tratamiento. Con el fin de resolver estas situaciones es tecomendable le forma- cin de un comité de 6tica con personas de reconocido preatigio, Algunas istituciones en las que se suelen realizar estudios experimentales han defi- nido y adoptado un conjunto de normas éticas que gufan la ejecucién de estos.’ Para Ia definicién -de tales cédigos estas organizaciones pueden guiarse, entre otras, por las recomendaciones adoptadas por Ja Asociacién Médica Mundial en su Declaracién de Helsinki en 1964 y revisadas pos- teriormente en 1975 y en .1983, Consideraciones finales De lo expuesto anteriormente se pude dedueir que la correcta realizacién Ge un estudio experimental exige 1a adhesién « rigurosos principios que guian la investigacién cientffica ¥ que implican, usualmente, una inversion de cuantiosos recursos, No obstante tales exigencias, la historia de ta in- Vestigacion epidemiolégica es rica en situaciones en Jas que la investiga- cién experimental ha aportado conocimientos de inmenso valor cientifico, tal como se puede entrever en Jos ejemplos citados en cl texto, De otro lado, ¢s importante considerar que ol paradigma de la ‘inves- tigacin experimental es la bese fundamental sobre la cual se han desarro- Itado los demés disefios que son comunes eq epidemiologia; por cate motivo, el intento de abordar tedrica 0 Prdcticamente estos diseiios sin una 64 /Melodologia de ia inrentgacién.» cabal comprensiGn de los principios subyacentes en Ia eatrategia de la in- ‘yestigacién experimental ¢s una tarca inttit y engaiiosa. Referencias bibliogrificas 1, Alon DG. Statistics and othica in medical research, 1: How large a sampic? British Medical Journal. 1980; (281): 1336-1338. 2, Aspizin Myocardial Infarexion Susdy Rescarch Group. A randomied, controlled tial of aspirin in persons recovered from myocardial infarction. JAMA, 1980; 7 (243): 661- 669. 3, Bernard C. An Introduction to the Study af Experimental Medicine, Trensi: Heary Copley G.New York, Dover Publications, 1957. 4, Boring BG, The nstime and history of experineauil conirsl. American Jounal of Paychiatty. 1954; (67): 373-89. 4. Bradford Hill A. A stort textbook of medical statistics, London, Hodder and Staughton, 1983. 6. Dean HT, Aoki FA, Elvone E. Domestic water ancl dental caries, V. Additional smadies of the relation of finoride domestic waters to deatal caries experience in 4425 white tildren, aged 12.to 14 years, of 13 cities in 4 states. Public Health Reports. 1942; (57), 155-1179. 1, DeMets DL, Hardy R, Priedmim LM et al. Statics! aspects of easly termination in the ‘Bots-Blocker Heart Attack Trial. Conrolied Clinical Trials, 1984; (8): 362. 8. Donner A. Approaches to aatiple size extimation in the design of clinical tials - A review. Siasistics in Medicine. 1984; (3): 199-214, 9. Feinsein AR. Clinical Biostatisiics. Saint Louis, CV. Mosley, 1977, 16. Fisher B, Bauer M, Margolese R at al Five-year results ofa randomized clinical wial Compar- ing tow masteciomy and segmental mastectonty with or without radiation in the meatment of breast cancec, New England Journal of Medicine. 1985; G12 665-673. 1, Fisher RA, The arrangements of field experiments. Journal of the Ministry of Agriculture. Great Britain. 1926; (33): 503-513. 12. Feiss JL, Statistical Methods for Rates and Proponions, 2nd, Ed. New York, Jchn Wiley and Sons, 1984. 13, Peannis TR. Koms RF, Voight RB etal. An evaluation of the 1954 polyomelitis vaccine tials, American Journal af Public Health. 1955; (45): 1-63. 14, Freiman JA, Chalmers TC, Smith H etal. Tee importance of beta, the type Hi error and Sample size in the design and inrpretation of the randomized contol wial: survey of “pegntive” tials. New England Journal of Medicine. 1978; (292): 690-694. 15. Feiedmen LM, Furberg CD, DeMets DL. Fundamentals of Clinical Trials, Boston, Joba ‘Wright, 1981. 16. Gotdberger !, Waring CH, Tanner WF. Pellagr prevention by diet nang instineciona! inmates, Public Health Reports. 1923; (38): 2361-2368, 17, Graont J, Nazura] and politieal observations mentioned in x following index, and made ‘upon the Bills of Mortality, London, 1662. Estudios experimeniates /65 18. Hipertension Deteetion and Follow-up Program Cooperative Group. Five-year find- ings of the hipertension detection and fullow-up program: I, Reduction in ror tality of persons with bign blood pressure, including amild hipertension. JAMA, 1979; (242: 2562-2571, 19, Lilienfeld AM. Cétetis pétibus: tha evolution of the clinical wil. Presented at the 34:h annual meeting of the American Association for the History of Medicine. Toronto, ‘Canada, May 1981, 20. Lind J. Treatise of the Scurvy. Edimburgh, Sands, Mary and Cochran, 1753. 21. Lipid Research Clinics Program. The Lipid Research Clinics Coronary Primary Preven fon Trial remults; I. Reduction of incidence of CHD. JAMA, 1984: (251): 351-364. 22, Lister J. On the effects of the antiseptic systema of treatmeat upon the sulubrity of a surgi- cal hospital, Lancer, 1870; 1 (4-6); 40-42, 23. Meinert CL. Clinieal Trials. New York, Oxford University Press, 1986, 24. Mejfa R, Espinal F, Vélez H. Fluoruracién de la sal en cuatro comunidades colombianas TL Estudio bésico de la caries dental. Boletin de ta Oficina Sanitaria Panamericana. 1972; (73); S61-571. 25. Multiple Risk Factor Intervention Trial Research Group. Multiple Risk Factor Imerven+ Son Trials isk factor changes and morbidity emul, JAMA. 1982; (248): 1465-1477. 26, Pew R, Pike MC, Annitage P et al, Design and analysis of randomized clinieal-tials re- quiring prolonged observation of each patient, E Introduction and design. British Jour ‘nal af Cancer. 976; (34): 58.612, 27, Peto R, Pike MC. Armitage P ct al. Design anc analysis of mandomized clinical trials re- quiring prolonged observation of each patient, Il: Analysis and examples. British Jour nad of Cancer. 1977; (35): 1-38. 28. Rothman KJ. Modern Epidemiology. Boston, Line, Brown and Co., 1986. 28. Schlesseiman J. Sample sizx requirements in cohort atc case-control studies of disease, American Journal of Epidemiotogy, 1574; (99): 381-384, 30. Wilhelsmen L, Liungberg S, Wedel H etal: A comparison between participants and non participants in a primary prevention tial, Journal of Chronic Disease. 1976; (29); 331- 339, 4 Estudios de seguimiento o de cohorte En el presente capitulo se exponen los principios metodolégicos que caracterizan a las estudios de seguimiento, ia mancra como se cstiman las medidas de atociacidn, los métodos que permiten evaluar el efecto del azar en las estimsciones obtenidas y, por dltimo, se muestran las veniajas y las limitaciones de ellos. L.. eatudios de seguimiento o de coborte son una estrategia importante utilizada por la epidemiologia para el andlisis de asociactones atioldgicas. Aunque su realizacién suele demandar cuantiosos recursos, la comprensién de la estrategia que los caracteriza Y de las exigencias metodoldgicas que les son propias son requisitos importantes para ¢l investigador en. cpide- miologia, no s6lo porque es la pcién indicada en algunas situaciones, sino 68 sMatodologia de la inwestigncion... porque es el punto de partida para las demas estraicgias de ta investigacion ‘no experimental cn cpidemiologia. Estrategia Bésicamente, un estudio de seguimicato se yealiza mediante la observa- cidn en el tiempo de dos o més grupos de personas inicialmente sanas y expuestas de una mancra diferente a un factor etioldgico, con el] fin de estimar las diferencias en la jncidencia de la cnfermedad entre tales pmupos, 0 sea para estinat la asociacién existente entre la enfermedad, y el factor etiolégica. Beta estratcgia dificre del tipico madelo de la inves- tigacién experimental —en el cual los participantes se asigoan aleatoria- qmente a los grupos de estudio o ‘tratamientos— porque e] investigador ae limita a observar los sujetos; por este motivo, a loa estudios de se- guimiento, a Jos de casos ¥ controles y a los descriptivas se Jes kama estudios observacionales. En los csmdios de sepuimiento se. observa la exposicién a la que estén sometidos 108 paricipantes y ol efecto resultente después de un tiempos Por Templo, ) consumo de alcobo! y la aparicion posterior de cneer de la Lai ge. La comparscién de as medidas del efecto que se manifests en Jos apt for han esiado expuestos de manera diferente permite conctuir soerea de la asociacin existente entre 1a exposicién y el efecto; ast, la Observacién de que en los recién nacidos hijos de mujcres expuestas a los pesticidas utilizados en . faz (a+ biim HA) R= Tae By (rm, AA) (Mg 2) (B= (117) (395077 _ 19 67 = TFA (3950/7240) (3290/7240) valor que referido a la distribucién de chi cuadrado de un grado de libertad revela resultados estadisticamente significativos, P < 0,001, prueba de una cola. . Esmudior de seguiniento o de cohorte/75 Un intezvalo del.90% de confianza se obtione, de manera aproxi- mada, de Ja siguiente manera: Rp ttaNe) 293i = 146; 2,82 Ademis, la evaluacién del impacto que en la poblacién trabajado- ra produce cl ruido sobre el dafia actistica se estima por medio de las diferencias observadas en la incidencia en términos de las proporciones. del riesgo atribuible en expuestas y del riesgo atribuible poblacional: PRak = Hi-Z. 902101 - 001033 = 0,508 Tt, 0.02107 Paap a Tex Ty . 001616 - 001033 _ 4 55, Th 001616 Esios resultados indican que cerca del 50.8% de la incidencia de dafio acdstico que ocurre en la poblacién expuesta al ruido se debe a la exposicion a éste, al igual que cerce del 36.1% de. Ia incidencia en la po- blacién total. Consideraciones metodolégicas La estrategia propia de los estudios de seguimiento —la cual refleja la estrategia propia ide log estudios experimentales— ofrece poca dificultad metodoldgica; no abstante, es preciso considerar algunas exigencias parti- culares. oy La definicién de las cohortes y del tiempo de observacién de ésts debe hacerse de acuerdo con el conocimiento existente acerca del Proceso. biolégico subyacente 0, en su defecto, con supuestos razonabies acerca de éste. Sobre tal respecto es importante considerar que el periodo minimo de seguimiento debe ser igual a la suma del periodo minimo de induccidn mis el periodo de latencia, el primer de ios cuales corresponde al tiempo re- querido para que la exposicién inicie el Proceso causal y e! segundo, cl que tascurre entre ef comicnzo de la enfermedad y el momento en que se ma- nifiesta clinicamente (Rothman, 1981), 76 / Mewodologia de 1a invesiigecién.. ‘TeGricamente, un estndio de seguimiento en e] cual el periado de observacién es menor que la suma de Jos periodos de induccién y de latencia tiende a producir estimacianes iguales de la incidencia en ex- puestos y cn no expuestos debido a que los casos que se deben a Ja exposicién no alcanzan a manifestarse, nO obstame, en algunos catudios de seguimiento —particularmente en aquellos relacionados con factores ocupacionales— es comin la prdctica de considerar el periodo de induc- ciéa a partir del momento en que s¢ inicia la exposicién, De acuerdo con ese principio, si para cierta enfermedad ce considera un decenio como el periodo minimo de inducci6n del tabaquismo, el tiempo do se- guimiento de los fumadores que no han completado diez afios de obser- vacion en e] momento’ de] andlisis no debe considerarse como tiempo de exposicién. Una vez los sujetos sc clasifican como expuestos 0 no expuestos debe mantenerse dicha clasificacién,-lo cual tiene como objetivo evitar que sc introduzcan sesgos puesto que es frecuente que los individuos modifiquen !a exposicién por motivos relacionados con el efecto estu- diado, Asf, una persona puede abandonar la utilizacién de un medica- mento nocivo cuando sospecha que éste se relsciona con sintomas recientemente percibidos y que, efectivamente, corresponden a Ta enfer- medad cstudiada: en o! momento del andlisis, st clasificacién en el gru- po de Jos no esxpuestos tiende a disminnir equivocadamente la estimaci6n de la asociarién existente. Las pérdidas durante el seguimiento por muerte, desercién 6 migra cién pueden ocasionar sesgos en la estimacion de la asociacidn en la me- dida en que estén relacionadas con el efecto estudiado, por ejemplo, & posible que durante el seguimiento de una cohorte-expuesta a una alta con- taminacién atmosférica para evaluar el efecto de ésta sobre la bronquitis crénica, algunas personas afectadas emigren a lugares mas saludables; la omisién de tal informaciGn produce un sesgo que tiende a disminuir Ja asociaci6n sj realmente existe. En los estudios de seguimiento es posible utilizar como grupo de comparacién para la cohorte expuesta un grupo interno 0 uno extermno. El primer caso se presenta cuando se selecciona una muestra de la poblacién cuyos sujetos se clasifican en expuesias y NO expuestos; en estas condicio- nes es posible comparar la incidencia observada entre ambos grupos 0 la incidencia entre si de aguellos expuestos en grado difereatc, tal como se hizo en el. estudio de Framingham en el cual se compararon lus tasas de 78/ Metodoiogia de la ievestigacida... Con el fin de controlar los posibles sesgos de, confusién en cl mo- mento del andlisis se. debe registrar durante el seguimiento ei valor obser- vado en les potenciales variables de confusién puesto que la obtencién de esta informacién, una vez sealizads la obscrvacién, es casi siempre una tarea imposible. El equiparamiento realizado en el momento en que sv se- leccionan los participantes rara vez se utiliza como estrategia para controlar los sesgos de confusién en estos estudios pursto que Ia obtencién de ta informaci6n necesaria con respecto alas variables que sc quieren controlar, —en grupos que son usualmente numerosos— hacen que ésta sea une al- temativa costoss ¢ ineficiente.'La estratificacién en el andlisis y el anélisis multivariado, estrategizs que se exponcn en capitulos individuales de esta obre, son las mejores alternativas para coprolar Ja confusi6n de variables y para estudiar Ja interaccién de los factores en este tipo de estudios. Ventajas y limitaciones ‘Los estudios de seguimiento demandan, por lo general, una cuantiosa in- versién de recursos. Por wna parte, la mayorfa de las enfermedades presen- tan una baja incidencia relativa y por tanto la deteccién de algunos casos durante un seguimiento en el tiempo cxige que inicialments se disponga de gropos muy numerosos; por ejemplo, si Ia tasa de incidencia de una deter- minada enfermedad es de diez. casos por diez mil personas-aiio-exposicién, para contar en el andlisis con 50 casos después de un periodo de segui- miento de 5 afios es neceserio empezar Ia observacién con una cohorte compuesta aproximadamente por 10.000 personas, motivo por el cual a medida que la incidencia se hace mas baja la factibilidad de realizar on estudio de seguimiento es menor. Por otra parte, si los periodos de induccién y de Jatencia de la en- fermedad estadiada son prolongados, la observacién de las cohortes debe comprender un periodo suficientemente largo para permitir tanto la inicia- cién como la manifestacién ulterior de la enfermedad (Rothman, 1986). A las anteriores exigencias se suman Jas derivadas de la necesidad de esta- blecer un sistema de monitorizacién casi permanente para recolectar y re- gistrar la informacién pertinente a las diferentes variables observadas y, en particular, para detectar la incidencia del efecto por medio de exé- menes clfnicos, dé laboratorio o con la ayuda de otros procedimientos diagnésticos. Sin embargo, ¢s posible disminuir el costo de un estudio cuando se utiliza informacion ya existemte en registros de buena calidad, tal como la que suelen tener los registros poblacionales de cAncer, no obstante, se debe (80 ./ Mesoalologia de ia trvestipacion... que mantienen una informacién sacualizada de mus afiliados facilita la tarea de In recolecci6n y registro de la informacin pertinente; los estudios realizados por Doll y colaboradores en Inglaterra con respecto al tabaguis- mo son un buen ejemplo de esta cstrategia (Doll y Hill, 1964; Doll y co- laboradores, 1980). También debe considerarse que con la estrategia propia de los est dios de cohorte, a partir de la exposicién hacia el efecto, s¢ puede obtencr ‘una informacién bastante completa acerca del fenémeno estudiado pues es ble observar durante ¢] seguimiento las vartaciones en ia exposicién, en Jes variables que confunden y en otras de interés: ademés, ellos ofrecen i idad de estudiar milhipics efectos relacionados con una soln ex- posicién, incluso los efectos benéfices, sin que ello implique un aumento significativo de los costos. Aderés, cuando s¢ observan grupos numerosos de la pobjacién es posible estadiar e] efecte de la exposicién a multiples factores como sico- hal, tabaco y colesterol tal come se realiz6 en los estudios de Framingham (Dawber y colaboradores, 1951) y de Tecumseh (Epstein y colabersdores, 1970). En estos casos, sin embargo, Ya nainraleza de los factores estudiados exige usualmente Ia entrevista personal como la Gnica fuente de Ta infor- macién requerida. Por wltimo, es importante mencicnar la allernativa que ofrecen los estudios colaboratives en los que ka participecién de multiples istitucio- nes para el desarrollo de un proyecto costoso hace factible su realiza- cién mediante aportes parciales; un ejemplo de ello se encuentra en el Collaborative Perinatal Project en ¢] cual se estudié Ja relacién de muilti- ples exposiciones perinatales con diferentes resultados observados en elre- cién nacido en catorce hospitales universitarios (Heinonen y colaboradores, 1977). En estos casos, se debe considerar cuidadosamente Ta estrecha ad- herencia a un protocolo comin de todas Jas entidades participantes con énfasis en Ja estandarizacion de las condiciones en as cuales s¢ miden las diferentes variables y de los criterios y procedimientos diagndsticos em- pleados. Referencias bibliograficas 1. Dawber TR, Meadors GF, Moore FE. Epidemiological uproaches ta heart disease: The Framingham Study. Americas Journal of Public Healih. 1951; 286 (43): ‘779-286. 2 Dawber TR. The Framingham Study: The Epidemiology of Atherosclerotic Disease. ‘Cambridge, MA. Harvard University Press, 1980. Esmdios de seguimiento v de cohoree /8 1 3. Doll R, Hill AB. Mortality in relation to smoking: 10 yours’ observations of British doc- Urs. British Medical Journal, 1964; 1399-1410. 4 Doll R, Gray R, Hafner B et al. Mortality in relation to smoking: 22 years’ observations on female British doctors, British Medical Journat, 980: (280): 967-971. 5. Bpstein FH, Napier FA, Block WD et al. The Tecumseh Swdy. Archives af Eavironmensal Health, 1970, (213 402.407. 6. Hadperin W, Beaumont J, Reeve G ct al, The Cohort Study. En: Epidemiology of Occupa- ional Health, Karvenen M, Mikheev M (eds). World Health Organization, Copen- hagen, 1986, 7. Heinonen OP, Stone D, Shapiro S. Birth Defects and Drags in Pregnancy. Littleton, Mas- sachusets, Publishing Sources Group, 1977. 8, Miettinen OS. Estimability and estimation in case-referent studies. American Journal of Epidemtology. 1976; (103): 226.235. 9. Morris IN. Kagan A, Pattison DC et a, Incidence and prediction of ischaemic heart disease im London bustaea. Lancet. 1966; (2): 353-559, 10. Rosenman RH, Brand RJ, Jeakins CD et al. Coronary heart disease in the Westem Col- Inborstive Study. Final follow-up experience of 8.5 year. JAMA, 1975; (233): 872- 877, UL Rothman Ki, Induction and latent periods. American Journal of Epidemiology. 1981: (#14); 253-259. 12, Rothman KJ, Mader Epidemiology. Boston, Little, Brown und Co, 1986. 13, Schilling RS, Sources of Data, En: Epidemiology of Occupational Health, Karvonen M. Mikheev M (eds). World Heaith ‘Organization, Copenhagen, 1986, tudios de casos y controles En el presente capitulo se expone 1a estratgia utilizada por los estu- dios de casos y.controles, se describe la manera de estimar las medidas de riesgo que con éllos se obtienen y, por iltimo, se exponen las con- sideraciones metodolégicas que son importantes para su adecuada eje- cucion, S bien et modelo propuesto por los estudios de seguimicnto para la bis- queda de asociaciones causales replica el método experimental, al estimar én un contexto observacional Ia incidencia de los eventos de morbilidad o de mortalidad a partir de grupos caracterizados por una cierta exposicién, también es posible estudiar la existencia de estas asociaciones a partir de grupos definidos por tales eventos para relacionar dicho fenémeno con una exposicion previa, estudios alos cuales se les conoce como de casos y controles; su desarrollo en el decenio del cincuenta a partir de los trabajos 84 /Metodologta de la tnvestigacin.. de Comfield (1951), Dom (1955, 1959), Mantel y Haenszel (1959) y su progresiva adopci6n como estrategia formal para el estudio de asociaciones cansales se consideran como un logro importante de la epidemiologia (Co- le, 1979; Breslow y Day, 1980). Estrategia La estrategia de los estudios de casos y controles consiste en comparar la exposicién de un grupo de personas que presenta cl evento de interés, usualmente la enfermedad o la muerte, con la exposici6n de otro grupo comparable que no presenta tal evento: si Ja exposici6n propia de} primer grupo, los casas, es diferente de la del segundo grupo, los contoles, 8¢ tiene un indicio de la existencia de la asociacién buscada. A diferencia de los estudios de seguimiento en los cuales se mide la presentecién del evento de interés ea grupos definidos por la exposicion previa, en los estudios de casos y cantroles se imide la exposicién de gro- pos definidos por la presentaci6n del evento. Asf, la observacién de que un grupo de paciemes con diagnéstico de cirrosis hepitica ha estado mas ex- puesto al consumo de alcohol que quienes no sufren de tal enfermedad sustenta la bipétesis de que él consumo de alcohol es un factor de riesgo para el desarrollo de ella; la estrategia de estos estudios se muestra en Ja figura 5.1. Casos Controles ‘entermos: sanos Expuestos = $j Expuestos j-—J Tiempo No expuestos |“— No expuestas [“— Figura 5.1 Esquema simplificade de la estrategia de los estudios de casos y controles fF Esnadior de cmos y controtas/ 85 ‘Si bien este esquema presenta la estrategia de los estudios de casos y controies de una manera simple y atayente, la debida comprensién del contexto espacial y temporal en el cual se genera la informacién Propia de. tales estudios es un requisito indispensable para su correcta ejecucién & interpretacién, Si se supone que se desea estudiar Ia asociacién que caractcriza la exposicién a un cierto factor de tiesgo y ia incidencia de una enfermedad en una poblacién definida en la que en un periodo ¢, +f; 8@ presentan A + B casos y el resto de la poblacién, C + D personas, permanece sana y si para cstimar la asociacién se tomara una fraceién fy de todos los casos que se Dresentan en la poblacién durante el periodo ty - 2 independientemente de la exposicién, se tendrian f(A + B) casos, 0 sea, un total de 2 + 5 casos. De manera similar, si independientemente de la exposicién se tomara una fraceién f, de todas las Personas que sc encucmtran sanas al terminar el periodo, se tendrian fC + D) personas sanas; o sea un total de c + d Personas sanas. De esta manera, el total de personas incluidas en el estudio se clasifican de acuerdo con Ja enfermedad y con la exposicién como se muestra en La tabla 5.1. Tabla 5.1 Clasificacién de una poblacién de acuerde con la enfermedad y con la expesicién Eniermedad! a c tne HA) x) Exposicién: b d fue) 2D) ™ no Con la informacién obtenida, al final del periode 7, - t, puede esta- blecerse la relacign: . 86 / Metodolagte de ia investigae!ée.. SHAVEEAA) + F40)] _ aha +) FABVEEAB) + FAD) bb + a) Ja cual permite estimar o riesgo relative como la relacién de dos proporciones de incidencia en individuos expvestas y no expucsios, o sa _ AAA + C} ~ BAB + Dj)" inicameme si fy y fy tienen igual-valor, caso en el cual estas frac- ciones se cancelarfan en el mumerador y en el denominador. No obstante, cualquiera que sean Jas fracciones f, yf) —y con la consideracion de que 4a incidencia de la enfermedad sucle ser relativamen- te pequefia cuando se compsra con la poblacién sana Jo cual implica que en los denominadores se pueden omitir los términos f(A) y j,{B) sin que se altere sensiblemente el valor de la relacién— la expresion amietior se aproxima a: FAM | (a/c) ad jaayegD) °°" Gad)” be relacién conaciva como 1a razén de disparidades RD, 1a cual estima de manera aproximada el valor del riesgo relativo.' Este razonamiento refieja la estrategia implicita en los estudios de casos y controles en los cuales se selecciona, independientemente de la exposicién, una fraccion f, usualmente desconocida, de todos los casos presentados durante el periodo ¢; - 4, y una fracci6n fp, usualmente des- conocida, de todas las personas que se encuentran sanas al terminar este. periodo con Jo cual sé cuenta con un grupo de n, casos y un grupo de ng controles, La clasificacién de los n, casos y de los 2, comtroles asf seleccionados con respecte a una exposicién dicotémica da lugar a ona tabla de 2 x 2 (Véase tabla 5.2). Ba general, in cispordad —en ings, odds en Tn pesertacn de um fenémeso que to nee Goa racy posibes, © sen sf 0 no, xe define coma La relacin entre lz probabiixtad de éxito py i protabiidad de fracaso g. Ast, im dispar de enfermar entre bos expwesins es dads Por qi eiseion favta + c}V/icda + ¢)) = ave y la diyparided de enfermat entre lor no expUesios, Por a Toncion pono + div{and + o)] = bid La razén de dnpardades también oe oosoce can el nombre: de desigualdad refutia. . Estudios de casos y controles +87 Tabla 5.2 Clasificacion de los casos y Jos controles con fespecto a una expo- sicion dicotémica Enfermedad + - + a ¢ m Exposicion - b a mo mt na a Estimacién de la asociacién ‘Una vez seleccionados los 2; casas y los 4g controies se puede estimar la . Taz6n de disparidades con respecto a la exposicin que caracteriza a ambos _ grupos mediante la férraula: iy = (ale Mibln,) _ (alo) _ ad - (cha Adin) {cld) ~ be relaciOn que, segiin se mencioné antes, estima de manera aproxi- mada el valor del riesgo relativo.2 Esta estrategia no suministra por s{ misma estimaciones de Fiesgos absolutos como tasas o proporciones de incidencia en eXpuesios y no ex- Puestos; no obstante, ella provee una estimacion de la Presentaci6n relativa del fendmeno —riesgs relativo de los expuestos con Tespecto a los no ex- Puestos— por medio de In razén de disparidades. Para obrener un intervalo de J00(7 - 0)% de confianza para ta razén de disparidades —y por tanto de manera aproximada para cl riesgo relati- vo— se puede utilizar la expresién propuesta por Miettinen (Miettinen, 1976) que permite obtener los limites del intervalo de manera aproximada, Tos cuales son satisfactorios en la mayoria de las situaciones: Rp ade) ‘2 Nétene que Ja mada de disparidades con reapocio a la ‘cxposiciéa (a/c¢bré) es igual a 1a ‘observada con respects a la enfermedad (a/bfe/d}; en ambos casos cl resultado es aff 88/Meradalogta de te inversigaciée.. expresién en la que RD corresponde a ia estimacion puntual de la raz6n de disparidades obtenida en ¢l estudio, Z)qy2 al percentil T-ov2 de la distibucin normal estindar y y? al valor de la variable aleatoria chi cua- drado obtenido a partir de los resultados observados, la cual se utiliza con frecuencia para realizar una prueba de significacién estadistica. Por ejemplo, si se supone que en un estudio sobre la asociacién entre ia obesidad y el infarto del miocardio se encuentra que 32 de los 80 casos y 20 de los 80 controles scleccionados han estado expuestos, 1a informa- ci6n obtenida se presenta en una tabla de 2x 2 (Véase tabla 5,3). Tabla 5.3 Resultados de un estudio de casos y controles sobre la obesidad como factor de riesgo’ para el infarto del miacardio infarto del miocardio + - + 32 20 Obesidad - 48 6 80 30 Con esta informacién se puede estimar la asociacién existente entre Ja obesidad y el infarto del miocardio en términos del riesgo relativo por medio de ia raz6n de disparidades: : “ eS ad 32x 60 RR~ RD = To Bx 00 = 200 Con e! fin de calcular un intervalo de} 90% de confianza para la raz6n de disparidades s¢ obtiene primero el valor de a variable chi cua- drado por medio de Ja siguiente expresion: 2» {ad = beP (n= 1) ei My My My My Eetudion de bases y comroles | 89 = G2 x 60 - 48x 207 (160-1), BOX 80 x 52 x 108 = 408 y nego se calculan los limites del intervalo: Rp 102! ¥y oftthort 4,08) = =444; 351 Con base en estos resultados se afirma con un 90% de confianza que el riesgo relative que caracteriza la asociscion existente entre ta obestdad Y el infarto del miocardio en Ja poblacién se encuentra aproximadamente entre 1,14 y 3,51. Adomés, a partir det valor obtenido en la variable chi suadrado de 4,08 se puede afirmar el hallazgo de una asociacién —con un nivel de significacién del 5%, prucba de una cola— entre la obesidad y el infarto del miocardia puesto que P < 0,05. Una estimacién de la misma asociacién por medio de la proporcidn dei riesgo atribuible en expuesios* se calcula de manera aproximada por medio de Ja expresién: PRAE = FR-1_ RD: 1 RR RD 2,00 - 7 = = 0, 209 7 250 De modo similar, se puede estimar la asociacién en t&rminos de la pro- Poreién del riesgo-caribulble poblacional por medio de 1a siguiente expresiGn: prap 2 —2ARR-1) pnt) BARR-1)+1 (RD 147 (20/80)(2,00 - 1) * eomoy2.00 - 4 7 = 97° 3 Voge 1 cupinilo 2, La mediviin en epidemiotogia 90 [Atetodologia de ia tavertigaciéa... en Ja cual pz es la proporcién de expuesios ea la poblacién y que en un estudio de casos y controles se estima por la proporcién de expuestos observada en el gropo de controles, la cual refleja aproximadamente la ex- posicién propia de toda la poblacién puesto que esté compuesta, en su gran mayorfa, por personas sanas (Breslow, 1980; Schiesselman, 1982). Seleccién de los casos y de los controles Como principio general es importante considerar que Ins muestras de casos y de conttoles deben ser representativas de la exposici6n de las personas enfermas y de las sanas de la poblacién definida por el interés del estudio, de acuerdo con ef esquema descrité anteriormente. La violacién de este ptincipio introduce sesgos de geleccién en la informacin obtenida que afectan la validez de las conchusiones del estudio; por ejemplo, si cl diag- néstico de la enfermedad ha sido favorecido por e} conocimiento previo de la expesiciOn se introduce un Seago que tiende a sobrestimar el valor de la asociacidn estudiada, e] cual se conoce como sesgo de deteccidn y se pre- senta, por ejemplo, cuando se hace una supervision médica muy estricta de las personas expuestas por los posibles efectos secundarios relacionados con la exposicién o por el conncimiento previo de Ia existencia de la aso- ciacién por quienes realizan et diagnéstica. A este respecto, vale 1s pena citar la polémica suscitada por estudios que han informado 1a existencia de una fuerte asociaciGn positiva entre la utilizacién de estrégenos después de Ja menopausia y 1a incidencia de cin- cer de codometrio (Smith y colaboradores, 1975; Ziel y Finkle, 1975; An- tunes y colaboradores, 1979). Algunos epidemidlogos han cuestionado tales resultados:con el argumento de que el sangrido que se presenta en algunas Thujeres expuestas a los estrégenos induce a una mayor supervision médica que, a su vez, favorece el diagnéstico del CAncer en las expuestas frente a Jas no expuestas, por lo cual sc cxagera Ja asociacién observada (Horwitz y Feinstein, 1978). Para controlar la posibilidad de este sesgo se tecomien- da seleccionar tanto los casos como los controles del grupo de pacientes que han sido sometidas a cilatacién, curetaje o histerectomic. De manera similar, cuando para evaluar el efecto de la exposicién a Jos rayos X sobre la incidencia de c4ncer se selecciona un grupo dc casos que se diagnostiean en Ja poblacién de afiliados a um sistema de seguridad social y un grupo de controles elegidas entre la poblacién general, sc pucde introducir un sesgo que tiende a sobrestimar la asociacidn por cuanto los Extudios de casos yconsrates/ OE casos, mis expuestos a los rayos X como consecuencia de una mayor su- pervisi6n médica, tienen una mayor probabilidad de ser diagnosticados. Si el investigador anticipa un sesgo de este tipo puede controlarlo al seleccio- nar los controles entre la misma pobiacién de. afiliades. Por ta facilidad de identificacién y obtencién de la informacién, los casos se suelen seleccionar en istituciones de atencién médica, casos hos- pitalarios, y rara vez se seleccionan entre toda la poblaci6n, casas pobla- cionales, como puede hacerse si se cuenta con un registro poblacional de. la incidencia de 1a enfermedad. Los controles, a su vez, se seleccionan con frecuencia entre los pacientes que consulian en las mismas istituciones, controles hospitalarios, y sdio algunas veces entre toda Ja poblacién de sujetos sanos, controles poblacionales. En ocasiones, la seleccién de estos iilumos se hace mediante la eleccién de personas residentes en el mismo barrio con et fin de igualar la informacién de los casos y de los controles Por factores tales como el estado socioecondmico. También, es comun'la estrategia de comparar el grupo de casos con dos o mis series de controles seleccionadas de manera diferente, por ejemplo, una serie de controles hos- pitalarios y otra de controles poblacionales. La obtencién de diferentes re- saltados en la asociacién observada con uas y otra serie puede suministrar claves. importantes para la deteccidn de posibles sesgos y para ia identifi- caci6n de factores relacionados con Ja incidencia de la enfermedad. Si existen patrones de referencia de pacientes a las istituciones de atencién médica que impliquen que los casos hospitalarios diagnosticadas en determinada istitucidn no representen la exposicién de la poblacién de casos, los resultados asi obtenidos estarin afectados por un sesgo de selec- cin conocido como sesgo de referencia. Por ejemplo, es posible que en uun estudio sobre Ja enfermedad eclusiva periférica se seleccionen tos casos entre el conjunto de paciéntes que acuden a una clinica altamente especia- lizada y que sélo admite a determinados pacientes que han sido cxpuestos de una manera particular, no representativa, al factor estudiade. De manera similar, es posible que los centros de atencién médica s6lo acudan los pa- cientes mis graves como sucle suceder en los paises menos desarollados, caso en el cual la seleccién de controles hospitatarios puede introducir ses- gos de seleccién, Cuando se seleccionan controles hospitalarios se debe tener especial cuidado en hacerlo entre pacientes cuya enfermedad no esté ssocinda con In exposicién que se estudia; as(, si para esmadiar la asociacién existente entre el infarto del miocardio y el consumo de cigarrillos se eligen los 92 sMeredologta de la investigacién... controles entre aquellos pacientes que sufren oclusin periférica vascular, la asociacién observada en el estudio tiende a ser menor que la que real- mente existe debido a la asociacién que se presenta entre Ia oclusi6n vas- cular y el consumo de cigamillos. Con el fin de evitar los sesgos de seleccién se recomienda excluir como posibles controles a aquellos pacien- tes que presentan enfermedades cuya asociacién con el factor estudiado se sospecha o se conoce y, ademés, ampliar la diversidad diagnéstica al elegir a Jos controles hospitalarios. . Con respecto a la seleccién de los casos y de tos controles en el tiempo se debe distinguir entre aquellos estudios realizados con casos in- cidentes y con casos prevalentes, Los primeros son los diagnosticados des- de e} momento de iniciacién del estudio con controles elegidos a medida que esto ocurre, los segundos son los que se diagnostican con anterioridad a la investigacién y los cuales pueden gencrar sesgos de scleccién cuando no son representativos de la exposici6n analizada debido a factores selec- tivos, como la muerte de los casos que han sufrido una mayor. exposicién, Por ejemplo, si se realiza un estudio de casos y-controles con el fin de estimar 1a asociacién existente entre el uso de cierto medicamento durante el primer tiimestre del embarazo y la incidencia de anomalias congénitas y se seleccionan los casos a partir de las anomlfas diagnosticadas en ¢l momento de] parto es posible que, al existir la asociacidn, algunos casos expuestos hallan terminado en abortos los cuales finalmente no forman par- te-del estudio; si estos se hubieran ineluido como casos la asociacién de- tectada habrfa sido atin mas fuerte que la observada. Cuando se seleccionan casos incidentes se debe considerar que la informacién obtenida con respecto a Ja exposicién previa sucle ser més fidedigna que la de Jos casos cuyo diagnéstico se ha producido en una fecha anterior, con lo cual se demuestra la veataja de aquellos para dismi- nuir los sesgos de memoria. Ventajas y limitaciones La estrategia de los estudios de casos y controles tiene algunas ventajas importantes con respecto a los de seguimicnto: La primera de ellas es su aplicacién més répida pueste que, en prin- cipio,'ne hay que esperer a que Ja enfermedad se manifieste después de periodos de exposici6n que pueden ser més 0 menos prolongados porque en estos estudics Jos casos gon personas que o bien ya han presentado la Extadios de casos ycontrotes /93 enfermedad de interés 0 ésta se diagnostica en periados cortos de: tiempo ¥ en Jos cuales se determina la exposicién al factor de riesgo en forma fetrospectiva. La segunda, es que e] estudio de una determinada asnciacién exige un nimero relativamente menor de Participantes, o sea requiere-un menor tamaiio mucstral. Un estudio de cohorte propuesto para evaluar una asocia- cion entre una exposicién y la incidencia de determinada enfermedad con una presentaci6n relativamente infrecuente, categoria a la cual pertenecen la mayorfa de las enfermedades crénicas, exige el seguimiento de numero 0s sujetos con el fin de detectar durante el periodo de observacién la in- sidencia de wn néimero suficiente de casos que permita estimar adecuadamente la asociacién de interés; en estas situaciones los estudios de casos y controles son especialmente ‘ventajosos para el estudio de enferme- dudes de baja frecuencia. La tercera se refiere a la considerable economia de reeursos, determi- nada por Jas dos ventajas anteriores, Porque estos estudios tienen una:menor duracién y uo menor mimero de participantes con el consecuente ahorro de tiempo, eximenes cifnicos y recursos administrativos, entre otros, Por ditimo, los estudios de casos ¥ controles permiten analizar gi- muliéneamente el efecto de varios factores, a diferencia de los de segui- miento que s6lo permiten estudiar el efecto de una determinada exposicién. A este respecto cabe sefialar la importancia de los estudios exploratorios. en los cuales se estudia la asociacién de miiltiples factores con una deter- minada enfermedad, Aunque la relativa simplicidad de le estrategia de Jos estudios de cess y controles hace de ellos un eficiente método de investigaci6n, estos tienen a su vez limitacidnes que se deben considerar en todo momento algunas de las cuales s¢ mencionan a continuacién, La medicién correcta de la exposicién se hace dificil cuando de- pende de la memoria de los participantes en el estudia; por tal razon, 12 exposicién informada por un participante sobre el consiime de tabaco o determinado tipo de alimentos en Periodos remotos puede ser poco con- fiable. En general, el control de los errores sisteméticos o Sesgos cs mas dificil en un estudia de casos y controles que en un estudio de seguimiento. En particular, se dificulta ef contral de los. sesgos de seleccién que pueden originarse durante la elecciéa de los casos y de los controles; ademis es dificil garantizar la calidad de 1a informacién telacionada con posibles va- 94 / Metadologta de ka tsveatigacié... riables de confusién que han caracterizado el fenémeno en el pasado, lo cual hace dificil el control de estos seagos. El conocimiente de los’ participantes con respecto a la presencia o au- sencia de Ia enfermedad puede originar sesgos en Ja informacién con respecto a la exposicién: un caso con infarto del miocerdio bien puede exagerar su exposicién a Ja dieta rica en gratas como resultado de un mecanismo culpe- Dilizamte, en tanto que un control pucde informar una exposicién menor que Ja que realmente ha tenido debido a un mecanismo opuesto. Un estudio de casos y controles sdlo permite analizar asociaciones relacionadas con wna determinada enfermedad, a diferencia de los eswdics de seguimiento que permiten estdiar la asociacin de la exposicién de interés con Ja presencia de miiliples enfermedades. Los estudios de casos y controles usualmente no son recomendables para analizar asociaciones de enfermedades con exposiciones que se pre- sentan raramente porque la informaci6n reunida es ineficiente; no obstante, el estudio es itil si 1s exposicin es infrecuente pero es responsable de una fraccién apreciable de la incidencia, como sucede con la exposicién in ure- ro a dietilestilbestrol y le incidencia de céncer vaginal. ‘Ademés estos estudios no aportan informacién con respecto a los riesgos absolutos, esto es sobre tasas © proporciones de incidencia, a dife- rencia de los estadios de seguimiento. Aunque no es una desventaja de estos estudios per se es importante sefialar que la aparente simplicidad de su estrategia junto con la relativa Tapidez de su ejecucién son un atractive que tae como consecuencia la rea- Yizacién de numerosos estudios de este tipo por personas que no comprenden adecuadamente la estrategin y cuya calidad cientifica es cuestionabie. Referencias bibliograficas 1, Antunes CM, Stolley PD, Rosenstein NE et al. Endometrial cancer and esirogen use, ‘Report of a large case-control study. New England Journal of Medicine. 1979; 900- 913. iS 2. Breslow NE, Day NE. Statistical Methods in Cancer Research. Vol L: The Analysis of ‘Case-Control Study, Lyon, International Agency for Research on Cancer, 1980. 3. Cole P. The evolving case-control study. Journal of Chronic Diseases. 1979; (32): 15-21. 4, Comficld J. A method of estimating comparative rates from clinical data. Application t0 cancer of the Tung, breaat and cervix. Journal of the National Cancer Institute. 1951; (1: 1269-1275. 5. Dom HF. Some applications of biometry in the collection and evaluation of medical dara, Joumal of Chronic Diseases. 1955; (1): 638-669. a Exudios de cosas y controtes/ 9S 6. Dorn HF. Some problems arising in prospective und retrospoctive studies of the etiology of diseate. New England Journal of Medicine. 1959; (261, 571-379. 7, Horwitz RI, Feinstein AR. Allemative analytic methods for case-control studies of estrogens and endometrial cancer. New England Joumaal of Medicine. 1978; (299): 1089-1094, 8. Mantel N, Hasaszel W. Statistical aspects af data from retrospective studies of disease, Journal of the Nasional Cancer institute, 1959; (22): 719-748. 9. Micitinen OS. Estimability and estiraation in cese-referent studies. American Journal of Epidemiology. 1976: (103): 226-235. 40, Schlesselman 13, Case-Control Studies. New York, Oxford University Press, 1982. 11. Smith DC, Prentice R et al. Association of exogenous estrogen and endometrial car cinoma, New England Joumal of Medicine. 1975; (293); (164-1167. 12. Ziel HIK, Finkle WD, Increased risk of endometrial carcinoma among users of conjugated estrogens. New England Journal of Medicine, 1973; (293): 1167-1170, 6 Fuentes de error en la investigacién epidemiolégica En este capitulo se inencionan Ins fuentes principstes de los errores ue afectan los resultados de la investigacién epidemiciégica: los erro- res alealorios y los sesgos, se muestran formas que permifen expresar ot efecto de la variabilidad aleatoria para diferentes estudio — pruebas Ge significacién ¢ intervalos de confianza— y se define ct sesgo, se inditan alguna: freates potenciales de este tipo de error y, por altimo, se enuncian las altenativas exiscentes para su control, L. correcta estimacidn de las medidas de interés en todo estudio de ca- técter cientffico es, sin duda, una condicién esencial de Ja labor investiga- tiva, Por este motivo, el conocimiento de las principales fuentes de error de los estudios epidemiolégicos es un requisite fundamental para el inves- 98 / Metodologin de la investigacién.. tigador que se desempefia en esta dea, ya que e0 Ja medida en que éste conozca con anticipscién los errores que pueden presentarse en un deter- minado estudio estaré en capacidad de controlar su efecto y de garantizar Ja calidad de sus resultados. [Los exrores que se pueden presenter ext 1a investigaciGn epidemiolé- giea se clasifican en dos grupos de acuerdo con su origen (Kleinbaum y colaboradores, 1982): 1. Aguellos que se originan en la variabilidad aleatoria fluctuante y capri- choca propia de los rexultados obtenidos en muestras elegidas al azar. os cuales afectan la precisién de los resultados. 2. Aquellos que se producen de manera sistemdtica, en el mismo sentido y con la misma magnitud y que no se deben ala variabilidad aleatoria; éstos afectan 1a validez de los resultados. En los pérrafos siguientes se precisa la naturaleza de estos errores y se indica la manera general de tratar los problemas que ellos presentan al investigador. Error aleatorio La variabilidad que presentan los resultados obtenidos en mruestras to- madas aleatoriamente es la expresién del comportamiento impredecible y caprichoso de] azar. Los resultados de wna investigaci6n son mds o menos precisos de acuerdo con la mayor o menor variabilidad aleatoria que presenten, la cual est4 condicionada fundamemalmente por dos fac- tores: 1. El tamafio mueswal: las muestras numcrosas producen resultados bastan- te precisos porque el error estindar de ta disiribuciOn de estimaciones mwuestrales, ¢l cual mide la dispersién de tales estimaciones, es inversamen- te proporcional al tamafio mucstral. 2, La variabilidad de las variables observadas: el error estandar de la dis- wibuci6n de resultados muestrales es directamente proporcional a dicha va- riabilidad, la cus} se mide por medio de Ja varianza? 1 El error ealdndar de | dittebuciée de ettimaciones miuestrales de los promedion o de las ‘dc una cieria variable ¥ cuando éajaa se extiman con base en ravedtvas reladvamente Frundes en igual 2 oA, an donde 0 es ledesvincién estindar de X y n es of tao mucual. 2 Ene principio cmplemente afirmma que ta dlspertiOn dt los cesultades sxuestrales os mayor ‘esdida que la variable que $e mide presenta und mayor variacién. Faemtes de error en ig investizacidn_ }99 La participacién eventual del azar en los resultados que se obtienen a partir de muestras aleatorias se expresa cunntitativamente por medio de has pruebas de significacién estadisica y de los intervalos de confianza, Aunque no ¢s pertinent presentar detalladamente en esta obra lo relacio, nado con tales procedimientos estadfsticos (Véase, Por ejemplo, Daniel, 1983), sf ¢s importante dirigir la atenci6n hacia algonos aspectos que tienen un interés particular para quien realiza una investigaciGa en epidemiologia. Pruebas de significacién estedistica Tencia, por ejemplo, entre Ia incidencia de expuestos y no expuestos a un factor de riesgo, y que la obtenciGn de esta diferencia entre los grupos comparados puede, en principio, ser el resultado del simple azar —por la contingencia de éste y no como la expresién de una diferencia real exis- tente entre los grupos comparados. Si se conoce la frecuencia con que se presentan por simple azar los revaltados posibles en.una determinada situaciOn se tiene una idea precisa acerca de si el resultado observado en el estudio, por ejemplo una diferencia Sotre Jos grapos comparadas, con alta probabilided es producto del azar o si Por el contrario, se est en presencia de un Fesultado que con muy baja pro- babilided puede ser atribuido a éste, Jo cual confimma la existencia de una diferencia enue los grupos comparados sospechada de antemano, Por este mo- vo itteresa conocer ta probabilidad con la cual Se presenta por simple azar un resultado como el vbservado en el estudio o uno aim ms extremo; esta Probabilidad sc presenta en Ja literatura cieatifica como el valor de P. Si la probabilidad de que el resultado observado o uno mds extremo se obtenga por simple azar es considerable, 0 sea sie) valor de P es alto, Se debe aceptar que la diferencia observads pudo ser producto del azar, caso en ef cual no se confirma la existencia de ésta entre los grupos com- Parados; en esta situacién el investigador debe informar Ia obtenci6n de resultados que no son estad{sticamente significativos. Por el contrario, si ia Probabilidad de que ei resultado observado uno més extremo se obicnga por simple azar es muy pequefla, esto es si el valor de P es bajo, se puede ponsar que la diferencia de interés entre gmipos Comparados existe real- 100 sMetodologta de le investigecion. mente, caso en ei cual el investigador esté en presencia de resultados que son estadisticamente significativos. El razonamiento anterior implica ta Sjacion de'un limite por fuera del cual se considera la presentaci6n de cierto resultado come improbable; con esta intencién el investigador, de acnerdo con su etiterio de exigencia, fija entonces lo que se denomina como ¢l nivel de significacion estad{stica de Ia prueba que va a realizar, el cual se denota por Ja leta priega a y no suele exoeder cl 10%. Por ejeraplo, si para verificar la hipétesis de que Jn exposici6n a un determinado factor esté agociada cori la incidencia de una enfermedad cl investigador fija como criteria de decisién para realizar ka prue- ba de significacién un nivel o igual 0,05, la obtercién de cualquier diferen- cia en Ja incidencia emre expuesios y no expuestos cuyo valor de P sea menor de 0,05 sugiere la existencia de ln asociacién estudiadla; en este caso ef inves tigador informari la cbtencién de resultados estadfaticarmente significativos. El conocimiento de la probabilidad P de que .se presente por azar un determinado resultado 0 uno és exmemo se obtiene al consultar la distribu- cién de probabilidades que comesponde a Ya situaciGn analizada. Ast, sl se comparn las proporciones de incidencia de una enfermedad observada en grupos nimerosos con exposiciGn diferente awn factor de riesgo, dicha pro- babilidad se conoce a} consulter la distribucién normal; no obstante si tal com- paracién se hace entre los promedios observades en una variable continua =por ejemplo nivel de glucemis— entre grupos de moderado tamaite, tl probabilidad se conoce al consular la distribucién de probabilidades conocida como ¢ de Student. Por ihimo, la comparaci6n de las frecuencias observadas con aquellas que se esperan por azar en ausencia de asociacién, en grupos telativamente grandes, se tealiza por medio de Ja distribucion de chi cuadrado, Par. ejemplo, sup6ngase que un investigador desea probar Ja hipote- sis de que un cierto medicamento ofrecido como terapia para e} sida es mejor que otro ya conocido que s6lo ‘produce una mejorfa en una propor- ciGn reducida de Jos pacientes; para tal propésito fija un nivel de signifi- cacién o de) 5% y distribuye aleatoriamente tos participantes cn Jos dos grupos comparados. Al mimr los resultados observa que, efectivamente, la mayor proporcién de pacientes que han mejorado corresponde al grupo tra- tado con el nuevo medicamento; sin embargo piensa que la diferencia ob- tenida puede ser fruto del azer y, para salir de esta duda, realiza una procba de significacién estadistica, Al consultar la distribucién’ de probabilidades correspondiente advierte que la presentacién por simple azar de une dife- rencia igual o mayor que la observada s6lo se presenta ‘con una probabili- ++ Bnantes de error en ia investigacion.../10L dad igual al 2%, esto es P = 0,02. Ante este hallazgo el investigador in- forma Ja obtencién de resultados estadfsticamente significativos P < 0,05 ¥ concluye a favor de la aueva tcrapia. Con Jo dicho anteriormente se Plantea que la verificacién de una hipstesis por medio de una prueba de significacién estadfstica se apoya sobre el conocimiento de lo que suele suceder por azar y, por tanto, la Conclusién a que de este modo se llegn no es infalible. Por ejemplo, ante la presencia de un resultado estad{sticamente significative el investigador se inclina a favor de la hipétesis que pretende confirmar porque el resulta- do cbservado no suele ocurrir por azar; no obstante el resultado puede ha- ber ocurrido por simple azar —eventualidad que ocutre rara vez pero no hay manera de descartarla totalmente— situacién en la cual ta conclusi6n indicada por la prueba de significacién es equivocada. De estas consideraciones se deduce que el resultado de wna prueba de significacién ha de tomarse como criteria ortentador en et proceso de prueba de hipdtesis que se realiza con base en Ja informacion obtenida en muestras aleatorias; ademas debe considerarse que Jos resultados de-estas Pruebas cstén condicionados por ef tamaiia muestral de los grupos compa- rados, Por lo anterior, no es dificil advertir que cualquier diferencia, por minima que sea, se puede mosirar f4cilmente como significativa si se in- crementa ¢l tamafio muestral; pero un resultado significativo en estas con- diciones s6lo indica Ja’ existencia de una diferencia que no tiene importancia desde una mirada clinica, cientifica 0 estratégica. . Quizds mas importante atin es la considerncién relacionada con la insuficiencia de la mueswa utilizada Pata demosirar como significativa una cierta diferencia existente. En estas situaciones frecuentes cuando se tra~ ta de economizar recursos escasos— los resultados obtenidos en la prueba de significacién tienden a producir diferencias que no son estadisticamente significativas debido al reducido tamaiio muestral; en este caso se habrin desperdiciado los escasos recursos existentes y 8¢ habré negado equivoca- damente la existencia de una asociacién, A pesar de la préctica difundida en 1a literatura cientifica de mostrar Ja posible participacion del azar en los resultados de investigaciones reali- 2adas con muestras aleatorias por medio de! valor de P, se ha hecho notar que _un resultado referido uinicamente en términos de éste no muestra el rango de variacién o precision de la medida que se estima, el cual se ori gina en Ja variabilidad propia de las estimaciones que se obtienen por azar; Por este motivo €s convenient acompafiar' las medidas que se obticnen 102 /Mesodologia de la ivestigocién. mediante procesos de seleccién aleatarios © estimaciones con los intervalos de confianza correspondientes (Rothman, 1986). Intervalos de confionza ‘Una aticrnativa para la expresiOn de Jos resultados obtenidos en mauestras alea- torias consiste oa presontar las estimaciones obtenidas —na proporcién de prevelencia, una proporcién de incidencia o una medida de asociaciGn— en términos de un intervalo de J00(1 - 003% de confianza, con ua amplind que refleja la precisiOn de la esimaciin tograda. La divulgnci6n de resultados por medio de estos intervalos se suele hacer, de manera aproximada, mediante cl supuesio de que las estimaciones mucctrales obtenidas a partir de mucstras grandes se comportan como una distribucién normal. En una encuesta de prevalencia realizada con una muestra aleatoria de x sujetos en Je cual se obtiene una estimacién puntual p de la propor- cin de prevalencia de interés 7, I variabilidad propia de los resultados obtenidos se expresa en un intervalo de 1007 - &)% de confianza con uncs Lmites que se obtienen mediante la expresiOn: BEZ 55, en Ja que Zin denota el valor que toma la variable normal es- tindar Z en el percentil } - 2 y 6 al valor del exror estfindar de la distribuci6n de las estimaciones muestrales de 1, valor que se estima como V{p(] - pn}. Asf, si en una encuesta de prevalencia sobre desnutrici6n realizada en cierta poblaciGn con una muestra aleatoria de 300 personas sc obtiene una estimacién puntusl de le proporcién de personas desnutridas p = 0,14, se puede afirmar con un 95% de confianza que la previlencia de desnotri- cién en tal poblacién 2 se encuentra entre el 10 y el 18%, limites que se obtienen al reemplazar en la expresién anterior: BA Zpap 6 = O14 + 190,14 10,8630] De modo similar, si en un estudio relizado para estimar la asociacién entre Ja exposicién al polvo de algodén y 1a bisinosis se encuentra un intervalo de 95% de confianza con unos Iimites de 1,5 y 3,2 parn ol riesgo relativo, st afirmar con tal confianza que este tltimo no os inferior a 1,5 ni superior 8 3,2, informacién més completa que la que pudiera suministrar e] simple valor de P obtenido en lz prueba de significacién correspondiente. Fuentes de erroren la investigaci¢n.../ 103 Cuando se pretende expresar la asuciacién buscada por medio de la estimacién de una diferencia de proporciones, ei intervalo de 100(1 - 2)% de conftanza para la diferencia buscada 1; - Mp toma Ja forma usual: Et Zap = (b, - Pot ZyanNipat ln, + Wn) en donde , y 2g son las estimaciones obtenidas de las proporciones de interés en los dos grupos de comparacién, Zi. €8 el valor que toma Ja variable normal estindar Zen el percentil / - a/2, ny y My son los tama- fos muestrales de los grupos comparados, p = {nzb, + myigin, + no yd =1-p Cuando se pretends estimar la asociacién de interés por medio de una 1az6n R —riesgo relativo o razén de disparidades— se puede conside- rar como altemnativa ala expresién ya citada en los dos capftulos preceden- tes —que permite caleular de una manera aproximada un intervalo de confianza para R con base en la prueba de significacién— que la variable X que se distribuye normalmente es su fogaritmo, de tal modo que sé puede obtener un intervalo de 200(2 - 0)% de confianza para In R mediante ta expresién (Rothman, 1986): XZ. = in R4Z,,, Warlin R) en donde X comesponde a la estimacién lograda en el estudio y Ia varianza estimada de su logaritmo adopta wna forma de acuerdo con cl tipo. de estudio-asi: 1. Estudios de seguimiento com base en tasis de incidencia: “Ed @ 6b Var(tn: R) en donde @ y & son les casos observados en los Brupos de expuestos y de no expuestos, respectivamente, 2. Estudios de seguimiento con base en Proporciones acumuladas: a ~ ¢ Var{in R} = —— + —_ ‘ar(In RY am, * in, en donde a y > corresponden al niimero de casos observades en los grupos de n, expuestos y de ny no expuestos, respectivamente, y cy d 104 1Matodologia de ta wvemtigacion.. al niimero de personas sanas observado-en cada uno de los grupos compa- rados. 3, Estudios de casos y controles o esiudios con base en datos de preva- Tencia: s i i id Varia R)= + tt G en donde a y ¢ corresponden al mimero de expuestos observados en os grupos de sanos y de enfermos y b y da sus respectives complementos. na vez se ban caiculado los Iimites del intervalo de confianza para el Jogaritmo natural de 1a raz6n R es posible encontrar Jos limites para Ja * yaz6n de interés al calcular los correspondicates antilogaritmos. Por ejemplo, en tn estudio realizado en Ia ciudad de Medellin sobre factores relacionados con el consumo de cigarrillos en escolares adolescen- tes (Londaiia, 1992) se encontraron los siguientes resultados con relacién a} consumo del adolesconte y al consumo en el grupo preferido de amigos (Wéase tabla 6.1). Tabla 6.1 Consumo de cigarrillos en escolares adolescentes y en el grupo de amigas, Medellin 1992 Grupo de amigos Total + - + 58 90 148 Consumo - 44 295 339 Total 102 385 487 Fuente: Londofo JL. Factores relacionadas con el consumo de cigarrllos en escolares adolescentes de la ciudad de Medellin. Boletin de tx Oficina Sanitarls Paname- rieana, 1982; (1125: 131-137, eentes de error en taimvessigacién:./ 105 ip = od _ (58.2 295) MO daaway 702 Un intervalo aproximado del 95% de confianza para el logaritmo de Ja raz6n de disparidades se obtiene asi: bn RD £ Ziq VWartin RD) = In RD + Zag7s Ni( a) + (Ib) + (He) + (1A)] = In 4,32 £ 1,96 NII58) + (Idd) + (IMO) + (17295)]} = 401; 1,92 resultado que permite obtener los limites del intervalo para la razén de disparidades al calcular sus corespondientes antilogaritmos: 2,75 y 6,82. Sesgos A diferencia de los ‘exrores que se introducen en los resultados de Ja investigacién debido ai comportamiento fluctuante det azar ¥ que afec- tan la precision de Jos mismos existen Otros que, de manera sistemdtica, Se producen con la misma Magnitud y en el mismo sentido y afectan la validez de los resultados, Jos cuales reciben cl nombre de sesgos. Aun- que se han identificado numerosos tipos (Sackett. 1979), se clasifican de modo general en tres grandes Srupos de acuerdo con su origen (Klein- baum y colaboradores, 1982); los Sesgos de informacién, los de selec- cién y Tos de confusién, Sesgos de informacién Los sesgos de informacién se originan en las mediciones o datos indivi- duales cuando tienden a informar sistematicamente valores erréneos de las Por ejemplo, si en un estudio de Seguimiento realizado para evaluar cl-efecto preventive de la aspirina en la aparicién del infarte de miocardio Se ignoran varios episodios de la enfermedad ocurridos en el grupo expues- to, como infartos eves, Pero se incluyen todos los episcdios Presentadas en el grupo no expuesto, la medida de asociaci6n obtenida tendri un valor mayor que el de la realmente existente debido a un sesgo de informacién: el error asf introducido tiende a invalidar Jas conclusiones del estudio. En este caso se incurre en un Seago diferencia! puesto que él error se ha co metido en In medicién del efecto que ocurre en uno de los grupos compa- aoe Fuanes de ervor en ta investigacion../ 107 una disminucién en Ia estimacién de la medida de la asociacién; si a Pesar de esto la asociacién hallada es significativa, la existencia de un Sesgo de tal naturaleza no invalida la conclusién del estudio. No obstan- ‘© puede ser que Ia disminucién introducida por el sesgo en la medida de esociacién hallada sea tan apreciable que obliguc a negar equivocada- mente la existencia de ésta (Barron, 1977; Copeland ¥ colaboradores, 1977). : Sesgos de seleccién Los sesgos de seleccién ocurren como consccucacia de procedimientos de seleceién de los participantes que generan muestras no representativas de las poblaciones estdiadas, de tal forma que las estimaciones asi obtenidas difieren de aquéllas que el investigador pretende obtener, Por ejemplo, es posible que cn un estudio sobre la dicta como factor coadyuvante en cl en los resultados obtenides fi . : Los sesgos de sclecci6n se presentan siempre que una variable co- rrclacionada con el efecto estudiado afecta la inclusién o exclusién de Jos Palticipantes en algino de Jos Smpos comparados; por ejemplo, varios es- tudios relacionados con la Ocupacién como factor de exposicién han incu- ido en sesgos de seleccién debido a que los grupos comparados han sido conformados por trabajadores activos, © sea, personas que s6lo son admi- tidas a ta empresa si tienen buenas condiciones de salud, caso en ef cual él fenémeno de seleccién ha ‘operado con anterioridad a la iniciacién del estudio. . : En {os estudios de casos y controles, la seleccién de casos haspita- Terios puede originar scsgos de seleccién debido a las Précticas diagnésti- cas o de acmisién de pacientes Propiss de Ja istitucién. Varios de ellos Tealizados con el fin de establecer In asociaciGn existente entre Ja adminis- tracién de estrégenos durante la posmenopausia y la incidencia de ofincer de endometrio han‘sido cuestionados con el argumento de que Ja identifi- cacién de los casos, pacientes hospitalizados, fia sido hecha a partir de un examen ordenado por un sangrado intensivo, causa de la hospitatizacion. Debido al sangrade que en ocasiones 8 presenta como efecto del consumo de estrégenos, una mayor proporcidn de Ios casos asf detectados, pacicntes con cancer de endometrio, results estar expuesta a ja hormona cuando se compara con Ta proporcidn de controles a quienes, por no haber sangrado Fasntes de ervor en ta invextigacitn...¢ 109 Asocacén xX Ty de interés Exposiciin Enfermedad 7 Variable de confusion Figura 6.1“ Representacion esquemiatica de la situacién en la que se produce un’'sesgo potencial de confusién , Esta condicién permite descartar como factores de confusién a aquellas variables Z gue son un eslabén intermedio en la secuencia causal ¥ + Z ~ Y. La arterioesclerosis, relacionada causalmente con Ja hipertensién y con Ia enfermedad coronaria, no debe considerarse co- mo una potencial variable de confusién cuando se estudia la asociacién existente entre la hipertensién X ¥ la enfermedad coronaria ¥, En cam- bio, en el estudio de-la misma asociacién, Ja obesidad si debe conside- Tarse como una. potencial variable. de confusién puesto que esid telacionada independientemente con ja hipertensién y con la enfermedad coronaria. De fo dicho anteriormente se eoncluye que el contral de la confu- Sién que una variable Z asociada con Ja exposicidn X puede introducir en la estimacién de una medida de asociacién cute X y Y se logra me- diante el aislamiento de tos efectos que la exposicién X tiene sobre ¥ y sobre Z. 2 La identificacién de una variable como potencial de confusién la ha- Ge cl investigador de acuerdo con el conocimiento que tenga de su com. Portamiento; en ocasiones, el javestigador séle alcanza a sOspechar que una variable puede introducir un Sesgo de confusién en sus resultados y debe snionces controlarla, En cualquier caso, la apreciacién del efecto de con- fusién que ejerce una variable se logra al comparar fa medida de asociacién que se obtiene cuando se controla si efecto con A medida encontrada cuando no se controla, esto es, la comparacién de la medida ajustada con la medida bruta; Ia magnitud de esta diferencia Tefleja el sesgo que intro- duce la variable de confusién si su efecto no se controla. ‘Fuenses de error en ta investigacién.:'7 E11 7. Lande IL. Factores relsaionsdes con ¢] consumo de cigarillos en escolares actolescentes de la ciudad de Modellfa, Boletia de la Oficina Sanitaria Panamericana, 1992; (112) 131-137, 8. Mictinen OS, Cook EF. Confounding: essence Epidemiology, 1981; (104): 609-620. 9. Rothman KJ. Modern Zpidemiology. Baston, Litue, Brown, and Co., 1986. 10, Sacket DL. Bias in analytic research. Journal of Chromic Diseases. 1979, (32): 51-63. N. Schlerselman II. Asseting effosts of confounding variables, American Journal uf Epidemiology. 1978; (108): 3-8, and detection, American Jounal of 7 Ajuste de tasas En este capftulo se presenta la estrategia utilizada en la investigaciGn epidemiolégica para ajustar indices, usualmenie tasas o proporciones, Son e] fin dé comparar las medidas observadas en varios grupos.en igualdad de condiciones con respecto # variables ajenas al interés det estudio. En particular, se presentan ef métode directo y ef indirecto con sus ventajas y limitaciones, E, muchas ocasionés, el epidemidlogo debe comparar Ios indices que reflejan la mortalidad o la morbilidad de diversas poblaciones; las diferen- Clas que se presentan en tales medidas son, con frecuencia, el Punto de partida para la bésqueda de los factores de riesgo asociados con las distin- tas cnfcrmedades y para la adopcién de medidas preventivas, No obstante, sucede con frecuencia: que las poblaciones comperadas no se encuentran en igualdad de condicioncs con respecto a determinados factores que, aunque 114 Ataodotogia de la investigenci6n— no son de interés en las comparaciones realizadas, estén relacionados con tina mayor o menor morbimortalided; entre cllos estén ta edad y el sexo. Por ejemplo, un epidemidlogo puede estar interesado en comparar Ja incidencia de cAncer géstrico en dos poblaciones que muestran Un consumo notablemente diferente de cierto alimento, con el objeto de co- nocer si éste es un factor de riesgo para Ja enfermedad; sin embargo, dicho investigador advierte que una de las poblaciones sth conformada, en su mayorfa, por personas j6venes en tanto que 1a otra est4 costimida principalmente por personas de edad avanzada. Ante este hecho percibe qué, para su propésito, no serfa adecuado realizar la comparacién sobre Jas tases brutas de incidencia de céncer géstrico, o sea Jas tasas reales de las dos poblaciones, y que tal comparacién debe realizarse con el supuesio de que las dos poblaciones tienen igual estructura etérea, ¢s decir, con base en tasas ajustadzs por edad o sea en igualdad de condi- ciones respecto a esta sltima! En esencia, el problema se resuelve si la morbilidad observada en ambas poblaciones sc refiere una poblacién finica o poblacién estindar de tel modo que Ja estructura ctérea tinica de ella permita calcular la mor- pilidad que se presenta en las poblaciones comparadas. Tradicionaimente, para resolver estas sitmaciones te ‘han propuesto dos estrategias metodolé- gicas conocidas como el método directo y el método indirecto, las cuales se exponen detalladamente 2 continuacién. Método de ajuste directo Quiz4s la manera més practice para cornprender este método sea Ta solu- cién de une situacién concrete como Ja que se muestra en el siguiente ejemplo. ‘Un investigador, en busca de factores de riesgo para el cincer de cuello uterino, desea comparar jas tasas de incidencia de las ciudades de Cali, Colombia y Sio Paulo, Brasil Jas cuales tienen una poblacién y unas tagas especificas por edad que se muestran en la tabla 7.1. 1 eedio que exine un miciocn eure Io edad y 4 incidenca G ednoer phstin, In poblacion vigja oe encuentra en. desveniaja con reapocto « It joven. . Ajaste de tazas / 115 * Tabla 7.1 Poblacion, niimero de casos y tasas anuales de incidenca de c4n- cer de cuello uterine en Cali, Colombia 1977-1981 y Sao Pauto, Brasil 1978 CH ‘Seo Paulo Fact Poblacion Node Tasa Pobladén = Node = Tase enafias a case x 10° a casosc x 10° Osta 217.645 Q 09 992.534 ° a0 Waza 145.409 2 14 786.750 14 19 2Saz4 666g 15 18,5 639.214 76 9 35044 63.454 34 53,6 423.847 195 46,0 4525400 41.180 4a 10858 328.074 266 811 Ssa66 24551351488. 208.108 228 109.6 GSymis = 19.042 371943 173.968 161089 Torat 597.925 169 2B 3,512,495 965 275 Fuente: hnternationat Agency for Research on Cancer, Cancer incidence in fWve Conti: nents. Lyon, 1987, Vol. 5. La informaciin original se grupo en categovias ate reas mis ampilas Con esta informacién se calculan las tasas brutas de ambas ciudades Toy Tp, ast: No. total de casos wm Stee + Osaae + + Cas y mite Oo Poblacion tral ~ Poblacicn total we LEX Mota FEE Mysagy Home + EX Tes y mis Pobtacion total = 042+16+34446436+37 169 597.525 © S9792S = 28,26 casos por 100,000 Dersonas-afia De mode similar se procede para obtener Ia tasa bruta de la pobia- cién de Sao Paulo: = Ne tatad de casos. Cyaig + Ci3an4 + me + Co8 y mas °° "Poblacion total ~ Poblacién total 116s stesodologta de ta invessigactén.. EX Mage * (TX Miseae + + (EX Mes y mate - Poblacién. tori _ O+ 144-764 195426642284 186 _ 965 ~ 3.512.495 © 3512495 = 27,47 casos por 100.000 personas-aho No obstante, ef investigador observa que existen algunas diferencias en la estructurn ctfrea de las dos poblaciones y por tal motivo, no serfa adecuado para su propésito realizar la comparacién de las tasas brutas asi obtenidas. En la tabla 7.2 se aprecia que ta poblacién de Cali es més joven que a de SGo Panto. Tabla 7.2 Distribudén por edad de la poblacién de Cali y de 580 Paulo Feed — ‘So Pais enaios Poblacion % Poblacion % ou 217.645 364 902.534 28,2 15824 745.409 243 746.750 213 25.034 36.544 145 639.214 182 35344 63.454 106 423.847 12.1 4554 41.180 6 328.074 93 55064 24.551 41 208.108 59 65 ymas 19.042 3,2 173.968 5,0 Total 597.925 100.0 3.512.495, 00,0 Fuente: international Agency for Research on Cancer. Cancer incidence in Five Conti nents, Lyon, 1987, vol. §. La mformacién original se agrupé en categorias eta. reas mas amplias. Con el fin de solucionar cl problema plantsado, «} investigador decide adoptar wna poblaciéa nica o estindar $ con la cual se puedan calcular las tasas ajustadas de ambes poblaciones. Para este propésito adopta como tal a la poblacién femenina de América Latina (Celade, 1991) y con ésta cal- cula el mimero esperado E de casos que se presentarfan en ambas pabla- ciones bajo las propias teas especificas de incidencie (Véase tabla 7.3). © Ajaite de mses 117 Tabla 7.3 Tasas espectficas de incidencia anual de cincer de quello utetina en Cali Cy So Paulo P y poblacén esténdar (en miles) Edad x10 Poblacion esténdar tox 10° en aos s Oal4 0,0 77.500 ao Sala 1,4 43.291 4g 25 a34 18,5 34.589, 119 3Sada 53.6 24,275, 46,0 asa 106.8 46.355 B11 55a 64 146.6 13.693 109,65 65 y mas 1943 11.220 106.9 Tore! 28,3 218.923 25 Fuente: Tasas: International Agency for Research on Cancer. Cancer incidence in Five Continents. Lyon, 1987, vol S. La informacién original se agrupé en categorias ‘téceas més amplias. Poblaciin esténdar: Celade, América Latina, proyecriones de poblacién afos calendarios 1950-2000. Boletin Demogrdfice. 1991; (48) 31 Asi, el nimero esperado de casos:‘en Cali Ec se obtiene de la si- Buiente forma: Em (tx Moar, + (tx Ms)rsang + one + Xess = 00x 10% x 77.500 + 14x 10? 5 43.291 +. 4 194,3 x 10° x 11.220 = 76,43 casos esperados De modo similar-ée obtiene ef nimero esperacio de casos en Sio Paulo Ep: : Epa (tx Moats, + (1X MS)isare + oe OX MDs iy = 0.0 x 10% x 77.500 + 195 10" x 43.291 + .. + 106.9 x 10° x 11.220 = 54,18 casos esperados Finalmente, los tasas ajustadas TA de ambas poblaciones —esto es, aquellas que se presentartan si ellas tavieran 1a estructura etérea de la po- 118 ¢ Meodalogia de ta investigecion. blscién estindar— se obticnen al dividir e! miimero experado de casos en una y otra por el total de Ja poblacién estandar N,. E, __ 7643 = =——— = 100.000 fe TAc 7 378.033 9] casos por personas-aiio Ep _ 5418 Thy = SE > ages 7 275 caro por 100.000 personas-afio De acuerdo con los resultados obtenidos se puode afirmar que si Cali y Sto Paulo tuvieran poblaciones en igueldad de condiciones de edad le tasa de incidencia de c&ncer de cuello uterino en Ja primera ciudad serfa notablemente superior a la que se presentaria en la segunda —34,91 x 10% y 24,75 x 10°, respectivamente— resultado bastante diferente al que se obtiene mediante la comparacién de tas tases brutas —28,26 x 105 y 27,47 x 10°, respectivamente. Otra manera.ce interpretar ¢1 resultado asi obtenido es afirmar que otros factores diferentes a la edad estén relacionados con la diferencia exis- tente en la incidencia de céncer de cuello uterine enme Cali y Sao Paulo, puesto que después de ajustar las tasas por edad persiste una diferencia, Pruebas de significacion estadistica La comparacién de 1a tasas ajustadas por el método directo de dos pobla- ciones suele hacerse en términos de Ia diferencia TA, - TA2. Una prueba de significaciéa para tal diferencia se realiza con el su- puesto de que las estimaciones muestrales de las-tasas se distribuyen nor- malmente; de este modo, para prober la hipétesis nula de que no existen diferencias entre Jas tasas ajustadas se puede recurtir a la variable normal estindar de la siguiente maneza:? Xp _ (TA - TA 0 Z= = ©, WarfTA, - TA,] 2 Niuese que las tssas ajustas son medidas hipolétlcas que se dasfsi en lav condiciones de la poblaciée esténdar y que sirven para realizar comperacionss em igualdad dx condiciones, 3 Estricummeme. se voi dc una price de siprifiraci6a para te diferencia de dos proportione: pondemdas, Ne obstane, dado gpe c valor numérieo de las tasas y las proparciones suele ser Sat, se asume que las tasas 1; sé pueden irwear comp proparciones 7. — « Ajuste de sasas #119 En donde: VarfTA, - TA,] = & w, tf - tX Uy + dng) ee Ey + tg X ty Con: ny + Re Asi, para el ejempio propuesia acerca de la comparacién de las ta- sas de incidencia de céncer de cuello uterino de Cali C y SBo Paulo P, se tiene que: z= (Tac - Thy) - 0 WarlTA, - TA,} 34,91 x 105 - 24,75 x 10% = Wi,040.58+4 15010 Fano Bia a oe ST = A £(0,0+0,58+4, 15+-10,45412, 834 14,954 17,49) x10") 4 resultado que indica la existencia de una diferencia altamente signi- ficativa entre las tasas ajustadas de ambas poblaciones. Con respecto al método de ajuste directo conviene considerar Jo si- guiente: 1, En principio, la mejor comparacién os 1a de las tasas espectficas, por ejemplo dentro det mismo grupo etéreo; sin embargo con frecuencia el nd- mero de observaciones en cada categoria es reducido, por tanto es necesa- rio recurrir a comparaciones globales con el fin de sstabilizar las Aluctuaciones de las tasas especificas debidas al azar. Ademds, Ia comparacién de Ins tasas especfficas de un numero apreciable de regiones se presenta a menudo como una tarea inaleanza- ble, condiciones en las cuales es necesario camparar tases globales ajus- tadas. En la figura 7.1 se presentan las tasas anuales brutas y ajustadas de incidencia de céncer de estémago en hombres de diferentes zonas geogriticas. 2. La eleccién de Ja pablacién estandar es, en cierto modo, una decisién arbitraria porque le esencia del método radica en la escogencia de una po- blacién tniea; no obstante con el fin de evicar distorsiones en los resultados (ue raramente se presentan— conviene elegir tma poblacién similar a las confrontadas. Cuando la comparaci6n se hace entre das poblaciones es co- man elegir como estindar a la combinaci6n o suma de jas dos, \ 120 (Mesodatogta de ta iewastigacién.. segiin Pride = TR OTA asa bruta Tass ai 11 x 108 zi? os 0 8 wD Chin, Shangsi = 7BE2— G43 5B — terae,judlos Frey 184 162 Jep6n, Hiroshima = 7880. 74,0 79,9 ‘Alemania, Hamburgo 7879 40,0 23,7 Finlandia 781 32 8 Wanda. AOWZ 158 2A Halla, Lombard = 7BS1 47,7 38,0 702 7181 782 «BO 15,0 Teaz 42,7 31,8 ee wT 1S InghterayGaks 7982 -28.2 18.5. Bratll, S50 Paulo 7 (340 536 Colombia, Col 7781 232 496 ‘Costa Rica aoa2 341 BB Pusrto Rico maz Ba 178 Canad 782.150 (1az Estados Unkios, NY. 7882 17.9 124 Francia, Doubs, 7882 179 152 Figura 7.1 Tasas brutas TB y ajsstadas TA de incidencia de cémcer de esté- mago an hombres de regiones selectas Fuente: International Agency for Research on Cancer, Cancer incidence in Five Conté nents, Lyon, 1987, vol. 5. Las tasas han sido gjustadas con respecto a la pobla: d6n mundial, 3. Si la obtencién de una tasa ajustada TA por el método directo se logra al dividir e] niimero esperado E por e} mimero totsl de Ja poblecién estin- dar Ns se tiene que: TA --. t, Ty, tty X My ton HEIN N, a HAM, | EM 1X Mh ets ts tet N, N, N, De este modo, si se denota por w,, a la proporci6n de personas de la poblacién estaéndar que se encuentra en cada categoria i, esto Ajuste de sasas/ 12} es wi, = m, /N,, la tasa ajustada se obtiene, segiin la expresién ante- rior, como TA = 5 t,x Wy. En esta expresign se advierte que una tasa ajustada por el método directo se obtiene al ponderar las tasas especfficas de la poblacién de inte- 3s 1, por factores w; que estfin dados por la distribucién proporcional de la poblacién estindar de acuerdo con 1a variable por la cual se realiza el ajus- te. Por este motivo, para obtener una tasa ajustada por este método bas- ta conocer la distribucién proporcional de la poblacién est4ndar, por ejemplo con respecto a cien mil personas, con lo cual se tienen los valores wp. . Para una comparaciéa de pafses de diferentes continentes es conve- niente elegir como esifindar a la poblaciéa del mundo con base en 100.000 Propuesta por Segi la cual se presenta en la tabla 7.4 junto con la poblacién de América Latina proyectada para 1990, Tabla 7.4 Distribucién de la poblacion mundial y de América Latina proyec tada para 1990 por grupos etdreas con base en 100.000 ‘Edad Pableciin Pablecién de en aflos emandiat América Latina Oad 42.000 12.830 Said 19.000 23.124 15224 17.000 19.964 25434 14.000 15.811 35aag 12.000 14.014 45254 11.000 7.368 55364 8.000 * 5.174 65a 76 5.000 B13 7Sy mis. "2,000 1.606 Total 100.000 100.000 Fuente: Poblacién: mundial: Segi M. Ageadjusted Death Rates for Selected Sites in 57 Countries in 1974, Nagoya, Japan, Segi institute of Cancer Epidemiology, 1973; Poblacién de América Latina: Celade, América Latina, proyecciones de poblacion afios calendarios 1950-2000. foletin Demogrético, 1991; (48): 31. 4, Hay que considerar que ona tasa ajustada es una medida global, o sea ¢l resumen de lo que sucede en una citrta poblacién, y puede a su vez 122 /Metodologta de ta trvestigacion.. encubrir aspectos importantes relacionados con Ja variabilidad y la magni- tud de las taeas especffices. Por ejemplo puede ocarir que aunque existan diferencias entre las tasas especfficas de dos poblaciones —para unas ca- tegorfas en un sentido y para otras en sentido inverso— se obtuvieran.tasas ajustadas de igual valor porque se anulan los diferencias positives con las negativas. En cualquier caso, la correcta aplicacién del método exige una clara comprensién de la estrategia subyacente. Método de ajuste indirecto E! método de ajusie indirecto ¢s una estrategia que logra ¢] mismo propésito del métado direcin, el de hacer comparaciones en igualdad de condiciones, en Ja cusl Ia comparacién de una poblacién expuesta a un factor de riesgo con otra tomada como estindar o de referencia se realiza mediante una raz6n cuyo numerador €s él mimero observado O de casos que se presentan en la pobla- cidn expuesta y el denominador es c] mfimero de casos osperados E en tal poblacién si tuviera las wsas especfficas de la estinder. La confrontaci6n an- teriormente propuesta de Ja incidencia de cincer de cuello uterino entre las cindades de Cali y Slo Paulo sirve para iluswar €] méiodo. ‘De acuerdo con los datos presentados el nfimero de casos ohservados en Cali, la’ poblaci6a expuesta, se obtienc al sumar los casos observados en las distintas edades: On LOH rn tem tw tM (Fx Mary + (tX Mysaag Foe HEX Mes y mt = (0,0 x 10°)(217.645) + (1,4 x 10°)(145.409) + + (194,3 x 105)(19.042} = 169 casos Si la cindad de Cali tuviera las tasas especfficas por edad de in- cidencin de céncer de cuello uterino propias de Sao Paulo, Ia poblacién estindar, el ntimero de casos esperados en ella E se obtione al aplicar Jas tasas eapecificas de Sao Paulo a las poblaciones especfficas de Cali, ash EaLVEah, rn + hrm tt ham Ajuste de tases (123 = Cg x arate + by x Masago FEE Mas 5 mig = (0.0 x 10°Y 217.645) + (1,9 x 10°5)145.409) +. + (106,9 x 1054 19.042) = 122,87 casos La comparacién del namero de casos observados en Cali O con el ‘trimero de casos que allf se presentarfan si tuviera las tasas de incidencia espectficas de Sao Paulo-£ por medio de una di ién, da origen a lo que S€ Conoce coms razén estandarizada de morbilidad o de mortalidad REM, o también razén nonmalizada, Réw = 2 . £69.00 E 122,87 = 138 Puesto que dicha razén es, en este caso, mayor que 1,0 se concluye que en igualdad de condiciones de edad la incidencia observada de cdncer de cucilo uterino en Cali supera a la que se presentarfa en Sio Paulo, De una manera mds general la re26n estandarizada se obtiene segun la expresion: x o Baan, REM = — = E kien, Né6tese que el valor de la raz6n estandarizada estd alrededor de 1,0 Segtin el mimero de casos observados sea mayor, igual, o menor que io esperado. La realizaci6n de una prueba de significacién para demostrar la hi- Pétesis de que la rizén estandarizada difiere de 1,0 —o su equivaiente, 1 cfleulo de un imervalo de confianzs— presenta alguna, dificultad por cuanto la distribucién de las estimaciones muestrates de dicha azn no es normal, 4 Con frevencia la resin estandacsada ae sucle prseotar en tdcnings de 100 al muiliplicare? cociente OFF por 100. 1 124 /Mewdologia de 1a invenigecién_ De una manera exacta, tales pruebas pueden realizarse mediante la disiribucién de Poisson que permite calcular el némero minimo y el méximo de casos que con determinada confianza se pueden prescntar dado el ngimere observado de casos> Al dividir tales valores por el nu- mero esperado de casos Z se encucntran los limites respectivos para la REM. Cuando cl néimero eaperado E de casos es relativamente alto, o sea mayor de treinta, se putde recurrir a la distribucién normal aproxdmada que las estimaciones de la REM, Ja\cual tiene un error esténdar esti- mado igual a V{REM/E]. Asi, Jos limites aproximados de un intervalo de 100(J - 0:)% de confianza se obtienen mediante la expresién: Rt Zag = REM + Z,_.NIREM/] En el ejemplo propuesto puede utilizarse tal aproximacién porque al nimero esperado de casos es bastante alto, con lo cual se obtiene un intes- ‘yvalo del 95% de confianza del modo siguieate: REM £ Zya;N[REM/E] = 1,38 + 1,96[1,38/122,80] = 117; 159 Altemativamente, una manera aproximada de obtener Jos limites del + 95% de confianza —o prueba de significacién de una cola con un nivel & de 0,025— se puede realizar por medio de 1a figura 7.2 en la cual Ja in- terseceién de las ineas correpondientes al valor de la estimacién obtenida para la REM x 100, que corresponde at eje horizontal, y el ndmero de casos observados, eje vertical, permite concluir si la estimacién difiere sig- nificativamente de 1,0. De acuerdo con la figura la raz6n estandarizada comespondiente al ejemplo citado, REM = 1.38 con 169 casos observados, es significativaments superior a 1,0. Bates valores extremes purdeo eacontiarse en tablas estadficas; véase por ejempia: Cibe-Geigy. ‘Documenua Geigy: soblas clendificas, Tu. ed. Basiica Suizs, 1975, p. 107. Nomero de casos observadas —escala log— Afuste tle toxas / 125 Q 20 40 60 &@ 100 120140 160 180 200 220 240 260 280 300 Razén significative fH} Razin significativa diferente de 100 ge No. de lim.sup casos dela azin i 3.953 2 826 FSO 3 485 4 5 2B 8B 367 309 10 w S & 20 40 60 8d 100 120 140 160 180 200 220 240 260 280 300 REM x 100 Figura 7.2 Estimacién de ta razon estandarizada: limites del 95% de confian- za alrededor de 100 con respecto al numero de casos observados Fuerte; Ollie of Popuation Censuses and Surveys: Occupational Mortality, Series DS No. 1, 4andon, 1970, p. 15. Consideraciones finales Aunque tradicionalmente se han distinguido Jos dos -métodos como dife- rentes, ambos utilizan la misma estrategia bésica, La comparacién O/E segtin el métods indirecto en el cual se adopta como estindar la poblacién nO expuesta, es idéntica a la comparacién E//Ez resultante de comparar los valores esperados que se obtendrfan segin el método directo en las dos poblaciones comparadas si se cligiera como estdndar a la poblacién expuesta. Numero de casas auservados ~escala log— 126 (Mteodologta de la irvrestigacién,.. Asif, la diferencia existente entre los dos métodos consiste més en Ja forma de realizar ta comparaciéa de interés: mientras en el método directo Ja comparacién se sucle plantear como una diferencia, en el indirecto tal comparacién adopta la forma de una raz6n. Sin embargo ambos se apoyan en valores esperados que se obtienen con la misma estrategia. La eleccién de 1s poblaciGn estdndar, salvo casos extemos, es un asunto relativamente arbitrario puesto que ia erencia de! método de ajuste sadica cn que permite hacer comparaciones sobre ch mismo modelo, inde- pendientemente de cudl sea; no obstante, ¢s una buena prictica elegir como poblaci6n estindar a una combinacin de las poblaciones comparadas. En cualquies caso es preferible elegir como esténdar a una poblacién relacio- nada de alguna manera con Jas comperadas. La decisién de realizar un ajuste por uno 0 otro método se basa, como primera istancia, en la disponibilidad de la informacién. Por ejemplo, es frecuente que en estudios de epidemiolog{a ocupacionsl se conozca el namero de casos de cierta enfermedad ocurridos en una poblacién wabaja- dora expuesta a determinado factor de riesgo, pero que se ignoren las tasas espeoificas por edad; en este caso no se pucde obtener ta tasa de esta po- blacién ajustada por edad septin ¢l método directo, el cual requiere el co- necimiento de las tases especificas de la poblacién. En casos como éste es bastante. comtn realizar ¢! ajuste por e) método indirecto al tomar como estindar a Ja poblacién general o no expuesta cnyas tasas especificas se suelen conocer. En principio, los métodos descritos anteriormente pueden ser utiliza- dos para obtener una tasa ajustada simultincamente para miliples varia- bies lo cual permitirfa realizar comparaciones en igualdad de condiciones con respecto a miltiples factores; sin embargo, a medida que se incrementa ei numero de aquellos por los cuales se desea realizar ¢] ajusie no sdio se increment la informacién necesaria, por ejemplo tasas especfficas por edad y sexo, sino que, existe e} peligro de utilizar tasas poco confiables debido a Ja reduccién que as{ Se opera en los denomiriadores de elas. Por este motivo raramente se recurre a estos métodos para producir tasas ajus- tadas por més de dos variables. Referencias bibliograficas 1. Breslow NE, Day NE. Stotitical Methods in Cancer Research, Vol. It: The Design and Analysis of Cohort Studies. Lyon, Internationat Agancy for Research on Cancer, 1987. Ajuste de tasas 7127 2 Tmemational Agency for Researci on Cancer. Cancer incidence in Five Continents, Lyon 1987, Val. 5, 3. Celade, América Latina, prayeccionss de poblacién, afios ealendarioa 1950-2000, Boletin Demogrifica. 1991; (48Y. 31. 4 Kahn HA, Sempos CT, Statistical Methads in Epidemiatogy. New York, Oxford Univer- sity Press, 1989, 5. Office of Population Censuses and Surveys: Ocupationai. Mortality, Series DS Na 1, Lon- don, 1970, pp5-16, & Segi M. Ageadusied Death Rutes jor Selected Sites in 51 Covutries in 1974. Nagoys, Japan, Segi lastitute of Cancer Epidemiology, 1979. 8 Aniilisis estratificado En et presente capitulo se describen los fundarneatos del andlisis es- tratificado, procedimienta mediante el cual es posible obtener medidas de asociacién Wores del ofecto que pueden intoducir variables de con- fusion y estudiar la intefacci6n entre diferentes variables cuando ac- ‘tian simuiténesmente sobre un efecto observade. E | anaisis estratificado es una estrategia que ¢l epidemidlogo utiliza con frecuencia en el andlisis de la informacida de estudios analiticos' con ei fin de controlar posibles sesgos de confusién introducidos por variables extrafias a la asociacién estudiada o para identificar ¢l efecto que sobre ella producen dichas variables. 1 Aguallot que tonen como objetivo demecur asociscicnes exisurtes cote exposisiones y le mpariciéa de dewerminads evento. 130 | Mrtodologia de ia iovestigaciOn.. En esencia, y con una mirada préctica, el andlisis cetratificado consiste en la clasificacién de la informacién obtenida y referente a la asociacién estudiada por categorias o estratos de una variable —o com- binacién de ellas— que presumiblemente confunde los resultados si no ge controla,? © que interacnia tanto con la exposicién como con el efecto eswwdiado al modificar el valor de Ja asociacién de interés a medida que cambia tal variable. Ea principio, tanto si se desea controlar el efecto de una variable potencisl de confusién como si se desea estudiar la interacci6n, ef objetivo se logra al fraccionar la asociaciGn observada en estratos de Ja variable que, supuestamente, produce eonfusi6n o que interactta; al proceder de esta manera el investigador tiene oportunidad de observar Ie asociacién es- timada en cada uno de log estratos, independientemente del valor que ella tome en los demés. Por ejemplo, si al estudiar la asociacién entre consumo de licor y cdncer de esdfago se estratifica la informacién por tabaquismo, con la in- tencién de controlar el efecto de esta variable que supucstamente produce confusién. se tiene asi la posibilidad de estudiar la asociacién consumo de licor y cfncer de es6fago en cada estrato de consumo de tabaco, libre de Ja confusién que pueda introducir esta: variable y ademas observar €] com- portamiento de la asociacién estudiada para diferentes valores del consumo. de tabaco, es decir, observar si él interactila con Ia ingestién de alcohol cn Ja incidencia de cAncer de esdfago. Una vez estratificada la informacién, el andlisis se centra en la ob- tencién de una medida de asociaci6n dmica entre la exposicién y la inci- dencia de la enfermedad libre de confusién —si la variacidn del efecto observada entre los diferentes estratos no es apreciable— 0 alternativamen- te en la deseripcién de la interaccién —si el efecto varia entre los estratos més de lo esperado por simple azar. Aunque Ia estrategia general del andlisis estratificado es Unica y sir- ve tanto para el contral de Ja confusién como para el estudio de la interac- ci6n, su correcta aplicacién y la adecuada interpretaci6n de jos resultados presentan diferencies importantes que deben considerarse, tal como ge €x- pone a continuacién. 2 Véane lp reforente a xeagos de confusién en el capimlo- 6, Fuentes de error en Je investigscién seerielbgion, - Andlisis estratificada / 13} Control de la confusion Una variable produce confusién en Jos resultados si cumple tres requisitos importantes: 1) si es un factor de Tiesgo para La enfermedad, 2) si presenta asociacién con la exposicién y 3) si no actéa como un factor causal inter- medio en la secuencia exposicién enfermedad. Asi, en el estudio de la asociacién entre ingesta de alcohol y céncer de eséfago ¢] consumo de tabaco debe ser considerado come una potencial variable de confusién porque, aunque est4 asociado tanto con la enferme- dad como con Ja exposicién, no es un factor causal intermedio entre la ingesta de alcohol y el céncer de esGfago; mientras que cuando se estudia la asociaci6n entre anticonceptivos orales y enfermedad coronaria la hiper- tensién arterial 20 ¢s una variable de confusi6n porgue,.aunque esti aso. Giada tanto con ja enfermedad como con Ja exposicién, es consecvencia de ésta, por tanto es un factor causal inicrmedio en el desarrollo de Ia enfer- medad. Un eriterio préctico importante que indica la presencia 0 ausencia de confusién en una cierta medida de asociacién es lo existencia de una dife- Tencia entre la medida ajustada y la medida cruda, Existen tres estrategias generales para la obtencién de una medida de asociacién libre de confusién o ajustada (Rothman, 1986): 1. Mediante la ponderacién de tas medidas especfficas de asociecion por factores o pesos con un valor inversamente proporcional a Ia varianza de la medida estimada en cada estrato. 2, Por medio del método de maxima verosimilitud e cual obtiene como medida ajustada aquélla que se estima con los valores que maximizan la funcién.de probabilidades correspondiente cuando se evaitia a partir de la informacién obtenida, 3. Por medio del método propuesio por Mantel y Hacuszei segun el cual los factores de ponderacién de las medidas de asociacion especfficas son inversamente proporcionales a la varianza del logaritmo de la razén de dis- Paridades en ausencia de asociacién, o-sea RD = /. Este método tiene algu- nas ventajas importantes como su aplicabilidad en aquellos casos en los cuales 132s Metodologio de ta \nvestigocion... Por las razones anteriores y porque produce resultades bastante pa- recidos a los que se obtienen con otros métodos, ¢] de Mantel y Haenszel ¢$ ampliamente utilizado, Estrategia general De acuerdo con el método propuesto por Mantel y Haenszel en 1959, el control de ls confusién existente en una medida de asociacién causada por una variable Z se logra al ponderar las medidas de asociacién Aj, obtenidas en los k estratos o categorfas de Z, por: factores de ponderacién w; de acuerdo con la expresién general: . Ema, z © a en la que los factores w; son inversamente proporcionales a la va- rianza del Jogaritmo de Ja razén de disparidades en le ausencia de aso- ciacién? Al ponderar las medides espectficas A, por tales factores se obfiene una medida Unica de la asociacién existente entre Ja exposicién y el efecto estudiado A libre del efecto de confusién praducido por Z, 0 sea una medida ajustada ‘La medida de asociacién A puede ser una diferencia 0 una razén de Tiesgos, el riesgo atribuible o el riesgo relativo, segtin el interés del estudio; con ¢l fin de analizar la injerencia del azar en Ja asociacién estadiada, la medida asf obtenida debe acompafiarse del intervalo de confianza corres- Pondiente y, como complemento, de ls prueba de significacién estadistica que evaléa la probabilidad de que tal medida haya sido obtenida por simple azar. A contimaciéa se expone la aplicacién del métode a cada uno de ios dlisefios mas importantes utilizedos por Jn epidemiologfa analitice. Estudios de casos y controles ij” Eo un estudio de este tipo la informacién cbtenida con respecto a la expo- sicién y a la enfermedad en el estrato i de la variable que se pretende controlar: se puede denotar como se muestra en la tabla 8.1. 3 Nitese ane e método se seduce a ponders medidas de ssociaciée que se encuentran libres de confusidn en eada estate por facawes w que reflejan la prectsiin de tales medidas. Andiisis estresificador 13.3 Tabla 8.1 Informacién. obtenida en el astrato i et ‘un ‘estudio de casos y Sontrales con datos que expresan prevalendia Expasiciin Enfermos ‘Sanos Total Expuestos a 4 ny No exouestos b 4, Ny, Torat My, Ma a Para este tipo de estudio, en el. cual ef riesgo relative que caracteriza 4 la asociacién se suele estimar de manera aproximada por la razén de disparidades RD,* los factores de ponderaciéa propuestos por Mantel y ‘Haenszel adoptan en el estrato / ta forma w; = be, i; con Io cual se tiene segin la expresi6a [i]: Bly — Ste ngad.ney Bad, RD= dw, Beem SE bam La razGn de disparidades asf ajustada AD es una medida de asociae cién que est libre del sesgo de confusién que en la informacién global, Presumiblemente, introducia la variable de confusién por la cual se estra- tifies la informacién. : La prueba de significacion éstadistica Que se realize para probar la hipdvesis de la existencia de una asociacién se basa en el comportamicnto del mimero de observacioncs conrespondientes a la casilla 2, enfermos ex- puestos, sit olvidar que; 1) el ntimero observado fn cada estrato es a), 2) el aiimero esperado en cada estrato con la hipdtesis de que no existe aso- siacién os m,ny,/n,, {recuencia que refleja la distribucién proporcional del ndmero total de.casos en el estrato, my y 3) la varianza del németo de ~ casos esperado en tal casilla ¢ rysiq ig: /{(r ~ 1)n7]. 4 En lor emudion que svaléun la aoctaciéa com base en metidas de prevalencia, it medida se ‘aims por medio de la razin de prevalencias RP; ental easy se cbticne uaa mazén de prevalencies ajnstads con el mlanse proccdimicato. 134s mandoloyiade la teverigacion.. ‘De este modo se obtiene un valor de la variable chi cuadrado de la siguiente mancra: k i & [20bs, - SepP & a, - Bmp nF eg Svar, 5 RPh fg Mn, + Tn? expresi6n que toma la forma equivalente: ‘ EE (ag, » be MnP ¥, = ——__ 2 taparartg A - Ln} ‘La obtencién del riesgo telativo ajnstado, aproximado por thedio de 1s razéa de disparidades, y el céloulo de la prueba de significacién corres- pondiente se muestran en el siguiente ejemplo, adaptado de un estudio de casos y controles con relacién 6 la diabetes como factor de riesgo para Ja enfermedad carotidea obstmctiva realizado por Cadavid y colaboradores (1992), Al clasificar los casos y los controles de acuerdo con los antece- dentes de diabetes —exposiciGn de interés— se observaron los resultados consignados en Ja tabla 8.2. EI valor aproximado del riesgo relative se caleulé por medio del valor estimado de la razén de disperidades, ast: ad _ 81x47 Rha RD= T= “peas” 3? Lo Andis esraifeato 135 Tabla 8.2 Resultados de un estudio de casos y controles sobre fa diabetes como factor de riesgo para la enfermedad carotidea obstructiva. Medellin, 1993 . Enfermedad carotidea Si No Total Si a1 26 107 Diabetes Na ag ana 893 Totai = 500 500 1000 Fuente: Cadavid G, Londofio JL, Zapata AM. Algunos factores de riesgo para la enferme- dad caratidea obstructiva: estudio de casos y cantroles en elecuciin. Centro de investigaciones médices de Antioquia, CIMA, Medellin, 1993. No obstante, dadas las asociaciones existentes entre la obesidad y la safermedad vascular obstructiva y de la primera con la diabetes, los inves- tigadores decidieron sjustar el valor de la razén de disparidades por obesi- dad pars controlar un posible sesgo de confusin introducido en tal medida por esta variable. Con este propésito se conformaron dos. estratos por obe- sidad y se obtuvo Ia informacién que muestra la tabla 8,3. El valor de la razén de disparidades ajustada por obesidad se obtuvo asi: RD = _ (37 x 298631 + (44 x 176359 _ © (288 x BYGST + (137 x 18369 ~ * Para Ja correspondiente prueba de Significacién estadistica, con la cual se prueba la hipétesis altemativa RR > 1,0 frente a la hipStesis nula RR = 1,0 se caleul6 el valor de Ja variable chi cuadrado como sigue: 136/ Metodetogia de ta iavestigacién... Tabla 8.3 Resultados de fa estratificacian por obesidad de un estudio de ca sos y controles de ta diabetes come factor’ de riesgo para la enfer- medad carotidea obstructive. Medellin, 1993 ‘Obesiciad: No st Enfermedad caroticea Enfermedad carotidea + . Total + -__ Total +| 37 al 45 +] wl 62 \ Diabetes - | 288 | 298) 586 - | 131) 176 | 307 Total 325 306 631 7S 194369 Fuente: Cadavid G, Londofio Ji, Zapata AM. Algunas factores de riesgo para la enferme- dod carotidea obstructiva: estuie de casos y controles en ejecurién. Centro de irwestigaciones médicas de Antioquia, CIMA, Medellin, 1993. t24ad, - bewnP z MyfiggM My Hn, = Lin? __ [137 x 298 - 2BB x BYO3I + (44 x 176 - 131 x 18Y360P © A5x586x32 5x 306/ G30)03 P+62230721 7521 98H 368)3F = 34,59, P< 0,901 Entonces se concluyd que, eliminado el efecto distorsionante de Ja obesidad, se observa una fuerte asociacién entre diabetes y enfennedad ca- rotfdes con una estimacidn puntual aproximada del riesgo relative de 3,83. La diferencia que se advierte entre la raz6n de disparidades cruda 3,52 y la razén de disparidades ajustada 3,83 muestra Ja confusi6n intro- ducida por la obesidad en Jos datos !a cual suprime ligeramente la asocia- cién estimada entre Ja diabetes y la enfermedad carotidea. Adicionalmente, se obtuvo un intervalo de confianza para el valor de la asociacién tal como se describe més adelante. . Andis estrotftcade 1 137 Estudios de seguimiento 0 de cohortes La estrategia por medio de la cual se logra el control de variables en los estudios de seguimicnto mediante el anélisis estratificado es similar a ta expuesta. para los de casos y controles, con algunas particularidades que dependen del disedo del estudio tal come se indica a continuacién. Estudios de seguimienio de tipo proporcional. La informacién obte- nida én el estrato i en un estudio tipico de esta clase se puede representar mediante la notecién ya utilizada, con la Consideracién que jos totales my; ~ ¥ Mg tepresentan al nttmero de sujetos expuestos y no expuestos observa- dos en el estudio (Véase tabla 8.4), Tabla 8.4 Resultados de un estudio de seguimiento de tipo proparcional en ef estrato i Eposiadn ‘Sanox Total ~ Expuestos S mi No expuestos qa Na, Para esta situacién, los factores de Ponderacién propuestos por Man- tel y Hacnszel Para las estimaciones de la asociacién obtenidas en cada estrato toman Ja forma: con lo cual se tiene, de acuerdo con la expresién [1], que una esti- macién del riesgo relative ajustado se obtiene al ponderar las medidas es- Pecfficas por estrato mediante la férmula: ‘ ‘ a MR) % thing Maa, ASM, Sry) RRe 7 z » z bay Wy, La prueba de significacién estad{stica Para demostrar la hipétesis adopta le forma descrita para los estudios de casos y controles, Estudios de seguimlenta con base en el tiempo de exposicién. Cuando en un estudio de Seguimiento se observa cl némero de casos que bn, fa, et 138 /tetadologia de ia tnvestigacion.. ocurre durante un cierto periodo de exposiciGa, para calcular la tasa los resultados correspondientes al estrato i pueden resumitse como se muestra en la tabla 8.5. Tabia 85 Resultados de un estudio de seguimiento con base en ej tiempo de exposici6n Exposicisn Enformas Tiempo de exposicion Expuestos a My; 4 No expuestos b Mo, Total By My De modo similar a la estrategin descrita para los estudios de segui- miento de tipo proporcional, los factores de ponderacién w, adoptan la for- ma b, M,, M, con Jo cual se obtiene una expresin equivalente a ta dela siwacion anterior para ef célculo de la razén ajustada do las tasas 0 riesgo relative ajustada: k 2 4; ha M, RR = ¥ 0M, mM, ca La prueba de significacién correspondiente a tal medida sc apoya cn ¢l valor de la variable chi cuadrado de un grado de libertad, asf: ge, = Har Via) praeba que se reficre a la casilla @ de la tabla glabal y que se basa en los resultados correspondientes 2 una distribucién binomial {n,p/ en 1a que n =a +b y p = Mj; M, con Ins siguientes consideraciones: a: némero total de enfermos expuestos o mimero observado de éxi- tos el cual se obtiene al sumar el némero de casos a; de todos los estratos. fa), némero woul esperado de enfermos expuestos bajo ia hipétesis nula o de no asociacién, con wm valor que se obtiene al sumar Jos valores esperados para los diferentes estratos. Andiisis estratificado 259 ~ En ef estrato i, bajo la hipdtesis nula, se esperarfan (M,, /MJm,; en- fermos expuestos al aplicar la distribucién Proporcional del tiempo de ex- Posicién al total de estos, 0 sea: LM, Ha) = Bae Via): es la varianza det mimero de enfermos expuestos bajo la hip6- tesis nula, valor que se obtiene como la suma de las varianzas de las esti- tmaciones propias de los diferentes estratos, de ia siguiente manera: ny My Mo "MM," expresién que rauestra Ja varianza de una distribucién binomial para Ja forma conocida n(p\(q) en donde n conesponde al nimero total de casos. en cada estrato n,, p corresponde a la probabilidad de éxito bajo la hipe- tesis ula de acuerdo con Ja distribucién proporcional del tiempo de segui- miento M,, 4M; y q al complemento de P. 0 sea My, AM, De este modo: E] siguiente ejemplo citado por Rothman (1986) ilustra el procedi- Taiento: Al estudiar la asociacién que la mortalidad observada en pacientes con neuralgia trigeminal puede tencr con ia variable sexo S¢ obtuvieron los siguientes datos (Véase tabla 8.6). 140 ¢rScxadologia de ta Investigacion. Tabla 8.6 Resultados de un estudio de seguimiento de ta asociacién existente entre el sexo como factor de.riesgo y la neuralgia trigeminal por edad Edad: <5 650 mas Sexo Muertes ——Afios Muertes Afos Mescutino 4 1516 76 29 Femenino 10 1701 124 2245 Totat m4 3217 97 3194 Fuente: Rothman KJ. Modem Epiderniciogy. Boston, Little, Brown and Co., 1986, p. 186. La medida de asociacién cruda RR, caiculada con base en las tasas de mortalidad sin considerar la edad, parece indicar que no existe una aso- ciaciGn de In mortstided por esta enfermedad con el sexo: ee RR=e—= = 110 ty 1313946 ‘No obstante, ante la sospecha de que la edad puede ejercer un efecto de confusién en Ja asociacién observada se obnivo el valor de] riesgo re- Jativo ajustado por edad, de la siguiente manera: _ (44)(S701)8217 + (764224573194 ” (HONTSIOVS2I7 + (121X949 V1 = 150 Este valor muestra un importante efecto de confusién suptesor de la asociacién por parte de la edad puesto que ¢l valor del riesgo relative cru- do 1,10 es bastante menor que el ajusiado £,50. La informacién necesaria a Anatase etmijicadot 34 para realizar la prueba de significacién con base en el valor de la variable chi suadrado se obtuvo de la siguiente manere:. eM, 1516 49 9S Hy, = Oe og 2? 97 2 Efa) 2 Mi, * “ay 24 + sygg 197 = 69.84 My My 24(1516x 1701) 1971949.x 2245) 2 Va) = 3 ty tart = aaa 3 47,12 2 _ f2-Ea)P (90. 6084 Way > e797 = 863; P< 0,0) El alto vator de chi cuadrado obtenido permite concluir, con base en el valor de P, que los hombres con seuralgia trigeminal experimentan una mayor mortalidad que las mujeres. . Intervalo de confianza para una medida de asociacién ajustada Con cl fin de conocer el intervaic en e] cual se puede afirmar con determinada confianza que se encuentra el valor de la medida de ja asociacién estudiada se calculan sus limites de la manera como se €Xpone a continuacién. El cdiculo aproximado de un intervato de 4100(1 - &)% de confianza Para el riesgo relativo cuando éste toma valores cercanos a la unidad se Puede hacer mediante la expresién propuesta por Miettinen (1976): en donde RR representa ef riesgo relative ajustado 0 su aproxi- macién, la raz6n de disparidades, Z;.a cl valor dc la variable normal es- tdndar y x? el valor obtenido en la variable chi cuadrado en la prueba de Significacion para la medida ajustada, Esta forma se conoce como la esti- macién de intervalo basada en la Prucba de significacién puesto que para 8u cdlculo sélo se precisa obtener {a informacién del riesgo relativo ajus- tado y el valor que toma Ia variable chi cusdrado en dicha prueba. 142 /Metodoogla de to investigociten. De este modo, un intervalo aproximade del 95% de confianza para el riesgo relativo ajustado como medida de asociacién entre antecedente de diabetes © incidencia de enfermedad carotidea segiin el ejemplo citado se obticne de la manera siguiente; mot ZyetNt2) 1 & 196 £434.59} 83 6 ae 59}, con lo cual se obtentn los mites 2,45 y 5,99 que revelan Ja exis- tencia de una asociacién significativa entre antecedentes de diabetes y en- fermedad carotidea. : Cuando la medida de asociaciGn ajustada difiere apreciablemenic de la unidad ee utiliza un raftodo general el cust se apoya en Je distribucién normal que presentan las estimaciones muestrales del logaritmo de! ricsgo relative o de'le raz6n de disparidades puesto que Jos Ifmites aproximades de] imter- valo de JOO{? - 0% de confianza se obtiencn mediante la expresién: X+tZ,.9 Wark en donde X representa, ta variable In RR o In RDS La varianza del logaritmo de Ja raz6n de interés se puede estimar de la manera siguiente segiin se trate de obtener un intervalo de con- fianza para el riesgo relativo ajustado, como en los estudios de segui- miento con base en proparciones, o para Ja rezén de disparidades ajustada como en los estudios de casos y controles o de asociacién con base en medidas de prevalencia. ‘La varianza del ipgaritmo del riesgo relative ajustado se puede esti- mar de modo aproximade mediente e] uso de la informacién corespon- diente a los k estratos, tal como sigue: . 2% Omri aban? Bar ay) & bry my) Varfin RR] = 5) Las cotimasiones mmusstraies del riesgo relative no ar dismibmyen noruulmeate, on cambio las cesimaciones muestales 0s sa logariuno si Araitisis esteatificada/ 14.3 La varianza del logaritmo de Ja razén de disparidades ajustada se puede estimar de manera aproximada por medio de la expresién propuesta por Robins y colaboradores (1986): PR 3 ossaR, 2s, R, Varlin RD] = + + ager ERs) ahs en donde, a, + d, P, Después de caleular Jos limites A y B del intervalo de confianza para el logaritmo natural de la medida de asociacion de interés se. obtienen [os Tespectivos limites para la medida de asociacién ajustada al exponenciar la base de los fogaritmos naturales con las potencias A y B. Asi, si se trata de obtener un intervalo de confianza para la raz6n de disparidades ajustada, ung vez que se han obtenido los Ifmites inferior y superior del intervalo para in(RD) de acuerdo con las anteriores expresiones se obtienen los Ii- tites para In razén de disparidades ajustada ai calcular: tim inf fin RD} lien inf [RD] ies sup [RD] = ot 8 th HO} En el ejemplo propuesto sobre el andlisis de la asociacién entre ba diabetes y la enfermedad carotidea por medio de un’ estudio de casos y Controles se estim6 una razén de disparidades ajustada por obesidad igual 4 3,83 y sé obtuvo cl valor estimado de 0,05788 para }a varianza de in {RO). Asi, los limites de un intervalo de 95% de confianza para el logarit- mo de la razén de disparidndes para la diabetes, ajustala por obesidi calcularon como sigue: In BD & Zyo1y. gp = tn 3,83 + 1.96 VO.05788 = 68713; 18132 144 Hdeaxtoiogia de ta tevenigacion. Luego se obmivieron los lfmites del imervalo de confianza para la vaz6n de disparidades ajustada al exponenciar dichos valores: lim inf (Roy =e”? = 2.39 18132 _ Yim sup [RD] = e 63 & intervaio obtenido mediante este procedimiento debe preférirss 8 aquel ligeraments més estrecho obtenido por cl método descrito basa- Go en la prueba de significacién dado el alto valor de la asociacién obser- vada RD = 3,83, Interaccion Cuando: se. realiza un estudio analitico con miras a identificar una aso- ciacién existente entre una exposicién X y un efecto ¥, se dice que un tercer factor Z interactiia con X si la exposiciGn simultinea de Jas per- sonas a X y a Z produce un efecto ¥ que es mayor que el que corres- ponderfa a Ja simple combinacién de los efectos individuales de X y de Z (Kupper y Hogan, 1978; Rothman y colaboradores, 1980; Koopman, 1981). La existencia de interaccién entre X y Z indica entonces que ja ex- posici6n al factor Z modifica el efecto de la exposicién X sobre ¥ al po- tenciar su acciGn, sinergismo, o al atenuarla, antagonismo. La modificacién que ejerce una variable Z sobre una exposicién X puede adoptar dos formas diferentes: si el efecto de'la exposicién a ambos factores es diferente de la suma de los efectos que ejercen por separada, se presenta una interaccién bajo un modelo aditivo; pero si el efecto de la exposicién a ellos es dife- rente de] producto de los efectos individueles se presenta una interacci6n bajo un modelo multiplicativo (Walter, 1978; Kleinbaum y colaboradores, 1982). La diferencia entre estos tipos de inteaccién se aprecia bien cuando se desea estudiar la interaccién que existe entre dos factores de exposicién Xy Z, ambos dicotémicos, En esta situacion, los riesgos de enfetmar bajo Jas diferentes categorias de exposicién se presentan en Ja tabla'8.7. En un modelo aditivo Ja inexistencia de interaccién se,fefieja en que Ja diferencia entre el riesgo de enfermar bajo ambas exposiciones y el exis- Anitisis exrasificados 145 Tabla 8.7 Riesgos de enfermar para las diferentes categorias de exposidén a : dos factores dicotdmicos, X y Z 0 1 o Foo Rot x 1 Rte Ri tente en ausencia de éstas RR,, - RRyy se obtiene como la surna de Jas diferencias en el riesgo para cada una de las exposiciones consideradas aisladamente y el que se presenta en ausencia de elias, (RRjg - RR) + (RRoy - RRog). Un ejemplo en el cual se evidencia la inexistencia de interaccién bajo un modelg. aditivo lo Proporciona Ja situacién en la que se obtienen los datos que se muestran en Ia tabla 8.8. Tabla 8.8 Riesgos de enfermar para las diferentes categorias de exposicién de dos variables dicotémicas en una situacién én ia que no existe imteraccién bajo el modelo aditivo z 0 1 . 0 10 20 x 1 30 40 En este caso, ef valor del riesgo atibuible a In oxposicién conjuma de las doa variables X y Z, 40 - 10, es igual a Ja suma de los riesgos atribuibles a las dos exposiciones consideradas individualmente (30 - 10) + (20 - 40). hecho que refleja la inexistencia de interaccién bajo ef modelo aditivo. Una prucba para detectar interaccién bajo el models aditivo et 1a situacién descrita, en la que le exposiciones de interés S¢'miden dicotémi- samente, sc puede realizar por medio de un modelo lineal en el cual Ia Probabilidad de enfermar en presencia de ambos factores se expresa como: 146 ¢ Metodologio de la investigactin... P(Ye XZ) = 1 + BX + yZ + BXZ Si no existe interaceién bajo este modelo Ja probabilidad de enfer- mar se estima como la suma del término independiente oy de los riesgot jndividuales de enfermar bajo ambas exposiciones B y y, pero si existe interaccién, Ia contribucién a la probabilidad de enfermar por parte del riesgo que supone la exposicin conjunta X-Z es significativamente dife- rente de 0. Asf, la existencia de interaccion bajo el modelo aditivo se de- mancstra si en cl modelo de regresién lineal indicado el coeficiente 5 difiere significativaments de 0. Bajo nn modelo muttiplicativo, en cambio, 1a interaccin no existe si el riesgo relative propio de Ia oxposicién conjunte X-Z es igual al pro- dueto de los.riesgos relativos que caracterizan 1a exposicion individual a Jos dos factores; asf, la inexistencia de interaccién bajo este modelo se etecta si RR,, =.RRjo X-RRoy, Esta condici6n se cumple si las estimaciones de los riesgos relatives obtenidas en los diferentes estratos de una tercera variable Z por medio del andlisis cstratificade aon similares,’ En la siguiente situacién bipotética, en Ja cual se presentan los ries: gos de enfermar para todas Ins combinaciones posibles en le exposicidn simulténea a X y a Z, se evidencia la ausencia de interaccidn bajo un mo- delo multiplicative (Véase tabla 8.9). Tabla &9 Riesgos de enfermar para las diferentes categoria de exposicidn de dos variables dicotémicas en una situacion en fa que no existe interaccion bajo el modelo multiplicative 0 1 o 10 20 x 1 30 6 6. La inderaccida bajo, o4 modelo multiplicative se puade evaluar tembléa por medio de un modelo ‘anhvarindo de regresidn loytica en ol cual ae prac ai) cocicente de} Wonino que express Andtisis esmnificada / 147 Notese que RR,, = 6 y que éste, a su vez, es igual al producto de Jos dos riesgos relativas considerados independientemente: RRj = 3 Ry, = 2. Esta misma relacion se aprecia en Ja igualdad que presentan los Tiesgos relativos que caracterizan la exposicién a X en los dos estratos del factor Z, RR = 3. En el estudio citado sobre antecedentes de diabetes como factor de riesgo para la enfermedad carotidea obsuuctiva, al evaluar tal asociacién de acuerdo con Ja edad, se encontraron los resultados que se muestran en la tabla 8.10. Tabla 8.10 Resultados de un estudio de casos y controles sobre la diabetes coma factor de riesgo para la enfermedad carotidea obstruciiva, por edad. Medellin, 1993 Edad: <2 be >64 Enfermedad carotides Enfermedad carctidea + oe ee + 30 9 + 51 7 Diabetes - 14a 325 - 275° (149 b= 7,52 Ab = 1,63 Fuente: Cadavid G, Londofio IL. Zapata AM. Algunos factores de riesgo para ia enferine dad carotidea obstructiva; estudio de casos y controies en ejecucién. Centra de Investigaciones médicas de Antioquia, CMA, Medellin, 1993. La notable diferencia que presentan las estimaciones de Ia asociacién observada en los dos estratos de Ia variable cdad RD = 7,52; /,63, sugiere Ja existencia de una interaccién entre Ia diabetes y esta itltima bajo on modelo multipticativo, 0 sea que la edad ejerce un efecto sinérgico sobre Ja diabetes como factor de Tiesgo para la enfermedad carotidea.de 101 modo que ¢l riesgo relativo que presenta In existencia de ambos factores de ex- Posicién es mayor que el producto de los riesgos relativos de estos consi- detados independientemente, Con ef fin de establecer si la variacién observada. entre las medidas de asociacién estimadas en los diferentes estratos de una tercera variable se debe aliazar, o si por el contrario tal variacion debe atibuirse a una 148s Metndotogio de ta investigocion... interaccién, se puede realizar una prueba de significacién estedistica de homageneidad con base en la distribucién de chi cuadrado de un ndmero de grados de libertad igual al némero de éstratos i menos uno, en la cual se comparan las medidas especificas por estraio con la medida tinica ajustada Y que, para ¢] caso en el que se estima ‘a asociacién por medio del riesgo telativo, toma Ja forma siguiente: £, (in RR, - In RRP Bu = % "Var (in RE} Bn el estudio citado, acerca de la diabetes como factor de riesgo para la enfermedad carorfdea, se obtuvo primero una medida dinica ajustada de asociacién RD y luego se reali2é Ia prueba estadistica de homogencidad para detectar interaccién de le diabetes con Ja edad, de la manera siguiente: t an, (30 x S2S5VSOB + (51 x 149)492 RD = = = 2,87 E bg, tm, (144 = 9Y50B + (275 x 17492 2} Gin RD,- in RDP Lat 44 Varlia RD) [in (252) - tu (2.870 _ fn (1,63) - n (2.873 (i304 VA IBGIBDS) * STHIZIS+ ATI) = 961; P | (Kicinbuum, 1982; Colimén, 1990). : 162 /aterodologia de ia irwestignci6a... Aunque el andlisis de los resultados obtenidos con wi modalidad es mis complejo y no se expone ea el presente texto (Véase por ejemplo, Miettinen (1969), Fleiss (1981), Kahn y Sempos (1989)) cs importante in- ddicar que Jos principios genereles que se han expucsto hasta ¢l momento son igualmente aplicables a dicha situacién. Consideraci final Cuando se estudia ¢f equiperamiento como una opciéa metodolégica te debe considerar fo signiente: 4 1. Bn algunas aituaciones es aconsejable yecurrir al oquiparamiento para Jograr una informacién més eficiente, tal como ocurre cuando le obtencién de Ia informacion relativa a cada control es muy costosa porque requiere exdmenes de laboratorio para detecter la exposicion previa a on virus, por ejemplo. La estrategia, en este caso, evita que tales exdmenes se practi- quen a todos los controles seleccionados en forma aleatoria, con el ries- go de que buena parte de fa informacién resultante aporte muy poco © nada al andlisis. 2. En aquellos casos en Jos cusles la variable de confusion que se desea controlar es nominal con numerosas categorias, por ejemplo lugar de resi- dencia v ocupacién entre otras, le elternativa de estratificar en el anilisis sin previo equiparamiento puede originar méltiples estratos con escasa in- formacién; para evitar que esto ocurra el investigador puede recurrir al Nento. En el caso de variables continuas, por ejemplo edad o in- greso, el investigador puede conformar estratos con categorfas mas © me- nos amplias y equiparer en él momento de la seleccién de los sujetos. 3. Un aspecto que debs considerarse ¢s que cuando se ha utilizado ¢} equi- paramiento en ei momento de la obtencién de Jos datos no es posible ¢s- tudiar el efecto que sobre la enfermedad puede tener el factor por el cual se ha equipatado porque jos dos grupos comparados se encuentran en igualdad de condiciones con respecto 2 aquel. 4. Una vez que se tienen los datos equiparados por un cierto factor, usual- mente no es factible controlar simultaneamente el efecto de otras variables por medio del andlisis estratificado porque la estratificacién por éstas tien- de a destmir ¢] equiparamiento logrado inicialmente por Ja primera varia- ble. En estos casos el andlisis multivariado se presenta como Jn estrategia de eleccién. 5. Aungue, tal como se ha indicado, el equiparamiento presenta ventajas ‘cuando s¢ trata de lograr mayor eficiencia en la informacién que se ha de aoe Equiparamieno/ 163 obtener, su cleccién como estrategia para controlar ¢l efecio de una varia- ble que confunde debe ponderarse detenidamente frente a otras altemativas que pueden ser més ventajosas. El investigador no debe olvidar que el equiparamiento exige esfuer- Zos que pueden ser costosos en. témminos de tiempo y dinero; esfuerzos que, 4 la postre, pueden hacer de éste una sarrategia atin més ineficiente que otras alternativas. En muchas circustancias en lag que se piensa en et equi- Paramiento como primera opcién es mejor tomar mayor numero de obser- ‘Yaciones en forma aleatoria y recurtir a la estratificacion en el andlisis. Referencias bibliogrAficas 1. Cole P. En: Breslow NE. Day NE. Statistical Methods ix Cancer Reseurchol lt The Analysis of Cose-Contol Study. Imemadional Agency for Research in Cancer, Lyon, 1986. 2. Colimba KM. Fudamentor de Epidemiotogta. Madi, Diaz de Santos, 1990. 3 Fleiss IL. Stainioel Methods for Rates and Proportions, 2a &. New York, John Wiley and Sons, 1981, : 4 Kahn HA, Sempos CT. Statistical Methods in Epideminlogy. Oxford University Press, New York, 1989, 5: Kleinbowm DG, Kupper LL, Morgestern H. Epidemiologic Research, Belmont California, Lifetime Lesrning Publicaions, 1982, &. MacMahon B, Pugh T. Epidemiology, Boston, Lite, Brown, and Co., 197, 7, Miettinen O8. The matched puit design in the euse of allor-none responses, Biometrics. 1968: (24): 339.359, 8: Mietinen OS. individual matching with multiple contfols in the ease af ll-or-none respon $£5, Biometrics, 1969; (25): 339.354. 9. Miettinen OS. Matching and design efficiency in retrospective studies. American Journal of Epidemiotogy. 1970 (91): Y11-118, 10. Rothman KJ, Boice JD. Epidemiologic Analysis With a Programmable Calculator, Washington, U.S. Deporimeat of Health Bdscation and Welfare, National Institules of Health, NIH Publication 79-1649. 1979, 11. Worscester J. Matched samples in epidemiologic stadies. Biometrics, 1964: (201: 840. 248, 10 Analisis multi El presente capitulo describe las posibilidaces de aplicacién del méto- do multivariade en Jas investigeciones del drea de la salud en general ¥ en la investigacién epidemiolégica en particular; jlustea la utilizacién de los principales métados multivariados con algunos ejemplos y hace énfasis en Ja costruccién de un modelo predictivo por medio de [a regresi6n logistica muitivariada. m la medida en que se avanza en Ja biisqueda del conocimiento sobre los factores que afectan la salud de los individuos y de los pueblos se hace necesario plantear relaciones multifactoriales en las cuales la enfermedad, como variable dependiente, se explique o se predice por multiples factores © variables independientes. Los fundamentos te6ricos del andlisis multivariado se desarroilaron, de manera particular durante Jos tres primeros decenios del presente sigio 166 /atetodotogta de ba inwestigacitn... bajo el influjo decisivo de los aportes hechos a Ja estadistica por Ronald Fishery Karl Pearson, En un principio, lot modelos multivariades se apli- caron predominantemente a trabajos experimentales propios de Ja investi- gncién agricola, sélo en la segunda guerra mundial se inicia su aplicaci6n a estudios epidemioligicos analfticos. Como trabajos pioneros en la epidemiologia cabe citar aquellos realizados por Corfield en 1962 sobre factores de riesgo para la enferme- dad coronaric (Corfield, 1962), por Truett y colaboradores en 1967 sobre Ia enfermedad coronaria en Is cohorte de Framingham (Truett y colabora- dores, 1967) y por Kieinbaum y colaboradores on 1971 acerca de méhiples factores de rieago para la misma enfermedad en e] estudio de Evans County (Kleinbaum y colaboradores, 1971). ‘La mayoria de los estudios multivariados realizados basta principios del deceaio de Jos sctenta utilizeron la estrategia conocida como anélisis discriminante, hasta cuando Cox lama la aencién sobre las ventajas de la foncién logistica sobre este filtimo (Cox, 1970) y se sefiala su utilidad en muchas siwariones propias de la investigacién cpidemiolégica analiticn (Halperin y colaboradores, 1971; Press y Wilson, 1978). Ya en 1975 la publicacién de wabsjos de investigarién con base en el modelo logistico multivariado es un becho relativamente frecuente y en la actualidad Ja uti- lizaci6n de este modelo en trabajos sobre las relaciones de miltiples fac- tores de riesgo con Ja incidencia de una determinada enfermedad es una estrategia casi rutinaria. El desarrollo de la tecnologia de los computadores que s¢ ha dado en forma paralela al metodolégico ha hecho posible la aplicacién de plan- teamientos teéricos a problemas de naturaleza mmultivariada, lo cual es un impulso tanto para Ja innovaciGn tedrica como para la investigacién apli- cada, A este respecto es importante mencionar, entre otros, algunos progra- mas de computador que han hecho un significative aporte en este sentido: SAS, Statistical Analysis System (SAS Instinte Inc.); SPSS, Statistical Package for the Social Sciences (SPSS Jac.) y BMDP, Biomedical Pro- grants (University of California). Los progamss Epi Info (Dean y colabo- radores, 1994) y True Bpistat (Epistat Services) ofrecen algunas posibilidades para ¢] anflisis multivariado; el programa EGRET, Epidemio- logical Graphics Estimation Testing (Statistics and Epidemiology Research Corporation) permite realizar andlisis multivariados de comin aplicacién en epidemiologia y el STATXACT (Cytel Software Corporation) permite. realizar prucbss no puramétrices exactas. Andlisis muttivariado/ 167... Los métodos estadfsticos mediante los cuales se pueden estudiar los fenémenos desde una perspectiva multivariada son muchos; cabe destacar aquellos que ofrecen posibilidades mds interesantes para ja investigacién epidemiolégica como el andlisis de regresién méltiple, ef andlisis de la vae Tianza, el anilisis discriminante y et andlisis de regresién logistica multiva- Tiada, Si bien cada uno de tales procedimientos tiene usos y caracteristicas que le son propios, Ia esencia comin se encuentra en la regresién miltiple y en el anilisis de la varianza. Aunque un tratamiento detaltado de cstos temas no es el propésito de esta obra, Ja referencia de algunas publicaciones orienta ai lector hacia fuentes més especializadas tales como las de Dixon y Massey (1963), Sne~ decor y Cochran (1967), Armitage (1971), Kerlinger (1973), Kleinbaum y Kupper (1978), Breslow y Day (1980), Draper y Smith (1981), Kleinbaur ¥ colaboradores (1982), Schlesselman (1982), Daniel (1983) y Kahn y Sempos (1989). Anilisis de regresién miltiple Con esta estrategia se evalia el poder predictivo de un conjunto de varia- bles usualmemte continuas X), X2, ..., Xp sobre una variable depenciente continua ¥ de acuerdo con un modelo lineal de ta forma: Yeas BX, + BX, +. + BX, +e, ¢n donde o representa el efecto no explicado por las variables in- cluidas en el modelo 0 saa el término independiente, 8; representa a los Cocficientes de regresiGn o pendiente de las variables independientes inclu. das en el modelo y e, el error aleatorio. La estrategia central de este método consiste en descomponer la va- Tiacién observada en la variable dependiente Y en: 1. La variacién explicada Por cada uno de tos factores considerados como vatiables independtentes X7, X2, .... Xp 0 variacién debida a la regresign, 2. La variacién residual no explicada por tales factores o debida al error (Véase figura 10.1). La descomposicién de la variabilidad observada en la variable de- pendiente Y en los dos componentes mencionados se apoya en la ecuacién fundamental de] andlisis de Tegresion, segtin la cual Ja vatiacién total de Jas n observaciones ¥, alrededor de} promedio total ¥ es igual a la variaci6n de los valores estimados por la linea de Tegresi6n ¥; con respecto al mismo 168 sMetodotogta de ta investigacida.. Figura 10.1 Descomposicién de la variacién de los datos alrededor de la me- dia en 1) la variacién explicada por la regresién y 2) ta variacion residual promedio, 0 variacién explicada, mas la veriacién de los valores observa- dos con respecto a la Ifnea de regresi6n, © variacion residual. . Dicha ecuacién se expresa en términos de sumas de cuadrados de la forma: doy ie Be + ha be Je cual expreaa el hecho fundamental de que Ja suma de cuadrados total SS; es iguat a la suma de cuadrados debida a Ia regresién SS, més le suma de cuadrados residual o debida al error SS SS, = SSp + S5z La razén resultante entre las medias de cuadrados' de las dos fuen- tes de variabilidad total —media de cusdmades debida a la regresién MS, 4 Una media de cvadradon se obtiece 3 a mum de ‘estos entre ef niimero de gracios dé bertad cormapondiente. El minere de pradoc de libertad de 1s mums de coadrados debide a le -egresién caus dado por el uémero do variables independiemes X iaciuiénn en el caodein: el iimero de gredos correspondiente a in toma de comiradot total et igual al mimero de ehscrvaciones menos 1, mécntias que of némsto dr grados correspondieme a la cuma é& candrados residual sc encucnita por diferencin entre kar dot anterioret, - Aniitisis mad tivariads (17.5 Anilisis de varianza En este tipo de anélisis se compara la variacién observada en una variable dependiente continua dentro de cada categoria de las variables inde- pendientes —que suelen ser nominales o discretas— con la variacién de ja misma variable dependiente enire las distintas categorias de las inde- pendientes. Esta comparacién, en términos de medias de cuadrados, da co- mo resultado un valor de la variable probabilistica F de Snedecor que referido a la distribucién que leva dicho nombre permnite probar Iu hipéte- sis mula de In igualdad det efecto estudiado bajo las distintas categorias 0 grupos por medio de una prueba de significacién estadistica. En ef estudio ya citado con respecto al tabaquismo en escolares se encontrd que tanto el nivel socioeconémico de los estudiantes como el sexo de los mismos se encontraban asociados con el grado de impulsividad, tal como se puede spreciar cn los siguientes resultados (Véanse tablas 10.3 y 10.4). Tabla 10.3. Resultados descriptivos de la impulsividad de los escolares por nivel socioecondmico NSE y sexo, Medellin, 1992 Variable Categoria Promedio Desviacian estandar NSE Bajo 4,1080 2,5407 213 Sexo Masculino 43246, 2,4871 114 Sexo Femenino. 3,8586, 2.5912 ce NSE Medio 3,9021 2.1550 235 Sexo Masculino 4,140S 2,3569 127 Sexo Femenina 3,6491 1,8954 4 NSE Alto 44,5066 23218 152 Sem Mascuino “4.6800 2.2966 5 Sexo Femenino 43377 2,3486 7 Total 4,1283 23482 600° Fuente: Londofio iL. Factores relacionades con el consumo de cigarrillos en escolares adolescentes de la ciudad de Medellin. Bolettn de ix Oficina Sanitaria Paname- Feana. 1992; (112): 131-137. 1721 Metodologia de laimvesigecite... Tabla 10.4 Resultados de un andiisis de ta varianza ANOVA para el estudia de la relacién de la impulsividad con el nivel socioecondmico NSE y con el sexo Fuente Suma de Gradosde Mediade =F ® de variacion ‘cuadrados fibertad cuadracios Ffectos principales 63,440 3 21,147 3,878 0,000 NSE 35,053 2 17,527 3.214 0,081 sexo 23,580 1 29,580 5,24 0,020 Interaccién NSESexo 0,550 2 0,275 0,050 0,951 Explicada 63,990 5 12,738 2,347 0,040 Residual 3239,129, 394 5,453 Total 303,118 599 5514 fuente: Londofe JL, Factores relacionados con el consumo de cigarrillos en escolares adolescentes de le Ciudad de Medellin. Bofetin de Ja Oficina Sanitaria Paname- rieana. 1992; (112), 134-137, Como se puede observar en tales resultados, este mismo andlisis permitié descartar la interaccién entre e] nivel socioeconémico y e] sexo con relacién a Ja impulsividad de los adolescentes F = 0,050, P = 0,951. De modo similar, el estudio de las relaciones existentes entre la va- niable dependieme continua consumo de alcohol y las variables inde- pendientes categGricas nivel socioeconémico y sexo puede realizarse también con la ayuda del andlisis de varianzs, el cual permite identificar no s6lo si el consumo de alcohol depende del sexo y del nivel socio- econdimico sino si existe alguna interaccién entre estas dos variables. Un andlisis de varianza puede ser utilizado para evaluar ta hipdtesis estudiada por Patrick y colaboradores en la isla de Ponape (Patrick y co- laboradores, 1974) segiin la cual la discrepancia entre ¢} grado de partici- pacién de sus habitantes en la vida modema, su actitud hacia la misma X, y su preparaciGn para este tipo de vida X, estaban relacionadas con los valores de presién arterial observados en dicha poblacién ¥. ilisis discrimi En esencia, el método conocido como andlisis discriminante evaliia la ca- pscidad que tiene un conjunto de variables independiemtes para predecir un resultado, el cual es siempre una variable dependiente de tipo nominal. La Anstils shivered (173 mejor prediccién se logra al estimar los coeficientes de cegresin de una foncién lineal de la siguiente forma: Peat BAX, + BX, + + BX, © funcién discriminante que maximiza las diferencias observadas en términos de las variables X,, Xz .. X, incluidas en el modelo, La utiliza- cida del método exige que Ja distribucién de las variables independientes incluidas sea normal multivariada, condici6n que no se satisface en aque- {los problemas que incluyen variables independientes de tipo nominal co- munes en la investigaci6n epidemiol6gica. Press y Wilson (1978) proponen una aplicacién interesante del and- lisis discriminante en una situacién en la sual se trata de predecir el cam- bio poblacional, aito o bajo, de diversas regiones de Estados Unidos con base en el ingreso per cdpita X,, la tasa de mortalidad X, la asa de na- talidad X;, el grado de urbanizacién Xz y la localizacién con respecto al mar Xs propios de tales regiones. A partir de la informacién as{ reunida se obtuve la funcién discriminante: Y= -1s84 + 211 X, - 2,55 Xz + 3,22 Xy- 036 X, + 116 X, Cuando se aplicé dicho modelo a una muestra de Giez regiones con el propésito de validario se logr6 predecir correctamente el cambio pobla- cional observado en afios anteriores en ef 68% de los casos. Sin embargo es importante anotar que, debido Principalmente a la distribucién no nor- mal de las variables continuas y a Ja inclusién de dos variables nominales dicotémicas como son el grado de urbanizacién y fa situacin con respecto al suar, la aplicacién de un modelo lineal log{stico logré predecir un resul- tado correcto en la muestra de validacién en un 72% de los casos, lo cual indica una moderada superioridad Part esta situaci6a del’ andlisis de regre- sién logistica sobre el andlisis discriminante. Andlisis multivariado de regresion lineal con base en la fancion logistica En esta estrategia la probabilidad de que se presente la enfermedad Y=0) bajo un conjunto X de factores X), Xo, ..., Xp se define como: i PEK Xp omy XJ = rc ip Xoo BD Pa ee fon 174 j Mevodologia de tainvaxigacibo. expresiGn que, en forma equivalente, se puede escribir como: P(Y=1K) = —_—)_, — 7 “H) D+ exp £0 +} BAN Dicha férmula expresa Ja probabilidad de enfermar bajo un con- junto de miltiples factores en términos de la que s& conoce como fun- cién logistica. ‘ Definida asf ta probsbilidad de enfermar P(Y=1/X), o simplemente P(X}, at tomer logaritmos natureles de Ja medida conocida como disparidad —en inglés: odds*— se obtiene Ja relacién que se conoce con el nombre de logit: : PR) F PX) @ logit de P(X) Cuando se estudia una exposicién miltiple, la expresin anterior es equivalente a: P logit P(X) = in medida que expresa el logaritmo natural de Ja relacién existente en- tre la probabilidad de enfermar bajo factores X,, Xp X, y ta probabilidad de no enfermar con los mismos. Dicha medida al ser expresade en términos de la probebilidad de enfermar segin la expresi6n [1] adopta 1g forma: A logit P(X) = 0 + 2 BX, 12) 3 La medida que mavestea In disparidad odds en el resultado de una variable dicosienica, ta com> 1s eafermedad cuando ésta ee mide comme presente © musenle, et ta razba entre La proporeién de cbaerveciones positivas, 0 sea propercise-de éaitos p y la proporcién de observacionss negatives, proparcitn de fracasos g = J - p- moe Andllsis muittearizcto ¢ 175, — PIXE » PIX RE © ty RD = tn Se ig RY Pex?) =In Toa" Se ~FF xpresién que, segtin el resultado obtenido en {2}. se convierte en una suma de ia forma: : 2 % B(x, xy BI Seguin este resutiado, 2 In RD = & BX! - x) a de tal modo que 1a estimacisn del riesgo relative con unos ciertos valotes de exposicién Xp Xp ones X, con respecto a otros valores Xp Xp cone %, se reduce a estimar los cosficientes B; propios de una regresign lineal que expresa el logit de P(X) segiin [3]5 4 Ea cimartn el riesgo roltivo se puede hacer de mane aproximada Por sneaks ets festimacin de 18 razon dp dispariindes, . 3 ar cca ee ts aren fe eiman et meio del modo de mina versie Cl cuol tos coeficienies de eegresiéa By son aquellos que matin’ lar Protabilidadler de bpredicrtin del madelo de acuerdo con Ia informaciin obtcnica y se encnencar poe medke de un Proceso iterative de apronimasiones sucesivas que Toque caui viens el see dk oo ‘computador, 176 sahetontologto te ix ivestigacion.. Una vez estimados tales coeficientes de regresién s¢ calcula fécil- mente el valor del riesgo relativo, puesto que: RR RD = exp [X, B(X} - X?I Segiin esta oxpresi6n, una vez el cooficiente de regresin B, de una ciezta exposicién dicotémica 0-1 ba sido calculado, la estimacién aproxi- moada del riesgo relative correspondiente —ajustado por las demés varia bles incluidas en el modelo— se obtiene al calcular cl valor de exp(B,): ia diferencia X’ - X° correspondiente al factor X, toma el valor | y jas demas diferencias toman el valor 0. Si junto con Jes estimaciones puntuales de los coeficiemtes de regre- sidn B, se obtienen estimacioner de los correspondientes errores estindar , se pueden calcular los limites de los intervalos de [00(2 - a)% de con- fianza para los B, con el supuesin de que estos se distribuyen normalmen- te, al uiilizar ja expresign: . Bt Ziaciy ‘Una ver obtenidos los limites de tales intervalos se pueden calcular, de manera aproximada, los Ifmites inferior y superior de los intervalos de 100{1 - 0,)% de confianza para jos riesgos relativos propios de cada una de las variables de exposici6n X, por cuanto: lim inf (RR) = expltion inf (B,)7 lim sup (RR) = exptiim sup (B)} Cuando se trata de variables X; categéricas con més de dos niveles, como en e] caso en que se utilizan mAs de dos categorfas para identificar ¢) estado civil, es necesario incluir en el modele un nimero de variables X, igual al mémero de categorias menos 1 Asi, si el estado civil se iden- fifica por medio de tres categorias es necesario incluir en e] modelo dos variables X, la categoria que no figura expresamente en e] modelo hace las veces de punto’ de referencia o exposicién cero, de tal modo que las estimaciones de la asociacién correspondientes a las demés categorias del 6 A cxtss variables se les concce como veriables antficisies 0 diunmy: Andlisis multivariads (177 mismo factor son estimaciones relativas a la exposici6n de referencia (Hos- mer y Lemeshow, 1989). Cuando se trata de una variable continua, tal como el nfimero de cigarrillos fumados at dia o la edad en afios, el tiesgo relative calculado como exp(B,) indica el riesgo asociado con el incremento de una unidad en lal variable y, por tanto, implica el supuesto de que el tiesgo aumenta en forma exponencial de acuerdo con la exposicién. En. aquellas situaciones en las que este supuesto no parezca razonable es mejor categorizar la va- tiable (Rothman, 1986) y tratarla consecuentemente, tal como se ha descri- to anteriormente. Adicionalmente, con un modelo logistico es posible detectar la inter- accién que puede existir entre una exposiciGn estudiada y otros factores segdn un modelo multiplicativo al definir algunos de los X; en términos de la interaecién estudiada. Por ejemplo, si la exposicin en estudio se denota con la letra Ey un cierto factor se denota con Ja letra W, la interaccién EW Se puede estudiar si en el modelo uno de los factores X;, representa el producto Ex W. Con ligeras modificaciones, el modelo antes descrito —due estricta- mente se aplica al andlisis de observaciones obtenidas con un disefio no equiparado, o sea regresiOn logistica incondicional— se puede aplicar a observaciones obtenidas por medio del equiparamiento mediante el uso de ja regresién logistica condicional. La tabla 10.5 presenta algunos de los resultados obtenidos al utilizar un modelo logistico multivariado con el fin de predecir ef consump de cigarrillo por parte de escolares adolescentes (Londofio, 1992). Tales resul- tados permiten apreciar las relaciones mds importantes gue caracterizan a la regresién logistica multivariada las cuales han sido expuestas, Ek modelo resultante se costruyé con la ayuda de un computador a partir de las variables que en un andlisis cstratificado se identificaron como Jas més asociadas al tabaquismo de los escolares y de las imeracciones detectadas por medio del mismo andlisis, En la costruccién del modelo multivariado sélo se incluyeron aquellas variables que en e! modeto lineal logit P{Xj— fueron significativas P < 0,05. En la misma tabla s¢ puede advertir que las diferentes estimeciones de la razén de disparidades ajustada se obtienen al exponenciar los coefi- cientes de regresién B o sea RD, = exp(fi) y que los limites de Jos inter- valos de confianza para las mismas razones se obtienen al exponenciar los limites inferior y superior de los mismos coeficientes B,, tal como se 178 /etodtologfa de la investigactin... Tabla 10.5 Factores relacionados con el consumo de ciganiillo en escolares; resultados de un anslsis de regresién logic rulverada, Mede- lin, 1992 Variable independiente (%) B ES(BP | RDP LLLERD)-LS.{RDI Tebaquismo en amigas 13679 (02387401 251-643 dmputsividad 0,1793 0.4193 1,20 O53 272 ‘baauisme ‘en amigos preferides 0,9137 02175 2,49 1,61 3,82 0.6777 0.2035 197 1,330 (2,92 Fendiniento académico 05198. 02027 «1,68 «1,14 2,49 @ Error estdndar, b Razon de disparidades. CLE yLS.; Bmites inferior y superior de un intervalo de 95% de confianza. Fuente: Londofie JL, Factores relacionadas con el consumo de cigarrillos en escolares adolescentes de la ciudad de Medellin. Bofetin de és Oficina Sanitaria Paname- ricana, 1992; (112): 131-937. indica antes. E} modelo en su conjunto resulté ser altamente signifi- cativo 72, = 98,77; P = 7,07 x 10" y al validar el modclo logrado por la comparacién de la prediccién de! tabaquismo de los escolares con la observada se obtuvo una sensibilided del 63,2% y una especifi- cidad del 72,3%, Consideraciones finales En Jo expuesto anteriormente se pueden apreciar les grandes posibilidades que presenta el andlisis multivariado para éstadiar los fenémenos en los que intervienen méiltiples factores. En particular, se ponen de manifiesto . Jas ventajas que ofrece la regresién logistica multivariada para el estudio de asociaciones etiolégicas con miltiples factores. . Al comparar el andlisis de regresi6n logistica multivariada ‘con el andlisis estratificado se advierte que aunque el primero es un método més complejo y puede presentar mayores dificultades para la interpretacién de Jos resultados obtenidos oftece ventajas importantes tales como la posibi- Jidad de controlar simulténeamente el efecto de multiples variables —lo cual sé dificulta en e} anilisis estratificado cuando el mimero de observa- ciones es relativamente escaso—, mayor facilidad para el estudio de la Anditsismuttivariade | 179 interaccisn y, en.¢l caso de. informacién equiperada, la posibilidad de con- tolar él efecto de factores distintos a aquél por el cual se ha equiparado la informacién. No obstante, se debe considerar que e] empleo de los métodos mul- tivariados exige no sdlo fa debida comprensién de los principios sobre los cuales han sido desarroliados, sino también una posicién cautelosa por par- te del investigador. Con frecuencia, la improvisada costruccién de un mo- defo multivariado sin una previa identificacién de las variables relevantes hecha mediante el empleo de] andlisis estratificado produce serios errores en la interpretacién de los resultados obtenidos, ‘Més adn, en ocasiones, el andlisis estratificado Puede ser la estrate- gia ms recomendable cuando permite identificar de una manera més sim- ple y mis clara relaciones multivariadas que aquellas que pueden lograrse con un andlisis de regresién multivariado. En cualquier caso, debe consi- derarse siempre que el modelo multivariado, el cual se apoya sobre una Tigurosa metodologia cientffica, es también un arte euyo dominio se ad- quiere con una sdlida experiencia. Referencias bibliograficas 1. armiuge P, Statistical Methods in Medical Research. Oxford. Blackwell Scie Publications, 1971, 2. BMDP, University of California, Health Sciences Computing Facilities, Lox Angeles, California, 90024, USA. 3. Breslow NE, Day NE, Statistical Methods in Cancer Research, Vol. I: The a case-controf studies, International Agency for Research on Cuncer, Lyon, 1980. 4. Dean AG ot al. Epi Info, versioi 6.0: a word processing, database, and statistics program for epidemiology on microcomputers. USD, Inc., Siane Mountain, Georgia, 1994. 5. EPISTAT, Epistat Services, 2011 Cup Rock Circle, Richanison, Texas, USA. 6. Conafield J, Joint dependance of risk of coronary heart diseuse on serum cholesterol and systolic blood presswre: a discriminant function analysis, Federal Proceedings. 196%: Q1y 58-61, 7 Cox DR. The Anatysit of Binary Data. London, Metiwes, 1970, 8. Duniel W. Biosiattetics: A Foundation for Anatysis in ike Health Sciences. New Yutk. Joho Wiley and Sons, 1983. 9. Dixon WI, Massey FI. Introduction to Statistical Analysis. Tokyo, McGraw-Hill, 1961. 10. Draper NR. Smith H. Applied Regression Analysis, 2nd ed, New York, John Wiley and Sons, 1981. LL. EGRET, Statistics and Epidemiology Research Corporation, 909 Northeast 43 ni. Stmeci. Suite 202, Seattte, WA 98105, USA. \ sie uf 180 Metodolosin de ia iavestigacién... 12 Halperin M, Blackwelder W, Verter J. Estimation of the Multivariate Logistic Risk Func- tion and Maxinwen Likelihood Appmaches. Journal of Chronic Diseases. 1971; (24%. 125-158, 13. Hosmer D, Lameshow 5. Applied Logistic Regression. New York, John Wiley and Sous, 1989, 14. Kahn HA, Sempos CT. Statistica! Methods in Epidemiology. Oxtord University Press, New York, 1989. 15. Kerlinger FN. Foundations of Behavioral Research, New York, Hoh, Rinchant nd ‘Winston, 1973. 16, Kleinbaum DG, Kupper LL. Applied Regression Analyals and Other Multivariable ‘Methods. Belmont, Celifornia, Wadsworth Publishing Co,, 1978. 17. Kieinbaum DG, Kupper LL, Morgeastem H. Epidemiologic Research. Belmont, Califor- nia, Lifetime Learning Publications, 1982. 38. Kieinbaum DG, Kupper LL, Caseel J, Tyroler H. Multivariate analytis of risk of coronary ‘heart discase in Evans County, Georgia. Archives of Internal Medicine, 1971; (128% 943-948, 19. Londotio JL. Factores relacionados con el consumo de cigarrillos en escolates adolescen- tes de in ciudad de Medellin. Boletin de Ja Oficina Sanitaria Panamericana. 1992, (112); 131-137. 20, Patrick R, Cassel JC, Tyroler HA et al. The Ponape Suidy of the Health Effects of Cul- tural Change. Annual Mecting, Society for Epidemiologic Research, Berkeley, Califor- nia, 1974. 21. Press 3, Wilson S. Choosing berween Logistic Regression and Discriminant Analysis, Journal of the American Statistical Association. 1978; (73): 699-705. 22, Rothman KJ, Modem Eptdemlology. Boston, Littie, Brown, and Co., 1986. 24, SAS Instinute Inc., SAS Circle, Po. Box 8000, Cary, North Caroline, USA. 24, Schissselman JJ. Case-Control Studies. New York, Oxford University Press, 1982. 25, Saedecor GW, Cochran WG, Sraristical Methods. Jawa, The Iowa State University Press, 1967. 26. SPSS, SPSS Inc.,444 N. Michigan Avenus, Chicago, illinois, USA. 27, STATXACT, Cytel Software Corporation, 137 Erie Steet, Cambridge, MA 02139, USA. 28, Truett }, Cornfield I, Kanne] W. A multivariate analysis of the risk of coronary heart dis- case in Framingham. Journal of Chronic Diseases. 1967; (20): 511-524. li E tudios ecolégicos En este capitulo se presenta ta estrategia propia de los diversos estu- dios ecoldgicos, su otitidad en In investigacién epidemiolégica y. por ‘time, sus alcances y limitaciones. ara el estudio de la distribucién de la enfermedad y de sus factores condicionantes los epidemiélogos recurren, en acasiones, a los estudios ecoldgicos en los cuales, a diferencia de Jos estudios Observacionales —de seguimiento 0 de.casos y controles— la unidad de andlisis ¢s um grupo geogréfico o cultural y no un individuo (Kleinbaum y colaboradores, 1982). Por ejemplo, es comtin tomar como unidad de andlisis a un barrio, ung ciudad o un pais; como unided de medida de la exposicién al factor de riesgo, el consumo per cépita de determinado Producto en tal unidad geogréfica, y como medida del efecto, a la tasa anual de incidencia o de mortalidad por determinada causa. 182 /Mstosotogia de lo investigacion. Los estudios ecolégicos son fuente de hipétesis etioldgicas y pes miten, también, el estudio del impacto logrado por programas de inter- vencién comunitaria, ademés hen sido utilizados para probar asociaciones etiolégicas, aunque para tal propésito presentan importan- tes limitaciones metodolégicas que el investigador debe considerar con cl fin de evitar serios errotes en la intexpretacién de sus resultados y en la inferencia derivada de ellos. Estrategia \ ‘La estrategia metodolégica utilizada en un estidio ecolégico depende de su propésito. De acuerdo con este concepto Morgenstern sn 1982 los clasificé en exploratorios, comperativos, de series cronolégicas y mixtos, cada uno de los cuales se desarrolla a continuacién. Estudios exploratorios Con los estudios exploratorios se pretende identificar un patrén en la dis- trilucién geogeifica o cultural de la incidencia o de Ia mortalidad por de~ terminada enfermedad, con e fin de reunir elementos que ‘permitan sogerir una asociacién etiolégica o formular una hipdtesis de igual paturaleza. Con ello no se mide la exposicién a algén factor de riesgo por cuanto slo se srata de observar Ja distribucién espacial de la torbimortalidad. En 1971, Urbach hace notar la variaci6n geogrifica del cAncer de piel diferente ol melanoms (Urbach, 1971) y en 1981, una encuesta del Instituto Nacional de Cancer de Estados Unidos revela una notable diferen- cia en la incidencia de aquél entre Sas poblaciones blanca y negra. de ese pais. Tales estudios fueron, en su momento, un punto de partida importante para la identificacin de la radiacién ultravioleta no ionizante como el prin- cipal factor de riesgo para 1a enfermedad (Scotto y colaboradares, 1982; Fears y Scotto, 1982). Estudios comparativos ” El propésito de estos estudios es el de establecer Ja asociaciGn entre el nivel de exposicin promedio X y la tasa de la enfermedad Y para varios grupos, lo cual se logr por medio de un modelo de regresién Jineal Y = co + AX, en donde ¥ representa la tasa estimada de incidencia co de mortalidad, & estima dicha tasa en ausencia de exposicign a X, 0 sea. el intercept y § estima la pendiente, Ja cual da a conocer Ia variaci6n en fa tasa por cada unidad de.incremento en Ja exposicién X. Estudios ecoldgicas 183 EI modelo de regresién puede incluir otras variables ‘independientes X, de tal modo que se logre estudiar el efecto de multiples factores de exposicién o identificar interacciones existentes entre ellos y controlar el efecta de potenciales variables de confusion. Ademds de los coeficientes e regresién se pueden estimar los coeficientes de correlacin X - ¥.! Es. tudios realizados par Amstrong y Doll en 1975 ¥ por Carroll durante ef mismo afio, con los cuales se pretendia estimar el efecto de diversos fac- tores ambientales y, en particular, de algunos relacionados con la dicta, han sefialado la estecha comelacién positiva y lineal entre el consume de carne y la incidencia de cfncer de colon y entre el aporte total de grasa y la mortalidad por edncer de‘ mama en mujeres de varios paises, tal como se aprecia en la figura 11.1. . De modo similar, Pelayo Correa en 1981 informé acerca de las ‘aso- ciaciones lineales estadfsticamente significativas observadas entre las tasas de mortalided ajustadas por edad de varios paises y diversos indicadores poblacionales por medio de coeficientes de correlacion (Véase tabla 11.1), Segiin el mismo autor, dichas estimaciones, permiten confirma? que [...] las enfermedaces que ticnen una mejor correlacién con indicado- wes dietéticos son los cénceres del intestino, mama y préstata y Ia en- fermedad arterioesclerstica del corazén. Las mismas enfermedades se comelacionan bien con el fndice fisico de calidad de vida y con ef Producto bruto, indicando que ellas son enfermedades de la afluencia. Nuestra tabla resaita Ins corelaciones negatives de las cnformodades bajo estudio con el consumo de arm, mafz y granos, que pudieren Sugetir un papel protector de estos alimentos (Correa, 1981). Series cronolégicas Con este tipo de estudio ecalégico se analiza la relacion existente en una poblacin entre el promedio de exposicién a une o varios factores en el tiempo con la tasa de la enfermedad observada en un momento Posterior; Por ejemplo, el estudio del impacto que sobre una poblacién ha tenido un programa de vacunaciéa, al comparar el comportamiento de la incidencia de la enfermedad antes y después de la ejecucién del programs, 1 Para describir 1a wsocincién existente ete variables contiaiss ae sacle utilizar el coeftciowe de ‘sortalacién de Pearson. Coando se-tram de ectimar lz correlaciGn entre variables ravdidas a nivet ct cooficiente pi (6). 134 7 Metedolosta de la invenigacién... Incunea de cdncw se cxfon pe 900.00 fees & o 8 ‘so de metakdad sputaia por edo por 100.000 Habitats Q 2 oe @ om om HD . ‘Aeon etl ce peaks en sit fgramos Figura 11.1 A) Correlacién entre la inddencia de cancer de colon en varios paises y el consumo de came (Armstrong y Dell, 1975. B) Corre. lacién entre mortalidad por cancer de mama en varios paises y consumo de grasa (Carroll, 1975). Fuente: Doll R, Peto R. Las Causas de! Cancer. Barcelona, Salvat Editores, 1989, p. 15. + > Estudios ecoldgicos ¢ 185, Tabla 11.1 Coeficientes de correlacidn de Pearson significativos P < 0,05: tasas de mortalidad ajustadas por edad por causas selectas y de la talla Y frente al producto bruto, el consume per cdpita de productos dieté- ticos y ia talla de las mujeres ‘Prochicts Tigo Arrax Mate Grancs Cornes Corde He Leche Acche Cer Cake pro Grase Talo ¥ bret one vee Ygrase vere das et (mage ‘rial ms ree) Coen 087 aK O67 98 O34 oA 075 mR O84 O82 O84 049 OM OSE Ara (mares) 055 © O34 SD O65 070 OSE OM O75 O88 0x4 O36 DAA O48 OF O63 Pete OS O58 OB O85 047 auMh Od OST Oa OE 052 O72 USE Estermecod Ce a 259 Oe ora asi O73 - We am. at ae 7 om ono’ 058 gar amt. Ost Fuente: Correa P. Epidemiologic correlations between diet and cancer frequency. Cancer Research, 1981: (41): 3685-3690. ‘También puede estudiarse, por medio de un andlisis de series crono- l6gicas, la asociacién existente entre una exposicién previa y Ja incidencia o la mortalidad que se presenta en un periodo posterior. con una diferencia minima en el tiempo que sea igual al periodo de Intensia de ta exposicién estudiada. Estudios mixtos- En este tipo de estudio se comparan entre sf los cambios observados en la tasa de la enfermedad con respecto a Ia evolucién de la exposicién ca va- rias poblaciones cn un periodo determinado. Por medio de esta esirategia es posible mostrar el impacto de los programas de control de la hiperten- sidn arterial al comparar ¢] comportamiento de la mortalidad por enferme- dad coronaria en el tiempo en varias poblaciones, unas en las cusles se ha Duesto en marcha e] programa y otras en las que no. Uses y limitaciones La relativa facilidad y rapidez con que se puede realizar un estudio ecolé- gico cuando se dispone de registros poblacionales de rutina puede ser atractiva para Ia investigecién epidemiolégica; no obstafite, es preciso que , 186 :Metodologla de ka inveniigacién... el investigador en cpidemiologia tenga-uns clara idea acerca de sus posi- bilidades, de sus alcances y de sus limitaciones. De acuerdo con Piantadosi y colaboradores (1988), la conveniencia de sealizar im estudio ecolégico se presenta en cuatro situaciones: 1. Cuando Ia recolecci6n de ta informacion a partir de individuos ¢s cxce- sivamente cosiosa o demorada, 2. Cuando se desea, una mayor variabilidad en 1a exposicién de tal medo que se pueda estimar mejor la asociaciGn de interés, requisito que suelen sarisfacer 1os indicadores de diversas regiones, tal como sucede con los indices de consumo de diversos alimentos. 3, Cuando se tienen dudas razonables acerca de los datos que pueden ob- tenerse de los individuos, tal como sucede con la medicién de comporta- mientos relacionados con temas tabi, por ejemplo, el consumo de psicoactivos. 4, Cuando el interés central del estudio esti relacionado con fendmenos colectivos, tal come ocurre con aquellos que evalian Ja respuesta poblacio- nai ante programas preventivos de intervenci6n en Ta comunidad. No obstante, en la interpretaci6n de los resultados obtenidos se debe considerar que las relaciones observadas con base en indicadores colectivos no suelen ser las mismas que se presentan individnalmente y que, al igno- rar tat hecho, se comete con frecuencia el error conocido come la falacia ecolégica (Robinson, 1950). ‘Como un ejemplo de este error es bien conocida la interpretacién ofrecida por el sociélogo francés Emile Durkheim quien relacioné el sui- cidio con la religién que profesaban los habitantes de la antigua Prusta, al encontrar mayores tasas de éste en aguellas provincias mayoritartamente protestantes (Durkheim, 1951); pero se ha objetado, con razén, que 105 suicidas podian ser sujetos que profesaban otras religiones menos predomi- nantes. Es posible demostrar més formalmente que los coeficientes de re- gresién y de correlacion obtenidos con base en medidas colectivas sue- Jen diferir de los mismos coeficientes cuando s¢ estiman con ‘base en tnediciones individuales (Morgenstern, 1982; Piantadosi y colaborado- res, 1988), lo cual se presenta como consecuentia de dos efectos (Mor- genstcm, 1982): . 1. Uno debido a la agrupacion parque excluye lz posibilidad de, ineluir | mediciones individuales aceres de variables que pueden estar relacionadas con la enfermedad, bien sean explicatives o de confusién. Esmlios scolégicos/ 187 2. Ouo efecto que se preseata por la filia de control de vatiables de confusién 10 incluidas en el modelo de asociacién definido por el tnvestigadar con base ‘on mediciones colectivas 0 modelo ecolégico. A manera de ejemplo, diferea- cias en la composicién.etfirea de los gTupos comparados en el modelo eco- légico pudieran explicar parcialmente fa asociacién observada entre una determinada exposicién y la mortalidad por determinada causa, Aunque, en principio, estas potenciales variables de confusién en los estudios ecolégices pueden ser identificadas por el investigador, 1a infor- macién correspondiente suele ser dificil de obtener, Un ejemplo que itustra la distorsign que sufren las medidas de asociacién como consecuencia de los efectos de agrupacién y de! confusi6n antes mencionados ha sido pro- Puesto por Piantadosi y colaboradores en 1988, quienes bacen notar las diferencias que presentan los coeficientes de correlacién rho y los de re- Bresion lineal B los cuales estiman la asociacién existente entre diversas factores cuando sc analiza la misma informacién en cuatro formas de agru- Pacion diferentes: individual, condado, estado o rogién, Los datos fueron Tomados por los autores de la Segunda encuesta nacional de salud y nutri- cién NHANES IT realizada en Estados Unidos entre 1976 y 1980 (Véase tabla 11.2). Tabla 11.2 Coeficientes de correlacién y de regresion Para asocaciones selec- tas, para cyatro niveles de agregacién Variables. individual Condado Estado Regidn (n = 13820} (n= 6a) {n= 34) (a6) rho bata tho beta rho beta. tho beta Peroiaia 0,502 0,821 0,320 0,384 0.272 0345 0,442 0318 » Edachmasa corporal 0,329 0,084 0,532 0.081 0,637 0,105 0,853 0,108 Proteina ross 0,785 O08BE 711 0.775 0858 0,620 0,140 0,072 fagresa stiucaciin 0,281 0,361 0,603 0705 0,669 0,801 0,992 1,354 Reza singreso 0,179 1.403 0.076 0345" 9,089 4,202 0,656 6,768 Raza “educaciin 0,131 41,277 0.054 9,291 015 0,091 0596 -8,390 Fuente: National Center ‘or Heath Statitls. Plan and Operation of the Second National Health andl Nutrition Examination Survey 1976-1980. ‘Washington, D.C.: US Go- vernment Printing Office, 1981. 188 / Metodoloyia de la iavestigaci¢n.— En Ja tabla 11.2 se observan diferencias importantes que tienen a ser mayores cuando se comparan las medidas obienidas individualmente wen ae que se obsenen en cl maximo nivel de agregncion, 14 repiGn: Por ejemplo, para Ia asociacién ingreso y educacién st obtienen coeficientes de comelacién a nivel individual y regional de 0,291 y 0.992 Tespectivamente y para la asociaciGn proteina y grasa st cbtienen coeficientes de correla- Cin que no s6lo son diferentes cn magnitud, sido que 2° de signe apues- to: 0.785 y -0,140. Algo similar puede afiemarse euando se comparan los coeficientes de regresién. ‘Ademds de Jos problemas citades, los estudios ecoligicos que se rea tizan con el fin de sustentar hipétsis etiolégices suelen presentar dificul- tades adicionales, entre las cuales cabe destacar Jas siguientes (Stavraky, 1, $i bien es pasible encontrar datos colectivos con respecto & Yas tasas actuales de ta enfermedad estudiada —como registfos mmunicipales, regio- nales.o nacionales— €5 més dificil obtener dates colectivos acerca de una exposiciGn presentada varios sflos atrés, para permitir un jntervalo igual al periodo de latencia correspondicate. 2. En algunas cireustancias, las divisiones geogréficas para las eusles es posible obtener {nformacién acerca de las tasas de la enfermedad no coin- rear om aguellas Areas de las qpe existe informacién eon respoctO @ Ta exposicién, casos ¢n Jos cuales el investigador se ve obligado a combinat ios datos disponibles de tal forma que el resultado obtenido no representa Jo que realmente sucede en términos de Ja asoctaci6n estudiads, con el peligro de etectar finaimente asociaciones espurias o de obtener estima- ciones nulas cuando las asociaciones estudiadas sf existen. 3, La estrecha conrelacién que suele existir entre miitples variables ambicn- Fo er eousnsemente anakizadns ea ese tipo de estadiot—, 0 sea la cclinea, ded hopin dsingoir Ios efecios anjbufles a unas y a otms Ax, sein él atmo cado de la asociacién ent dieta y eéicer presentado por Corea: {..] las comelaciones ne] ives de las enfermedades bajo estudio con tl consumo de arroz, mafe y granos pueden sugeris un pape! protertor se catns slimnentos, La excesiva ingesta de proteina animal (principelmes- te carne) en tes sociedad eflventex ee da simuitinearente on tna dis varia en ef consumo de wegetaics Exio hace imposible por ot vamante determiner sie] efeor “protector” del aaroz, el malz, y lof Fr severe por woeiéa direca o set simplemente uns manifestacion dct Garo causado por el excesivo consumo de came (Correa, 1981). Exatios ecoligicos / 189 De modo similar, en el estudio ecolégica sobre dieta y edncer de colon realizado por Drasar ¢ Irving (1973) no fue posible scparar los efec- tos del consumo de grasa total y de protefna animal debido a la estrecha correlacién existente entre ambas variables. También en un estudio qealiza- do en Jamaica, aunque los autores encucntran ascciada la seroprevalencia del HTLV-1 con medidas ecolégicas tales como Ja altura sobre el nivel det nar, la precipitacién pluvial, la produecién agricola, ia densidad poblacio- nal y diversas medidas del grado de urbanizacién, ellos anotan que las variables independientes Pueden ser sustitutas de otras variables tales como el estrato sociceconémico, Ia lactencia materna, las conductas o los hdbitos 4. Con frecuencia ocurre que, si bien se encuentra informacién con fespec- to a las variables en estudio, ‘no es posible reuair informaci6n relacionada con e! comportamiento de variables de confuusi6n importantes. En el mismo estudio de Drasar ¢ Irving (1973) no fue posible aislar el.éfecto de la dicta de otros factores relacionados con las condiciones de vida, como la conta- minacién del aire y del agua, debido a la falta de informacién sobre los mismos (Stavraky, 1976), Consideraciones finales De las consideraciones antes expuestas se derivan importantes conclusiones Con respecto a las posibilidades que presentan los estudios ecolégicos para la investigacién epidemiolégica. En primer iugar, es importante considerar que la mera descripcién de ies tasas de morbilidad 0 de monalidad para determinadia causa por localiza, observaciones individuales en estudios epidemiolégioos mas directos. Sin embargo, con In debida cauiela que imponen les limitaciones ya mencionadas, los estudios ecéidgicas pueden ser tiles en, Ins fases preli- minares de la conformacién de hipotesis ctiokégicas, Particularmente, cuan- do por razones econémicas 0 de tiempo ellos se presentan como opciones favorables frente a otras Posibilidades, A este Tespecto conviene considerar Ja observacién que acompafia a la figura 11.1 Correspondiente al estudio realizado por Armstrong y Doll (1975) y citsdo por Doll y Peto (1989); 1901 uetodetogia de la investigaciin... Baws sorprendentes correlaciones ajustadas por edad no necesoriameme pogierea que la came o alge tipo de'gram sean determinentes raAyores de chncer de colon o de mama, pero sf sugierert que existen determina tes manipulables de estos cfinceres (Armstrong y Dell, 1975). Por ditimo, es importante seBalar la posibilidad que ofrecen los es- udios ecolégicos pura evaluar el efecto de programas de intervenciGn oo” munitaria, tales como aquellos que pretenden modificar e| estilo de vida de as poblaciones con respecto a ln dieta y a la actividad fisica, entre otros, y para identificar grupos humanos que poedan estar expussios & factores de riesgo colectivos. A exte titimo tipo pertenece una cncuesta serologics recientemente realizada en México que, por medio de la comparaciGn de las tasas de infeccién por denguc con indicadores poblacionales tales como Ja temperatura mediana en la estaciéa de Huvias y la proporcién de viviendas con deficientes condiciones de proteccién, permitié clasifi- car las comunidades como de alto, moderado o bajo riesgo (Koopman y colaboradores, 1994). Referencias bibliograficas 1. Ammstrong B, Doll R, Bnvirenmerta! factors and cancer incidense and mortality i at Townt countries, with special reference to dietary prectites. International Journal af Cancer. 1975; (15): 617-431. 2. Carroll KK. Experimental evidence of dietary factors mc! hormonedependent cancers. Cancer Research. 1975; (35): 3374-3383. 3, Comaa P, Epidemiologic correlations berwoos diet and cancer frequency. Cancer Re- ‘search, 1981; (41): 3685-3690. 4. DoW R, Peto R. Las causas def cincer, Barcelona, Salvet Ediuores, 1989. 5. Drasar BS, Irving D., Environmental factors end cancer of the colon and breast. Brits Journal of Cancer. 1973; (27): 167-172. 6, Durkheim E. Sucide: A Suidy in Seeiology. New York, Free Press, 1951. 7. Fears TR, Scoto J. Changes in akin eancer morbidity berweeen 1971-72 y 1977-78. Jow- inal of the National Cancer Institute. 1982; (69): 365-370. &, Kleinbanm DG, Kupper LL, Morgenstern H. Epidemiologic Research, Belmont, Califor- nig, Lifetime Learning Publications, 1982, @. Koopman 35, Prevots DR, Vasa-Marin MA of al. Determinants and predicts of dengue ection in Mexico. Americas Journal af Epidemiology. 1991; (133): 1168-1178, 10, Maloeey EM, Margy EL, Figueroa JP e al. Human T-lympboropi virws ype 1 HTLV) seroprevalence in Jamaica. 1], Geographic and ecologic ‘determinants, American Jour- nal of Epidemiology. 991; (133): 1525-1134, 11. Morgenstem H. Uses of ecologic anelysis jn epidemiologic research. American Journal of Public Healsh, 1982; (72): 1336-1344. no Esmdios eooldgicos 1193 12, National Center for Health Statistics. Plan and operation of the Second National Health ‘and Nutrition Examination Survey 1976-1980. Washingtoa, D.C: US Government Printing Office, 1981. DHHS publication No. PHS 81 - 1317. 13. Pinntadosi §, Byar D, Green S. The ccological fallacy. American Journal of Epidemio- logy. 1988; (127): 893-904, 14, Robinson WS. Eoologicat correlations and the behaviour of individusls. American Socio logy Review. 1950; (1 5} 351-357. 15, Scotta J, Fears TR, Fraumeni JF. Solar Radiation, in: Schottenfeld 1D, Fraumeni JF Jr. eds. Cancer Epidemiology and Prevention. Philadelphia, W. B. Saunders Co., 1982, 16. Stavraky KM, The role of ecologic analysis in studies of the etiology of disease: a discussion with reference to large bowel cancer. Journal of Chronic Diseases. \976; (29): 435-444, 17. Urbach F, Geographic Distribution of Skin Cancer, Journal of Surgical Oncology. 1971; (3):219-234, 12 udios de supervivencia En el presente capitulo se describe la manera como se esmudia la su- Pervivencia de un grupo de sujetos a partir de un momento de interés ~vomo el diagnéstico de una enfermedat— por medio de la tabla de supervivencia, estrategia fundamental de lo que de modo mds general 30 conoce como anflisis de supervivencia; se presenta, ademfs, el mé- todo de Kaplan Meier el cual permaite estimar la supervivencia con un mimero reducido de pacientes, se-describe el uétodo de Mantel y Hoenszel para comparar Ja supervivencia de dos grupos de personas y se muestra el modelo de Cox para describir y comparar la superviven- cig de acueedo con milltiples variables; por diltimo, se discote In me- dicién de la mortalided en téminoe de wios de vida potencialmente perdidos y se presenta Ja medida de la carga de Ia enfermedad por medio de los afios de vida saludable perdidos. 1947 Metodologio de la arvestinaciCn... Como parte del quehacer de la investigacién cpidemiolégica surge et ocasionés la necesidad de estudiar la supervivencia de ciertos gmupos-de. personas en el tiempo 2 partir de algén evento inicial, que suele ser el momento en gue s¢ diagnostica una enfermedad. Por ejemplo, un epide- midlogo puede estar interesado en estudiar Ia supervivencia de los pacien- tes con diagnéstico de efncer de estimago y, ain més, comparar la supervivencia de aquellos sometidos a un determinado tratamiento con la de otro grupo con el mismo diagnéstico pero con un tratamiento diferente. ‘A continuacién se describe el método central de un conjunto de téc- nicas relacionadas con el estudio de Ja supervivencia, el método actuarial. Método actuarial Las diferentes téenicas asociadas con el estudio de Ja supervivencia estén relacionades de una u otra manera con el método actuarial el cual ha sido utilizado tradicionalmente en Ja investigaciGn demografica para la costruc- cidn de tables de vida (Berkson y Gage, 1950; Cutler y Ederer, 1958; BF veback, 1958). Por medio de dicho método se costruye en epidemiclogia Jn tabla de supervivencia que tient Como objetivo central Ja estimacién de. dos medidas: 1, La probabilidad que tiene un paciente de sobrevivir un cierto tiempo a partir del momento del diagnéstico, conocida como probabilidad acumula- da de supervivencia, S,. 2 La probabilidad que tiene un pacientes de morix en algin momento, dado que ha sobrevivido hasta entonces, ae! Fi conjunto de valores de S, define la funcién de supervivencia Ss) y el conjunto de valores de q, 0 probabilidad de morir 2 Jo largo de! tiem- po, la denominada funcidn de petigro l(t) (Geban, 1969). Tabla de supervivencia Con el fin de ilustrar la estrategia que sé utiliza para costruir una tabla de supervivencia s¢ propone el siguiente ejemplo: - Para estudiar la supervivencia de pacientes con diagnéstico de céncer de cuello uterino sometidas a cirugia radical durante Jos quince dias si- 1 hung: el wéiodo agul propoets bace énfais en In saperviveacin —esto es, se considers 1 ang cine evenin final éete podiers ter aplicado » ctuscionct mis gencrales t16s EOmno 1 aa ch de una esis coronaria s pirtc det eomento dete implamaciin de it mmscapases, a fecuperaci6a dc los pacientcs soretidot x determinado Watemiculo, EB OOS, Estudios de supervivencia! E95 ~ guientes al diagn6stico se observé en una clf{nica de tamores a un grupo de 300 pacientes durante cinco aiios; el estudio se inicié en 1989 y se terming:en 1993, En la tabla 12.1 se presentan las observaciones obtenidas en dicho estudio. Tabla 12.1. Informacién iniciel para la costruccién de una tabla de Superviven- cla con base en la observacion de 300 pacientes con diagndstico de cancer del cuello uterino _ Afto de ingresa. Alia Vives Muertes—“Péndidas ‘Muertes__Vivas al por atta” terminar causa of estudio 1989 1989 oo a 4 i . 1990 34 6 1 o 1991 27 4 0 1 1902 2 2 1 0 1993 19 1 a o 18 1990 * 1990 67 B 3 2 1991 39 a 2 1 3092 28 3 1 0 1993 24 3 o 1 20 1991 1991 53 18, 3 0 1992 32 5 1 o 1993 26 2 o 1 23 1992 1992 64 2 5 2 1993 35 7 2 1 25 1993 1993 56 19 2 1 34 Para interpretar la informacién es necesario considerar que la tabla presenta la evolucién anual de las pacientes que fucron admitidas al esnidio somo sujetos de observacién en cada uno de los cinco afios: durante 1989 ingresaron 60 pacientes con didgnostice de céncer de cuctlo uterino de las cuales sc murieron 2! durante el mismo fio, se perdieron 4 porque se ignora si sobreviven o han fallecido —debido a que se interrumpié el con- tacto por cambio de residencia o emigracién— y.1 murié a causa de un infarto del miocardio. Asf, de las pacientes que ingresaron al estudio en 196 / Hesodologta de 1a iivestigacion. 1989 quedaron 34 vivas al principio de 1990 e iniciaron su segundo perio- do de vida » partir del momento del diagnéetico, tiempo durante et cual murieron 6 y se perdid 1. . De esta forma se procede aiio por afio hasta advertir que de las 60 pacientes que entraron al estudio cn 1989 adlo diecinueve aportaron infor- macién en 1993, afio durante el cual mun6 una paciente de cancer de cuc- lo werino y, al momento dpl cierre ‘del extudio, quedaban dieciocho quienes con certeza se encontraban vivas. Debe advertise que estas dltimas ‘no han sobrevivido los cinco afios completos sino que, por haber ingresado al estudio en algén momento durante 1989, eu supervivencia a partir del diagnéstico es de cinco afios incompletos. De manera similar se interpreta ta informacién correspondiente. a las pacientes que ingresaron al estudio en cada uno de los cuatro afios siguientes a 1989. Para efectos del tiempo de supervivencia, ¢ independientemente del aio calendario en e] que se admiten al estudio, todes las pacientes que ingresaron durante cada uno dé los cinco afios contribuyen con informacién alo que sucede en el primer afio de supervivencia a partir del momento del diagnéstico. Se tiene asi un total de 300 pacientes que ingreseron vivas al primer periodo (60 + 67 + 53 + 644 56)? Del mismo modo, se observa que durante el primer aiio de seguimiento mmiieron 103 pa- cientes (21 + 23 + 18 + 22 + 19), se perdieron Waeseerse 2), murieron por una causa distinta 2 la estudiada 6 pacientes (1 + 2+ 0 +2 + 2) y 34 paciemes que ingresaron durante 1993 —y que continian vivas al momento del cierre del esmdio— contribuyeron cada una con un afio incompleto de supervivencia. ‘De manera similar se obtiene la informacié6n correspondiente a lo que sucede durante el segundo periodo: ingresuron vivas a éste 140 pacien- tes (34 4 39 + 32 + 35), quienes eran las mismas qué restaban de las 300 pacientes iniciales después de descontar Jas muertes por céneer de cucllo wtering, las pérdidas, las muertes por otra causa y Jas que permanecian vivas al terminer el estudio pero que no alcanzaron a aportar un afio com- pleto al seguimiento. Durante el segundo periodo de observacién 26 pa- cientes murieron de cancer de cuello-merino (6 + 8 + 5 + 7) ése perdieron del seguimiento (7+ 2+] + 2)y2 mautieron por otra causa 2 Emel ejempio citado se estadin In eupervivencia en afos, pero de mumera mis general et period 4e mupervivencia pusiera estar definido por cmiquier unklad de tempo, segin Jo acuaseje la saturaleza de! fendmeno eatudiado. an Esnudios de supervivescia/ 197 (0 + 2 +.0 + I), durante 1992. ingresaron 25 pacientes las cuales conti- nuaron vivas al final del estudio y contribuyeron de una manera incompleta ala supervivencia del segundo periodo. Para obtener la informacién propia del tercero, cuarto y quinto pe- Tiodos a partir del momento del diagnéstico se provede de igual forma y se obtiene la informacidn correspondiente a las cinco primeras colummnas de Ia tabla 12.23 _ Tabla 12.2. Tabla de supervivencia correspondiente a la chservacidn de 300 Pacientes con céncer de cuello uterine Perode Vis Muar Pls Muar Vivas_ Deng Proba- Probe. Proba- alin tes dias tes por af ter minador — balidad bilidac —bilided reso ote. mings efectinn de morir cond} © acum causa’ ebeste conada fede de io de super. super vivencia vivercia x. cum oo ox Sx 1 30001317, 34 271,5 0379. 0621 0,821 2 440 we 6 | 2 3123S 217.789 oa a a 9 1 2 27 68001320868 0825 4 46 5 4 1 200380 04a 08870, 384 5 2 1 9 0 38 10,0 0,100 9080328. Las restantes colummas de Ja tabla de supervivencia, /',, 4, Be ¥ §, se obtienen de Ja manera siguiente: indica ¢] denominador efectivo de la probabilidad de morir en cada periodo. No todos los pacientes que figuran como vivos al principo de cada aiio /, estén expuestos al riesgo de morir durante el trascurso del periodo por cuanto algunos de ellos se pierden u,, otros mueren por ona causa distinta i, y otros s6lo aportan una observacién parcial W,i por tal motivo, ¢l denominador efectivo de la probabilidad de morir se obtiene ut restar dei total de sujetos vivos al inicio de cada periodo i, la mitad de la suma de las pérdidas u,, las musrtes por otra causa i, y los gue terminan vivos al final del estudio y que aportan informacion parcial w,. Con esta consideraciGn se puede suponer que cada paciente perteneciente a una de 3 Se utiliza 1a ootacisn convencional wmmaia del inglés: | alive —vivor—, d: deaths —muertes—. 1: unknown —desconccides—, i!:intercurrent —eoncomitanter—, w: withdrawn —sustraidis. 198 Mevodologia de la beveatigncin... estas wes categorfas contribuye el denominador no con una unidad sino con Ja mitad: de este modo, I’, = I, - 1/2(u, + i, + w,)- Para el primer periodo, por ejemplo, P, = 300 - 1/2(17 + 6 + 34) = 271,5. gz: indica la probabilidad de moris en cada poriodo y se obtiene al dividir el ndmero de mvertes d, por el denominador efective I’, Asi, en el primer periode 9, = 203/271.5 = 0,379. pg muestra Ja probabilidad de sobrevivir 2 un determinade periodo dado que se ba ingyesado vivo al mismo y se conoce, por tanto, como 1a probabilidad condicionada de supervivencia, Su valor sc obtiene como el complemento de la probabilidad de morir, 0 sea, P, aI-@, Segén cl ejemplo ilustrado, una paciente con eéncer de cuello ute- rina presenta una probabilidad estimada de sobrevivir al primer afio a partir del diagndstico B; = 1 - 0,379 = 0,621 y una probabilidad de sobrevivir al tercer afio dado que ha sobrevivido al segundo afi, P3 = I - 0,132 = 0,868. §,: muestra la probabilidad acumuslada de supervivencia es decir, 1a probabilidad que tiene una persona de sobrevivir un cierto mimero de pe~ siodos a partir del momento del diagnéstico, la cual se obtiene como el producto de las probubilidades condicionadas de supervivencia correspon- dicntes a los periodos J hasta x, o sea el producto py x... X Px que corres- ponde al producto de ias fracciones sucesivas del ndmero de personas que sobreviven al terminar cada periodo. Ast, la probabilidad estimada que te- ne una paciente de sobrevivir al terver afio a partir del momento del diag- néstico de céncer de cuello uterina €s Sy = 0,621 x 0,789 + 0,868 = 0,425, o sea cl 42,5%, ‘Una vez estimados los valores sucesivos de g, y de S, se costruyen con ellos, respectivamente, 1a funcién de peligro A(t} que expresa la pro- babilidad que tiene una persona de morir en determinado momento dado que ha sobrevivido hasta entonces* y la funcién de supervivencia S(t) que indica la probabilidad de sobrevivir en el tiempo a partir del momento del diagnéstico. Las figuras 12.1 y 12,2 muesoran tales funciones, estimadas de acuerdo con los valores obtenidos en el ejemplo. Sobre ¢] gréfico de la funcién estimada de supervivencia o curva de supervivencia se ubican los cuattiles y. en particular, la mediana que indica ef momento a partir del cual sobreviven la mitad de las pacientes desde el 4 Ala foncién de peligro también te Je somoce como fuerza de 1a monalided, Esmudtos de supervivenciat 199 oa 82 O1 o 1 2 ano? 4 5 ee eee Figura 12.1 Funcion de peligro que estima el riesgo de morir can base en la observacién de 300 pacientes con cancer de cuelle uterine 3 4,0) 0,8] 06 04 02 nee Figura 12.2 Funcién de supervivencia que estima la supervivenda al diagnéstico de cancer de cuello uterino con base en la observacin de 300 pa Gentes momento del diagnéstico, En general, la mediana del tiempo de supervi- vencia es una medida preferible a la media puesto que la distribucion del tiempo de supervivencia en muchas situnciones es notablemente sesgada hacia uno de los extremos, tal como sucede en 1a supervivencia a un infarto de miocardio que es menor en las primeras horas que siguen al evento. Con ef fin de calcular intervalos de 400(1 - o)% de confianza para Jos valores de S$, se recurre a la expresion usual $+ Z, 96 en la que S, denota la estimacién puntual de la supervivencia acumulada obtenida en 200/ Mesodalogia de ta invertiscetén... cada periodo Z).y9 #1 valor que toma la variable normal esténdar Z en ef percentil J - a/2 y 6 ef valor del error estiindar de S,. Una estimaci6n de este dltimo se obtiens asi: . Le a= 8% en donde la sumatorie cubre los valores comprendidos entre ¢] pri- mer periodo y aquél de imerés.* . De acuerdo con el ejemplo se tiene que el error esténdar de $, para el tercer periodo se estima asf: 2 Gos = Shp a = 0,425 [- 9,379 oa 0132 j= 00347 2915-103 * 123,5-26 * C809 De este modo, los limites de un intervale de 90% de confianza para la probabilidad acumulada de supervivencia en el tercer perioda S, se ob- tienen al calcular !2 expresin: 0,425 + 1,64 (0,0347) con la cua} se tienen finalmente los valores 0,3681 y 0,4819. El método aprovecha toda ie informacién disponible con mizas al jncremento de Ja precisién de las estimaciones de q, y de S, incluso la de aquellos pacientes que se pierden, se mueren por olras causas 0 tienen un seguimiento incompleto. No obstante ser telativamente simple, la correcta costmccién de una tabla de supervivencia exige el cumplimiento de los siguientes requisitos: 1, La supervivencia de los pacientes perdidos durante ¢] seguimiento debe ser igual a ta de aquellos observados durante todo el tiempo del estudio lo cual es dificil de garantizar porque, debido a la pérdida en el seguiraiento 5 Pate focibiar gu edicuo en in prstica, qulzés sce coavenients aliciooar uma columns 1 table fe mapervivarois bajo el encabezamienio ge APs de) y boner es total de la pamatoria af final de dichs color. Estudios de sepervivercia/201 de log mismaos, se desconoce su evolucion en el tiempo; ademés dicha pér. dida puede estar asociada con un determinado resultado como la muerte, Es importante entonces que Ja fraccién de pérdidas se reduzca al minimo, tanto que algunos autores sugieren qué no debe exceder del 10% del total de pacientes incluidos en el estudio. 2. La supervivencia de los pacientes que ingresan al estudio en un momen- to relativamente proximo a su terminacién debe ser igual a la de aquellos que ingresan en un momento Prdximo a su iniciacién, lo cual no se cumple en aquellos casos en los cuales la Supervivencia se modifica aprecia- blemente durante el periodo de la realizacién de] estudio como consecuen- cia de avances en el tratamiento o cambios en el nivel socioeconémico de los pacientes, entre otras causas, 3. Las estimaciones de S, y de q, obtenidas a partir de un reducido ndmero de pacientes estén sujetas, como es de esperar, a una variabilidad aleatoria Considerable, o sea a un elevado error estdindar. Estimaciones obtenidas con base en un ndmaero de pacientes comprendido entre 10 y 50 se deben in. lerpretar con cautela y aquellas obtenidas a partir de un nimero inferior a diez se deben ignorar, Método de Kaplan Meier Cuando se cuenta con un reducido mimero de observaciones es aconsejable optimizar la informacién de tal modo que se pueden obtener estimaciones atin mds precisas que les logradas con el método actuarial antes descrito: Con este propdsito se presenta el método de Kaplan Meier que, aunque esencialmente utiliza la misma éstrategia del método actuarial, permite ¢s- ‘tudiar la presentacién de fenémenas que suceden en periodos cortos y toma Ja informacion de cada sujeto de observacién en vez de agruparla por pe- tiodos (Kaplan y Meier, 1958). Se tiene asi una serie de n observaciones acerca de] tiempo de se- Suimiento a partir del diagnéstico de cada uno de los » pacientes; cada una corresponde a un paciente que puede morir 0 Presenta un tiempo de segui- Taiento incompleto,® Estas observaciones se pueden ordenar’en forma as- cendente de scuerdo con el tiempo de observacién de tal modo que se § Aduelas obeervaciones cormespondientes 4 fas rueroe recben ct aomiive de mo censurades Porive spartan informacién completa: loa deruis —pérfdas, uameriea por Dea cease. 0 vivos al Gérmino del estudio— reciben el nombre de centuredas, 202s Metadologio ds la imvestigacion.. pueda asignar ¢! valor re cada una de elas segin el orden que Je corres- ponda en In serie (r = J, 2, 3, Ademés, si en Ja serie ordenada se denota por n, ¢! iimero de indi- ‘viduos que se encuentran en riesgo de morir al principio de cada intervalo de tiempo y se registra Ia condiciéa de censura de cada obsorvacién —d = 0 para aquelias observaciones censuradas y d = J para las no censuradas— se dispone entonces le informacién de la manera siguiente: i mM om2 0 m3 Ma dy dz d3 0. do De este’ modo, Ja probabilidad q, de que ocurra una muerte en el intervalo i —-en el cua) al momento de su iniciacién bay n; sujetos en tiesgo de morir y se presenta una muerte si la observacién es no censurada 0 no ocurre ninguna si cs censurada— se estiina como d/n, Asi, la proba- bilidad de morir toma el valor J/n, si la observacién es no censurada, 0 toma el valor 0 si es censurada. La probabilidad de sobrevivir al intervalo i, dado que se ha sobrevi- vide hasta el momento de su iniciacién, adopta entonces la forma J - d; /n; con lo cual se tiene que la probabilidad acumulada de supervivencia en el momento 1 se puede calcular como el producto de las probabllidades con- dicionadas de supervivencia de la manera descrita para el mérodo actuarial: 8, = (Dod fry) (1d tg) on (Ind, Ay) = tf (I-d, fn) En esta expresién, las observaciones censuradas no modifican €] pro- ducto puesto que en tales casos d; = 0 y cl factor correspondiente asume entonces e] valor /. Hasta ¢] momento se ha supsesto que los tiempos de observacién 1; son diferentes, es decir, que no hay empates; cuando se presentan varies tiempos de observaciéa iguales se procede como sigue: 1, Si ef empate se presenta entre algunas observaciones censuradas y otras no censuradas se asiime que éstas ocurren inmediatamente antes que aquéllas. 2. Si el empate ocurre entre observaciones no censuradas se puede con- siderar que jas muertes d; que suceden en ¢] mismo tiempo 1; 8€ pre- sentan con una diferencia mfnima en él tiempo, con lo cual cada una Lo. Estudios de speriveniad 203 de las observaciones coniribuye a Ja funcién de supervivencia con el factor 1 +. dJn, correspondiente; no obstante, como estimacién de la superviven- cia acumulada S; se suele tomar la menor de tas estimacioues resultantes Para el mismo tiempo 1, como criterio cor a : 3.-Si.el empate se presenta entre observaciones censuradas, no existe difi- cultad para el cdiculo de la funcién de Supervivencia puesto que para cilas la fraccién d/p, adopta una valor igual a 0 y, consecuentemente, el Tespec- tivo factor en Ja fancién de Supervivencia toma el valor 7. Se tiene asf que para las situaciones en las cuales se presentan em- Pates se puede incluir un término 8 con valor J Sila observacién corres- Pondiente a! tiempo i es no censurada y con valor 0 si es consurada. De esta manera se tiene en forma Seneral que: n % $= Wed, ny" Con el fin de calcular un intervalo de 100(? - 0)% de confianza iC Para el valor de la probabilidad acumulada de Supervivencia S, se puede utilizar la distribucién normal que, de manera aproximada, presentan Jas estimaciones del logaritmo natural de 5, con una varianza estimada igual a 2d) Ain{n; - di] (Miller y colaboradores, 1981). De este modo, se tine que: rysy = 05, + Z, aaSiys,y = 882g MZ Amin, - a con lo cual se pueden obtener los limites del intervalo de confianza para la probabilidad acurnulada de supervivencia S, al exponenciar los va- lores resultantes de calcular tal expresion. El ejemplo hipotético propuesto a continuacién ilustra la aplicacién del miétodo de Kaplan Meier para estimar la funcién de supervivencia propia d= ta cardiopatia congénita con base on observaciones correspondientes a la mortalidad observada en 10 nitios a partir del nacimiento. De ellos, 2 mueren Por otra causa a los 6 y a los 15 meses —observaciones ceasuracias— y los Testantes Mueren como consecusncia de 1a cardiopatia en un lapso compren- dido entre Ios 2 y los 34 meses —observaciones no censuradas, 204 ¢ Mewodologia de ta inwestigacion... La informacion obtenida sc presenta en la tabla 12.3, junto con la probabilidad de morir q, la probabilidad condicionada de sobrevivir p; y la yrobebilidad acumulada de supervivencia S,, Tabla 12.3 Informacién para la estimacion de la supervivencia por el método de Kaplan Meier con base en la sobrevida' de diez nifios con car diopatia congénita, a partir de su nacimiento é 7 ti a P % 0 10 - : : 1,000 2 10 1 vio 910 0.900 5 9 1 v9 a) 0,800 o ° 9 7 v7 6/7 0,686 W 6 1 V6 5/6 0,571 15° 0 6 4 1 vs 3/4 0,429 20 3 1 V3 2/3 0,286 2 2 1 ft ap 0,143 cad 1 a 1 o 0,000 Con los valores estimados para 5; se obtiene entonces la funcién de supervivencia estimada que se presenta en Ja figura 12.3. 3 40 0,8] 96 04 0 5 10 5 25 300035 Mes 2° Figura 12.3. Funcién de supervivencia que estima la supervivencia al momento del diagnéstico de una cardiopatia congénita con base en la ob- servaciOn de diez neonates 206s Metodotogia de ia ivestigacise.. misma hipétesis nivla, la varianza del ntimero de defunciones propias del propo Jen el estaio ae obtiene como mf; ~ min, Ln. Finalmente, la prueba de significacion sc basa on el valor obtenido en la varinble chi cuadrado a partir de la informaci6n parcial que se obticne en Jos k estratos: : [Obs A Bap AP FE Obs a, SE af Vara VarA { Ba. Entra nl? ee Samra =m (m- De? Dicho procedimiento se conoce como prueba de Mantel Haenszel (Mantel y Haenszel, 1959) y au aplicacién se itustra con el siguiente cjemplo. Para probar Ia hip6tesis de qe un cierto tratamiento alternativo para Ja levcemia en nifios Ty es mejor que otro tratamiento Ty se ha observado In supervivencia a partir del momento de] diagnéstico de dos grupos con formados aleatoriamente. En e] primero uno de Jos nifios muri6 por otra causa -a Jos 50 meses 2 partir del diagudstico y en el segundo grupo, el estado de uno de ellos se desconocié a partir de los 77 meses. ‘Cs informaciGn correspondiente a la supcrvivencia de los nifios ob- servados y aguélla necesaria para Ja prueba de hip6tesis por medio de Ja prueba de Mantel Haenszel s¢ presenta ex Ja tabla 12.5. Entonces se tiene asf que: Boss a,- Sem a Caer Spnknn oP _ gph ee 1 a Var A & mera 1 myn, - Dn = 708? = 0,991, P > 0,15, prusba de una cola, resuliade que no permite confirmar Ja hipétesis de Ja superioridad del segundo tratamiento frente al primero. 208 / Mesedologia de ia investigation... Estudios multivariados: el modelo de Cox Algunas investigaciones tienen como objetivo estudiar el efecto de mflti- ples variables sobre la supervivencia © €] prondstico de ciertos grupos de pacientes. En 1972 Cox propuso un modelo multivariado para estudiar la supervivencia, conocido también como e] modelo de riesgos proporciona- des, el cual es amplismente. utilizado en estudios epidemolégicos de este tipo (Cox, 1972). modelo define la funcién peligro que muestra ¢] tiesgo instanté- neo de falla —saucrte, recurrencia, reactivacign u oro evento similar— de una persona i en el tiempo /A{1)] como el producto de la funcién de peli- gro de una persona de la poblacién general fh{1)] por una funcién expo- nencial del tipo: (PR + Bhat + BM El modelo presenta entonces 1a fanci6n de peligro del individuo i de la forma, fs) BBs + Baka + + Baty het) la cual expresa los riesgos correspondientes a diferentes variables x como igualmente proporcional a Ag(t). ‘De esta manera, es evidente que el riesgo propio de una persona ¢s una funciGn exponencial de los valores que ella presenta en las variables X, o variables explicativas, que pueden ser factores de riesgo, variables de confusién o interacciones entre factores como Ja edad, el sexo, el estrato socioeconémico, el némero de infarios previos o el niémero de lesiones Dicho modelo permite expresar el riesgo relative de una persona i que presenta determinados valores en las variables explicativas X co- mo: WA Bhan + Batis +m + By hd?) expresién que permite aprecier que el riesgo telativo de una persona icon una exposicién mula 0 para todas las variables X es 1, puesto que en se Esnudios de supervivancia/ 209 tal caso RR = hfiVig(1) =e? = 1, resultado que sefiala la conveniencia de este modelo para cstimar el riesgo relativo, En términos de logaritmos se tiene que: In RR, = In Thi tiilO)] © BX, + BXa + = + By de tal forma que la estimaci6n del riesgo relativo correspondiente 8 diferentes variables de exposicién X con base en un conjunto de ob- servaciones se reduce a estimar los coeficientes de regresiGn B de una funci6n lineal, lo cual se suele hacer por el métode conocido como de . Méxima verosimilitud que se describe en algunos textos de estadistica (Armitage, 1971; Freund, 1971) y para Jo cual se requiere el use de un computador. A manera de ilustraci6n, supéngase que se quiere estudiar el efec- to de dos tratamientos X,:1,0 y de la edad Xz-afos en Ja supervivencia con un control del efecto del estraio socilaeconémico 4G:4,0 con base en un conjunto de observaciones realizadas en un grupo de pacientes que, de mado aleatorio, se asignaron a dos Srupos de tratamiento: medica- mento 1 y placebo 0. En tal caso, ell riesgo relativo con respect a la poblacién general de Una persona que recibe ¢} medicamento, con 50 anos de edad ¥ que perte- nece a cualquier estrato sociceconémico es: BR = ity wg Bld + BASD) + BX, aft) De modo similar, el riesgo relativo de una Persona que recibe el placebo, con 20 afios de edad Y que pertenece a cualquier estrato socio econémico es: Rr = JD By) + By20) + B5xy ET riesgo relativo de Ia primera pertona con respecto a la segunda es, entonces, la razdin resultante de los dos riesges relativos asf calculados, o sea: BY) + By50) + Bx, RRs fo oe BAO) + B20) + BX, 210 /Aderodotogh debe investigation. Jo cual indica que, en igualdad de condiciones con respecio al estrato socioeconémico, el riesgo relative del primer individuo frente ai segundo es igual a: e Bytat + By50-20) et (30) Este altima resultado permite apreciar que el modelo de Cox supone que Jos riesgos relatives correspondientes a exposiciones muiltiptes resultan de Ja multiplicaciéa de Jos riesgos relatives individuales: * 0) * RRy = By(t-0) : ¢ 150-20) ber = RR, Hiya (ety pe PAP a QB PH En Ja interpreteciém de este resultado se debe considerar que el coeficieme fiz, de una variable de tipo continuo como la edad, indica la variacién en el riesgo relativo correspondiente a una unidad de cambio en la variable, por ejemplo ua sfio. Como ilustraci6n, considérense los siguientes resultados obtenidos en un estudio de la asociacién entre algunas variables y la mortalidad ob- servada con posterioridad al diagndstico de céncer de endometrio, realizado por Schwartzbaum y colaboradores (1987) y citado por Kan y Sempos “(1989) (Véase tabla 12.6). De acuerdo con teles hallazgos, el uso de estrogenos es un factor pro- tector’ puesto que RR = «7/8 = 0,4876, el riesgo relativo de una paciente de 65 afios con respecto a otra de 35 afios se estima como 75206555) = 1,3854 y de una paciente con c&ncer grado TI con respecto a otra con céncer grado 1 como 97° = 2.0257. De la misma forma, el riesgo relative de una paciente de 65 aiios y con céncer grado IIT con respecto a otra de 55 afios y con cdncer grado I. ajustado por Jas demés variables, se estima como: Brae £465-55) + Ay 2-0) 0,0326{10) + 0,7059 a 6 10a) + =281 Remmlos de supervivencie (212 Tabla 12.6 Resultados de un estudio muttivariado acerca de la supervivencia de un grupo de pacientes con cancer de endometrio Variable B Cidiges Uso de estrégenos 0.7182 1=sh0=n0 Edad 0,0326 aos Céneer grad It 0.6176" 1*si0=no Cancer grado Ill 0,7059" Ts 0=n0 “Con respecto a crcer grado |, Fuente: Kahn HA, Sempos CT. Statistical Methods in Epidemiology. New York, Oxtord University Press. 1989, p, 197, Este mismo resultado so obtiene al muhiplicar los dos riesgos rela- tivos estimados individualmente, ; Ry x Ry = 1.3854 x 2.0257 = 2,87 . Jo cual refleja el supuesto implicito en el modelo de Cax ya mencio- nado, segiin el cual los riesgos relatives correspondientes al efecto de mil- tiples variables se obticnen como el Producto de los riesgos relativos individuales 0 modelo multiplicativo. *Otras aplicaciones més particulares del modelo de Cox junto con otros modelos multivariados para el estudio de la supervivencia pueden encontrarse en obras especializadas, tales como las de Armitage y Gehan (1974), Bukley (1979), Cox y Oakes (1984), Kalbfleisch y Prentice (1980), Lee (1980) y Miller y colaboradores (1981). Adios de vida potencialmente perdidos Una’ medida complementaria de las tasas de mortalidad —que muestran el fiesgo de morir— y de aigin modo relacionada con la esperanza de vida es la que indica el mimero de afios de vida potencialmente perdidos en una Poblacién como consecuencia de las defunciones ocurridas Por distintas casas. La medici6n de la mortalidad en términos de afios de vida potencial- mente perdidos fue propuesta inicialmente por Dublin y Lotka en 1936 y Pposteriormente utilizada por Dempsey en un andlisis de ja mortalidad por 212 /Mewwdologia de ta trvestigacion... wiberculosis en 1947. En el Ghimo decenio ha tecibido particular atencién por cuanto ella permite establecer e] impacto que tienen las distintas causas de muerte sobre la poblacidn y evaluzr, asi, ci efecto de las acciones en salud que tienden a disminuir-la mortalidad por diferentes causas (Romeder y McWhinnie, 1977; Cavazos y colaboradores, 1989; Gardner y Sanborn, 1990; Wigle y colaboradores 1990). Aunque existen varios métodoe para caleular el niimero de afos de ‘vida potencialmente perdidos, todos ellos tienen como base comin la edad a Ja cual ocurre la muerte y el nimero de ellas en una edad determinada (Gardner y Sanborn, 1990). Uno de los métodos més utilizados para cal- cular aquellos en una poblacién por una determinada causa consisie en 5u- amar los afios perdides por todas las pereonas fallecidas con respecto al promedio de vida de la poblacién o esperanza de vida al nacer. Asi, si una persona mnere debido a una enfermedad infecciosa a los 5 afios cuando la esperanza de vide de la poblacién es de 65 afios, ella habré perdido 60 afios potenciales de vida por tal causa, El total acumulado de afios para todas las personas que mueren por determinada causa se ob- tiene al sumar los datos individusles y e) promedio, al dividir dicho total por el miimero de personas de la poblacién, De este moda, el niimero total de afios de vida potencialmente per- didos AVPP en una poblacién por determinada causa de muerte se obtiene al calcular la expresién: AVeP = Sie - x) mt en donde e® denota la esperanza de vida de la poblacién al momento de nacer, x;, 1a edad a la que ocumé cada muerte y la sumatoria ce obtiene pera todas las muertes presentadas por tal causa. ‘Cunndo las muertes han sido agrapadas en & intervalos de edad con n, movertes ocurridas en cada uno y con valores centales x,, €] total de afos de vida potencialrnente perdidos se obtiene entonces como: AVPP = 5 nf - x) La utilidad de esta medida se puede apreciar en Ja tabla 12.7, la cual presenta los resultados de un estudio de Ja mortalidad observada en el Dis- trito Federal de México en’ 1985 por lesiones accidentales ¢ intencionales a ~ Estudios de supervinercia #213 Tabla 12.7 Afios de vida Potencialmente perdidos AVPP por las cirico principa- les causas de muerte ¥ Por grupo de edad. México, Distrito Fede ral, 1985 Edad ‘Enh aperata tesiones academe ‘Turnores. Ent, infecdoses End. aparsto. creufatorio les « fomclanaies Beste Meertes VPP Muerte: AVP Ahurtes AVBP Adcertas AVP Muse aye 0 95 ize 78 SUF 2012901348 asBc6 odin 1a4 17 1054 140 E680 452790324 200HB tk 1116 sais 40 2200 216 11770 12g 137 7588341870 15224 100 4500908 40860 147 65151. suas 75975 am 03 705 749 e215 195 GBD 195 eas 376 13460 Sam 373 95 512 12800 ames a9 sas 799 19900 ‘Sas 773 11595 370555027 sans a56 sag 088 15825 BS aGs 1420 7100 3251625 1096 SHB 548 ara 1088 5440 Tora 3021, 49007 3296 112531 2506 4747s 208 140804 3537 65072 Tasax to 30,21 32,96 25,86 3284 35,37 Fuente: ‘Har MC. Mortaidad por asiones accidantaes ¢ intencionales en & Dstt Fede. tal de 1970 a 19R6. Salud Pubica de Mérico, 1990; (32): 402. Los datos se agnu. Paton en intervales de edad més amplics, se asamnié una esperanza de vids al hacer de 65 atios y se estimd la pobiacion en diez millones de habitantes, (Eijar, 1990). En dicha tabla se puede apreciar que, aunque la tasa de mor- talided por enfermedades infecciosas es similar a las de otras causas, ef mayor nimero de afios de vida potencialmente perdidos se debe a elas y Supera apreciablemente al total de aiios perdidos Por las defunciones debi- das a las enfermedades del Aparato circulatorio y a los mmores. Este resul- tado se debe, en buena Parte, al elevado nimero de defunciones por dicha causa durante e] primer afio, a diferencia de las muertes debidas a los u- Mores que Ocurren, en una mayor proporcién, en edades mAs a: . Asf, el 61,93% del total de afics de vide potencialmente perdidos por en- fermedaces infecciosas se debe a Jas defunciones ocurrides en menores de win ao, en tanto que. tal porcentaje en ta mortalidad por tumores es tan sclo Gel 2.72%. Si se atiende al impacto de la mortalided en términos de aoc 214, Metodplogia de ta investigactén. de vida perdidos en ver del ndmero de musrtes ocurridas, los resultados seflalan al grupo de caférmedades infecciosas como una prioridad para los programas de prevencién. Cuando se realizan comparaciones entre diversas poblaciones con base en esta medida se debe considerar que cl Mmite méximo de edad o esperanza de vida de las poblaciones comparadas debe ser igual; por otra parte, las comparaciones realizadas entre poblaciones con un nimero de habitantes diferente se deben realizar’sobre indicadores relativos tales como el promedio de afios de vida perdidos por habitante o por cada cien mil. Ajios de vida saludable perdides Desde hace algunos afios se han propuesto indicadores que dan a conocer los aios de vida saludable perdidos no aélo por la mortalidad prematura, sino también por Ja discapacidad (Sullivan, 1966, 1981); la primera aplica- cién de estos indices en una poblacién se realizé en Ghana en 1981 (Ghana Health Assessment Proyect Team) pero sélo en los Gitimos ires afios el Banco Mundial ha aplicado tal indicador para medir Ia carga de la enfer- medad en‘ Jas diferentes regiones del mundo (Banco Mundial, 1993). Murray (1994) y Murray y Lopez (1994) presentan una descripeién, Getallada de 1a metodologia que consiste, en esencia, en el céleulo de los afios de vida saludable AVISA perdidos por mortalidad prematura y por discapacidad, Los primeros se obtienen al calcular log afios de vida poten- cialmente perdidos de acuerdo con la esperanza de vide pare cada edad segiin une tabla de vida tinica y los afios de vida saludable perdidos por discapacidad se obtienen al ponderar los ailos durante los cuales Iss perso- nas permanecen enfermas por la severidad de ta enfermedad, tanto éstos como aquellos se ajustan por el.valor relativo de Ja edad en la cual se presenta el evento —con un peso mayor pata los eventos ocurridos alrede- dor de los 25 afios— y por una tasa de actualizacién predefinida que re- fleja la preferencia social por los beneficios en el presente. Se anticipa que ésta medida ha de ser un istremento importante para la evaluaci6n de la carga que imponen sobre una regiGn las diferentes causas de morialidad y de morbilidad, para el establecimiento de polfticas de prevencién y de atencién en salud y para la asignacién de recursos. Referencias bibliograficas 1. Armbage P. Statistical Methods in Medical Research. London, Blackwell Scientific Publicstions, 1971. - Exnedion de supervivercias 215 2. Armitage P. Gehan EA. Statistical methods for the identification and use of prognostic fac- tors. International Journal af Cancer, 1974; (13): 16-36. 3. Banco Mundial, informe sobre ef Desarrollo Mundial 1993: Invertir en Salud. Banco ‘Mundial, Washington, D.C, 1993, 4. Berkton J. Gage RP. Calculation of survival mics for cancer, Proceedings of the Staff Meetings of the Mayo Clinde, 1950; (25): 270-286, 5. Buckley J, James I, Linear regression with censored data, Biometrika, 1979: (66): 429-436. 6. Cavazos N, del Rio A. Iaznia JA et al. Atos de vida potenciatmente perdidos: sa utilidad en el andlisis de a mortalidad en México. Salad Piiblica de Mézica. 1989. 31):610-624, 7. Cox DR. The analysis of exponentially distributed life-times with 1wo types of faitures. Jounal of de Royat Statistical Soctery, Series B.1939;{21y. 411-421. §. Cox DR. Some applications of exponentially ondered scores, Journat of the Royal Statist cal Sociery, Series B. 1964; (26): 103-110, $. Cox DR. Regression modeis and life tables. Journal of the Royul Statistical Sociery, Series ‘B.1972; (34): 187-202, 10. Cox DR, Onkes Bh. Analysis of Survival Dara, New York, Capman and Hall, Co., 1984, 11. Catler $1, Bieter F. Maxim wilizatioa of the life table method in analizing survival. Journal of Chronic Diseases. 1958; (8).-699-712. 12, Dempsey M. Decline in tuberculosis: the death rate fatls to tell the ‘entire story, American Review of Tuberculosis. 1947; (86): 2, 13. Dublin LI, Lothe AJ, Length of Life. New Y ork, Ronald Press, 1926, 14 Elveback L, Estimation of survivorship in chronic disease: the actuarial method, Journal ofthe American Statistical Aseeciation, 195%; (53): 420-440, 15. Fleiss IL, Statistical Methods for Raies and Proportions, 2nd ed. New Yérk., John Wiley and Sons, 1981." 16, Freund JB, Mathematical Statistics, 2nd ed. London, Prentice Hall, 1971. 17. Gardaes JW, Sanborn JS. Years of potential life lost. What does it meamure? Epidemi- logy, 1990; (1): 322-329. 18. Gehan EA. A generalized Wilcoxon test for comparing arbitrarily singly-censored samples. Biometrika. 1965: (52): 203-223, 19, Geban EA. Estimating survival functions from the life table, Journal of Chronic Dis- eases, 1969; (21): 629644. 20. Ghana Health Assessment Project Team. A quantitative method of assesing the heoith im- fact of different dissises in less developed countries. International Joumal uf Epidemiology. 1981; (10): 73-80. 21. Gusrrero R, Gonmilez. CL, Medina E. Epidemiologia. México. Addison-Wesley Ibero- americana, 1986, 22. Hifjar MC. Martalidad por leslones accidentales e inteocionsies en cl Distrito Federal de 1970 2 1986. Salud Pablica de México, 1990; (32). 395-404. 23. Kain HA, Sempos CT. Statistical Methods in Epidemiology, New York, Oxford Univer. sity Press, 1989, 216 /idetodologia de la investigacién.. 24, Kalbfleisch JD, Prentice RL. The Statistical Analysis of Fallure-Time Data. New York, John Wiley and Sons, 1980. 25, Kaplan EL, Meier P. Non~peremetric estimation from incomplete observations. Jowrnal of the American Statistical Association. 1958; (53): 457-481. 26, Lee EP. Statistical Methods for Survival Dota Analysis. Belmont, California, Lifetime ‘Learning Publications, 1980. 27, Mantel N, Evaluation of survival data and two new rank onder statistics arsing in its con- sSderations, Concer Chemoterapy Reports. 1966; (503: 163-170, 28. Mantel N, Hacnszel W. Statistical arpeets of the analyzis of dats from sudies of disease. Journal of the Nationa! Cancer Institute. 1959; (22): 719-748, 29, Murray C. Quantifying the burden of disease: the techoical basis for disability adjusted life years. Bulletin of the World Health Organizmion. 1994; (72), 429-445. . 30, Murray C, Lopez A. Quantifying disability: data, methods, and remits, Bulletin af the World Health Organization, 1994; (72): 31. Miller RG, Gong G, Muoz A. Survival Analysis. New York, Jahn Wiley and Sons, 1981. 32, Peto R, Peto J. Asymptotically efficient rank inveriant procadures. Journal af the Royal Statistical Soctety, Series A. 1972; (135): 185-207. : 33, Romeder JM, McWhinaie JR, Potential years of life lost between ayes | and 70: an in- dicator of premature raortality for health planning, international Journal of epidemio- logy. 197%, (6): 143-151, 34, Schwarzbaum JA, Hulka BS, Fowler WC et al. The influence of exogenons estrogen ust ‘on survival after agnosis of endometrial cancer. American Joumal of Epidemiology. YOB7; (126): BS1-859. 35, Wigle DT, Mao Y, Semenciw R et al, Premature deaths in Canatia: impact, tends and op- portunities of prevention. Canadian Journal of Public Health. 1990: (81): 376-381. 38, Sullivan DF. Conceptual problems in developing an index of health. US Public Health Service, Publication Series No. 1000. Vital and Heslth Statisiks Serica 2, No. 17. Nav tional Cemer for Health Statistics, 1966. 37. Sullivan DF. A single index of mortality and morbidity. Health Reports. 1971; (86): 347-354. 13 Tamaiio de la muestra Este capitulo presenta, en uns primera parte, los Procedimientos que Penmiten calcular el tamaiio muestral para aquellos estudios epidemio- gicos de caricter descriptivo en los que se desea estimar una propor- ciéo oun promedio poblacional y, en wna segunda parte, los Procedimientos utilizados para calcalar el tamaio muestral para los es- tudios anaifticos que estiman la asociacién existente entre ‘uaa exposi- cidn y un efecto; luego sc discuten Jas implicaciones que sobre la detenuinacién det tamario mwestral tienen ios diferentes condicioan- mientos y se ilustran las diversas situaciones can ejemplos. Determinacién del tamaiio muestral en los estudios descriptivos ™ los estudios epidemiclégicos de tipo descriptivo el investigador desea tomar un muestra aleatoria que produzea una estimacién con un valor 218 /Maodologia de ia irventigocion... aproximado al pardmetro que caracteriza a la poblaci6n de interés;' no obs- tante una aproximacién que puede ser razonable para determinado props- sito puede no serlo para otro o la que puede ser razonable para un investigador puede no satisfacer a otro. Por ejemplo, con el propésito de proponer un plan general de salud pera una regiGn, puede parecer suficien- te estimar le proporcién de prevalencia de malaria con un error méximo tolerable del 5% alrededor del verdadero valor, sin embargo con el propé- sito de caleular los servicios de aiencién médica que en la misma region se deben dedicar a Ja atencién de este problema puede ser necesario que tal cstimacién sca més precisa y que, como méximo, se pueda tolcrer un error del 2% en ia estimmacién muestral obtenida. Para satisfacer las condi- ciones més exigentes de la segunda situacién.el tamaiio de Ja mnestra debe ser mayor. Esta argumentacién implica que el investigador debe tener una idea previa de la precisidn descada co la cstimacién en términos del _ error méximo tolerable e, o sea de la diferencia méxima admisible entre el pardmetro estimado y le estimacién obtenida en la muestra, diferencia que se debe al azar; ademds deben considerarse otros elementos como son: 1. La variabilidad de la variable observada, que # su vez determina la dispersién de los resultados muestreles alrededor del pardmetro de interés y que se mide por Ja varianza. Esta es una caracterfstica propia de la va- Tiable y se acepta como condicién. 2, La confianza que el investigador desea tener en los resultados que ha de obtener. Para lograr un determinado grado de precisiGn en 1a estimaciéa sobre una variable que presenta una diversidad de valores se debe tomar una muestra més numerosa que aquélla que s¢ requiere para hacer una estima- cién acerca de una variable con valores muy homégeneos. Por ejemplo, si todos los individuos de una comunidad tienen el mismo valor en la con- centracién de hemoglobina, con el fin-de estimar el promedio de tal varia- ble basta’ con tomar al azar una sola persona; pero si ios valores en la concentracién de hemoglobina son muy hetérogeneos para hacer tal esti- maci6a con cierta precisién se requiere una muestra mds numerosa, 3 Bimtos esudics descriptives, a diferencia de Jos estudio mnalticas, no se prueba ana hipdtesis de smociacida; se trata de deacribir 1a coagnitod con la cua) se present una enfetnedad © wn foctor de riage. Yamato de lamuestras 219 No cbstante, puesto que en la mayorfa de las situaciones sc desconoce el valor de la varianza de la variable estdiada, el investigador debe suponerlo con base'en informaciones adicionales como encuestas realizedas en poblacio- nes similares; en ausencia de Sstas debe hacer varios supuestos hipotéticas y decidir entre las distintas altemativas la que considere mejor. EI segundo de ios elementos mencionades estd relacionado con la confianza que ¢l investigador desea depositar en 1a estimacién lograda con Tespecto a lo cual es claro que, si él, para una precisién deseada y bajo cierta varianza de la. variable conocida o supuesta, desea tener una gran confianza en que la estimacién lograda sea cierta debe tomar una muestra telativamente numerasa, En términos estadfsticos, la confianza que se de- posita cn una estimaciGn esta relactonada con Ia amplitud del intervalo ob- tenido para ella, es decir con la precisién de que goza; por ejemplo un investigador puede tener una alta confianza en que ef valor que trata de estimar esté contenido en un cierto intervalo si éste cs mary amplio o im- Preciso, pero teadré menos confianza en que éste contenga la medida que se uata de estimar si el intervalo es pequefio o més preciso. De esta manera, los intervalos amplios, aunque suclen ser de alta confianza, son muy imprecisos porque indican que el valor ce la medida Que se trata de estimar se-enicuentra entre dos limites tay distantes, mien- tras que los intervalos estyechos son més precisos pero la confianza de que la medida que se wata de estimar se encuentre en ellos es mer; 0 sea que Para lograr una mayor precisién en la estimacién el investigador debe sa- crificar confianza. Por ejemplo, con determinado tamanio muestral se puede obtener un intervalo con unos limites de 12 y 25%, en el cual el invosti- gador puede afirmar con un 99% de confianza que se encuentra la preva~ lencia de hipenensién propia de cierta poblacién; pero si se calcula un intervalo del 80% de confianza con Kimites del 15 y del 22%, se obtiene asf un intervalo més preciso aunque se tiene menos confianza en que con- tenga el valor de Ja prevalencia de hipertensién de la poblacién de interés. La confianza deseada la define el investigador, con lo cual se deter- minan implicttamente los valores Zaz ¥ Zyo2 que limitan el intervalo de Ja distribucién normal en el cual se Producen el 100(7 - 01% de Las esti- maciones muestrales que se obtienen por azar. De lo dicho hasta aquf se 2 Seguin Jn torte estadtmica, las estimecionea muesirales de una propercién 0 de un procedio ‘Poblacional que te obtienen de mmestras relativemente grandes, —como regia general: n > 30— ‘5 Gletribuyen aproximndemente de acuerdo con una dishibuciéa norm, \ 220/ Mevodolosta de ta irvestipacin... deduce que cuando se trata de hacer una estimacién, un tamafio muestra) suficiente es squel necesario para lograr una precisin y una confianza de- finidas por el investigador, con unz varianza que es caracteristica de la variable tratada. Las relaciones existentes entre la precision y Ja confisinza’ descadas por el investigador, la variabilidad propia de la variable y el tamaiio mues- twal requerido en teles condiciones se expresan por medio de relaciones TMateméticas que permiten, por ejemplo, calcular e] tamafio muestral sufi- ciente dados determinados requerimicntos de precisién y de confianza por parte ded investigador y con una determinads varianza, supnesta 0 conoci- da, tal como se expone a continuacién. Proporciones Cuando se trata de calcular-el tamaiio muestral n suficiente para estimar ‘una caracieristica que se presenta en una poblacién de tamafio N con una Froporcién m por medio de un intervalo de 700(J - 0()% de confianza, con un méximo error tolerabls e y con una proporcién aproximada o supuesta , 8¢ utiliza la férmula: N 2,00 P (1 - ?) IN - E) + Bian Bl - pl Puesto que-e] valor de-n se desconoce, e! valor de p suele tomarse Ge una informacién ya conocida, tal como ia aportada por estudios re- lncionades con el tema o por encuestas piloto hechas con este propésito; en ausencia de ella, es aconstjable sustituir el valor de p por 0,50 valor que, segin determinados valores de N, Zyo y ¢, da lugar al mayor lamafio muestral requerido para la estimacién de m. Cuando se trata de poblaciones infinitas’ la férmula antes citada se puede aproximar a la exprésion: Zina P {1 - P) e 2 Aquéilas en las que in inclusién de un elemento en la muestra pricticamente no altera el marco Inuctral rere; ls poblacioet mumersas we pueden contderar por ani como peblaciones infinitas. ‘Taranto de ta rmuncira #22) Por ejemplo, los tamaiios muestrales requeridos para estimar una Proporcién en una poblacién de 20,000 sujetos segdn la primera expresién, con una confianza del 95%, p = 0,50 y errores m4ximos tolerables de! 10, 5 y 2% sexfan respectivamente de 96,380 y 2262 unidades; al. utilizar la segunda expresiGn, se obtienen tamatios muestrales de 96, 384 y 2401 uni- dades, valores similares a los calculados con Ja primera, ‘Si la expresién indicada para el célculo de! tamaiio muesiral en una poblaci6n infinita se utiliza para calculer los tamafios muestrales requeridos bajo una confianza del 95% segin diferentes valores del m4ximo error 10- lerable y p se obtienen los resultados de la tabla 13.1. Tabla 13.1 Tamaho musstral requerido para estimar una proporcién poblado- nal con el 95% de conflanza con diferentes vaiores para la propor- clon asurmida p y del maximo error tolerable P ‘Wedximo error tolerable 0,10 0,05 0,02 os 96 364 2400 06004 92 368 2300 0,7.00,3 ar 324 2025 0,800.2 62 246 1525 Fuente: Mueller J, Schuessler K, Cosiner H. Statistical Reasoning in Sociology. doston, Houghton Miffiin Ca., 1971, p. 391. En dicha tabla se advierte cOmo aumenta ef tamaiio muestral a me- dida que se quiere obtener una estimacién mds precisa dado un determina- do valor de p, 0 sea para uaa determinada varianza, o 2 medida que el valor de p se aproxima 2 0,5 dado un determinado error mAximo permisible. Por ejemplo, un investigador estd interesado en estimar Ia proporeién de hipertensos existentes en una poblaciGn de 2000 empleados de una em- Presa con una confianza del 95% y con un m4ximo error tolerable del 4%, Por encuestas previas sc sabe que cerca del 18% de ta poblacién adulta de la regiGn es hipertensa. El tamaiio muestral necesario para satisfacer tales especificaciones se obticne al caicular la expresién que se debe utilizar en el caso de poblaciones finitas: ne — Frond tl -P) 2 IN- 1) + Foag pip) 222 /Mtetodoiogia de ia investigacién.. 2002, 95710I81082) ay (Oa IDI9) + (1.96)(0,t60082) con lo cual se obtiene que, para satisfacer las exigencias impuestas por el investigadar, se deben seleccionar aleatoriamente 302 emplcados. Promedios Cuando el investigador desea estimar cl promedio de una variable que tiene una deaviacién estindar en una poblacién de tamafic NV, con una confian- za de 100{i - o)%, y con wn error ‘maximo tolerable e, ¢] tamafio muesiral se obtiene al calenlar la expresi6n: ne Non “ZIN- 1) + Zyge En la mayoria de las situaciones el valor de o se desconoce y «l investigador debe tecurrir a estimaciones hechas en estudios previos o en up pequefio estudio piloto realizado con el fin de estimar su valor, de tal modo que se pueda determinar el tamaiio muestral requerido. Por ejemplo, tn investigador desea estimar el promedio de la presién arterial diastélica de 10s 500 trabajadores de una empresa y quiere obtener un resultade con una confianza del 95% y que, como maximo, se desvie del verdadero valor en 2 mmbg; en estudios anteriores se habfa encontrado una desviacién esténdar de 8 mmHg. Se calculé entonces el tamafio muestral requerido para satisfaccr tales exigencias al aplicar la férrmula: = NZan 500 (1,967(8P 548 T*OIN-1)+ Ziq, ® 2500-1) 4 (196KaP con lo cua} se determina que para que los resultados gocen de las especificaciones deseades por el investigador se debe tomar entonces una mauestra aleatoria de 55 empleados. . Observaciones En la practica epidemioldgica sucede con frecuencia que el investigador no est4 libre de tomer una muestra tan grande como quisiera para satisfacer sus exigencias y se debe contentar con un limitado nimero de sujetos, por ejemplo 37 casos de infarto del miocardio que se encuentran al re- visar las historias clinicas de una istitucién, situaci6n en Ja cual dicho Fama de armvestra/ 223 tamafio determina 1a precisin de los resultados obtenidos, de tal forma que si es elevado estos son bastante precisos y, consecuentements, el intervalo de cenfianza obtenide para cl pardmetro poblacional serd pequefio; por el conuario si es reducido Jos. resultados sexin imprecisos y el intervalo de confianza para dicho pardmetro serd relativamente amplio, Bn este tipo de situaciones ¢s el ramatio muestral el que determina Ja precisién lo- grada. Por ejemplo, un investigador desca estimar con un 90% de confianza Ja proporcién de mujeres que han usado estrégenos entre aquélias que tie- nen cdrcer de endometrio pero sélo cuenta con 47 pacientes con dicho diagnéstico, en las cuales encuentra 16 que han utilizado estrdgenos, es decir, una proporcién § = 0,34. De acuerdo con la teorfa estadistica, un intervalo aproximado det 90% de confianza para la proparcién buscada se obtiene al utilizar la expresin: Tryg = PB £ Zpon NURI - BYn), en donde Zioq refieja la confianza descada por ¢l investigador, valor que se toma de Ja tabla de la distribucién normal estandar ypes el valor de la proporcién obtenido en Ja muestra. Asi, ¢] intervalo bus- cado cs: 0,34 + 1,64 \\[0,34(0,66V47] = 0,22: 0,45 El investigador puede afinmar, con una confianza del 90%, que la Proporcién de mujeres con cancer de endometrio gue han utilizado estré- genoa se encuentra entre el 22 y el 45%, intervalo que es bastante amplio Ys por tanto, impreciso. En cambio, si el investigador hubiera contado con una muestra de 94 pacientes habria obtenido con Ja misma. confianza —¥ con el supuesto Se que la proporcién observada p hubiera sido igual a 0,34: 0,34 & 1,64 V[0,34(0,66)/94} = 0,26; 0,42, intervalo mds preciso que el obtenido anteriormente con una muestra de menor tamaiio. 224s Metodolog ta de te imvemigacite... _ Determinacién del tamaiio muestral ex los estudios sanaliticos En e] estudio de Jas relaciones existentes entre la exposicién a diferentes factores y la incidencia'de las. enfermedades, el epidemidlogo debe basar su conocimiento en resultados observados en mucstras aleatorias qut, su- phestamente, representan lo que sucede en Ja poblacién de donde ellas pro- vienen; por este motivo en la fase de planeacién de un estudio epidemiclégico analitico el investigador debe decidir acerca del uimero de sujetos participantes en cada uno de Jos grupos que se comparan. Esta de- cisién es el resultado de una serie de consideraciones importantes que s¢ detallan a continuacién. Consideraciones generales A medida que se incrementa el tamafio muesirz] los resultados obtenidos son mag precisos y, al mismo ticmpa, aumentan los recursos necesarios para obtener y procesar una mayor informacidn. De esta manera Ja solu- cién al probleme de la determinacién del tamafio muestral se presenta, en primera istancia, como una solucién de equilibric entre los costos y him- precisién de las estimaciones que se trata de obtener: una muestra nume- rosa suele ser bastante precisa pero también bastante costosa. De una manera intuitiva se percibe que Jos resultados obtenidos con muestras pequefias no son confiables; esta apreciacin implica un conocimiento del comportamiento crrético que tienen los resultados aleatorios que se basan-en un niimero escaso de observaciones. Ast, si ‘en 4 lanzamientos de una moneda se obtienen 4 caras, la decisién acerca de si se trata de una moneda equilibrada o de una falsa tiene un funda- mento mucho mas débil que aquel que se tiene si en 50 lanzamientos se obtienen 40 caras, Con los resultados observados en una muestra pequefia el riesgo de tomar una decision equivocada acerca de la hipétesis que se intenta demos- trar es relativamente alto, 0 sea que a inedida- que aumenta el tamaiio mvestrall Ja probabilidad de tomar ona decisién acertada acerca de la hipé- tesis que se prueba ¢s mayor. De este modo cs facil adventir que ¢] tamaiio de una muestra depende, en parte, del riesgo que el investigador asume de obtener un resultado que leve a una conclusién equivocada, El riesgo de concluir equivocadamente con respecto a la hipotesis que se intenta demostrar presenta dos posibilidades: ‘Temata de la muestra 1225 1, En ausencia de la diferencia § que se intenta detectar, es posible obtener Por azar un resultado que permita concluir equivocadaments a favor de la existencia de la asociacion, Se dice entonces que se acepta equivocadamen- te la hipdtesis alternativa y se rechaza la hipétesis nula. Obviamente, Ia frecuencia con que se Presentan estos resultados es excasa y coincide con el nivel de significacién estadfstica que el investiga Gor fija de antemano para lag pruebas de significacin del estudio que se sucle denotar con la letra o (Véase la figura 13.1). Puesto que el investi- gador acepta corter un riesgo reducide de que el azar lo Heve a concluir equivocadamente, ol nivel de significacién sucle ser pequeho, casi siempre 10, 5, 0 1%, segdn el criterio de aquél, 8 z Figura 13.1. Distribucién de los resultados muestrales cuanda no existe asocia- cidn, © sea bajo a hipatesis nuta Por ejemplo, en un estudio de seguimiento en el que, con base en loa resultados de dos mucstras aleatorias, se evaliia Ja diferencia 5 en la incidencia entre expuestes y no expuestos a un determinado factor de ries- £0, €2 posible que en ausencia de asociacién se obtenga por simple azar uaa diferencia estadisticamente significativa, lo cual llevaria al investigador a coneluir equivacadamente 2 favor de la existencia de la asociacidn, Asi, el nivel de significacién fijado para una prueba estadistica es una medida del riesgo que asume aquél de conciuir equivocadamente a favor de la cxis- tencia de la asociacién cuando ésta en realidad nO existe , error que se Conoce en estadistica como tipo 1. 226 | Merodologia de ta investigaciéa.. 2. Al existir la asovincién que se intenta detectar, es posible obtener por el ‘azar un resultado que permita concluir de manera equivocada a favor de la inexisiencia de la asociacién, esto es, a favor de la hipdiesis nula. De acuerdo con la figura:13.2, si la asociacién existe con un valor ignal a 8), Jas estimaciones de tal valor se distribuyen alrededor de 5, de acuerdo con la distribucién que aperece a la derecha. Zz Figura 13.2° Distribucién de las estimaciones muestrales que se obtienen en muestra grandes cuando la asociacién buscada existe No obstante, es posible que por azar se obtenga una estimacién con un valor inferior al que delimita el nivel de significacién estadistica en la distri- ‘bucién que se presentarfa bajo la hipdtesis nula; la frecuencia con que ocume: uno de tales resultados est indicada por ¢] valor B. De este modb, el riesgo de obtener un resultado que Heve a Ja conclusién equivocada a favor de la inexistencia de la asociacién cuando ésta existe es B y e] error se conoce en estadistica como tipo 1; su complemento, / - B, es la probabilided de detec- lar correctamente la existencia de una asociacién lo cual se conoce como po- der de la prueba estadistica. En el intento de demoswar la cxistencia de una asociaciéa, el inves- tigador desea tener una alta probabilidad de detectarla con sus resultados alcatorios, cs decir, un alto poder de la prueba estadfstica lo cual suele ser igual o superior al 80%, o sea que 6 casi munca excede.el 20%. Es fécil advertir que 2 medida que se desea reducir los riesgos a y B de que el azar produzca resultados que leven a una conclusién falsa se debe incrementar el tamafio muestral requerido. De otro lado, 1a magnitud de las diférencias existentes también con- diciona el tamafio muestral requerido en un cierto estudio comparativo. In- tuitivamente es ffcil advertir que para detectar diferencias grandes basta un . Tamano de a muestra (227 reducido tamafio muesteal en tanto que para detectar diferencias pequefias S$ necesario contar con muestras aumerosas: Planteamiento que se mani- fiesta ea Ja préctica en.el hecho de que para calcular el tamafio muestral Tequeride en un ciesto estudio es necesario especificar de antemano la di- ferencia minima o el riesgo relative minimo que se considera importante detectar desde una mirada clinica, ctiolégica o preventiva. Asi, en iguaidad de otras condiciones, la deteccién de un Tiesgo relative dé 2.0 exige un tamafio muestral mayor que Ja deteccién de uno de 5.0. Finalmente, el tamafio muestrel requerido en un cierto estudio también std. condicionado por Ja frecuencia con que ocurren los eventos observados, © sea que la deteocién de una asociacién cnme una exposicisn y la incidencia de una enfermedad frecuente exige un menor tamafio mauestral que el reque- ‘ido si se trata de una enfermedad rara, Este hecho implica que para la deter- tinecién del tamaio mucstral Tequerido en un estudio de seguimiento es necesario especificar la incidencia propia dé la pobiacién no. expucsta y que para caleular dicho tamafio cn un estudio de casos y controtes es necegario especificar la proporciéa de exposicién propia de los controles, tal como se expone detalladamente a continuacién (Schlesselman, 1974)4 Estudios de casos y controles De acuerdo con jos planteamientos antes descritos, para calcular el tamafio muesiral requerido en un estudio de casos ¥ controles es necesario especi- ficar las siguientes condiciones (Schiesselman, 1982): 1. El nivel de significacién a 0 Probabilidad de que los resultados obteni- dos Teven a aceptar equivocadamente la existencia de la asociacién. 2. El poder deseado en las prucbas estadisticas 7 - B, o 1a probabilidad de ebicner resultados que confirmen acertadamente la asociacién estudiada, 3. El riesgo relative minimo que, con una probabilidad 7 - 8, se detectaria como significative. 4, La frecuencia de exposicién entre la Poblacién sana, Dado el hecho de que la mayoria de la pobiacién total suele estar conformada por sujetos sanos, aquella puede estimarse adecuadamente Por Ja frecuencia de expo- sicién de la poblacién total; se conoce, por ejemplo, la proporcién de per- songs que en la poblacién total fuman, consumen alcohol o usan anticonceptivos orales. 4 ‘Une deduocisn formal del tansfo micstrd « partir d¢ tos comlicionanies twencionadot te presenta al final de este capéulo. 228 / Metodologie de la investigecion... En las tables 13.2 2 13.7 se muestra el ndimero de casos requerido ‘en un estudio de casos y controles no equiparado'para diferentes especifi- caciones y cuando se decide tomar 1, 2 0 4 controles por cada caso. En Ia tabla 13.3 se observa, por ejemplo, que si se desea detectar un tiesgo relative de 2,0 con una probsbilidad de 0,90 y un nivel de signifi- cacién de 0,05 con una proporcién de exposicién de la poblacién sana de 0,10 se necesitarian’ 332 casos y 332 controles; si se acepta disminuir el poder a 0,80 y se mantienen las otras especificaciones se requezirfan en- tonces, segtin la tabla 13.2, 246 casos y 246 controles. ‘Algunos autores han confeccionado gréficos que determinan el tamsa- fio mmestral para diferentes especificaciones y que pemmiten apreciar de una manera visual las relaciones existentes entre elias y el tamafio muestral, tal como puede advertirse en la figura 13.3. Para especificaciones de a y de J - § diferentes a las de la figura 13.3 se puede obtener ¢] tamafo requerido n al multiplicar cl valor hallade en el gréfico por Jos factores que se presentan en la tabla 13.8, En general, la seleccién de igual ntimero de casos y de controles es aconsejable si la obtencién de la informacién de unos y de otros es igual- mente factible y costosa, No obstante, en ocasiones, la seleccién de los casos se hace diffcil o excesivamente costosa, por tanto s¢ puede reducir el ndmero de casos y aumentar el de controles con ¢l fin de conservar el mismo poder que se obtendrfa al seleccionar ua niimero de casos igual al de controles, Ast, si se incluyen r controles por cada caso r = J, 2, 3, 4 el némero de casos n se reduce de acuerdo con e] factor (r + 1)/2r ; segtin esto, sien vista de que el nimero de casos elegibles es escaso se decide tomar 2 controles por cada caso. ¢] ntimero de casos requerido para determinadas especificaciones se puede reducir en un 75% 0 sea (2 + AQ x 2) = 0,75. De este modo, si se piensa desarrollar un estudio de casos y contro- Jes para detectar un riesgo relativo de 2,0 con un poder de 0,80 y on nivel de significacién de 0,05 bajo una proporcién de exposici6n en la poblacién sana del 10% se requerixian 246 casos y 246 controles, tal como se puede apreciar en Ja tabla 13.2. Si ante la dificultad de contar con un numero abundante de casos se decide disminuir su némero y tomar en cambio dos comtroles por cada caso se pueden seleccionar 185 casos (246 x 0,75) y "492 controles (246 x 2) y aun conter con el mismo poder estadistico. Ei beneficio de aumentar ¢l nfimero de controles, sin embargo, es despreciable a partir de cinco eontroles por caso. ‘Tomato de ta muestra 1229. Tabla 13.2 Ndmero de casos requeridos en, un estudio de casos y controles no equiparado cuande se toman 1, 2 y 4 controles por caso, & + 0.08; 1 - B (poder) = 0,80; prueba de una cola RR Proparcién de exposicion en fa poblacidn sana 0,01 005 0,10 0,15 0,20 025 030 O40 050 1s 6672 1415 763550 4B 390356. 3250325 4901 1041563407332, 200265 232d 400g 8540462 335274240219 02,203 20 2087 449 246181150133 128s Ist2 327-180-133, «110g a 12200 «2640 145108 9st 5D 75 2s 1140-243 1350 10 wag Rm 799175 8 74 62 56 5S 34 6B 14000 79S Hg 4s 30 732161 og 669 S853] 33 S210 116 66 507 4 412 2 3400 35H 3B 40 420 94 55 420037 34003338 a7 296 7 9 3t2F 28 231 3 3) 25 2 oO 23 50 290 6 3 31 27 26 2 6 a 203 a 2 2 2 89 9 20 2 157 7 22 1% 16 5% 15 16 19 75 161 39 4 200 Baa 2 12 7 7 4 13 138 134 7 85 un 3 10 wo 012 14 10,0 am 28 8 5 4 4 4 «16 19 7 20 3 M1 Ho 4 58 15 10 10 12 Fuente: “Smith P. Curso de Epidemiologia de Céncer (Notas), IARC, Heildelberg, Alerna- nia, 1987. 230/ Metodologie de la invertipacién... Tabla 13.3 Numero de casos requeridos en un estudio de casas ¥ controles no equiparado, cuando se toman 1, 2 0 4 contoles por caso, @ = 0,05; 1 - 8 (poder) = 0.90; prueba de una cola RR Proporciin de exposicién en ia poblacién sana DOT. 005 O10 O15 020 0,25 030 040 0,50 1S 9090 1927 «103749 G10 533 ABS AZ AZ $758 «(1434740559 4553873621334 55831186 641 4630«2377—- 329 B01 275 276 20 2815 605 «332,243 «201178165 15S 160 20794424511: 138-123-1612 4704 BER 202s: 102 E100 28 14930-32515 96 1087 2B 134 100 eh 75 n” 6B 7 e930 (195 (09's 2B OT 60 3.0 977) 215724 O77) «70 «(66S 70 m5 158 89 a 3? 52 50 49 53 578128 70 SAF ABO ry 40 586 125 7 Li} 48 44 a a 48 405 ot 53 418583 BRB 36 325 B 4300330 2927 KO 30 50 382 a7 51 40 35 33 32 4 38 red 64 3e 3 26 KS 2» 221 51 30 4a nN wm 2D 2 23 75 au 50 Ey 3 232 2 2 2B 152 36 23 ww 17:0:«18 OE 2 120 2 8 15 4 B uw 15 v7 10,0 145 36 2B 19 1 @ 8 2 24 405 26 vw “wo 1 BOS 18 82 a 13 a uu 0 " 12 15 Fuente: Smith P. Curso de Epidemiologia de Cancer (Notas), IARC, Heildelberg, Alera nia, 1987. Tomaha de ta muestra! 232 Tabla 13.4 Numero de casos raquerides en un estudio de casos y¥ controles: Ro equiparado, cuando se tornan 1, 2 0 4 controle’ por caso; _ & = 0.05; 1 - B (poder) = 0,95; prueba de una una cola RR Proporién de exposicion en a poblaciin sana 6.01 0,05 0,10 O15 9,20 0,25 0,30. 040 0,50 15° 11381 24131301. 938783665606 5SB S53. 8527 1808975703 572 aBBCASA ath 7oag 1503811 SBS 47G IS 7B 34535, 20 3505 753-413, 302,280) Bt 205. 193199 26220 «5640—<— 309 22G_ 187865544 2171 4670256 18B 155138 128120123 25 185200 «403224156 1391S F198 13830-3301 1670124143 a 114400 «248138108 BF B70, 74 3.0 1208« 265149112852 85 $00 198 111 a 71 Bt TCO 64 739168 92 6959) S350 53 40 685153 a8 6 S854 2B 58 soo 11g 66 Ca ee ee) 4 416 93 54 4 360 3332 36 50 469107 a 499.0043 400 39 46 348 9 47 3682 34 283 65 38 3000-260 52 28 75 258 61 37 3027) 2 OF 34 191 45 28 2 2 20 2m 2 25 154 37 22 1 17° 16 1G 20 10,0 WW 43 27 2300 2 21 ot oat 2 131 32 20 7 16 1 16 2 105 36 6 400130 120 Bak WV Fuente: Smith P. Curso de Epidemiotogte de Giéncer (Notas), 1ARC, Heidelberg, Alema- nie, 1967, 232/ Mewdologin de ixinvestipection. ‘Yabla 13.5 Nimero de casos requeridas en un estudio de casos y controles no equiparado, cuando se toman 1, 2 0 4 controles por caso; = 0,01; 7 - B (poder) = 0,80; prueba de una cola BR Proporcién de exposicién en fa pobleciin sana 001 0.05 0015 0,20 O25 0,30 040 0.50 48 tose} 2245121173711 62D SHS S155 7eos «1638 «= 8874224 ASB 419 38S B87 62471332 724«525 480877 519323 20 3266 3 age 0 2e8 2340207, 192A 186 228° «504278206: 171: TAZ 1B 1D 185) 40322166139, 12HTA MAP 25 128 (3772101561118 110 106182 14(o267,—«C«*SDss13 9S BHR BO BS o0 «210s 19—— 9s OT n 30 120249 40GB 82 784 VS 100 6 85 6 57 57 62 606 136 7 61 52 4847 ce 52 40 641 144, a a a 56 439 100 59 46 40 38 7 38 a3 323 7 4% 36 32 31 30 3t 36 50 440101 oO 4 4 3 38 40 45 298 70 2 3 3 2% 2 30 34 223 53 32 20 ABR 29 1S 203 58 3 0OC« HB 33 162 40 6B 2 wm 19 1 21 25 ng 30 9 96 0 HOB a 10,0 167 42 7 82 28 wt 2 9 «6 1S 15 1B 22 80 2 “4 Bb 2 BR 8B 18 a Fuente; Smith P. Cursa de Epidemioiogla de Cancer (Notas), ARC, Heiidelberg, Alema nia, 1987. Tomato de a muestra 233 Tabla 13.6 Ndmero de casos requerides en un estudio de casos y controtes NO equiparado, cuando se toman 1, 2 © 4 controles por caso; @ = 0.01; 1 - B (poder) = 0,90; prueba de una cola aR Proparcién de exposicién en ja poblacién sana 001 0.95 0,10 0,45 6,20 0,25 030 040 0,50 15 13608 2886 1556-1122, «913.798 72686522 wooiO 2127 1149831 67B 502541495497 81981745845 GBA SBD ag wast gig 20 M77 8880 493361299. 265245230237 3031 654380265220 196182172479, 2448 530020321711 tet 508g 25 2202 479267198 6E 149 tats ta. 13820-3450 194145122110 104101107 128300«278 156118 «100 90s ao 3,0 143300«#BIS 178138411408. 10220226129 s 83 78 BO 7B 800 180103 9? 8 82 59 59 65 40 811 182108 ee | 70 S72 130 76 595148 53 446102 60 7? 40 2 RD “4 50 555127 75 5B S248 36 389 #0 54 42 38 36a 42 300 70 az 4 300 292930 35 25 305 a 450 36 (3332s, 4) 212 51 32 G6 @ 2M 4B 6 3 161 39 3% 2 19 19 19 26 10.0 20 52 3B 8 2% 2 2 2 38 145 36 a4 2 19 3 18 22 26 10928 1 1% 18 15 46 wae Fuente: Smith P. Curso de Epidemiologla de Cincer. (Notas), IARC, Heildelberg, Alema- nia, 1987, 234 /sMetodologio de ta tnvestigacion... Tabla 13.7 Numero de casos.requerides en un estudio-de casos y controtes ‘no equiparado, cuando.se toman 1, 2 0 4 controles por caso; a = 0,.01; 1 - B (poder) = 0,95; pruebs de una cola RR Proporcién de exposicén en fa poblacién sane O01 005 O10 075 0.20 025 030 040 050 145° 16402-3478) «1875 «1352-1100 959 B74 797797 12155 «2580 «1393 1005) 820715653597 ‘598 10016 «2428 «1151 BB G7 SOR S296 AOR 20 50IB) 107859) 433, 3SH B17 BA 276285 3685 794 4370 321286236219 207 24 3007, 64S BSB 264 2199S 18117278 25 2539 574 319 «237, 199° 178167185 170 1926 420028517547 BZ 12H 121 1B. 3557341191 14B ZT 09103, 100106. 30 1715 377 a2 wo 01350 «(123116194 123 1245 «2750156198100 87 BG 92 woo 02226 GAH 7 40 968 217) 25 9K BF KS 83 698 «187 ot 7° 61 57S OSE. 2 554126 oe 57) 500 46 BG sz 50 662151 an eo 6 SF 56 OSB 66 474109 o St 45 41 48 49 373 86 51 4 36 88 a BR 42 34 78 3Bé2 52 a3 39 37 BBY 48 258 3B 3128 2B BD 36 200 48 30 a3 23 2 3 a 29 10,0 248 a 3 32H a 176 a 2B “6 RB 2 - RB 30 136 cay 22 19 18 18 18 2 25 Fuente: Smith P. Curso de Epidemiologis de Cancer (Notas), IARC, Heildelberg, Alema- nia; 1987. Tarsaio de ta muartra {23.5 == 0-003. Re Ree nebo Zon oo RRERSRS BE pein Tarai ets rt dro de 205 & Siu 2 BRISA RES Povertajawxpuaee rts ema. 10090 Figura 13.3. Tamaiio de la muestra requerido para estudios de casos y con troles no equiparados, 1 caso 1 cantroi, bajo a * 0,05 (una cola), 1 -B = 0,95, diferentes valores det riesgo relativo minimo que se desea detectar coma significativa R y diferentes grados de expo- sicién de la pobladén al factor de riesgo Fuente: Chase G, Klauber MR. A graph of sample sizes for retrospective studies. Amert can Journal of Public Health, 1965; (SS), p. 1993. ‘Tabla 13.8 Factores que permiten calcular el tamafio muestral requeride para diferentes valores de a y de 7 - B a partir de los tamarios mues- trales requeridos para & = 0.05 y 1 - B = 0.95 que se presentan en ta figura 13.3 Poder Nivel de significacién a 1-6 0,050 0,025 9,010 0,80 0,571 0,725 0,927 0.90 0,791 0971 1,203 0,95 1,000 1,207 1,457 Fuente: Chase G, Slauber MR. A graph of sampie sizes for retospetie studies. Amer- can Journal of Public Health, 1965; (55), p. 1994, 236 Mesodolopta de ta hrvestigacibn.. Estudios de seguimiento Avague las consideraciones generales con respecto a los condicionantes que determinan e] tamatic muestral que han sido expucstas al principio de este capitulo son igualmente apticables al diseiio de un ‘estudio de segni- miento, conviene distingvir dos simaciones on las cuales se sucle realizar este tipo de estudio: 1. Cuando sc clige la poblacién general como grupo de comparacién 2. Cuando se elige a propSsito un grupo no expuesto como grupo dé com- paracién Cuando se elige Ja primera alternative se suele conocer Ia incidencia de! evento estudiads en Ja poblacién general, con base en la cual es posible calcular el néimero esperado de casos en el grupo expuesto con el supucsto de que no existe asociacién al aplicar a éste la tasa de incidencia propia de la poblacién general. Ast, si se contempla el seguimiento de 1000 personas expuestas durante 4 afios y la tasa anual de incidencia de 1a, enfermedad estudiada en Ia poblacién general es de 3 por mil cabria esperar que en el grupo expucsto, bajo la hipétesis nula, se presenton cerca de doce casos de Ja enfermedad, o sea 1000(3/1000)4 = 12. La determinaci6n dei tamafio muestral en estas condiciones se pre- senta como la respuesta 2 dos preguntas. 1, 4Cnél es e] mimero de casos de la enfermedad que, con un determinado nivel de significaci6n, habia que detectar en e] grupo expuesto con el fin de confirmar la cxistencia de la asociacién estudiada? 2. Con qué probabilidad o poder se puede Negar a establecer la asociaciGn estudiada? . ‘Lag tablas 13.9 y 13.10 responden a tales preguntas y muestran, para niveles de significaci6n de 0,05 y 0,01 respectivamente, el nimero mfnimo de casos que serfa necesario detectar para difereates valores del némero esperado de casos y el poder correspondiente de la prueba para diferentes valores del riesgo relativo. * Tameaiio de ta wsserera £237 Tabla 13.9 Tamafio muestral de un estudio de seguimiento cuando se elige la poblacién general como grupo de camparacion, « ~ 0,05, prueba de una cola. ta tabla muestra el poder(x100) con e/ cual se detee- taria un determinado riesgo relative cuando se esperan m casos ‘Nimero | Nomera Hlesgo relativa de casos | catia emperades|decasos | 1,0 15 20 30 40 50 7,5 10,0 150 200 n e 10 4 1907 14 38 574k 9] 100 to 20 é 16 B21 55893100 3,0 ? 335 17 33 799598 40 3 214 15 41 a4 a8 100 5,0 10 318 22 54 93 100 60 u 426 29 «65 (97 100 20 B 270 26 64 98 100 80 4 ad2 32 7399" 100 9.0 5 415 38°79 400 19.0 6. 487 43 84 100 12.0 6 322 33 83100 120 9 a74 44 87 100 130 2 427 48 90 100 149 Fs 479 33° 93° 100 150 Fel 32749-92100 200 3 343 697100 Fiesgo relative ” © O14 42 13 14 18 18 7k 19 200 2B 343009 «18 30 45 «60 73 83h 250 34 498 13 26 42 8S 74S 925 30,0 a 40219 «27 46 8S 35,0 4 425 18 2 48 65 83 09287, 99 100 409 52 3B7 13 30 52 72 «86 694 «98 «98100 45,0 57 473° 16 «3 6 78 919798100 $0.0 a 4240 1637) Gt 81988889100 60,0 m 442 18 4263 BEG 9100 700 85 448 19 47 «(75 «92-88 100 80.0 96 446 21 51 80 54 88 100 90.9 | 107 439 2 55 88 96 98 100 100.0 | 11a. 428 B58 85 987 100 € esl mimero més poqueio al que in probabilidaa de obtens: un nitmero de cas0¢ mayer o igual 42 41 os menor que 0,05. Los céicukcs hm sido realitedos mediante ta distribuciéa de Poisron cuando se srume que ka proporcide de licidencin es baja 0 sea menor del 2%. Fuente: Smith P. Curso de Epidemiologle de CAncer (Noias), IARC, Heikielberg, Alena: i nia, 1987. (238 / Metadologla de la investizaride... Tabla 13.40 Tamafo muestral de un estudio de seguimiento cuando se elige la poblacién general como grupo de comparacién, « = 0,01, prueba de una cola. La tabla muestra el poder(x100) con el cual se detec- taria un determinado tiesgo relativo cuando se esperan m casos. Mimero | Mimero Riess relatives de casos | exhicg esperacos| de cases} 1,0 1,5 2,0 30 40 5,0 75 10,0 15,0 200 nm 1 5 O37 20 5 18 OF 8 TF 10D 100 20 T oa oF No 39 & BF 9 100 30 9 038 4 15 54 84 96 (100 40 10 On 68 «628 76 9% 99100 50 2 O55 8 30 G2 98 100 60 3 088 12 «42 91 98 100 70 15 OS7 41 43 93 100 ao 16 082 36 53 97 100 3D 13 O53 14 97 100 10,0 19 O72 18 6 99 100 140 20 CC a) 120 2 061 20 6 100 0 2 076 24 75 100 14,0 rr 098 28 80 100 35,0 26 Bez 26 79 100 20.0 32 ost 38 $1 100 Alesga reatvo m © WoW 12 18 14 15 46 17 B18 20,0 32 oe 3 7 16 2 38 52 6 O77 (86 3.0 38 O92 06306 69: «619 «33 49 B CBT 30.0 4 097 4 1) 23) 4 658 74 BSB 35,0 0 098 4 12 STB 40,0 56 O97. 5 14 31 52 71 8 94 9B 109 45.0 82 o93 5 «15 345776 DH 10D 30,0 cy ogo 5 17 37 61 Bl 82 «ST 99 TOD 80.0 80 07 85 19 43 6B BF 96 99 100 70.0 31 og1 6 2 51 77 9 98 100 80.0 | 103 O76 6 2 55 Bl 9S 99 100 goo | a4 Das 7) 29 2887100 1000 | az5 Das 9 4B T0D © 6s ch amero ms pequetio ia) que la probabllidad de obtener un mdmcro de cavos mayor 0 iva) 18 61 6s meant que 0,01. Los cAlenlos has sido realizados mediunar 1a clstibeckin de Palssan CUBMo se ASURNe que LA propemeson de incidencis ef baja 0 sea mecor del 2% Fuente: Smith P. Curso de Epidemiologia de Cincer (Notas), IARC, Heildelberg, Alema- nia, 1987, Tamatio de ta nuestra? 239 En Ia tabla 13.9, por ejempio, se advierte que si e] nimero esperado de casos en ausencia de asociacién es de 12, s6lo a partir de un numero observado de ellos igual a 19 se pudiera confirmar la asociacién estudiada con un nivel de significacién de 0,05 y que, en las mismas condiciones, la probabilidad de detectar un riesgo relativo de 2,0 es de 0,87. En las mismas condiciones la deteccién de un riesgo relative de 3,0 seria un suceso casi seguro. Las tablas 13.11 y 13.12 preseatan la misma situacién de un modo diferente, ya que ellas permiten calcular e] tamaiio muestral a partir del riesgo relativo que se desea detectar con determinado Poder, con niveles de significacion de 0,05 y 0,01, tespectivamente. En la tabla 13.11 se conoce, por ejemplo, que si se desea detectar como significative un ties- go relativo de 2,0 con un nivel de significacién de 0,05 y un poder de 0,80 el ntimero esperado de casos en ausencia de exposicién es de 9; asi, si se conoce que Ja tasa anual de incidencia en la poblacién general es de tres por mil, se deben. observar 1000 personas por un periodo de 3 afios, 0 sea 1000 (3/1000) 3 = 9, o alternativamente. 2000 personas durame 1.5 afios, Cuando se escoge a propésito un grupo no expuesto como grupo de comparacién de igual tamafio al grupo expuesto se debe considerar que, ademas del costo y del esfuerzo que implica el seguimiento de dicho gru- PO, es necesario recurrir a tamaiios muestrales relativamente mayores que Jos exigidos por Ia situacién si se utilizara Ia poblacién general come grupo de comparacién. Las tablas 13.13 y 13.14 presentan la informacién necesaria para cb- tener el tamafio muestral en esta dltima alternativa y con la misma forma de las tablas 13.11 y 13.12, para niveles de significacion de 0,05 y 0,01, respectivamente. En la tabla 13.13 se conoce, por ejemplo, que para detectar un riesgo relative de 2,0 con un poder de 0,80 y con un nivei de significacién de 0.05 es necesario contar aproximadamemte con 15 casos esperados. Para ello, si Je incidencia anual en ausencia de exposicién es de 3 por mil al afio, habria que seguir a 1000 personas por 5 aiios, 0 sea 1000 (3/1000) 5 = 15 o, alternativamente, a cerca de 1660 personas durante 3 afios y, ade- més, a 1660 personas expuestas. Este tamaiio muestral excede notablemen- te al que se requiere para la misma hip6tesis cuando se clige la poblacién general como grupo de comparacién tal como ha sido indicado. a sea 1000 Personas expuestas observadas durante 3 afios. (240 / Mewdologia de ta trenigacion... Tabla 13.11 Tamanho muestal para un estudio de seguimiento cuando el grupo expuesto se compara con la poblacién general, & = 0,05, prueba de una cola, La tabla muestra los valores del riesgo relative que se detectarian con determinedo poder y un nimero m esperado de po casos Némero Namero Poder decasos | atftico esperados| de cagcs m c 0,50 0,80 0,90 0.95 0.99 10 4 3.67 5,52 6,68 775 10,05 2.0 6 2,84 3.95 464 526 655 30 7 2,22 3,03 351 3.95 486 40 9 217 2.84 325 3.8) 435 50 0 1,93 2,50 284 Baa 376 6.0 1" 78 228 287 2.83 336 20 B 181 227 254 2,78 3.26 Bo 14, Ww 213 237 258 3,02 30 5 1.63 2,01 2.24 243 2.83 100 16 15? 4,92 213 231 2.67 19 18 1,61 1,95 235 232 2,66 12,0 19 456 1.88 2,06 2,22 2.55 13.0 20 151 1.82 1,99 2,14 2.45 mop on 148 77 1,93 2,08 2,36 15,0 23 1,51 179 1.95 2,09 2,37 20,0 2 143 1.67 1,80 192 215 25,0 34 1.35 135 167 177 "96 30,0 40 182 151 161 1,70 1.87 35,0 46 1,30 1a7 187 1.65 181 40.0 52 1,29 1.45 1,54 1,61 1,76 45,0 57 1.26 ia 4,49 1,55 168 50,0 63 1,25 1,39 1.47 1,53 1,66 60,0 74 1.23 1,35 1a2 1.48 159 70,0 as 124 1,32 4,39 1,44 4,54 80,0 96 1,20 1,30 1,36 11 1,50 90.0 107 119 1,28 1,34 1,38 1,47 100,0 18 4AB 1.2? 1,32 1,36 145 © cesel nthmero ins pequeio tal que Ja probebilidad de que s¢ preseate un miimero de ecsos igual fo mayor que ni es menor dx 0,05. Los cdicuios han sido realizados bajo una dswibucion de Poiston eassido se atom que a proporeén de Incidcacia cs baja © azn menor del 3%, Fuente: Smith P. Curso de Epidemialogla de Cancer (Notas), ARC, Heildelberg, Alema- ia, 1987. . Tomoko dela moesira/241 Tabla 13.12Tamafia muestral pare un estudio de seguimiento cuando el grupo expuesto se compare con fa poblacién general, a ~ 0,07, prueba de una cola. La tabla muestra los valores del riesgo selativo que se detectarlan con determinado peder y un nimero m esperado de casos Numero | Mimero Poder decasos | critica esperados| de casos m ¢ 0,50 0.80 0.90 0.95, 0,99 1.0 5 467 6,72 7,99 3.15 11,60 20 7 3,33 4,54 5.27 5,92 7,29 3,0 9 2.89 3,79 4B 4at 5.80 40 40 2.42 3.13 3.55 3,93 4,70 50 @ 233 2.96 3,32 3.64 4,30 60 B 2a 2.65 2,96 3.24 3,80 7,0 15 2.10 2,59 2,88 313 3,54 8,0 16 1,96 2.40 2.66 2,89 34 9.0 18 1.96 2.38 2,62 2,83 3,26 10.0 19 1.87 2.25 2.48 2.67 3,06 11.0 2 | 179 2,15 2,35 2,53 2,90 200 | 22 | 481 215 2,35 2,52 2.86 13.0 23 194 2,07 2,26 2,42 274 14.0 24 1,69 2,00 218 233 2.63 15,0 26 uit 2,01 218 233 2.62 20,0 32 4,58 1,83 197 2,09 2.3 25,0 38 1,51 1,72 1,84 1.95 2.15 30.0 a4 1,46 1,65 1,76 185 2,03 35,0 50 1,42 1,60 1,69 1.78 1,94 40,0 56 139 1,55 1,64 a2 4,87 45,0 6z 137 1,52 161 1.68 1,82 50,0 68 1,35 1,50 1,58 1.64 7? 0 80 1.33 1.45 153 1.59 1.70 70.0 ot 1,30 iat 1,48 1.53 164 20,0 103 1,28 139 145 1,50 1,60 90,0 1146 126 137 1,42 1,47 1,56 100,0 125 1,25 134 1.40 144 152 * cesel nimero mis pequefa tal que la probabilided de que se presente um imero de cou ipunt (© mayor que zm ex menor de 0,01. Los cileulos han sido realiaados mediame Ia diswribucién de Foisson cuando se asume que la proporciéa de incidencia ve baja o ox menor del 2%. Fuente: Smith P. Curso de Epidemiologla da Cancer (Notas), IARC, Heildelberg, Alemania, 1987. 242 / Meiodalogta de la tvestigavicn.. Tabla 13.13 Tamaho muestral para un estudio de seguimiento cuando e} grupo expuesto se compara con UN grupo no expuesio de igual tamano, @ = 0,05, una cola. La tabla contiene los valores del riesgo relativo que se detectarian con determinade poder y un niimero mm espera- do de casos Nomero Poder 235 at 3,90 443 5.54 2,20 3,04 355 4,00 4,95 2,09 284 3,29 3,63 4,53 2,01 2,69 3,09 3.45 420 1,94 2,56 2,94 3,26 3,94 1,88 2.46 2.84 311 373 1.84 2.38 270 2,98 356 1,79 230 2,60 2.87 344 176 2,24 2,52 277 3,28 149 173 2.19 2,45 2,69 317 150 170 214 239 2,61 307 200 159 1,95 2.16 2.35 an 250 1,52 184 2,02 27 2.48 30,0 1,47 175 191 2,05 2,32 35.0. 143 13 1,83 1,96 2,20 40,0 140 4,64 17 1,88 241 45,0 138 1,60 172 4,82 2.03 500 136 1,86 1,68 78 197 60,0 1,32 1,51 181 170 187 70,0 1,30 147 1,56 1,64 178 80,0 1,28 1,43 1,52 159 1,73 0.0 1,26 iat 1,49 1,55 1,69 100,0 1,25 138 146 1,52 1,65 * El valor del scape relative RR ee obsiene cunin sohucice de in ccumsidn KR? = RR(2 + Q) + 1 - Om 0,en donde Q = (Za + Zprim uente: Smith P. Curso de Epidemiologia ee Gincer (Notas), IARC, Helidelberg, Alemania, 1987. Tamaio de ia muestra /243 Tabla 13.14Tamafo muestral para un estudio de seguimiento cuande el grupo expuesto se compara con un grupo no expuesto de igual tamafo, @ = 0,01, una cola. La tabla contiene los valores del riesgo relativo que se detectarian con determinada poder y un ndmero m espera do de casos Némero Poder de casos esperados m 0,50 0.80 0,90 095 099 10 737 12,75 15,78 1457 2449 20 5,04 755 91 10,54 13,55 30 4,00 5.57 683 7,80 985 40 3,46 4,82 5.65 6,40 737 50 ant 424 493 S54 682 60 287 385 443 4.96 6.04 70 2.69 356 4.07 4,53 57 80 258 3,33 3,79 420 5,04 90 2,44 3,15 357 394 470 10,0 2,35 3,00 339 3,73 443 11,0 227 2,88 324 3,56 4,20 12.0 2,20 2.78 311 3,41 4,00 13.0 214 2.69 3.00 328 384 140 2.09 261 291 317 3,59 15.0 2,05 2.54 2,82 3,07 337 20,0 1,88 2,28 2,51 271 311 25.0 178 22 241 2,48 2,82 30,0 1,70 2,00 217 2,32 2,52 35,0 1,64 1,91 2,07 2.20 2.46 40,0 1,59 1.84 1,93 211 235 45,0 155 179 1,92 2,03 2,25 50,0 1,52 174 1,86 1,97 217 60,0 147 1,67 178 1,87 2,05 70,0 1,43 1,81 1,71 1,79 1,96 80,0 1,40 1.66 1.73 1,88 90.0 1,38 1,53 1,61 1,69 1,82 100.0 1,36 4,50 1,58 1.65 1,78 @ = 0, en donde @ = (Za + Zay/m. Fuente: Smith P. Curso de epidemiologia de céncer (Notas), 1ARC, Heidelberg, Alemania, 1987. El valor det riesgo relative AR se obticne como soiucidn de la ecuacidn RR - RR? + 0) + f- 244 /Merodologta de la invastigacin.. Cuando se decide seleccionar a propésito un grupo no expuesto como grupo de comparaci6n, también es posible seleccionar grupos de ex- puestos y no expuestos de diferente tamafio. Si con un conjunto de deter minadas especificaciones se requieren n personas expuestas y 00 expvestas de igual tamafio y s¢ considera una razén del mimeio de perso- nas no expuestas al mimero de personas no expuestas igual a 7, el nimero requerido de éstas cs igual a n(r + 2¥2r y el de las no expuestas es igual an(r + 1¥2. ne Asi, si segéin el ejemplo citade se calcula que de acuerdo con las especificaciones deseadas se debe observar un grupo de 1660 personas €x- puestas y otro no expuesto de igual tamafio, pero por razones de factibili- dad se contempla la posibilidad de aumentar el mimero de los no expuestos al doble de los expuestos, ¢] mimero de estos serfa de 1245, 0 sea 1660(2 + IM(2 x 2) = 1245 y el de los no expuestos de 2490 o sea 1660(2 + 2 = 2490, Equiparamiento y control de la confusion Fi razonamiento que se ha expuesto en los parrafos precedentes se refiere. a la situacién que contempla un disefio no equiperado. Tal como se ha indicado en el capitulo correspondiente, el equiparamiento de los sujetos observades con respecto a una variable que produce confusién tiende a aumentar la eficiencia de un estudio y permite seleccionar asi un menor ndmero de casos con respecto a un estudio no equiparado en las mismas condiciones. También, en un disefio cquiparado es posible aumentar el ni- mero de controles por cada caso si se hace dificil 0 costoso obtener la informacién de estos, con Jo cual se incrementa el poder de las pruchas estadisticas. En la tabla 13.15 se muestra el niimero de casos requerido en un estudio de casos y controles equiparado, para algunas especificaciones selectas y cuando s¢ utilizan 1 y 2 controles por cada caso. Adviértase, por ejemplo, que si con un disefio equiparado 1 caso 1 control se deses detectar un riesgo relativo de 2,0 con un nivel de significacién de 0,05 y un poder de 0,80, y se asume una proporcién de exposici6n en la poblacién sana de 0,10 se necesitarfan 241 casos y 241 controles, 0 sea, 10 sujetos menos que los necesarios para un disefio simple, segin la tabla 13.2. Ademés, se debe considerar que si de acuerdo con el disefio de la inyestigacién se pretende commrolar por medio del andlisis estratificado el Tamaie de la neuesira 245 Tabla 13.15.Numero cde casos requeride en un estudio de casos y controles equiparado para algunas condiciones selectas y cuando se utilizan 1 y 2 controles par cada caso Riesge relativo 45 2,0 (28 30 35 4p 45 50 Froporcién de expasicon = 0,1; Significacion = 5%; Poder = 86% 757-244 11 a7 65 52 43 37 559176 95, 63 46 37 30 26 Proporcién de exposicibn = 0,1; Significacion = 5%; Poder = 95% 1.283398 zt 138, 01 9 cr 55 3630299 158 103 6 59 48 49 Proparcién de expasicién = 9,1; Significacién ~ 1%; Poder - 60% 1.204380 206 17 102 81 67 58 88174 146 96 n 56 46 40 Froporcién de exposicién = 0.1: Significacian = 1%; Poder = 95% 1.855 575 305 200 47 15 35 a1 1.380 425 224 147 107 a4 6 58 Proporcion de exposicén = 0,3; Significacin = 5%: Poder = 80% 355 122 mn 50 39 az 2B 25 264090 52 37 23 24 20 8 Proporcién de exposicin = 0,5; Significacion = 5%; Poder = 80% 3240118 52 a2 36 3 28 24300 ag 54 39 32 27 24 a Fuente: Breslow NE, Day NE. Statistical Methods iz Cancer Research. Vol it The Design and Analysis of Cohort Studies, Lyon, |ARC, 1987, p. 257. efecto de una variable de confusién se debe incrementar el tamaiio mues- tral requerido en un disefio basico para las mismas especificaciones. Debi- do a la cantidad de informacién necesaria para el cflculo de este incremento y a la relativa complejidad de éste quizés sea un criterio teil saber que rarameate s¢ requiere un incremento en el tamaiio muestra] bé- sico mayor del 10%. 246 1 Metadoiogia deta trvetigation. Por cada variable adicional que sc desea controlar por medio de la estratificacién se puede adoptar, también como criterio practico, el incre- mento del tamafio musstral previamente calculado en un 10% @resiow y Day, 1987). Deduccibn del tamaiio mnestral para demostrar Ja diferencia entre dos proporciones Los factores enuncisdos al principio de este capfalo como condicionantes del tamaiio muestral se relacionan entre sf de tal modo que su interdepen- dencia pusde deacribirse por medio de una ecuacién que permite, finelmen- te. calcular el tamagio muestral 1 necesario para satisfacer tales condiciones Gays, 1963; Fleiss, 1981; Breslow y Day. 1987). ‘Cuando se estudia la asociacién entre la exposicién a un factor de riesgo y una enfermedad, ambos medidos en forma dicotémica, el proble- ma se plantea como la determinacién del tamaiio muestral requerido para detectar como significativa la diferencia existente entre dos proporciones enya deduccién formal es como sigue: Si B, ¥ By son las extimaciones muestrales de las proporciones de imrerés que se obtienen en dos muestras dé igual tamafio en dos pobla- clones caracterizadas por parémetros II, y Tl, y s¢ toma el valor p = (b; + B22, q = 2 - p, mediante la aproximacién de la distribaciGn normal se tiene que: 1-f = Prob 2) > Zq poder de Ja prueba, wna cola s Prob ((By ~ By) - (Uy - Ty) > Z_V(2pqén) - Mz - TH} = Prop LPB) - Oa - 1) 5 ZaMl2pe/n) « , - Ty) ViTI,Q, + 10,Va) ~ Vi0,0, + 11,0,¥n) Ademfs, s¢ tiene por definicién que J - B = Prob(Z > Zp), de tal modé que el valor Zp, coincide con el segundo término de la desigualdad anterior: Be ZN(2pain) - (ML, - Th) UTO, + T,0,Ve) woe ‘Tamato de ia muestra /247 ‘Esta thtima expresin es funcion de Il, y de M1, valores que pueden ser supuestos de antemeno por el investigador y también de p, valor que s6lo puede conocerse después de realizado el cstudic. No obstante, en Tuestras relativamente grandes p se puede estimar de modo aproximada por II = (1, + 11,2, y pq se puede aproximar al valor TQ en donde, @ =s/-Th De esta manera, al reemplazar el valor de pq por el de I1Q y despe- Jar el valor de n, se tiene que: n= IZN(21Q) - ZNO, + T,Q_)P (fl, - TF expresién que permite calcular ¢l tamafio muestral n requerido en cada. uno de los grupos comparados con valores especificados de a. B, 11, yh, Esta ecuacién —que es 1a misma que se propane para caicular el tamaiio muestral en estudios experimentales cuando se comparan dos gru- pos y sc busca detectar una diferencia entre dos proporciones— en los estudios epidemiolégicos de tipo analitico se puede expresar en funcitn det riesgo relative RR que se pretende demoatrar como significative y de la proporcién i, que caracteriza el grape de comparacién: en los estudios de seguimiento TI, = (RJT, y en los estudios de casos y controles, de acuerdo con Ia aproximacién del riesgo relative por medio de la raz6n de disparidades RD, se tiene que I, Al - 11) TL, 47 - f,) BRT, “ RRM, Il, +7 Consideraciones finales Aunque Ja determinacién del tamafio muestral requerido en un estudio epidemiolégico obedece también a consideraciones econémicas, éticas, bioldgicas, sociales y polfticas, entre otras, Ja especificacién de los condi- Gionantes estadisticos con los cuales se obtiene una determinada muestra se Presenta como un requisite ineludible. Por ejemplo, un investigador puede determinar que ¢l tamafio muestral requerido en un estudio de casos y con- = RD = RR, de tal modo que (2487 Metodologia de ta investigacién... ‘woles, con una proporcién de exposicion asumida del 10%, para detectar Un riesgo relativo mfnimo de 2,0 y con probahilidades de Ilegar a una con- clusién equivocada ct = 0,05 y B =.0,20 es de 246 casos y 246 vontroles. No obstante, los recursos con que cuenta solo alcanzan pare 91 casos y 91 controles con lo cual podria detectar como significativo con el mismo po- der y con la misma proporcién de exposicion un riesgo relative de 3,0, segén la tabla 13.2. ‘Ante esta situaciOn, si lo considera pradente, puede decidir aceptar mayores probabilidades de equivocarse con Jo cual se disminuye el tamafio guestral inicialmente calculado a, si por el contraric, considera que TIO debe sdmitir mayores probabilidades de error y que no puede conseguir yecursos adicionsles, puede decidir que en tales condiciones no es impor- tante realizar e) estudio porque asume un riesgo elevado de no obtener resultados significativos si el riesgo relative es en efecto menor de 3,0. Si por el contrario, considera que no debe admitir mayores probabi- lidades de error pero que puede abtener recursos adicionales para incluir 135 casos y 135 controles pucde realizar el estudio con ¢) conccimiento de que si el riesgo relative es al menos de 2,5 y con la suposicién de que le proporcién de exposicién al factor de riesgo en Ta poblaci6n es realinente det 10%, las probabilidades de egar a una conclusi6n equivocada con re- laci6n ela existencia de la asociacién de interés son de o = 0,05 y B = 0,20, segun la tabla 13.2. Ein numernsos estudios analiticos realizados con tamatios muestrales insuficientes se suele concluir ante resultados no significativos que no exis- te asociacién con 1a exposicién estudiada. Es importante pregumarse si ta- Jes resultados se deben al redacido tamafio muestral utilizado, caso en el cual Jos recursos s¢ han malgasiado indtiimente. En otras ocasiones, no del todo infrecuentes, los estudios de este tipo se emprenden sin considerar los aspectos que orientan Ja adecuada deter- minacién del tamafio muestral; los resultados obtenidos en catas circustan- cias son de dudeso valor cientifico porque carecen de un punto de referencia con respecto al cual pueden evaluarse. Tampoco son raras las ocasiones en les que el investigador, con desconocimiento de las especifi- caciones con las cuales se determiné el tamaiio muestral, acoge Jos resul- tados ebservados en subgrupos reducidos de la muestra total, por ejemplo, categorias de sexo © regi6n; en estas circustancias Ja disminucién de) ta maiio muestral como consecuencia de] fraccionamiento de Ja muestra ini- cial produce una disminueién del poder requerido inicialmente para a Tamato de Io muestra /249 Muestra total y, por tanto, un incremento en la probabilidad de obtener resuttados que nieguen 1a asociacién estudiada cuando ella existe. En aquellos estudios que pretenden establecer la existencia de mil- tiples asociaciones, por ejemplo una enfermedad con milltiples factores de riesgo, la opcidn inds indicada es la de obtener los diferentes. tamatios muestrales correspondientes a las diferentes asociaciones de interés y elegir finalmente <1 mayor tamafio muestral. Alternativamente, puede identificarse Ja asociacién de mayor interés y catcular con base en ésta el tamafio mues- tral requerido, caso en el cual los resultados correspondientes a algunas de Jas demds asociaciones pueden ser negativos debido simplemente al insu- ficiente tamafin muestral para detectarlas. Referencias bibliograficas L. Breslow NE, Day NE. Statistical Methods in Cancer Research. Vol. Yi: the Design and Analysis of Cohort Studies. Lyon, Inemacional Agency for Research on Cancer, 1987. 2. Chase G, Klauber MR. A grarh of sample sizes for retrospective Studies. American Jour- nal of Public Heabih. 1965; (55): 1993-1996. 3. Fleiss JL. Statistical Methods for Rates and Proportions, 2nd ed. New York, John Wiley and Sons, 1981. 4, Hays WL. Statistics. New York, Holt, Rinehart and Wiston, 1963. 5. Mueller J, Schuessler K, Costner H. Statistical Reasoning in Sociology. Boston, Houghton Mifflin Co. 1971. 6. Schlesselman JJ. Sampte Size Requirements in Cohort and Case-Control Studies of Dis- ease. American Journal of Epidemiotogy. 1974; (99): 381-384. 7. Schlesselman J}. Case-Conmoi Suudies. New York, Oxford University Press, 1982. 8. Smith P. Curso de epldemiologia de cincer (Noms). Imemational Agency for Research on Cancer, IARC, Heiidelberg, Alemania, 987, Anexo Distribuciones probabilisticas: * Distribucién normal estandar + Distribucién t de Student " Distribucién de chi cuadrado Anexo4253- Distribucién normal estandar Probabiidades acumuiadas Z 00ers ks 8.0 0.5000 9.5080 508 0.5120 O5160 05199 95239 0.5779 OT 0.539 0543G 05478 05517 0.5557 0.5596 05636 05575 02 05793 0.5832 QS871 0.5910 G5BM8 05987 6026 0,6064 0.3 06179 0.6217 08255 0.8793 0.6311 05368 06406 0.6443 O4 0.8554 0.6592 QESzR “8664 0.6700 6735 DETI2 06808 OS 06915 0.5950 O59B5 0.7019 0.7054 0708 07123 07157 QE 0.7257 0,729 7324 0.7357 0.7389 07422 a74ss 0.7408 @} 0,758 O76 Q7802 0,767 0,7703 0.7734 OTTSA 0.7794 98 0,788 O,7910 07999 0.7967 0.7995 0.8023 OADs1 OAn7e OS OBIS? 0.8186 8212 832 OLEZEA O,8RES 8315 0.8340 0.6113 0.5438 0.8451 0.885 0.8508 0.8531 oBssa 0.8577 0.8643 08665 0.686 0.8708 0.8779 0.879 OA77 9.700 0.8042 0,8869 O.BHBR O,B907 0.80725 0.803 08952 0.8960 0.9052 03049 0.9066 0.9082 0.9099 9718 Ogi31 o9147 9.9192 09207 09722 00236 O.9St 0.9265 99279 0.9202 0.9332 095 09357 0.9370 0.9982 G93¢ 9m 0.9818 0.9652 G.3a63 0.9474 0.9884 0.9895 0.9505 09515 0.9525 0.9554 O,9564 0.9573 0,9582 0.9591 0.9599 O98 0.9516 0.9641 0.9642 0.9636 0,9664 0.9671 0.9678 09885 0,953 O71) 99719 O97 29732 0573 09744 09750 09756 0.9772 09778 0.9783 o9788 09703 CSTE O98? 0.9808 0.9821 0.0826 0.9030 9.9834 0.9838 05842 O98 0.9850 D961 0.9864 0.9858 O9R71 0.9875 OsH7a Osan 09ead 0.9093 9.3896 0.9858 9,9901 $908 0.9006 o9009 0.0011 0.9918 0.9920 0.9072 n9R74 0.9927 09979 O9891 0.9937 25 O.993K 0.99 O954 9.9943 0.0945 0.9045 a.9988 0.9540 26 = — 0.9953 09953 09956 9.9957 0.9959 0.9960 9.9%1 0.9967 27° 0.9985 0.9966 09967 D998 0.8969 0.9970 OD871 D972 09973 0.9974 2 09974 0.9975 09975 0.9977 09977 0.9978 9.9979 0997 O998 09961 2S 0.9981 0.9962 09982 9.9983 0,984 0.9986 GINS 09985 09985 09985 40 OS8BG 0.9987 09987 9.9988 0,5988 09989 a9ND 09089 02950 oomD 21 0.8990 pg98t a.981 0.9991 0.9902 09982 C9m2 usm o5Ne OMB 37 0.8991 0.9993 0.9984 o.9994 0.9984 C998 9904 U.99ms O99 09995 23 08095 09995 0.9995 0.9996 05995 0.9996 986 O99 0995s 09097 a4 06987 0.9987 9.9957 0,997 0.9997 0.9997 09997 09997 0.9957 ON9NH 25 0.9598 09998 1.9996" 0.9898 D698 Oosss osmB nga Ass OSI 25 05998 0.9999 es 05999 0.9999 0.9999 osm9 a58e D.9mt OoNED 2.7 0,809 “o9a99 09990 0.9999 0.2999 0.9m gms one 0.ea9 O.gsea 28 08099 0.9999 9099 nessa o.c089 o.9999 osm a.se9 OLssGS Ope" 39 1,0000 254/ Hewdologia de la ievertigacién_. Distribuciont de Student ‘Grados 28 ‘Percentiles Hered 556575 EDS ORE ROS 1 8488 OD 1962 2.07 6314 12,705 SLANN 63,657 636.519 2 te Os 1385 1G 2204303665 NS 31.599, 3 0137 oem rzso 1.688 2353-3387 Agata 12824 4 ting gata 11901593 2.182 2976-377 4.604 ATO 50a Oa8 486 1ATE Zs 257 BRS 4.02266 5 OAS 04D O7TE 3138 amg = 2487 34s 8707 888 Ph ey ee ce ee 2 DA] G399 DFR Tew 1.397 1.800 290) 26S 855 ROH $02 0398 OOS 0D 4383892 2am 283250478 wm 0290s? 70D asda WIZ 2228 ee SN 4.387 tf =m 039568? 10N8 1.363 TBE 22012718 5.106 a7 AMR OS ORS MKS 1.35G 1782-2179 2681-3055 4315 3 N28 04 De LOM LAD LAY 2160-2650 3012 4224 4 one 30a 061,078 MS 1781S 2.977 414 1% OB 0293 Og om NaAT 758 21 edz 2987 4073 Pe ae ee er ee ee ee 17 OB O82 seD 1,069 4,993 ad 21D 2ST aR 36S «ORT 0882 O62 0B? 1880 173H Aor 2s? 2a BZ ne ee ee sd 20a? ange toca 1s tas 2006 2SNE Baas .8BD re ee eM ee 22-27 O38 ORS 10811211717 aA 0B ats 5,77 27 0ut2?O8BG 68S 1,000 17M 2068 2.500 2R0T 3,768 127390 6H 1.059 AIM 20682822787 3,748 25127-0390 Osea 1,058 1708 2,080 2.485 2,787 3,725 8 02703800884 1,058 1705 208624792778 3,707 270127 0389 eed 1,057 1708 308224732771 3.880 28” 0127 aBs 0.883 3,056 170) 2,008 2457-2783 3.57A 220127 O3B9- 0683 1,058 veg 708524622756 3.659 so 0127 3D OED 105513101687 2.002457 2.750 5.66 as 0127 pags 9,682 1.052130 7.690 20024882724 890 4 (N26 OS Ose AOSD 1308 168k ORT 2423-2708 3.551 6 02S 0388 0KHD 194g Tay] 16™ 2014 2412-260 5,520 5D (08260382579 1,047 1298157 0240S 267 AE 6 026 0387 O87) 15128867000 2380 Z6e0 3.480 7D 026-3 OTB 3h MG] 1,994 2381 RMB 3,635, mo «02803870578 1063 12m. 268” 2.416 so (DA26 UST «OST 1042 325) 1.062 1.987 2368-2652 32 sm 012603860677 Nz 129016601984 22826 3.290 #2026386 OST 1a 128916581080 2ASB ENF 3,873 tm 126 E58G ETE Noe 8G 1977-2353 BEM 3.364 7 ONZE .3RGO67G 10D THT 87E «23502607 3.352 ye 025038 OTG TASH 6SS 1.979 234? 2.609 3.385. 200 (Ize ONG 071A 1285 16a 18722345 2.601 3.340 mm OI2G OBS OTe 1,036 282601862326 2.576 3.204 anexo/ 255 Distribucién de chi cuadrado radon do Pereentiles wed 530mm mms 1 7 1mm 362 28 6535 1215 2 MER 2a0R 4219 aan 3210 15202 2 ze anes az 345 70 4 sou ag78 zm wz? 39997 5 51 apse oe 15086 2an5, ‘ ga 7332 roysas ree? 2am 2 7 83 12017 145, 2508 ‘ as! gst shez 20.000 258 3 sau esse se 266s 2o.ses. @ yaar 17a 13907 23708 i20 w 1159 12399 sas ans aa a 1e3e aan 39 zanr sewer a 1363 15,19 as012 27.608 36078 « 146956222 71.64 ara aan is 1s7 47302 22.307 ans%e aan 1" is70 1eae aaa 32.000 1308 @ Wan 9511 20769 pees ara79 = Ves 20501 72760 25.989 32005 at 2 1g910 aise 23900 27.208 36.191 8973 » O95 22775 28438 28.412 2566, oan a 2190! 29886 msn aso. 2 2a0s 24930 a0 sean, a 2a061 76015 28022 32007 41838 5200 “ 25105 27096 29353 33.196 osm 08 5 21a BATT 3087S 34 3 au sanar Fy WIN 220 85 558 asa S607 2 ra2m Sams 32912 36.341 4903 sansa ™ 29209-31391 3am? 37516 278 59300 2 302M Fag! 35.09 19,07 45a 0735 ” BU26 gas e280 Le se98t Bai6e a 3ea7s pase 1778 46.09 S134 so.00 2 sys2 ates 47769 51,005 8691 76055 a e676 44st RTS 5780S H.oHe v9.37 2876 z Sieoa $4721 Satge GIG? 7.50 7120 75354 901 rs GUS 652 we TARY mon 20 aRa7e 102895 ” Ya308 TSE 7OIIS OST S50 s5023 100.425 nage » gases 26120 904s 36.78 WAM tone: 112379 vzoze1 Fo t 334 SATS S524 TONSA TO7SES TINS UIE ISE 124116 128200 140,762 too 7729 92.179 99.336 107 9K5 JOE 111.667 T1GS 12AH2 12956) 135A 14IE0 152167 120 95.0S TNA 119.334 128789 II7EIE THDAOS ANTE SST TRIN 1SE.950 163688 177602 142 1934659 130-766 130334 Jaxeot 1a26 sRAsA 151.7 veRGI 7G teis4D TeREAT IOTENT 10) 131756 150.158 158.304 I6e,g0q LeME7e 175428 MAIN TEMSIG 196915 70452 2O9mMs IZSaNT 100 16896 VES 179.324 1BLITA 180486 195749 204906 21208 290% 727058 28287 TaR0KN 200 108.279 108,019 199,304 2044 mORSES TIES HEM! ASA DIE LABS 255261 772423 Airé L, Bentall HH et al, Relationship beeen cuncer of stomach and ABO blood groups. British Joumal of Medicine, 1953; (1): 758. Altman DG. Statistics and ethics in medicel research, Ill: How large a sample? British Medi- cal Journal. 1980; (281): 1336-1338. American Heart Association. Risk factors and coronary heart disease. Circulation. 1980; (62): 449A-455A, Antunes CM, Stolley-PD, Rosenstein NB et al. Endometrial cancer and estrogen use. Report of w large case-control smidy. New England Journal of Medicine. 1979; 900-913. Amnitage P. Statistical Methads in Medical Research, London, Blackwell Scientific Publica- tions, 1975. Asmitage P, Gehan EA. Statistical methods for the identification and use of prognostic fac- tors. International Journal of Cancer, 1974; (13); 16-36. Armstrong 8, Doll R. Environmental factors and cancer incideace and mortality in different ‘countries, with special reference io dietary practices. Jnternational Journal of Cancer. 1975: (15): 617-631 258 / Meiodologia de 1a investigecién.. ‘Aspein Myocardial Infarction Stady Research Group. A reniosnized,comolle tit} of i ‘nin persons recovered from myocardial infarction. JAMA, 1980; 7 (243): 661-659, Bailey NT. Staiisical Methods in Biology. London, The English Universities Press, Lid, 1972, Banco Mundial Informe sobre ef Desarroiio Mundlat 1993: Invertir en Salud. Banco Miu dis}, Washington, D.C. 1993, ‘Baran BA. ‘The effects of miscinsification on the estimation of elative risk. Biometrics. 1977; G3p 414-418, Beaglehole & Bot R, Kjellstrom. Basic Epidemiology. Geneva. World Health Organizs- tion, 1993, perigon 5, Gngz RP. Calculation of survival rates for cancer, Proceedings of the Staff Mee- tings of the Mayo Clinic, 1950; (25): 270-286. ‘Bernard C., Ar Introduction to the Study of Experimenial Medicine. Transl: Henry Copley 6 New York, Dover Publications, 1957, Bilewice WZ. Tue efficiency of matched samples: sx empirical investigation, Biometrics. 1965; (21): 623-644, Blot WI, Day NE. Synergism and interaction: Aie they equivalent? American Journal of Epi- demiolegy. 1979, (110): 99-100, BMDP, Univecsity of California, Health Sciences Cempnting Facilities, Los Angeles, Cali- fomia, 90024, USA. . Boring BG. The naure sind history of experimental conrol, Amerisar Journal of Prychlatry. 1954; (67): 573-89. Bradford HA. A short textbook of medica! stainies, Locsin, Hodder & Stoughton, 71, Breslow NE, Day NE. Statistical Methods in Cancer Research, Vol. : The Analysis of Case Control Snudy. Lyon, Interitional Agency for Research ou Cancer, 1980. Breslow NE, Day NE. Statistical Methods in Cancer Research. Vol. It: The Design and Ana- lysis of Cohort Srudies. Lyon, intemacional Agency for Research on Cancer, 1987. ‘Bross 1. Misclassificetion in 2x 2 tables. Biometrics. 1954; (10):478-486. ‘Buck C, Poppe:'s philosopiy for epiderictogists, Inernational Journal of Epidemiology. 1975; (4y. 159-168. Buckiey J. James J. Linear regression with censored data. Biometrika, 1979; (66): 429-436. Cadavid G, Londofo JL, Zapata AM et al. Alganos faciores de ricego para la enfermedad ca- otfdea obstructive: extadio de casos y convroles ex ejecucién. Centro de Investigacio- nes médicas de Antioquia, CIMA, Medeliin, 1952. Carrall KX, Experimental evidence of dietary factors und hormone dependent cancers: Can- per Research. 1975: (35): 3374-3383. Cassel JC. Summary of major findiags of the Evans County besrt disease study. Archives of Internal Medicine. 1971; (128); B87-889. Cavazos N, del Rio A, Izuzola JA et al. Ais de vids potoncialmente peridoe ev otilidad en. cl andlisis de 1a mortalidad en México. Salud Publica de México..1 Celede, Boletit Demogrifico de América Latina, proyecsiones Se poblaci6n, sfos calenda- ‘hos 1950-2000, 1991; (48): 31. woe Bittiografia/ 259 Cole P. The evolving case-control study. Journal of Chranic Diseases. 1979; (32): 15-27. Cole P, Bn: Breslow NE, Day NE, Statistical Methods in Concer Research. Vol. 1: The Analysis ‘of Case-Cootral Suudy, Lyon, Intemational Agency for Resoarch in Cancer, 1980. Colirién KM. Fundamentos de epidemiologia. Medid, Diaz de Santos, 1990. Copeland KT, Checkoway H, Holbrook RH, McMichaol AJ, Bias due to misclassification in the estimate of relative risk, American Journal of Epidemiotogy. 1977; (105): 488-495, Cornfield J. A method of estimating comparative rates fron clinical data. Application to can- ccer of the lung, breast and cervix. Journal of the Notional Cancer Institule. 1951; (1: 1265-1275. Cornfield J. Suuistical relationships and proof in medicias, American Statistician, 1954; (8): 19-23, Cornfield J. Joint dependence of risk of coronary heart disease on serum cholesterol and sys tolic blood pressure: a discriminant function anstysis. Federal Proceedings. 1962; (21): 58-61. Corfield J, Haenszel W, Some aspects of retrospective studies. Journal of Chronic Diseases. 1960; (11): $23-534, Corea P. Epidemiologic cnrrelations between diet and cancer frequency. Cancer Research. 19BE; (41): 3685-3690. Covell G. Relaciones entre la parasitemia malérica y tos s{rsomas de la enfermedad. Bolen de la Oficina Sanitaria Panamericana, L. 1961: G): 223-240, Cox DR. The onalysis of exponentially distributed life-timos with two types of failures. Jour- nal of de Rayal Statistical Society, Series B. 1959; (21); 411-421. Cox DR. Some applications of exponentially ordered scores, Joumal of the Roval Statistical Society, Series B. 1964; (26): 103-110. Cox DR: The Analysis of Binary Data, London, Methuen, 1970, Cox DR. Regression models and life tables, Journal of the Royal Statistical Saciery, Series B, 1972; (34): 187-202. Cox DR, Oakes D. Analysis of Survival Data. New York, Capman and Hall, Co,, 1984. Cutler SJ, Ederer F. Maximum wilization of the life table method in analizing survival, Jour- anal of Chronie Diseases, 1958; (8): 699-712, Chase G. Klauber MR. A graph of sample sizes for retrospective stadies, American Joumal af Public Health. 1965; (55): 1993-1996. Dunicl W. Biossatistics: A Foundation for Analysis in the Health Sciences, New York, Joha Wiley and Sons, 1983, Dawber TR. The Framingham Study: The Epidemiology af Atherosclerotic Disease. Cambridge, MA. Harvard Lintversity Press, 1980. Dewber TR. Meadors GF, Moore FE Epidemiological apraaches to heart disease: The Framingham Study, American Journal of Public Health, 1951;286 (41): 279-286, Dean AG et al. Epi Info, Version 6.0: a Word proceszing, database, and statistics program Sor epidemiology on microcomputers. USD, Inc., Stonc Mountain, Georgia, 1994. Dean HT, Amold FA, Hivone E, Domestic water and dental caries, V. Additional studies of the relation of ftuoride domestic waters to dental caries experience in 4425 white 260 Metadotogta de ls investigacin.. : children, aged 12.10 14 years, of 19 cities in 4 states, Public Healsh Reports. 1942; (S87): 1155-1179. DeMets DL, Hardy R, Friedman LM et al, Statistical aspects of early termination in the Beta- Blocker Heart Attack Teal. Controlled Clinical Trials. 1984; (5): 362. Dempsey M. Decline in teberoulosis: the death rate falls to tell he entire story. American Review of Tuberculosis, 1947; (B6}: 2. Dixon Wi, Massey FJ. Introduction to Statistloal Analysis, Tokyo, McGraw-Hill, 1963. Doll R, Gray R, Hafner B ot al. Mortality ia relation to smoking: 22 years’ observations on ‘female British doctors, Britisk Medical Journal. 1980; (280%: 967-971. Doll R, Hill AB, Mortality in relation to smoking: 10 years* observations of British doctors. Britich Medical Journal. 1964; 1399-1410. Doll R, Peto R. Las eausas del céncer. Barcelona, Salvat Bditores, 1989. Donner A. Approaches to sample size emimation in the design of clinical tinls - A review ‘Suavisnics in Medicine. 1984; (3); 199-234. Damn HF, Some epplicstions of biomeiry in the collection and evaluation of medica dart Journal of Chronic Diseases. 1985; (1): 638-659. Dém HF, Some problems arising in prospective and retrospomtive studies of the etiology of tisease. New England Journal of Medicine, 1959; (261): 571-379. Draper NR, Senith H. Applied Repression Analysis. 2nd ed. New York, John Wiley ané Sons, 1981. Drasar BS, Irving D. Environmental factors and concer of the colon and breast, British Jour- nal of Cancer. 1973; 7): 167-172. Dublin LI, Lotka AJ, Length of Life. New York. Ronald Press, 1936. ‘Durkheim E. Sucide: A Study in Sociology. New York, Free Press, 1951. EGRET, Statistics and Epidemiology Research Corporation, 909 Northeast 43 rd. Strost, Suite 202, Seattle, WA 98108, USA. landt-Fohnson R. Definition of rates: some remarks on their use and misuse. American Jour- nal of Epidemiology. 1975; (102): 267-271. Fiveback 1. Estimation of survivership in chronic disease: the actuwial method. Journaf of the Amerlean Statistical Association, 1958; (53): 420-440, EPISTAT, Eplstat Services, 2011 Cap Rock Circle, Richardson, Texas, USA. Epstein FH, Napier JA, Block WD et al. The Tecumseh Suidy. Archives of Eavironmenta! Health. 1970; C21}: 402-407. Fears TR, Scotto J. Changes in skin cancer morbidity between 1971-72 y 1977-78. Journal ofthe National Cancer Instituse. 1982; (69): 365-370. Feinstein AR, Clinical Biontatistics. Saint Louis, C.V.Mosiey, 1977. Fisher B, Bauer M, Margolese R et al. Five-year results of a randomized clinical tial compa- Ting total mastectomy and segmental mastectomy with oe without radietion in the treat: ment of breast cancer. New England Journal af Medicine. 1985; (12): 665-673. Fisher RA. The arrangements of field experiments, Journal of the Ministry of Agriculture. Great Britain, 1926; (33): 903-513, . Bibliografia/ 261 Fleiss IL. Statistical Methods for Rates and Proportions, Zod ed. New York, Johet Wiley aos Sons, 1981. Francis TF, Korns RF, Voight RB ét al. An evaluation of the 1954 polyomelitis vaccine trials. American Journal of Public Health, (953;445): 1-63. Freiman JA, Chalmers TC, Smith H et al. The importance of beta, the type Il error and sample size in the design and interpretation of the raadomized conirol trial: survey of “negative” tials. New England Journal of Medicine. 1978; (299): 690-494. Freand JE. Mathematical Statistics, 2nd ed. London, Prentice Hall. 1971. Friedman LM, Furberg CD, DeMete DL. Fundamentals of Clinical Trials. Boston, John Wright, 1981. Gardner JW, Sanbarn IS. Years of potential life lost, What docs it measure? Epidemiology. 1990, (1); 322-329. Gehan EA. A generalized Wilcoxon test for comparing arbitrarily singly-censoced samples. Biometrika, 1965; (52): 203-223. Gohan GA. Estimating survival functions from the life table. Joumal af Chronic Diseases. 1959; (21): 629-644, Ghana Health Assesment Project Team, A quantitative method of assesing the health impact of different diseases in less developed counties. /nremnariona! foumal of Epideminiogy, 198; (10y: 73-80. Goldberger J. Waring CH, Tanner WF. Pellagra prevention by diet among institucional in- mates. Public Health Reports. 1923; (38): 2361-2368. Graunt J. Natural and political observations mentioned in a following index, and made upon the Bills of Morality. London, 1662. Guerrero R, Gonziilez CL. Medina E, Epidemiologin. México, ‘Addison. Wesley Iber. umericana, t986. ‘Halperin M, Blackwelder W, Vertex J. Estimation af the Multivariate: Logistic Risk Function and Maximum Likelihood Appmaches, Journal of Chronic Diseases. 1971; (24). 125-158, ‘Halperin W, Beaumont J, Reeve G et ai. The Cohort Sindy. En: Epidemiology of Occupation- al Health, Karvonen M, Mikheev M (eds). World Health Organization, Copenhagen, 1986. ‘Hays WL. Statistics, New York, Holl, Rinehart and Wiston, 1963, Heinonen OP, Stone D, Shapira S. Birth Defects and Drugs in Pregnancy. Littleton, Mas- sachusets, Publishing Sources Group, 1977. ‘Hennekens CH, Buring JE. Epidemiofogy in Medicine, Boston, Little Brown and Co., 1987. ‘Hijer MC. Mortalidad por lesiones accidentales ¢ intescionales an el Distrito Féderal de 1970 8 1986. Salud Piblica de Mézieo. 1990; (32): 395-404. Hill AB. Observation and experiment, New Engiand Journal of Medicine. 1993; (248): 995- 1001. Hill AB. The environment and disease: association or citation? Proceedings of the Royal Society of Medicine. 1965; (58): 295-300. Hill B. Principtes of Medical Sasistics, London, The Lancet Limited, 1971. 262./ Metodologte He ia invertigacide... Hipertension Detection und Follow-up Program Cooperstive Group. Five-year findings of the tipertensicn detection and follow-up propram: 1. Reduction in mortality of pecsons ‘vith kigh blood pressure, including mild hipertension. JAMA. 1979; (242 2562-2571. Horwitz Ri, Feinstein MD. Alternative analytic methods for case-contro) stadies of estrogens and endometrial cancer, New England Journal of Medicine. 1978; (299): 1089-1094. Hosmer D, Lemeshow 8, Applied Logistic Regressin. New York, John Wiley ané Sors, 1589, Intemational Agency for Research on Cancer. Vol, V. Cancer incidence in Five Continents. Lyon 1987. Kain HA, Sempos CT. Statistical Methods in Epidemiology. New York, Oxford University Press, 1989. Kalbfleisch JD, Prentice RL. The Statistical Anatysis of Failure-Time Dasa. New York, John ‘Wiley and Sons, 1980. Kanntl WB, Gordan T. The Pramingham Stady: an epidemiological invertigation of cat- diovascular disease, Deparmcot of Health, Education and Welfare. Public Health Service, National Instiuite of Health, DHEW Publication, 1974; 574.599. Xaplen EL, Meier P. Non-partmetric estimation from incomplete observations. Journal af the ‘American Startstical A ssociasion. 1958; (53); 457-481. Kelsey 1. Thompson WD, Evans AS. Meihods in Observational Epidemiology. New York, Onord University Press, 1986. Keslinger FN. Foundations of Behavioral Research. New York, Hol, Rinehart and Winston, 1973. Kleinbaum DG, Kupper LL. Applied Regression Analysis and Other Multivariable Methods. Belmont, California, Wadsworth Publishing Co.. 1978. Kisinbaum DG, Kupper LL, Cassel 3, Tyroier H. Multivarime analysis of risk of coronary heart disnase in Evans County, Georgia. Archives of Iniemal Medicine. 1971; (128): 943-948, Kisinbaum DG, Kupper LL, Morgenstern H, Epidemiologic Research. Belmont, California, Lifetime Learning Publications, 1982, Koopman IS. Interaction between discrete causes. American Journa! of Epidemiology. 198); (113): 716-724, Koopman JS, Prevots DR, Vaca-Marin MA tt al. Determinants and predictors of dengue in- fection in Mexico, American Journal of Epictemiology. 1991; (133): 1168-1178, Kuppef LL, Hoyas MD. Interaction in epidemiologic sadies. American Journal of Epidemiology. 1978; (0B): 447-453. Kupper LL, Karon JM, Kleinbaum D et al. Matching in epidemiotogic sudies: validity and efficiency considerations. Biametrics. 198); (37): 271-291. Lee ET. Statistica! Methods for Survival Data Analysis. Belmont, California, Lifetime Lear ing Publicetions, 1980. Lilienfeld AM, Cétoris péribus: the evolution of the clinical tial, Presented at the 54th an ‘nual meeting of the American Association for the Histary of Medicine, Toronto, Canada, May 198). Anexo Distribuciones probabilisticas: * Distribucién normal estandar + Distribucién t de Student " Distribucién de chi cuadrado Anexo4253- Distribucién normal estandar Probabiidades acumuiadas Z 00ers ks 8.0 0.5000 9.5080 508 0.5120 O5160 05199 95239 0.5779 OT 0.539 0543G 05478 05517 0.5557 0.5596 05636 05575 02 05793 0.5832 QS871 0.5910 G5BM8 05987 6026 0,6064 0.3 06179 0.6217 08255 0.8793 0.6311 05368 06406 0.6443 O4 0.8554 0.6592 QESzR “8664 0.6700 6735 DETI2 06808 OS 06915 0.5950 O59B5 0.7019 0.7054 0708 07123 07157 QE 0.7257 0,729 7324 0.7357 0.7389 07422 a74ss 0.7408 @} 0,758 O76 Q7802 0,767 0,7703 0.7734 OTTSA 0.7794 98 0,788 O,7910 07999 0.7967 0.7995 0.8023 OADs1 OAn7e OS OBIS? 0.8186 8212 832 OLEZEA O,8RES 8315 0.8340 0.6113 0.5438 0.8451 0.885 0.8508 0.8531 oBssa 0.8577 0.8643 08665 0.686 0.8708 0.8779 0.879 OA77 9.700 0.8042 0,8869 O.BHBR O,B907 0.80725 0.803 08952 0.8960 0.9052 03049 0.9066 0.9082 0.9099 9718 Ogi31 o9147 9.9192 09207 09722 00236 O.9St 0.9265 99279 0.9202 0.9332 095 09357 0.9370 0.9982 G93¢ 9m 0.9818 0.9652 G.3a63 0.9474 0.9884 0.9895 0.9505 09515 0.9525 0.9554 O,9564 0.9573 0,9582 0.9591 0.9599 O98 0.9516 0.9641 0.9642 0.9636 0,9664 0.9671 0.9678 09885 0,953 O71) 99719 O97 29732 0573 09744 09750 09756 0.9772 09778 0.9783 o9788 09703 CSTE O98? 0.9808 0.9821 0.0826 0.9030 9.9834 0.9838 05842 O98 0.9850 D961 0.9864 0.9858 O9R71 0.9875 OsH7a Osan 09ead 0.9093 9.3896 0.9858 9,9901 $908 0.9006 o9009 0.0011 0.9918 0.9920 0.9072 n9R74 0.9927 09979 O9891 0.9937 25 O.993K 0.99 O954 9.9943 0.0945 0.9045 a.9988 0.9540 26 = — 0.9953 09953 09956 9.9957 0.9959 0.9960 9.9%1 0.9967 27° 0.9985 0.9966 09967 D998 0.8969 0.9970 OD871 D972 09973 0.9974 2 09974 0.9975 09975 0.9977 09977 0.9978 9.9979 0997 O998 09961 2S 0.9981 0.9962 09982 9.9983 0,984 0.9986 GINS 09985 09985 09985 40 OS8BG 0.9987 09987 9.9988 0,5988 09989 a9ND 09089 02950 oomD 21 0.8990 pg98t a.981 0.9991 0.9902 09982 C9m2 usm o5Ne OMB 37 0.8991 0.9993 0.9984 o.9994 0.9984 C998 9904 U.99ms O99 09995 23 08095 09995 0.9995 0.9996 05995 0.9996 986 O99 0995s 09097 a4 06987 0.9987 9.9957 0,997 0.9997 0.9997 09997 09997 0.9957 ON9NH 25 0.9598 09998 1.9996" 0.9898 D698 Oosss osmB nga Ass OSI 25 05998 0.9999 es 05999 0.9999 0.9999 osm9 a58e D.9mt OoNED 2.7 0,809 “o9a99 09990 0.9999 0.2999 0.9m gms one 0.ea9 O.gsea 28 08099 0.9999 9099 nessa o.c089 o.9999 osm a.se9 OLssGS Ope" 39 1,0000 254/ Hewdologia de la ievertigacién_. Distribuciont de Student ‘Grados 28 ‘Percentiles Hered 556575 EDS ORE ROS 1 8488 OD 1962 2.07 6314 12,705 SLANN 63,657 636.519 2 te Os 1385 1G 2204303665 NS 31.599, 3 0137 oem rzso 1.688 2353-3387 Agata 12824 4 ting gata 11901593 2.182 2976-377 4.604 ATO 50a Oa8 486 1ATE Zs 257 BRS 4.02266 5 OAS 04D O7TE 3138 amg = 2487 34s 8707 888 Ph ey ee ce ee 2 DA] G399 DFR Tew 1.397 1.800 290) 26S 855 ROH $02 0398 OOS 0D 4383892 2am 283250478 wm 0290s? 70D asda WIZ 2228 ee SN 4.387 tf =m 039568? 10N8 1.363 TBE 22012718 5.106 a7 AMR OS ORS MKS 1.35G 1782-2179 2681-3055 4315 3 N28 04 De LOM LAD LAY 2160-2650 3012 4224 4 one 30a 061,078 MS 1781S 2.977 414 1% OB 0293 Og om NaAT 758 21 edz 2987 4073 Pe ae ee er ee ee ee 17 OB O82 seD 1,069 4,993 ad 21D 2ST aR 36S «ORT 0882 O62 0B? 1880 173H Aor 2s? 2a BZ ne ee ee sd 20a? ange toca 1s tas 2006 2SNE Baas .8BD re ee eM ee 22-27 O38 ORS 10811211717 aA 0B ats 5,77 27 0ut2?O8BG 68S 1,000 17M 2068 2.500 2R0T 3,768 127390 6H 1.059 AIM 20682822787 3,748 25127-0390 Osea 1,058 1708 2,080 2.485 2,787 3,725 8 02703800884 1,058 1705 208624792778 3,707 270127 0389 eed 1,057 1708 308224732771 3.880 28” 0127 aBs 0.883 3,056 170) 2,008 2457-2783 3.57A 220127 O3B9- 0683 1,058 veg 708524622756 3.659 so 0127 3D OED 105513101687 2.002457 2.750 5.66 as 0127 pags 9,682 1.052130 7.690 20024882724 890 4 (N26 OS Ose AOSD 1308 168k ORT 2423-2708 3.551 6 02S 0388 0KHD 194g Tay] 16™ 2014 2412-260 5,520 5D (08260382579 1,047 1298157 0240S 267 AE 6 026 0387 O87) 15128867000 2380 Z6e0 3.480 7D 026-3 OTB 3h MG] 1,994 2381 RMB 3,635, mo «02803870578 1063 12m. 268” 2.416 so (DA26 UST «OST 1042 325) 1.062 1.987 2368-2652 32 sm 012603860677 Nz 129016601984 22826 3.290 #2026386 OST 1a 128916581080 2ASB ENF 3,873 tm 126 E58G ETE Noe 8G 1977-2353 BEM 3.364 7 ONZE .3RGO67G 10D THT 87E «23502607 3.352 ye 025038 OTG TASH 6SS 1.979 234? 2.609 3.385. 200 (Ize ONG 071A 1285 16a 18722345 2.601 3.340 mm OI2G OBS OTe 1,036 282601862326 2.576 3.204 anexo/ 255 Distribucién de chi cuadrado radon do Pereentiles wed 530mm mms 1 7 1mm 362 28 6535 1215 2 MER 2a0R 4219 aan 3210 15202 2 ze anes az 345 70 4 sou ag78 zm wz? 39997 5 51 apse oe 15086 2an5, ‘ ga 7332 roysas ree? 2am 2 7 83 12017 145, 2508 ‘ as! gst shez 20.000 258 3 sau esse se 266s 2o.ses. @ yaar 17a 13907 23708 i20 w 1159 12399 sas ans aa a 1e3e aan 39 zanr sewer a 1363 15,19 as012 27.608 36078 « 146956222 71.64 ara aan is 1s7 47302 22.307 ans%e aan 1" is70 1eae aaa 32.000 1308 @ Wan 9511 20769 pees ara79 = Ves 20501 72760 25.989 32005 at 2 1g910 aise 23900 27.208 36.191 8973 » O95 22775 28438 28.412 2566, oan a 2190! 29886 msn aso. 2 2a0s 24930 a0 sean, a 2a061 76015 28022 32007 41838 5200 “ 25105 27096 29353 33.196 osm 08 5 21a BATT 3087S 34 3 au sanar Fy WIN 220 85 558 asa S607 2 ra2m Sams 32912 36.341 4903 sansa ™ 29209-31391 3am? 37516 278 59300 2 302M Fag! 35.09 19,07 45a 0735 ” BU26 gas e280 Le se98t Bai6e a 3ea7s pase 1778 46.09 S134 so.00 2 sys2 ates 47769 51,005 8691 76055 a e676 44st RTS 5780S H.oHe v9.37 2876 z Sieoa $4721 Satge GIG? 7.50 7120 75354 901 rs GUS 652 we TARY mon 20 aRa7e 102895 ” Ya308 TSE 7OIIS OST S50 s5023 100.425 nage » gases 26120 904s 36.78 WAM tone: 112379 vzoze1 Fo t 334 SATS S524 TONSA TO7SES TINS UIE ISE 124116 128200 140,762 too 7729 92.179 99.336 107 9K5 JOE 111.667 T1GS 12AH2 12956) 135A 14IE0 152167 120 95.0S TNA 119.334 128789 II7EIE THDAOS ANTE SST TRIN 1SE.950 163688 177602 142 1934659 130-766 130334 Jaxeot 1a26 sRAsA 151.7 veRGI 7G teis4D TeREAT IOTENT 10) 131756 150.158 158.304 I6e,g0q LeME7e 175428 MAIN TEMSIG 196915 70452 2O9mMs IZSaNT 100 16896 VES 179.324 1BLITA 180486 195749 204906 21208 290% 727058 28287 TaR0KN 200 108.279 108,019 199,304 2044 mORSES TIES HEM! ASA DIE LABS 255261 772423 Airé L, Bentall HH et al, Relationship beeen cuncer of stomach and ABO blood groups. British Joumal of Medicine, 1953; (1): 758. Altman DG. Statistics and ethics in medicel research, Ill: How large a sample? British Medi- cal Journal. 1980; (281): 1336-1338. American Heart Association. Risk factors and coronary heart disease. Circulation. 1980; (62): 449A-455A, Antunes CM, Stolley-PD, Rosenstein NB et al. Endometrial cancer and estrogen use. Report of w large case-control smidy. New England Journal of Medicine. 1979; 900-913. Amnitage P. Statistical Methads in Medical Research, London, Blackwell Scientific Publica- tions, 1975. Asmitage P, Gehan EA. Statistical methods for the identification and use of prognostic fac- tors. International Journal of Cancer, 1974; (13); 16-36. Armstrong 8, Doll R. Environmental factors and cancer incideace and mortality in different ‘countries, with special reference io dietary practices. Jnternational Journal of Cancer. 1975: (15): 617-631 258 / Meiodologia de 1a investigecién.. ‘Aspein Myocardial Infarction Stady Research Group. A reniosnized,comolle tit} of i ‘nin persons recovered from myocardial infarction. JAMA, 1980; 7 (243): 661-659, Bailey NT. Staiisical Methods in Biology. London, The English Universities Press, Lid, 1972, Banco Mundial Informe sobre ef Desarroiio Mundlat 1993: Invertir en Salud. Banco Miu dis}, Washington, D.C. 1993, ‘Baran BA. ‘The effects of miscinsification on the estimation of elative risk. Biometrics. 1977; G3p 414-418, Beaglehole & Bot R, Kjellstrom. Basic Epidemiology. Geneva. World Health Organizs- tion, 1993, perigon 5, Gngz RP. Calculation of survival rates for cancer, Proceedings of the Staff Mee- tings of the Mayo Clinic, 1950; (25): 270-286. ‘Bernard C., Ar Introduction to the Study of Experimenial Medicine. Transl: Henry Copley 6 New York, Dover Publications, 1957, Bilewice WZ. Tue efficiency of matched samples: sx empirical investigation, Biometrics. 1965; (21): 623-644, Blot WI, Day NE. Synergism and interaction: Aie they equivalent? American Journal of Epi- demiolegy. 1979, (110): 99-100, BMDP, Univecsity of California, Health Sciences Cempnting Facilities, Los Angeles, Cali- fomia, 90024, USA. . Boring BG. The naure sind history of experimental conrol, Amerisar Journal of Prychlatry. 1954; (67): 573-89. Bradford HA. A short textbook of medica! stainies, Locsin, Hodder & Stoughton, 71, Breslow NE, Day NE. Statistical Methods in Cancer Research, Vol. : The Analysis of Case Control Snudy. Lyon, Interitional Agency for Research ou Cancer, 1980. Breslow NE, Day NE. Statistical Methods in Cancer Research. Vol. It: The Design and Ana- lysis of Cohort Srudies. Lyon, intemacional Agency for Research on Cancer, 1987. ‘Bross 1. Misclassificetion in 2x 2 tables. Biometrics. 1954; (10):478-486. ‘Buck C, Poppe:'s philosopiy for epiderictogists, Inernational Journal of Epidemiology. 1975; (4y. 159-168. Buckiey J. James J. Linear regression with censored data. Biometrika, 1979; (66): 429-436. Cadavid G, Londofo JL, Zapata AM et al. Alganos faciores de ricego para la enfermedad ca- otfdea obstructive: extadio de casos y convroles ex ejecucién. Centro de Investigacio- nes médicas de Antioquia, CIMA, Medeliin, 1952. Carrall KX, Experimental evidence of dietary factors und hormone dependent cancers: Can- per Research. 1975: (35): 3374-3383. Cassel JC. Summary of major findiags of the Evans County besrt disease study. Archives of Internal Medicine. 1971; (128); B87-889. Cavazos N, del Rio A, Izuzola JA et al. Ais de vids potoncialmente peridoe ev otilidad en. cl andlisis de 1a mortalidad en México. Salud Publica de México..1 Celede, Boletit Demogrifico de América Latina, proyecsiones Se poblaci6n, sfos calenda- ‘hos 1950-2000, 1991; (48): 31. woe Bittiografia/ 259 Cole P. The evolving case-control study. Journal of Chranic Diseases. 1979; (32): 15-27. Cole P, Bn: Breslow NE, Day NE, Statistical Methods in Concer Research. Vol. 1: The Analysis ‘of Case-Cootral Suudy, Lyon, Intemational Agency for Resoarch in Cancer, 1980. Colirién KM. Fundamentos de epidemiologia. Medid, Diaz de Santos, 1990. Copeland KT, Checkoway H, Holbrook RH, McMichaol AJ, Bias due to misclassification in the estimate of relative risk, American Journal of Epidemiotogy. 1977; (105): 488-495, Cornfield J. A method of estimating comparative rates fron clinical data. Application to can- ccer of the lung, breast and cervix. Journal of the Notional Cancer Institule. 1951; (1: 1265-1275. Cornfield J. Suuistical relationships and proof in medicias, American Statistician, 1954; (8): 19-23, Cornfield J. Joint dependence of risk of coronary heart disease on serum cholesterol and sys tolic blood pressure: a discriminant function anstysis. Federal Proceedings. 1962; (21): 58-61. Corfield J, Haenszel W, Some aspects of retrospective studies. Journal of Chronic Diseases. 1960; (11): $23-534, Corea P. Epidemiologic cnrrelations between diet and cancer frequency. Cancer Research. 19BE; (41): 3685-3690. Covell G. Relaciones entre la parasitemia malérica y tos s{rsomas de la enfermedad. Bolen de la Oficina Sanitaria Panamericana, L. 1961: G): 223-240, Cox DR. The onalysis of exponentially distributed life-timos with two types of failures. Jour- nal of de Rayal Statistical Society, Series B. 1959; (21); 411-421. Cox DR. Some applications of exponentially ordered scores, Joumal of the Roval Statistical Society, Series B. 1964; (26): 103-110. Cox DR: The Analysis of Binary Data, London, Methuen, 1970, Cox DR. Regression models and life tables, Journal of the Royal Statistical Saciery, Series B, 1972; (34): 187-202. Cox DR, Oakes D. Analysis of Survival Data. New York, Capman and Hall, Co,, 1984. Cutler SJ, Ederer F. Maximum wilization of the life table method in analizing survival, Jour- anal of Chronie Diseases, 1958; (8): 699-712, Chase G. Klauber MR. A graph of sample sizes for retrospective stadies, American Joumal af Public Health. 1965; (55): 1993-1996. Dunicl W. Biossatistics: A Foundation for Analysis in the Health Sciences, New York, Joha Wiley and Sons, 1983, Dawber TR. The Framingham Study: The Epidemiology af Atherosclerotic Disease. Cambridge, MA. Harvard Lintversity Press, 1980. Dewber TR. Meadors GF, Moore FE Epidemiological apraaches to heart disease: The Framingham Study, American Journal of Public Health, 1951;286 (41): 279-286, Dean AG et al. Epi Info, Version 6.0: a Word proceszing, database, and statistics program Sor epidemiology on microcomputers. USD, Inc., Stonc Mountain, Georgia, 1994. Dean HT, Amold FA, Hivone E, Domestic water and dental caries, V. Additional studies of the relation of ftuoride domestic waters to dental caries experience in 4425 white 260 Metadotogta de ls investigacin.. : children, aged 12.10 14 years, of 19 cities in 4 states, Public Healsh Reports. 1942; (S87): 1155-1179. DeMets DL, Hardy R, Friedman LM et al, Statistical aspects of early termination in the Beta- Blocker Heart Attack Teal. Controlled Clinical Trials. 1984; (5): 362. Dempsey M. Decline in teberoulosis: the death rate falls to tell he entire story. American Review of Tuberculosis, 1947; (B6}: 2. Dixon Wi, Massey FJ. Introduction to Statistloal Analysis, Tokyo, McGraw-Hill, 1963. Doll R, Gray R, Hafner B ot al. Mortality ia relation to smoking: 22 years’ observations on ‘female British doctors, Britisk Medical Journal. 1980; (280%: 967-971. Doll R, Hill AB, Mortality in relation to smoking: 10 years* observations of British doctors. Britich Medical Journal. 1964; 1399-1410. Doll R, Peto R. Las eausas del céncer. Barcelona, Salvat Bditores, 1989. Donner A. Approaches to sample size emimation in the design of clinical tinls - A review ‘Suavisnics in Medicine. 1984; (3); 199-234. Damn HF, Some epplicstions of biomeiry in the collection and evaluation of medica dart Journal of Chronic Diseases. 1985; (1): 638-659. Dém HF, Some problems arising in prospective and retrospomtive studies of the etiology of tisease. New England Journal of Medicine, 1959; (261): 571-379. Draper NR, Senith H. Applied Repression Analysis. 2nd ed. New York, John Wiley ané Sons, 1981. Drasar BS, Irving D. Environmental factors and concer of the colon and breast, British Jour- nal of Cancer. 1973; 7): 167-172. Dublin LI, Lotka AJ, Length of Life. New York. Ronald Press, 1936. ‘Durkheim E. Sucide: A Study in Sociology. New York, Free Press, 1951. EGRET, Statistics and Epidemiology Research Corporation, 909 Northeast 43 rd. Strost, Suite 202, Seattle, WA 98108, USA. landt-Fohnson R. Definition of rates: some remarks on their use and misuse. American Jour- nal of Epidemiology. 1975; (102): 267-271. Fiveback 1. Estimation of survivership in chronic disease: the actuwial method. Journaf of the Amerlean Statistical Association, 1958; (53): 420-440, EPISTAT, Eplstat Services, 2011 Cap Rock Circle, Richardson, Texas, USA. Epstein FH, Napier JA, Block WD et al. The Tecumseh Suidy. Archives of Eavironmenta! Health. 1970; C21}: 402-407. Fears TR, Scotto J. Changes in skin cancer morbidity between 1971-72 y 1977-78. Journal ofthe National Cancer Instituse. 1982; (69): 365-370. Feinstein AR, Clinical Biontatistics. Saint Louis, C.V.Mosiey, 1977. Fisher B, Bauer M, Margolese R et al. Five-year results of a randomized clinical tial compa- Ting total mastectomy and segmental mastectomy with oe without radietion in the treat: ment of breast cancer. New England Journal af Medicine. 1985; (12): 665-673. Fisher RA. The arrangements of field experiments, Journal of the Ministry of Agriculture. Great Britain, 1926; (33): 903-513, . Bibliografia/ 261 Fleiss IL. Statistical Methods for Rates and Proportions, Zod ed. New York, Johet Wiley aos Sons, 1981. Francis TF, Korns RF, Voight RB ét al. An evaluation of the 1954 polyomelitis vaccine trials. American Journal of Public Health, (953;445): 1-63. Freiman JA, Chalmers TC, Smith H et al. The importance of beta, the type Il error and sample size in the design and interpretation of the raadomized conirol trial: survey of “negative” tials. New England Journal of Medicine. 1978; (299): 690-494. Freand JE. Mathematical Statistics, 2nd ed. London, Prentice Hall. 1971. Friedman LM, Furberg CD, DeMete DL. Fundamentals of Clinical Trials. Boston, John Wright, 1981. Gardner JW, Sanbarn IS. Years of potential life lost, What docs it measure? Epidemiology. 1990, (1); 322-329. Gehan EA. A generalized Wilcoxon test for comparing arbitrarily singly-censoced samples. Biometrika, 1965; (52): 203-223. Gohan GA. Estimating survival functions from the life table. Joumal af Chronic Diseases. 1959; (21): 629-644, Ghana Health Assesment Project Team, A quantitative method of assesing the health impact of different diseases in less developed counties. /nremnariona! foumal of Epideminiogy, 198; (10y: 73-80. Goldberger J. Waring CH, Tanner WF. Pellagra prevention by diet among institucional in- mates. Public Health Reports. 1923; (38): 2361-2368. Graunt J. Natural and political observations mentioned in a following index, and made upon the Bills of Morality. London, 1662. Guerrero R, Gonziilez CL. Medina E, Epidemiologin. México, ‘Addison. Wesley Iber. umericana, t986. ‘Halperin M, Blackwelder W, Vertex J. Estimation af the Multivariate: Logistic Risk Function and Maximum Likelihood Appmaches, Journal of Chronic Diseases. 1971; (24). 125-158, ‘Halperin W, Beaumont J, Reeve G et ai. The Cohort Sindy. En: Epidemiology of Occupation- al Health, Karvonen M, Mikheev M (eds). World Health Organization, Copenhagen, 1986. ‘Hays WL. Statistics, New York, Holl, Rinehart and Wiston, 1963, Heinonen OP, Stone D, Shapira S. Birth Defects and Drugs in Pregnancy. Littleton, Mas- sachusets, Publishing Sources Group, 1977. ‘Hennekens CH, Buring JE. Epidemiofogy in Medicine, Boston, Little Brown and Co., 1987. ‘Hijer MC. Mortalidad por lesiones accidentales ¢ intescionales an el Distrito Féderal de 1970 8 1986. Salud Piblica de Mézieo. 1990; (32): 395-404. Hill AB. Observation and experiment, New Engiand Journal of Medicine. 1993; (248): 995- 1001. Hill AB. The environment and disease: association or citation? Proceedings of the Royal Society of Medicine. 1965; (58): 295-300. Hill B. Principtes of Medical Sasistics, London, The Lancet Limited, 1971. 262./ Metodologte He ia invertigacide... Hipertension Detection und Follow-up Program Cooperstive Group. Five-year findings of the tipertensicn detection and follow-up propram: 1. Reduction in mortality of pecsons ‘vith kigh blood pressure, including mild hipertension. JAMA. 1979; (242 2562-2571. Horwitz Ri, Feinstein MD. Alternative analytic methods for case-contro) stadies of estrogens and endometrial cancer, New England Journal of Medicine. 1978; (299): 1089-1094. Hosmer D, Lemeshow 8, Applied Logistic Regressin. New York, John Wiley ané Sors, 1589, Intemational Agency for Research on Cancer. Vol, V. Cancer incidence in Five Continents. Lyon 1987. Kain HA, Sempos CT. Statistical Methods in Epidemiology. New York, Oxford University Press, 1989. Kalbfleisch JD, Prentice RL. The Statistical Anatysis of Failure-Time Dasa. New York, John ‘Wiley and Sons, 1980. Kanntl WB, Gordan T. The Pramingham Stady: an epidemiological invertigation of cat- diovascular disease, Deparmcot of Health, Education and Welfare. Public Health Service, National Instiuite of Health, DHEW Publication, 1974; 574.599. Xaplen EL, Meier P. Non-partmetric estimation from incomplete observations. Journal af the ‘American Startstical A ssociasion. 1958; (53); 457-481. Kelsey 1. Thompson WD, Evans AS. Meihods in Observational Epidemiology. New York, Onord University Press, 1986. Keslinger FN. Foundations of Behavioral Research. New York, Hol, Rinehart and Winston, 1973. Kleinbaum DG, Kupper LL. Applied Regression Analysis and Other Multivariable Methods. Belmont, California, Wadsworth Publishing Co.. 1978. Kisinbaum DG, Kupper LL, Cassel 3, Tyroier H. Multivarime analysis of risk of coronary heart disnase in Evans County, Georgia. Archives of Iniemal Medicine. 1971; (128): 943-948, Kisinbaum DG, Kupper LL, Morgenstern H, Epidemiologic Research. Belmont, California, Lifetime Learning Publications, 1982, Koopman IS. Interaction between discrete causes. American Journa! of Epidemiology. 198); (113): 716-724, Koopman JS, Prevots DR, Vaca-Marin MA tt al. Determinants and predictors of dengue in- fection in Mexico, American Journal of Epictemiology. 1991; (133): 1168-1178, Kuppef LL, Hoyas MD. Interaction in epidemiologic sadies. American Journal of Epidemiology. 1978; (0B): 447-453. Kupper LL, Karon JM, Kleinbaum D et al. Matching in epidemiotogic sudies: validity and efficiency considerations. Biametrics. 198); (37): 271-291. Lee ET. Statistica! Methods for Survival Data Analysis. Belmont, California, Lifetime Lear ing Publicetions, 1980. Lilienfeld AM, Cétoris péribus: the evolution of the clinical tial, Presented at the 54th an ‘nual meeting of the American Association for the Histary of Medicine, Toronto, Canada, May 198). . Bibtiagrafta/ 263 Lillenfeld AM, Lilienfeld DE. Fundamenios de Epidemiologia. Bogots, Fondo Educative ler teramericano, 1983. Lind J. Treatise of zhe Scurvy. Edimbargh, Sands, Murray and Cochran, 1753, Lipid Rescurch Clinics Program, The Lipid Research Clinics Coronnry Primary Prevention ‘Trial esuits: 1, Reduction of incidence of CHD. JAMA. 1984: (251): 351-364, Lister J. On the effects of the antiseptic system of weaumcat upon the salabrity of a surgical hospital. Lancet. 1870; (1): 4-6, 40-42, Locther HI, MeTavish DG. Descriptive Statitics for Sociologists. Boston, Allyn and Bacon Inc,, 1974, Londofio IL. Factores relacionados con el consumo de cigarrilios en escolares adolescentes de 1a ciudad de Medellin. Bolettn de fa Oficina Sanitaria Panamericana. 1992; (112), 131-137, €. 1976; (294): 1622-1667, MacMahon B, Pugh T, Zpidemiology. Boston, Little, Brown, and Co., 1970. Maloney EM, Murphy EL, Figuerea JP et al. Human T-lymphotropic virus type I (HTLV.1) ‘seroprevalence it Jamaica, Il. Geagraphic an ecologic determinanis. American deurnal of Epidemiology. 1991; (133): 1125-1134, Montel N. Evaluation of survival dais and two new rank order simtistics ariing in its cone siderations. Cancer Chemoterapy Reparts, 1966; (50): 163-170. Mantel N, Haenszel W. Statistical aspects of data from cetcospective studies of disease, Jour- aal of the National Cancer. dnstituie, 1959; (22): 719-748, Mavener 38, Kramer 8, Maasner and Bol Epidemiology: An hnveductory Test. Philsdephia, W, B. Saunders Co., 1985. Meinen CL. Clinical Trials. New York, Oxford University Press, 1986, Melia R, Bspinal F, Vélez H, Fluoruracién de la sal en custro comunidides eolombianas IL Estudio bisica de la caries dental. Boletin de tla Oficina Sanitaria Pazamericuna. 1972; (73); 561-371. Miettinen OS. The matched pair design in the case of all-or-tone responses. Biometrics. 1968: (24): 339.382, Micttinen OS. Individual matching with multiple controls in the case of alleorcnone fespon- 32s. Biometrics, 1969; (25): 339-354, Mietinen OS. Matching and desiga efficiency in retrospective susdies, American Joumal of Epidemiology. 1970; (91): 111-118, Mictinen O8. Estimabitity and estimation in cuse-referemt studies. American Joumal of Epidemiology. 1916; (103): 226-235, . Miettinen OS, Cook FF. Confounding: essence and detection, Amevicar Journal of Epidemiology. 1981; (104): 609-620, Miller RG, Gong G, Mutez A. Survival Analysis, New York, John Willey and Sons, 1981. Morgenstern H. Uses of ecologic analysis in epidemiologic research, Ameri¢nn Joumal oe Public Health. 1982: (72): 1336-1344, 264 Merodologta de ta irvestigacicn... Mortis JN, Kagan A, Pattison DCetal. Incidence and prediction of ischacmic heart disease in London busmen. Lancet, 1966: (2): 553-559. Mucller J, Schoeasler K, Costuer H. Statistica! Reasoning in Sociology. Botton, Houghton Mifflin Co, 1971, ‘Multiple Risk Factor Intervemion Trial Research Group. Multiple Risk Factor intervention Trial: risk factor changes and morbidity resuks. JAMEA. 1982; (248): 1465-1477, Murray C. Quantifying the burden of disease: the technics! basis for disability adjusted life years. Bulletin of the World Health Organization, 1994; (72): 429-445, ‘Murmay C, Lopez A. Quantifying disability: data, methods, and results. Bulletin af the Workd Health Organization, 994: (72): 481-494. Office of Population Censuses and Surveys: Ocupational Mortality, Series DS No }. London, 1970; 5-16, Patick R, Cassel JC. Tyroler HA et al, The Ponape Study of the Health Bfecis of Culnural Change. Annasl Meeting, Society for Epidemiologic Research, Berkeley, California, 1974, Peto R, Peto J. Asymptotically efficieat renk invariant procedures. Journal of the Royal Statistical Society, Series A. 1972; (135): 185-207. Peto R, Pike MC, Armitage P et al. Design and analysis of randomized clinical trials re- quiring prolonged observation of asch patient, I: Introduction and design, British Jour- nal of Cancer. 1976; (34): 585-612. Peto R, Pike ‘MC, Armitage P et al Design and analysis of randomized clinical tials requir- ing prokonges observation of each patient, U: Analysis and examples. British Journal <éf Cancer. 197T; (35): 1-38. Piantedosi §, Byar D, Green S. The ecological fallacy. American Journal af Epidemiology. 1988: (127); 893-904, Press J, Wilson §, Choosing between Logistic Regression and Discriminant Analysis. Jour ral of the American Storistical Association. 1978: (73): 609-705. Robins JM, Breslow N, Greenland S, Estimators of the Manel-Hacaszel variance consistent in both sparse data and large strata limiting models. Biometrics. 1986; (42): 355-323. Robinsen WS. Ecological correlations and the behaviour of individuals. American Sociology Review. 1950; (15): 351-357. Romeder JM, MeWhinnie 3R. Potential years of life lost between ages } und 70: an indicator of premature mortality for health planning. Internationa! Joumal of Epidemiology. 1977: @): 143-151. Rosenman RH, Brand RJ, Jenkins CD et al, Coronary hesrt disexse in the Western Col- laboralive Study. Final follow-up experience of 8,5 yeare, JAMA. 1975; (233): 872- 877. Rosenman RH, Friedman M, Straus R, et al. A predictive study of coronary heart disease: the ‘Western Collaborative Group Study. JAMA, 1964: (189): 15-22. Rothman KJ. Causes. American Journal of Epidemiology. 1976; (104): 587-592. ‘Rothman KJ, Induction and latent periods. American Jossmal of Epidemiatogy. 1981; (114): 253.259. Rothman KI. Modem Epidemiology. Boston, Little, Brown end Co., 1986, Bibdiogrofia’ 265 Rothman KJ, Greenland S. Walker AM. Concepts of interaction, American Journal of Epidemiology. \980; (112): 467-470, Sackett DL. Bias in analytic research. Jewmal ‘of Chronic Diseases, 1979; (32): 51-63, Saracci R. Interaction and sinergicm. American Journal of Epidemiology. 1980; (112): 465. 466, Sartwell PE. “On the methodology of investigations of etiologic factors in chronie disease” further comments. Journal of Chronic Diseases. 1960: (11): 61-63. ‘SAS Institute Inc., SAS Circle, Po. Box 8000, Cary, North Carolina, USA. Scotto J, Fear TR, Fratmeni JF. Solar Radiation, fn: Scholtenfeld D, Fraumeat JF Ir. eds, Cancer Epidemiology and Prevention, Philadelphia, W. B. Saunders Co,, 1982. Schilling RS. Sources of Data. En: Epidemiology of Occupational Heulih. Karvonen M, Mikheew M (eds). World Health Organization, Copenhagen, 1986. Schlessciman IN, Assesing offecs of confounding variables. American Journal of Epidemio- logy. 1978; (108): 3.8 Schlesselmen JJ. Case-Comirol Suadies. New York, Oxford University Press, 1982 Sehlesselman 13. Sample sive requirements in cobaet and eave-control studies of disease. American Journal of Epidemiology. 1974; (98): 381-384, Schwartebaum JA, Hulke BS, Fowler WC e1 sl, The influence of exogenons esuogen use on tarvival after agnosis of endometrial cancer. American Journal of Epidemiologs 1987; (126): 851-859, SeGi M. Ageadjusted Death Rete: for Selected Sites in 51 conuries in 1974. Nagoya. Japan, Segi Insticute of Cancer Epidemiology, 1979. Smith DC, Prentice R ct al, Association of CRogenous estrogen and endometrial csrcinonaa, New England Journal of Medicine, 1975; (293): 1164-1167 Snedecor GW, Cochran WG. Statistical Methods, Iowa, The lowa State University Press, 1967. SPSS, SPSS Inc., 444 N. Michigan Avenue, Chicago, Itinois, USA, STATXACT, Cytel Software Corportion, 137 Brie Stret, Cambridge, MA 02139, USA, Stavraky KM. The role of ecologic analysis in studies af ine etiology of disease: a discuesion Pitt refereace to large bowel cauccr. Joumal of Chronic Diseases. 1976: (29). 435. i, Sallivan DF. Conceptual problems in developing an index of heuith. US Public Health Ser. vice, Publication Series No. 1000, Vic! and ?fealth Stasstics Series 2. No.7. Nation, al Cenier for Health Statistics, 1966. . Sullivan DF. A single indix of eonality and morbidity. Health Repons, 1971; (86): 47-354, Susser M. Causal Thinking in the Health Sciences: Concepts and Serategies of Epidemiology. New York, Oxford University Press, 1973. Susser M. Judgment and causal inference: criteria in epidemiologic studies. American Jour. nal of Eptdemioiogy. 1977, (105): 1-15. 266 / Metadologia de to investizecitn. The Health Consecuonces of Smoking: a report of the Surgeon General. Washington, DC. Government Printing Office. 1984, ‘The Review Pane} on Coronary-prone Behaviour and Coronary Heart Disease, Coronary- ‘prone behaviour and coronary heart disease, Circulation. 1981; (63): 1199-1215, ‘Truott J, Comfield J, Kannel W. A rovitivariate analysis of the risk of coronary heart disense in Framingham. Journal of Chronic Diseases. 1967; (20): 511-524. | ‘Unbach F. Geographic Distribution of Skin Cancer. Journal of Surgtcal Oncology. 1971; (3): 219-234, ‘U.S. Department of Health and Human Service. Public Health Service. Seventh Special Report io the U.S. Congress on Alcohol and Health jrom the Secresary of Health and Human Services. Ienuary, 1990. US. Public Heatth Service, Smoking and Health. Report af the Advisory Comittee to the Sur- eon General of the Public Health Service, U.S. Department of Health, Fducation and Welfare, Public Health Service, Center for Disease Control, PHS Publication No. 1103, 1964, Walter SD, Determination of significant reletive risks and optimal sampling procedures in prospective and retrospective comparative studies of various sizes. American Journal of Epidemiology. 1977; (108, 4): 387-387. ‘Walter SD. Calculation of attributable risk from epidemiological date, fuernational Journal of Epidemiology. 1978; (7): 157-182. Waker SD, Holford TR. Additive, multiplicative and other models for disease risks. American Journal of Epidemiology. 1978; (108): 341-346. Wigle DT, Mao Y, Semenciw R ci al, Premature deaths in Canada: impset, trends and opportunities of prevention. Canadian Journal of Public Healih. 1990; (81): 376- 38l, ‘Wilbelamem L, Liungberg S, Wedel Het al. A comparison benween participants and nom-pay- ticipants in a primary prevention trial. Jauraal af Chronic Disease, 1976: (29); 331- 339. ‘Worscester }. Matched samples in epidemiologic studies. Blomerrics. 1964; (20): 840-848. ‘Yerushalmy J, Palmer CE. On the methodology of investigations of etiologic factors in chronic diseases. Journal of Chronic Diseases. 1959; (10): 27-40. Ziel HK, Finkle WD. Increased risk of endomattrial carcinoma among wert of conjugated estrogens. New England Joumal of Medicine. 1975; (283): 1167-1170, F Indice analitico A adherencia 59-61, #0 ajuste de tasas 113 auslisin ‘de asaciaciones etiolégicas 67 de la informacién 28, 37, 129 ide la mortalidad 211 de la verianza 167 de los resultados $9 de observactones 177 e regresiGn 167, 170, 173, 178, 179 de supervivencia 193 de varianza 167, 171. 172 discriminame 166, 167, 172, 173 epidemiolsgico 149 estadistico 153, 158 sstratificaddo 110, 129, 130, 137, 146, 450, 135-158, 162, 177, 178, 179, 244 multivariada 78, 110, 162, 165, 166, 174, 178 regresién, 167 sabos de vida Potcnclatmente perdidas 45, 193, 241-233, 215 saludable 45, 193, 213 asignacién slcatoria 24, 48, 49, 55, 62 causal 19, 23 stiologicn 69, 182 indirecta 2t ‘meramenle estndisticn 20 observnda 22, 23 positive 40 c caracteristicas de base 49, 51. 52. 55, 61 easos y controles Veane estudio de casos y controles hospitalarios 91, 107 incidentes 92 poblacionaies 91 Prevalentes 92 eategorizacién ‘Véase clasificacién causalidad 19 causes, ‘necesarias 20° suficientes 20 chasificacién 268 / Mteiodotogia de ia invesigacién siscriminante 3 exhaustive 3] coeficiente te determinaciGn 169, 170 de regresisn 169. 176 saberencia de lor hsllaagos 23 cobortes dindrnicas 69. 70 fjas 69 colineatidad 188 complejo causal 20 confusiés Véase scagos de oonfusién couocimiems etioligico 23, 149 controles Véase esnidio de caros y controle hoapitalarios 91, 92 poblacionales 91 curva de supervivencia 198 D diagnésticos de morbirmosiatidad 24 disparidades 86-88, 103, 105, 131-136, 141-144, 159, 161, 177 duracién de In enfermedad 35 E efecto placebo 62 eficiencin 58, 155, 156, 158, 160, 162, 244 cnevestas de prevalencia 25 ensayos slinions 24, 52, 62 cormunitarios $5 de laboratoria 23 ‘enevista personal 80 ‘epidemiologia ocupacional 79, 126 iento 58, 78, 110, 150, 155, 156-159, 161-163 177, 244 individual 154, 158, 159, 160 error alestorio 98, 167 ée clasificacién 106 muxirno tolerable 218, 222 tipo 157 tipo 11 57 estilo de vida 19, 190 estimacign de inwervaio 7h. 141 estrategias metodolégicas 23. 110, bid

You might also like