You are on page 1of 230
1 INTRODUCCION Un var6n de 51 afios de edad se presenta aquejado de dolor tordcico. El paciente se habia encontrado bien hasta 2 semanas antes, cuando noté una opresién en el centro del pecho mientras caminaba cuesta arriba. La opre- sin cedi6 después de 2-3 min de reposo. Desde entonces ha percibido sen- saciones similares en varias ocasiones, veces durante el ejervicio y otras, en reposo, Fuma un paquete de cigarrillos al dia y le han indicado que su resin arterial era Chrcerda chive aoe {| om A Fig. 1-1, Seago de confusion: jes el vtus del herpes 2 (VHS-2) una posible causa de céncer de én? Solamente sau asociacin con ol cancer de cévix os independiente de la nfecsién por ¢l virus del paploma humano (VPH\, conocido por causar céncer de.cénix. Amos virus mantie- en rlacion con una mayer actividad sex. 10 _ Epidemiologic clinica, Aspectos fundamentales po que efectué el ejercicio tuvo una mejor oportunidad de que se detectara un acontecimiento coronario, ya que un mayor mimero de esos individuos fue examinado rutinariamente. Por dltimo, en este estudio conereto, la con- clusién de que el ejercicio disminuyé el riesgo de coronariopatia podria ser consecuencia de un sesgo de confusién si la asociacién entre el ejercicio y Jos acontecimientos coronarios fue consecuencia del hecho de que el habito tabsiquico es un factor de riesgo de coronariopatia y el grupo que efectué el ejercicio fumé menor niimero de cigarrillos. La posibilidad de seszo no significa que en reslidad en un estudio con- creto exista un sesgo. Para que un investigador o lector aborde eficazmente el sesgo, en primer lugar, es nevesario saber dénde y eémo buscarlo y lo que pueda hacerse al respecto, Pero no podemos detenerncs ahi. También es preciso determinar si el sesgo se encuentra realmente presente y cual es su probable magnitud, para decidir si es lo suficientoments importante como para modificar las conclusiones del estudio de forma clinicamente signifi- cativa. ar Las observaciones sobre Ias enfermedades habitualmente se hacen en una muestra de pacientes més que en todos los individuos que experimentan la enfermedad en cuestién. Las observaciones en una muestra de pacientes, incluso si no estén sesgadas, podrian representar erréneamente la situacién enel conjunto de la poblacién debido al azar. No obstante, si las observacio- nes se repitieren en numerosas muestras de pacientes, los resultados para las muostras variarfan alrededor dol valor real. La divorgoncia de una obser- vacién de una muestra con respecto al valor real de la poblacién, debida tini- camente al azar, recibe el nombre de variacién aleatoria.. ‘Todos estamos familiarizados con el azar como explicacién del por qué tuna moneda no cae de cara exactamente el 50 % de las veces cuando se lan- za al aire, por ejemplo, 100 veces. E] mismo efecto, la variacién aleatoria, 8 aplicable cuando se evaliian los efectos de los tratamientos A y B, expuestos previamente. Supongamos que se eliminaran todos los sesgos del estudio de los efectos relativos de los dos tratamientos. Supongamos, ademés, que los dos tratamientos son en realidad igualmente efectivos, mejorando en cada uno de ellos aproximadamente el 50 % de los pacientes tratados, Incluso en este caso, debido tinicamente al azar, un solo estudio que incluyera un pequefio ntimero de pacientos en cada grupo de trata- miento ficilmente podria identificar que A mejora a una proporcién mayor de pacientes que B, o viceversa. El azar puede afectar todas las etapas de las observaciones clinicas. En a evaluacién de los tratamientos A y B, la variacién aleatoria se produce en el muestreo de pacientes para el estudio, la seleccién de los grupos de tratamiento y las mediciones levadas a cabo en les grupos. A diferencia del sesgo, que desvia los valores en una direceién o en otra, Ja variaci6n aleatoria tiene tantas probabilidades de provecar observacio- nes por encima del valor real como por debajo de éste, Como consecuencia, la media de observaciones no sesgadas procedentes de muestras tiene ten- Introduedon 11 dencia a corresponder al valor real en 1a poblacién, aun cuando los resulta- dos de pequefias muestras individuales no se correspondan. La estadistica puede contribuir a estimar la probabilidad de que el azar (variacién aleatoria) justifique los resultados clinicos. Los conocimientos de Ia estadistica también pueden contribuir a disminuir dicha probabilidad permitiendo que el investigador formule un diseno y andlisis mejores. Sin embargo, la variacién aleatoria nunca puede climinarse por completo, de moda que, cuando se evaltian los resultados de las observaciones clinicas, siempre es preciso considerar el azar. En la figure 1-2 se ilustra la relaci6n entre el sesgo y el azar. Se toma como ejemplo la determinacién de la presién arterial diastélica en un paciente individual. La presion arterial real puede obtenerse mediante una cénula intraarterial, siendo en este paciente de 60 mm He. Sin embargo, este método no es posible para |as determinaciones rutinarias de la presién arterial; habitualmente, la presién arterial se determina indirectamente utilizando un esfigmomansmetro. El instrumento mas simple es propenso a los errores 0 a desviaciones del valor real. En la figura 1-2, el error esta representado por todas las lecturas del esfigmomanometro que quedan a la derecha del valor real. La desviacién de las lecturas del esfigmomanémetro la derecha (sesgo) puede toner varias explicaciones (p. ¢j., un esfigmoma- németro mal calibrado, un tamaiio erréneo del manguito o un médieo con déficit auditivo). El sesgo también puede ser consecuencia de los diferentes sonidos escogidos para representar la presiGn arterial diastélica. Los pun- tos limite habituales ~1a fase IV y V de los ruidos de Korotkoff- tienen ten- deacia a encontrarse por encima y por debajo de la presién diastélica real, PRESION DETERMINACION ARTERIA, DE LA PRESION REAL ‘ARTERIAL (CANULA INTRAARTERIAL) (ESFIGMOMANOMETRO) Numero de observaciones 0, ~” Presion arterial dlastolica (mmm Hg) Fig. 1-2. Relaciin entre el sesgo y ol azar: determinaciones de a presin arterial mediante una cnula inraartoril y un estigmomanémetr. 12 _ Epidemiologic clinica. Aspectos fundamentales respectivamente, ¢ incluso esto es impredecible en los individuos obesos. Ademés, las lecturas individuales de la presién arterial también estén sujetas a errores debido a la variacién aleatoria de la medicién, tal y como se ilustra por Ia dispersién de las lecturas del esfigmomanémetro alrededor del valor medio (90 mm Hg). Las dos fuentes de error, sesgoy azar, no son mutuamente excluyentes. En la mayor parte de situaciones, ambas estn presentes. La principal razén para distinguirlas es que deben ser manejadas de forma diferente. En teoria, el seago puede prevenirse llevando a cabo correctamente las investigaciones clinicas o puede corregirse mediante un anilisis apropiado de los datos. Si no se eliminan, a menudo los sesgos pueden ser detectados por el lector con discernimiento. A lo largo de este libro se trataré cémo reconocer, evitar 0 minimizar los sesgos. Ademés, el azar no puede elimi- narse, pero su influencia puede reducirse mediante un disefio correcto de la investigacidn y el error residual puede estimarse mediante la estadisti- ca. La estadistica también puede contribuir a eliminar los efectos de los ‘sesg0s conocidos. Sin embargo, ningtin tratamiento estadistico puede corre- gir los sesgos desconocidos en los datos. Algunos estadisticos incluso sugie- ren que la estadistica no deberia aplicarse a los datos susceptibles de estar sesgados debido a un mal diseno de la investigacion, por temor a dar una falsa respetabilidad a una investigacién que puede inducir a error. \Validez interna y externa Cuando se hacen inferencias sobre una poblacién a partir de las obser- vaciones de una muestra, se plantean dos preguntas fundamentales (figu- ra 1-8). En primer lugar, json correctas las conclusiones de la investigacién para los individuos de la muestra? En segundo lugar, en caso de respuesta ‘Todos los pacientes VALIDEZ con ol proceso deinterde INTERNA Introduccion 13 afirmativa de la cuestién anterior, representa la muestra a la poblacién de interés? La validez interne es el grado en que los resultados de un estudio son. correctos para la muestra de pacientes que estn siendo estudiados. Es « : fae ' t Medicion Fig. 24. Vide yfabikad, A) Vader slovaca y fabled olovaca 8) Valdez bay abiidad clevade. C) Valdez elevada y fabildad baja. D) Valdez bajay fabliad bala Las lineas de pun- tos represenian fs valores reales ‘Sensibilidad Un instrumento es sensible hasta el punto de que sus resultados cam- bian a medida que cambian las condiciones. Por ejemplo, la escale de la New York Heart Association, clases 1 IV (ausencia de sintomas, sintomas con ejercicio ligero y moderado y sintomas en reposo), no es sensible a los cambios sutiles de la insuficiencia cardiaca congestiva quo valorarian los pacientes, mientras que las determinaciones de laboratorio de la fraccién de eyeccién pueden detectar cambios demasiado sutiles para que los pacientes los perciban. Interpretabilidad Una desventaja de las escalas basadas en cuestionarios en los que, en general, no intervienen parametros fisicos es que los resultados pue- den no ser significativos para los clinicos y los pacientes. Por ejemplo, ghasta qué punto es malo tener un valor de 72 en la escala de depresién de Zung? Para superar este inconveniente, los investigadores pueden soujetar* los valores de la escala a fenémenos familiares, por ejemplo, indicando que los individuos con puntuaciones inferiores a 50 se consi- deran normales y los individuos con puntuaciones de 70 0 superiores estén grave 0 extremadamente deprimides y requieren asistencia inme- diata, VARIACION Las determinaciones clinicas del mismo fenémeno pueden adoptar una serie de valores dependiendo de las circunstancias en las que se han hecho. Para evitar conclusiones erréneas a partir de los datos, es preci- ‘80 que los clinicos conozcan las razones de la variacién en una situacion determinada y conozcan los factores que es probable que desempefien un papel importante, un papel menor o ningtin papel en lo que se ha observado. La variacién global es la suma de la variacién relacionada con el acto de la determinacién, las diferencias biolégicas dentro de individuos de ‘un momento a otro y las diferencias biolégicas de un individuo a otro (tabla 2-2), Tabla 2.2. Fuentes de variacién Fone Deteiiin Medion Instrument Elmedio ce realize a mecicién Obsarvador Evindividuo que realza la medicién Vasiacin tiologica En cada individu (Cambios de fs indivicuos con el tiameo ya situacion Entre incivivos Difrencias bclégicas de un individvo a otro 26 _ Epidemiologia clinica. Aspectos fundamentales Medicién de la variacin ‘Todas las observaciones estén sujetas a variacién debido al rendi- miento de los instrumentos y a los observadores que participan en la medicién. Las condiciones de ia medicién pueden conducir a un resultado sesgedo (falta de validez) o simplemente a un error aleatorio (Falta de fia- bilidad). Ess posible disminuir esta fuente de variacién efectuando las mediciones con gran precaucién y siguiendo protocolos esténdar. No obs- tante, cuando estas mediciones ee relacionan con el juicio humano, mas que con aparatos, la variacién puede ser especialmente amplia y muy iffcil de controlar. Rjemaplo. La insuficioncia cardines ftal frecuentamente sa monitoriza per auscultaciin, ‘que est sujets al error del observador La monitorizacin electronica proporciona la frecuen ‘ia real. Las frecuenciascardiaeas fetsles que son inusitadamente elevadas 0 bajes represen tan mercadores dal distrés fatal, que eugioren la necosidad dean parts precoz ‘Dag y cols. (2) compararon las frecuencias cardiacas fetales sbtenids por auscultacién fectuada por el personal hospitalario con las frecuencias obtenidas mediante monitarizacin clectrénica (fig. 22). Cuando la frecuencia cardiaca fetal real ee encontré en los limites nor- ‘males, las frecuencias por ausrultacin se encontraron dstribuidas uniformemente alrededor del valor real, os doc, slo exists un error aleatoro, pero cuando la frecuencia cardiaca fotal real fue inasitadamente elevada o baja, las frecuencias por auscultacién se encontraron set sadas hacia lo normal. Las frecuencias bajas tuvieroa tendencia a documentarse como més levadas que las freevencias reales y las frecuencias elevadas, exmo més bajas que las fre- cueneias reales. Esto estudio ilustra los errores tanto aleatorios como sisteméticos de las observaciones clinicas. En este caso, el sesgo hacia las frecuencias nor- males podria haberse originado porque el personal hospitalario esperaba que el feto se encontrara bien y era reacio ¢ llevar a cabo una intervencién mayor basada en su observaciGn de una frecuencia cardiaca anormalmente elevada o baja. Las variaciones de las mediciones también se originan porque éstas se Mevan a cabo solamente en una muestra del fenémeno que se ests descri- biendo, lo que podria representar erréneamente al conjunto. A menudo, la fraccién de muestreo (la fraccién del conjunto que se ha incluido en la mues- tra) es muy pequeia; por ejemplo, una biopsia de higado s6lo representa aproximadamente 1/100.000 del higado. Dado que se examina una parte muy pequefa del total, existe un margen considerable para la variacién de tuna muestra a otra. Silas mediciones se levan a cabo con diferentes métodos (p. ¢.. labora torios, técnicos o instrumentos diferentes), algunas de ellas podrian ser poco fiables yio manifestar diferencias sistemsticas a partir del valor correcto, contribuyendo a la dispersion de los valores obtenidos. Veriacién biolégica La variacién también surge debido a los cambios biolégicos dentro de los individuos con el tiempo. La mayor parte de fenémenos biolégicos se modifican de un momento a otro, Una medicién en un punto del tiempo 157 Frecuoneia cardiaca ‘etal monitorzada 420-160 sob 10} Frecuencia cerdiaca {otal monitorzada > 150) 0 4 30 20 1 0 1 2 9 40 OO latin Infroestimacion Sobreestimecién Fig. 2-2. Vaiablidad del observadox or al documantar (en lamin la recuencia cardia fetal fen funclén de sla recvencla real, determirada medtarte un monet electronica, se encuentra {ontro de ls limites nermaes. por debajo © por encima. (Repreducide de Day, Maddem Ly \Weod ©. Auscultation of Fotal Heart Rate: An assossment of is error and significance. BMI 1968; 4: 422-428), constituye una-muestra de mediciones durante un periodo de tiempo y podria no representar el valor habitual de éstas. Ejemplo. Los clinicos estimas la frecuencia de despolarizaciin prematura ventricular (exsranistoles ventriculares) (EV) pare contribuir a determinar la necesidad 7 efacia de un tratamiento, Por razones pricticas, lo llevan a eabo medianta obsorvacienes relativaments bbreves:quiza tomando el palsc durante 1 min 9 revisando un electocardicgrama (un registro {e unos 10 veg. No obstante, la frecuencia de las EV en un pacien‘e determinado varia con el tiempo. Para obtener una meestra mayor del ‘adica de BV, en peasiones se utiliza un monitor portétil (Holter). Perola monitorizacién, incluso durante periodos prolangodos de tiempo, puede conducir a error La figura 2-8 muestra las observaciones en un paciente con EV, simi- lara otros pacientes estusiados (3). Las RVihora variaron desde menea ds 20 hasta 280 durante un periodo de 3 dias, de acuerdo cn el diay el momento del ds. Las autores Degaron als siguiente conclusion: edistinguir una disminucién dela frecuencia de EV atribuile a la intervenciie torapéutiea mas que imicamente + la variacién binlogiea + espontinen preciaria tuna disminucidn superior al 88 % do la frecuencia do EV, si sélo se compararan dos periodos ‘de monitorzacion de 24 horas. 28 _ Epidemiologta clinica, Aspectos fundamentales 400 i 00] G 8 200) i bis z 100) Diaz pas Meciodia «6PM ‘Madlanoche = AM Fig. 2-3. Variabllidad biolégica. Nimero de extrasistoles ventriculares (EV) para un paciente no tratado en 3 dias conoscutives. (Ropreducide de Morganvoth J, Micholeon EL, Horowitz LN, Josephson ME, Pearlman AS y Dunkman WB. Limitations of routine long-term electro- Cardiographie moritorng to assess ventricular ectopic frequency, Circulation 1978; 68: <08- 414) La variacién también surge debido a las diferencias entre individuos. Las diferencias biolégicas entre individuos predominan en numerosas situaciones. Por ejemplo, varios estudios destacan que la hipertensién puesta de manifiesto en mediciones aisladas y casuales, aunque esta suje- taa todas las demés formas de variacién, mantiene relacién con una enfer- medad cardiovascular posterior. Variacion total ‘Los diversos origenes de la variacién son acumulativos. La figura 2-4 ilustra este hecho para la medicién de la presién arterial. La variacién a partir de la medicién contribuye de manera relativamente insignifican- te aunque abareé unos limites de 12 mm Hg entre diferentes observado- res. Ademés, la presién arterial de cada paciente varia considerable- mente de un momento a otro durante el dia, de modo que una sola lectura de la presién arterial podria no representar la habitual para dicho paciente. Gran parte de esta variaci6n no es aleatoria: la presién arterial en general es més elevada cuando los individuos estan despier- tos, excitados, durante la visita al médico o cuando toman farmacos de ispensacién libre para el resfriado. Naturalmente, estamos més intere- sados en conocer eémo la presién arterial de un individuo se compara con la de sus semejantes, sobre todo si el nivel de la presi6n arterial mantiene relacién con las complicaciones de la hipertensién y con la cefectividad del tratamiento, Efectos de ta variacién tra forma de considerar la variaci6n es desde el punto de vista de su efecto neto sobre la valider y fiabilidad de una medicida y de lo que se pue- de hacer al respecto. La variacién alestoria, por ejemplo cbtenida por instrumentos inestables © por muchos observadores con diversos sesgos que tienen tendencia a com- pensarse entre s{no origina como consecuencia una representacién errénea Gel estadc real de un fenémeno si se hace una serie de mediciones; sin embargo, las mediciones individuales pueden ser engafiosas. La inexactitud, que es consecuencia de la variacién aleatoria, puede reducirse tomando una muestra més amplia de lo que se esté determinando, por ejemplo, mediante un recvento de mayor mimero de células en una extensién de sangre, exami- nando un érea mayor de un sedimento urinario o estudiando @ un mayor néimero de pacientes. Asimismo, el grado de la variacién aleatoria puede estimarse mediante métodos estadisticos (v. cep. 9). Condiciones Distribucién Fuentes dela medicion elas mediciones. de variacion Un pacient, un observador, observaciones repetivas fen un momento dado Medicion Un pacient, musnos observacores, Un gaciente, un observadr, fen muchos momentos da dia < > 6 7 8 9 10 110 120 130 resign arterial diatéiion mm He) Fig. 2-4, Fuentes de variacior. Mecioon oe la presi antral asilica (ase V). (De Fotchor Fe y Fleicher SW: y B08 J, Humarfelt S, Wedervang F y Oecon C. The blood pressure in a popula tion [Sposa sous), Acta Med Scand 1957: 321: 5-318) 30 _Ipidemiologia clinica, Aspectos tundamentales Ademis, los resultados sesgados son sistemsticamente diferentes del valor real sin que importe el niimero de veces que se repitan. Por ejemplo, cuando se investiga a un paciente en el que se sospecha una hepatopatia infil- trativa (quiza representada por un aumento de la fosfatasa alcalina sériea detectado al realizar un seguimiento), una sola biopsie hepatica puede con- ducir a error, dependiendo de cémo se encuentren distribuidas las lesiones en ol higado. Si Ia losién os una metéstasis en el Isbulo iequierdo del higado, una biopsia en el lugar habitual (el lobulo derecho) la pasar4 por alto. Asimismo, tuna biopsia para una tuberculosis miliar, que esta representada por millones de pequefios granulomas en todo el higado, sélo seria imprecisa con una Yariacion aleatoria. De forma parecida, todos los valores elevados de las EV mostrados en la figura 2-3 se registraron el primer dfa y la mayor parte de Jos valores bajos, ol tereer fa. Los dias fueron ostimacionios sesgadas entre af debido a la variacién de la frecuencia de EV de un dia a otro DISTRIBUCIONES: Los datos que se han determinado en escalas de intervalo frecuentemen- te se presentan como una figura, que recibe el nombre de distribucién de fre- cuencia y en la que se muestra el niimero (0 porcentaje) de un grupo definido de individaos que poseen valores diferentes del parémetro (fig. 2-5). La pre- oda ap 16 | ol is 12 8 4 5 6 7 8 @ 0 APE (nai) Fig. 2-5.Determnaciones dela tendencia central y de la dispersin. Distibucién de os riveles dal entigeno prostitico expeciice (APE) en varonsa eupusstamerte normals, (De Kare AA, Lt ‘tu Pu, Babsian R, Drago JR, Lee F, Chesley A, Murahy GP y Matti C. Prostate-specficanti- ‘gen levels in 1695 men wihout evidence of prostate cance: Cancer 1982; 69: 1201-1207.) Anormatided 31 sentacién de los datos do intervalo como una distribucién do frecuencia pro- porciona la informacién con un detalle relativamente meticuloso. Deseripcién de las distribuciones Es conveniente concentrar las distribuciones. De hecho, es imprescinds ble si tienen que presentarse y compararse un amplio ntimero de distribu ciones. Para ello se utilizan dos propiedades basicas de las distribuciones: la tendencia central (el punto medio de la distribuci6n) y la dispersion (hasta qué punto estan alejados los valores unos de otros). Bn la tabla 2-3 se resu- men varias formas de expresar la tendencia central y la dispersion junto con sus ventajas y desventajas, y ellas se ilustran en la figura 2-6 ‘Tebla 2.3. Expresiones de la tondencia contral yla dispersién Expres Deficen ‘verti Dosvertas Tandencia central Neda Suma ce valores Adscuada para el Afectada por valo- ‘paras obsena- tratamiento ma- res extremos ‘slenes tamética Nimero de obser- Meciana El punto donde a! No. infuida ficil: No adectada para rimero. ce. cb ‘mente por valo- fa manipulacion, ‘sevaciones por res extromos. ‘matematica ‘encima es igual al_ndmero por debajo Moda Elvsor que xe po Simplicidad desig- En ocasiones, no duce més te rificedo hay valores mas, ‘cusntemente frecuertes (0 hay muchos) Dispersién Limits Desde el valor mas ncuye todos los Muy afeciados por Dao hastaet mis valores tos valores slevade dea ce temo ‘wibucion Desviaolin estindar’ El valor sbsouto de Adecuada para la Para distribucio- la lterencia me manipulacién nes no gavsia- ia delos valores matamatea has no deseribe Inciviouales con tuna proporcion respecte ala mo- conocida de las ia observaciones La proporcion de Describe la stare- Poco adecuados todas las obser zar do un valor para la manipu- vaciones que se sin. asunciones —_—_—laciin estadist- encuentran den- -sobvelaformade ca ltodelos valores tna distrbucdén especticados once X= cada cbseracén X= mea do todas as obseracone,yN = nero de cbseracenes. 32_Epidemiclogia cit Dictribuciones reales En la figura 2-6 se muestran las distribuciones de la frecuencia de cua- tro pruebas sanguineas habituales (potasio, fosfatasa alcalina, glucosa y hhomoglobina). En general, la mayor parte de Jos valores aparecen préximos al punto medio y, excepto para la parte central de las curvas, no existen «gibas» o irregularidades. Los extremos alto y bajo de las distribuciones se estrechan en colas, con la cola de un extremo més alargada que la del otro (es decir, las curvas estan «tesgadas» hacia ese extremo). Mientras que algunas de las distribuciones estén sesgadas hacia los valores més eleva- dos, otras estan seegadas hacia los mas bajos. En otras palabras, todas estas distribuciones son unimodales, tienen aproximadamente una forma de campana y no necesariamente son simétricas; ademas, no se parecen entre si La distribucién de los valores para muchas pruebas de laboratorio cam- bian segun las caracteristicas de los pacientes, como edad, sexo, raza y nutricién. La figura 2-7 muestra c6mo la distribucién de una de estas prue- Aspectos fundamentoles 90 2 pose Fostatasa ico alain 0 0 a0 40050 20 40 60 80 100 120 140 mEgi Unidades 0 0 2» 2 Gicose vlasmitca = Hemoglobin 0 10 100 150,200 a 9 219 14 18 16 19/100 mit 100m Fig. 26. Distibuciones cinicas reales (De Martin HF: Gudinowicz 84 y Fanger H. Normal values in cirical chemistry. New York: Marcel Dekker, 1875.) 20-00 tos do edad | Peewee ” mp BUN (rmg/100 mi) Fig. 2-7 La dietibucidn de as variable clnioae 2 modifica con la edad: BUN para los indvi- ‘duos ce 20-29 aos frente alos indviduos de 80 afios o mis. (De Martn HF, Gudzhowcz B y anger H. Normal values in crical chemist. New York: Marcel Deki, 1975.) bas, el nitrégeno ureico sanguineo (BUN), cambia con la edad. Un BUN de 25 mg/100 ml seria inusitadamente elevado para un individuo joven, pero no seria un valor especialmente destacado para una persona de edad avan- zada. Distribuci6n normal En ocasiones se supone que otro tipo de distribucién denominada dis- tribucién «normal: o gaussiana es una aproximacién de las distribuciones ‘que se producen de manera natural, aunque se basa en la teoria estadisti- cay no necesariamente tiene una relacién con las distribuciones natura- Jes. La curva normal describe la distribucién de la frecuencia de medicio- nes repetidas del mismo objeto fisico realizadas por el mismo instrumento. Le dispersién de los valores sélo representa la variacién aleatoria. En la figura 2-8 so muestra una curva normal. La curva es simétrica y tiene for- ma de campana. Tiene la propiedad matemdtica de que alrededor de dos tercios de las observaciones se encuentran dentro de 1 desviacién estén- dar de la media, y aproximadamente el 95 &, dentro de 2 desviacion¢ estandar. ‘Aunque las distribuciones clinicas a menudo se esemejan a una distri- buciéa normal, la similitud es superficial. Tal y como deseribié un estadis- tico (4): El hecho experimental es que pars la mayoria de variables fsilégices la disiribuciéa es Ihomogines, unimodal y sogada, y que la media 23 deovieciones eatdndat no sirvs como pun. to de carte del 95 % deseado. Carecemes de tecremas matemiticos,estadisticos ode ota case ‘que nos permitan predecirla forma de las dstribuciones de los pardmetros isologicos. 34 _ Epidemiologie clinica, Aspectos fundamentales Deswacienes Dupmactenes 3, 400 4 42 214 | 1999 | a419 | 9410! 39.50) ane Porcentaje oe area — 08.26 —» ‘bajo la curva £8.26 —— 9,44 ——+ —_____ 9,2 —_____ Fig. 2-8. Dietibucién norma! (gaussian) Mientras que la distribucién normal se deduce de la teorfa matematica y solo refleja la variacion aleatoria, muchas otras fuentes de variacién con- ‘tribuyen a las distribuciones de las determinaciones clinicas, especialmen- to las diferencias biolégicas entre individuos. Por esta raz6n, si las distri- buciones de los parémetros clinicos se parecen a curvas normales, en su mayor parte, es por accidente. Incluso asf, frecuentemente se supone, por conveniencia (porque las medias y desviaciones esténdar son relativamen- te faciles de calcular y manipular matematicamente), que los parametros clinicos estén distribuidos -normalmente CRITERIOS DE ANORMALIDAD Seria conveniente que las distribuciones de frecuencia de los parame- tros clinicos individuales, normales y anormales, fueran tan diferentes que tas distribuciones pudieran utilizarse para distinguir dos o mas poblacio- nes diferentes. Este es el caso para las secuencias del DNA y RNA, y anti- ‘genos especifices (fig. 2-9 A) que se encuentran presentes o ausentes, aun- ‘que sus manifestaciones clinicas pueden no ser tan evidentes. No obstante, la mayor parte de distribuciones de las variables clinicas no se dividen ficilmente en -normales» y hasta unos limites snormales altos», En cuarto lugar, algunos valores extremos son claramente infrecuentes, pero preferibles a otros més habituales. Esto es especialmente verdad en el extremo bajo de algunas distribuciones. {Quien no estaria satisfecho de tener unos valores de creatinina sérica de 0,4 mg/100 ml o una presién arterial sistélica de 105 mm Hg? Ambos valores son inusitadamente bajos, pero mejores indicadores de salud o de riesgo que la media. Por ultimo, para las pruebas diagndsticas de laboratorio, algunos pacientes pueden presentar valores en los limites habituales de los indivi- duos sanos y, a pesar de todo, estar claramente enfermos. Ejemplos de ello incluyen la hidrocefalia a presicn baja, el glaucoma de presién normal y el hiperparatircidismo normoceleémico. Anormal = asociado con la enfermedad Un enfoque més razonable para distinguir lo normal de lo anormal es clarificar como anormales las observaciones que regularmente se asocian con la enfermedad, la diseapacidad o la muerte, es decir, cualquier desvia- ‘idn clinicamente significativa de le buena salud, Ejemplo, Qué es una ingestién de alechol (etsnol)? Diversos estudios hn demostrado ana rulacién en forma de U entre la ingestién de aleshol y la martalidad:taras de ortalidad elevadas en los abstemios, tasas mis bajas en los bebedores moderados y tana ‘levudas en los grandes bebedores (fig. 1-10) Se ha sugeride que las tasas do mortalidad mis ‘jas con un consumo erecente de alcohol, en el extreme inferior de la curva, se producea ‘que el alcohol aumeata loe niveles de lipoproteina de alta densidad, que protege frente a enfermedades cerdiovasculaes. Alternativamente, cuando Ins individues eontreen una eager medad, disminuyen su eonsumo de alcohol y esto podria explicar ls elevada tasa de martali dad asociads con la baja ingestin de alcoho (6: Las tasas de mortalidad elevadas en el ea00 de las grandes bebedares son menos controvertidas: el sleabol constituye una causa de diver- ‘sas enfermedades que conducen a la muerte (cardiepatias,cdncor ¢ Anormal = tratable En algunos procesos, especialmente los que no son preocupantes por sf mismos (es decir, asintométicos), es mejor considerar una determinacién anormal sélo ai el tratamiento del proceso representado por la determina ‘i6n conduce a un mejor resultado. La razén de ello es que no todo lo que se asotia con un mayor riesgo puede tratarse con eficacia: la eliminacién del proceso puede no eliminar el riesgo, ya sea porque el propio proceso no es Ja causa de la enfermedad sino que esta relacionado con la causa 0 porque ya se ha producido una lesién irreversible. Asimismo, etiquetar a los indi- ‘yiduos como anormales también puede provocar efectos psicolégicos adver- 408 que no estn justificados si el tratamiento no puede mejorar el pronés- tice. Lo que consideramos tratable se modifica con el tiempo. En el mejor de Jos casos, las decisiones terapéuticas se basan en pruebas a partir de ensa- ‘Muertos anvales por 1.000 ‘Ausents —Ocasional Ligera_—Modrada_Excesiva Ingestion de alcoho! Fig. 2-10. Concepto de anormalidad asoclada con la enfermedad. Relactn entre consume de aleshol y mortalidad. (De Shaper AG, Wanramethee G y Walker M. Alcchol and Morality in Br- tish Mon: explaining the U-shaped curve. Lancet, 1988;2: 1267-1273.) yyos clinicos realizados adecuadamente (cap. 8). A medida que se adquieren nuevos conocimientos tras los resultados de los ensayos clinicos, puede cambiar el nivel a partir del cual se considera util el tratamiento. Por ejem- plo, las pruebas acumuladas del tratamiento de la hipertension han modi- ficado la definicién del nivel a partir del cual es tratable. A medida que se han llevado a cabo un mayor niimero de estudios, se han puesto de mani- fiesto sucesivamente niveles més bajos de presién arterial diastélica que merecen un tratamiento, REGRESION ALA MEDIA Cuando los médicos se encuentran con un resultado inesperadamente anormal de una prueba, tienen tendencia a repetirla. Frecuentemente, el segundo resultado esta mas préximo a los valores normales. {Por qué ocu- rre? Es suficiente el segundo resultado para que el clinico esté tranquilo? En los pacientes scleccionados porque representan un valor extremo en una distribucién, puede proverse como promedio que presenten valores ‘menos extremes en las mediciones ulteriores. Esto se produce por razones puramente estadisticas y no necesariamente porque los pacientes hayan mejorado. Este fenémeno se conoce con el nombre de regresién a la media. 40 Epidemiologic clinics. Aspectos fundamentales La regresién a la media se origina del siguiente modo (fig. 2-11): prime- 10, los individuos son seleccionades para la inclusién en un estudio o para un diagnéstico 0 tratamiento adicional porque la medicién inicial de una de las caracteristicas se sitia més alla de un punto de corte seleccionado arbi- trariamente en el extremo de la distribucién de los valores para todos los pacientes examinados. Algunos de estos individuos permanecen por enci- ma del punto de corte en las mediciones ulteriores porque sus valores rea- les suelen ser superiores a la media, pero otros, en los que se identificaron valores por encima del punto de corte durante el cribado (screening) inicial, habitualmente presentan valores més bajos, Sélo fueron seleccionados por- que ~debido a la variacién aleatoria- presentaron un valor elevado en el momento de la primera medicién. Cuando se efectia de nuevo la medicion, esi08 individuos presentan valores mas bajos de los que se identificaron durante el primer estudio. Este fondmeno tiene tendencia a arrastrar hacia abajo el valor medio del subgrupo en que originalmente se hallaron valores superiores al punto de certe. Por consiguiente, en los pacientes que son seleccionados por presentar resultados de una prueba de laboratorio inusitadamente elevados o bajos, como promedio, se puede prever que estén més cerca del centro de la distri- bucién, si ee repite la prucka. Asimismo, es probable que los valores subsi- guientes constituyan estimaciones més precisas del valor real que podri ‘obtenerse si, en un paciente concreto, se repitieran las pruebas en muchas ocasiones. Por consiguiente, no es ilégica la préctica de repetir las pruebas de laboratorio identificadas como anormales y de considerar que la segun- da, que a menudo se encuentra dentro de los limites normales, es la correc- ta. Tione una base teérica aélida y también una base empirica. Por ejem- { ermeagane coepobuces Pacientes con valores elevados Pacientes estudados de nuevo Fig. 2-11. Regresion a a medi ‘Anormatidad 41 plo, se ha puesto de manifiesto que Ia mitad de las pruebas de la T, sérica que en un estudio se encontraron fuera de los limites normales, se encon- traron dentro de los limites normales cuando se repitieron (7). Sin embar- go, cuanto més extremo es el valor inicial, menos probable es que sea nor- mal euando se repita, RESUMEN Las fenémenos clinicos se determinan en escalas nominales, ordinales y de intervale. A pesar de que muchas observaciones clinicas se encuentran dentro de un continuum de valores, por razones practicas, frecuentemente 8¢ simplifican en categorias dicotémicas (normales/anormales). Las obser- vaciones de los fenémenos clfnicos varian debido al error de medici6n, a las diferencias intraindividuales de un momento a otro y a las diferencias entre individuos. E] rendimiento de un método de medicién se caracteriza por su validez (mide lo que pretende medir”), la fiabilidad (ideparan medi- das repetidas del mismo pardmetro los mismos resultados”), los limites, la sensibilidad y la interpretabilidad Las distribuciones de frecuencia para las variables clinicas tienen for- mas diferentes que pueden resumirse describiendo su tendencia central y su dispersion. Frecuentemente, los valores de laboratorio procedentes de individuos € a Falsos | Verdaderos, & | Negativa | negativos | negativos Fig. 3-1. Relacién entre ol routad do una prusba siagréatica y la nciconcia dela enformodad, Exsten dos posibiidades de que el resultado de la prueba sea corecto (verdadero positivo y verdadero negative) y dos posibildades de que el resutaco de la prueba sea incorrecio (also postivoy fal negetivo. error si es positiva cuando la enfermedad esta ausente (falso positivo) o nega- tiva cuando la enfermedad esta presente (falso negativo). El patron oro La evaluaci6n de la exactitud de una prueba se basa en su relacién con alguna forma de saber si la enfermedad esta verdaderamente presente 0 no lo.est4: una indicaciéa consistente de la certidumbre a la que a menudo se hace referencia como «patrén oro». Habitualmente, el patrén oro es difi- cil de alcanzar. En ocasiones, el patrén de exactitud es en si mismo una prueba relativamente simple y de bajo coste, como un cultivo faringeo en busca del estreptococo beta-hemolitico para validar la impresién clinica de ‘una inflamacion faringea o una prueba de anticuerpos en busca del virus de la inmunodeficiencie humana, No obstante, habitualmente no es asf. ‘Mucho mas a menudo es preciso recurrir a pruebas relativaments comple- jas, de coste elevado o que conllevan riesgos para asegurar la existencia 0 inexistencia de la enfermedad. Entre estas pruebas, cabe citar las biopsias, las exploraciones quirirgicas y, naturalmente, la autopsia. Para las enfermedades que no son autolimitadas y habitualmente se manifiestan al cabo de algunos aiios después de sus primeros indicios, los resultados de un seguimiento pueden servir como patrén ore. La mayor par- te de cénceres y de enfermedades crénicas degenerativas se incluyen dentro de esta categoria, Para éstas es posible una validacién, incluso si no es vi ble una confirmacién inmediata del rendimiento de una prueba, porque el patrén oro disponible de inmediato conlleva demasiados riesgos o tiene un coste demasiado elevado. Es preciso decidir cuidadosamente la duracién del periodo de seguimiento, que debe ser lo suficientemente prolongade como para que la enfermedad se manifieste, pero no tanto como para que aparez- ‘can casos de enfermedad después de las pruebas originales. 46 _ Epidemioiogia clinica. Aspectos fundementales Pucsto que utilizar estas formas més precisas de establecer la certidum- bbre casi siempre comporta mayor coste y riesgo, los elinicos y pacientes pre- fieren pruebas mas simples que el riguroso patrén oro, al menos inicial- mente, Para determinar la naturaleza de una neumonfa se utilizan las radiografias de térax y los frotis del esputo més que una biopsia pulmonar con un analisis del tejido pulmonar patol6gico. De forma parecida, los elec- trocardiogramas y las enzimas séricas frecuentemente se utilizan para establecer el diagnéstico de un infarto de miocardio agudo mas que una cateterizacién o procedimientos de diagndstico por la imagen. Las pruebas ‘més simples se utilizan como sustitutos de formas més elaboradas, pero més exactas, para establecer la existencia de la enfermedad, a sabiendas de que existe cierto riesgo de clasificacion erronea de los resultados. Este rriesgo ests justificado por la seguridad y comodidad de las pruebas més simples. Sin embargo, las pruebas més simples sélo son atiles cuando se conocen los riesgos de una clasificacién errénea y se consideran aceptable- ‘mente bajos. Esto requiere unos datos fiables que comparen su exactitud con un patron adecuade. Falta de informacién sobre las pruebas negativas El objetivo de todos los estudios clinicos que deseriben el valor de las pruebas diagnésticas debe ser obtener datos para las cuatro casillas de Ia figura 3-1. Sin todos estos datos, no es posible evaluar los riesgos de una clasificacion errénea, las preguntas decisivas sobre el rendimiento de las pruebas. En ocasiones, el objetivo de llenar las cuatro casillas es dit ‘cumplirlo en la préctica. Es posible que exista un medio objetivo y valido de establecer el diagndstico, pero que, por razones éticas o précticas, no sea factible utilizarlo para determinar formalmente las propiedades de una prueba. Considérese la situacién en la cual se obtenga la mayor parte de informacién sobre pruebas diagnésticas. Los informes publicados proceden principalmente de contextos clinicos y no de la investigacién. Las médicos sstdn utilizando la prueba en el proceso de asistencia a los pacientes en ‘estas cireunstancias. Sélo consideran justificado proceder a una evaluacién ms exhaustiva, dado el interés del paciente, cuando las pruebas diagnds- ticas preliminares son positivas. Cuando la prueba es negativa, son reacios a iniciar una evaluacion diagndstica agresiva, con sus riesgos y costes aso- ciados. Como consecuencia, la informacién sobre las pruebas negativas, con independeneia de que sean verdaderos o falsos nogativos, tiende a ser mucho menos completa en la literatura médica. Este problema esté ilustrado por un influyente estudio de Ia utilidad del anélisis diagnéstico que detecta el antigeno prostatico especifico (APE) para el diagnéstico del cancer de prostata (2). Alos pacientes con un APE, superior al punto de corte se les efectud una biopsia, mientras que los pacientos con un APE inferior al punto de corte no fueron biopsiados. Los autores comprensiblemente, fueron reacios a someter a los varones a un procedimiento molesto sin pruebas que lo respaldaran. Como consecuencia, el estudio no nos permite determinar la tasa de falsos negativos para el estudio mediante el APE. Diognéstico 47 Falta de informacién sobre los resultados de las pruebas ‘en ausencia de la enfermedad Como se ha descrito antes, los clinicos comprensiblemente se resisten a evar a cabo pruchas complejas en pacientes que no tienen problemas. Una evaluacién del rendimiento de una prueba puede ser extremadamente err6- nea si la prueba sélo se aplica a los pacientes con la enfermedad. ‘Bjemplo. La resonancia magnétia (RDM) de lacolumna lumbar se utlizafrecuentements ‘en Ia evaluacién de los pacientes con una lumbalgia. Numerosos pacientes con dolor lumbar Dresentan discos intervertebrales hemiados en la RM, loque a menudo resulta util para expi- ‘ar el dolor y orienta ol tratamiento. [La RM ae llevs a cabo en 98 voluntariosasintomsticos (2) Dos radilogos, que dasconneian = ® | Negatva e d ced Che are brd atbtord sp=~¢ = “pee aa ops - **° op. = SEE ch ee ee Fig. 3-2. Caracarsticas y Cofriciones de las pruebas diagnSsticas. Se, sensblidad: Sp, especi- ‘cia; ,prevalencia; V, valor predict; CP, cociente de probabldad. de éstos, para una sensibilidad de! 73 %. Ademés, en 112 pacientes se iden- tificaron resultados negativos del cultivo; el personal no administré correc- tamente antibioticos a 77 de éstos, para una especificidad del 69 “. Utilizaci6n de las pruebas sensibles Cuando seleccionan una prueba diagnéstica, los clinicos deben tener en cuenta la sensibilidad y especificidad de ésta. Es preciso escoger una prue- ba sensible (es decir, una prueba que suele ser positiva si existe enferme- dad) cuando el precio que deba pagar por el hecho de omitirla puede ser muy elevado. Este seria el caso, por ejemplo, cuando existen razones para sospechar un proceso grave, pero tratable, como la tuberculosis, la sifilis 0 la enfermedad de Hodgkin. Las pruebas sensibles también son titiles durante las primeras fases de la investigacién diagndstica, cuando se con- sideran numerosas posibilidades para disminuir el ntimero de éstas. Las pruebas diagnésticas se utilizan en estas situaciones para descartar las enformodades, os decir, para establecer que doterminadas enfermedades son posibilidades improbables. Por ejemplo, en Ia evaluacién de unos infil- trados pulmonares y una pérdida de peso, se podria escoger precozmente ‘un andlisis de los anticuerpos anti-VIH para descartar una infeccién rela- Diagnéstico elinico si 27 0 fa faringttis ‘estroptecsciea =73% Sp 27 10. aio op 1H? 3 7 377 es Fig. 9-8, Exacttuc del diagndstico clinica de treptocécica comparado con los reautados del cutivofaringeo, (De Fletcher SW y Hamann ©, Emergency room maragemert of patients with sare throats in a teaching hospital: influence of ron-ohysician factors. J Comm Heath 1976; 1: 196-204), cionada con el SIDA. En resumen, una prueba sensible es sobre todo itil para el clinico cuando su resultado es negativo, Utilizaciones de las pruebas especificas Las pruebas especificas son vitiles para confirmar (o «dictaminar-) un diagnéstico que ha sido sugeride por otros datos. La razén de ello es que una prueba muy especifica tara vez es positiva si no existe enfermedad, es decir, proporciona pocos resultados falsos positives. Las pruebas muy espe- cifficas son necesarias especialmente cuando los falsos positivos pueden per- Judicar al paciente desde un punto de vista fisico, emocional o econdmico. Por consiguiente, antes de someter a los pacientes a una quimioterapia ara un céncer (con sus riesgos concomitantes, el trauma emocional y los costes econémicos asociados), es preciso un diagméstico histolégico en lugar de confiar en pruebas menos especificas. En resumen, una prueba especifi- ca es més titi] cuando el resultado de la prueba es positivo. Diagnéstico 51 Equilibrios entre sensibilidad y especificidad Evidentemente, es deseable disponer de una prueba que sea al mismo tiempo muy sensible y muy especifiea. Por desgracio, esto habitualmente noes posible. En lugar de ello, existe un equilibrio entre la sensibilidad y la especificidad de una prucha diagnéstica. Esto es verdad siempre que los datos clinicos adquieren una variedad o espectro de valores. En estas situa- ciones, la localizacién de un punto de corte, el punto del continuum entre lo normal y lo anormal, constituye una decision arbitraria. Como consecuen- cia, para cualquier resultado de una prucha determinada expresada en una ala continua, una caracteristica (p. ¢j., la sensibilidad) sdlo puede aumentar a expensas de la otra (p. ¢j., la especificidad). La tabla 3-1 demuestra esta interrelacién para el diagnéstico de la diabetes. Si exigié- ramos que la glucemia sanguinea 2 horas después de la ingestién de ali mentos fuera superior a 180 mg/100 ml para diagnosticar Ia diabetes, qui- zd todos los individuos diagnosticades como «diabéticos» experimentarian Ia enfermedad, pero muchas otras personas con diabetes se pasarian por alto al utilizar esta definicién tan oxtraordinariamente rigurosa de la enfermedad, Esta prueba seria muy especifica a expensas de la sensibili- dad. En el otro extremo, si cualquier individuo con una glacemia sangus- nea superior a 70 mg/100 mi fuera diagnosticado como diabético, se pasa- fa por alto a muy pocas personas con la enfermedad, pero la mayor parte de personas normales se etiquetarian felsamente como pacientes con dia- betes. Asi pues, la prueba seria sensible pero inespecifica. Utilizando una determinacién aislada de la glucemia sanguinea en condiciones esténdar, no existe ningtin medio para mejorar al mismo tiempo la sensibilidad y la especificidad de la prueba. ‘Otra forma de expresar la relacién entre la sensibilidad y la especifici- dad para una prucba determinada es construyendo una curva denominada ‘Tabla 3-1. Equilibrio entre la sencibilded y la eopeciticidad en ol diognéation dota diabetes” ‘Nel de ucria2 rors donuts “Selningetion dealin ‘Sensis Espectcidad 0100 oo, os 70 086 a8 80 97.1 255 90 943 476 100 356 sos 110 a57 341 10 74 25 130 043 269 140 8A a4 150 500 908 180 az 298 170 429 r000 180 386 1000 130 343 r000 200 2a 1000 “ube Health Senda. Diabats program gue, Publetion n= S08, Washington. DC: U.S. Government reting cn 1980. 52. Epidemiologia clinice. aspectos fundamentales curva de caracteristicas operativas para el receptor (ROC). En la figura 3-4 se ilustra una curva ROC para la utilizacién de una determinacién aislada de la glucemia sanguinea para el diagnéstico de la diabetes mellitus. Se traza mediante una gréfica la tasa de verdaderos positivos (sensibilidad) frente a la tasa de fals0s positivos (1 - especificidad) a lo largo de una serie de puntos de corte. Los valores en los ejes flucttian desde una probabilidad de 0 a 1,0 (6 alternativamente, desde 0 hasta el 100 %). La figura 3-4 ilus- tra el dilema creado por el equilibrio entre sensibilidad y especificidad. Un punto de corte de 100 de la glucemia sanguinea sélo pasarfa por alto al 11 % de diabéticos, pero el 30 % de individuos normales se alarmarfan por un falso positivo. | aumento del punto de corte hasta 120 disminuye los falsos positivos hasta menos del 10 % de los normales, pero a expensas de omitir casi el 30 % de los casos. Las pruebas que diferencian bien se agrupan hacia el extremo superior izquierdo de la curva ROC; para éstas, a medida que la sensibilidad aumenta progresivamente (cuando disminuye el punto de corte), apenas existe una pérdida de especificidad o no se produce ninguna hasta que se alcanzan niveles muy elevados de sensibilidad. Las pruebas que rinden ‘menos tienen curvas que se sittian més cerca de la diagonal que va desde el extremo inferior izquierdo hasta el superior derecho. La diagonal mues- % Soneiblided % “Tasa de verdadores positvos 1 Eepeciticided % ‘Tasa de flsos positivos Fig. 9. Curva ROC. Precision de ioe valores posprancialos alas 2horae do la glucemia como iagndstica de a diabetes melitus, Del Public Heath Service, Diabetes program quie. Publcacion n° 605. Washington, DC: U.S. Government Printing Office, 1960.) Diognestico 53 tra la relacién entre las tasas de verdaderos positives y de falsos positivos ‘que se producirian para una prueba que no aportase informacién, es decir, si el clinico simplemente decidiera echario a cara o cruz. La curva ROC pone de manifiesto lo importante que es el equilibrio entre la sensibilidad y la especificidad para una prueba, y puede utilizarse para contribuir a decidir donde debe estar e] mejor punto de corte. En gene- ral, el mejor punto de corte esté en el -hombro- dela curva ROC, o cerea de éste, a menos que existan razones clinicas para minimizar los falsos nega- tivos o los falsos positivos. Las curvas ROC son métodos especialmente valiosos para comparar pruebas alternativas para un mismo diagnéstico. La exactitud global de una prueba, puede describirse como el area bajo la curva ROC; cuanto mayor es el drea, mejor es la prucha. La figura 3-5 compara la curva ROC para los dos cuestionarios utiliza- dos para el estudio del alccholismo en pacientes ancianos: el CAGE y el Michigan alcoholism screening test (MAST) (5). El cuestionario CAGE es al ‘mismo tiempo més sensible y mas especifico que el MAST e incluye un érea bajo la curva mucho mayor. Obviamente, las pruebas que son tanto sensibles como especificas son Jas mAs buscadas y pueden tener un extraordinario valor. No obstante, los 888 88s 8 Bs Fig. 3-5. Curvas ROC para los cuestionarios CAGE y MAST en pacientes ancianos con y sin aleshotomo. (De Jones TY, Lindsey BA, Yount P, Soltya Ry Farani-Enayat B. Aleohaliom acroo- ning questionnaires: are they vad in elderly mecical outpatients? J Gen Intern Med 1993; 8: 674- 678) 54 _ Epidemiologia clinics. Aspectos fundamentales clinicos en ejercicio rara ver trabajan con pruebas que son al mismo tiempo muy sensibles y especificas. Por consiguiente, por el momento es preciso que utilicemos otros medios para resolver el equilibrio entre la sensibilidad y la especificidad. La forma més frecuente de hacerlo es utilizar los resul- tados de varias pruebas a la ver (tal y como se describe mas adelante). (COMO ESTABLECER LA SENSIBILIDAD Y LA ESPECIFICIDAD Frecuentemente, se describe una nueva prueba diagnéstica en términos elogiosos cuando se introduce por primera vez, y sélo cuando se ha acumu- lado experiencia se ponen de manifiesto sus defectos. El entusiasmo por el valor clinico del antigeno carcinoembrionario (ACE) experiments este alti- bajo. Primero se consideré que el ACE era un método muy prometedor para el diagnéstico del cancer de colon, pero después se puso de manifiesto que el ACE estaba aumentado en una amplia variedad de otros procesos, al igual que en alrededor del 20 % de fumadores sin céncer. Este tipo de con- fusion, el entusiasmo inicial seguido de una decepcicn, no es debido a una falta de honestidad por parte de los primeros investigadores 0 a un escepti- ccismo injusto por parte de la comunidad médica sino que més bien tiene ‘que ver con las limitaciones de los métodos mediante los cuales se estable- cieron en primer lugar las propiedades de la prueba. Al nivel més basico, las propiedades de una prueba diagnéstica (p. ¢., la sensibilidad y especifi- cidad), pueden ser descritas de forma inexacta porque se ha escogido un patrén incorrecto de validez, tal y como se ha descrito previamente. No obs- tante, otros dos aspectos, relacionados con la seleccién de pacientes onfor- ‘mos y no enfermos. también pueden afectar profundamente la determina- cién de la sensibilidad y la especificidad. Estos son el espectro de pacientes a Jos cuales se aplica ia prueba y el sesgo al juzgar el rendimiento de la prueba. Un tercer problema que puede conducir a estimaciones inexactas de la sensibilidad y especificidad es el azar. Espectro de pacientes. Pueden surgir dificultades cuando los pacientes utilizados para descri- bir las propiedades de una prueba son diferentes a las de los pacientes a quienes se aplicara la prueba en la practica clinica. Frecuentemente, los informes preliminares evaldan el valor de la prueba entre individuos que estén claramente enformos comparados con individuos que claramente no estén enfermos, por ejemplo, estudiantes de medicina que se ofrecen como voluntarios. La prueba puede distinguir muy bien entre estos extremos. Sin embargo, incluso los pacientes con la enfermedad en cuestién pue- den diferir con respecto a la gravedad, estadio o duracion de la enfermedad y la sensibilidad de una prueba tendré tendencia a ser més elevada en los pacientes mis gravemente afectados. Ejemplo. La figura 3-5 ilustra cémo el rendimionto de le determinacién del ACE varia segin el eatadin del edncercolerrectal. EI ACE tiene un buen rendimiento pare Ia enforme Diagnéstico 55 1.00 0.0 Sensiblided 1 Sensibilidad Punto.de sone A 25 ngimi 50 nom © 100 mg/m 020 049060 080 1,00 Especiticidad Fig. 9:6. Curva ROC para el ACE come prucba diagnéstice del céncer colorectal, de acuerdo ‘con 6! estadio dela enfermedad. La sensibiidad y la especficidad de una prueba varian con ol ‘stadia dela enfermedad. (De Fletzher RH. Carcinoembryonic antigen. Ann Intern Med 1936; 104; €6-73) ‘metastisica y un mal rendimiento para el esincer loeslizada. Por esta raz, la sansiilidad para el acer colorrettal- depende de Ia mezcla eanereta de estadios de los pacientes con la enfermedad utilizados para deseribir a prucha y su exactitud es mas estable dentro de los featadion 6 Igualmente, algunos tipos de individuos sin la enfermedad (p. ¢., aquéllos en quienes se sospecha) pueden experimentar otros procesos que provoquen una prueba positive, con lo que aumenta la tasa de falsos posi- tivos y disminuye la especificidad. Por ejemplo, el ACE también esté aumentado en numerosos pacientes con colitis uleerosa o cirrosis. Si los pacientes con estas enfermedades fueran incluidos en el grupo no enfer- mo, cuando se estudia el rendimiento del ACE para el eéncer colorectal, aumentarian los falsos positives y disminuiria la especificidad de la prue- ba para el cancer. En teorfa, la sensibilidad y la especificidad de una prueba son indepen ientes de la prevalencia de los individuos enfermos en la muestra en la cual se est evaluando la prueba. (Para confirmarlo trabaje con la fig. 3-2.) ‘No obstante, en la practica, diversas caracteristicas de los pacientes, tales como el estadio y la gravedad de la enfermedad, pueden guardar relacién 56 _ Epidemiologie clinica. Aspectos fundamentales tanto con la sensibilidad y especificidad de una prucba como con la preva- lencia, porque se identifican diferentes tipos de pacientes en situaciones de prevalencia elevada y baja. La utilizacién de una prueba para el cribado de una enfermedad ilustra este aspecto (v. cap. 8 para una descripcién en pro- fundidad del cribado). El cribado incluye la utilizacién de la prueba en una poblacion asintomatica, en la cual la prevalencia de la enfermedad en gene- ral es baja y, en cuanto al espectro de la enfermedad, predominan los casos més precoces y menos graves. En dichas situaciones, la sensibilidad tiende a ser més baja y le especificidad més elevada que cuando la misma prueba se aplica a los pacientes con indicios de la enfermedad, la mayor parte de Jos cuales presentan una enfermedad avanzada. Sesgo En ocasiones, Ia sensibilidad y especificidad de una prueba no se estable- cen independientemente de los métodos por medio de los cuales se establece el diagnéstico verdadero, lo que conduce a una evaluacién sesgada de las pro- iedades de la prueba. Esto puede ocurrir de diversas formas. Como ya se ha mencionado, si la prueba se evalva utilizando datos obtenidos durante el ccurso de uns valoracién clinica de pacientes con indicios do la enfermedad en cuestién, una prueba positiva puede propiciar que el médico continde inves- tigando el diagn6stico, lo que aumenta la probabilidad de identificar la enfer- medad. Asimismo, una prueba negativa puede ser responsable de que el médico abandone la investigacién adicional, lo que aumenta las probabilida- des de que la enfermedad, si esté presente, se pase por alto. En otras situaciones, el resultado de una prueba puede formar parte de la informacién utilizada para establecer el diagndstico,o al contrario, los resulta- dos de la prueba pueden interpretarse teniendo en cuenta otra informacién clinica o el diagndstico final. Los radislogos frecuentemente estén sujetos a este tipo de sesgo cuando interpretan las radiografias. Puesto que la interpre- tacién de las radiografias es en cierto modo subjetiva, resulta facil estar influi- do por la informacién clinica proveida. Todos los clinicos han pasado por la situacién de haber interpretado exageradamente una radiografia debido a una impresién clinica o, al contrario, de recuperer una radiografia antigua en la ccual se pasé por alto un hallazgo porque en ese momento no se conocia un pro- bblema clinieo y, por esta razén, no se presté atencién a un area conereta de la radiografta. Debido a estos sesgos, algunos radiGlogos prefleren interpreiar las radiografias dos veces, primero sin la informacién clinica y, después, con ella. Todos estos sesgos tienen tendencia a aumentar el acuerdo entre la prue- bay el patrén de validez, es decir, tienen tendencia a hacer que la prueba parezca més uitil de lo que realmente es, como, por ejemplo, cuando una RM dela columna lumbar muestra un prolapso discal en un paciente con dolor Tumbar (x, el ejemplo previo en este cap.). Azar Los valores de la sensibilidad y la especificidad (o cocientes de probabi- lidad, otra caracteristica de las pruebas diagnésticas descrita mas adelan- Diognéstico 57 100 0 Intervaiog (ce confanza—————Observacos. Pei 98 36 Sonsiitided % 8 oi a 10 20 0 “0 30 Nimero de individuos abservados Fig. 2-7. Precision de una estinacén ¢e la sensiblidad. Intervalo de confianza del 95 % para Ua sensibldad observada cel 75%, de acuerdo con el rimmero de indvicuos observados. te) suelen estimarse a partir de observaciones en muestras relativamente pequefias de individuos, con y sin le enfermedad en cuestién. Debido al azar (variaci6n aleatoria) en una muestra, especialmente si es de pequefio tamaio, la sensibilidad y la especificidad reales de la prueba pueden estar representadas erréneamento incluso aunque en el estudio no exista un ses- 0. Los valores concretos observados son compatibles con una serie de valo- res reales, caracterizados tipicamente por los «intervalos de confianza del 95 %' (x. cap. 9). La amplitud de este intervalo de valores define el grado de precision de las estimaciones de la sensibilidad y la especificidad. For esta razén, los valores mencionados para la sensibilidad y la especificidad no deben tomarse demasiado al pie de la letra si se estudia a un niimero reducido de pacientes. La figura 3-7 muestra cémo la precisién de las estimaciones de la sen- sibilidad aumenta a medida que aumenta el ntimero de individuos en los cuales se basa la estimacion. En este ejemplo concreto, la sensibilidad observada de la prucba diagnéstica es del 75 %. La figura 3-7 muestra que si esta estimacién s6lo se basa en 10 pacientes, por efecto del aza aislado, la sensibilidad real podria ser solamente del 45 % y hasta de casi "Bl intervalo de cxnfianza dal 95 % de un porentaje s estima lciinente mediante la sguiente formu on ERE ane pane dra et coker vidoe sbaervados. Para wna sproximacion mie 58 _Epidemiologia clinica, Aspectos fundamentales 1 100 %. Cuando se estudia a un mayor nvimero de pacientes, se estrecha elintervalo de confianza del 95 %, es decir, aumenta la precisién de la estimacién. VALOR PREDICTIVO Como se ha mencionado previamente, la sensibilidad y la especificidad constituyen propiedades de una prueba que se tienen en cuenta cuando se decide emplearla o no. Pero, una ver que se dispone de los resultados de una prueba diagn6stica, sean positivos o negatives, la sensibilidad y espe- cificidad dela prueba dejan de ser importantes porque estos valores perte- necen a individuos en los que se conoce si tienen la enfermedad o no. Sin embargo, si se conociera el estado de la enfermedad del paciente, ino seria necesario realizar la prueba! Para el clinico, el dilema estriba en determi- nar si el paciente tiene la enfermedad o no, dados los resultados de una prueba. Definiciones La probabilidad de una enfermedad, datos los resultados de una prue- ba, se denomina valor predictivo de la prueba (v. fig. 3-2). El valor predic- tivo positivo es la probabilidad de la enfermedad en un paciente con un resultado positive (anormal) de la prueba. El valor predictive negativo es a probabilidad de no tener la enfermedad cuando el resultado de la prue- ba es negativo (normal). El valor predictivo responde a la cuestién: «si ol resultado de la prueba de mi paciente es positivo (negativo), zeudles son las probabilidades de que mi paciente tenga (no tenga) la enfermedad». El valor predictivo en ocasiones se denomina probabilidad posterior (0 posprueba), la probabilidad de la enfermedad después de conocer el resul- tado de la prueba. La figura 3-3 ilustra estos concertos. Entre los pacien- tos tratado: con antibisticos por una faringitis estreptocécica, menos de la mitad (44 %) presentaban el proceso, segtin el cultivo (valor predictivo positivo). El valor predictivo negativo de las impresiones diagndsticas del personal fue mejor; de los 87 pacientes en quienes se consideré que no presentaban una faringitis estreptocécica, la impresion fue correcta para 77 de ellos (88 %). Se han deacrito términos que resumen el valor global de una prucha. Un término de este tipo, la exactitud, es el porcentaje de todos los resulta- dos de Ia prueba, positivos y negatives, que son correctos. (Para el ejemplo de la faringitis de la fig. 3-3, la exactitud de las impresiones diagnésticas del personal fue del 70 %.) El rea bajo la curva ROC es otra medida resu- ‘men dtil de la informacion proporcicnada por el resultado de una prueba, Sin embargo, eatas medidas resumen son excesivamente bésicas como para ser de utilidad desde un punto de vista clinico porque Ia informacién espe- cifica sobre las partes que la componen -la sensibilidad, la especificidad y el valor predictivo a determinados puntos de corte se pierde cuando se agregan en un indice tinico. Diagnéstico 59 Detorminantes dol valor predictive El valor predictive de una prueba no es una propiedad de la prueba ais- ada. Esta determinado por la sensibilidad y la especificidad de la prueba y por la prevalencia de la enfermedad en la poblacion que esta siendo eva- Tuada, en la cual, la prevalencia tiene su significado tradicional: el porcen- taje de individuos en una poblacién definida en un punto dado do tiempo que sufren el proceso en cuestién. La prevalencia también recibe el nombre de probabilidad previa (0 preprueba), la probabilidad de la enfermedad antes que se conozca el resultado de la prueba, (Para una descripcién deta- Mada de la prevalencia, ¥. cap. 4.) La formula matematica que relaciona la sensibilidad, la especificidad y 1a prevalencia con el valor predictivo positive deriva del teorema de Bayes de las probabilidades condicionales: Se idad x Prevalencia) x Prevalencia Brpecfcidad) x (I~ Frevalenda) Cuanto més sensible es una prueba, mejor sera su valor predictive negative (més seguro podré estar el clinico de que el resultado negativo de Ja prueba descarta la enfermedad investigada). Por el contrario, cuanto mis especifica sea la prueba, mejor seré su valor predictivo positive (mas seguro podré estar el clinico de que una prueba positiva confirma 0 corro- bora el diagnostico investigado). Puesto que el valor predictivo tambien est4 influido por la prevalencia, no es independiente del contexto en el cual se utiliza Ia prueba. Los resultados positives, incluso para una prueba muy especifica, cuando se aplican a pacientes con una baja probabilidad de tener la enfermedad, serdn en su mayor parte falsos positives. De forma parecida, los resultados negativos, incluso para una prueba muy sensible, cuando se apliquen a pacientes con una probabilidad elevada de tener la enfermedad, es probable que sean falsos negatives. En resumen, la inter~ protacién do un reoultado positive o nogative de una prueba diagnéstica varia de un contexto a otro, de acuerdo con la prevalencia estimada de la enfermedad en cada contexto eonereto. ‘A.veces, no es evidente qué tiene que ver la prevalencia con un paciente concreto, Para los eseépticos, podria ser titil considerar cémo rendiria una prueba en los extremos de la prevalencia. Es preciso recordar que no importa el grado de sensibilidad y especificidad (corcanfa a Ia perfeccién) de una prueba, ya que siempre existiré un pequefio porcentaje de pacientes clasificados erréneamente por ella. Imaginemos a una poblacién en la cual ningiin individuo padece la enfermedad. En dicho grupo, todos los resulta- dos positives, incluso para una prueba muy especifica, seran falsos positi- vos. Por consiguiente, a medida que la prevalencia de la enfermedad en ‘una poblacién se acerca al 0, la prevaloncia del valor predietivo positive de Ia prueba también se acerca al 0. Por el contrario, si cada individuo de la poblacién examinada padece Ia enfermedad, todos los resultados negativos serdn falsos negativos, incluso para una prueba muy sensible. A medida que la prevalencia se acerque al 100 %, el valor predictivo negativo se acer- 60 Epidemiolagia clinice. Aspertos fundamentales caré al 0. Otra forma para que los escépticos se convenzan de estas relacio- nes es considerar la figura 3-2, manteniendo la sensibilidad y la especific. dad constantes, modificando la prevalencia y calculando los valores predic- tivos resultantes. El efecto de la prevalencia sobre el valor predictivo positivo, para una prueba con diferentes niveles de sensibilidad y especificidad, aunque gene- ralmente elevados, s¢ ilustra en la figura 9-8. Cuando la prevalencia de la enfermedad en la poblacién investigada es relativamente elevada, superior a determinado porcentaje, la prueba tiene un buen rendimiento, pero con prevalencias més bajas, el valor predictivo positivo disminuye casi a0 y la prueba practicamente no es itil para el diagnéstico. A medida que la sensi- bilidad y la especificidad disminuyen, llega a ser més aguda la influencia de los cambios de la prevalencia en el valor predictivo. Ejemplo. Bl valor predictivo del APE para el diagndstice dal carcinoma de préstata ha sido estudiadocen diversas situaciones clinicas quo corresponden a diferentes prevalencias o Drebatilidades previas. Ea veroace asintomdticos, de edad avanaada, en los que ae eatima, ‘que la prevalercia del carcinoma de pritata es dl 6-12 %,sdl alrededor dl 15“ de varones con un APE de 4 mg/dl o cuperior padecian realmente un eéncer En varones con tun riesgo ‘més elevado (con tintemas 0 una exploracién rectal sugestiva), en los cuales la prevalencia el carcinoma de préstata ora dal 26 . el 40 % de ellos can un AFE positivo padecian el cin cer (7). Sie] APE so hubiera utilizado come prueba de cribado en varones asiniomiticos, 506 ‘varones sanos habrian tenido que hacerse pruebas adsconales, a menudo inclayendo la biop- ‘para identficar a un varén eon eéncer No abstante, cuando existe un indicioelinico con- vineente de malignided, casi en el $0 % de varanes con una pracbs positiva seidentificaré un cancer de présiata Los esfuerz0s actuales para prevenir la transmisién del sindrome de la inmunodeficiencia adquirida (SIDA) por los productos sanguineos es otro ejemplo del efecto de la prevalencia de la enfermedad sobre el valor predic tivo positive. 100 = eo Sensibilidad/eepecifiidad i voy \ 3 col 0% too ove |. 5 3 2 ° ws 10 «1780 VI00 171.000 "710.000 Prevalencia Fig. 3-8 Valor predictive pesitve de acuerdo con la sersibildad, Ia especiicdad ylaprevalencia de a onformedad. Diagnéstice 61 Ejemplo, Para el cribado de ls donantes de sangre, se utiliza un analisis de sangre en ‘busca de anticuerpos frente al virus dela inmunodeficiencia humana (VIH). Aun determina do punto de corte, Ia sensibilidad ex del 978 % y a eapecfcidad dsl 90,4 %. Ba 1985, a partir dela provalencia en las unidaes infeecionas, se esti que el Valor predictivo positivo de la ‘prueba no era superior a 1/1000. Por consiguiente, por cade resultado verdadero positivo. ‘existirian 9.250 resultados falsos positives de la prueba 8). Habrian tonido que rechazarse ‘asi 10,000 unidades o investigarse adicionalmente para prevenir una transfusica de sangre ‘contarinada. Loa auteres concuyeron que, enn tema con tanta earga emocicnal, «una adhe- ‘etcia euidadata a los prinipios de la evaluacion de las pruebas dagnsaticas evita expecta- tivas poco realist. Pore la situaciéa cembis. A modida que la provaloncia de I infeccién yor el VIH auments ‘ena poblacién general, mejoré el valor preditivo positivo de la prueba de cribedo. En una publicacin un afe més tarde, la prevalencia de unidades infectadas entre 67.190 unidades ‘xaminadss fue de 25/10,000 y, a niveles similares do senaibilidad y especiScidad, el valor predictive positive seria del 2,8 %, muy superior al de unos afes airs (9), Estimacién de la prevalencia {Como pueden estimar los clinicos la prevalencia o probabilidad de una enfermedad en un paciente para determinar el valor predictive del resulta- do de una prueba? Existen diversas fuentes de informacién: la literatura médica, las bases de datos locales y el juicio ciinico. Aunque la estimacién resultante de la prevalencia rara vez es muy precisa, no es probable que el error sea de tal magnitud que modifique los juicios clinicos que se basan en Iaestimacion. En cualquier caso, el proceso tenderd a ser mas exacto que el ‘mero juicio clinico implicito. En general, para determinar el valor predictivo, la prevalencia es mas importante que la sencibilidad y la cspecificidad (v. fig. 3-8). Una razén do ello es que la prevalencia generalmente varia a lo largo de unos limites mas amplios. En distintos contextos clinicos la prevalencia de una enfermedad puede variar desde una fraccién de un porcentaje hasta casi la certidum- bre, en funcién de la edad, el sexo, los factores de riesgo y los hallazgos cli- nicos del paciente. Comparese la prevalencia de una lepatopatia en un adulto joven, sano, que no consume drogas ilegales u otros farmacos y que consume aleohol sélo ocasionalmente, con la de un drogadicto por via intra- venosa que presenta ictericia. Segiin los patrones actuales, los clinicos no estn especialmente interesados en las pruebas con sensibilidades y espe- cificidades muy por debajo del 50 %, pero, si tanto la sensibilidad como la especificidad son del 99 %, se considera que la prueba es muy buena. En otras palabras, en términos précticos, la sensibilidad y la especificidad rara ver varian més de dos veces, ‘Aumento de la prevalencia deta enfermedad Al considerar la relacién entre el valor predictivo de una prueba y la prevalencia, constituye una ventaja evidente para el médico aplicar las pruebas diagnésticas en los pacientes con mayor probabilidad de padecer Ia enfermedad que se esté investigando. De hecho, tal y como muestra Ia figura 3-8, las pruebas diagnésticas son de mayor utilidad cuando la exis- tencia de la enfermedad noes ni muy probable ni muy improbable. 62__Epidemiologia clinica. Aspectos fundamentales Eriste una serie de métodos mediante los cusles pusde aumentarse la probebilidad de una enfermedad antes de utilizar una prueba diagnéstica, Proceso de referencia El proceso de referencia o envio es uno de los métodos més frecuentes a través del cual se auments la probsbilidad de Is enfermedad. El envio a hospitales docentes, consultas externas y servicios de urgencias aumenta la probabilidad de que tras las molestias del paciente subyazca una enfer- medad significativa . Por esta razin, en estos contextos puede estar justifi- cado una utilizacién relativamente mas agresiva de las pruebas diagnosti- cas. Asimismo, en atencidn primaria y especialmente entre pacientes sin molesties, la probabilidad de hallar la enfermedad es considerablemente ‘menor y las pruebas deben utilizarse con mucha mayor parquedad it6 a cientoe de 3 nunca identifies mings, paziente con una causa grave subyacente de la exfalen. (Bs poco probable que se procesns importantes puesto que la elinica era practicamente la Unica fuente d ‘dics para estos pacientes y ae hacia un soguimisnts prolongads.) Sin embergo, durante la primera semana de vaslta ala residencia médica, on un paciente que acudié al devartamento de urgencias dol hospital por una cefalea similar» Is tratadas en la diniea militar se ident- fics un absceao cerebelovo Puesto que los clinicos pueden trabajar en diferentes extremos del espectro de la prevalencia en diferentes momentos en su préctica clinica, deben tener en cuenta que puede ser nevesario ajustar la intensidad de la evaluacién diagnéstica a cada situacién especifica. Grupos demogrificos seleccionados En un contexto determinado, los médicos pueden aumentar el rendi- miento de las pruebas diagnésticas aplicandolas a grupos demograficos conocidos por presentar mayor riesgo de la enfermedad. Un varén de 65 fos presenta 15 veces mas probabilidades de experimentar una arteriopa- tie coronaria como causa de un dolor tordcico atipico que una mujer de 30 afos; por consiguiente, la prueba electrocardiogréfica de esfuerzo, una prueba diagndstica concreta para la coronariopatfa, es menos itil para con- firmar el diagndstico en la mujer joven que en el varon de edad avanzada (20). De forma parecida, una prueba para la anemia falciforme obviamente tendria un valor predictive positivo més elovado entre individuos de raza negra que entre individuos de raza blanca. Caracteristicas espectiicas de la situacién clinica Claramente, las caracteristicas especificas de la situacién clinica consti- tuyen la influencia més poderosa en la decisién de solicitar pruebas. Los signos, sintomas y factores de riesgo de la enfermedad aumentan o dismi- nuyen la probabilidad de hallar una enfermedad. Por ejemplo, una mujer con un dolor tordcico tiene mayores probabilidades de experimentar una Diagnéstico 63 coronariopatia si padece una angina tipica e hipertensién y es furnadora. Como consecuencia, un electrocardiograma de esfuerzo con un resultado anormal tiene mayores probabilidades de representar una coronariopatia en dicha mujer que en individuos con un dolor tordcico inespectfico y sin factores de riesgo coronario. El valor de aplicar las pruebas diagnésticas en personas con mayores probabilidades de experimentar una enfermedad concreta es intuitivamen- te evidente para la mayoria de médicos. Sin embargo, con la ereciente dis ponibilidad de pruebas diagndsticas, es més facil adoptar un enfoque ‘menos selectivo cuando se solicitan pruebas. No obstante, cuanto menos selectivo sea el enfoque, probablemente menor seré la prevalencia de la enfermedad y menor sera el valor predictivo de la prueba. La magnitud de este efecto puede ser mayor de lo que la mayoria de nosotros imaginamos. Bjemplo. Los factores que influyen en la interpretacién dun resultado anormal de un clectrocardiograma de esfuerzo se ilustran ex la Sigura 3-9, La figura muestra que el valor 100 1 054.0mm ee | g hr i x © ibs Ew 3 H oo & a 10 0 ted m0 60-6 woe we Sotomas Ningine Negino Angina Angina aipica ‘plea Prevaencapwala 1,9 1287143 atteriopatia coronaria Fig. 2-0. Facto de la provalercia de Ia enfermedad sabre al valor predictive postive da una ‘prucba ciagnéstica. Prebablided de arteriopatia coronaria de acuerso con la edad, bs shtomas la depresion del sagrrento ST en el electrecarciograma. (De Diamond GA y Forester JS. Analy is of probability as.an aid in the clrical diagnosis of coronary artery disease. N Engl | Med 1979; ‘300: 1350-1358) 64 _ Epidemiologia clinica, Aspectos fundamentales predictive potitive para le arteriopatia coronaria assciado con un resultado ancrmal de I prueba puede variar desde el 1,7 hasta e199,8 %, dependiendo de la edad, los sintomas y el srado de anormaliad de la praebe. Axi, una prueba de esfuerso en un varén ssintomético de 236 aos euyo resultado indique una depresién de 1 mm del segmento ST seré un faleo postive fen mas del 98 % de casos. BI mismo resultado de la prueba en un varén de 70 afos con una ‘angina tipica sea Ia historia se ssociar4 con una arteriopatia coronaria en més del 90 % de ‘casos (10) Debido a este efecto es preciso que los médicos interpreten resultados similares de una prueba de manera diferente en distintas situaciones clini- cas. Una prueba de esfuerzo negativa en un varén asintomético de 36 aiios ‘simplemente confirma la probabilidad, ya de por s{ baja, de una arteriopa- ‘ia coronaria, pero una prueba positiva habitualmente conducira a error si se utiliza para investigar la enfermedad no sospechada, tal y como se ha Mevado a cabo en individuos que practican jogging, en pilotos y en ejecuti- vos. Lo contrario vale para el varén de 65 afios con una angina tipica. En este caso, la prueba puede ser titil para confirmar la enfermedad, pero no para excluirla, La prueba es sobre todo itil en situaciones intermedias, en las cuales la prevalencia no es ni muy elevada ni muy baja. Por ejemplo, un varén de 60 aiios con un dolor torécico atipice tiene una probabilidad del 67 % de arteriopatis coronaria antes de 1a prueba de esfucrzo (véase fig. 3-9), pero después, con una depresién del segmento ST superior a 2,5 mm, tiene una probabilidad de coronariopatia del 99 %. Puesto que la prevalencia de la enfermedad es un determinante tan potente del grado en que una prueba diagndstica seré util, es preciso que Jos clinicos consideren la probabilidad de la enfermedad antes de solicitar Ja prueba. Hasta hace poco tiempo, los clinicos se basaban en observacio- nes clfnicas y en su experiencia para estimar la probabilidad preprueba de una enfermedad. En la actualidad, la investigacién, que utiliza extensos bancos de datos clinicos informatizados proporciona estimaciones cuantita- tivas de la probabilidad de la enfermedad, dadas diversas combinaciones de hallaagos clinicos (11). Implicaciones para la bibliografia médica Frecuentemente, las descripeiones publicadas de las pruebas diagnésti- cas incluyen, ademas de la sensibilidad y la especificidad, algunas conclu- siones sobre la interpretacién de una prueba positiva o negativa, es decir, ‘el valor predictivo, Esto se leva a cabo, con raz6n, para proporcionar infor” macién directamente ttil para los médicns, pero los datos para estas publi- caciones a menudo se redinen en hospitales docentes universitarios donde la prevalencia de una enfermedad grave es relativamente elevada. Como consecuencia, las afirmaciones sobre el valor predictivo en la bibliografia médica pueden conducir a error cuando la prueba se aplica en ambitos ‘menos seleccionados. ¥ lo que es peor, los autores a menudo comparan el rendimienta de una praeba en una serie de pacientes en los que se ha detectado la enfermedad y en un nimero igual de pacientes sin la enferme- dad. Esta es una forma eficiente de describir la sensibilidad y especifici- dad, No obstante, cualquier valor predictive positivo mencionado proceden- Diognéstico 65 to de dichos estudios apenas tiene valor porque se ha determinade para un grupo de pacientes en los cuales los investigadores establecieron la preva- lencia de la enfermedad en el 50 %. COCIENTES DE PROBABILIDAD 0 VEROSIMILITUD Los cocientes de probabilidad o verosimilitud son una forma alternativa de describir el rendimiento de una prueba diagnéstica. Resumen el mismo tipo de informacién que la sensibilidad y la especificidad y pueden utilizar- se para calcular le probabilidad de la enfermedad después de una prueba ositiva 0 negativa. Odds Puesto que la utilizacién de los cocientes de probabilidad o verosimilitud depende de la odds, para comprenderlos primero es necesario distinguir la odds de la probabilidad. La probabilidad, utilizada para expresar la sensibili- dad, la especificidad y el valor predictivo, es el porcentaje de individuos en quienes esté presente una caracteristica conereta, como una prucbe positiva Por otra parte, la odds es la razén de dos probabilidades. La odds y la probabi- lidad contienen la misma informacién, pero la expresan de forma diferente. Las dos pueden interconvertirse utilizando formulas simples: (Odds = Probabilidad del acontecimiento ~- 1 ~ Probabitidad del acontecimiento Probabilided = Odds + 1+ Odds Los lectores deben estar familiarizados con estos términos porque se utilizan en la conversacién diaria. Por ejemplo, podemos decir que la odds de que un equipo de futbol gane esta noche es de 4:1 0 que tiene una proba- bilidad de ganar del 80 %. Definiciones Elcociente de probabilidad 0 verosimilitud para un valor conereto de una prueba diagndstica se define como la probabilidad de dicho resultado de la prueba en individuos con la enfermedad dividida por la probabilidad del resultado en individuos sin la enfermedad. Los cocientes de probabili- dad expresan cudintas veces mas (0 menos) probable es que se identifique un resultado de una prueba en individuos enfermos comparados con los no enfermos. Si una prueba es dicotémica (positiva/negativa), dos tipos de cocientes de probabilided describen su capacidad para diferenciar entre individuos enfermos y no enfermos: uno se asocia con una prueba positiva y el otro, con una pruoba negativa (v. fig. 3-2) LN. det. Bl ocabo ds no tiene uns treduccién a castaliano ampliamenteaceptada Entre las ‘muchas propustiaa queso en eletunda para tradi dde rio destacan Oportumitod relatica¥ el txtanjriamv Ronda te odd v Goce Sontarta 1980; 4(16) 3539) 06 _ Epidemiologie clinics. Aspectos fundamentales En el ejemplo de la faringitis (v. fig. 3-8), los datos pueden utilizarse para caleuler los cocientes de probabilidad de una faringitis estreptocécica si existe una prueba positiva o negativa (diagnéstico clinico). Una prueba positiva es aproximadamente 2,5 veces mas probable que se produzca si existe faringitis estreptocdcica que si no existe. Si los médicos consideraron que no existia una faringitis estreptocécica, el cociente de probabilidad para esta prueba negativa fue de 0,39; Ia odds de que se estableciera un diagnéstico clinico negativo con faringitis estreptocécica comparada con que no hubiera enfermedad fue de aproximadamente 1:26. Utilizaci6n de los cocientes de probabilidad La probsbilidad preprucba (prevalencia) puede convertirae on odde pre- prueba utilizando la formula presentada previamente. Después, los cocien- tes de probabilidad pueden utilizarse para convertir la odds preprueba en ‘odds posprueba, por medio de la formula siguiente: (Odds preprueba x Cociente de probabilidad = Odds posprueba A.su vez, las odds posprucha pueden convertirse de nuevo en una pro- babilidad, utilizando la formula descrita previamente en este capitulo. En esta relacién, Ia odds preprueba contiene la misma informacién que la pro- babilidad previa (prevalencia), los cocientes de probabilidad, la misma informacion que la sensibilidad/especificidad y la odds posprueba la misma que el valor predictivo positivo (probebilidad posprucba), La prineipal ventaja de los cocientes de probabilidad es que permiten ir més alld de una clasificacién simple y burda de un resultado de una prue- ba como anormal o normal, tal y como se lleva a cabo habitualmente cuan- do se describe la exactitud de una prueba diagndstica s6lo en términos de sensibilidad y especificidad en un solo punto de corte, Obviamente, la enfermedad es més probable si existe un resultado extraordinariamente anormal de la prueba que con un resultado préximo a los limites. Con los cocientes de probabilidad, es posible resumir la informacin contenida en el resultado de una prueba a diferentes niveles. Se pueden definir los cocientes de probabilidad para cualquier resultado de una prueba a lo lar- .g0 de todos los limites de los posibles valores. De este modo, no se desecha Ia informaci6n representada por el grado de la anormalided, més que por la mera presencia o ausencia do ésta. En ol ealeulo de los cocientes de pro- babilidad a través de un espectro de resultados de la prueba, la sensibili- dad hace referencia a la capacidad de dicho resultado concreto de la prueba para identificar a los individuos con la enfermedad y no a individuos con dicho resultado o algo peor. Lo mismo puede afirmarse para el célculo de la especificidad. - Por consiguiente, los cocientes de probabilidad pueden adaptarse ala prictica clinica comtin y razonable de dar mayor valor a unos resultados extraordinariamente elevados (0 bajos) de una prueba que a unos resulta- dos en los limites cuando se estima la probabilidad (u odds) de que esté presente una enfermedad concreta. Diagnéstico 67 Bjemplo. ;Hasta qué punto es exocta una determinacisn aislada de la tiroxine (T.)sériea ‘como prueba del hipotiroidismo? Esta cuestiin se abords en un estudio con 120 pacientes ambulatorios de medicina general con indicios de hipotiroidismo (12. Lee pacientes fueron iagmosticadoa como partadores dotun posible hipotroidizm ai ae entifs un aumento dela tirctropina (TSA) séricay si las evaluaciones posteriores, inclayendo otras pruebas troideas y le respuesta al tratamiento, fueron congruentes con an hipotioidismo, Los autores estudia- +00 el nivel nical de, en 27 pacientes con hipotroidismo y en 98 pacientes en los que no 96 ingnosti para establocer In exactitud de la determinacién aislada de T, para el diagnéstico ‘de prover, los codentes de probabilidad para el hipotiroidismo fueren mayores para las nivelesbajos de T, y menores para los niveleselevadbs (tabla 3-2). Los valores mas, bajos en la distribucién de ia 7, (< 4,0 g/dl) silo se identiicaron en pacientes con hipotiroi- Aismo, es decir estos niveles cofirmaran ot diagndstico. Los niveles mis elevados (> 8,0 yg) ‘ose identifiearon en pacientes con hipotiroidismo, es decir, la existencia de estos aiveles des carté la enfermeded. Los autores coneluyeron que -es porble lograr un ahorro de lo costes inla perdida de exactitud diagnostica utiizando una determinacion aislada de T, total para Inevalaacininiisl de Ia sospecha de hipatroidismo en pacientes concretons Elcociente de probabilidad tiene otras ventajas con respecto a la sensi bilidad y especificidad como descripcién del rendimiento de la prueba. La informacion con la que contribuye la prueba se resume en un numero en lugar de dos. Los célculos necesarios para obtener la odds posprucha a par- tir dela odds preprueba son sencillos. Asimismo, los cocientes de probabil dad son especialmente adecuados para describir la probabilidad global de Ja enfermedad cuando se utilizan una serie de pruebas diagnéstices (x. més adelante). Los cocientes de probabilidad (CP) también tienen desventajas. Es pre- ciso utilizar odds y no probabilidades, y la mayorfa de nosotros tenemos ‘més dificultades para razonar en términos de adds que en términos do pro- babilidades. Ademés, la conversién de la probabilidad en odds y ala inver- sa requiere un célculo matematico o la utilizacién de un normograma, lo ‘able 3-2. Dietribucién de los valores de tiroxina sérica en pacientes hipotroideos y en indivues normates con el céleulo de los cocientos de probablidader Pacantes conreautadca dela pb eosin va tte Noma Cocierte pacente probated 1 Confimado 10) 138 665) 23 sain 11018) 09 204) 13:20. 24 17083) t 20g.) sts Descatado 4143) 443) 274900) 92 (100) "De Goldeiin 81 y Mushin N. Use oa angie yong tei to ealute ambulatory medon patents fr suspected potyroldom J Gen ier Mad 1957, 220-28. 08 _ Epidemiologie clinics. Aspectos fundamentales que -en parte—contrarresta Ia simplicidad del eéleulo de Ia odds posprue- ba utilizando cocientes de probabilidad. Por tltimo, para las pruebas con un intervalo de resultados, los cocientes de probabilidad utilizan medidas de sensibilidad y especificidad que son diferentes de las habitualmente des- crritas, PRUEBAS MULTIPLES Puesto que los médicos generalmente utilizen pruebas diagnésticas imperfectas, con una sensibilidad y especificidad infericres al 100 % y corientes de probabilidad intermedios, a menudo una sola prueba propor- ciona una probabilidad de la enfermedad que no es ni muy alta ni muy baja, por ejemplo, situada entre el 10y el 90 %. Habitualmente, no es acep- table interrumpir el proceso diagndstico en este punto. (Estaria satisfecho un médico o un paciente con la conclusién de que el paciente tiene una pro- babilidad del 20 % de pedecer un carcinoma de colon? 0 de que un varén asintomaticn de 36 anos de edad con una depresiGn de 2,5 mm del segmen- to ST en una prueba de esfuerzo tuviera una probabilidad del 42 % de suftir una arteriopatia coronaria (v. fig, 3-9)? Incluso par enfermedades ue no conducen a la muerte, como el hipotiroidismo, las pruebas con pro- babilidades posprueba intermedias apenas son de utilidad. El médico, por lo general, esté dispuesto a aumentar o a disminuir la probabilidad de la enfermedad en estas situaciones, a menos que naturalmente todas las posi- bilidedes diagnésticas sean insignificantes, no pueda hacerse nada acerca del resultado o el riesgo de continuar adelante sea prohibitive. Salvo estas excepciones, el médico desearé proseguir con pruebas adicionales. ‘Cuando se llevan a cabo miiltiples pruebas y todas son positivas o nega- tivas, la interpretacién es clara. Sin embargo, a menudo algunas son posi- tivas y otras negativas. En estos casos, la interpretacion es mas complica- da, Este apartado describe los principios mediante los cuales se aplican interpretan miiltiples pruckas. Las pruebas maltiples pueden aplicarse de dos formas en general (figu- ra 3-10). Pueden utilizarse en paralelo (es decir, todas ala vez) y un resul- tado positivo de cualquiera de las pruebas se considera una prueba de la enfermedad, 0 bien pueden llevarse a cabo de manera seriada (es decir, con- secutivamente), partiendo de los resultados de la prueba previa. Para las pruebas seriadas, es preciso que todas las pruebas deparen un resultado positive para que se establezca el diagn6stico, puesto que el proceso diag- néstico se interrumpe cuando se obtiene un resultado negativo, Pruebas paralelas Los médicos habitualmente solicitan prusbas en parelelo cuando es necesaria una evaluacién répida, tal y como ocurre en los pacientes hospi- talizados o visitados en situaciones de urgencia, o para los pacientes ambu- latorios que no pueden regresar facilmente porque han recorrido una larga distancia para ser evaluados. ESTRATEGIA ‘SECUENCIA DE CASOS ‘CONSECUENCIAS. Pruebas seriadas Laprusba A y la prueba B ya prueba C son positives ASt a Bait + Oo4 | Sensiiided 2 4 L 1 Espectcidad Pruebas paralelas La prusba A 0 a prueba Bo la prusta C'son pasitvas a> iF B- |el 1 Sensiiidad | Espectcidad Fig 910. Prucbas seridas y paraleas, Las pruebas miltiples en paralelo en general aumentan la sensibilidad ¥, por esta razén, el valor predictivo negativo para una prevalencia deter- minada de la enfermedad es superior al del de cada prueba individual. Por otra parte, disminuyen la especificidad y el valor predictivo positivo. Es decir, es menos probable que la enfermedad se pase por alto (Jas pruebas paralelas probablemente constituyen una explicacién de que los centros hospitalaries parezcan que diagnostiquen Ins enfermedades que los médi- cos locales pasan por alto); pero también es mAs probable que se establez- can diagnésticos falsos positives (y por consiguiente, la propensiGn a sobre- diagnosticar en dichos centros también es mayor). El grado en que aumenta la sensibilidad y el valor predictivo negativo depende del grado ‘en que las pruebas identifican a pacientes con la enfermedad que han sido omitidos por las otras pruebas utilizadas. Por ejemplo, si se utilizan dos pruebas de forma parelela con unas sensibilidades del 60 y el 80 ‘%, la sen- sibilidad de la prueba paralela sélo seré del 80 %, si la mejor prueba iden- tifica a todos los casos puestos de manifiesto mediante la prueba menos sensible. Si ambas pruebas detectan todos los casos omitidos por la otra, la sensibilidad de las prucbas paraleles naturalmente es del 100 %. Si las dos pruebas son completamonto independientes entre si, la sensibilidad de Jas pruebas paralelas seria del 92%. Las pruebas paralelas son especialmente utiles cuando el clinico se enfrenta a la necesidad de una prueba muy sensible pero solamente dispo- 70 _ Epidemiclogie clinica. aspectos furdamentales ne de dos o mas pruebas relativamente insensibles que miden diferentes fendmenos clinicos. Utilizando les pruebas en paralelo, el efecto neto es una estrategia diagnéstica més sensible. No obstante, el precio que debe pagarse es la evaluacién o tratamiento de algunos pacientes sin la enfer- medad. Rjemplo. E1 APE y ol examen rectal digital son pruebas insonsibles para el diagndstico el edncer de préstata (7) La tabla 3-8 muestra sa sensibilidad, expecifcidad y valores pre- ‘ictivos en un contexte de cribado varones sin sfatomas). Cuando amabas prusbas se atilizan fen paralle, Ia sensbilidad aumen'a, pero a aspecifcidad digminuye. Fl valor predetivo pasi- tivo es mAs bajo que la determinacin sislada del APE. Pruebas seriadas Los médicos utilizan frecuentomonto ostrategias de pruchas seriada en situaciones clinicas en las que no es preciso una evaluacién répida de los pacientes, por ejemplo, en las consultas privadas y en las consultas externas hospitalarias, en las cuales los pacientes ambulatorios son segui- dos a lo largo del tiempo. Las pruebas seriadas también se atilizan cuando algunas de las pruebas tienen un coste elevado o conllevan riesgos y en este caso a6lo 6¢ utilizan después de que prucbas més simples y seguras sugic- rran la existencia de la enfermedad. Por ejemplo, la edad materna y los an4- lisis de sangre (alfa-fetoprotefna, gonadotropina corinica y estriol) se utili- zan para identificar embarazos con un riesgo més elevado de que la mujer déa luz a un feto con el sindrome de Down. A las madres en las que se iden- tifica un riesgo elevado mediante estas pruebas a menudo se les ofrece la realizacién de una amniocentesis (13). Las pruebas seriadas conducen a ‘una menor utilizacién del laboratorio que las pruebas paralelas porque la evaluacién adicional depende de los resultados de la prueba previa. No obs- tante, las pruebas seriadas requieren mayor tiempo porque sélo se solic tan pruebas adicionales después de disponer de les resultados de las prue- bas previas. Las prucbas seriadas maximizan la especificidad y el valor predictivo positive pero disminuyen la sensibilidad y el valor predietivo nogativa (ta~ bla 3-8). El elinico acaba estando més seguro de que los resultados positivos de la prueba representan enfermedad, pero corre mayor riesgo de pasar por alto la enfermedad. Las pruebas seriadas son especialmente utiles cuando ninguna de las pruebes individuales disponibles es muy espectfica. ‘Tabla 3-3. Coracteristicas de la prueba del APE y de Ia exploracién rectal digital (ERD Vor pricto Pr Sera epectcat pe APE (4,0u9/m) os7 97 043 ERD anormal 950 a4 24 APEO ERD anormal ope ge 028 APE ERD anormales 034 0.995 “Daterrinacin del APEy ERD ailadce, yon combhaclin (rusbas eraloas yeradae one iagndstico ‘jl cancer di prota (De Krmmer Byes Pronnte ancnrereoning uh wets and what we nae 1 ios A et Mod 989; 11: 814-223) Diagnéstico 71 Si un médico va a utilizar dos pruebas en serie, el proceso sera més efi- cionte oi se utiliza en primer lugar la prueba con mayor especificidad. La tabla 3-4 muestra el efecto de Ia secuencia en las pruebas seriadas La prueba A es més especifica que la B, mientras que la prueba B es més sensible que la A. Utilizando en primer lugar la A, un nimero de pacientes menor se someterd a ambas pruebas, a pesar de que se diagnosticaran un numero de pacientes idéntico, con independencia de la secuencia de las pruebas. No obstante, si una prueba tiene un coste més bajo o conlleva ‘menos riesgo, puede ser més prudente utilizarla en primer lugar. Asuncién de Ia independencie Cuando se utilizan multiples pruebas, como se ha descrito previamente, Ja exactitud del resultado depende de si la informacién adicional a la que ha contribuido eada pruebs es, en cierto modo, independiente dela que ya se disponia a partir de las pruebas previas, es decir, la prueba siguiente no duplica simplemente la informacién conocida. De hecho, esta premisa des- taca todo el enfoque del valor predictive que hemos descrito, No obstante, parece improbable que las pruebas para la mayor parte de enfermedades sean completamente independientes unas de otras. Si la asuncién de que las prucbas son totalmente indepondientes os errénea, el eileulo de la pro- babilidad de la enfermedad a partir de las diversas pruebas tiende a sobre- estimar el valor de las pruebas. ‘Tabla 3-4, Efecto deta secuencia de las pruebas incials: A despuss B frente a después A’ Prevalencia de la enfermedad [Nimero de pacionis exarrinados 11000 Numero de paciantos con ia orforredad £200 (prevalence del 20 %) Sensiitad y especticidad de as prisbes Prucbe ‘Sensibilad Especincicad a a0 ‘0 8 %0 @ Secuencia de la pruebe Empezando con'a prueba A Empezando con la prueba 8 ‘enformeaag Eermecad A 4 60 0B 180180 HO = 4 720180 a a 200 800 1.000 200 800 3.000, £240 pacientes teexaminados con B {40 pacientes reexaminados con A Enfermedad ‘Enfermecad Boo + te 680180 = oO = us 180 so 0 301600 “Sbstcvon gua on ambaa onasonims os Henticn come erformon a miawa irra de panies 100 9 seldentice miso numer de voradercs posts (14) poro cuando se uulea primes a prcha Aeon ‘oyarsopettcted) ve wocarans in rer hires Ov patients x renetliied an taj Se apres A ‘oaleca acversumerie a readta fo 72__Epldemiologia clinics. Aspectos fundamentales Cocientes de probabilidad seriados Cuando se utiliza una serie de pruebas, puede calcularse una probabili- dad global utilizando ol cociente do probabilidad para el resultado de cada prueba, tal y como se muestra en la figura 3-11. La prevalencia de la enfer- medad antes de le prueba se transforma primero en la odds preprucba. A medida que se lleva a cabo cada prueba, la odds posprueba de una se con- vierte en la odds preprueba de la siguiente. Al final, se identifica una nue- va probebilidad de la enfermedad que tiene en cuenta la informacién a la que han contribuido todas las pruebas de la seri. RECEPTIVIDAD (SENSIBILIDAD) El estado clinico de los pacientes cambia continuamente como respues- taal tratamiento o por los efectos del envejecimiento o la enfermedad. Los clinieos regularmente se enfrentan a la pregunta «imi paciente ha mejora- hha deteriorado?». Las pruebas utilizadas para monitorizar el curso inico (p. ¢}., gravedad de los sfntomas o estado funcional) a menudo son algo diferentes de las utilizadas para el diagnéstico de la enfermedad, pero Ja evaluacién de su rendimiento es muy similar. La capacidad de los cambios del valor de una prueba para identificar correctamente los cambios del estado clinico se denomina recoptividad sen sibilidad. Desde un punto de vista conceptual, se relaciona con la validez de una prueba diagndstica, excepto porque el patron oro es la existencia de un cambio significativo del estado clinico 0 no, y no la existencia de la enfermedad 0 no. La magnitud de la sensibilidad de una prueba puede expresarse como sensibilidad, especificidad y valor predictive o como el Grea bajo la curva ROC. jemplo. Diversos parimetros autovalorados de salud y estado funcional se utilisan fre ‘cuentemente para monitorizar la ealud dels poblacioes y evaluar los efectos del tratamien- to.Dor de dichss parémetros son los dias de actividad limitads, ot doe loscuales las actividades habituales han estado limitadas parla enfermedad ouns lestn, y la PROBABILIDAD PREPUEBA 4 Prueba A" Odds preprusba x CP, = Odds posprueba Prueba B (Odds preprueba x CP, = Odds posprueba 1 PROBABILIDAD POSPRUEBA Fig. 9-11. Uillzacion de los cocentes de probabitided (CP) en prustasseriadas. Diognéstico 79 ‘salud eutovalorada, una progunta planteada 2 lo individuos que responden al cuestionsrio ‘para valorar6u slid desde exceleate hasta mala comparados con otros inividuos de su edad. Secevalus la recoptividad de estos pardmetros on un cucstionacio edministrado con un ahe de diferencia comparands los cambios de cada parémetro entre adultos de edad avanzada que ‘suieron una enfermedad principal darante ol afo y los que no la sufrieron (14). En la figu 25-12, las curvas ROC muestran que los cambios dela salud autovalorada rindiroo ligera- ‘mente meior que Is posibilidad de dentifcar cambios de l salud asociados eon ln enfermedad principal, al mismo tiempo que las cambios dels dias de actividad initada rindisron mucho ‘mejor representando el 80 ‘e del area bajo la curva ROC. E] rendimiento de una prueba diagnéstica se evalia comparando los resultados de la prueba con la presencia de la enfermedad en una tabla 2 x 2. Es preciso lenar las 4 casillas de la tabla. Cuando se estima la sen- sibilidad y especificidad de una nueva prueba diagnéstica a partir de la informaeién de las publicaciones médicas, es preciso que exista un patrén oro, con el cual se compare la exactitud de la prueba. Los individuos enfer- ‘mos y no enfermos deben parecerse a los tipos de pacientes para quienes la prueba podria ser titil en la préctica. Ademds, el conocimiento del diagnés- tico final no debe sesgar la interpretacién de los resultados de la prueba 0 vieevorsa. La modifieacién del punto de corte entre lo normal y lo anormal Espociticidad % Fig. 32. Receptividac de os dos parémetos del cuesttoraro sobwe el estado de la salud. Dis- tincibn ent los pacientes ancianos con y sin una enfermedad erincipal (De Wagner EH, Lacroix ‘AZ, Grothaus LC y Hecht, JA. Responsiveness of health status measures to charge among oder ‘auis. J. Am Geriatr Soo 1985; 41: 241-248.) 74 _ tpidemiologia clinica. aspectos fundamentales cambia la sensibilidad y 1a especificidad. Los cocientes de probebilidades ‘son otro método para describir la exactitud de una prueba diagnéstica. E] valor predictivo de una prueba es la caracteristica mds importante cuando los elinicos interpretan los resultados de una de ellas. No sélo esta determinado por la sensibilidad y la especificidad de la prueba, sino tam- bién por la prevalencia de la enfermedad, que puede cambiar de un contex- toa ctro. Habitualmente os necesario utilizar varias pruebas, en paralelo 0 en serie, para lograr una certidumbre diagnéstica aceptable. La sensibili- dad, la capacidad de una prueba para detectar un cambio del estado clini- co, también se evaliia mediante la misma tabla 2 x 2. ite on Detection, Eralation, and Treatment of High Blood Pres- sure. The Ath coport of the Joint Netonal Commitee on Detection, Evaloatin, and Treatment of High Blood Pressure INC V). Arch Intern Med 1955; 15%154—133, 2. Gatalona Wi ¢ al Measurement of prostate speci antgan in serum a a screening test for prestate cancer N Eng) J Med 191;3241155-116 9, Jeraen MC, Brant-Zaveadehi MN, Obuchowski N, Moc NT, MalbasienD, Ross J. Mag- ‘ete resonance imaging ofthe tambar spine in people without back pain N Eng J Med 194;351:69-73, 4. Bartram Re, Crow HC, FooteSR.Ultasonic and radiographic choleystoraphy. N Engl J Ned 1977 29659-54, 5 Jones TV, Lindsey BA. Yount P, Solis Farani-Eraya B. Alcohol screening quston- naires: are they val in elderly medial outpatients?) Gn Infern Med 1995;8674-678 6, Fletcher RH. Carcnoembronic antigen, Ann inter Med 1985;10456-73 7 VorJD. Prostate cance, sreeing an prstaespecc antigen: promise or peri? J Gen Intern Med 1984 9468-474 8. Barry Mj Malley AG, Singer DE. Screening for HTLV Il anibodies: the relation between prevalence and postive predictive value adits soil consequences JAMA 1985, 2533395 9, Ward JW, Grindon A), Fewino PM, Schabe C, Parvin M, Allen JR Laboratory and epi tmilogisovakation of an eryrm imntmoasey for antibodies fo HTLV 111. AMA 1986356357 261. 10, Diamond GA, Forster JS. Analysis of probability a an aid in the cnc agree of coronary artery dense. N Eng] Med 197900 1350-1358. 11, Temney WM, McDonald CJ. Practice dataaes and thir uses in clinical ruarch. Stat Med 155110341557 12, Goldstein B, Mushln Al Use of singe thyroxine test to evaluate ambulatory medical patents fr suspeced hypothyroidism} Gen ntem Ned 1987;2:20-24 13, Haddow J, Pelomaki GE Knight C), Wiliam J, Pinon A, Caniek JA, Sallor DN Jr Bowers GB Prenatal sreringfr Down's syndrome with use of maternal serum markers, IN Engl] Me 199232758855. 14, Wagner EH, LaCroix AZ, Groaus LC, Hecht JA. Resporsvenes of health tars mea- burr fo change among older adil. J Arm Cait So 198; 41.24- 248 LECTURAS RECOMENDADAS (Cebul RD, Beck LH. Teaching clinical decision making. New York: Praeger, 1985. Department of Clinical Epidemiology ane Biostatistics, McMaster University. Interpretation of diagnostic data. V. How to do it with simple math. Can Med Asso: J 1983/12822-29. Diagnéstico 75 (Repzinted in Seckett DL, Haynes RB, Tugwell P, eds, Clinical epidemiology: a basic science for clinical medicine. Boston: Little. Brown, 1985) Fagan T). Nomogram for Bayes’ theorem [Letter]. N Engl J Med 1975;293:257 Griner PF, Mayewski Rl, Mushiin Al, Greenland P. Selection ard interpretation of diagnostic ‘ests and procedures. Principles and applications. Ann Intern Med 1961,94:557-400, Griner PF, Panzer RJ, Greenland P. Clinical diagnosis and the laboratory: logical strategies for common medical problems. Chicago: Year Book, 1985. MeNeil Bf, Abrams HL, eds, Brigham and Women’s Hospital handbook of diagnostic imaging Boston: Lite, Brown, 1986. auker SG, KassirerP. Clinical application of decision analysis detailed illustration. Semin ‘Nucl Med 1978;8324-335, ‘Sheps $B, Schechter MT. The assessment of diagnostic tests. A survey of current medical research. JAMA 1984;2522818~2422. Sox HC Jr. Probability theory inthe use of diagnostic laste An introduction to critical study ofthe literature. Ann Intern Med 1986;104:60~66. Sox HC fr, BlattM, Higgins MC, Marton KI. Medical decision making. Kent, UK: Butterworth, 1967 Wasson JH, Soe HC Jr Noff RK, Goldman L, Cinical prediction rules. applistions and methodological sandards. N Eng ] Med 19853137539 Weinstein MC; Fneberg HV, Esten AS, Frazier HS, Neuhauser D, Neuka RR, McNeil 8. ‘Gina decison analysis Paden: W8 Saunders, 1960. 4 FRECUENCIA En el capitulo 1 explicamos sucintamente las preguntas bésicas a las que se enfrentan los clinicos cuando atienden a los pacientes. En este capi- tulo definimos y describimos las pruebas cuantitativas que los clinicos uti- lizan para orientar su diagnostico y sus decisiones terapéuticas. Introduci- remos el tema con un paciente. Un varén de 72 aiios se presenta con una polaquiuria lentamente pro- gresiva, vacilacién y goteo. La exploracién rectal digital pone de manifiesto ‘un aumento simétrieo de la glindula prostatica. Las determinaciones del flujo urinario indican una disminucién significativa de la tasa de flujo y no se identifica un aumento del APE sérico, Se establece un diagndstico de hiperplasia prostética benigna (HPB). Al tomar la decisin sobre el trata- miento, es preciso que el clinico y ol paciente contrapesen loo costes y bene- ficios de las diversas opciones terapéuticas, por ejemplo, los riesgos de un empeoramiento de los sintomas o de una enfermedad renal obstructiva con un tratamiento médico frente a la mortalidad operatoria o la disfuncién sexual con un tratamiento quinirgico. ‘Tradicionalmente, hemos tomado las decisiones mediante el uicio elt- nico", lo que aprendemos en la cabecera del paciente y en las consultas. En Jos tiltimos aftos, en medicina se han introducido métodos para tomar deci- siones clinicas cuantitativas. Las estrategias clinicas utilizadas més a ‘menudo son el andlisis de decisiones, el anélisis coste-efectividad y el ané- lisis coste-beneficio, Estos métodos atilizan datos cuantitativos sobre la frecuencia de los problemas clinicos clave y sus consecuencias en los pacientes para deducir el mejor curso de accién. Los métodes, deseritos con mayor detalle al término de esto capitulo, son sélo tan buenos como las esti- maciones de la probabilidad o frecuencia de los resultados clinicos en los que se basan. Pera un paciente con una HPB, un juicio clinico sensato requiere infor- macién exacta sobre la probabilidad de un deterioro de los sfntomas, una retencion aguda 0 una lesién renal con el tratamiento médico, asf como el alivio de los sintomas, 1a mortalidad, la impotencia o la eyaculacién retré- grada con el tratamiento quirirgico, Kate es, en general, el tipo de infor- macién necesaria para responder a la mayoria de preguntas elfnicas. Las decisiones estén orientadas por la probabilidad de los resultados en cir- cunstancias alternativas: ante una prueba positiva frente a una prueba negativa o después de un tratamiento A frente a un tratamiento B. Puesto 7 73 Aspectos fundamentales que la frecuencia con que se producen la enfermedad, la mejora, el deterio- ro, la curacién o la muerte constituye la base para responder ala mayoria de las preguntas elfnicas; este capitulo examina los parémetros de la fre- cuencia clinica ASIGNACION DE NUMEROS A LAS AFIRMACIONES ‘SOBRE PROBABILIDAD Con frecuencia, los médicos mencionan las probabilidades en palabras (habituatmente, en ocasiones, rara ver, etc.) mas que en néimeros. Sustituir los naimeros por palabras os cémodo y evita hacer una afirmacién procisa cuando uno no esté seguro de una probabilidad. No obstante, se ha puesto de manifiesto que apenas existe acuerdo sobre los significados de los térmi- nos utilizados comtinmente para la frecuencia. _Byemplo. Se sclicito @ un grupo de médicos que estimaran Ia probabitidad de enfermedad para eada una de las 30 expresiones de probahilidad identificadas mediante ls revisida de lox informes radiclogizos y de Laboratorio. Para cada expresién se identifies una graa diferencia ‘de opinion. Las probabilidades para coherente con fuctaaron desde 0,18 hast 0,98; para Improbable, loa Writes faeron de 001-008 Rats datos rerpaldan la afirmacin de lox atoren de que la diferencia de opinicn entre médicos, por lo que respecta al tratamiento de un pro- Dlema, podria reflgjar diferencias del significado atribuido. Iss palabras utilizadss para defi- obabilidad: (1) Los pacientes también asignan valores variables a las expresiones de probabilidad. En otro estudio, profesionales con mucha experiencia consi- deraron que habitualmente hacia referencia a las probabilidades de 0,35- 1,0 (¢ 2 desviaciones estandar a partir de la media); raramente significaba para éstos una probabilidad de 0-0,16 (2). Por consiguiente, sustituir los ntimeros por palabras disminuye la infor- macién que expresan. Nosotros defendemos la utilizacién de ntimeros siem- re que sea posible. Percepciones de la frecuenci La experiencia personal influye en la percepeién del elinico de la pro- babilidad de los procesos y resultados. El hecho de haber vivido una experiencia reciente con un paciente que ha presentado determina dos resultados tiende a lograr que el clinico sobreestime la probabili dad de dichos resultados. Por el contraric, los clfnicos tienen tendencia a infraestimar la frecuencia de los resultados que los pacientes todavia no hen presentado o que éstos puedan ser reacios « comenter. Por ejem- plo, las entrevistas sistematicas de los pacientes después de una resec- cién transuretral de la préstata (RTUP) ponen de manifiesto que mas del 50 % de varones experimentan una eyaculacién retrégrada (3). La mayor parte de urdlogos estimarian que la frecuencia es mucho menor puesto que muchos varones son reacios a discutir los problemas sexua- Tes. PREVALENCIA E INCIDENCIA En general, los pardmetros clinicamente relevantes de la frecuencia 0 probabilidad de acontecimientos son fracciones en que el numerador es el rmtimero de pacientes que experimentan el resultado (casos) y el denomina- dor es el mimero de individuos en quienes el resultado podria haber ocurri- do, Naturalmente, dichas fracciones son porcentajes, pero segtin la utiliza- cién comin se hace reforencia a éstas como «tasas. Los clinicos se encuentran con dos medidas o parémetros de frecuencia: prevalencia e incidencia. La prevalencia es la fraccién (poreentaje) de an grupo de individuos que presentan un proceso clinico o resultado en un ‘momento determinado de tiempo. La prevalencia se determina mediante el sondco de una poblacién definida que contiene individuos con y sin el pro- 030 en euestién, en un momento conereto. Existen dos tipos de prevalen- cia. La prevalencia de punto o puniual se determina en el momento del son- deo para cada individuo, aunque no necesariamente en el mismo momento para todos los individuos de la poblacién definida. La prevalencia de peri do hace referencia a los casos presentes en cualquier momento durante un periodo especifico de tiempo. Una incidencia os la fraccién 0 poreentaje de un grupo inicialmento libre del proceso que lo desarrella a Io largo de un determinado periodo de tiempo. Asf pues, la incidencia hace referencia a los nuevos casos de la enfermedad que se producen en una poblacién inicialmente sin la enferme- dad o nuevos resultados, como la discapacidad o la muerte, que se produ- cen en pacientes con una enfermedad especifica. Como se describe mas ade- lante en este capitulo y con mayor detalle en el capitalo 5, la incidencia se determina identificando a un grupo susceptible de individuos (es decir, individuos sin la enfermedad o el resultado), examinéndolos periédicamen- te durante un intervalo de tiempo para identificar y efectuar un nuevo recuento de los casos que se desarvollan durante el intervalo. Bjemplo. Para ilustrar las diferencias entre Ia provalencia y la incidencia le figura 4-1 ‘muestra la ineidencia de a enfermedad en un grupo de 100 individuos durante el curso de 3 ‘anos (1992-1984). A medida quo transcarre el tempo, ciertos tnviduos del grupo desarrollan In enfermedad. Permanecen en este estado hasta quese recuperan 0 allecen. Durante les 3 6 individuos experimentan cl inicio de la enfermedad y 4 ya la presentan. Los 80 i ‘iene restantes no desarrolian Ia enfermedad.y no aparvoen en la figura ‘Al principio de 1902 exieten 4 easos, de medo que Ia prevaloncia en este panto de tiempo ‘er de 4/100, Bial principio de cads af ae realizan prucbes a los 100 individuoe, inclayendo lo casos previns, se puede calculer la prevaleneis en esos puntos de tiempo. Al principic de 1999, a provaloncia ee de 5/100 porque 2 de ow canoe previon «1092 parsaten an 1903 ¥ 2 de los nuevos casos, que se desarrollaron en 1992, terminaron (eabe esperar que en curacisn) ‘antes de Ia prusba al inicie de 1995. Pueden caleularee las prevalenciss para cade una delas ‘otras dbo prucbas anualee y, supaniendo que ninguno de los 100 individuoe originale fllcis, ‘se mudé o rechaz6 ol examen, estas prevaleneias son de 7/100 prineipios de 1954 y de 5/100 ‘2 pringipios de 1995. ‘Pare calcular Is incidencia de nuevos casos desarrlladoe on la poblacién, consideraresoe ‘inicamente a los 96 individuos sin la enfermedad a prineipios de 1992 y lo queles scurris durante los présimos 3 afos. En 1992, se desarrollaron 5 nuevos casos, en 1998 se desarralla- ‘ou 6 nuevas casos y 6 nuevos casos adciouales ve deservllaroa en 1984. La ineldeneto alos 3 aos do la enfermedad soa todos los nuevos casos desarrollados en los 3 afos (que son 16) divididos por el numero de individuos susceptibles al inicio del periedo de seguimiento (96 80 _ Epidemiolagia clinica, Aspectos fundamentales 1992 1993 1994 o 4 -—_] o— oo ——_ ot o—1 o——_+ oo Po o—-f —— © trio = Duracion Fig, 44. ncidencia de la enfermedad en 100 fndhicuce de oego doedo 1902 hasta 1094, individuos) 0 16/96 en 3 afos. ;Cusles incidensias anuales para 1992, 1993 y 1964 respectivamente? Recordando que debemos eliminar los casos previos del denominador,caleu- Jartamos las ineideneias anvales de 6°96 para 1992, de 6'¥1 para 1998 y de 585 para 1994, Cada medida de In frecuencia de la enfermedad contiene necesariamen- te alguna indicacién de tiempo. Con les medidas de prevalencis, se supone que el tiempo es instanténeo como en una escena tinica de una pelicula. La prevalencia representa la situacién en ese preciso momento para cada paciente, aunque en realidad podrian haber sido precisas varias semanas 0 ‘meses para recoger las observaciones de diversos individuos en cl grupo estudiado. Para la incidencia, el tiempo es lo fundamentsl porque define el intervalo durante el cual se monitorizé a los individuos susceptibles en bus- ca de la aparicién del problema en cuestién. La tabla 4-1 resume las caracteristicas de la incidencia y la prevalencia. A pesar de que las distinciones entre ambas parecen claras, la bibliografia esté lena de utilizaciones incorrectas de los términos, sobre todo la de inci- dencia (4), Por qué es importante conocer la diferencia entre prevalencia e inci- dencia? Porque responden a 2 preguntas diferentes: a) qué porcentaje de tan grupo de individuos experimenta un proceso? y b) a qué ritmo apare- Frewencia 8 ‘Tebla 4-1. Caractoriatioas de la incidencia ya prevalencia Cancteiticn Inecenca Preveenci Numerador ‘Se producen nuevos casosdu- Recuerto de todos los casos ‘ante un periado de tiempo nun solo eondoo 0 encuee fen un grupo iniciamente sin ta degrupo laenfermedad Denominador Todos loe indvidues auecepti- Todos 198 individuoe eotudia- ‘bles presentes al inicio del dos, incluyerdo los casos y period les no casos Tempe DDuracién de! periodo En un momento preciso Cémo se mide Estudios de cohorts (v.cap.5) Estudio de prevalencia(trans- versa) cen nuevos casos en un grupo de individuos a medida que transcurre el tiempo? La respuesta a una pregunta no puede obtenerse directamente a partir de la respuesta a la otra, DETERMINACION DE LA PREVALENCIA Y LA INCIDENCIA Estudios de prevatencia La prevalencia de una enfermedad se determina mediante el estudio de un grupo de individuos, algunos de los cuales estan enfermos en ese preci- 80 momento al mismo tiempo que otros estén sanos (fig. 4-2). La fraccién o porcentaje del grupo que est enfermo (es decir, los casos) canstituye la pre- valencia de la enfermedad. Dichos estudios puntuales, encuestas o sondeos de poblacién de indivi- duos (que incluyen casos y no casos) se denominan estudios de prevalencia. Otro término es el de estudios transversales, porque los individuos son cestudiados en un momento (corte transversal) determinado. Constituyen los tipos més frecuentes de disefios de investigacién descritos en la biblio- grafia médica, Poblacién ‘Muestra Enfermedadirecultado definida representativa ePresente? Fig. 4-2 Diserio de una encuesta de prevalencia, 82 _Epidemiologia clinics, Aspectos fundamentales Acontinaacién, se proporeiona un ejemplo de un estudio tipico de pre- valencia, Ejemplo. :Cuil es la prevalencia de la demencia en la prblecién general de adultos de ‘edad avansada? Para reeponder a eate pregunta o» Hlevé 1 eabo una eneuesta de 1.068 perso- ‘nas mayores de 75 ates que vivian en Cambridge, Reino Unido, Cada partcipante se sometis ‘aun estudio que incluyé el Mini-Mental State Examination (MMSE), una pruebs para cxno- cerel deteriore cogitive. La exiatencia de demencia ve identifies mediante una eetrategia de pruebas seriadas: los individuos con puntuaciones del MMSE de 25 o inferiores se examina- ron utlizando un proiacdlo estandarizado por un psiquiatra que establecié el dingndstico ‘nal. La prevalencia de demencla en conjunto fue de un 10 %y las tasas se duplicaron en cada segmento de 5 afos do edad (5). Estudios de incidencia En comparacién con la prevalencia, la incidencia se determina identifi- cando en primer lugar a una poblacién sin el problema en cuestién y, des- pués, siguiéndola a lo largo del tiempo con pruebas periddicas para deter- minar la incidencia del problema. La poblacién sometida a prueba en un estudio de incidencia, a la que se hace referencia como cohorte, puede estar formada por individuos sanos en los que se observa la aparicién de los sin- tomas de la enfermedad o individuos enfermos en los que se observan los resultados de la enfermedad. Este proceso, denominado también estudio de cohorte, se describiré con detalle en el capitulo 5. Hasta ahora, el término incidencia se ha utilizado para describir la tasa de nuevos casos en un gru- po de individuos de tamafio fijo, todos los cuales son observados durante un periodo de tiempo, Esto recibe el nombre de incidencia acumulativa, ya que con el tiempo se acumulan nuevos casos. -Bjemplo. Para estudiar la incdencia do demencia, ls investicndores de Cambridge idan- tifcaren a una echorte extrayendo de la pablacin del estudio de seguimiento a los individuos ‘ms anesanos diagnostieados de demencia en el extudio de prevalencia descrito previamente (6) Se sigui ls pista los 1.778 pacientes restantes sin demencia. De los mitmos, 305 falle- cieron, 190 rechazaron someterse a pruebas adicionales y no se pudo seguir la pista a 88 por- ‘que estaban demasiadn enfermos para someterse a pruebas. En canjunto, la tasa de ineiden- ia anual de demencia en esta cohorte fue del 4,3 & y superd al 8 % anual para los individuos ‘on més de 86 ator de edad en el momento del estudio de la prevalencia. ‘Un segundo enfoque para estimar la incidencia es determinar el nuime- rode nuevos casos que aparecen en una poblacién en constante cambio, en 1a que los individuos se encuentran en estudio y son susceptibles durante periodos variables de tiempo. La medida de incidencia derivada de los estu- dios de este tipo en ocasiones se denomina densidad de incidencia. Ejem- plos tipicos son los ensayos clinicos de un tratamiento crénico en los cuales los pacientes seleccionables son reclutados durante varios aftos, de modo ‘que los individuos incluidos precozmente son tratados y seguidos durante un tiempo mas prolongado que los reclutados més tarde. En un esfuerzo por mantener la contribucién de los individuos de acuerdo con su intervalo de seguimiento, el denominador de una medida de densidad de incidencia no son individuos en riesgo durante un periodo de tiempo especifico sino individuos-tiempo (personas-afios) en riesgo de padecer una enfermedad. Frewencia 83 Un individuo soguido durante 10 aiios sin convertirse en caso aporta 10 personas-aiios al denominador, mientras que un individuo seguido durante un afio s6lo aporta una persona-afio. La densidad de incidencia se expresa como el ntimero de nuevos casos por el ntimero total de personas-afios en riesgo. Elenfoque personas-afios también es ttil para estimar la incidencia de la enfermedad en grandes poblaciones de tamafie conocido cuando se dis- pone de un recuento preciso de los nuevos casos y de una estimacién de la poblacién en riesgo; por ejemplo, un registro de cancer de base poblacional. Un inconveniente del enfoque de la densidad de incidencia es que mez- cla diferentes duraciones del seguimiento. Un pequefio nuimero de pacien- tes seguidos durante un tiempo prolongado puede aportar tanto al denomi- nador como un gran ntimero de pacientes seguidos durante un tiempo breve. Si estos pacientes seguidos durante largo tiempo son sistematica- mente diferentes de los pacientes seguidos a corto plazo, las medidas de incidencia resultantes pueden estar sesgadas. INTERPRETACION DE LAS MEDIDAS DE FRECUENCIA CLINICA Para dar sentido a una tasa de prevaleneia o de incidencia, el primer paso inchuye una definicién cuidadosa del numerador y el denominador. 20ué es un caso?: definicién del numorador Hasta ahora, el término general caso se ha utilizado para indicar a un individuo que tiene le enfermedad o manifiesta un resultado relevante. En Ia epidemiologia clasica, los casos tienden a ser individaos con una enfer- medad y la prevalencia ¢ incidencia hacen referencia a la frecuencia de los casos entre grupos de poblacién como los residentes de una comunidad. No obstante, a menudo las decisiones elinicas dependen de la informacion sobre la frecuencia o tasa de las manifestaciones de la enfermedad, como Jos signos, los sintomas o los resultados anormales de laboratorio 0 de l frecuencia de los resultados de Ia enfermedad, como Ia muerte, Ia discapa. cidad o la mejora sintomética. Por tanto, en Ia préctica clinica los «casos» los constituyen frecuentemente los pacientes con una enfermedad que ‘manifiestan un hallazgo clinico determinado o experimentan un resultado concreto. Para interpretar las tasas ca necesario conocer la base sobre la cual se define un caso porque ls criterios utilizados para definir un caso pueden afectar extraordinariamente las tasas. ‘Bjemplo. Un medio simple para identifcar un caso es preguntar a los individuos si sertan tn proceso determinado. {Cémo se compara esta matodo con métodos mAs rigurosos? Enel Commission on Chron Illness study se compararon las prevalencias de diversos proce- seqin lo determinado mediante entrevstas personales domiciliarias, con las prevalencias sogin lo determinedo mediants una exploracign frien de Ise mismoa individuos. La figura 43 ilustra as prevalencias de a entrevista y las prevalencias de la exploracién clinica para diver- 50s process, 84 _ Epldemiologia clinics. Aspectos fundamentales (METODO DE LA DEFINICION DE CASO Exploracién clinica tis Bronquits crinica Asmasfebre del neno Sinusitis crica woe 6 4 2 0 2 & 8B PREVALENCIA (%) Fig. 4-3. La provalonca depence de a deficién de caso. Prevalonca de las enfermedades on la ppoblacén general baseda en epiniones de oe invduos fencuesta)y la evaluecién cinca. (Oe ‘Sanders BS. Have morbidity surveys been oversolc? Amn J Puke Health 1952; 62: 1648-1659.) Loe datos ilustran que estos doe métodoe de definicién de caso pueden generar saimacio- nos muy diferentes dela prevalencia y on diferentes diresciones, lo quo dapende del proceso ©, Para algunos procesos se dispone de criterios diagndsticos explicitos, ampliamente aceptados. Pueden utilizarse como ejemplo los criterios de los Centers for Disease Control and Prevention para la enformedad de Lyme definitiva (tabla 4-2) (8). Estos criterios demuestran la espe- cificidad necesaria para definir fidedignamente una enfermedad a la que se presta tanta atencién como la enfermedad de Lyme. También ilustran un equilibrio o compromiso entre las definiciones rigurosas y la realidad clfnica, Si solo se incluyeran en una tasa los casos «defi- nitivos-, no se ineluirian la mayor parte de pacientes que habitualmen- te se considerarian afectados por la enfermedad. AdemAs, Ia inchusién de casos «probables» podria sobreestimar In tasa real de la enferme- dad. -Bjemplo. La tasa do incidencia de la enfermedad de Lyme se estimé on Olmstead County, Minnowota ()- Entre 1980 y 1990 se diagnosticaron elinieamente 68 eases on Ios residentos ‘del condado. Sélo 17 (25 %) eumplieron las criterios de los Centers for Disease Control (CDC). En Minnesota es cbligatorio declsrar la enfermedad de Lyme a las sutoridades sanitarias, wanque s6l ae doclararon 7 casos, de los euales 4 cumplieron los criterias de loa CDC. Estos datos ilustran lo difell que es hacer estimaciones predsas de la frecuencia de las enfermeda- ‘des cuyo diagnistic ne hasa en multiples eriterios elinicos Frecuencia 85 ‘Tabla 4.2. protocole para declarar la enfermedad do Lyme’ Defricion det caso cinco (contd) Ettema mipratenio 0 Como mineno, utamanifestacin tac y confimacin dea intecién mediante datos de a- orator Mantestcio tara (cuando nos pane ce manteste una explicacion aera) Muscuibesauelitica Episodiosreidvantes brevs deinlanacién articular objetiva ‘Sitoma revowo (cvlguna Je los lguotos tater) Meningtsirtociica Nous cranea (especianerte paris facia) Enodalomilio con enticuorpos en auido ooalonaquideo Ccariovascular ico agido de defectos de 20 3." grado de a conduccén aurculeventica, con remi- sn Confrmatin de boratovo (ual dels siguientes cats) ‘lament de Sonia Nelo dagndsticos de antousrpos igh @ Gente a i esproquets en suero OLER Cambio sinifcavo de la espuesia de aricueros en dos musias de suere de fase agu- 1a yconvaleionie. “Protocalo de los Cater for lseane Contr and Prevonten, Del JS. Department of Heath and Human ‘series Cave deat for pub health sree. RIMWR 1980, 39:1220) 2Qué es la poblacién?: definicién del denominador Una tasa s6lo es titil en la medida en que el médico puede decidir a qué tipos de pacientes se aplica. Deben conocerse el tamaio y las caracteristi- ‘eas del grupo de individuos en el cual surgicron los casos. ‘Tradicionalmente, el grupo incluido en el denominador de una tasa se denomina poblacién 0, mas concretamente, poblacién en riesgo, donde en riesgo significa susceptible a la enfermedad 0 resultado contabilizado en el numerador. Por ejemplo, la incidencia o la prevalencia del cancer cervical se infravalorard si la poblacién incluye a mujeres que han sido sometidas a histerectomias 0 incluye a varones. El denominador de una tasa debe incluir la poblacién pertinente a Ia pregunta que se plantea o una muestra representativa de ésta. Con todo, lo que es pertinente depende de la perspectiva de cada uno, Por ejemplo, si desedramos conocer la prevalencia real de la artritis reumatoidea en los norteamericanos, preferir(amos incluir en el denominador una muestra aleatoria de todos los individuos de Estados Unidos, pero si deseéramos conocer la prevalencia de la artritis reumatoidea en la practien médica ~quizd para planificar los servicios el denominador relevante serian los pacientes visitados en la consulta y no los individuos de toda la poblacién. Sélo el 25 % de adultos en los que se identificaron sintomas artriticos y reu- maticos (no necesariamente una artritis reumatoidea) durante una encues- ta comunitaria habian recibido asistencia para dichas molestias por parto de un profesional de Ia salud o una institueién (10). ‘Tradicionalmente, los epidemiélogos piensan en una poblacién formada or todos los individuos que residen en un area geogréfica y asi deberia ser para los estudios sobre causa y efecto en la poblacion general, pero en los estu- 386 _Epicemiologia clinica. Aspectos fundamentales dios sobre cuestiones clinicas, las poblaciones relevantes en general constan de pacientes que tienen determinadas enfermedades o manifiestan determi- nados hallazgos clinicos y se identifican en contextos clinicos que son simila- es a aquellos en los cuales se utilizaré la informacién. En general, dichos pacientes son reclutados en un numero limitado de centros elinicos en los eua- les los médicos visitan a los pacientes. Constituyen un subgrupo pequefio y peculiar de todos los pacientes con los hallazgos en algin area googréfica © incluso pueden representar un grupo ins6lito para una consulta en general. iQué diferencia puede representar la eleccién de una poblacién’ El pro- blema se plantea en la generalizabilidad de las tasas observadas. Muestreo Rara vez es posible estudiar a todos los individuos que han desarrollado © pueden desarrollar el proceso en cuestién. Habitualmente se obtiene una muestra, de modo que el mtimero estudiado sea de tamafio manejable. Esto plantea una cuestién: {la muestra es representativa de la poblacidn? En general, existen dos medios para obtener una muestra representati- ya. En una muestra aleatoria, cada individuo de la poblacién tiene una pro- babilidad idéntica de ser seleccionado. El término mas general de muestra probabiltstica se utiliza si cada individuo tiene una probabilidad conocida (no necesariamente igual) de ser seleccionado. Suele ser importante que una muestra de estudio incluya a un mimero suficiente de miembros de subgrupos conerstos de interés, como las minorias étnicas. Si estos subgru- pos son de pequeiio tamafio, una simple muestra aleatoria de toda la pobla- ‘i6n podria no ineluir el nimero suficiente de miembros del subgrupo. Para resolverlo, se selecciona al azar un porcentaje mayor de cada uno de estos subgrupos. La muestra final todavia serd representativa de toda la pobla- «ign, si se tienen en cuenta las diferentes fracciones de muestreo en el ané- lisis. Como promedio, las caracteristicas de los individuos en las muestras probabilisticas son similares a las de la poblacién a partir de la que se seleccionaron, en especial si se escoge una muestra de gran tamafio. Otros métados de selecciéin de muestras pueden estar sesgados y, por To tanto, no necesariamente representan a la poblacién original, La mayor parte de grupos de pacientes descritos en la bibliografia médica y cbserva- dos en la experiencia de la mayor parte de clinicos se basan en muestras sesgadas. Por regla general, los pacientes son incluidos en estudios porque reciben asistencia en una institucién académica, estan disponibles, desean ser estudiados y, quiza también, porque son de especial interés yio estén gravemente afectados. No hay nada que decir con respecto a esta préctica, siempre que se sepa a quiénes se aplican (0 no se aplican) los resultados. RELACION ENTRE INCIDENCIA, PREVALENCIA Y DURACION DE LA ENFERMEDAD: Cualquier factor que aumente la duracién de la enfermedad o hallazgo clinico en un paciente aumentaré la posibilidad de que este paciente sea Frecvendia 87 identificado en un estudio de prevalencia. Una ojeada a la figura 4-1 lo con- firmara. La relacién entre Ia incidencia y la prevalencia, y la duracién de la enfermedad en un estado equilibrado, es decir, en el cual cualquiera de las variables apenas se modifica con el tiempo, puede describirse de forma aproximada mediante la siguiente expresi6n: Prevalencia = incidencia x duracién media de Ia enfermedad ‘lo largo de todas las distribuciones por edd, le que indica que el asma tiene tendencia a sor ‘rdniea o8 especialmente exéniea entre los individuos de edad svanzads. Adem, puesto que (ares) ot er Ipodenes ara 05 6 29 48 16 3 32 10,7 144 2 26 13,0 4564 1 33 33,0 65 ° 36 33,0 3 30 100 “Rarer, 0 pre vars fort,

You might also like