You are on page 1of 6

Rev Md Chile 2008; 136: 1203-1208

MEDICINA BASADA EN EVIDENCIA

Estudios que evalan


un test diagnstico:
interpretando sus resultados
Felipe Salech1,a, Victoria Mery1,b, Francisco Larrondo1,b,
Gabriel Rada1,2,3.

Studies about diagnostic tests:


interpreting the results

E n trminos generales, un test diagnstico es


til si permite diferenciar dos o ms condicio-
nes que de otro modo podran ser confundidas.
CONCEPTOS GENERALES

Recordaremos algunos conceptos generales.


En otras palabras, para diferenciar entre distintas
enfermedades o condiciones clnicas, as como Gold standard (GS): El rendimiento de todo test
entre la condicin de sano y la de enfermo1. diagnstico se basa en su comparacin con un
En los estudios sobre tests diagnsticos, al gold standard (estndar de oro, patrn de oro,
igual que en el anlisis crtico de cualquier patrn de referencia). El GS es la tcnica diagns-
estudio, el primer paso es evaluar su validez, es tica que define la presencia de la condicin con la
decir, cul es la probabilidad de que exista sesgo mxima certeza conocida. Debido a la falta de
por caractersticas del diseo. Este aspecto ha sido consenso en la forma de traducir este concepto,
revisado en artculos anteriores de esta serie2-4. utilizaremos su denominacin en ingls.
Una vez definida la validez del estudio, el
siguiente paso ser analizar la correcta interpreta- Valores posibles de un test diagnstico: Algunos tests
cin de los resultados presentados en ellos, ya entregan resultados binarios o dicotmicos, general-
que es posible que un estudio cumpla con todas mente positivo o negativo (ej: test pack de embarazo).
las caractersticas que aseguren su validez, sin Algunos se expresan como resultados categricos (ej:
embargo, si los resultados muestran que carece de alta, moderada y baja probabilidad de un cintigrama
capacidad de discriminar entre las condiciones de V/Q). Otros, en cambio, entregan resultados continuos
inters, ste no tendr utilidad. (ej: glicemia, colesterol, hemoglobina). Estos valores

1Unidad de Medicina Basada en Evidencia, Pontificia Universidad Catlica de Chile.


2Departamento de Medicina Interna, Pontificia Universidad Catlica de Chile.
3Servicio de Medicina, Hospital Stero del Ro. Santiago de Chile.
aResidente. Hospital Clnico Universidad de Chile.
bResidente. Pontificia Universidad Catlica de Chile. Santiago de Chile.

Correspondencia a: Dr. Gabriel Rada, Lira 44, Santiago. Chile. Fax: 56-2-2897638. E mail: gabriel@rada.cl

1203
Rev Md Chile 2008; 136: 1203-1208

continuos pueden ser transformados en binarios si se la enfermedad de inters (verdaderos negativos


establece un punto de corte a partir del cual se sobre los GS negativos) (Tabla 2).
considerarn los resultados como positivos o negati- Si un paciente tiene un resultado positivo en
vos para la presencia de la condicin (ej: glicemia un test altamente especfico podemos confirmar la
mayor a 125 mg/dl) o como categricos, si se enfermedad.
establecen rangos, como discutiremos ms adelante.
3. Valor predictivo positivo y negativo:
El valor predictivo positivo se define como la
FORMAS DE PRESENTAR LAS PROPIEDADES DE UN TEST probabilidad que un individuo con un resultado
positivo, tenga la enfermedad6,7. Por el contrario,
Al comparar un test diagnstico con un GS, se el valor predictivo negativo corresponde a la
pueden obtener cuatro combinaciones si los resul- probabilidad que un individuo con un resultado
tados del test se expresan en forma binaria: negativo, no tenga la enfermedad (Tabla 2).
1. Verdadero positivo: GS positivo, test positivo Si bien los valores predictivos, a diferencia de
2. Verdadero negativo: GS negativo, test negativo. la sensibilidad y especificidad, nos entregan infor-
3. Falso positivo: GS negativo, test positivo. macin clnicamente relevante (la probabilidad de
4. Falso negativo: GS positivo, test negativo. que la condicin est o no presente dado el
Esto se puede resumir en una tabla de contin- resultado del test), sta slo es utilizable si nos
gencia de 2 x 2 (Tabla 1). enfrentamos a pacientes similares a aquellos en
A partir de la tabla, se pueden calcular distin- que se realiz el estudio. Los valores predictivos
tas formas de expresar el poder de discriminacin varan enormemente dependiendo de la prevalen-
o rendimiento de un test diagnstico. Cada una cia o riesgo basal de la condicin, por lo que si
tiene ventajas y desventajas, muchas veces entre- nuestro paciente tiene un riesgo mayor o menor,
gando informacin complementaria. A continua- no podemos aplicarlos. Lo anterior no ocurre con
cin, revisaremos las ms usadas en la literatura la sensibilidad y especificidad, ya que su clculo
mdica sobre estudios diagnsticos. no depende de la prevalencia de la condicin (al
menos desde el punto de vista matemtico). Esto
1. Sensibilidad: ha hecho que constituyan una de las formas ms
Se define como la razn entre los individuos que frecuentes de expresar el rendimiento de un test.
tienen un resultado del test positivo y aquellos En resumen podemos decir que:
que tienen la condicin o enfermedad de inters La sensibilidad y especificidad no varan con la
(los verdaderos positivos sobre el total de GS prevalencia de la condicin, pero no nos
positivos) (Tabla 2). hablan de la probabilidad que tiene un pacien-
En un paciente determinado, si aplicamos un te de presentar la enfermedad de inters.
examen altamente sensible (identifica muy bien a los Los valores predictivos nos hablan de la
enfermos) y obtenemos un resultado negativo, probabilidad que tiene un paciente de presen-
podemos descartar razonablemente la enfermedad5. tar la enfermedad de inters, pero varan
enormemente dependiendo de la prevalencia
2. Especificidad: de la condicin.
Se define como la razn entre los individuos que A lo anterior hay que agregar otra desventaja
tienen un resultado del test negativo y aquellos sin de utilizar estas medidas de rendimiento tradicio-

Tabla 1. Tabla de contingencia para tests diagnsticos

Gold standard + Gold standard - Total

Test + Verdadero positivo (A) Falso positivo (B) A+B


Test - Falso negativo (C) Verdadero negativo (D) C+D
Total A+C B+D

M E D I C I N A B A S A D A

1204 E N E V I D E N C I A
ESTUDIOS QUE EVALAN UN TEST DIAGNSTICO - F Salech et al

Tabla 2. Resumen de las propiedades de un test diagnstico

Propiedad del test Pregunta a responder Frmula Comentarios

Sensibilidad Qu tan bueno es el test detectando posibles enfermos. a/(a+c) Si un test es muy sensible,
un resultado negativo
descarta la enfermedad.
Especificidad En sentido estricto nos dice qu tan bueno es el test en d/(d+b) Si un test es muy especfico,
excluir a los sanos. Se entiende mejor puesto al revs un resultado positivo
(qu tan bueno es en confirmar enfermos). confirma la enfermedad.
VPP Si una persona tiene el test positivo qu tan probable a/(a+b) Los valores predictivos
es que tenga la condicin varan mucho con la
VPN Si una persona tiene el test negativo qu tan probable d/(c+d) prevalencia. No utilizar, si
es que no tenga la condicin nuestro paciente es
diferente a los del estudio.
LR Qu tanto ms probable es encontrar determinado valor Pueden calcularse tantos LR
del test en alguien enfermo comparado con alguien sano como valores posibles tiene
un test. En el caso de un
test dicotmico tendr un
valor positivo y uno negativo.
LR + Qu tanto ms probable es encontrar el test positivo en (a/a+c)/(b/b+d) Tambin se puede calcular de
alguien enfermo que en alguien sano la siguiente forma:
Sensibilidad / (1-especificidad)
LR - Qu tanto ms probable es encontrar el test negativo en (c/a+c)/(d/b+d) Tambin se puede calcular de
alguien enfermo que en alguien sano la siguiente forma:
1-sensibilidad / (especificidad)

nales. Para calcularlas, necesariamente necesita- cualquier test diagnstico, el clnico (explcita o
mos utilizar valores binarios (si o no, positivo o implcitamente) le asigna a su paciente una proba-
negativo, presente o ausente), limitando su capa- bilidad pre test de presentar la enfermedad. Una
cidad diagnstica. vez realizado el test diagnstico, esta probabilidad
A continuacin revisamos algunas formas de aumentar o disminuir, dependiendo del resulta-
expresar el rendimiento del test, que intentan dar do del test. A esta nueva probabilidad la llamare-
solucin a las limitaciones de las tradicionales. mos probabilidad post test.
Una forma de aproximarse a la probabilidad pre
4. Probabilidad pre test y post test test en un paciente determinado, es utilizar la
En un artculo previo se introdujeron los concep- prevalencia de la enfermedad en el estudio que
tos generales acerca de las probabilidades pre y estamos analizando (total de pacientes con el GS
post test, cmo se modifican de acuerdo a los positivo, o A + C en nuestra tabla de contingencia,
resultados de un examen y cmo se incorporan a sobre el total de pacientes del estudio o A+B+C+D).
la toma de decisin3. Si nuestro paciente es similar a la poblacin del
Todo paciente en que sospechemos una enfer- estudio, sera razonable utilizar este valor.
medad, tendr una probabilidad de presentarla. Formas ms precisas de estimar la probabilidad
Esta depender de la prevalencia de la enferme- pre test, corresponden a estudios observacionales
dad en la poblacin, de las caractersticas del en la poblacin de inters o estadsticas locales8.
paciente (edad, gnero, raza), de los signos y Pocas veces contaremos con estudios del
sntomas presentes, etc. As, antes de realizar problema de inters, con las caractersticas exactas

ME D I C I N A B A S A D A

E N E V I D E N C I A 1205
Rev Md Chile 2008; 136: 1203-1208

que presenta nuestro paciente y en nuestra pobla- por la proporcin de test positivos en los indivi-
cin especfica (por ejemplo, la poblacin que duos sin la condicin en estudio (Tabla 2). En
consulta al Servicio de Urgencia en que trabajo). A trminos sencillos nos indica la magnitud y el
pesar de eso, utilizando la mejor evidencia de que sentido del cambio de la probabilidad pre a post
se disponga, y complementndola con juicio test segn sea el resultado del test diagnstico1,9.
clnico y experiencia, habitualmente se lograr Si tomamos un test que tiene slo dos valores
una buena estimacin. posibles, positivo o negativo, tendremos un valor
La propiedad del test que nos permite cuantifi- de LR (+), que representa la magnitud del cambio
car la magnitud y el sentido del cambio de nuestra en caso de presentar un test positivo, y un LR (-),
probabilidad pre test segn sea su resultado, es el que representa la magnitud del cambio en caso de
likelihood ratio (razn de probabilidad o cuocien- presentar un resultado negativo.
te de verosimilitud). Dado que no existe consenso Si bien con un poco de matemtica se puede
acerca de la forma de traducir este trmino y a su hacer el clculo, una forma ms prctica de traducir
diseminada utilizacin en ingls, tambin hemos el LR de un test en un cambio objetivo de la
decidido mantenerlo sin traducir. probabilidad pre a post test de un paciente determi-
nado, es utilizando el Nomograma de Fagan (Figura
5. Likelihood Ratio (LR) 1a)10. Si hemos estimado la probabilidad pre test en
Se define como la razn entre la probabilidad de determinado paciente, y conocemos el LR del test
tener determinado resultado del test en la pobla- diagnstico, basta con unir (con una regla) los
cin con la condicin versus tener el mismo puntos correspondientes de las 3 columnas del
resultado en la poblacin sin la condicin. Es nomograma. La columna izquierda del nomograma
decir, la proporcin de test positivos en los representa la probabilidad pre test, la del centro el
individuos con la condicin en estudio dividido LR, y la de la derecha, la probabilidad post test1,9.

1a 1b
0,1 99 0,1 99

0,2 0,2 Partiendo de una


probabilidad pretest
0,5 95 0,5 95
de 30%, si el LR es de
35 para un resultado
1 1.000 90 1 1.000 positivo, nos lleva a un
90
500 500 post test de 92.
2 200 2 200
80 80
100 100
50 70 50 70
5 5
20 60 20 60
10 10 50 10 50
10
5 40 5 40
20 2 30 2 30
20
% 1 % Partiendo de una
20
% 1 %
30 0,5 30 0,5 20 probabilidad pretest de
40 0,2 40 0,2 30%, si el LR es de 0,45
0,1 10 10 para un resultado negativo,
50 50 0,1
60 0,05 60 0,05 nos lleva a un post test
0,02 5 5
70 70 0,02 de 16.
0,01 0,01
80 0,005 80
2 0,005
2
0,002 0,002
90 0,001 90
1 0,001 1
95 0,5 95
0,5

0,2 0,2

99 0,1 99 0,1
Probabilidad Cocientes de Probabilidad Probabilidad Cocientes de Probabilidad
Pre-test Probabilidad Post-test Pre-test Probabilidad Post-test

Figura 1. 1a. Nomograma de Fagan. 1b. Ejemplo de utilizacin del nomograma, basado en el ejemplo 1.

M E D I C I N A B A S A D A

1206 E N E V I D E N C I A
ESTUDIOS QUE EVALAN UN TEST DIAGNSTICO - F Salech et al

Como gua prctica, cuando un test tiene LR negativo es 0,4511. Si usted estim una probabili-
mayores a 10 o menores a 0,1, los cambios en las dad pre test de 30% (por ejemplo, en base a su
probabilidades sern en la mayora de los casos, experiencia y la prevalencia de TBC en su regin),
suficientes para confirmar (superar el umbral un resultado positivo nos llevar a una probabili-
teraputico) o descartar la condicin de inters dad post test de 92%, certeza suficiente para
(superar el umbral diagnstico o de estudio iniciar tratamiento (supera el umbral teraputico).
adicional)3. Por el contrario, un resultado negativo disminuira
Como describimos antes, algunos test tienen esta probabilidad a slo 16% que no es suficiente
slo 2 valores posibles (positivo y negativo), sin para descartar el diagnstico de meningitis tuber-
embargo, la mayora tienen ms de 2 valores, culosa (Figura 1b).
llegando a infinitos posibles valores en un test con Ejemplo 2: Se presenta un paciente con cuadro
resultados continuos. dudoso de trombosis venosa profunda, y usted
Una de las principales ventajas del LR que lo decide realizar un Dmero D. Una revisin siste-
diferencia de las otras propiedades del test, es que mtica de estudios diagnsticos reporta que para
podemos obtener un LR distinto para cada valor esta tcnica los LR positivo y negativo respectiva-
del test, o para un rango de valores. Por ejemplo, mente son 1,6 y 0,1212. Si usted consider una
si tenemos una enfermedad hipottica, en que el probabilidad pre test de 10%, un resultado negati-
examen que la detecta tiene un valor de 0 en vo nos llevar a una probabilidad post test
sujetos sanos, y a medida que el valor es mayor, la cercana al 1%, certeza suficiente para descartar el
probabilidad de tener la enfermedad va aumen- diagnstico. Por el contrario, un resultado positivo
tando; entonces, podemos calcular el LR para prcticamente no modificar la probabilidad
distintos rangos y as estimar cual ser el aumento (15%), por lo que se requerirn ms estudios para
en la probabilidad con distintos valores. As, un confirmar la condicin.
valor del test entre 1-10 podra tener un LR de 2, Ejemplo 3: En muchas ocasiones un test diag-
lo cual nos aumentara un poco la probabilidad, nstico tiene ms de dos posibles resultados. En
un valor entre 11-20 tendra un LR mayor (diga- estos casos debe presentarse el LR asociado a
mos un LR de 5), y por tanto nos aumentara un cada uno de ellos por separado. Por ejemplo, un
poco ms la probabilidad. Finalmente, un valor de estudio evalu, entre otras cosas, el rol de la
50 tendra un LR tan alto (10 o ms) que en la ferritina para el diagnstico de anemia ferropri-
mayora de los casos confirmara la enfermedad. va13. Un valor de ferritina plasmtica entre 45 y
Es imposible hacer lo mismo con la sensibilidad/ 100 mg/L mostr un LR de 0,54 por lo que rara
especificidad o con los valores predictivos. vez modificar la probabilidad en forma importan-
Los LR permiten resumir y complementar, en te. El LR asociado a un valor entre 35-45 fue 1,8,
un solo valor, dos propiedades de los test diag- para 25-35 fue 2,5 y para 15-25 fue 9,3. Como se
nsticos, la sensibilidad y la especificidad, y dado puede apreciar, valores de ferritina ms bajos van
que su clculo se hace a partir de ellos, su valor es cambiando en forma ms importante la probabili-
independiente de la prevalencia de la condicin dad. Finalmente un valor <15 se asoci a un LR de
en la muestra seleccionada. 55, por lo que prcticamente siempre confirmar
el diagnstico de anemia ferropriva.
Ejemplo 4: Para enfatizar la importancia de la
EJEMPLOS DE LIKELIHOOD RATIO probabilidad pre test, analicemos lo que ocurre
con los test de screening, en donde sta es
A fin de clarificar estos conceptos, presenta- generalmente muy baja. Imaginemos una mujer
mos algunos ejemplos de LR. sana de 45 aos que se realiz una mamografa en
Ejemplo 1: Imagine que est atendiendo a un el contexto de un chequeo general, que inform
paciente con un cuadro sugerente de meningitis una lesin BIRADS 4 (sospecha de malignidad).
tuberculosa y decide realizar un test de PCR para En una revisin sistemtica el LR para este
micobacterias en lquido cefalorraqudeo. Una resultado en particular fue de 125 (lo cual sera
revisin sistemtica reporta que para esta tcnica excelente de acuerdo a la regla de oro que
el LR de un valor positivo es de 35 y el de un valor mencionamos anteriormente)14. Dado que la pro-

ME D I C I N A B A S A D A

E N E V I D E N C I A 1207
Rev Md Chile 2008; 136: 1203-1208

babilidad pre test para esta paciente de tener un Cuanto ms estrecho es el intervalo, mayor con-
cncer de mama es de slo 0,003%, la probabili- fianza tendremos para utilizar el resultado.
dad post test sera de 0,37%. En otras palabras, a Los conceptos entregados en este artculo se
pesar que el LR asociado a este test es muy resumen en la Tabla 2.
elevado, la baja probabilidad pre test hace que
ste no sea suficiente para hacer el diagnstico
definitivo, por lo que se requerirn otros estudios CONCLUSIN
para confirmar la presencia de cncer.
Un test diagnstico es til en la medida que permite
diferenciar dos o ms condiciones que de otro modo
PRECISIN DE LOS RESULTADOS: podran ser confundidas. As, el test diagnstico
ideal es aquel que es capaz de detectar la mayor
Al igual que en un estudio de terapia, todo cantidad de pacientes con la condicin, excluyendo
resultado en un estudio de test diagnstico debe a la vez a la mayor cantidad de pacientes sin ella.
ser informado con su intervalo de confianza (el Los resultados de un test diagnstico nos ayudan
concepto de precisin de los resultados ha sido a modificar la probabilidad de presentar o no una
discutido en un artculo previo de esta serie)15. determinada condicin en un paciente determinado.
El intervalo de confianza es el rango de valores Existen diversas maneras de presentar las propieda-
dentro del cual se encuentra el valor verdadero des de un test, cada una con ventajas y desventajas.
(que no puede ser conocido de modo exacto) con El uso de los LR ayuda mejor a los clnicos en el
un grado prefijado de certeza. Habitualmente se proceso diagnstico, al hacer explcito el cambio
utiliza el intervalo de confianza de 95%, que entre probabilidad pre y post test. As, todos los
quiere decir que dentro de ese intervalo se estudios de test diagnstico deberan entregar su
encontrar el verdadero valor en 95% de los casos. valor, o al menos los datos que permitan su clculo.

REFERENCIAS 9. DEEKS J, ALTMAN D. Diagnostic tests 4: likelihood


ratios. BMJ 2004; 329: 168-9.
1. JAESCHKE R, GUYATT G, LIJMER J. Diagnostic Tests. En: 10. FAGAN T. Normogram for Bayess theorem. N Engl J
Guyyat G, Drummond R, ed. Usersguides to the Med 1975; 293: 257.
medical literatura. Essentials of evidence-based clinical 11. PAI M, FLORES L, PAI N, HUBBARD A, RILEY L, COLFORD J.
practice. Chicago: Editorial: JAMA Press 2002; 187-217. Diagnostic accuracy of nucleic acid amplification
2. PANTOJA T, LETELIER LM, NEUMANN I. El anlisis crtico tests for tuberculous meningitis: a systematic review
de la informacin publicada en la literatura mdica. and meta-analysis. Lancet (infectious diseases) 2003;
Rev Md Chile 2004; 132: 513-5. 3: 633-43.
3. CAPURRO D, RADA G. El proceso diagnstico. Rev Md 12. STEIN P, RUSSELL H, KALPESH P. D-dimer for the
Chile 2007; 135: 534-8. exclusion of acute venous thrombosis and pulmona-
4. VALENZUELA L, CIFUENTES L. Validez de estudios de tests ry embolism. Ann Intern Med 2004; 140: 589-602.
diagnsticos. Rev Md Chile 2008; 136: 401-4. 13. GUYATT GH, OXMAN AD, ALI M, WILLAN A, MCILROY W,
5. ALTMAN D, BLAND J. Diagnostic tests 1: sensitivity and Patterson C. Laboratory diagnosis of iron-deficien-
specificity. BMJ 1994; 308: 1552. cy anemia: an overview. J Gen Intern Med 1992; 7:
6. ALTMAN D, BLAND J. Diagnostic tests 2: Predictive 145-53.
values. BMJ 1994; 309: 102. 14. KERLIKOWSKE K, SMITH-BINDMAN R, LJUNG B, GRADY D.
7. LOONG T. Understanding sensitivity and specificity Evaluation of abnormal mammography results and
with the right side of the brain. BMJ 2003; 327: 716-9. palpable breast abnormalities. Ann Intern Med 2003;
8. GUYATT GH, PATTERSON C, ALI M, SINGER J, LEVINE M, 139: 274-84.
TURPIE I, MEYER R. Diagnosis of iron-deficiency 15. CANDIA R, CAIOZZI G. Intervalos de confianza. Rev
anemia in the elderly. Am J Med 1990; 88: 205-9 Md Chile 2005; 133: 1111-5.

M E D I C I N A B A S A D A

1208 E N E V I D E N C I A

You might also like