You are on page 1of 21

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 129

ARTÍCULO ESPECIAL
62.458

¿Cómo realizar, evaluar y utilizar revisiones sistemáticas
y metaanálisis?
J.P. Gisberta,b y X. Bonfillc
a
Servicio de Aparato Digestivo. Hospital Universitario de La Princesa. Universidad Autónoma de Madrid. Madrid. España.
b
Editor del Cochrane Upper Gastrointestinal and Pancreatic Diseases Group.
c
Centro Cochrane Iberoamericano. Servicio de Epidemiología Clínica y Salud Pública. Hospital de la Santa Creu i Sant Pau. Universidad Autónoma de
Barcelona. Barcelona. España.

INTRODUCCIÓN «enfermedad de Crohn» o «Crohn’s disease» en cual-
quiera de los buscadores de Internet actualmente disponi-
Una de las definiciones más populares de la tan nombrada
bles (Altavista, Yahoo, Google, etc.), encontraremos más
medicina basada en la evidencia es la de «la utilización
de 300.000 direcciones con información relacionada, lo
consciente, explícita y juiciosa de la mejor evidencia clí-
que evidentemente supone una cifra desorbitada.
nica disponible para tomar decisiones sobre el cuidado de
En segundo lugar, disponemos en la actualidad de un nú-
los pacientes». La práctica de la medicina basada en la
mero inagotable de fuentes1; así, se publican anualmente
evidencia significa, por tanto, la integración de la maes-
más de 25.000 revistas y más de 10 millones de referen-
tría clínica individual con las mejores evidencias científi-
cias en MEDLINE. Por ejemplo, si introducimos de nue-
cas externas disponibles a partir de una investigación clí-
vo el término «Crohn’s disease» en la casilla de PubMed
nica. Aunque este último componente parece, en teoría,
(el motor de búsqueda más conocido de MEDLINE),
relativamente fácil de adquirir, en la práctica los profesio-
identificaremos casi 20.000 referencias bibliográficas re-
nales sanitarios se ven desbordados por una cantidad de
lacionadas con esa enfermedad, lo que de nuevo supone
información imposible de manejar.
una cifra realmente difícil de digerir. En este sentido, un
Así, hoy más que nunca existen diversos motivos que ha-
médico que intente mantenerse al día sólo en su especiali-
cen necesario gestionar correctamente el conocimiento1.
dad debería leer, teóricamente, más de 100 artículos com-
En primer lugar, sufrimos actualmente un exceso de in-
pletos cada semana, o más de 500 el día de vuelta de sus
formación; se ha pasado en tan sólo unos pocos años de
vacaciones de verano3. Por otro lado, el tiempo disponible
no disponer de fuentes de información a nadar en una so-
para la búsqueda de información y el estudio es cada vez
breabundancia que nos satura y puede ser ciertamente
más limitado. Como consecuencia de lo anterior, los co-
contraproducente. Se calcula que se habrán realizado
nocimientos del médico se deterioran rápidamente tras fi-
cientos de miles de ensayos clínicos aleatorizados sobre
nalizar la carrera de medicina (o el programa de forma-
diferentes aspectos de la asistencia sanitaria desde 1948,
ción continuada que posteriormente se haya llevado a
año en el que se publicó el primero de estos estudios2. Y
cabo). Este hecho está magníficamente expresado en una
el futuro se promete imparable en cuanto a la expansión
figura ya clásica, donde el eje de ordenadas representa los
continua de la información obtenida mediante la investi-
conocimientos actualizados sobre el mejor tratamiento y
gación. A modo de ejemplo del exceso de información al
el eje de abscisas, los años desde la graduación; y en di-
que nos vemos sometidos, si introducimos el término
cho gráfico se observa cómo existe lo que se ha denomi-
nado una peligrosa «pendiente resbaladiza».
En tercer lugar, la calidad de las diversas fuentes de infor-
Esta revisión ha sido realizada en parte gracias a la concesión de las becas mación es desigual, por lo que el problema al que nos en-
del Instituto de Salud Carlos III (C03/02 y G03/090) y de la Red Temática de frentamos no es sólo el exceso de información, sino el
«Medicina basada en l’evidència: la Col·laboració Cochrane
Iberoamericana» (exp. 2003/XT/00087), Departament d’Universitats, que la calidad de la mayoría de las fuentes es deficiente1.
Recerca i Societat de la Informació, Generalitat de Catalunya. Por último, los contenidos de las fuentes de información
Correspondencia: Dr. J.P. Gisbert.
se quedan obsoletos rápidamente, lo que supone una limi-
Playa de Mojácar, 29. Urb. Bonanza. tación adicional de los sistemas actuales. Por tanto, nece-
28669 Boadilla del Monte. Madrid. España. sitamos disponer de herramientas que nos permitan acce-
Correo electrónico: gisbert@meditex.es
der a la información adecuada en términos de cantidad,
Recibido el 14-10-2003; aceptado para su publicación el 15-10-2003. calidad y actualidad.

29 Gastroenterol Hepatol 2004;27(3):129-49 129

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 130

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

Las revisiones nos ofrecen la posibilidad de estar informa- REVISIONES SISTEMÁTICAS FRENTE
dos sin necesidad de invertir la enormidad de tiempo antes A NO SISTEMÁTICAS
mencionada3. Precisamente, una de las maneras más efi- Llegados a este punto, cabría preguntarse: ¿es que no se
cientes de encontrar la evidencia científica a la que hace re- han empleado desde siempre este tipo de revisiones «sis-
ferencia la medicina basada en la evidencia es buscar una temáticas»?, ¿es esto de las revisiones «sistemáticas»
revisión sistemática de los ensayos clínicos aleatorizados algo realmente novedoso? Tradicionalmente se ha reali-
sobre los efectos de la atención sanitaria. Por tanto, necesi- zado un tipo de revisiones que podríamos denominar «na-
tamos imperiosamente revisiones sistemáticas para integrar rrativas». El inconveniente de este tipo de revisiones es
de forma eficiente toda la información válida y proporcio- que utilizan métodos «informales», no explícitos, y a me-
nar una base para tomar decisiones de manera racional. Las nudo personales y subjetivos3. En consecuencia, los lec-
revisiones sistemáticas establecen cuándo los efectos de la tores de una revisión narrativa encararán 2 problemas:
atención sanitaria son consistentes y cuándo pueden aplicar- primero, los autores no especifican el proceso que han
se los resultados de la investigación a los diferentes grupos seguido para buscar, reunir y evaluar la información que
de población. El uso de métodos explícitos y sistemáticos les ha llevado a ofrecernos sus conclusiones, y en segun-
en las revisiones limita el sesgo (esto es, el error sistemáti- do lugar, y ante la ausencia de dicha información, no se-
co) y reduce los efectos encontrados por azar, de modo que rán capaces de repetir y verificar los resultados y las con-
proporciona resultados más fiables sobre los cuales sacar clusiones de la revisión3.
conclusiones y tomar decisiones. El metaanálisis, es decir, En resumen, los principales defectos de las revisiones tra-
el uso de los métodos estadísticos para resumir los resulta- dicionales o narrativas son la dependencia de la subjetivi-
dos de estudios independientes entre sí, puede proporcionar dad del revisor y la falta de explicitación de los métodos
estimaciones más precisas sobre los efectos de la atención de búsqueda y selección de las fuentes4. Las limitaciones
sanitaria que las derivadas de los estudios individuales in- antes mencionadas están magníficamente expresadas en
cluidos en una revisión. la frase de D. Sackett, al referirse a las revisiones narrati-
El presente trabajo versará sobre cómo realizar, evaluar y vas: «Creo que la razón de esta deficiencia en las revisio-
utilizar revisiones sistemáticas y metaanálisis, en concre- nes se debe a la tradición de llamar a un experto en el
to de ensayos clínicos aleatorizados (randomised contro- tema para hacer la revisión… Esos autores comienzan su
lled trials), ya que éstos tienen mayores posibilidades de apartado de objetivos con una conclusión… Desafortuna-
proporcionar información más fiable que otras fuentes de damente los resultados están ya anunciados». Además, la-
evidencia sobre los efectos diferenciales de las distintas mentablemente, la calidad de la mayoría de la revisiones
opciones de atención en salud. A lo largo de ese artículo médicas tradicionales deja mucho que desear, debido a
se citarán numerosos ejemplos prácticos, con la intención que las labores de recogida, análisis y publicación de los
de hacer más ameno y didáctico el enfoque de cada uno resultados no se realizan con el mismo cuidado y detalle
de los aspectos de las revisiones sistemáticas. que cuando se trata de un trabajo de investigación origi-
nal. Esta falta de método lleva a la tendencia a extraer
conclusiones que, en el mejor de los casos, están sesgadas
DEFINICIÓN DE REVISIÓN SISTEMÁTICA
y, en el peor de los casos, son erróneas2.
Las revisiones sistemáticas son investigaciones científicas En contraposición, como se ha señalado anteriormente,
en sí mismas, con métodos prefigurados y un ensamblaje las revisiones sistemáticas emplean métodos explícitos y
de los estudios originales, que sintetizan los resultados de sistemáticos que limitan el sesgo, y de este modo propor-
éstos. Las características básicas que mejor definen a una cionan resultados más fiables5,6. Como se deduce de su
revisión sistemática se podrían resumir en las siguientes: nombre, las revisiones sistemáticas, no satisfechas con
a) son síntesis y análisis de la información con un enfo- averiguar parte de la verdad, buscan «toda la verdad», es
que práctico; b) se basan en la mejor evidencia científica decir, recogen y ensamblan todas las evidencias de cali-
disponible; c) formulan preguntas claramente definidas, y dad disponibles sobre una cuestión clínica en concreto.
d) utilizan métodos sistemáticos y explícitos para identifi- Además, esta forma de revisión da al lector una importan-
car y seleccionar estudios, evaluar éstos críticamente, ex- te ventaja sobre otras revisiones: la posibilidad de repro-
traer los datos de interés y analizarlos. ducirla y verificar si se llega a la misma conclusión3.
Consecuentemente, las revisiones sistemáticas pretenden Otra diferencia importante es que las revisiones sistemáti-
ser: a) rigurosas, en cuanto a los estudios incluidos (con cas se generan para responder en profundidad a cuestio-
criterios de calidad, etc.); b) informativas, esto es, enfoca- nes clínicas generalmente muy concretas y específicas.
das hacia problemas reales, tratando de contestar una pre- Estas cuestiones pueden y deben formularse con precisión
gunta claramente delimitada o específica, e idealmente (véase más adelante el apartado «Componentes clave de
analizando y presentando los datos de la forma que mejor una pregunta»). Si la pregunta que trata la revisión no
ayude a la toma de decisiones; c) exhaustivas: su objetivo está clara en su enunciado, en el resumen o en la intro-
es identificar y utilizar la mayor cantidad posible de in- ducción, o si no se incluye un apartado de «Métodos», lo
formación pertinente, sin introducir sesgos (de publica- más probable es que el artículo sea una revisión narrativa,
ción, de selección, etc.), y d) explícitas, ya que todos los no sistemática.
métodos utilizados en la revisión deben describirse con En contraposición, la mayor parte de los artículos de revi-
suficiente detalle. sión de tipo narrativo abarcan un amplio abanico de asun-

130 Gastroenterol Hepatol 2004;27(3):129-49 30

por del metaanálisis se ha generalizado. Alta explícita de todas las El término «metaanálisis» fue introducido por Glass en de la probabilidad de sesgo fuentes y artículos 1976 (es decir. incluiría apartados sobre anatomía del páncreas. aunque muy impor- tante. han experimentado en la última década un ejemplo de una revisión sistemática de la Colaboración crecimiento exponencial que se ha calificado de «epide- Cochrane relacionada con este tema plantea concretamen. en la mayoría de las especialidades. habiéndose empleado ejemplo. ningún metaanálisis hasta el año 1986. Basada en la calidad tudios independientes acerca de un mismo tema»4. No Estrategia de búsqueda DEFINICIÓN DE METAANÁLISIS información dirigida a localizar sistemática y y revisión todos los estudios. clí- nica. se podría concluir que. pueden retrasar más de una década la recomen. dación de un nuevo tratamiento de probada eficacia o En aparato digestivo. efectos del tratamiento. En el año 2003. una revisión narrativa sobre la pancrea- tudios para obtener una estimación o suma única del efecto titis aguda. mientras que una dé- dad. 31 Gastroenterol Hepatol 2004. fisiopatología de la función pancreática. en algunos datos objetivos). una bacteria que se descu- las sistemáticas –resumidas en la tabla I–. una de las más difundidas quizá sea la de estudios calidad metodológica Jenicek: «Una integración estructurada. Pregunta de Con frecuencia amplia y Clara. Revisiones sistemáticas frente a revisiones primeras están basadas frecuentemente en opiniones (ade- narrativas más de. Por ejemplo. con una revisión de los estudios revisados cualitativa y cuantitativa. hace relativamente poco tiempo). una búsqueda en Por último. Por lo EVOLUCIÓN DE LAS REVISIONES SISTEMÁTICAS tanto. diagnóstico. hasta el año 2003 se llevan publicados aproxi- En resumen. de entre las múltiples madamente 130 metaanálisis relacionados con la infec- diferencias que existen entre las revisiones narrativas y ción por Helicobacter pylori.27(3):129-49 131 . a Aunque a veces se utilicen indistintamente los 2 términos. Cuando los resultados de los es- frecuencia basada en científica. en com. como la que puede encontrarse en el capítulo de la intervención en salud que estamos evaluando. las recomendaciones halladas en las revisio. Alta criterios de selección. las revisiones dió hasta 65 en el período 1992-19989. ET AL.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 131 GISBERT JP. esta base de datos que incluyera como descriptor o pala- nes narrativas publicadas en las revistas y los libros de bra clave el término «meta-analysis» recuperó nada me- texto suelen diferir de las que se encuentran en las revi. ¿CÓMO REALIZAR. pero no lo son tanto para obtener respuestas concretas y mensurables Las revisiones sistemáticas en general. Asimismo. 1987 y 1991 se publicaron tan sólo 15. concreta. investigación poco definida centrada en una cuestión clínica bien definida Fuentes de No especificada. Así. ríodo 1981-1986 se encontraron sólo 21 referencias con paración con la nutrición enteral. Además. probabilidad de sesgo Selección aplicada de manera uniforme De entre las múltiples definiciones que se han propuesto Calidad de los Generalmente no evaluada Evaluación crítica de la posteriormente. complicaciones y tratamiento. de datos generalmente cualitativo. el método matemático llama- opiniones personales persisten do metaanálisis (que daría como resultado una revisión siste- mática «cuantitativa») es sólo una parte. La aplicación siones sistemáticas7. un tos relacionados con un tema. mien- Característica Revisión narrativa Revisión sistemática tras que las revisiones sistemáticas están basadas funda- mentalmente en pruebas8. disminuye la mortali. no se había publicado continuar defendiendo un tratamiento mucho tiempo des. de los resultados de diversos es- Síntesis Resumen subjetivo. Baste el dato de que durante el pe- te la pregunta de si la nutrición parenteral total. mentado hasta 1.4594. Así. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? TABLA I. estadístico menudo resumida revisión sistemática no es igual a metaanálisis3. las revisiones narrativas. las revisiones narrativas pueden ser más útiles para Y LOS METAANÁLISIS adquirir una perspectiva amplia sobre un tema. más que uno en profundi- metaanálisis es la combinación estadística de al menos 2 es- dad.000 referencias bibliográficas. dentro de sistemáticas que incorporan técnicas cuantitativas pueden las diversas especialidades. que lo bibliografía potencialmente definía en los siguientes términos: «un análisis estadístico relevantes Selección de Generalmente sin criterios Descripción explícita de de una amplia serie de análisis de resultados de estudios estudios de selección. han utilizado en casi todas las áreas temáticas. y los metaanálisis ante cuestiones clínicas específicas. con los estudios que se han identificación de las tudios primarios se resumen pero no se combinan con méto- seleccionado lagunas de dos estadísticos. la morbilidad o la estancia hospitalaria en los cada después (período 1991-1996) esta cifra había au- pacientes con pancreatitis aguda. Dicho de otro modo. el resultado puede denominarse revisión subjetivamente y en conocimiento que sistemática «cualitativa». ejemplo. pero con la evidencia poder ofrecer conclusiones. mia de metaanálisis». metodológica de sin un estimador los estudios. por ejemplo. de la revisión sistemática. por supuesto. por no decir en todas. de un libro de texto. entre los años pués de que se haya demostrado su escasa eficacia o in. ese encabezamiento en MEDLINE. destaca que las brió hace relativamente poco tiempo. las técnicas metaanalíticas se detectar mejor que las revisiones narrativas pequeños. un en particular. individuales con el objetivo de integrar sus hallazgos»4. nos que 14. En este sentido. A modo de aunque significativos. y esta cifra ascen- cluso su potencial iatrogénico. La primera (cuantificada) por un es el proceso que nos lleva a obtener los estudios cuyos re- estimador estadístico Interpretación En ocasiones basada en la Generalmente basada en sultados pueden combinarse –o no– matemáticamente para evidencia.

el auge del movimiento de. busca dotar a la práctica de la Y UTILIZAR UNA REVISIÓN SISTEMÁTICA medicina de los argumentos más objetivos posibles10. la especificación de las intervenciones que se han comparado. incorpora tablas y figuras es- 5. Análisis y presentación de los resultados tándar para mostrar las características de los estudios in- 6. con más de 9 millones de artículos publicados de la Colaboración Cochrane (www. Metaanálisis de los revisores.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 132 GISBERT JP. En la tabla III se resumen los pasos necesarios para pre- cas entre diversos autores. nominado «medicina basada en la evidencia». Pasos para la preparación de una revisión ción (antecedentes y objetivos). Una de las Sinopsis más utilizadas es la propuesta por los National Institutes Resumen of Health de EE. ¿CÓMO REALIZAR. calidad metodológica y re- 2.. que. reflejado en el incremento del sores a construir las revisiones según el formato estructu- número de revistas biomédicas.Cochrane-net. los resultados propiamente dichos y una lista Las causas más probables de esta eclosión son fundamen. Precisamente. por especialidades o subespecialidades. mática. Esquema de una revisión Cochrane REVISIONES SISTEMÁTICAS. Además.12. METAANÁLISIS Carátula Y GRADO DE EVIDENCIA CIENTÍFICA Título Revisores Para evaluar el grado de evidencia científica existen di- Fuentes de apoyo versas escalas que puntúan la calidad de la información Qué contenido es nuevo Texto de la revisión en función del tipo de estudio que la soporta. texto de obligada y los más heterodoxos. revman).UU. de los estudios que se han excluido. sin mie- «prefiero fiarme de un buen estudio individual que de un do al naufragio. el aumento de información Manager (RevMan) está diseñado para ayudar a los revi- acaecido a partir de 1940. solicite una beca o realice su te. el texto de la revisión.300 a más rado descrito y se puede adquirir gratuitamente en la web de 25. la res- Estudios excluidos puesta a ese desafío la constituyen las revisiones llevadas Estudios pendientes de evaluación a cabo por la Colaboración que lleva su nombre. Características de los estudios en curso Comparaciones. Esta «fiebre de metaanálisis» ha suscitado vivas polémi. que manifiestan todo lo contrario: consulta para todo aquel que quiera embarcarse. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? TABLA II. Localización y selección de los estudios sultados propiamente dichos). y en segundo lugar. Interpretación de los resultados cluidos. manteniendo y divulgando revi- Características de los estudios incluidos siones sistemáticas sobre los efectos de la atención sanita- Características de los estudios excluidos ria. La mayoría los que afirman que «cualquiera que se inicie en una nue. con el objeto de establecer lo que ya se conoce…» Centro Cochrane Iberoamericano)11. de lo que se expondrá en este apartado está basado en el va área de investigación. Las referencias bibliográficas utilizadas en este 132 Gastroenterol Hepatol 2004. que consta de una introduc- TABLA III. que se emplea para graduar las re- Antecedentes Objetivos comendaciones en las guías de práctica clínica basadas en Criterios para la selección de los estudios de esta revisión la evidencia y en la que las revisiones sistemáticas y los Tipos de estudios Tipos de participantes metaanálisis ocupan una posición privilegiada4. Formulación del problema (descripción de los estudios. ET AL. una or- Estudios en curso Otras referencias ganización internacional sin ánimo de lucro que intenta Referencias adicionales ayudar a tomar decisiones clínicas y sanitarias bien fun- Otras versiones publicadas de esta revisión Tablas y figuras damentadas preparando. datos y gráficos perfectamente definido. EVALUAR realizados en diversas áreas. métodos. Evaluación de la calidad de los estudios 4. en la preparación de una revisión siste- metaanálisis»4. de todos los ensayos clínicos Referencias de los estudios Estudios incluidos de asignación aleatoria relevantes»8. «Manual de revisores» de la Colaboración Cochrane (ver- sis doctoral debería antes realizar un metaanálisis del sión española de «Cochrane reviewers’ handbook» del tema.27(3):129-49 32 . resultados 1. Las revisiones Cochrane tienen un formato estándar. Referencias adaptado periódicamente. basán- dose precisamente en la revisión sistemática de los trabajos PASOS NECESARIOS PARA REALIZAR.000. Extracción de datos. Tipos de intervenciones Tipos de medidas de resultado (outcomes) Estrategia de búsqueda para la identificación de los estudios Métodos de revisión REVISIONES SISTEMÁTICAS Y METAANÁLISIS Descripción de los estudios DE ENSAYOS CLÍNICOS Calidad metodológica Resultados Archie Cochrane señalaba no hace mucho la necesidad de Discusión Conclusiones de los revisores un mayor número de revisiones de conjunto sistemáticas Implicaciones para la práctica cuando escribió: «Seguramente es una crítica grave a Implicaciones para la investigación nuestra profesión el que no hayamos organizado un re- Agradecimientos Conflictos de interés sumen crítico. El programa Review talmente 2: en primer lugar. discusión y conclusiones 3. que debe constar de los siguien- Tablas adicionales tes apartados (tabla II): un resumen en un formato estruc- turado. que pasó de 2.org/ por año10. materiales (criterios de sistemática selección y estrategia de búsqueda). con posturas encontradas entre parar correctamente una revisión sistemática.

A pesar de las consideraciones anteriores. hay que defi. En segundo babilidades habrá de encontrar datos que respondan de lugar. a una respuesta tam- las que éstas se compararán. Ya que las revisiones Cochrane plantean cues- sirven también a los lectores para valorar inicialmente su tiones acerca de los efectos de la atención sanitaria. debiéndose establecer criterios que sean suficiente. en una revisión sobre los efectos de la atención sanitaria. remitiendo al lector intere. una pregunta terminado tratamiento. de interés para la revisión. por unir hallazgos atrayentes entre todos los estudios. incluso dudosamente ético. Por último. También es importante definir las intervenciones con conduce. realizar un ensayo clínico alea- ducción de la mortalidad debida al cáncer de colon (el re. de una enfermedad es tan uniforme o los efectos de una mática de más de 50 años (los participantes). al mismo tiem- nizan cuando la pregunta principal es confusa y se opta po. evidencia ya reconocida. forma específica a preguntas tan restringidas. con mucha probabilidad. la primera y más importante decisión a cuestiones. la etnia. el tipo de grupo bién confusa. una pregunta confusa rés. Desde la perspectiva del lector. hay que identificar a la población y el ámbito de in. a ve- da debe especificar el tipo de personas (participantes). sean los criterios exigidos acerca del diseño de los estu- luar. En primer lugar. resulta de utilidad inicio son si se revisarán únicamente los estudios que tie- considerar en 2 fases el tipo de personas que son objeto nen un seguimiento de una cierta duración. Así. ¿CÓMO REALIZAR. dios para responder a la pregunta planteada. Los re- cipal claramente definido a priori ayuda a luchar contra visores deben evitar abrumar a los lectores con datos que las denominadas «expediciones de pesca»3. la Componentes clave de una pregunta aleatorización es el único modo de controlar aquellos que Existen varios componentes clave que son necesarios no se conocen o no están cuantificados14. A modo de ejemplo.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 133 GISBERT JP. el ces resulta apropiado realizar una revisión sistemática de tipo de intervenciones y el tipo de resultados que son de los estudios no aleatorizados sobre los efectos de un de- interés para la revisión. En primer lugar. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? artículo de revisión podrían ser innumerables. Muchos autores consideran que los ensayos la hora de preparar una revisión es determinar su enfoque. Así. clínicos controlados y aleatorizados son una condición lo que se consigue planteando preguntas claramente deli- sine qua non para tratar asuntos referentes a la eficacia te- mitadas. enfocar una revi- sión sobre la efectividad del cribado (screening) del cán- cer de colon mediante colonoscopia dirigida únicamente a Primer paso: formulación del problema individuos mayores de 50 años de edad parece estar justi- ficado por diversas razones. es preciso tener en cuenta que cuanto más restrictivos nir las enfermedades o condiciones que pretendemos eva. éstas relevancia. ET AL. Esto implica tener que decidir si se está interesado gran parte de éstas se encuentran recogidas en el «Manual en un grupo específico de la población. sanitarias. los lectores pueden utilizar las preguntas se centran principalmente en ensayos clínicos aleatoriza- y los objetivos planteados para juzgar si la revisión les dos. en este manuscrito citaremos únicamente tores como la edad.27(3):129-49 133 . ción o del ámbito de estudio debe estar justificada por sulta del citado manual. debe consi- en la afirmación de Counsell13: «Ask a poor question and derarse con detenimiento si las personas en el grupo con- you’ll get a poor review». otros aspectos relevantes acerca del sultado)?». es decir. Así. entre las que destaca que la Justificación de las preguntas bien formuladas incidencia de este tipo de cáncer en individuos menores de 50 años es muy baja. claro a partir del título o del resumen. éstas se orga- tienen poca o ninguna trascendencia pero. menos pro- mente explícitos para estas definiciones. en ocasiones el curso correctamente planteada sería: «En la población asinto. Una pregunta claramente defini. No obstante. tricción basada en características específicas de la pobla- sado por un detalle bibliográfico más exhaustivo a la con. 33 Gastroenterol Hepatol 2004. puesto que terés. Al igual que en cualquier proyecto periores a otros para tratar de responder a determinadas de investigación. torizado. Por ejemplo. pues algunos resultan su- un resultado positivo. Existen 2 razones fundamentales por las que se debe puede resultar de interés y si es pertinente para las cues- ser cauteloso a la hora de incluir estudios no aleatorizados tiones que ellos se plantean. ¿el cribado intervención son tan evidentes que resulta innecesario. el sexo. por lo general. hecho que está magistralmente expresado control que es aceptable para la revisión. ambos relacionados con los sesgos. probablemente no El tercer componente clave de una pregunta bien formu- merece la pena perder el tiempo leyendo el artículo de re- lada es la especificación –con criterios explícitos– de visión en su totalidad8. El desarrollo de un objetivo prin- aquellos resultados concretos que sean de interés. Un componente adicional al plantear una pregunta es el hasta que finalmente alguna combinación de datos ofrece tipo de diseño de los estudios. han de tener cuidado en no omitir datos importantes. Cualquier res- algunas de las más relevantes. Las preguntas mal enfocadas conducen a decisiones poco El segundo componente clave de una pregunta bien for- claras acerca de qué estudios conviene incluir en la revi- mulada es especificar las intervenciones que son de inte- sión y cómo resumir sus datos. Dichas preguntas y los objetivos de una revisión rapéutica. Por ejemplo. diseño de los estudios que merecen considerarse desde el Con respecto al tipo de participantes. trol pueden estar recibiendo otras intervenciones (y cuá- si el principal problema que aborda la revisión no está les) distintas del placebo. etc. los estudios no aleatorizados especificarse en la sección «Criterios de selección de los tienden a sobreestimar los efectos de las intervenciones estudios» de la revisión. en función de fac- de revisores». Datos empíricos para formular correctamente una pregunta y que deben indican que. e con colonoscopia (la intervención) se asocia con una re.

sólo pueden identificar entre un 30 y un xación del artículo. si lo derivado de la modificación de la pregunta inicial de sólo se emplean los términos «Helicobacter pylori» y revisión.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 134 GISBERT JP. que la búsqueda de determinado. los componentes clave que resultan de utilidad cuando se realiza una bús- Segundo paso: localización y selección queda incluyen la condición o enfermedad de interés y la de los estudios intervención o exposición que se está evaluando. un revisor po- inglesa tienen una baja representación en MEDLINE. esta base de Amplitud de las preguntas datos no incluye la totalidad de la bibliografía médica pu- blicada y. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? Identificación y selección de los estudios mediante te. algunos de los cuales pueden ser relevantes para la MEDLINE. ET AL. Por el contrario. a distintas po- que en un principio se pensó que las revistas médicas po- blaciones o a formas alternativas de una misma interven- dían ser las responsables fundamentales de este tipo de ción. Las revisiones enfocadas de manera restringida quizá prioritariamente estudios con resultados positivos. Son varias las ventajas y desventajas que se deri- influyan en las decisiones de enviar y aceptar para publi- van del hecho de formular preguntas amplias o restringi- cación los resultados de la investigación. Para las revisiones Cochrane. Las búsquedas que ciar la revisión completa. debe documen- ulcerosa» y «largo plazo». tes). el sesgo de publicación puede de- estos fármacos son efectivos para reducir el riesgo de re- berse a la tendencia existente entre autores. es importante protegerse del riesgo de aborden los efectos a largo plazo de la erradicación de sesgo al modificarlas. Por ejemplo. revisores y cidiva únicamente en los pacientes con enfermedad de editores de revistas a permitir que la dirección y la signi- Crohn que han sido sometidos a cirugía de resección in- ficación estadística de los resultados de la investigación testinal. un enfoque restringido comporta un eleva- sesgo. algunos estudios nunca llegan a publi- El alcance de las preguntas que aborda una revisión pue- carse. Por otro lado. Aunque se pueda estar específicamente interesado en un ámbito Como se ha mencionado previamente. sin particularizar a ninguna subpoblación de pacien- publica no es representativo de lo que se investiga16-18. pero es posible que no formen parte de la inde- ción de estudios. si uno busca estudios que sión del problema. ya que tenderían a publicar únicamente estudios do riesgo de conclusiones sesgadas cuando el revisor con resultados significativos. En general. 80% de todos los ensayos clínicos controlados aleatori- zados que se han publicado. Las referencias de estudios escritos en lengua no de ser amplio o restringido. al seleccionarse das. es probable que no se identifi- tarse y justificarse cualquier cambio que sufra el protoco- quen estudios que pueden ser relevantes. Aun- no sean generalizables a entornos diversos. y a partir conoce la bibliografía sobre un determinado tema y res- de las entrevistas efectuadas directamente con investiga- tringe los criterios de inclusión de tal manera que queden dores. Además.27(3):129-49 34 . que se origina cuando lo que se ral. «recidiva ulcerosa» en la búsqueda. «recidiva sultados espurios. como tados. Modificación de la pregunta tros especializados de ensayos clínicos elaborados por los La pregunta debe plantearse en el protocolo antes de ini- Grupos Colaboradores de Revisión. Por ejemplo. ¿CÓMO REALIZAR. y las preguntas modificadas por los propios diante los términos «Helicobacter pylori». se identificarán cien- tos de artículos irrelevantes. en cuenta para definir la estrategia de búsqueda inicial15. Además. por otra. de la condición de interés se asocian con efectos de la in- deberían determinarse qué componentes clave se tendrán tervención que son marcadamente diferentes. Las preguntas a posteriori son más H. la validez de las revisiones definidas en términos muy los componentes clave de la pregunta amplios puede no ser apropiada cuando existe evidencia sólida que induce a pensar que las diversas definiciones Una vez que se ha planteado correctamente una pregunta. «úlcera duodenal». Por una parte. en la actualidad. si no hay resultados estén en conflicto con la postura que defiende. «tratamiento datos pueden generar conclusiones falsas basadas en re- erradicador». los estudios no son interesantes para su pu- 134 Gastroenterol Hepatol 2004. Por su par- significativos. pylori sobre la prevención de la recidiva ulcerosa duo- proclives al sesgo que aquellas que han sido formuladas denal y lo hace buscando los que están indexados me- previamente. pero no debe convertirse en una requieran de la presencia simultánea de varios de los «camisa de fuerza» que impida la exploración de aspectos componentes de la pregunta –o bien de formulaciones inesperados. por dría plantear una pregunta amplia al considerar si los ami- lo que si se utiliza esta base de datos para identificar estu- nosalicilatos son eficaces en la prevención de la recidiva dios la revisión puede estar afectada potencialmente por de la enfermedad inflamatoria intestinal crónica (en gene- un sesgo de publicación. en todo caso. otro revisor podría preguntarse si Desde otra perspectiva. son potentes herramientas para la localiza- revisión. la búsqueda de estudios se ve enormemente facilitada por la existencia de los regis. los estudios pueden evaluar múltiples resul- dicionales. Aunque es de esperar que se obtenga una muy específicas de ciertos componentes– suelen ser de- cierta fluidez y refinamiento al formular las preguntas de masiado específicas y tienden a pasar por alto informa- revisión conforme se va adquiriendo una mayor compren- ción relevante. se sabe que los principales responsables son los excluidos algunos o varios estudios con resultados que propios autores al considerar que. Si bien las bases de datos electrónicas. Por tanto. los estudios no suelen estar indexados se- los estudios sea exhaustiva y no sesgada es una de las di- gún esta variable dentro de las bases de datos electróni- ferencias clave entre las revisiones sistemáticas y las tra- cas. «prevención».

todos los datos relevantes sean incluidos en una revisión. además. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? blicación4. CICYT. compuesta por in- Posibles fuentes de información para la localización de formes técnicos. es necesario utilizar varias fuentes de infor. Medicus y Excerpta Medica son repertorios de revistas de rio de Sanidad. MEDLINE. ya que muchos putarizadas de estudios publicados en revistas indexadas estudios referenciados de esta manera no son publicados (MEDLINE. y l) trónico bajo la denominación de MEDLINE y EMBASE. por lo que una búsqueda más exhaustiva requiere que se interroguen. se ha cal- está haciendo un uso eficiente de otras bases de datos adi. ambas bases de datos. Colaboración Cochrane. Excerpta Medica. lo hacen en ejemplo. La «lite- mediante el empleo de múltiples estrategias de búsqueda. c) artículos originales (publicaciones preli- Bases de datos electrónicas minares o completas) en publicaciones primarias. Presentan existentes. como mínimo. Al desarrollar una estrategia de las referencias. Este registro incluye principal- gresos. Entre las publicaciones secun- 35 Gastroenterol Hepatol 2004. aunque lento. ninguna de las bases de duplicación innecesaria de esfuerzos y garantizar que se datos mencionadas cubre todas las revistas. ACP Journal Club.19. cuencia10. sociedades científicas. Control de las listas de referencia Los revisores deben controlar las listas de referencias de Publicaciones secundarias todos los artículos relevantes que hayan identificado. En general. i) agencias financiadoras (FIS. junto con un de Resúmenes de Revisiones de Efectividad (Database of breve comentario de un experto que aporta una perspecti- Abstracts of Reviews of Effectiveness-DARE). A veces estos referencias (una tendencia a citar preferentemente los canales informales de comunicación pueden ser los úni- estudios que apoyan el propio punto de vista) y evitarlo cos medios para identificar datos no publicados. Español. mación de ensayos recientes que todavía no se han publi- nerse en cuenta la posibilidad de que haya un sesgo de cado o de ensayos inéditos más antiguos. b) artículos de revisión y metaanálisis. f) tesis doctorales (registro de publicaciones de fa. Por otra parte. d) pu- blicaciones secundarias: resúmenes de artículos publica.27(3):129-49 135 . éste es un medio eficiente. cuando se realiza una La principal fuente de estudios para las revisiones Coch. culado que el solapamiento entre MEDLINE y EMBASE cionales.). búsquedas manuales a partir de las citas bibliográficas de respectivamente. minado «CENTRAL». ¿CÓMO REALIZAR. los indexadores no queda de Ensayos o al coordinador del grupo de revisión siempre son expertos en el área temática del artículo que del Grupo de Colaboradores de Revisión para evitar la están indexando. Sin embargo. ciencias de la salud que están accesibles en formato elec- nográficos. de diversos mecanismos de búsqueda. ET AL. Los colegas pueden ser una importante fuente de infor- mación para identificar los estudios.. Así. La Cochrane Library incluye la Base de Datos un resumen estructurado de dichos estudios. los artículos de revisión aparecen indexados revistas de más impacto y son citados con más fre. ratura gris u opaca» (grey literature). también puede resultar útil. Para evitar estos sesgos y asegurar que. En el sesgo de publicación intervienen diver. EMBASE y estadísticamente significativos tienen mayor probabilidad otras bases de datos bibliográficas también pueden usarse de ser publicados que los que no arrojan diferencias. la Colaboración Cochrane ha ve- dos en otras revistas como originales (Evidence Based nido desarrollando su propio registro de estudios. Las publicaciones secundarias seleccionan estudios origi- tificar estudios. grupos de otras entidades que han identificado los ensayos a través trabajo. Debe también te. una para identificar artículos de revisión (en MEDLINE. etc. Desde octubre de 1996. e) resúmenes de con. como «Review» en el campo «Publication type»). EMBASE. etc. Algunas de las fuentes de referencia de nales con la exigencia de que sean metodológicamente ensayos más obvias y convenientes son las revisiones ya correctos y además clínicamente relevantes. Índice Médico en su totalidad2. k) industria farmacéutica. deno- Medicine. Esta sencilla estrategia de búsqueda funciona bien si el objetivo es recuperar algún buen artículo sobre un tema o simplemente identificar un Registros especializados de la Colaboración Cochrane artículo específico. aportadas por grupos de revisión y personales con expertos. g) libros de texto sobre el tema. por las empresas productoras. revisión sistemática debe considerarse con cierto escepti- rane es el registro especializado de los Grupos Colabo. entre otros). estudios incluyen4: a) bases de datos bibliográficas com. registros mo. bien sus métodos u objetivos. etc. h) contactos atención sanitaria. j) registros de ensayos clínicos (Ministe. de iden. Cochrane Library). es de tan sólo un tercio aproximadamente. mente referencias de los ensayos clínicos controlados en cultades). entre otros. Index daciones. dado que los autores quizá no describan búsqueda es importante consultar al coordinador de Bús. por el NHS Centre for Reviews and Dissemination sos factores: además de que los trabajos con resultados (CRD) en York (Reino Unido). fun. cismo la precisión con la que se aplican los descriptores a radores de Revisión. A continuación se revisan con den ser interrogadas mediante descriptores temáticos más detalle las fuentes de información más relevantes (subject terms) asignados por indexadores contratados para la localización de los estudios. actas de congresos y tesis doctorales. Por su parte. producida va clínica a los resultados. en la medida de Comunicación personal lo posible. Estas bases de datos referenciales pue- los artículos originales. por vez aceptados se publican más rápidamente.).129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 135 GISBERT JP.

que se incluyen en las revisiones sistemáticas es necesaria ciones que se están evaluando (agrupados con el operador para limitar los sesgos y guiar la interpretación de resulta- «OR») si también abordan la condición de estudio (es de. una estrategia de búsqueda para evaluar la posi- com/). la estrategia de búsqueda para cada base de datos gran ayuda en el desarrollo y ejecución de éstas. es aconsejable que más de un revisor examine consenso). do será asimismo deficiente. garbage out».129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 136 GISBERT JP. y c) cómo se resolverán las requisitos de inclusión. cialidad de aparato digestivo. aunque es importante que al menos tivamente. Algunas tis y el linfoma no hodgkiniano sería: («hepatitis C» OR especialidades disponen de publicaciones secundarias es. ya mediante discusión. un revisor esté versado en el tema objeto de revisión. A producirse. artículos. debe explicitarse la estrategia de búsqueda. el título o el resumen nes. Los no sólo no nos aportará beneficio alguno sino que incluso resultados pueden reducirse utilizando posteriormente el podrá confundirnos en nuestra práctica clínica. la evaluación de la calidad de los estudios individuales los que utilizan los términos que describen las interven. «non-Hodgkin lymphoma» OR «lymphoproliferative di- terology (www. rrollo de una estrategia de búsqueda es un proceso iterati. ge in. cir. Idealmente. cuando la discrepancia se deba a una diferencia de rar su inclusión. evitarse en la medida de lo posible). la calidad de la revisión sistemática que los ha inclui- fica que se identificarán los artículos indexados que in. en general.org/) y el EBM online (http://ebm. el tema debe resolverse por decisiones. Como expresa muy gráficamente el refrán inglés «garba- Un buen abordaje para desarrollar una estrategia de bús. tencialmente elegibles deben evaluarse con posterioridad nan los estudios para su inclusión en una revisión. limitaciones de idioma o de otro tipo (aunque éstas deben gún los resultados que se vayan obteniendo. recomendable). siempre es necesario mantener un equi. se identifican los artícu. Incluso si la revisión incluye sólo ensayos clínicos 136 Gastroenterol Hepatol 2004. De este ples que describan la condición o enfermedad de interés y modo. Por lo tanto..27(3):129-49 36 . detalle en la revisión como para que el proceso pueda re- librio entre el grado de exhaustividad y su precisión. b) si las resúmenes para determinar si cada artículo reúne los re. Aumentar la exhaustividad en una búsqueda implica re- Documentación de una estrategia de búsqueda ducir su precisión e identificar más artículos no relevan- tes. En cada etapa del proceso de se. ej. Selección de estudios Desarrollo de una estrategia de búsqueda Todas las referencias de estudios identificados como po- Debe describirse el proceso mediante el que se seleccio. a criterio del revisor. En este paso. La documentación debe incluir las principales menudo. las limitaciones temporales (p. debería obtenerse el texto completo del artícu. Esto signi. qui- lo. es de. si la calidad de los estudios incluidos es defectuo- combinarlos con el operador booleano «OR».20. ET AL. es importante trabajar estrechamente con un documenta- lista en el momento de decidir en qué bases de datos bus- car y qué estrategias de búsqueda utilizar en cada una de Tercer paso: evaluación de la calidad de los estudios ellas. zá sea una ventaja disponer de un segundo revisor que no te. Debido a la importancia que tienen estas interpretación más profunda. Los revisores deben decidir: a) cuándo se ne- ra etapa de revisión de los resultados de una búsqueda cesitará que más de un revisor evalúe la relevancia de electrónica implica la evaluación detallada de los títulos y cada artículo (actitud. como es el caso de Evidence-Based Gastroen. finalmen. por lo tanto. En este caso. Aunque es importante que la búsqueda sea lo más La estrategia de búsqueda debe describirse con suficiente completa posible. sores. menudo un simple descuido por parte de uno de los revi- ceso de selección es improbable que se vuelva a conside.bmjjournals. si cumplen la intervención «Y» la condición). no especialistas o ambos (los especialis- nar la información disponible se puede determinar que un tas en un área específica con frecuencia tienen opiniones artículo no cumple los criterios de inclusión. Si. Por tanto. dicha revisión cluyan por lo menos uno de los términos utilizados. a la exclusión del estudio porque no reúna los sea un experto en esa área). Si al exami. discrepancias si existe más de un revisor (generalmente lección es preferible errar por exceso que por defecto. ejemplo. pues la causa del desacuerdo es a que una vez que un estudio ha quedado excluido del pro. si se introduce basura en una revi- queda exhaustiva es empezar utilizando términos múlti. sa. operador «AND». decisiones en cuanto a la selección las tomarán especia- quisitos predeterminados para ser escogido. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? darias se encuentran el ACP Journal Club (http://www.evidence-based-gastro. sease» OR «lymphoproliferative disorder»). tanto sobre la relevancia como sobre la validez de los del artículo ofrecen dudas que impiden rechazarlo defini. sión sistemática se obtendrá también basura3. «hepatitis C virus» OR HCV) AND («lymphoma» OR pecíficas. cada registro obtenido antes de que sea rechazado. la revisión. El desa. Estas 2 publicaciones se encuentran reunidas en ble relación entre la infección por el virus C de la hepati- formato CD-ROM bajo el título Best Evidence.com/) en la espe. de 1966 a 2003) y las vo en el cual los términos que se utilizan se modifican se. éste puede formadas previamente que pueden sesgar sus evaluacio- rechazarse. listas en el tema. dos. ¿CÓMO REALIZAR. los bibliotecarios o documentalistas que se han fuentes de información utilizadas para identificar los estu- especializado en búsquedas electrónicas pueden ser de dios. los revisores deben estar junto al docu- mentalista cuando se ejecute la estrategia de búsqueda. Por acpjc. consultada y la fecha en la que se efectuó dicha búsqueda. para confirmar si cumplen los criterios de inclusión para cir. La prime. La revisión del texto completo puede llevar.

Por ejemplo. – Sesgo de selección. para obtener una evaluación global de los resultados de dios sobre los efectos de la atención sanitaria pueden cada estudio22. ej. ¿CÓMO REALIZAR.. dirse con el término «cegar». 9 listas que se han utilizado para evaluar la validez y la «ca- lección. la validez de los estudios indivi. De este modo. El sesgo de detección se refiere a mos a la «verdad». sin embargo. nos centraremos a continuación en cómo evaluar. Mientras se evalúa la con la definición de los componentes clave de las pregun.27(3):129-49 137 . La interpretación de los re. la validez externa de una investigación se plantea a la hora de generalizar Si se han utilizado. Se refiere a las diferencias temáticos o sesgos mediante el correcto diseño y rea. o pérdida (attrition bias) y de detección– que se comen. Cuan. ción central. el término «sesgo» hace referencia a los evalúan los resultados son. Dado que la mayoría de las (en inglés. proceso de ocultar la asignación hasta que se asigna el que quizá no estén relacionados directamente con la vali. puede «cegarse» a aquellos que dan y reciben el cha revisión. las diferencias sistemáticas entre los grupos de compara- rosos suelen estar sesgados hacia la sobreestimación de la ción en la evaluación de resultados. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? aleatorizados. Los factores que justifican una evaluación de. mientras que los estudios menos rigu. Los ensayos clínicos eficacia de la intervención. Hace referencia a las diferencias sistemáticas en la atención sanitaria proporcionada a los Validez. tratamiento se denomina «ocultación de la asignación» dez interna de los ensayos. de realización (performance bias). en el diseño de duales y ciertas características del diseño que afectan a la ensayos clínicos es muy importante utilizar un método interpretación de los resultados.23. El cegamiento es particularmente importante en la población de referencia a la que se pretende generali. En una revisión sistemática. de desgaste lidad» de los ensayos clínicos controlados y aleatorizados. elegibilidad potencial de un participante en un ensayo clí- tas correctamente formuladas. Por el contrario. la validez de dichos estudios. si los datos encontra. tre tratamientos está relacionado con el proceso de obten- bilidad de los resultados. entonces es necesario tomar otras precaucio- motilidad) y es posible que tengan períodos de segui. asignados quienes lo reciben. es importante conocer si éstos eran de bue. tudio se refiere a la capacidad de evitar los errores sis. En el tratamiento para que no conozcan el grupo al que están contexto de una revisión sistemática. como es aconsejable. está relacionada asignación de los tratamientos21. Uno de los factores más importan- na calidad.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 137 GISBERT JP. que ciegan la asignación de las intervenciones a quienes En resumen. aquellas investigaciones que utilizan medidas subjetivas zar los resultados16. tienen mayor probabilidad de dar resultados más próxi. contra las diferencias en la atención y contra el efecto ta mayor sea la validez de los estudios que sustentan di. esto sos a estar sesgados que los ensayos clínicos que no lo es. de tratar las pérdidas puede sesgar los resultados. El un año). la validez de un es. – Sesgo de detección. Lo ideal es que el proceso de asignación no de otras características. más nos fiaremos de las conclusiones. las la pérdida de participantes durante el estudio. Por ejemplo. didas tomadas para reducir el sesgo una vez que la inter- precisamente. ción de los grupos a comparar. Para proteger temática debemos valorar si nos las vamos a creer3. claro Antes de fijarnos en las conclusiones de una revisión sis. sistemáticas entre los grupos de comparación en cuanto a lización del estudio. aspecto ya comentado en nico. las personas que reclutan a los participantes deben el apartado correspondiente. tes que puede sesgar y distorsionar las comparaciones en- tallada de la calidad son los relacionados con la aplica. placebo. Si no puede organizarse tal aleatoriza- dispepsia de tipo ulceroso o. como el dolor. Se han identificado al menos 25 escalas y existir 4 tipos de sesgos o errores sistemáticos –de se. pero ninguna de ellas puede recomendarse sin reservas24. menos propen- problemas de validez interna de una investigación. también apropiado para prevenir que se conozca de antemano la llamada validez externa o generalización. Sesgos en los ensayos clínicos participantes en los grupos de comparación. por el contrario. La manera diferencias observadas en la validez de los estudios in. para lo que debería instaurarse un programa de asigna- tos del tratamiento erradicador de H. está. una revisión quizá pueda estar influido por las personas que lo llevan a cabo. que se reserva para las me- dos. de la intervención objeto de estudio. Así. los estudios más rigurosos puede ocultar este problema. pylori sobre los sín. alguien ubicado en una oficina cen- clínicos quizá examinen diferentes tipos de pacientes (con tral del ensayo). y la in- cluidos podrían ayudarnos a explicar la variabilidad de formación incompleta sobre cómo se tratan las pérdidas sus resultados. En los estu. tan a continuación: Una de las más empleadas es la escala de calidad propuesta 37 Gastroenterol Hepatol 2004. los ensayos reclutamiento (p. si es cierta la menor de resultado. allocation concealment). aparte. que no debe confun- revisiones Cochrane incluyen ensayos clínicos aleatoriza. vención ya ha sido asignada.25. lógicamente. desconocer el tratamiento que corresponde a la próxima sultados depende de la validez de los estudios incluidos y asignación. plícitos para valorar la validez. varios criterios ex- los resultados obtenidos. – Sesgo de realización. nes para evitar la manipulación del proceso de asignación miento variables (desde unos pocos meses hasta más de por las personas que participan en el reclutamiento. es recomendable resumirlos dos en una población son aplicables a otra16. Estos aspectos afectarían a la interpretación aun. se plantea si los resultados obtenidos son ciertos en hacen. – Sesgo de desgaste o pérdida. ción aleatoria implantado por alguien no implicado en el tomas de la dispepsia funcional. ET AL. es decir. incidencia de hemorragia digestiva por varices esofági- cas en los pacientes cirróticos que reciben profilaxis con Evaluación de la validez y calidad de los estudios bloqueadores beta. La aplicabilidad. de tipo dis. resuma 20 ensayos clínicos válidos que evalúan los efec.

ejemplo. Aunque la búsqueda y el proceso de selección deberían La razón fundamental para realizar las revisiones de for- haber descartado la mayoría de estudios no elegibles. además. diferentes subgrupos de pacientes o pueden señalar medi- gamiento de los participantes. fueron finalmente excluidos. en último término. en los análisis de Cómo medir el resultado de los estudios puede ser una de sensibilidad y como pesos en el análisis estadístico de los las secciones más difíciles de diseñar del formulario de ex- resultados de los estudios. a fin de determinar si los también podría compararse el porcentaje de pacientes con resultados globales coinciden con los que se obtienen síntomas dispépticos de una determinada gravedad antes y cuando sólo se incluyen en el análisis los estudios con ries. o diante un análisis de sensibilidad. y el beneficio. Este enfoque puede utilizarse me. En parte. pueden incluir medidas de resultado para dios que previenen el sesgo de realización mediante el ce.). que han informado los investigadores de los estudios pri. masiada atención a la línea estadística inferior o al rom- Algunas de las características de los métodos de los estu. tencia o corticodependencia). pylori puede ser también relevante. cruzados). A veces. proveedores y evaluadores de llegar al rombo-diamante. su mejoría: los síntomas podrían considerarse una variable el cual preferiblemente debe especificarse a priori en el cuantitativa. después del tratamiento. de manera que los estudios más válidos mente la ausencia de síntomas dispépticos al final del estu- tengan más influencia en la medida resumen de efecto (no dio. en una revisión Los criterios diagnósticos utilizados para definir el pro- blema de salud de interés pueden ser una fuente impor. bo-diamante situado al final del gráfico que resume los dios que pueden ser relevantes incluyen la duración del resultados de estudios individuales en un metaanálisis. no existe una base empírica para determinar qué los síntomas tras haber administrado tratamiento erradica- peso debe asignarse a los distintos criterios de validez. fenotipo (inflamatorio o fistulizante) y cómo se definió la lidez en una revisión: como un umbral para la inclusión refractariedad al tratamiento convencional (corticorresis- de estudios. el ocasiones. tras un examen con estas técnicas.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 138 GISBERT JP. Por ejemplo. Cuarto paso: proceso de extracción de datos El formulario de recogida de datos es un puente entre lo Quinto paso: análisis y presentación de resultados. Metaanálisis marios y lo que. Existe también el riesgo de prestar de- más minucioso. pero el papel del análisis estadístico en las revisiones pue- mento del resumen o de la recogida de datos. el uso de la estadística visiones Cochrane incluyen una tabla de estudios exclui. el doble ciego y la cológica con infliximab en la enfermedad de Crohn es descripción de las pérdidas durante el seguimiento. reflexión y de las consideraciones hechas en los pasos an- miento. conveniente comprobar la elegibilidad de éstos en el mo. calidad de vida. En estudio. Se pueden utilizar gráficos visuales de los resulta. un descenso determinado en el protocolo de la revisión. pylori sobre la dispepsia funcional es un tema cluidos. más un obs- dos en el caso de aquellos que inicialmente parecían táculo que una ayuda para los que no están familiarizados reunir los criterios de inclusión pero que. el apartado de métodos del formu- lario de recogida de datos debe incluir los criterios de va- Justificación para realizar un metaanálisis lidez utilizados (véase el apartado anterior). pueden presentar la Por ejemplo. para medidas de resultado muy subjetivas. por último. el tipo de ensayo (diseños paralelos. Un acuerdo entre los diversos estudios realizados sobre cómo segundo enfoque consiste en analizar subgrupos de estu. y quizá lo sea. la valoración del efecto del tratamiento erradica- plicar las diferencias entre los resultados de los estudios in. valor medio de todos los pacientes tras el tratamiento. dor de H. en la que se puntúan por separado 3 com. cias en los resultados entre los estudios. ello se debe a la falta de dos ordenando los estudios según su grado de validez. con las prisas de cegamiento (de pacientes. ¿CÓMO REALIZAR. misma medida de resultado usando diferentes escalas de como la dispepsia. de confusión. morbili- estudios que no cumplen uno o varios criterios de validez. el número de pérdidas y de cambios de trata. de estar menos claro.27(3):129-49 38 . etc. pues algún lo que este último enfoque es de dudosa utilidad). dad. das de resultado en diferentes momentos del tiempo. estudio ha señalado que existe una cierta latencia desde que desaparece la infección hasta que se comprueba la me- joría sintomática (en caso de que esto realmente ocurra). En algunas revisiones. muy controvertido27. (metaanálisis) puede parecer. otra opción más sim- go de sesgo bajo. detalle. Por otra parte. podría decidirse incluir sólo los estu. También es posible ponderar los estudios plista consiste en definir como éxito terapéutico sencilla- según la validez. en una revisión sobre terapia farma- ponentes esenciales: la aleatorización. posteriormente. Por Hay diversos métodos para explorar si la validez puede ex. las cointervenciones y otros factores potenciales teriores al análisis o en el análisis mismo. Así. se justifica la exclusión de los cluir más de una medida de resultado (mortalidad. como una posible explicación de las diferen. se pueden usar 138 Gastroenterol Hepatol 2004. ET AL. es ma sistemática es asegurar la validez de los resultados. descuidan la importancia de la resultados). importante conocer cómo se estableció en cada estudio el Hay distintas formas de utilizar las evaluaciones de la va. informa un revisor. se deben cuantificar los síntomas dispépticos y por lo tanto dios situados por encima del punto de corte metodológico. por dor de H. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? por Jadad et al26. Para preparar una revisión se deben obtener datos de los tante de variabilidad clínica y deberían describirse con estudios individuales y. Los informes de los estudios suelen in- riesgo de sesgo es elevado. los revisores y los lectores. cuantificación. el momento preciso en que se evalúan obstante. Además. si el tracción de datos. las re.

Cuando los resultados entre estudios son divergentes o 3. fármaco tiene efecto beneficioso o no). Así. Resumir los resultados de la bibliografía recogida y ha. den un mayor peso a los más grandes. Así. el uso de métodos estadísticos –metaanálisis– no ta clínico–. 1. los metaanálisis valoran los estudios de acuer. ET AL. con probabilidad. En estos casos el metaanálisis (esto es. bien porque el estudio que se tendría que lle- garantiza que los resultados de una revisión sean válidos. Por otro lado. Resolver la incertidumbre (p. dos: el efecto beneficioso es estadísticamente significati- cer de ella una valoración cualitativa y cuantitativa. po. ciertas situaciones concretas en las que 1. puede contribuir a explicar el porqué de las discrepancias 4. Cuando existen muchos estudios no concluyentes sobre los resultados globales representan un promedio pondera. 1. de modo que conce. des para reducir la mortalidad perinatal en los recién naci- análisis se encuentran los siguientes4: dos de mujeres con riesgo de parto prematuro. Además. magnitud de la eficacia de una intervención sanitaria. además. 1). entre otras cosas. y no se dispone de tiempo suficiente para realizar nuevos tivo a la luz de la importancia clínica y como negativo estudios. rable es pequeño –aunque relevante desde el punto de vis- puesto. a un error beta consecuencia de la escasa potencia es- Fig. pues. lo que es especialmente tadísticos pueden utilizarse de modo inapropiado. bien porque el efecto espe- do de los resultados de los estudios individuales8. mediante un metaanálisis que incluye 7 ensayos clínicos aleatoriza- 1. en el que se confiere el mismo valor a los estudios de pequeño y gran tamaño es poco fiable y debe evitarse. los métodos es. por este motivo. este procedimiento es generalmente más rápido y me- do. Mejorar la precisión del estimador del efecto testado incluso contradictorios. a pesar de que sólo 2 de los estudios mostraban un 2. Sin eficiente. un efecto importante que no sea esta. si un determinado claro efecto a favor de los corticoides2. Orientar futuros trabajos de investigación (generar hi- de un metaanálisis pótesis). estudios individuales (resolver discrepancias). en particular al conside- rar negativos los estudios con resultados que no son estadísticamente significativos (debido. vo. 4. que ilustra la capacidad de los corticoi- Entre los propósitos generales comunes a cualquier meta. con su tamaño. Esta especie de «recuento de votos». ventajoso en condiciones de baja prevalencia o cuando se evalúan efectos de pequeña magnitud2. y además porque no tiene en cuenta el peso relativo de la evidencia fiable proporcionada por cada estudio8. var a cabo para obtener una respuesta definitiva es como ocurre también en un estudio primario. Si se usan apropiadamente. ej. dístico de los estudios originales. les no habían planteado o no podían responder por no te- ner suficiente poder estadístico (análisis de subgrupos). Cuando se desea establecer con cierta precisión la 5. terapéuticas) dísticamente significativo podría interpretarse como posi. ¿CÓMO REALIZAR. dichos métodos proporcionan una herramienta potente para llegar a unas conclusiones que tengan sentido y ayudan a evitar errores de interpreta- ción. Un bonito ejem- plo es el representado por el logotipo de la Colaboración Objetivos de los metaanálisis Cochrane (fig. los metaanálisis aumentan el poder esta- cualquier herramienta. los efectos de un tratamiento. Al «contar los vo- tos» también se tiende a pasar por alto los efectos peque- ños pero clínicamente relevantes. La revisión sistemática es un técnica científica desde la perspectiva de la significación estadística8. Contraindicaciones para la realización 6.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 139 GISBERT JP. un investigador puede interpretar un estudio como positivo mientras que otro lo considera ne- gativo. Para decidir la aprobación o rechazo de un nuevo fár- estaría específicamente indicado realizar un metaanálisis4: maco (en las fases iniciales del desarrollo de un fármaco 39 Gastroenterol Hepatol 2004. aunque es laboriosa y ocupa mucho tiem- embargo. porque un estudio puede considerarse positivo o negativo dependiendo de cómo interpreten los resultados los revisores. hay también una serie de situaciones en las que no debería llevarse a cabo un metaanálisis4: Indicaciones para la realización de un metaanálisis Existen. Logotipo de la Colaboración Cochrane. como irrealizable. Cuando en una revisión no se usan métodos estadís- ticos. 2.. nos costoso que embarcarse en un nuevo estudio2. aumentar el poder estadístico).27(3):129-49 139 . Responder preguntas nuevas que los estudios origina.. Por su. es fácil cometer el error de comparar el número de estudios «positivos» con el número de estudios «negati- vos». tadística). matemática o no. Comparar y contrastar los resultados divergentes de los entre estudios. 3. Cuando hay que tomar decisiones (p. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? métodos estadísticos para analizar y resumir estos datos. por ejemplo. ej.

da estimación global del efecto10. La medida de resultado evaluada es la persistencia o la recidiva hemorrágica. OR: odds ratio. Gene.19) Cardi. pero esto raramente se hace. En tal en estadísticamente significativo combinando muchos es. la combinación resulta relativamente sencilla y cada tudios irrelevantes que muestran efectos insignificantes.0 1.09) Labenz. Se suele representar el valor medio de cada estudio cuantitativa o metaanálisis ocurre cuando al menos una mediante un símbolo (cuadrado o rombo) cuya área es medida de resultados procedente de como mínimo 2 estu. 1998 2/50 12/50 14. con los demás participantes en el mismo estudio. Para intentar convertir un efecto clínicamente pequeño camente significativas o clínicamente relevantes.1 0. Se observa cómo en la mayoría de los ca- calidad metodológica.4 0.04-3. 1997 4/26 5/13 7.59) Test de heterogeneidad χ2 = 17. el nombre del au- Un objetivo de la mayoría de los metaanálisis es propor.47 (0. 1990 3/19 17/20 17. lo que permitirá obtener una sóli- conoce con precisión el efecto de una intervención sanita. estudio se resume usando una medida de efecto (riesgo 4.. Así.5 0.1 0. IBP: inhibi- dores de la bomba de protones. neas horizontales). el más habitual de los cuales es el denominado forest plot o gráfico de efectos. IC: intervalo de confianza. la hemorragia digestiva por úlcera péptica.06-1.8 0. hallazgos de un grupo de estudios tiene sentido si las di- bre aspectos en los que existe una certeza casi absoluta).056 Test de efecto global z = 4.03-0. la situación ideal mienta más apropiada para valorar la eficacia terapéu.0 0. 1997 1/21 7/24 7. ej.00001 0.17-1. del grupo de intervención y de control.63 (0. etc.97 df = 10 p = 0.42 (0. cada estudio. tor o la fecha de publicación).27(3):129-49 40 .24-10.80) Ortí. Para la presentación de los resultados se suelen emplear gráficos. ¿CÓMO REALIZAR.22-1. es decir.59 (0.40 (0. También es posible dar más o menos dida de resultado evaluada la persistencia o la recidiva peso a los estudios basándose en otros factores como su hemorrágica28.27-0. para un resultado llamado «efecto sumatorio global» (overall así resaltar de algún modo los estudios más precisos10. ferencias observadas entre sus resultados no son estadísti- 3. 1997 3/20 2/20 2.13 (0.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 140 GISBERT JP. de protones con los antagonistas H2 en el tratamiento de provenientes de estudios más amplios y con más sucesos. es aquella en la que se cuenta con bastantes estudios de tica).01-1.52 p = 0.58) Pérez Flores.8 0.12 (0.63) Michel.29 (0. la síntesis lisis. 1995 6/28 9/23 9. en el que se ordenan en Resumen de los efectos de los estudios en un metaanálisis vertical. según un cierto criterio (p. sos el cuadrado que representa el efecto resumen de cada 140 Gastroenterol Hepatol 2004. De este modo.6 0.1 1.1 1 10 100 Favorece IBP Favorece antagonistas H2 Fig. siendo la me- se les da más peso. los blicaciones (aunque esta situación pueda parecer absurda. En la figura 2 se puede observar el gráfico de efectos de ralmente. ET AL.62) Uribarrena.08-2. 1994 1/38 3/43 2. Se trata de un metaanálisis que compara los inhibidores de la bomba de protones con los antagonistas H2 en el tra- tamiento de la hemorragia digestiva por úlcera péptica. 1994 5/131 11/151 12. sus intervalos de confianza del 95% (líneas horizontales) y la odds ratio global (diamante). con el único objetivo de aumentar el número de pu. basada en una media ponderada de los resulta.11 (0.) que representa la comparación ginal. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? Comparación: 01 IBP versus antagonistas H2 (todos juntos) Método de resultado: 02 hemografía persistente o recidivante IBP Antagonistas H2 OR Peso OR Estudio n/N n/N (IC del 95%) % (IC del 95%) Brunner. Para el cálculo de un efecto global. 1994 8/38 11/37 11.5 0. muy homogéneos tanto en su diseño 2. 2. H2 antagonistas: antagonistas H2 de la histamina.01-0. La combinación de los ria (es obvio que no tiene sentido efectuar metaanálisis so. los resultados obtenidos en cionar una estimación fiable de los efectos de una inter. con su intervalo de confianza del 95% (lí- vención.03 (0. a cada estudio se le asigna como peso el inverso un metaanálisis que compara los inhibidores de la bomba de su variancia.45) Lin.36) Lin. summary effect en la terminología anglosajona)3. 1995 2/267 4/252 5. a las estimaciones más precisas. caso. En situaciones en las que existe suficiente evidencia y se como en sus resultados.49) Villanueva. así como el efecto global del metaaná- dos de todos los estudios relevantes. relativo.36 (0. proporcional al peso con el que interviene en el cálculo dios diferentes se combina estadísticamente para obtener global (inversamente proporcional a la variancia).51 (0. odds ratio. Para suplir la necesidad de llevar a cabo un estudio ori.12-1. Gráfico de efectos en el que se representa la odds ratio de cada estudio (cuadrado). 1995 11/43 9/38 9.1 0. participantes en cada estudio se comparan únicamente no es excepcional encontrar en la bibliografía metaanáli. los ensayos clínicos aleatorizados constituyen la herra.70) Lanas. pequeño tamaño.01 0.40-3. sis sin preguntas de interés científico o sanitario).05) Total (IC del 95%) 46/681 90/671 100.

ET AL. tratamiento erradicador a los 49 pacientes restantes que tervalo de confianza del 95% (representado por los extre. Por el contrario.59) y. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? estudio se encuentra situado a la izquierda de la línea me. pues la elección de ésta depende del tipo de datos las relativas porque reflejan el riesgo basal y el cambio de analizados. la interpretación es más directa e efecto preventivo (sobre la persistencia o recidiva hemo. para estimar el efecto global y habrá que utili- aproximación del riesgo relativo sólo es válida para tasas zar una medida relativa. por lo estimados por cada estudio es de naturaleza meramente que su uso a partir de los resultados globales de un metaa- mecánica4. correcto emplear una medida. con mayor signifi. pacientes que reciben tratamiento erradicador de H. que siempre que sea posible deberían describirse los re- El «número necesario a tratar» (NNT). mientras que para sucesos frecuentes el primer riesgo relativo10. que deberá sopesarse con los odds ratio global de 0. aunque exista una tenden. conviene recordar que el ejecución de un metaanálisis. lo que indica que. (en comparación con el tratamiento antisecretor) a tan dia (la cual señala una odds ratio igual a la unidad.4 (representada por el rombo-dia. riesgo relativo y diferen. Los metaanálisis utilizan diversas técnicas es. si expresamos la magnitud de dicho efecto protector Las pruebas de homogeneidad son análisis estadísticos diciendo que el NNT correspondiente es de 5. no es sumen disponibles: odds ratio.27 a 0. Por último. Como resumen. en un reciente metaanálisis que compara la inciden. nos proporciona una esti. que aglutina los estudio responsable de heterogeneidad en los resultados27. ej. sólo 5 pacientes para conseguir prevenir un episodio de cir. miento erradicador de H. las diferencias no alcanzan significación esta. Sin embar. mos izquierdo y derecho de dicho rombo-diamente) que Cuando se presentan medidas absolutas –como el NNT– no incluye a la unidad (de 0. la parte más sencilla en la ne un valor similar.30. indica un mayor recidiva hemorrágica. como la reducción absoluta cia de riesgo. lamentablemente. No obstante. en compa- ración con el placebo o el tratamiento control. rrágica) de los inhibidores de la bomba de protones. por tanto. Si los intervalos de valo de confianza del 95% que no incluye la unidad)29. podríamos recomendar estadístico no es una buena aproximación del segundo10. e incluso de 50 cuando se excluye un aquí donde la potencia del metaanálisis. como puede ser la odds ratio o el pequeñas. la ausencia de efecto) y. duce un efecto terapéutico importante. ¿CÓMO REALIZAR. no hay una única co. es útil dar la información para un intervalo de riesgos ba- te. grupo control no es similar en todos los estudios. Por ejem. que evidentemente indica un efecto protector dos típicamente mediante líneas horizontales) no se su- del tratamiento erradicador sobre la recidiva hemorrágica. de expresar de nuevo los resultados: nos dice cuántos pacientes es necesario tratar con el nuevo Evaluación de la heterogeneidad tratamiento para producir un evento de interés. tadísticas pero. posibles perjuicios que podría causar la administración de mante situado en la parte inferior de la figura) con un in.27(3):129-49 141 . Por otra parte. Es importante preguntarse si los resultados de los estu- ri frente a los tratados únicamente con antisecretores (sin dios son similares dentro de cada comparación. si la tasa en el rios pros y contras en cada uno de los estadísticos de re. cación clínica. quizá. En la actualidad constituye una de las motivaciones fun- plo. go. pylori sobre la mejoría de los cia a un mayor efecto con los inhibidores de la bomba de síntomas de la dispepsia funcional demuestra que el NNT protones. sales (p. para el intervalo observado en los estudios incluidos). lo que indi. la combinación estadística de los valores en particular a la heterogeneidad entre los estudios. nera de responder a esta pregunta es examinar una pre- nimiento).. es una forma útil e intuitiva. parece evidente que un valor de 5 tra- en todos menos en 2 de los estudios la línea horizontal. cruza la un reciente metaanálisis que evalúa el efecto del trata- línea media. es de. en esta misma figura se puede comprobar cómo como alto o bajo. riesgo rela- nerse fácilmente a partir de la diferencia de riesgos (es su tivo o reducción del riesgo relativo) y también mediante inversa). por consiguien. damentales para realizar un metaanálisis. pylo. que representa el intervalo de confianza del 95%. La interpretación de la odds ratio como de riesgo. Es obvio que esta última cifra (uno entre 50) supone un mación más precisa sobre el efecto del tratamiento: una beneficio más que dudoso. nálisis debe ser siempre juicioso3. riesgo con la intervención. sentación gráfica de los resultados. Sin Aunque no existe regla alguna para clasificar un NNT embargo. Las medidas absolutas pueden ser más informativas que rrecta.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 141 GISBERT JP. esto indica que es probable que las diferencias no es fácil de «trasladar» a la práctica clínica. perponen. NNT es sumamente sensible a los sesgos de todo tipo y guido con rigor. resultados de todos los estudios. entre los estudios sean estadísticamente significativas. un estimador absoluto (NNT o diferencia de riesgos)4. sultados con una medida relativa (odds ratio. Y es placebo) es de 25. Una ma- recibir posteriormente tratamiento antisecretor de mante. con terapia erradicadora para conseguir la mejoría sinto- dística en la mayoría de los estudios individuales (proba. se calcula una odds ratio de 0. confianza para los resultados de cada estudio (representa- Esta cifra. los NNT son específicos de un período de seguimiento y solamente deben calcularse Métodos estadísticos de los metaanálisis cuando se combinan ensayos en los que esta variable tie- El análisis estadístico es.18 (con un inter. no se beneficiarán de él. Si los otros pasos se han se. Para datos dicotómicos (o binarios) hay va. mática de uno de estos pacientes (en comparación con el blemente por el reducido tamaño muestral de éstos). que puede obte. formales para examinar si la variación observada en los ca que es necesario administrar tratamiento erradicador resultados de los estudios es compatible con la variación 41 Gastroenterol Hepatol 2004. indica un efecto estadísticamente significativo. intuitiva. incluso mayor cia de recidiva hemorrágica por úlcera péptica en los que el mero cálculo de una estimación del efecto global10.

91) Gisbert 2001 9/15 16/33 3.65-1. esperada únicamente por azar.1 1 5 10 Mejor tratamiento control Mejor tratamiento erradicador Tratamiento. pylori cionales al no objetivarse durante la gastroscopia una en la dispepsia funcional27. 1998 33/154 11/154 9.85-1.86 (0.65-1. ET AL.8 3.25-4. 1998 40/45 32/36 3.99) Talley 1999 (USA) 69/150 71/143 21.01 0. De hecho. pylori podría estar tratando únicamente da no ser significativa8. erradicadora evidenciado en los ensayos clínicos positi- Por lo tanto.59-1.20 (0.0 1. panel inferior: resultados homogéneos tras la exclusión de dicho estu- dio.99) Talley. la pesar de que la prueba estadística de heterogeneidad pue.1.10 (0.87-2.51) Passos 1998 40/45 32/36 2. por lo que es explicarse.43 df = 8 p = 0. Además.5 1.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 142 GISBERT JP. Cuanto más significativos (McColl.27(3):129-49 42 .82 (0. úlcera gastroduodenal activa.7 0. la p del test de hetero- ño). panel superior).1 en lugar de úlcera gastroduodenal en las distintas áreas geográfi- del habitual 0.55-1.51) McColl. La elevada incidencia de úl- presentación gráfica nos indica que uno de los estudios cera gastroduodenal en Escocia.9 0.67-1.67-1. 3.50) Koelz 1998 55/89 61/92 12.72-7.58) Test de heterogeneidad χ2 = 13. al reducido subgrupo de pacientes con úlcera péptica a los En el ejemplo del metaanálisis anteriormente menciona.0 0.45-1.06 (0. más probable es que las diferencias observadas no geneidad. no diagnosticada.91) Gisbert.13 (0.0 1. a te respuesta a la erradicación de H. 1988) ofrece resultados claramente discordantes sean los resultados de la prueba (valor de p más peque.03) Talley 1999 (ORCHID) 32/133 31/142 14.13 (0.45 (0.2 0.31) Test de heterogeneidad χ2 = 3. Panel superior: presencia de hete- rogeneidad.8 1.1 Test de efecto global z = 1.0 1.05.86 (0. terapia frente a H. las diferencias clínicamente importantes en.45-1.6 0. Tratamiento erradicador control OR Peso OR Estudio n/N n/N (IC del 95%) (%) (IC del 95%) Tratamiento Blum 1998 45/164 34/164 control 17. al menos en parte. Por tanto.01 0.82 (0. 2000 80/129 74/124 14.41) Bruley. con un valor de 0.59-1.46-5. por la diferente prevalencia habitual situar el punto de corte para la p10 en 0.4 1. las pruebas tramos en el límite estadístico que la define. 1999 (USA) 69/150 71/143 16.1 1. 2001 47/74 45/70 10. 1999 (ORCHID) 32/133 31/142 13.7 1.87-2. una prueba no significativa no cas. vos sea debido al tratamiento de la enfermedad ulcerosa tre los resultados de los estudios siguen imponiendo pre. Los resulta- estadísticas que valoran la presencia de heterogeneidad dos contradictorios entre varios estudios podrían suelen tener una baja potencia estadística.31) Passos.55 (1.46-5. Así.55-1.59 (0.6 1. Metaanálisis de la eficacia del tratamiento erradicador de Helicobacter pylori en la dispepsia funcional27.4 1.9 1.51 p = 0. confirma que nos encon- sean debidas únicamente al azar.2 0.00 (0. IC: intervalo de confianza.5 0. Tratamiento erradicador control OR Peso OR Estudio n/N n/N (IC del 95%) (%) (IC del 95%) Blum.91-1.83) Froehlich. que se ha clasificado erróneamente como dispépticos fun- do sobre el efecto del tratamiento erradicador de H.10 (0. 1998 55/89 61/92 12. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? Tratamiento. pylori. como es sabido.50) Koelz. 3.31 df = 8 p = 0.45 (0. OR: odds ratio. (fig. donde se llevó a cabo el 142 Gastroenterol Hepatol 2004.59 (0.84 Test de efecto global z = 0.25-4.1 1 5 10 Mejor tratamiento control Mejor tratamiento erradicador Fig. En general.03) Talley.83) Froehlich 2001 47/74 45/70 10. es posible que el efecto favorable de la terapia descarta necesariamente la existencia de heterogeneidad.41) Bruley 2000 80/129 74/124 n/N 18. que. debida a los resultados discordantes del estudio de McColl et al.37) Total IC del 95% 410/953 375/958 100.26 p = 0.37) Total IC del 95% 377/799 364/804 100. tiene una excelen- caución en la interpretación de los hallazgos globales.00 (0.3 1.97 (0. 2001 9/15 16/33 4.4 0. ¿CÓMO REALIZAR. 1998 45/164 34/164 14. la mera observación de la re.97 (0.

la confianza que Análisis de subgrupos tendremos en éstos queda fortalecida. Es más probable que las decisiones acerca de qué terpretación de los resultados combinados. Las preguntas incluidas en la tabla IV pueden utili. Se debe tener siempre presente que loso al examinar y plantear conclusiones acerca de la los tests estadísticos no pueden compensar la falta de sen. si A menudo resulta interesante examinar una categoría par. existen 6 áreas temáticas generales im- plantea si es plausible esperar que haya una diferencia ba. Es preciso re- calcar aquí que el término «subgrupos» se refiere a las Presentación de los resultados del metaanálisis agrupaciones particulares de pacientes entre los estudios. diferencias en los fármacos. ej. situación en la que el valor de la p diferencia en algún subgrupo en particular? 2. Se debe ser extremadamente caute- estudios individuales.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 143 GISBERT JP. Idealmente. no es deseable) y se que. los revisores deben preguntarse cuán sensi- portante recalcar que un adecuado análisis de los factores bles son los resultados del análisis a los cambios en el que pueden ser responsables de la heterogeneidad entre modo en que éste fue realizado. combinación adecuada de di- ría emplearse el análisis de subgrupos. que les fue impo. un siones diferentes. Incluso podrí.84 (fig. los criterios para la se- 43 Gastroenterol Hepatol 2004. De este modo. surgen después de éste? nel inferior). 3. basándose en diferencias en los resultados entre los estu- gica. es más proba- tud que es preferible no combinar los resultados de los ble que sean espurias. la perspicacia clínica y la plausibilidad bioló.. Si los análisis de sensibilidad que se efectúan no cambian sustancialmente los resultados. Por el contrario. ción debe ser cautelosa. revisores pueden comentar. los revisores deben alertar a los lectores de su revisión y recomendar cautela en la in. ¿Hay evidencia indirecta que apoye la existencia de una dio de McColl et al. debe recordarse que no se aleatorizó a los contraron no ofrecían datos combinables. TABLA IV. análisis estadístico. análisis realizar estén reorientadas por los datos cuando an llegar a decidir que la heterogeneidad es de tal magni. ¿CÓMO REALIZAR. que Según este grupo. pues puede haber muchos factores que lo justifiquen de datos no es posible (o mejor. existen revisiones en que la síntesis dios. rizados: diseño del estudio.32. se les aleatorizó a recibir uno u otro trata- geneidad y tratar de explicarla. Con frecuencia se abusa de Con el ánimo de mejorar y homogeneizar la calidad de la los análisis de subgrupos. los resultados cambian de manera que conducen a conclu- ticular de participantes en una revisión (como mujeres. en los es- dan en honrosas revisiones sistemáticas cualitativas3. pues cuanto más grande sea puesta incluye una lista (fig. en consecuencia. por lo que los revisores deberán presentación de los resultados de los metaanálisis. Precisamente.27(3):129-49 143 . 1. azar. Esta pro- número de estos análisis. 3. sistemática. específico o gravedad de la enfermedad). publicado recientemente un documento donde se destaca- zarse para ayudar a decidir si se lleva o no a cabo este ban los puntos que deberían exigirse ineludiblemente31. Los quemas de tratamiento específicos que se han utilizado. los revisores deben intentar reducir al mínimo el lisis de sensibilidad y problemas de aplicabilidad. miento. (p. ¿La diferencia se insinúa a partir de comparaciones dentro de los estudios y no entre los estudios? Como se ha comentado antes. aná- posible. En resumen. 4. existencia de diferencias en la respuesta de los subgrupos tido común. sino que. control del sesgo. dentro del protocolo inicial de la revisión. puesto que estos análisis se hacen habitualmente a posteriori. En este caso. apoyaría esta posi. 4) que «obliga» a los autores el número de hipótesis a evaluar mayor será el número de del metaanálisis a ofrecer a los lectores información explí- las diferencias que podrán encontrarse simplemente por cita sobre la estrategia de búsqueda. los factores que podrían conducir a diferencias entre los Dado que hay varios enfoques para realizar una revisión resultados de estudios individuales. Por último. mismo estudio. De entre ellas destaca la primera. con las asunciones clave surgidas en el proceso de reali- zarla. en ese caso. ¿La magnitud de la diferencia es clínicamente relevante? rencias observadas en los resultados de los estudios in. ET AL. Incluso si la revisión incluye únicamente ensayos sible combinar los resultados porque los estudios que en. portantes para la realización y presentación de los resulta- sándose en lo que se conoce acerca de la intervención y dos de cualquier metaanálisis de ensayos clínicos aleato- del problema. no a subgrupos de estudios3. es im. aleatorizados. Preguntas que ayudan a decidir si debe o no hacerse un análisis de subgrupos bilidad. dentro de un revisores deben intentar explorar las causas de la hetero. la heterogeneidad encontrada al principio en el metaanálisis desaparecía al excluir el estu. ¿La diferencia es estadísticamente significativa? dividuales podrían estar causadas por otros factores dis- tintos del azar. se planean a posteriori y.). ya que si no es así probablemente no debe. resultados de la revisión en relación con las decisiones y sultados contradictorios entre los diversos estudios10. pero cualquier interpreta. deben especifi- Análisis de sensibilidad carse a priori. Esto proporciona a los re- los estudios es de mayor importancia que la idea simplista visores un mecanismo para probar cuán robustos son los de buscar una medida de efecto global cuando existen re. ¿Las hipótesis acerca de la diferencia preceden al análisis y no del test de heterogeneidad ascendía hasta 0. la existencia de heteroge. 6. 5. los pacientes a un estudio o a otro. QUOROM (Quality Of Reporting Of Meta-analysis) ha las. el grupo ser cuidadosos al efectuarlas y los lectores al interpretar. En la medida de lo versos estudios. etc. pa. en las dosis. se deberá ser más cauteloso en la inter- grupo de edad en particular o los sujetos con un subtipo pretación de los datos y al plantear las conclusiones. ¿La diferencia es consistente a lo largo de los estudios? neidad estadísticamente significativa indica que las dife. tipo de análisis. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? único estudio con resultados positivos.

una relación) y otras fuentes de información Métodos de revisión Los criterios de selección (es decir. actualmente se los diversos estudios y la síntesis cuantitativa de los datos. sobre todo cuando se ha Interpretaciones erróneas y limitaciones limitado a un ingenuo cálculo del efecto global. análisis de datos y características del estudio.e. la intervención. ECC: ensayos clínicos controla- dos. los funda- mentos biológicos de la intervención y los fundamentos de la revisión Métodos Búsqueda Las fuentes de información. resultado y diseño del estudio). Por otra parte. idioma de la publicación30. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? Categoría Subcategoría Ítem ¿Incluido en N. Propuesta QUOROM de la calidad y sus hallazgos33-36) (Quality Of Reporting Of Meta-analy- sis)32. La aparente precisión con la que se efec- rizados33. y síntesis de datos cuantitativos suficientemente detallada para permitir la repetición Resultados Caraterísticas de los ECC incluidos y excluidos: hallagos cualitativos y cuanti- tativos (estimaciones puntuales e interva- los de confianza). las discrepancias entre estudios. sis de sensibilidad de los resultados10. los resultados principales y el diseño del estudio32) Fig.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 144 GISBERT JP. población. que resultados contradictorios se combinen en una única lisis y los hallazgos encontrados en macroensayos aleato. ET AL.34 han llevado a un planteamiento mucho más túa el cálculo de una estimación global en un metaanálisis crítico del papel del metaanálisis10. pero más grande»20. lección de estudios. y análisis de subgrupo Conclusión Resultados principales Describir Introducción El problema clínico concreto. Así. el metaanálisis es un por los que estos últimos lo fueron. en todo caso. 4.e. las características de sión ordinaria. dado que de los metaanálisis los métodos estadísticos no pueden «corregir» o «ajustar» Después de un notable entusiasmo inicial. en la influencia de flujo (fig. ficheros personales. medida global10. las discrepan. como si fuera. lo que en ocasiones puede llegar a ser 144 Gastroenterol Hepatol 2004. por tanto.31) Selección Los criterios de inclusión y exclusión (relativos a la población.° informe? (S/N) páginas Título Identificar el trabajo como un metaanálisis [o revisión sistemática] de ECC26 Resumen Utilizar un formato estructurado27 Describir Objetivos La cuestión clínica explícitamente Fuentes de datos Las bases de datos (es decir. Desde sus orígenes el metaanálisis ha sido y sigue siendo una técnica controvertida. la evaluación de la validez de éstos. «una revi- modo en que se extrajeron los datos. de la validez condiciones encubiertas. expertos. 5) en el que los autores deberán aportar informa. estudio observacional. bases de datos. intervención. con las limitaciones que ello com- porta10. No se debe caer en el puede disuadir de la realización de estudios posteriores error de considerar el metaanálisis una mera combinación sobre ese asunto. situación de publicación29. valoración de un metaanálisis. Lista (checklist) para evaluar la correcta presentación de los resultados Evaluación Criterios y proceso utilizados (p. búsqueda manual) y cualquier restricción (años considerados.27(3):129-49 44 . las características de los pacientes incluidos y en el análi- ción detallada sobre el número de ensayos clínicos aleatori. y mucho menos lograr cias entre las conclusiones extraídas de algunos metaaná. y los motivos se debe olvidar que. con detalle28 (p. registros. incluidos y excluidos. agencias. ¿CÓMO REALIZAR. la propuesta QUOROM incluye un diagrama de entre estudios y sus posibles causas. los métodos de valoración de la validez. el de múltiples estudios. profundiza mucho más en el análisis de la heterogeneidad Además. no zados identificados.

ño y representa una estrategia coste-efectiva porque redu.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 145 GISBERT JP. estudios dirigidos a la profilaxis primaria (del pri- debe ser una herramienta para la generación de hipótesis mer episodio hemorrágico) y secundaria (de la recurren- más que para la toma de decisiones10. Diagrama de flujo (flow diagram) para evaluar la correcta presentación de ECC con información útil según los resultados de un metaanálisis. el metaanálisis no un error que se comete frecuentemente al realizar un me- debe sustituir a los ensayos clínicos de gran tamaño. debido a su elevada ensayos clínicos. plo. en este caso. Por ejem- tuye una guía para la práctica clínica e incluso para el di. al ignorar las diferencias fundamentales entre embargo. medir. el metaanálisis consti. 45 Gastroenterol Hepatol 2004. el metaanálisis. si se utiliza correctamente. potencia. el metaanálisis no resultados de diversos estudios en un mundo cada vez es la panacea que convierte estudios primarios metodoló. No se debe caer en el error de dores beta en la prevención de la hemorragia digestiva considerar el metaanálisis un sustituto de los grandes en. sin taanálisis. un inconveniente10. 5. el metaanálisis lisis. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? ECC identificados potencialmente relevantes y sometidos a selección para su repuración (n = …) ECC excluidos (motivos) (n = …) ECC seleccionados para una evaluación más detallada (n = …) ECC excluidos (motivos) (n = …) ECC potencialmente adecuados para su inclusión en el metaanálisis (n = …) ECC excluidos del metaanálisis (motivos) (n = …) ECC incluidos en el metaanálisis (n = …) ECC retirados a causa del resutado (motivos) (n = …) Fig. del que de- to. ce el número de estudios primarios innecesarios. para así orientar las líneas de investigación futuras. los distintos estudios y combinarlos sin más20. en el mismo metaaná- sayos clínicos de elevada calidad. Idealmente deberá cia de la hemorragia). constituye la mejor herramienta posible para combinar los Como se ha comentado previamente. más desbordado por el volumen de información que pre- gicamente deficientes en una combinación brillante de cisa ser sintetizada10. Mez. Pro- el resultado (n = …) puesta QUOROM (Quality Of Reporting Of Meta-analysis)32. Ambas poblaciones de pacientes localizar dónde se encuentran las lagunas de conocimien. Así. Sin embargo. En este sentido. pende directamente el valor de la variable que se pretende Dicho de otro modo. es también un arma de doble filo que puede lle- do en no combinar de forma indiscriminada (dando igual varnos a sacar conclusiones sesgadas a partir de estudios valor) las investigaciones de buena y mala calidad.27(3):129-49 145 . el metaanálisis es complementario. ECC: ensayos clíni- cos controlados. En resumen. imperfectos que aisladamente no habrían sido capaces de clar «manzanas y naranjas» en la misma cesta es también «confundirnos»20. por varices esofágicas. no sería apropiado evaluar el efecto de los bloquea- seño de futuros ensayos10. cirróticos tienen un riesgo de base diferente. ET AL. ¿CÓMO REALIZAR. la incidencia de hemorragia digestiva no sustituto. del ensayo clínico aleatorizado de gran tama. por varices esofágicas mezclando. cuando éstos no existen. por lo que hay que tener especial cuida.

Dicho de otro modo. como la solidez de la evidencia. el ¿Las preguntas de la revisión están bien formuladas y contienen los componentes clave? lector puede que proceda de o resida en una zona de alta in- 2. como 146 Gastroenterol Hepatol 2004. se fundamenta en una serie de estudios que la detección de errores importantes en una revisión sistemática evalúan dicha estrategia en pacientes dispépticos jóvenes (p. controlar la hemorragia digestiva por varices en los pa- una revisión sobre la estrategia test-and-treat en la dispep. un error común que se comete cuando la evi- 8. ET AL. los se ha planteado? usuarios de cualquier revisión sistemática deben decidir si 3. deben determinar ¿Se aplican los criterios de selección de manera que limiten los sesgos? si los participantes y los entornos en los estudios incluidos 4. Un ejemplo que destaca este problema vención de interés. una de las ventajas de una menos que 250 pacientes por grupo aproximadamente revisión de conjunto es que. evidencia indirecta? Finalmente. Si los resultados son consistentes a tra. beta o de tipo II. Síntesis de datos ¿Se tomaron decisiones razonables con respecto a la manera de sión sistemática y metaanálisis. si un metaanálisis ha demostrado que un de- riedad de pacientes. Por tanto. ya que es posible que ésta dependa. las decisiones prácticas a tomar. Los autores y los lectores Sexto paso: interpretación de los resultados deben ser cuidadosos para no caer en esta trampa. llevada a cabo por la Co- combinar los datos? laboración Cochrane sobre el efecto del tratamiento ¿Se han considerado en la síntesis factores importantes como el diseño de los estudios? erradicador de H. esto es. Para hacerlo. es confundir «la fal- efectos observados? ta de evidencia de efecto» con «la evidencia de que no ¿Hay interpretaciones adecuadas acerca de la evidencia que no es concluyente (sin evidencia de efecto frente a evidencia de que hay ningún efecto». se con- ¿Son sensibles los resultados a los cambios relacionados con el cluye que la erradicación del microorganismo tiene un modo en que se hizo el análisis? pequeño pero estadísticamente significativo efecto bene- ¿Se informa de la precisión de los resultados? 7. no es lo mismo no hay efecto)? decir que un estudio «no ha demostrado diferencias esta- ¿Se identifican las consideraciones que resultan importantes para dísticamente significativas» entre 2 tratamientos que afir- las personas que deben adoptar decisiones? mar que realmente «no existen diferencias» y que ambos tratamientos son equivalentes. Con respecto a la solidez de la eviden. los resultados proceden de una variedad muy di. Obtención de datos ¿Hay una mínima cantidad de datos no disponibles en los los ensayos no deben aplicarse en ciertas circunstancias. Formulación de la pregunta incidencia de cáncer gástrico es mínima. coste-efectivo. pues en este grupo de edad la 1. una eficacia menor del 70% o mayor del 90%) es de nada En relación con la aplicabilidad. clusiones que van más allá de la evidencia que se analiza. ¿CÓMO REALIZAR. Una segunda equivocación común consiste en sacar con- versa de pacientes8. cuan- la toma de decisiones. lo en una revisión sistemática y que pueden ser de ayuda en que se traduce en una escasa potencia estadística y. Sin embargo. basada en el diagnóstico y el consiguiente tratamiento tratamiento se siga necesariamente de una disminución de de la infección por H. Discusión ficioso35.27(3):129-49 46 . pylori en la dispepsia funcional. Evaluación de los estudios son razonablemente similares a su propia situación. esto no implica que dicho sia. Incluso así. mente significativas entre un tratamiento A (con una tasa ción metodológica importante de los estudios incluidos y de éxito terapéutico del 80%) y un tratamiento B (con una de los métodos usados en la revisión que pueda afectar a diferencia clínicamente significativa de un 10%.. que afecta típicamente a los estudios (y también a los metaa- Existen algunos temas que deben ser objeto de discusión nálisis) que incluyen un reducido número de pacientes. Por ejemplo. ej. se puede seguir teniendo terminado tratamiento es más eficaz que el placebo para dudas sobre la aplicabilidad de los resultados. Por ejemplo. una elevada probabilidad de cometer un error ficios esperados y los posibles daños y costes de la inter. en lugar de aplicar rígidamente los criterios de inclu- individuales? ¿Se abordan de modo sistemático los parámetros importantes que sión y de exclusión de los estudios a situaciones específicas. menores de 50 años). tamiento. los autores plantean un modelo económico que ¿Se mencionan las limitaciones de los estudios y del proceso de apunta finalmente a que este modesto beneficio es. resultados y en otras variables que se consideren clave para la Un tercer aspecto es si los beneficios compensan los ries- interpretación de los resultados? gos de la intervención. en una reciente revi- 6. donde probablemente no sea aplicable este punto ¿Las estrategias de búsqueda son adecuadas para la pregunta que de corte para la edad y sea prudente reducirlo. pueden afectar a los resultados del estudio? es mejor preguntarse si hay razones evidentes por las cuales 5. Por ejemplo. estudios. un buen punto de partida o de destino para la sección cesario para demostrar que existen diferencias estadística- de discusión de una revisión es abordar cualquier limita.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 146 GISBERT JP. cientes con cirrosis hepática. En ge- ¿Se valora de manera fiable la validez de los estudios neral. Selección de estudios ¿Se aplican criterios de inclusión y de exclusión apropiados para la evidencia que encuentran en ella es o no aplicable a sus seleccionar los estudios? circunstancias específicas. la do no se demuestran diferencias entre los 2 grupos de tra- aplicabilidad de los resultados o el balance entre los bene. Conclusiones de los revisores dencia disponible no es concluyente. tanto al describir re- ¿Se apoyan las conclusiones en el contenido de la revisión? ¿Se abordan explicaciones alternativas y verosímiles de los sultados como al sacar conclusiones. de «equivalencia» es el siguiente: el tamaño muestral ne- cia. Identificación de estudios cidencia de adenocarcinoma gástrico como Japón o Latino- ¿Se realiza una búsqueda minuciosa de datos pertinentes usando fuentes apropiadas? américa. proba- revisión? ¿Se integran los resultados de la revisión en el contexto de otra blemente. Lista de verificación (checklist) que permite gastroscopia. se aplicarán por tanto a esta amplia va. dado que incluye numerosos (500 en total) si aplicamos un contraste bilateral. vés de los estudios. pylori sin necesidad de practicar una la mortalidad. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? TABLA V.

Sí No sé No ¿era razonable hacer eso? Pista: considera si: – Los resultados de los estudios eran similares entre sí – Los resultados de todos los estudios incluidos están claramente presentados – Están discutidos los motivos de cualquier variación de los resultados e Fig. 6). Por último. o programa de habilidades en lectura crítica). sólo si la respuesta es afirmativa en ambas merece propuesta por el grupo CASP (Critical Appraisal Skills la pena continuar con la tercera pregunta. Siguiendo las «guías para usuarios de la biblio- res deben especificar exactamente qué investigación se grafía médica» publicadas en la revista JAMA (en concre- necesita y su justificación precisa. con lo que es plear una lista de verificación (checklist) como guía para probable que desechemos la mayor parte de las revisiones descubrir errores importantes. es útil em- ción» y se pueden responder rápidamente.redcaspe. considerando sistemáticamente los necesarios para poder considerar las revisiones sistemáti- 47 Gastroenterol Hepatol 2004.27(3):129-49 147 . tiene como objetivo ayudar a desarrollar habilidades para hacer una lectura crítica de A MODO DE CONCLUSIONES la evidencia científica. su validez y su relevancia ficados por el tratamiento en cuestión. Programme. 8). b) ¿cuáles son los resultados? (fig. En España existe un grupo CASP afirmaciones generales del tipo «se necesitan más estu. ¿CÓMO REALIZAR.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 147 GISBERT JP. que. La falta de rigor – Tiene un diseño apropiado CA puede afectar al resultado de los para la pregunta estudios (“No es oro todo lo que reluce” El mercader de Venecia. Preguntas propuestas por el grupo CASP (Critical Appraisal Skills Programme) para la lectura crítica de una revisión sistemática: a) ¿los re- sultados de la revisión son válidos?8. ET AL. 7). tan empleadas en las últimas líneas de muchos pueden encontrar herramientas muy útiles para estas acti- manuscritos. o mos? (fig.org) se dios…». como su nombre indica. resultados que se presentan. Acto II) SP 5 Si los resultados de los diferentes estudios han sido mezclados para obtener un resultado “combinado”. incluso para el trabajo propio. Otro formato alternativo para la evaluación crítica hasta una época muy reciente son narrativas y no sistemá- de una revisión sistemática por parte de los lectores es la ticas). existen 3 preguntas fundamentales que deben plantearse cuando se hace la lectura crítica EVALUACIÓN CRÍTICA DE UNA REVISIÓN de este tipo de artículos: a) ¿son válidos los resultados? SISTEMÁTICA (fig. to. como la propuesta en la ta- (entre otros motivos. 6. y c) ¿son aplicables en el medio particular en que nos encontra- Al plantearse llevar a cabo una revisión sistemática. En las páginas anteriores se han aportado los argumentos bliografía científica. en cuya página web (www. deberían evitarse. en realidad ocurre. porque la mayoría de las publicadas bla V. (CASPe). Las 2 primeras preguntas son «de elimina- para revisar una ya realizada por otros autores. La lectura crítica sería el proceso de evaluar e interpretar la evidencia aportada por la bi. de otros factores que no se ven modi. vidades. el artículo escrito por Oxman et al8 sobre «cómo utilizar una revisión»). En todo caso. los reviso. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? a) ¿Los resultados de la revisión son válidos? Preguntas «de eliminación» CA 1 ¿Se hizo la revisión sobre 3 ¿Crees que estaban incluidos CA un tema claramente definido? los estudios importantes Sí No sé No y relevantes? Sí No sé No Pista: un tema debe ser definido Pista: busca: en términos de: – ¿Qué bases de datos SP bibliográficas se han usado? SP – La población de estudio – ¿Seguimientos de la referencias? – La intervención realizada – ¿Contacto personal con expertos? – Los resultados (“anteriores”) – búsqueda de estudios no considerados publicados? e – ¿Búsqueda de estudios en idiomas 2 ¿Buscaron los autores el tipo distintos del inglés? e de artículos decuado? 4 ¿Crees que los autores de la Sí No sé No revisión han hecho sificiente Pista: el mejor “tipo de estudio” esfuerzo para valorar la calidad es el que: de los estudios incluidos? Sí No sé No Pista: los autores necesitan considerar – Se dirige a la pregunta objeto el rigor de los estudios que han de la revisión identificado.

Molinero LM. Asimismo. Antman EM. rane Collaboration. Oxman AD. cian 2002. Chalmers TC. y desde aquí anima- mos a cualquiera que esté interesado en colaborar con esta organización a visitar su página web (http://www. Clarke M. 11. 8. ok 4. Centro Cochrane Iberoamericano.272:1367-71.es/Castellano/CC_Handbook 148 Gastroenterol Hepatol 2004. si es apropiado) teresados en revisar críticamente la base científica que – Cómo están expresados los resultados? (NNT. El Centro Cochrane Iberoamericano es el que en España e Iberoamérica se responsabiliza de coordinar este apoyo y facilitar la información necesaria2. Ceballos C. 2001. Disponible en: http://www. sustenta las diferentes decisiones clínicas y sanitarias.268:240-8. López Arrieta JM. independiente y Disponible en: http://www.2:32-8. Evaluación de la eviden- SP 10 ¿Los beneficios merecen la pena cia en medicina: revisiones sistemáticas y metaanálisis. Ausejo M. Evidence-Based Medi- Skills Programme) para la lectura crítica de una revisión sistemática: cine Working Group.de/cochrane/hbook. Kupelnick B. 5. Gastroenterol Hepatol Continuada 2002. JAMA 1994. Allepuz C. 8. sino de una red de profesionales sanitarios (y últimos de la revisión también de pacientes y ciudadanos) de todo el mundo in- SP – ¿Cuáles son? (numéricamente.cochrane.17: 521-6. uno de los rasgos distinti.htm revisión sistemática. contramos?8. La Colaboración Cochrane. Mosteller F.) Para ello. junio 2000]. VI. Gabriel-Sánchez R. Medici- ne 1998. Lau J. Almarcegui C. la Colaboración Cochrane proporciona forma- 7 ¿Cuán precisos son los resultados? Pista: busca los intervalos de confianza de los estimadores e ción y apoyo metodológico a todos aquellos que se mues- tran interesados en participar activamente en esta labor. How to Aunque no esté planteado write an evidence-based clinical review article. Cook DJ. según los criterios de la Colabora.65:251-8. Barcelona: Centro Cochrane Iberoamericano. Slawson DC. Cook DJ. utilidad y limitaciones del metaa- cas como piezas fundamentales del complejo engranaje nálisis. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts. odds ratio. Fuentes y centros de gestión del conocimiento. Valdizan JR. La medicina basada en prue- CA 9 ¿Se han considerado todos bas: revisiones sistemáticas. Guía para leer e interpretar una revisión sistemática. Versión 4. Preguntas propuestas por el grupo CASP (Critical Appraisal literature.update-software. 9. ¿qué opinas? 7.es). es que las revisiones sistemáticas son b) ¿Cuáles son los resultados? elaboradas por las personas interesadas por un tema parti- 6 ¿Cuál es el resultado cular. An Med Interna 2000. NNT: número necesario a tratar. Ann Intern Med e frente a los perjuicios y costes? 1997. En: Review Manager (RevMan) [computer program]. Sí No 6. etc.107:581-5.126:376-80. 2. Manual de revisores (versión española de «Cochrane Reviewers’ Handbook») [actualización de ción Cochrane. Interpretación. 12. Fig. ciudadano puede consultar gratuitamente la revista electró- nica Cochrane Library Plus. Precisamente. c) ¿son los resultados aplicables en el medio particular en que nos en.36. 7. 10. Systematic reviews: syn- thesis of best evidence for clinical decisions. vos de esta organización internacional.7:4845-51. no se llevan a cabo de manera centraliza- CA global de la revisión? da por parte de un instituto especializado (aunque existen Pista: considera: diversos organismos que producen revisiones sistemáticas – Si tienes claro los resultados de calidad).cochra- ner en cuenta para desarrollar con solvencia y validez una ne. Guyatt GH. Am Fam Physi- explicitamente en la revisión.2:29-36. Haynes RB. para tomar la decisión? Sí No sé No 3. Rev Soc Mad Med Fam Comunit 2000. ¿CÓMO REALIZAR. Gisbert JP. 2003.2 [updated March 2003]. England: The Coch- llado las diversas etapas metodológicas que conviene te.com/clibplus).1:311-8. desde octubre de 2003 y gracias a una suscripción Skills Programme) para la lectura crítica de una revisión sistemática: realizada por el Ministerio de Sanidad y Consumo. En- fermedad inflamatoria intestinal al día 2003. Mulrow CD. ET AL. editors. García Campayo J. Oxman AD. JAMA 1992. Shaughnessy AF.2. que constituye la producción y divulgación de los conoci. ¿Por qué la medicina basada en la evidencia? 20 años de metaanálisis. Med los resultados importantes Clin (Barc) 1996. Oxford.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 148 GISBERT JP. Es decir. se han deta.27(3):129-49 48 . Artal A. Gourlay ML. Users’ guides to the medical Fig.co- chrane. cualquier b) ¿cuáles son los resultados?8. Pladevall-Vila M. 4. Sáenz A. la cual contiene la versión en CA castellano de la Cochrane Library y otras publicaciones de c) ¿Son los resultados aplicables en tu medio? interés (http://www. Treatments for myocardial infarction. Siwek J. How to use an overview. Cochrane Reviewers’ Handbo- mientos científicos en medicina. 8 ¿Se pueden aplicar los resultados en tu medio? Pista: considera si: SP – Los pacientes cubiertos por la revisión pueden ser suficientemente diferentes Sí No sé No BIBLIOGRAFÍA e de los de tu área – Tu medio parece ser muy diferente al del estudio 1. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? sin ánimo de lucro. Qizilbash N. et al. Preguntas propuestas por el grupo CASP (Critical Appraisal Además.

Egger M. BMJ 1994. et al.126: of grey literature influence estimates of intervention effective. Assessing the quality of randomized controlled trials: an an. McAuley L. Eastwood S. Urrutia G. Harris A. N Engl J Med 1997. Antes G. Jenkinson C. sayos clínicos controlados: el acuerdo QUOROM. Bias in treat. 28. Reynolds DJ. Pham B. Egger M. et al. Ltd. S. The unpredictability paradox: review of 118:405-9. Domín- nálisis. En: 18. JM. Abrams KR. Stroup DF. Sillero-Arenas M. 2003. Khorrami S. recurrent bleeding from peptic ulcer (Cochrane Review). BMJ 1998.354:1896-900. Quality of Re- 21. Rennie D. 29. Moore RA. Issue 1. ment assignment in controlled clinical trials. Lancet 1997. Ioannidis JP. Roque M. Hunt RH. Delaney B. Penman M. 1996. Olkin I. Jones DR. Jadad AR. Infección por He- for inclusion in systematic reviews. Metaanálisis de la efi- 127:380-7.74:107-18. Cappelleri JC. Chalmers TC. Rennie D. En: The Cochrane Library. BMJ 1994. Derderian 24. Lefebvre C. 35. controlled trials. Moher D. Cook DJ. Duval SJ. Med Clin (Barc) 2002. Moayyedi P.309: F.27(3):129-49 149 . Pajares nical trials. licobacter pylori y dispepsia funcional. The Cochrane Library. Oxman AD. Cook DJ. BMJ 2000. Moher D. Moher D. Soo S. Smith H Jr. Cook DJ. Zellweger-Zahner T. Gisbert JP. 323:42-6. Eastwood S.129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 149 GISBERT JP. 309:1358-61. Jadad AR. Using numerical results from systema- 19. 32. Language bias in randomised controlled trials term maintenance antisecretory therapy) for the prevention of published in English and German. Checklists for review articles. LeLorier J.112(Supl 1):17-20. Dickersin K. Counsell C. Moore RA. Huang JQ. Uses and abuses of meta-analysis in gas. (Cochrane Review). 20. Calvet X. Gené E. cacia del tratamiento erradicador. Lapierre J. Rev Esp Sa- Does quality of reports of randomised trials affect estimates of lud Pública 2000. Plade- mized clinical trials: is blinding necessary? Control Clin Trials vall M. Formulating questions and locating primary studies 27.350:326-9. Chalmers TC. Chin J Dig Dis 2002. Proton pump inhibitors versus H2-antagonists: a meta- 15. Celano P.337:536- 25. Eradication of Helicobacter pylori for non-ulcer dyspepsia Trials 1995. Med Clin (Barc) 1999. Tugwell P. Does the inclusion tic reviews in clinical practice. Ann Intern Med 1997. Oxford: Update Software. Control Clin al. Jones A. Pajares JM. Innes M. BMJ 2001. 34. McQuay HJ. Moher D. Stroup DF. N Engl J Med 1983. Benhaddad A. Martí J. Nichol G.309:1286-91.17:1-12. Tweedie RL. 31. Chichester: John Willey pirical assessment of effect of publication bias on meta-analy. Lenge. Au- 352:609-13. Jadad AR. Schmid CH. Helicobacter pylori eradication therapy versus 17. Gisbert JP. Altman DG. ET AL. Large trials versus meta-analysis of 23. Calvet X. Issue 4. antisecretory non-eradication therapy (with or without long- ler C. Bonfill X. 317:1185-90. Walsh 42. 33. Gabriel R. analysis of their efficacy in treating bleeding peptic ulcer. Sacks HS. 14. Deeks J. Juni P.356:1228-31. Calvet X. 26. Pham B. Scherer R. EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS? 13. Carballo F. Improving the quality of reports of meta-analyses of randomi- troenterology.16:62-73. Kunz R. Moher M. ness reported in meta-analyses? Lancet 2000. ses. Schneider M. Etcheverry C. guez-Muñoz E. El desarrollo de la Colaboración Cochrane española. Identifying relevant stu. et al. Glutting JP. Ann Intern Med 1997.3:39-42. Gavaghan DJ. De Ferranti SD. bert M. 2003. Gabriel R. Discrepancies between meta-analyses and subsequent large 648-51. empirical comparisons of randomised and non-randomised cli. 30. Gisbert JP.276: assessing the quality of controlled clinical trials. Med Clin (Barc) 1999. Olkin I. 16. 1332-8. Sesgos en el metaa. et notated bibliography of scales and checklists. Junker C. ¿CÓMO REALIZAR.112(Supl 1):43-50. Moher D. sed controlled trials: the QUOROM statement. Mejora de la calidad de los informes de los metaanálisis de en- 22. 36. González L. intervention efficacy reported in meta-analyses? Lancet 1998. 49 Gastroenterol Hepatol 2004. Systematic reviews in health care: smaller trials: how do their results compare? JAMA 1996. Gregoire G. & Sons. Sutton AJ. Delgado-Rodríguez M. Tugwell P. 712-20.320:1574-7. Assessing the quality of reports of rando. Lancet 1999.15:917-26. ment Pharmacol Ther 2001. Carroll D. Ali- dies for systematic reviews. Em. porting of Meta-analyses. Oxman AD. randomized.