You are on page 1of 14

DOCUMENTOS

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

Cmo interpretar los Niveles de Evidencia en los diferentes escenarios clnicos*


Drs. CARLOS MANTEROLA D.1,2,3, DANIELA ZAVANDO M. 4,5. GRUPO MINCIR.

1 2 3

4 5

Departamento de Ciruga, Universidad de La Frontera. Centro Colaborador UFRO de la Red Cochrane Iberoamericana. CIGES (Capacitacin, Investigacin y Gestin para la Salud Basada en Evidencia), Facultad de Medicina, Universidad de La Frontera. Programa de Magster en Ciencias Mdicas, Universidad de La Frontera. Programa de Pos-Graduaao em Morfologia, Escola Paulista de Medicina, Universidade Federal de Sao Paulo, Brasil (UNIFESP). Temuco, Chile.

Evidence-based clinical practice, levels of evidence


Introduccin
El uso de la evidencia en ciencias se atribuye a la medicina tradicional china, en los tiempos del emperador Qianlong, cuando ya se sealaba el mtodo kaozheng que representa la bsqueda de evidencia prctica1, pero su desarrollo, como se conoce en la actualidad, se origin con la creacin en 1976 de la Canadian Task Force on Preventive Health Care (CTFPHC), quienes fueron los primeros en generar y organizar los niveles de evidencia y los grados de recomendacin para pacientes asintomticos, indicando cules procedimientos eran los ms adecuados y cules deban ser evitados2. Esta metodologa permiti tomar conciencia de la existencia de un orden jerrquico en la calidad de la evidencia entre los estudios cientficos, donde lgicamente aquellos que presentan ms sesgos, no debieran justificar acciones clnicas3. Tambin en Canad, desde 1992, un grupo de mdicos internistas y epidemilogos clnicos de la Facultad de Medicina de la Universidad de McMaster, definieron, sistematizaron y consolidaron el concepto de medicina basada en la evidencia o medicina basada en pruebas (MBE), contribuyendo al cambio paradigmtico para estudiar y ejercer las ciencias mdicas, pues, entre otros tantos hechos, esta prctica se haca cada vez ms compleja, debido al incremento progresivo y abrumador de las publicaciones cientficas que no se asociaban a calidad o a un aumento del tiempo necesario para leer y valorar de manera apropiada dicha informacin4-6. El anlisis constante de la evidencia disponible desde la perspectiva de los diferentes escenarios clnicos, permite establecer grados de recomendacin para el ejercicio de procedimientos diagnsticos, teraputicos, preventivos y econmicos en salud; e indica la forma de valorar el conocimiento en funcin de etiologa, dao, morbilidad y complicaciones; pronstico, historia natural y curso clnico de una enfermedad o evento de inters. Estos han de actualizarse permanentemente en relacin al avance del conocimiento, del desarrollo tecnolgico y al estado del arte. Se estima que hasta la fecha se han descrito y propuesto alrededor de 100 sistemas distintos para valorar la evidencia7, lo que nos orienta acerca del valor que le otorga la comunidad cientfica a esta

*Recibido el 17 de Agosto de 2009 y aceptado el 22 de septiembre de 2009. Financiado por proyecto DI09-0060 de la Direccin de Investigacin Universidad de La Frontera. Correspondencia: Dr. Carlos Manterola D. Manuel Montt 112, Oficina 408. Temuco, Chile. E-mail: cmantero@ufro.cl

582

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

forma de hacer medicina; pero que, por otra parte contradice el principio de simpleza y practicidad que inspir al paradigma de la MBE. Esta situacin puede confundir al clnico en la bsqueda de la mejor evidencia aplicable a su realidad, debido a que, a lo anterior se agrega la dificultad propia del lenguaje epidemiolgico en que se expresa la informacin, siendo en ocasiones la comprensin de estos tpicos, slo privilegio de algunos. El objetivo de este artculo es entregar informacin referente a los niveles de evidencia para cada tipo de estudio segn el escenario clnico o mbito de la prctica clnica que corresponda, interpretndolos en un lenguaje clnico comprensible, especialmente para quienes se acercan a la jerarquizacin de la evidencia y sus recomendaciones, desde la prctica clnica.

Clasificacin de la evidencia y tipos de estudio


No todos los conocimientos provenientes de los artculos cientficos publicados, tienen el mismo impacto o valor sobre la toma de decisiones en materia de salud; por ello, se hizo necesario evaluar la calidad de la evidencia. Esto es, en trminos simples, el anlisis de la validez de los hallazgos en virtud de la calidad metodolgica de las investigaciones que los soportan, garantizndonos por una parte un acercamiento a la veracidad cientfica; y por otra, a que esta verdad pueda traducirse en recomendaciones que a partir de la valoracin crtica de los estudios, nos permitan aplicarlas a la problemtica clnica o evento de inters que nos ocupe. Resulta importante sealar, en este momento, que no todos los diseos tienen el mismo poder para formular una recomendacin; y que ms an, un mismo diseo de investigacin puede tener un nivel de evidencia y grado de recomendacin diferente segn el escenario clnico o mbito de la prctica clnica que corresponda. Por lo anteriormente expuesto, nos parece que vale la pena aclarar algunos conceptos que seguirn utilizndose de aqu en adelante: Se define como diseo de investigacin a los distintos tipos de estudios que con sus caractersticas metodolgicas propias, permiten llevar a cabo una investigacin clnica8. Como escenario, mbito o entorno, al ambiente en el que se desarrolla la situacin clnica que se est evaluando; es decir: tratamiento, prevencin, etiologa, dao, pronstico e historia natural, diagnstico diferencial, prevalencia, estudios econmicos y anlisis de decisin. Como niveles de evidencia, a herramientas, ins-

trumentos y escalas que clasifican, jerarquizan y valoran la evidencia disponible, de forma tal que en base a su utilizacin se pueda emitir juicios de recomendacin. Como grados de recomendacin a una forma de clasificacin de la sugerencia de adoptar o no la adquisicin o puesta en marcha de tecnologas sanitarias segn el rigor cientfico de cada tipo de diseo 4-6. Dependiendo de los tipos de diseos de investigacin clnica utilizados, podemos observar diferentes niveles o gradacin de la calidad de estos segn el escenario de investigacin clnica a la que se refiera. Por una parte, llama la atencin que las intervenciones teraputicas sean las ms abordadas desde esta concepcin, situacin que posiblemente no sea por azar, puesto que es un hecho que entre el 50% y el 60% de las publicaciones versan sobre el mbito del tratamiento o los procedimientos teraputicos9-11. No obstante ello, es deseable que todo el quehacer en salud sea analizado bajo la misma perspectiva. Lo anterior se relaciona al grado de avance que los diversos grupos de expertos (autores de clasificaciones de la evidencia), han ido adquiriendo y que han adecuado, paulatinamente, estos fundamentos a los diferentes escenarios y diseos. Entonces, debemos advertir al lector que slo las clasificaciones propuestas por Sackett, National Institute for Health and Clinical Excellence (NICE) y el Oxford Centre for Evidence-Based Medicine (OCEBM), consideran otras reas de la investigacin clnica adems de la concerniente a tratamiento. De esta forma, NICE adiciona evaluacin de la evidencia para diagnstico; mientras que Sackett considera cuatro grandes grupos temticos: terapia, prevencin, etiologa y dao; pronstico e historia natural; diagnstico; y estudios econmicos. OCEBM, que es una modificacin complementaria de la clasificacin de Sackett, incluye terapia, prevencin, etiologa y dao en un subgrupo; pronstico e historia natural en otro; diagnstico en el siguiente; diagnstico diferencial y estudios de prevalencia en otro; y estudios econmicos y anlisis de decisin en otro. A continuacin se mencionan y describen las propuestas de jerarquizacin de la evidencia ms utilizada en la actualidad (Tabla 1). Canadian Task Force on Preventive Health Care (CTFPHC)2,12 Esta propuesta de clasificacin de la evidencia busca generar recomendaciones de una manera prctica, adoptando una posicin binaria, hgalo o no, pero slo en el mbito de la prevencin. Este grupo de estudio gener su primer informe en el ao 1979, en el cual se divulg el anlisis de la

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

583

CARLOS MANTEROLA D. y cols.

Tabla 1. Propuestas de jerarquizacin de la evidencia analizadas Propuesta CTFPHC SACKETT USPSTF OCEBM SIGN NICE X X X X X X X X X Tratamiento Prevencin X X X X X X X X X X X Etiologa Dao Pronstico Diagnstico Prevalencia Econmicos

Tabla 2. Grados de recomendacin para intervenciones de prevencin (CTFPHC)12 Grados de recomendacin A B C Interpretacin Existe buena evidencia para recomendar la intervencin clnica de prevencin Existe moderada evidencia para recomendar la intervencin clnica de prevencin La evidencia disponible es conflictiva y no permite hacer recomendaciones a favor o en contra de la intervencin clnica preventiva; sin embargo, otros factores podran influenciar en la decisin Existe moderada evidencia para recomendar en contra de la intervencin clnica de prevencin Existe buena evidencia para recomendar en contra la intervencin clnica de prevencin Existe evidencia insuficiente (en cantidad y en calidad) para hacer una recomendacin; sin embargo, otros factores podran influenciar en la decisin

D E I

evidencia hasta esa fecha para 78 enfermedades, lo que permiti ordenar y producir planes de salud para la poblacin canadiense desde la perspectiva de la prevencin. La metodologa de este grupo hace nfasis en el tipo de diseo utilizado y la calidad de los estudios publicados, basndose finalmente en tres elementos claves: 1. Un orden para los grados de recomendacin, establecido por letras del abecedario donde, las letra A y B indican que existe evidencia para ejercer una accin (se recomienda hacer); D y E indican que no debe llevarse a cabo una maniobra o accin determinada (se recomienda no hacer); la letra C, indica que la evidencia es conflictiva, o sea, que existe contradiccin. Y la letra I que indica insuficiencia en calidad y cantidad de evidencia para establecer una recomendacin (Tabla 2). 2. Niveles de evidencia clasificados segn diseo de estudio de I a III, disminuyendo en calidad segn se acrecienta numricamente. Para el nmero II se subdivide en nmeros arbigos del 1 al 3 (Tabla 3).

3. Niveles de evidencia clasificados segn la validez interna o calidad metodolgica del estudio, en buena, moderada e insuficiente (Tabla 4). Como todo sistema de clasificacin, este presenta algunas debilidades que se mencionan a continuacin: No abarca toda la dimensionalidad de la problemtica de la prevencin, respecto a las condiciones particulares de quienes son sujeto de la aplicacin de medidas preventivas. En su anlisis no se incorpora el mbito financiero para la factibilidad de las intervenciones preventivas. La propuesta slo se bas en poblacin canadiense, por ende, el uso de las recomendaciones slo puede ser extrapolada a poblaciones similares a sta; por ello, esta propuesta tiene un inconveniente relacionado con su validez externa que ha de ser valorado al momento de pretender aplicarla en otros escenarios, pues de lo contrario se corre el riesgo de incurrir en esfuerzos econmicos con resultados errticos.

584

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

Tabla 3. Niveles de evidencia e interpretacin de los tipos de estudio para intervenciones de prevencin (CTFPHC)12 Niveles de evidencia I II-1 II-2 II-3 III Interpretacin Evidencia a partir de EC con asignacin aleatoria Evidencia a partir de EC sin asignacin aleatoria Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente realizados por ms de un centro o grupo de investigacin Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la intervencin; podran incluirse resultados espectaculares provenientes de estudios sin asignacin aleatoria Opinin de expertos, basados en la experiencia clnica; estudios descriptivos o informes de comits de expertos

Tabla 4. Validez interna e interpretacin de los tipos de estudio para intervenciones de prevencin (CTFPHC)12 Validez interna Buena Moderada Interpretacin Un estudio (incluyendo la RS y el meta-anlisis) que cumple los criterios especficos de estudio bien diseado Un estudio (incluyendo la RS y el meta-anlisis) que no cumple (o no est claro que cumpla) al menos uno de los criterios especficos de estudio bien diseado*, aunque no tiene defectos fatales Un estudio (incluyendo la RS y el meta-anlisis) que tiene en su diseo al menos un defecto fatal o no cumple (o no est claro que cumpla) al menos uno de los criterios especficos de estudio bien diseado*, aunque no presenta errores fatales o una acumulacin de defectos menores que hagan que los resultados del estudio no permitan elaborar las recomendaciones

Insuficiente

No contempla la relacin del paciente, sus expectativas y su medio, para establecer las recomendaciones. Puede inducir a errores al momento de valorar las recomendaciones para su puesta en prctica en los sistemas estatales de salud, esto quiere decir que una recomendacin B puede ser menospreciada pudiendo tener un beneficio importante para la poblacin. No contempla otro tipo de reas de investigacin como tratamiento, etiologa, dao, pronstico, etc. Clasificacin de la Evidencia segn Sackett 13 Esta sistematizacin propuesta por el epidemilogo David L. Sackett (la que se emplea generalmente), jerarquiza la evidencia en niveles que van del 1 a 5; siendo el nivel 1 la mejor evidencia y el nivel 5 la peor, la ms mala o la menos buena, segn como se quiera leer (Tabla 5).

sta fue la primera propuesta que consider otros escenarios clnicos o mbitos de la prctica clnica diferentes de la prevencin. Incorpor los anlisis econmicos, el diagnstico y el pronstico. Hasta hoy, ha sido ampliamente utilizada por diferentes grupos cientficos. A cada mbito o escenario clnico le otorga el diseo de estudio ms apropiado para la elaboracin de las recomendaciones. As, en el escenario de terapia, los diseos ms puntuados corresponden a las revisiones sistemticas (RS) de ensayos clnicos controlados con asignacin aleatoria (EC); en escenarios de pronstico, los estudios de cohortes; en escenarios de diagnstico, los estudios de pruebas diagnsticas con estndar de referencia, etc. Presenta desventajas que son comunes a todas las propuestas existentes, como que puede llevar a despreciar recomendaciones que se basan en evidencias inferiores a las de nivel 1; por ejemplo un

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

585

CARLOS MANTEROLA D. y cols.

estudio de nivel de evidencia 4, an cuando se trate de un artculo cuyo aporte sea novedoso. No obstante, los autores son enfticos en que lo que debe valorarse es la mejor evidencia disponible actual; pues lo actual puede variar en el da a da; y de este modo puede ocurrir que ante determinadas situaciones la mejor evidencia disponible

actual sea una serie de casos y no un EC; y dos meses despus, aparezca un estudio de cohorte prospectivo que dar la mejor evidencia disponible actual. Esta clasificacin fue pionera y ha servido de base para el desarrollo de clasificaciones ms completas, como la propuesta por el OCEBM14.

Tabla 5. Clasificacin de los niveles de evidencia segn Sackett13 Recomen- Nivel dacin A 1a Terapia, prevencin, etiologa y dao RS con homogeneidad y Meta-anlisis de EC Pronstico Diagnstico Estudios econmicos RS de estudios econmicos de nivel 1

RS con homogeneidad y Meta-anlisis de estudios de cohortes concurrente Estudio individual de cohorte concurrente con seguimiento superior al 80% de la cohorte

RS de estudios de diagnstico nivel 1

1b

EC individuales con intervalo de confianza estrecho

Comparacin independiente y enmascarada de un espectro de pacientes consecutivos sometidos a la prueba diagnstica y al estndar de referencia RS de estudios diagnsticos de nivel mayor a1 Comparacin independiente enmascarada de pacientes no conconsecutivos, sometidos a la prueba diagnstica y al estndar de referencia

Anlisis que compara los desenlaces posibles, contra una medida de costos. Incluye un anlisis de sensibilidad

2a

RS con homogeneidad de estudios de cohortes Estudio de cohortes individual. EC de baja calidad

RS de cohortes histricas Estudio individual de cohortes histricas

RS de estudios econmicos de nivel mayor a1 Comparacin de un nmero limitado de desenlaces contra una medida de costo. Incluye anlisis de sensibilidad

2b

3a

RS con homogeneidad de estudios de casos y controles Estudio de casos y controles individuales Estudios no consecutivos o carentes de un estndar de referencia Series de casos. Estudios de cohortes de mala calidad Opinin de expertos sin evaluacin crtica explcita, o basada en fisiologa, o en investigacin terica Estudios de casos y controles sin la aplicacin de un estndar de referencia Opinin de expertos sin evaluacin crtica explcita, o basada en fisiologa, o en investigacin terica Anlisis sin una medida exacta de costo, pero incluye anlisis de sensibilidad Estudio sin anlisis de sensibilidad

3b

Series de casos. Estudio de cohortes y casos y controles de mala calidad Opinin de expertos sin evaluacin crtica explcita, o basada en fisiologa, o en investigacin terica

Opinin de expertos sin evaluacin crtica explcita, o basada en teora econmica

Por homogeneidad se entiende una RS que est libre de variaciones (heterogeneidad) en las direcciones o grados de resultados entre los estudios individuales.

586

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

U.S. Preventive Services Task Force (USPSTF)15 Este grupo de expertos jerarquiz y estableci la fuerza de sus recomendaciones a partir de la calidad de la evidencia y del beneficio neto; es decir, beneficios menos perjuicios de la medida evaluada para su aplicacin en exmenes peridicos de salud. Por otro lado, analiz el coste-efectividad de las intervenciones, por ende su aporte vino a complementar lo que haba generado el grupo de CTFPHC2,12. La fuerza de las recomendaciones va desde la letra A hasta la E, otorgndose una A cuando existe buena evidencia que respalda la recomendacin; y una E, que indica que existe buena evidencia que sustenta la recomendacin de evitar la intervencin (Tabla 6). La calidad de la evidencia es valorada en buena, justa o insuficiente en la fuerza de las recomendaciones y se basa en la consideracin sistemtica de tres criterios: el concepto de costo de sufrimiento de la condicin estudiada, las caractersticas de la intervencin y la efectividad de la intervencin demostrada en investigaciones clnicas publicadas; recibiendo un especial nfasis la efectividad de la intervencin. En la revisin de los estudios clnicos, se utilizan criterios estrictos para la seleccin de la evidencia admisible y se otorga un acento especial en la calidad de los diseos de los estudios. Para jerarquizar la calidad de la evidencia, se otorga mayor peso a aquellos diseos que metodolgicamente ofrecen

menor riesgo de sesgos y errores aleatorios (Tabla 7). Es interesante observar que la correlacin entre la fuerza de la recomendacin y el nivel de evidencia no es exacta; por ejemplo, puede haber un buen nivel de evidencia que no prueba que una intervencin es efectiva, como el caso de la mamografa en mujeres menores de 50 aos; que recibe una recomendacin C. Por otra parte una recomendacin tipo A fue otorgada al Papanicolaou para deteccin precoz de cncer crvico-uterino basado en el costo de sufrimiento de la enfermedad y un nivel II de evidencia sosteniendo dicha intervencin14. As, las recomendaciones permiten un cierto grado de flexibilidad y se amoldan de acuerdo al contexto imperante. Esta clasificacin tiene la ventaja que contempla nuevos aspectos que condicionan la elaboracin de recomendaciones ya no slo a la calidad de la evidencia (siempre controversial) sino tambin al beneficio neto y al costo de sufrimiento de padecer el evento de inters en estudio, aproximndose a una perspectiva ms global que emerge desde la posicin de quien padece la condicin de salud o evento de inters en estudio. Dentro de las desventajas podemos sealar que slo se consideran estudios para diagnstico y, an resultan insuficientes los aspectos abordados para establecer las recomendaciones; por ejemplo no se considera la factibilidad de cobertura de salud estatal.

Tabla 6. Recomendaciones a partir de calidad de evidencia para exmenes peridicos de salud (USPSTF)15 Recomendacin A Interpretacin La USPSTF recomienda claramente que los clnicos proporcionen la intervencin a los pacientes que cumplan los criterios. La USPSTF ha encontrado buena evidencia de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan ampliamente a los riesgos La USPSTF recomienda que los clnicos proporcionen la intervencin a los pacientes. La USPSTF ha encontrado evidencia moderada de que la medida mejora de manera importante los resultados en salud y concluye que los beneficios superan a los riesgos La USPSTF no recomienda a favor o en contra de la intervencin. La USPSTF ha encontrado al menos evidencia moderada de que la medida puede mejorar los resultados en salud, pero los beneficios son muy similares a los riesgos y no puede justificarse una recomendacin general La USPSTF recomienda en contra que los clnicos proporcionen la intervencin a los pacientes asintomticos. La USPSTF ha encontrado al menos evidencia moderada de que la medida es ineficaz o que los riesgos superan a los beneficios La USPSTF concluye que la evidencia es insuficiente para recomendar a favor o en contra de la intervencin. No existe evidencia de que la intervencin es ineficaz, o de calidad insuficiente, o conflictiva y que el balance entre los riesgos y los beneficios no se puede determinar

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

587

CARLOS MANTEROLA D. y cols.

Tabla 7. Niveles de evidencia e interpretacin de estos para exmenes peridicos de salud (USPSTF)15 Evidencia Buena Moderada Interpretacin La evidencia incluye resultados consistentes a partir de estudios bien diseados y realizados en poblaciones representativas que directamente evalan efectos sobre resultados de salud La evidencia es suficiente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia es limitada por el nmero, la calidad, o la consistencia de los estudios individuales, la generalizacin a la prctica rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud La evidencia es insuficiente para evaluar los efectos sobre los resultados de salud debido al nmero limitado o al poder de estudios, defectos importantes en su diseo o realizacin, inconsistencias en la secuencia de la evidencia, o falta de informacin sobre resultados de salud importantes

Insuficiente

Centre for Evidence-Based Medicine, Oxford (OCEBM)14 Esta propuesta se caracteriza por valorar la evidencia segn el rea temtica o escenario clnico y el tipo de estudio que involucra al problema clnico en cuestin. Lo anterior es una innovacin y es complementaria a lo expuesto por las otras iniciativas. Esta, tiene la ventaja que grada la evidencia de acuerdo al mejor diseo para cada escenario clnico, otorgndole intencionalidad, agregando las RS en los distintos mbitos. As por ejemplo, al tratarse de un escenario clnico relacionado con pronstico de un evento de inters, la evidencia ser valorada a partir de una RS de estudios de cohortes con homogeneidad, o en su defecto de estudios de cohortes individuales con un seguimiento superior al 80% de la cohorte; en cambio, si el escenario se refiere a terapia o tratamiento, la evidencia se valorar principalmente a partir de RS de EC, o en su defecto de EC individuales con intervalos de confianza estrechos. Esta clasificacin tiene la ventaja que nos asegura el conocimiento ms atingente a cada escenario, por su alto grado de especializacin. Adems tiene la prerrogativa de aclarar cmo afecta la falta de rigurosidad metodolgica al diseo de los estudios, disminuyendo su valoracin no slo en la gradacin de la evidencia, sino que tambin en la fuerza de las recomendaciones. No obstante lo cual, presenta algunos inconvenientes para su prctica habitual. Por una parte, vemos como en su estructura se presentan trminos epidemiolgicos poco amigables y con mltiples aclaraciones que hacen su lectura poco fluida y, que rpidamente pueden frustrar a quien se aproxima a ella por primera vez. En su intento por abarcar todos los aspectos con la mxima exhaustividad, pierde la simpleza para hacerla aplicable (Tabla 8).

Scottish Intercollegiate Guidelines Network (SIGN)16,17 Esta propuesta, se origina tambin teniendo como foco de inters la temtica del tratamiento. Se diferencia de las anteriores por su particular nfasis en el anlisis cuantitativo que involucra a las RS y otorga importancia a la reduccin del error sistemtico. Se compone de niveles de evidencia y grados de recomendacin segn esos niveles (Tablas 9 y 10). Como fortaleza, es interesante el hecho que considera la calidad metodolgica de los estudios que componen las RS, situacin que es de inters dada la alta produccin anual de revisiones. Como debilidad podemos sealar que no considera en la elaboracin de las recomendaciones la realidad cientfica y tecnolgica del momento, pues estas se crean con una rigidez que puede ser peligrosa en el sentido de quienes usan con ortodoxia las recomendaciones para la implementacin de polticas de salud, los que pueden evitar invertir con argumento en la evidencia. Por otro lado, se basa de forma puntual en los aspectos metodolgicos y de diseo, pero no as en la dimensin de la perspectiva del padecer una enfermedad o considerar las implicancias econmicas de las medidas recomendadas; situacin que pone en riesgo la factibilidad de su utilizacin en la prctica mdica latinoamericana. National Institute for Health and Clinical Excellence (NICE)18 Esta iniciativa que nace del National Health Service del Reino Unido (NHS), abarca la temtica de la terapia y el diagnstico. Adapta la clasificacin hecha por SIGN para terapia y utiliza la de la OCEBM para diagnstico; de tal modo que se efecta una valoracin de la evidencia disponible con base en estas dos herramientas. Por lo tanto, queda patente la semejanza con las clasificaciones an-

588

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

Tabla 8. Clasificacin de los niveles de evidencia de Oxford (OCEBM)14 Grado de recomendacin A Nivel de evidencia Tratamiento, prevencin, etiologa y dao RS con homogeneidad de EC controlados con asignacin aleatoria Pronstico e historia natural Diagnstico Diagnstico diferencial y estudios de prevalencia RS con homogeneidad de estudios de cohortes prospectivas Estudios econmicos y anlisis de decisin RS con homogeneidad de estudios econmicos de nivel 1

1a

RS de estudios de cohortes, con homogeneidad, o sea que incluya estudios con resultados comparables, en la misma direccin y validadas en diferentes poblaciones

RS de estudios diagnsticos de nivel 1 (alta calidad), con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma direccin y en diferentes centros clnicos Estudios de cohortes que validen la calidad de una prueba especfica, con estndar de referencia adecuado (independientes de la prueba) o a partir de algoritmos de estimacin del pronstico o de categorizacin del diagnstico o probado en un centro clnico

1b

EC individual con intervalo de confianza estrecho

Estudios de cohortes individuales con un seguimiento mayor de 80% de la cohorte y validadas en una sola poblacin

Estudio de cohortes prospectiva con buen seguimiento

Anlisis basado en costes o alternativas clnicamente sensibles; RS de la evidencia; e incluyendo anlisis de la sensibilidad

1c

Eficiencia demostrada por la prctica clnica. Considera cuando algunos pacientes mueren antes de ser evaluados RS de estudios de cohortes, con homogeneidad

Resultados a partir de Pruebas diagnsticas la efectividad y no de con especificidad tan su eficacia demostrada alta que un resultado a travs de un estudio positivo confirma el de cohortes. Series de diagnstico y con casos todos o ninguno sensibilidad tan alta que un resultado negativo descarta el diagnstico RS de estudios de cohorte retrospectiva o de grupos controles no tratados en un EC, con homogeneidad Estudio de cohorte retrospectiva o seguimiento de controles no tratados en un EC, o GPC no validadas RS de estudios diagnsticos de nivel 2 (mediana calidad) con homogeneidad

Series de casos todos o ninguno

Anlisis absoluto en trminos del mayor valor o peor valor

RS (con homogeneidad) de estudios 2b y mejores

RS (con homogeneidad) de estudios econmicos con nivel mayor a 2 Anlisis basados en costes o alternativas clnicamente sensibles; limitado a revisin de la evidencia; e incluyendo un anlisis de sensibilidad

2b

Estudio de cohortes individual con seguimiento inferior a 80% (incluye EC de baja calidad)

Estudios exploratorios que, a travs de una regresin logstica, determinan factores significativos, y validados con estndar de referencia adecuado (independientes de la prueba)

Estudios de cohortes retrospectivas o de seguimiento insuficiente

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

589

CARLOS MANTEROLA D. y cols.

Tabla 8. Clasificacin de los niveles de evidencia de Oxford (OCEBM)14 (Continuacin) Grado de recomendacin Nivel de evidencia Tratamiento, prevencin, etiologa y dao Estudios ecolgicos o de resultados en salud RS de estudios de casos y controles, con homogeneidad Estudios de casos y controles individuales Pronstico e historia natural Diagnstico Diagnstico diferencial y estudios de prevalencia Estudios ecolgicos Estudios econmicos y anlisis de decisin Auditoras o estudios de resultados en salud

2c

Investigacin de resultados en salud

3a

RS con homogeneidad de estudios 3b y de mejor calidad

RS con homogeneidad de estudios 3b y mejores

RS con homogeneidad de estudios 3b y mejores Estudio no consecutivo de cohorte, o anlisis muy limitado de la poblacin basado en pocas alternati vas o costes, estimaciones de datos de mala calidad, pero incluyendo anlisis de la sensibilidad que incorporan variaciones clnicamente sensibles

3b

Comparacin enmascarada y objetiva de un espectro de una cohorte de pacientes que podra normalmente ser examinado para un determinado trastorno, pero el estndar de referencia no se aplica a todos los pacientes del estudio. Estudios no consecutivos o sin la aplicacin de un estndar de referencia

Serie de casos, estudios de cohortes, y de casos y controles de baja calidad Opinin de expertos sin evaluacin crtica explcita, ni basada en fisiologa, ni en trabajo de investigacin juicioso ni en principios fundamentales

Serie de casos y estudios de cohortes de pronstico de poca calidad

Estudio de casos y controles, con escasos o sin estndares de referencia independiente

Series de casos o estndares de referencia obsoletos

Anlisis sin anlisis de sensibilidad

Opinin de expertos sin evaluacin crtica explcita, ni basada en fisiologa, ni en trabajo de investigacin juicioso ni en principios fundamentales

Opinin de expertos sin evaluacin crtica explcita, ni basada en fisiologa, ni en trabajo de investigacin juicioso ni en principios fundamentales

Opinin de expertos sin evaluacin crtica explcita, ni basada en fisiologa, ni en trabajo de investigacin juicioso ni en principios fundamentales

Opinin de expertos sin evaluacin crtica o basado en teora econmica o en principios fundamentales

GPC: Gua de prctica clnica. Estudios con homogeneidad: Se refiere a que incluya estudios con resultados comparables y en la misma direccin.

590

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

Tabla 9. Niveles de evidencia para estudio de tratamiento con anlisis cuantitativo (SIGN)17 Nivel de evidencia 1++ 1+ 1 2++ Interpretacin Meta-anlisis de alta calidad, RS de EC o EC de alta calidad con muy poco riesgo de sesgo Meta-anlisis bien realizados, RS de EC o EC bien realizados con poco riesgo de sesgos Meta-anlisis, RS de EC o EC con alto riesgo de sesgos RS de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o de casos y controles con riesgo muy bajo de sesgo y con alta probabilidad de establecer una relacin causal Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con una moderada probabilidad de establecer una relacin causal Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de que la relacin no sea causal Estudios no analticos, como informes de casos y series de casos Opinin de expertos

2+ 2 3 4

Los estudios clasificados como 1- y 2- no deben usarse en el proceso de elaboracin de recomendaciones por su alto potencial de sesgo.

Tabla 10. Grados de recomendacin para estudios de tratamiento con anlisis cuantitativo (SIGN)17 Grados de recomendacin A Interpretacin Al menos un meta-anlisis, RS o EC clasificado como 1++ y directamente aplicable a la poblacin diana de la gua; o un volumen de evidencia cientfica compuesto por estudios clasificados como 1+ y con gran consistencia entre ellos Un volumen de evidencia cientfica compuesta por estudios clasificados como 2 ++, directamente aplicable a la poblacin diana de la gua y que demuestran gran consistencia entre ellos; o evidencia cientfica extrapolada desde estudios clasificados como 1 ++ 1+ Un volumen de evidencia cientfica compuesta por estudios clasificados como 2 + directamente aplicables a la poblacin diana de la gua y que demuestran gran consistencia entre ellos; o evidencia cientfica extrapolada desde estudios clasificados como 2 ++ Evidencia cientfica de nivel 3 4; o evidencia cientfica extrapolada desde estudios clasificados como 2+

teriores respecto a la importancia otorgada a las RS al momento de generar las recomendaciones (Tablas 11-14). Presenta el inconveniente que hace una relacin tan directa entre calidad de la evidencia y grado de recomendacin que puede generar confusin sobre esos constructos.

Ejemplo
Una forma de ejemplificar el modus operandi de las distintas propuestas analizadas, es a travs de

la aplicacin de un ejemplo. Para ello se utilizar una publicacin de inters nacional, pues a partir de ella se gener el protocolo que ha sido incorporado en algunos hospitales chilenos como tratamiento del cncer gstrico. Se trata del estudio publicado por JS Macdonald y cols19, y que dice relacin con los resultados obtenidos con el uso de ciruga y quimioradioterapia comparado con ciruga exclusiva en pacientes con adenocarcinoma gstrico y de la unin esofagogstrica; por ende, se trata de un escenario de tratamiento, razn por la que se aplicarn las propuestas concernientes a dicho es-

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

591

CARLOS MANTEROLA D. y cols.

cenario. Para ello, se construy una tabla que permite comparar las clasificacin del estudio segn la propuesta con que se analice (Tabla 15). Es as como se puede comentar que el artculo no se orienta a una pregunta claramente definida pues esta slo se puede suponer (de hecho puede tratarse de un escenario de tratamiento, prevencin

o pronstico). La poblacin blanco es heterognea, incluye pacientes con cncer gstrico y gastroesofgico. La intervencin est claramente descrita ciruga+quimioradioterapia (CQR), no as la variable de inters (no se explicita si es morbilidad, mortalidad, supervivencia global, supervivencia libre de enfermedad, efectos txicos, etc). No se describe

Tabla 11. Niveles de evidencia para estudios de terapia (NICE)18 Nivel de evidencia 1++ 1+ 12++ Interpretacin Meta-anlisis de gran calidad, RS de EC con asignacin aleatoria o EC con asignacin aleatoria con muy bajo riesgo de sesgos Meta-anlisis de gran calidad, RS de EC con asignacin aleatoria o EC con asignacin aleatoria con bajo riesgo de sesgos Meta-anlisis de gran calidad, RS de EC con asignacin aleatoria o EC con asignacin aleatoria con alto riesgo de sesgos* RS de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de casos-controles de alta calidad, con muy bajo riesgo de confusin, sesgos o azar y una alta probabilidad de que la relacin sea causal Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusin, sesgos o azar y una moderada probabilidad de que la relacin sea causal Estudios de cohortes o de casos y controles con alto riesgo de sesgo* Estudios no analticos, como informe de casos y series de casos Opinin de expertos

2+ 2 3 4

* Los estudios con un nivel de evidencia no deberan utilizarse como base para elaborar una recomendacin. Adaptado de Scottish Intercollegiate Guidelines Network.

Tabla 12. Grados de recomendacin para estudios de terapia (NICE)18 Grados de recomendacin A Interpretacin Al menos un meta-anlisis, o un EC con asignacin aleatoria categorizados como 1++, que sea directamente aplicable a la poblacin diana; o una RS o un EC con asignacin aleatoria o un volumen de evidencia con estudios categorizados como 1+, que sea directamente aplicable a la poblacin diana y demuestre consistencia de los resultados. Evidencia a partir de la apreciacin de NICE Un volumen de evidencia que incluya estudios calificados de 2++, que sean directamente aplicables a la poblacin objeto y que demuestren globalmente consistencia de los resultados, o extrapolacin de estudios calificados como 1++ o 1+ Un volumen de evidencia que incluya estudios calificados de 2+, que sean directamente aplicables a la poblacin objeto y que demuestren globalmente consistencia de los resultados, o extrapolacin de estudios calificados como 2++ Evidencia nivel 3 o 4, o extrapolacin de estudios calificados como 2+, o consenso formal

D (BPP): Un buen punto de prctica (BPP) es una recomendacin para la mejor prctica basado en la experiencia del grupo que elabora la gua. IP: Recomendacin a partir del manual para procedimientos de intervencin de NICE.

592

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

Tabla 13. Niveles de evidencia para estudios diagnstico (NICE)18 Nivel de evidencia Ia Ib II III IV Interpretacin RS con homogeneidad* de estudios de nivel 1 Estudios de nivel 1 Estudios de nivel 2 RS de estudios de nivel 2 Estudios de nivel 3 RS de estudios de nivel 3 Consenso, informes de comits de expertos u opiniones y/o experiencia clnica sin valoracin crtica explcita; o en base a la psicologa, difusin de la investigacin o principios bsicos

* Homogeneidad significa que no hay variaciones o estas son pequeas en la direccin y grado de los resultados entre los estudios individuales que incluye la RS. Estudios de nivel 1 son aquellos que utilizan una comparacin enmascarada de la prueba con un estndar de referencia validado, en una muestra de pacientes que refleja a la poblacin a quien se aplicara la prueba. Estudios nivel 2 son aquellos que presentan una sola de esta caractersticas: poblacin reducida (la muestra no refleja las caractersticas de la poblacin a la que se le va a aplicar la prueba; utilizan un estndar de referencia pobre (definido como aquel donde la prueba es incluida en la referencia, o aquel en que las pruebas afectan a la referencia; la comparacin entre la prueba y la referencia no est enmascarada; o estudios de casos y controles. Estudios de nivel 3 son aquellos que presentan al menos dos o tres de las caractersticas sealadas anteriormente.

Tabla 14. Grados de recomendacin para estudios diagnstico (NICE)18 Grados de recomendacin A (EPD) B (EPD) C (EPD) D (EPD) Interpretacin Estudios con un nivel de evidencia Ia o Ib Estudios con un nivel de evidencia II Estudios con un nivel de evidencia III Estudios con un nivel de evidencia IV

EPD = Estudios de pruebas diagnsticas

Tabla 15. Niveles de evidencia y grado de recomendacin del estudio de Macdonald19, segn clasificacin Clasificacin Tabla 2. CTFPHC12 Tablas 3 y 4. CTFPHC Tabla 5. Sackett
13 15 12

Nivel de evidencia II-1 2b Moderada 2b


17 18

Grado de recomendacin C Insuficiente (validez) B C B No recomendable No recomendable

Tabla 6 y 7. USPSTF Tabla 8. OCEBM


14

Tabla 9 y 10. SIGN

11-

Tabla 11 y 12. NICE

qu mtodo de asignacin aleatoria fue utilizado, slo se especifica que 281 pacientes fueron asignados a CQR y 275 a ciruga exclusiva (CE); lo que ocurri en el postoperatorio; tampoco se menciona si es que se mantuvo oculta la secuencia de asignacin. Por otra parte, los pacientes fueron analizados en los grupos a los que fueron asignados, pero el seguimiento slo se complet en el grupo de CE (35,6% de los pacientes del grupo de CQR no complet tratamiento y se desconoce qu ocurri con ellos). Por otra parte, es evidente que los resultados no pueden ser aplicados en el cuidado de mis pacientes, debido a que existen diferencias biodemogrficas evidentes entre la poblacin estudiada y la chilena (la poblacin de raza negra, asitica y anglosajona en nuestra realidad es escasa; y el grupo denominado otros por Macdonald y que representa la poblacin latina es slo el 4% de la muestra); ms del 50% de las lesiones son de localizacin antral, y en nuestro medio un porcentaje mayoritario son de fondo gstrico; al mismo

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

593

CARLOS MANTEROLA D. y cols.

tiempo, en nuestra realidad existe una baja prevalencia de lesiones T1 y T2 (mayoritaria en el artculo en evaluacin). Tampoco fueron considerados todos los resultados de importancia clnica en el estudio, pues variables como calidad de vida, efectos adversos de la terapia en evaluacin, mortalidad por efectos deletreos, morbilidad y mortalidad quirrgica y costos involucrados no fueron consideradas (al menos no aparecen consignadas en el reporte del estudio). No se reporta informacin sobre complicaciones quirrgicas; por otra parte, un 36% de pacientes no completaron el esquema asignado, por lo que las estimaciones finales se realizan en base al 64% de los pacientes del grupo de CQR; lo que dificulta la valoracin de potenciales beneficios o efectos deletreos del esquema CQR al compararlo con CE. En resumen, se trata de un EC multicntrico, sin asignacin aleatoria precisa, ni enmascaramiento; cuya validez interna se encuentra afectada por lo que su nivel de evidencia es 2b. Por otra parte, en relacin a la validez externa; si se omitiesen los problemas relacionados con la validez interna, se constata que la inferencia de los resultados slo aplicara a poblaciones de caractersticas similares a las del estudio. En este caso, no a la poblacin chilena o a otras similares20.

Discusin
La evidencia ha tenido un desarrollo diacrnico marcado por el inters de la comunidad cientfica por ordenar y valorar de una manera exhaustiva el conocimiento, siendo uno de los objetivos primordiales el contestar preguntas clnicas surgidas del quehacer mdico diario. En principio, la idea principal fue dar directrices para que el conocimiento ms vlido sea conseguido de manera expedita por el clnico. Paradjicamente, el desarrollo de mltiples propuestas de clasificar la evidencia y formular recomendaciones y el lenguaje epidemiolgico empleado, ha llevado consigo confusin e incomprensin por parte de los clnicos, quienes ven en esta gran variedad de opciones ms conflictos que ayuda al desarrollo de la prctica profesional. En este artculo hemos presentado y desarrollado de forma somera algunas de las clasificaciones existentes, utilizando como criterio de seleccin, el nivel de utilizacin de cada cual, el que se asocia directamente con el grado de aceptacin de ellas por parte de la comunidad cientfica. El problema de la jerarquizacin de la evidencia tambin ha planteado desafos a los comits editoriales de las revistas biomdicas respecto de cmo

estandarizar la valoracin de la evidencia, para la aceptacin de trabajos cientficos. Entendemos la necesidad de simplificar y aunar criterios, incluso sera deseable que las recomendaciones que nacen de la valoracin de la evidencia tuvieran un carcter universal, pero el generalizar tambin trae consigo algunos inconvenientes. Por qu hay polticas de salud que fracasan an cuando han contemplado en su elaboracin la evidencia disponible? Una de las tantas razones es que algunas recomendaciones basadas en la evidencia pueden no ser aplicables a nuestro contexto latinoamericano. De esta forma, al momento de acercarnos a la evidencia es necesario considerar la existencia de caractersticas propias de nuestra regin, tanto poblacionales, culturales, econmicas, tecnolgicas como ambientales; es decir, darle relevancia al concepto de validez externa y no importar todo lo que parece que resulta en otras latitudes sin probar previamente en nuestra realidad; en otras palabras dejar de pensar que todo lo que brilla es oro. No obstante lo anterior, sorprendentemente vemos que se hace poco esfuerzo por establecer sistemas de valoracin de la evidencia aplicada a nuestra propia poblacin y contexto. Por otro lado, la enseanza de las ciencias mdicas no incentiva la validacin de instrumentos extranjeros para la valoracin de la lectura crtica, ni menos la creacin de los propios. As, nos vemos obligados no slo a traducir el lenguaje epidemiolgico desde el ingls, sino que tambin a adaptar e implementar esas traducciones a las problemticas sanitarias regionales. Es cierto que el anlisis de la evidencia incluye sutilmente, la adaptacin a diferentes realidades; pero, complicando un poco ms la contingencia qu repercusiones podemos tener en el mbito legal? De a poco vamos observando cmo la lex artis ya no se basa en opiniones de expertos, cada da se hace ms prxima a la MBE, lo cual implica la contemplacin de recomendaciones al momento de fallos judiciales, pero cmo nos aseguraremos que el acercamiento sea justo y se considere la realidad local? Necesitamos establecer recomendaciones basadas en estudios propios. No podemos pretender que las recomendaciones establecidas por cientficos con distinto grado de desarrollo tecnolgico y de habilidades, puedan ser entendidas por quienes ejecutan las leyes sin el riesgo de creerlas como definitorias. Siguiendo con nuestro anlisis nos preguntamos: Cul es el nivel de influencia de la evidencia en el quehacer mdico en Chile? Entendemos bien lo que es la evidencia, sus niveles e interpretaciones? Cul de las propuestas de clasificacin de la evidencia es ms adecuada para nosotros? Desde nuestro punto de vista, destacamos la clasificacin

594

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

CMO INTERPRETAR LOS NIVELES DE EVIDENCIA EN LOS DIFERENTES ESCENARIOS CLNICOS

ofrecida por OCEBM por sobre las otras, por ser capaz de asignar una valoracin ms completa de la evidencia segn cada tipo de escenario. Sin embargo, es absolutamente imprescindible entender que las recomendaciones, son consejos desde la ms alta perspectiva cientfica, no importa cul propuesta usemos sino cmo las empleemos, qu juicios hagamos y cmo interrelacionamos la evidencia con los factores propios de nuestro entorno. El propsito de los autores es a travs de este artculo, acercar las clasificaciones de la evidencia y sus recomendaciones a quienes se aproximan a la jerarquizacin de la misma e invitar a reflexionar respecto a este tema para abordarlo de manera equilibrada.

Referencias
1. Sackett DL, Richardson S, Rosenberg W, Haynes RB. Medicina baseada em evidncias: prctica e ensino. 2 ed. 2003, Porto Alegre: Artmed Editora S.A. 270. Canadian Task Force on Preventive Health Care. New grades for recommendations from the Canadian Task Force on Preventive Health Care. CMAJ 2003; 169: 207-220. Upshur RE. Are all evidence-based practices alike? Problems in the ranking of evidence. CMAJ 2003; 169: 672-673. Evidence-based medicine Working Group. Evidencebased medicine. A new approach to teaching the practice of medicine. JAMA 1992; 268: 2420-2425. Manterola C. Medicina basada en la evidencia o medicina basada en pruebas. Generalidades acerca de su aplicacin en la prctica clnica cotidiana. Rev Med Clin Condes 2009; 20: 125-130. Manterola C. Medicina basada en la evidencia. Conceptos generales y razones para aplicacin en ciruga. Rev Chil Cir 2002; 54: 550-554. West S, King V, Carey TS, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength of Scientific Evidence. Health Services/Technology Assessment Text, National Library of Medicine. AHRQ Publication No. 02-E016, 2002. Available from: http://www.ncbi. nlm.nih.gov/books/bv.fcgi?rid=hstat1.chapter.70996. Visitado el 22 de junio de 2009. Manterola C. Investigacin clnica, por qu realizarla y cmo desarrollarla. Rev Med Clin Condes 2009; 20: 233-239. Pineda V, Manterola C, Vial M, Losada H. Cul es la calidad metodolgica de los artculos referentes a terapia publicados en la Revista Chilena de Ciruga? Rev

2.

3.

4.

5.

6.

7.

8.

9.

Chil Cir 2005; 57: 500-507. 10. Manterola C, Pineda V, Vial M, Losada H; the MINCIR Group. What is the methodologic quality of human therapy studies in ISI surgical publications? Ann Surg 2006; 244: 827-832. 11. Manterola C, Busquets J, Pascual M, Grande L. What is the methodological quality of articles on therapeutic procedures published in Ciruga Espaola? Cir Esp 2006; 79: 95-100. 12. Task Force Revitalization Process (CTFPHC). Evidence-Based Clinical Prevention, Updated August 17, 2005. Available from: http://www.ctfphc.org. Visitado el 22 de junio de 2009. 13. Sackett DL, Wennberg JE. Choosing the best research design for each question. BMJ 1997; 315(7123): 1636. 14. Oxford Centre for Evidence-based Medicine (CEBM). Centre for Evidence Based Medicine - Levels of Evidence (March 2009). Available from: http:// www.cebm.net/index.aspx?o=1025. Visitado el 22 de junio de 2009. 15. Task Force Ratings. Guide to Clinical Preventive Services, Second Edition. Available from: http:// odphp.osophs.dhhs.gov/pubs/guidecps/PDF/APPA.PDF. Visitado el 22 de junio de 2009. 16. Harbour R, Miller J. A new system for grading recommendations in evidence based guidelines. BMJ 2001; 323: 334-336. 17. Scottish Intercollegiate Guidelines Network (SIGN). SIGN 50, A guideline developers handbook, revisited edition 2008. Available from: http://www.sign.ac.uk/ pdf/sign50.pdf. Visitado el 23 de junio de 2009. 18. National Institute for Health and Clinical Excellence (NICE). The guidelines manual 2009. Available from: http://www.nice.org.uk/media/5F2/44/The_guidelines_ manual_2009_-_All_chapters.pdf. Visitado el 22 de junio de 2009. 19. MacDonald JS, Smalley SR, Benedetti J, Hundahl SA, Estes NC, Stemmermann GN et al. Chemoradiotherapy after surgery compared with surgery alone for adenocarcinoma of the stomach or the gastroesophageal junction. N Engl J Med 2001; 345: 725-730. 20. Manterola C, Torres R, Burgos L, Vial M, Pineda V. Calidad metodolgica de un artculo de tratamiento de cncer gstrico adoptado como protocolo por algunos hospitales chilenos. Rev Md Chile 2006; 134: 920926. 21. Saha S, Hoerger TJ, Pignone MP, Teutsch SM, Helfand M, Mandelblatt JS; Cost Work Group, Third US Preventive Services Task Force. The art and science of incorporating cost effectiveness into evidence-based recommendations for clinical preventive services. Am J Prev Med 2001; 20 (3 Suppl): 36-43.

Rev. Chilena de Ciruga. Vol 61 - N 6, Diciembre 2009; pg. 582-595

595