You are on page 1of 21

La investigación es la recopilación de datos, información y hechos para el avance o la

finalización del conocimiento. Al agregar a la tienda del conocimiento humano, la


investigación científica tiene un gran valor intrínseco. La investigación también tiene un
valor práctico sustancial, en forma de tecnologías beneficiosas que se derivan de dicho
conocimiento.

Desde una perspectiva ética, la investigación puede considerarse aceptable o inaceptable.


Las características éticamente importantes de la investigación incluyen: los temas
seleccionados para el estudio; los enfoques investigativos utilizados; la forma en que se
lleva a cabo la investigación; y la forma en que se comunican los resultados. Los juicios
éticos de la investigación son razonables y necesarios: los investigadores deben ser
responsables ante el público, sobre todo porque su investigación se basa en la cooperación
y el apoyo de la población. La investigación debe realizarse con integridad y
transparencia. La integridad exige que exista un ajuste claro entre lo que los
investigadores dicen que harán y la forma en que realizan la investigación. La
transparencia significa que los investigadores son abiertos sobre la naturaleza de su
investigación y la comunican adecuadamente. Las fallas en la ética de la investigación
tienen el potencial de dañarnos significativamente a todos.

Se dice con frecuencia que aquellos que han realizado investigaciones poco éticas son
culpables de "mala conducta de investigación". Tal mala conducta toma muchas formas
y viene en diferentes grados de severidad. Si bien la investigación de todo tipo puede no
cumplir con los estándares éticos, sugerimos que, en la CAM, tales fallas son mucho más
frecuentes, y generalmente mucho más profundas, que el caso de la investigación dentro
de los campos científicos y médicos.

En este capítulo, comenzaremos ofreciendo una breve y necesariamente incompleta


descripción de cómo debería ser una buena investigación. Luego consideraremos algunos
conceptos clave relacionados con los enfoques estadísticos utilizados para analizar los
datos de investigación. Finalmente, veremos más ampliamente el panorama de la
investigación CAM publicada.
1 buena y mala investigación

La investigación científica tiene tres componentes principales: formular una pregunta de


investigación clara; recopilar datos para responder adecuadamente a la pregunta; y
presentar una respuesta a la pregunta. En el contexto de la medicina, las preguntas de
investigación a menudo se centran en medicamentos, tratamientos y procedimientos, y
preguntan con frecuencia: "¿funciona?" Para generar progreso, los datos deben analizarse,
interpretarse y presentarse a una audiencia más amplia a través de la publicación en un
lugar adecuado. diario académico. De manera crucial, para obtener los datos necesarios,
se debe diseñar e implementar un plan de acción adecuado, un protocolo científico. El
diseño preciso de un estudio dependerá de varios factores interrelacionados, los
principales de los cuales son: la naturaleza de la pregunta de investigación; la viabilidad
de la actividad investigadora; y las consideraciones éticas asociadas. En las siguientes
secciones, consideraremos varios tipos de investigación, y discutiremos sus méritos y
deméritos.
1.1 Estudios no humanos
Algunos tipos de investigación no involucran a pacientes humanos en absoluto.
Comúnmente conocida como "preclínica", esta forma de investigación puede involucrar
animales o células humanas aisladas (o animales) mantenidas en un laboratorio (in vitro).
Dicha investigación generalmente se refiere a experimentos en los que se administra una
sustancia o terapia de prueba (por ejemplo, un fármaco prototipo) a animales o células, y
se registran los cambios biológicos resultantes. A pesar de los diversos problemas éticos
asociados con la experimentación con animales (que están más allá del alcance de este
libro), el uso de animales como bancos de pruebas para prototipos de medicamentos o
tratamientos se considera muy valioso como un medio para obtener información valiosa
sobre seguridad y efectividad. Sin embargo, la información de la investigación con
animales solo puede ser indicativa para la salud humana; requiere confirmación (o de otra
manera) por estudios que involucran sujetos humanos.

El uso de células para probar agentes terapéuticos también puede ser útil y necesario; sin
embargo, dicha investigación es más valiosa en términos de responder preguntas
fundamentales sobre biología, en lugar de probar terapias. Esto se debe a que, eliminadas
de su entorno corporal, las células con frecuencia pueden reaccionar de una manera
diferente a una sustancia de prueba que los humanos. En el cuerpo, las sustancias
administradas están sujetas a alteración de muchas maneras (ruptura gastrointestinal,
procesamiento del hígado, efectos hematológicos, etc.) y las células aisladas pueden
responder de manera muy diferente a las células in situ, ya que el último contexto implica
muchas influencias adicionales (incluidos los efectos tisulares localizados, las respuestas
hormonales, los factores inmunológicos, etc.). En general, el establecimiento de la
seguridad y la eficacia de un prototipo de fármaco procede de la experimentación celular
in vitro, luego a estudios en animales y, finalmente, a ensayos en humanos. En total, este
proceso generalmente involucra muchos estudios realizados por varios grupos de
científicos especializados.

Sería completamente injustificado afirmar que un tratamiento dado, ya sea un prototipo


sintético de la droga, un extracto de hierbas, una preparación homeopática u otra terapia,
tiene un beneficio médico basado solo en la investigación con células o animales. Tales
afirmaciones podrían causar un daño sustancial, engañando a los pacientes y
profesionales: el cuerpo humano obviamente difiere de un plato de células o un ratón
experimental, y la historia de la investigación médica contiene miles de ejemplos de
agentes prometedores que funcionaron bien en células y células. animales, pero no
lograron ser efectivos en humanos, o produjeron efectos secundarios inesperados y, a
veces, peligrosos. Por lo tanto, uno podría suponer que este tipo de reclamación no
ocurriría, pero lamentablemente, esto no siempre es así. Por ejemplo, muchos defensores
de la CAM afirman que debido a que ciertos extractos de plantas matan las células
cancerosas in vitro, se deduce que los pacientes con cáncer deben tomar estos extractos
(Ernst 2013b).
1.2 Evidencia anecdótica

Una forma de intentar averiguar si un tratamiento dado es eficaz y en qué medida es


eficaz, es probar el medicamento o la terapia en un paciente individual y observar qué le
sucede a esa persona. De hecho, muchos profesionales de CAM toman tales
observaciones como una fuente de evidencia válida de efectividad terapéutica. A veces,
estos "estudios de caso" individuales se escriben y publican en las revistas CAM como
"investigación". Desafortunadamente, sin embargo, la evidencia anecdótica de este tipo
sirve como una fuente de conocimiento médico lamentablemente inadecuada. De hecho,
los hallazgos que se derivan de este enfoque pueden desinformar gravemente la práctica
clínica; de esta manera, la evidencia anecdótica a menudo puede ser peor que ninguna
evidencia en absoluto. Vale la pena considerar por qué la investigación basada en
observaciones de pacientes individuales es tan completamente defectuosa como fuente de
conocimiento clínico, porque la comprensión de las deficiencias subyacentes puede
iluminar algunas de las características necesarias que debe poseer la investigación médica
para que se produzca información clínica confiable . Las características clave que hacen
que la evidencia anecdótica sea tan inútil son las siguientes.
1.2.1 No representativa
Un paciente individual puede responder a una terapia de manera diferente a la que algunos
o la mayoría de los otros pacientes responderían. Estas respuestas diferenciales pueden
deberse a diferencias genéticas u otras diferencias sutiles entre los pacientes. Por lo tanto,
no es válido generalizar acerca de la efectividad (o seguridad) de una terapia basada en
una sola cuenta anecdótica. Sin embargo, la falta de representación es uno de los
problemas más leves con la evidencia anecdótica. Después de todo, si fuera el único
problema, se podrían obtener conclusiones válidas considerando varias cuentas
anecdóticas juntas. De hecho, muchos entusiastas de la CAM creen que combinar los
resultados de un gran número de cuentas anecdóticas puede proporcionar una imagen
confiable de la efectividad clínica. Pero están muy equivocados, porque la evidencia
anecdótica se ve socavada por varias otras debilidades intrínsecas, de manera que no
importa cuántos casos individuales se sumen, la errónea de los hallazgos no cambia
fundamentalmente.
1.2.2 Informes subjetivos

Cuando un paciente acepta ser objeto de un "experimento" clínico individual,


naturalmente espera que la terapia de prueba tenga efectos beneficiosos sobre su
enfermedad. Lo mismo ocurre con el investigador que dirige el estudio. De hecho, es poco
probable que tanto el paciente como el experimentador participen en el estudio a menos
que tengan un cierto optimismo de que la terapia funcionará, y esto crea una situación en
la que todas las partes están preparadas para el autoengaño. El peligro es uno de la
subjetividad: motivado por expectativas positivas y pensamientos ilusorios, el paciente
puede auto-informar los cambios beneficiosos en los síntomas que son bastante
imaginarios, y el investigador puede ver la condición del paciente a través de lentes
teñidos de rosa, que tergiversan inconscientemente lo que el paciente tiene informó
1.2.3 El efecto placebo

Un agente ficticio (placebo), como una pastilla de azúcar o una solución salina, puede
ejercer efectos positivos en el paciente. Por ejemplo, los pacientes que reciben un placebo
generalmente informan mayores mejoras en sus síntomas de dolor que los pacientes que
no reciben ningún tratamiento. Este fenómeno, que está mediado por procesos
psicosomáticos, se conoce como "efecto placebo" o "respuesta placebo" .1 Desde que el
Dr. Henry K. Beecher publicó en 1955 un artículo influyente titulado "The Powerful
Placebo" (Beecher 1955), Se ha sabido que el efecto placebo es fuerte y beneficioso. Al
observar varios estudios, Beecher encontró que el 35% de los pacientes que habían
recibido un placebo respondieron positivamente. El trabajo de Beecher ha sido criticado
posteriormente por varios científicos, y el resultado es que el alcance de la respuesta al
placebo es menor de lo que comúnmente se presume. Por ejemplo, una revisión científica
sustancial buscó la respuesta al placebo en artículos publicados que cubren una amplia
gama de condiciones (Hrobjartsson y Gotzsche 2010); los autores informaron que, aunque
en ciertos entornos, el efecto placebo puede mejorar algunos resultados subjetivos
(especialmente el dolor y las náuseas):
No encontramos que las intervenciones con placebo tengan efectos importantes en
general.

Por lo tanto, el efecto placebo tiende a ser muy exagerado en la imaginación común. De
hecho, es poco fiable, de corta duración y limitada en magnitud. A pesar de esto, algunos
defensores de la CAM, especialmente cuando se enfrentan a pruebas convincentes de que
su remedio favorito no funciona, recurren al efecto placebo como una justificación para
continuar tratando a sus pacientes con terapia ineficaz. Volveremos a este último refugio
de apologistas de CAM en un capítulo futuro. Por ahora, el punto importante es que la
posibilidad de una respuesta placebo hace que la evidencia anecdótica no sea válida: si el
paciente mejora después del tratamiento, es simplemente imposible separar el papel del
efecto placebo (si lo hay) de los efectos específicos del placebo efecto. Tratamiento (si
hay uno). En contraste, los ensayos clínicos bien diseñados están estructurados para
separar los efectos del placebo de los efectos reales, como veremos más adelante en este
capítulo.
1.2.4 El efecto de "mejorar en cualquier caso"

Si no se trata, las condiciones clínicas tenderán naturalmente a cambiar de una de tres


formas:
1. Empeorarse con el tiempo; Por ejemplo, cánceres y trastornos neurodegenerativos.
2. Mejorar con el tiempo; Por ejemplo, depresión clínica y dolor musculoesquelético.

3. Fluctúa con el tiempo (mejora durante un tiempo y luego empeora, y luego mejora, en
un ciclo a largo plazo); Por ejemplo, la migraña y las alergias.
Cuando la historia natural típica de un trastorno es de cualquiera de los dos últimos tipos,
surge otro problema serio para el enfoque anecdótico. Los pacientes que buscan ayuda
para una queja médica son mucho más propensos a hacerlo cuando sus síntomas se han
vuelto particularmente molestos; por lo tanto, para condiciones en las que los síntomas
tienden a mejorar de forma natural con el tiempo, o fluctúan, es probable que estos
pacientes experimenten una reducción de sus síntomas después del tratamiento, incluso
si el tratamiento fue completamente ineficaz.
Además, cuando tomamos muchas medidas, inevitablemente habrá algunas

"Valores atípicos", valores que no están cerca del promedio pero que están
considerablemente por debajo o por encima de él. Si repetimos estas medidas, es probable
que se hayan desviado a la mitad. Este fenómeno estadístico se conoce como "regresión
a la media", y en el contexto actual se refiere a la tendencia de los síntomas inusualmente
intensos a regresar. Hacia un nivel más típico (o desaparecer) con el tiempo.

Las mediciones realizadas por McGorry et al. (2000) observar el carácter episódico del
dolor lumbar crónico y recurrente es un buen ejemplo de esto. El efecto de "mejorar de
todos modos". Los pacientes con dolor lumbar registraron su dolor en una escala de 10
puntos todos los días durante 5 meses (se les permitió tomar analgésicos a voluntad). Los
resultados para cuatro pacientes se muestran en el siguiente artículo de McGorry:

En promedio, los niveles de dolor permanecen bastante constantes durante cinco meses,
sin embargo, fluctúan mucho, con diferentes patrones para cada paciente. Los episodios
dolorosos que duran de 2 a 9 días se intercalan con períodos de dolor más bajo o ninguno
en absoluto.

Supongamos que estos pacientes buscaron tratamiento de un homeópata sobre su dolor.


Después de tomar la medicina homeopática prescrita, pronto se sentirían mejor, a pesar
de que el tratamiento que recibieron fue completamente inefectivo, e incluso si no produjo
una respuesta detectable de placebo. Pero el tratamiento lo haría. han sido declarados un
éxito, a pesar de que el paciente no obtuvo ningún beneficio en todo eso. Este "beneficio"
completamente falso sería el mayor para los pacientes cuyo dolor tiende a fluctuar más
(es decir, los dos pacientes representados por los paneles ayd en la figura anterior).

Por lo tanto, el efecto "mejorar de todos modos" refuta aún más la noción de que vale la
pena. Hay evidencia de las anécdotas. En muchos casos, el paciente iba a mejorar de todos
modos; y simplemente, cuando se analiza un estudio de caso individual, no es posible
desentrañar los efectos (si los hay) de que una intervención terapéutica tenga el efecto de
"mejorar de todos modos" o el efecto placebo (completamente separado).

En términos de ayudar realmente al paciente, mientras que el efecto placebo puede


proporcionar algunos beneficios genuinos, aunque en menor medida de lo que
comúnmente se supone, el efecto "mejorar de todos modos" proporciona un beneficio
cero para el paciente.
1.2.5 Post hoc ergo propter hoc
El post hoc ergo propter hoc ('después de esto, por lo tanto, debido a esto'), o la 'falacia
post hoc', es un error basado en la noción errónea de que simplemente porque un evento
ocurre después de otro, el primer evento fue la causa del segundo evento. Es una forma
de reconocimiento de patrones que parece estar cableada en el cerebro humano, como una
característica evolucionada que supuestamente ayudó a nuestra supervivencia como
cazadores-recolectores al proporcionar una heurística para aprender rápidamente acerca
de las posibles causas y efectos. ayudó a nuestros antepasados prehistóricos, en muchos
dominios de la vida moderna es más un obstáculo que una ayuda. Este es ciertamente el
caso cuando se trata de nuestra comprensión de causa y efecto en el contexto de la salud.
Como dijo el gran biólogo Peter Medawar:
Si una persona está A) mal, B) recibe un tratamiento destinado a mejorarlo y C) mejora,
entonces ningún poder de razonamiento conocido por la ciencia médica puede
convencerlo de que no fue el tratamiento que le devolvió la salud. Medawar (1967)

En el contexto de la CAM, la falacia post hoc ergo propter hoc interactúa con el
mencionado efecto de "mejorarse de todos modos", de modo que se cree firmemente que
las terapias ineficaces funcionan. Por ejemplo, supongamos que el Sr. Green ha estado
sufriendo de migrañas. Motivado por una serie de episodios de migraña particularmente
graves, busca la ayuda de un homeópata. Se le prescriben remedios homeopáticos: como
estos no contienen ingredientes activos, no hay nada en la "terapia" que pueda afectar el
cuerpo del Sr. Green. Sin embargo, él experimenta una marcada reducción en los síntomas
de la migraña, pero esto es simplemente porque su condición estaba lista para mejorar de
todos modos. No importa: la heurística de causalidad del Sr. Green entra en acción, y
llega a creer firmemente que la homeopatía redujo sus migrañas. Al observar la
"respuesta" de su paciente a la homeopatía, el homeópata de Green también concluye que
la homeopatía "funciona" para la migraña. Supongamos que el homeópata se imagina a
sí misma como investigadora; ella escribe el caso del Sr. Green en un documento
académico, que se presenta a una revista CAM que publica debidamente el documento.
Como resultado, la totalidad

La noción injustificada de que la homeopatía es efectiva contra la migraña recibe un


apoyo aparentemente "basado en la evidencia".

2 Por ejemplo, supongamos que un humano ancestral come un hongo y unas horas más
tarde está violentamente enfermo. Si esta experiencia le hace creer que el hongo causó el
vómito, la ayudará a sobrevivir, ayudándola a evitar una posible fuente de
envenenamiento en el futuro. Este mecanismo de reconocimiento de patrones debe ser
propenso a errores en la dirección de hacer suposiciones falsas sobre la causalidad: si el
hongo no es realmente tóxico (y la enfermedad en realidad es el resultado de alguna otra
causa invisible), el conocimiento falso resultante conlleva algún costo (en particular).
términos de la evitación errónea de una posible fuente de alimento), pero es improbable
que esto amenace enormemente la supervivencia. Por el contrario, si el vínculo causa-
efecto no se logra en el caso de un hongo realmente tóxico, el costo probablemente sea
mucho mayor: si se comen más hongos, los efectos podrían ser letales. Así, las secuencias
genéticas. NOTA DE PAGINA
subyacente a la heurística de causa y efecto propensa a errores se transmite a las siguientes
generaciones a través de la selección natural. Está claro que tales presiones han influido
en la evolución del cerebro humano, de modo que tenemos una fuerte tendencia inherente
a hacer suposiciones propensas a errores acerca de la causalidad.

El homeópata que trató al Sr. Green, u otros homeópatas, puede recopilar y publicar todos
los casos que pueda encontrar, pero esto no agrega nada nuevo. El simple hecho de
catalogar más y más casos del mismo fenómeno, es decir, los efectos clínicos aparentes
que en realidad pueden deberse al efecto "mejorar de todos modos" entrelazado con el
post hoc ergo propter hoc, no debe en modo alguno conducir a una mayor confianza en
el "hallazgo". 'que la homeopatía puede ayudar a mejorar los síntomas de la migraña.

En resumen: los intentos de utilizar los estudios de pacientes individuales como fuente de
conocimiento clínico se ven acosados por varios problemas profundos, que incluyen la
falta de representación potencial de los casos individuales, la inevitabilidad de los
informes subjetivos, la interferencia del efecto placebo, la mejora de los síntomas debido
simplemente a la el efecto de mejorar de todos modos, y la atribución errónea de
causalidad a través de la fuerte tendencia humana a sucumbir al razonamiento post hoc
falaz. Estos elementos funcionan en combinación para hacer que la evidencia anecdótica
sea virtualmente inútil, y con frecuencia altamente engañosa, como un medio para evaluar
la efectividad terapéutica.

Los investigadores médicos no suelen confiar en estudios aislados de individuos. En


cambio, la mayoría de los estudios involucran un grupo de sujetos, con datos de todos los
sujetos agregados para mostrar características generales. En las siguientes secciones de
este capítulo, revisaremos los principales enfoques utilizados en la investigación médica
para estudiar grupos de seres humanos. Algunos de estos métodos son más fuertes que
otros, como discutiremos. Y cuanto más débil es un estudio, más probable es que se
encuentre con uno o varios de los riesgos mencionados anteriormente asociados con la
evidencia anecdótica. Los estudios diseñados de manera robusta y rigurosamente
implementados son capaces de trascender las limitaciones de la evidencia anecdótica y,
por lo tanto, proporcionar un conocimiento médico confiable; por el contrario, los
estudios más débiles, incluso aquellos que incluyen un gran número de sujetos, no son
mejores que un conjunto de casos anecdóticos.
Lamentablemente, en el mundo de la investigación de CAM, predomina este último tipo
de estudio. Por lo tanto, muchos estudios de CAM publicados solo aportan información
falsa y engañosa al cuerpo del conocimiento médico, como lo demuestran varios ejemplos
en el siguiente capítulo. Esto es de gran preocupación ética, ya que tal información
errónea conduce a decisiones de tratamiento aberrantes con daños concomitantes a los
pacientes.
1.3 Experimental versus estudios observacionales
Para la investigación con seres humanos, un ensayo clínico es siempre el enfoque
preferible para responder preguntas de investigación sobre la eficacia o la seguridad
terapéutica. Los ensayos clínicos son experimentos efectivos: su objetivo es cambiar una
variable y observar las consecuencias. Supongamos, por ejemplo, que los investigadores
desean averiguar si un agente en particular ejerce un efecto terapéutico contra el asma.
Este agente podría ser un prototipo de fármaco farmacéutico o podría ser una terapia de
CAM, como un remedio homeopático o herbal. En cualquier caso, se podría diseñar un
estudio en el que un grupo de pacientes asmáticos tomen el agente, y se registra el número
subsiguiente de ataques de asma experimentados por estos pacientes. El diseño preciso
de tales ensayos es de crucial importancia: discutiremos los elementos clave de los buenos
ensayos clínicos más adelante en este capítulo.

Por el contrario, los estudios "observacionales" no son experimentos, sino que implican
el examen de una situación existente. Por ejemplo, para averiguar si los ácidos grasos
omega-3 (presentes en varios alimentos, especialmente los pescados grasos y en los
suplementos de aceite de pescado) reducen la incidencia de los ataques de asma, a los
pacientes asmáticos se les puede pedir que participen en un estudio en el que se les
pregunta. para proporcionar información sobre: [a] sus hábitos alimenticios y cualquier
suplemento tomado; y [b] cuántos ataques asmáticos sufrieron durante un período de
tiempo. Los investigadores luego examinarían los datos para detectar posibles
correlaciones entre [a] y [b].
1.3.1 Debilidades de los estudios observacionales

Los estudios observacionales son intrínsecamente más débiles que sus contrapartes
experimentales, por varias razones, la más destacada es la naturaleza no intervencionista
del estudio: el investigador simplemente está mirando, en lugar de alterar activamente las
variables. Este problema significa que los datos obtenidos solo pueden mostrar una
correlación entre una variable (como la cantidad de omega-3 consumida) y un parámetro
observado (como la frecuencia de los ataques asmáticos). No se puede controlar la
función de muchas otras variables, como la condición física, el índice de masa corporal,
la calidad del aire, el historial de infecciones, las dificultades de nacimiento, la higiene
doméstica, la ocupación, el consumo de tabaco, el consumo de alcohol, etc., y, por lo
tanto, una correlación entre la variable. bajo observación (es decir, ingesta de omega-3)
y el parámetro clínico (ataques de asma) no puede interpretarse como la causa de la otra.

Muchos estudios observacionales son de naturaleza retrospectiva: los datos dependen de


mirar hacia atrás en el tiempo. Esta característica promete inyectar sesgos debido a la
naturaleza notoriamente propensa a errores de la memoria. Pedirles a las personas que
recuerden los detalles del pasado garantiza la interferencia de limitaciones y errores
cognitivos bien conocidos, como la falla de memoria directa, el reconocimiento de
patrones erróneos y la ilusión.

En el ejemplo del omega-3 y el asma, es cuestionable si los sujetos del ensayo podrán
recordar con suficiente precisión los detalles de sus dietas o la frecuencia con la que se
produjeron sus ataques de asma a lo largo del tiempo. Es probable que esto se vea
agravado por la conciencia de los sujetos de lo que el estudio está buscando: el
conocimiento de que existe una correlación "esperada" (por ejemplo, entre el consumo de
pescado y el asma) es muy probable que distorsione inconscientemente los informes de
los participantes.

Entonces, una vez más, nos encontramos con los mismos problemas que vimos en el
contexto de la evidencia anecdótica (arriba), en particular los problemas asociados con la
información subjetiva y el post hoc ad hoc adter hoc. En resumen, los participantes
pueden imaginar que cuando consumen más pescado disminuyen sus ataques de asma y
se lo comunican debidamente a los investigadores. Los "datos de observación" resultantes
obtenidos de los participantes pueden luego publicarse como si parecieran apoyar la idea
de que el omega-3 reduce los ataques de asma. Pero este "hallazgo" es injustificado; en
el mejor de los casos, puede mostrar un vínculo muy putativo entre la dieta y el asma, que
posiblemente requiera un estudio adicional (con un enfoque experimental). En el peor de
los casos, dicha investigación puede contaminar la literatura médica con asociaciones
engañosas, que pueden ser aprovechadas por personas con un gran interés, como los
entusiastas defensores de los supuestos beneficios para la salud del aceite de pescado y
los vendedores de suplementos alimenticios.

La confusión de correlación y causa es un error lógico elemental y profundo. Muchas


cosas se correlacionan en ausencia de un vínculo causal significativo entre ellas. Por
ejemplo, la incidencia de la fiebre del heno se correlaciona con las ventas de helado, pero
sería erróneo sugerir que comer helado causa la fiebre del heno; más bien, es el clima de
verano lo que aumenta tanto las ventas de helados como los niveles de polen que llevan
a la fiebre del heno. Y muchas cosas se correlacionan con ningún vínculo causal en
absoluto.

En la mayoría de los estudios observacionales, hay muchos factores potenciales


involucrados. Como se describió anteriormente, en el ejemplo de omega-3 y asma, los
investigadores probablemente tendrán una gran cantidad de datos sobre variables distintas
al consumo de omega-3. Dicha riqueza de datos presenta el riesgo de "dragado de datos":
si observa suficientes datos, está obligado a encontrar correlaciones, pero estas
correlaciones generalmente serán completamente espurias. En términos estadísticos, el
dragado de datos es un problema de comparaciones múltiples. En otras palabras, compare
suficientes variables y seguramente encontrará algunas variables que se correlacionan
entre sí.
Para escribir y publicar asociaciones de azar como "reales", es decir, como evidencia de
causa y efecto, es equivalente a difundir información médica errónea. Sin embargo, estos
artículos se publican continuamente, lo que presenta un problema general para quienes
intentan utilizar la investigación para dar sentido a los factores que influyen en la salud.
Pero en el dominio de CAM, la situación es aún peor: la mayoría de los estudios de
investigación de CAM publicados que involucran a pacientes (a diferencia de los artículos
que se basan únicamente en la opinión y la especulación) son del tipo observacional, y la
mayoría de ellos se tornan inválidos por el tipo de debilidades graves descritas
anteriormente.
1.3.2 ¿Son los estudios observacionales de algún valor?
Por lo tanto, los estudios observacionales son muy limitados, e intrínsecamente inferiores
a los estudios experimentales bien diseñados en términos de poder desenredar la
correlación y la causa. Sin embargo, esto no es para afirmar que los estudios
observacionales carecen de valor. Para algunas preguntas de investigación, los estudios
experimentales no son posibles. Este es a menudo el caso en el que hay un deseo de
determinar si el daño a la salud es causado por factores del estilo de vida o ambientales.
Por ejemplo, considere la pregunta "¿aumentan las partículas de diésel en el aire el riesgo
de enfermedad cardiovascular?" Sería poco ético investigar esto mediante la creación de
un experimento que exponga deliberadamente a los humanos a los vapores del diesel por
períodos prolongados de tiempo.
Además, cuando ya existe una gran cantidad de datos, sería demasiado estricto insistir en
que se ignoren tales datos: podrían contener algunas ideas valiosas, si se analizan con la
suficiente atención. Y algunos estudios observacionales pueden diseñarse para minimizar
los inconvenientes descritos anteriormente. Por ejemplo, si se puede obtener información
clínica objetiva, por ejemplo, al mirar los registros médicos de los pacientes, esto puede
evitar sesgos asociados con las debilidades de memoria de los participantes y los errores
cognitivos.

Otras características positivas de los estudios observacionales incluyen que a menudo


pueden incluir muchos más individuos de lo que podría ser un ensayo clínico, y pueden
abarcar un período de tiempo mucho mayor. Y algunos estudios observacionales son
prospectivos, en lugar de retrospectivos: se selecciona y se sigue una cohorte de
individuos a lo largo del tiempo, con resultados clínicos predefinidos evaluados en
determinados momentos.

No es sorprendente que los investigadores, particularmente aquellos con recursos


limitados, recurran con frecuencia a un enfoque observacional, donde un ensayo clínico
hubiera sido posible. Pero esto es muy lamentable, ya que los estudios observacionales,
incluso cuando están bien diseñados y ejecutados, solo pueden demostrar correlación, en
lugar de causa y efecto. Y el problema es particularmente frecuente en la investigación
de CAM, donde las afirmaciones sobre la eficacia terapéutica de cualquier tratamiento
dado se basan generalmente en estudios observacionales aislados, que suelen ser muy
deficientes y que nunca se triangulan con fuentes adicionales de evidencia que puedan
apoyar la noción de Vínculo causal entre la terapia y la mejoría clínica. Esto se hará
evidente cuando veamos ejemplos de estudios de observación CAM en el próximo
capítulo.
1.4 Ensayos clínicos aleatorizados (ECA)

Los experimentos con humanos son la mejor manera de obtener información confiable
que muestre la causa y el efecto en la medicina. Al evaluar si un tratamiento dado
funciona, tales experimentos son esenciales. El consenso dentro de la investigación
médica es que un tipo particular de enfoque experimental, conocido como el "ensayo
clínico aleatorizado" (ECA), es la mejor herramienta para este propósito.
En un ECA ideal, los pacientes se asignan al azar a [un] grupo que recibe el tratamiento
bajo investigación o [b] un grupo, conocido como el grupo 'control', que no recibe el
tratamiento pero en cambio recibe una intervención con placebo, es decir, uno que es
inerte e indistinguible del tratamiento de prueba. Los resultados para el grupo [a] se
pueden comparar con los del grupo [b], para establecer si el tratamiento funcionó como
se esperaba. Esto significa que ambos grupos están expuestos a exactamente el mismo
rango y fortalezas de influencias, excepto por la terapia específica que se está
investigando.

Los ECA pueden usarse para probar una sustancia por sus efectos terapéuticos, como un
fármaco farmacéutico recientemente desarrollado, un suplemento como el omega-3 o un
remedio homeopático: los principios de los ECA son los mismos y se pueden aplicar a
cualquier medicamento. terapia. Las intervenciones físicas también pueden evaluarse
mediante ECA; Los ejemplos incluyen procedimientos quirúrgicos o procedimientos de
CAM como la acupuntura, la manipulación quiropráctica o la meditación. En tales casos,
los participantes del grupo de control podrían estar expuestos a una versión simulada del
tratamiento bajo investigación. La elección de la intervención para el grupo de control
siempre depende de la pregunta de investigación precisa.

¿Cuáles son las características de un RCT riguroso? En términos generales, un ECA debe
diseñarse de manera que permita una interpretación inequívoca de la causa y el efecto.

El diseño del estudio clínico es un tema en sí mismo, y una exposición de los aspectos
detallados y las variedades del diseño de ECA está fuera del alcance de este libro. Sin
embargo, los ECA bien fundados tienen una serie de características cruciales en común,
y las describimos a continuación.
1.4.1 Asignación a Placebo y Grupos Experimentales
Si la pregunta de investigación es "¿la terapia X se desempeña mejor que un placebo?",
Los participantes deben ser asignados al azar a dos grupos (o "brazos"): un brazo
experimental y un brazo de control (o "placebo"). Los primeros sujetos reciben la terapia
de prueba y los últimos reciben una versión indistinguible e inerte del tratamiento.
Algunos ECA tienen más de un brazo experimental, por ejemplo, cuando se comparan
dos fármacos con placebo, o donde se comparan dosis variables de un fármaco u otro
tratamiento. En todos los casos, es esencial que se incluya un número adecuado de sujetos
en cada brazo, con las asignaciones completamente aleatorias, a fin de maximizar las
posibilidades de variación biológica natural entre los sujetos que están aproximadamente
igualados entre los grupos.

En la investigación clínica, el uso de un grupo de control es crucial: los resultados del


brazo de control forman el estándar con el que se comparan los resultados del brazo
experimental. Sin un grupo de comparación válido, cualquier mejora observada en el
grupo experimental no tiene sentido porque no se puede atribuir a una sola causa.

Los pacientes a menudo mostrarán una respuesta positiva a un medicamento simulado o


un procedimiento simulado. Como hemos discutido anteriormente, este efecto es más
evidente cuando se involucran resultados subjetivos. Por ejemplo, la administración de
un placebo puede obtener de manera confiable una disminución a corto plazo del dolor
informado por el paciente. Pero el efecto también se produce con algunas medidas
objetivas; por ejemplo, una píldora de placebo que el sujeto cree que es un fármaco
antihipertensivo puede causar una disminución a corto plazo de la presión arterial del
sujeto (muy probablemente a través de la anticipación psicológica, relajando al sujeto y
reduciendo así su presión arterial). Este efecto se explica por la inclusión de un brazo de
placebo en el estudio.

Además de los efectos genuinos de placebo, una razón adicional para tener un grupo de
control se deriva de la trayectoria natural de muchos trastornos y el efecto asociado de
"mejorarse de todos modos". Como se mencionó anteriormente, los pacientes que buscan
atención médica tienden a hacerlo cuando sus síntomas son más problemáticos. Del
mismo modo, en su mayoría son individuos que muestran síntomas y signos relativamente
extremos quienes son reclutados en ensayos clínicos. Esto se debe a dos razones: en
primer lugar, es más probable que estos pacientes, a diferencia de sus contrapartes que
muestran manifestaciones clínicas más leves, entren en el marco del reclutamiento de
ensayos debido a que buscan atención médica; en segundo lugar, los ensayos clínicos
normalmente establecen umbrales para signos y síntomas, por lo que los pacientes cuyas
condiciones (en el momento del reclutamiento) no son lo suficientemente graves como
para cumplir con el umbral del ensayo serán excluidos del estudio.

Por lo tanto, los ensayos clínicos tienden a poblarse con individuos "extremos" cuyos
síntomas probablemente mejoren (aunque solo sea temporalmente) durante el ensayo
clínico, incluso si la terapia experimental es completamente inefectiva. Tenga en cuenta
que estas mejoras son bastante independientes de cualquier efecto placebo; incluso si
ninguno de los pacientes del ensayo muestra una respuesta de placebo, el efecto de
"mejorar-de todos modos" implica que todavía se observarán mejoras. Por lo tanto, un
grupo de control es necesario no solo para tener en cuenta los efectos del placebo, sino
también para controlar el efecto de mejorar de todos modos.

El último fenómeno puede ser más importante que el primero en términos de explicar por
qué los pacientes mejoran después de una terapia ineficaz. Independientemente de su
contribución relativa, es razonable suponer que ambos fenómenos funcionan en
combinación para producir mejoras observadas en los síntomas y signos que no tienen
nada que ver con la terapia bajo investigación. Un grupo de control es esencial porque,
en promedio, la combinación del efecto placebo más el efecto de "mejorar de todos
modos" será la misma en todos los grupos de un ensayo clínico bien diseñado.
Dependiendo de la pregunta de investigación precisa, un ensayo clínico idealmente
debería tener un grupo que reciba solo un placebo y ningún otro tratamiento. Sin embargo,
en algunos casos, no es ético usar un brazo de placebo puro. Esto se aplica, por ejemplo,
cuando una enfermedad es grave o potencialmente mortal y para la cual se dispone de una
terapia eficaz. En tales casos, un ECA podría evaluar si una nueva terapia tiene mayor
efectividad que el tratamiento estándar. O a todos los pacientes se les puede administrar
un tratamiento estándar y un grupo adicionalmente recibe el experimento, mientras que
el grupo de control recibe además el placebo.
1.4.2 Doble cegamiento
En los ensayos controlados con placebo, los sujetos no deben saber a qué brazo del ECA
se les asignó, de lo contrario, se perdería todo el propósito de tener un brazo con placebo
(como el anterior). Los pacientes en el brazo de placebo deben estar "ciegos" porque la
decepción de no recibir la terapia experimental puede llevar a resultados negativos o
mayores tasas de abandono. Esto último disminuiría el "poder" estadístico del ECA al
reducir el número de participantes y, por lo tanto, reduciría la confiabilidad de los
hallazgos del ensayo.

Se dice que los ECA son "doble ciego" donde no solo los sujetos, sino también los
investigadores y todo el resto del personal no saben quién está recibiendo el placebo o la
terapia experimental. El doble ciego garantiza que los pacientes no detecten indicios
involuntarios de los médicos o el personal de enfermería, lo que podría revelar a los
sujetos en qué brazo se encuentran. Además, si los investigadores no están cegados,
podrían tratar de manera consciente o inconsciente a los pacientes de los dos grupos de
manera diferente. Por ejemplo, se pueden transmitir expectativas positivas a los sujetos
en el brazo experimental, lo que lleva a sesgar sus resultados medidos. Además, la falta
de doble ciego aumentaría el riesgo de que investigadores sin escrúpulos cambien los
resultados para adaptarse al resultado esperado.

El doble ciego es fácil de lograr en ensayos de agentes terapéuticos como tabletas,


líquidos o inyecciones mediante la aplicación de códigos aleatorios a los placebos y los
agentes experimentales, y los códigos solo se revelan después de que concluye el ECA y
se analizan los datos sin procesar. Idealmente, debería implementarse una salvaguardia
adicional: una verificación realizada después del tratamiento para ver si los pacientes
adivinaron correctamente en qué brazo estaban. Esto proporcionaría información sobre el
éxito de los procedimientos de cegamiento.
1.4.3 Números suficientes de participantes

Los ECA con muy pocos participantes, denominados estudios "con poca potencia", son
problemáticos porque conllevan un alto riesgo de resultados poco fiables. Por analogía,
si le pedimos a 80 personas que arrojen una moneda una vez, podemos esperar un
resultado que está muy cerca de 40 cabezas y 40 colas. Si le pide a 8 personas que hagan
lo mismo, hay una posibilidad mucho mayor de obtener un resultado que

diverge de la proporción 1: 1 "esperada". Por ejemplo, no nos sorprendería obtener una


ración de 5: 3 (5 cabezas y 3 colas) de un ensayo de este tipo; de hecho, este resultado
tiene una probabilidad del 22%; mientras que la misma proporción de 5: 3 para el ensayo
de 80 personas (50 cabezas y 30 colas) tiene solo un 0.7% de probabilidad. El riesgo
análogo para los ECA clínicos de baja potencia es que los efectos aleatorios generarán
resultados falsos.
1.4.4 Duración suficiente
Puede tomar tiempo para que se desarrollen los beneficios médicos o surjan efectos
secundarios. Sin embargo, teniendo en cuenta el costo, la complejidad y las molestias
para los sujetos, puede ser difícil garantizar que los ECA se realicen durante períodos
suficientemente largos. Sin embargo, los ECA que tienen períodos de tratamiento
demasiado cortos tienen poco valor. De hecho, los resultados de los ECA de duración
extremadamente inadecuada pueden tener un valor negativo, ya que con frecuencia no
son más que hallazgos casuales que pueden engañarnos a todos.

Cuando se encuentra que una terapia en los ECA es efectiva y, por lo tanto, se utiliza en
la práctica, se debe monitorear un gran número de pacientes para detectar efectos
secundarios y resultados clínicos durante los siguientes meses y años. Esto permite a los
investigadores detectar efectos adversos que son demasiado raros para ser notados en
ensayos relativamente pequeños de duración modesta.
1.4.5 Ambiente regulado y ejecución adecuada

Es importante que los factores extraños que podrían influir en los resultados del ensayo
se mantengan lo más iguales posible para todos los sujetos en el ECA. Por lo tanto, el
diseño ideal del estudio comprende un entorno residencial altamente controlado, en el que
los pacientes o voluntarios son monitoreados constantemente y se les proporciona
entornos casi idénticos.

No tiene sentido idear un estudio bien diseñado si su ejecución es descuidada o corrupta.


La implementación de un estudio es al menos tan importante como su diseño. Si bien un
estudio mal diseñado debe estar abierto a la detección por parte de quienes lean el informe
publicado, la ejecución defectuosa (o fraudulenta) es, por su naturaleza, muy difícil de
detectar. Los ensayos controlados aleatorizados pueden verse menoscabados por la mala
práctica en varias etapas y niveles. El tipo más frecuente de incumplimiento importante
del protocolo probablemente involucre la ruptura del proceso de cegamiento, lo que lleva
a los investigadores y / o sujetos a darse cuenta de en qué brazo están.

Contabilizar todas las características anteriores puede hacer que los RCT rigurosos sean
muy costosos. Muchos investigadores no tendrán los recursos para realizar estudios
"ideales". La falta de recursos es particularmente común en la comunidad de investigación
de CAM. Por lo tanto, los investigadores de la CAM con frecuencia recortan esquinas y
realizan pruebas que no llegan al "ideal". Estos ensayos subóptimos generalmente
comprenden muy pocos sujetos y tienen una duración corta. Tales ensayos a pequeña
escala pueden, si cumplen con los otros requisitos clave de una buena experimentación
(asignación al azar, doble enlace, ejecución cuidadosa, etc.), en el mejor de los casos,
sugerir efectividad. Los hallazgos de estos mini-ECA deben ser siempre preliminares y
dependen de la replicación en estudios mejores y más amplios. Pero el problema es que
tales hallazgos publicados están listos para la selección de cerezas, como para presentar
una imagen engañosa o totalmente falsa. Desafortunadamente, este tipo de
La selectividad no ética es un lugar común en la CAM, como veremos más adelante.
A pesar del consenso entre los científicos médicos de que el ECA es el "estándar de oro"
para probar la efectividad, existen otros diseños de estudios experimentales mucho menos
rigurosos, y los investigadores de la CAM los utilizan con demasiada frecuencia. Por
ejemplo, a un grupo de pacientes se les puede administrar un tipo de terapia y el resultado
se registra posteriormente, pero sin grupo de control. Esta omisión tan básica significa
que nadie puede saber.

si el resultado observado fue causado por la terapia administrada per se u otro factor,
como el efecto placebo o el efecto de "mejorarse de todos modos".
2 analisis de datos

Normalmente, los investigadores deben tener un protocolo que especifique previamente


todas las metodologías utilizadas en un ensayo, incluidos los análisis de datos
planificados. En los ensayos médicos de gran venta, es habitual consultar a un estadístico
médico profesional en la etapa de diseño, así como para el análisis de resultados. Pero, en
CAM, a menudo hay una supervisión (o fondos) insuficiente para garantizar que esto
suceda siempre. Peor aún, los investigadores sin escrúpulos pueden encontrar maneras de
"torturar los datos hasta que confiesen". Uno puede ejecutar una prueba estadística
después de una prueba estadística, y, finalmente, uno dará algo que puede ser disfrazado
como el resultado positivo esperado. En esta sección, examinaremos cómo el
razonamiento defectuoso (o deshonesto) en el contexto de la interpretación de datos en
general y el análisis estadístico en particular puede llevar a conclusiones erróneas y
engañosas respecto a la efectividad terapéutica.
2.1 Puntos finales

Es crucial que, antes del comienzo de un estudio, los investigadores definan un punto
final apropiado como el de interés principal. Idealmente, tales criterios de valoración
primarios deberían incluir los resultados clínicos más relevantes, es decir, cambios que
mejoren directamente la condición clínica del paciente. Los ejemplos incluyen el tiempo
hasta la recurrencia del cáncer, el tiempo de supervivencia, la aparición de un evento
cardíaco mayor, la tasa de muerte o la frecuencia de eventos adversos episódicos (por
ejemplo, episodio de migraña, ataques de asma). También se pueden utilizar resultados
más subjetivos, siempre que se midan utilizando métodos validados. Los ejemplos
incluyen el nivel de dolor, la intensidad de los síntomas y la gravedad de la depresión.

Considere, por ejemplo, un ensayo clínico en el cual el remedio herbal X (HRX) se prueba
como un tratamiento para la angina (la sensación de dolor en el pecho, asociada con un
flujo sanguíneo reducido a través de las arterias cardíacas). Se debe establecer un punto
final primario desde el principio: por ejemplo, la gravedad del dolor en el pecho. De
manera crucial, este punto final debe expresarse en la publicación final de los resultados
del estudio.

Como es habitual en los ensayos clínicos, en un estudio que analiza la HRX, los sujetos
también se evaluarán en varios parámetros secundarios, además del registro de la
gravedad del dolor de angina. Algunas de estas mediciones serán bastante generales e
incluirán, por ejemplo, cambios en el peso corporal, la presión arterial y los parámetros
sanguíneos estándar, junto con puntuaciones subjetivas (por ejemplo, para el cansancio y
la depresión). Además, se determinarán mediciones complementarias más específicas,
incluida una serie de parámetros fisiológicos y bioquímicos de la sangre directamente
asociados a la angina. Por ejemplo, los niveles de la hormona aldosterona se pueden
determinar, porque un aumento en la aldosterona tiende a aumentar la presión arterial y
la presión arterial elevada.

Se asocia positivamente con la angina. De manera similar, los niveles de sodio pueden
medirse, ya que un aumento en el sodio en la sangre conduce a un aumento de la presión
arterial. La evaluación de estos parámetros secundarios puede ser valiosa de varias
maneras; por ejemplo, ayudando a los investigadores a comprobar que la terapia
experimental no está teniendo ningún impacto negativo en la salud y, en última instancia,
ayudando a una comprensión más detallada de cómo la terapia bajo prueba realmente
reduce el dolor de angina, si es que puede hacerlo.

Desafortunadamente, los datos adicionales proporcionados al medir estos parámetros


además del punto final primario presentan una tentación para el comportamiento no ético.
Supongamos que el HRX no reduce el dolor de angina: en consecuencia, un informe
honesto del ensayo sería que no se han presentado pruebas que demuestren que el HRX
es eficaz para reducir dolor de angina, Pero supongamos que los investigadores,
comprometidos con la creencia de que su terapia es valiosa y que no están dispuestos a
perder la esperanza de estar trabajando en un producto comercializable, deciden salvar
algo del estudio. Dos opciones principales son posibles; Ambos de estos recursos no
llegan a ser completamente fraudulentos, pero sin embargo están éticamente cargados.

En primer lugar, los investigadores pueden recurrir a la confianza en los datos


secundarios. Si bien el HRX no logró su objetivo principal (reducir el dolor de angina),
podría haber alterado favorablemente otro parámetro que generalmente se correlaciona
con una reducción de la presión arterial y, por lo tanto, con una reducción del dolor de
angina. Supongamos que se observa una reducción de la aldosterona en el grupo
experimental: esto parece de cierto interés, considerando el vínculo mencionado
anteriormente entre esta hormona y la presión arterial. Pero la aldosterona es solo un
factor en una compleja interacción de factores fisiológicos que influyen en el dolor de
angina. El resultado clave de la prueba es el hallazgo de que el HRX no logra reducir el
dolor de angina; este resultado triunfa claramente sobre el hallazgo de que el HRX está
asociado con una disminución en el nivel de aldosterona.

Sin embargo, los investigadores pueden sentirse tentados a redactar el ensayo basándose
únicamente en los datos de aldosterona, omitiendo mencionar el criterio de valoración
principal. Por consiguiente, el informe publicado prestará apoyo a la idea de que el HRX
puede ser útil para combatir el dolor de angina. Es probable que esto conduzca a
justificaciones injustificadas para realizar más investigaciones sobre un posible
tratamiento "prometedor" para la angina. El nivel de aldosterona es un "punto final
sustituto", es decir, una medida que no tiene una relación garantizada con el punto final
primario. El informe selectivo de los puntos finales sustitutos de esta manera es
claramente engañoso, y equivale a un comportamiento no ético.

El segundo subterfugio abierto a los investigadores sin escrúpulos es rastrear todos los
datos obtenidos del estudio en un intento de seleccionar cualquier parámetro que muestre
un cambio aparentemente "beneficioso" en los pacientes que recibieron el remedio a base
de hierbas. Esta forma de mala conducta de investigación es el dragado de datos, una
práctica que mencionamos anteriormente en el contexto de los estudios observacionales.
Está estrechamente relacionado con el uso indebido de puntos finales sustitutos, pero
conlleva un mayor riesgo de generar pistas médicas falsas y, por lo tanto, es incluso menos
éticamente aceptable. En nuestro ejemplo del rastro de HRX, quizás los participantes en
el brazo experimental informaron una reducción en los síntomas depresivos no
observados en el brazo de control. Por supuesto, tal cambio podría ser de interés y podría
explorarse en investigaciones separadas. Sin embargo, lo más probable es que este cambio
se haya producido puramente por casualidad: si uno observa suficientes datos aleatorios,
como lo han hecho estos investigadores, a menudo será posible encontrar algunos sucesos
aparentemente "significativos" que son simplemente artefactos estadísticos.
El ejemplo anterior de lanzamiento de monedas proporciona un ejemplo simple de este
tipo de problema: si una moneda se lanza varias veces, a menudo será posible encontrar
un número de cabezas inusualmente largo. Supongamos que ocurren seis cabezas
seguidas; la probabilidad de que esto ocurra en una prueba de lanzamiento de una sola
moneda (de seis lanzamientos) es del 1.6%, sin embargo, en el contexto de muchos
lanzamientos de monedas, este resultado no es sorprendente y es simplemente un hecho
aleatorio. Esto es análogo a la selección de una gran cantidad de datos, ya sea de estudios
observacionales o experimentales, en busca de correlaciones: descubierta de esta manera,
es probable que dichas correlaciones sean espúreas.

Debido a su suposición injustificada de que el HRX reduce la depresión, nuestros


investigadores de CAM pueden publicar la afirmación de que el HRX tiene un valor
potencial como un antidepresivo "natural". Seguramente dirán que sus datos de un ECA
bien diseñado, no menos, abogan por una mayor investigación clínica sobre un posible
tratamiento "prometedor". Y hasta pueden sugerir que los pacientes deprimidos pueden
tomar HRX; Si los investigadores no llegan tan lejos, podemos estar seguros de que otros
defensores de la CAM, incluidos los vendedores de remedios a base de hierbas,
recomendarán que los pacientes tomen HRX.

Pero cualquier persona que lea el artículo de investigación probablemente no se dará


cuenta de que el remedio a base de hierbas no hizo lo que originalmente se estaba
probando, es decir, reducir el dolor de angina. Tampoco sabrán que la correlación con la
depresión simplemente se extrajo de una gran cantidad de datos secundarios y, por lo
tanto, es más probable que refleje simplemente una correlación espúrea. Tenga en cuenta
que los investigadores no se están comportando de manera fraudulenta en el
sensación de haber realizado sus resultados; pero el potencial para inducir a error es muy
considerable, especialmente si el punto final primario (que reduce el dolor de angina) no
se aclara en su informe publicado. Claramente, este informe no ético de un ensayo es una
forma de mala conducta de investigación.

Es un hecho lamentable que la información errónea de datos secundarios se produce en


la investigación médica general. Sin embargo, tal mala práctica parece mucho más común
en la investigación de CAM. Cuando la falta de efectividad terapéutica (en términos del
criterio de valoración principal) es endémica, como suele ocurrir con las terapias CAM,
los investigadores se sienten incentivados a profundizar en sus datos en una búsqueda
desesperada de algo que parezca interesante. Este problema se ve agravado por el hecho
de que los investigadores de CAM con frecuencia no reciben educación o no aceptan las
convenciones de investigación establecidas que consideran que el uso indebido de datos
de puntos finales sustitutos y el dragado de datos son totalmente inadecuados.

5 problemas con la investigación CAM

Aunque la mayoría de los artículos de CAM publicados son meramente de opinión, especulación
o encuesta, han surgido varios estudios empíricos dirigidos a examinar la eficacia de CAM.
Anteriormente en este capítulo, señalamos que, a pesar de varias posibles salvaguardas contra
el sesgo, los ensayos clínicos de las modalidades de CAM son a menudo menos rigurosos y sus
hallazgos menos confiables. Hay varios factores que pueden contribuir a este fenómeno. Ya
hemos mencionado que la investigación clínica de alta calidad tiende a ser costosa, y los fondos
de investigación son particularmente escasos en CAM. A esto podemos agregar los siguientes
dos factores:

• La minimización del sesgo en la investigación requiere científicos expertos, y muy pocas de


estas personas se sienten atraídas por la CAM. De hecho, los jóvenes talentos ven a la CAM como
un medio para arruinar una carrera prometedora.

• Los investigadores de CAM a menudo son entusiastas de los tratamientos que investigan. En
consecuencia, a menudo se permite que el sesgo se introduzca en sus estudios.

El último punto parece particularmente importante. Es posible identificar una lista


decepcionantemente larga de investigadores de CAM que rara vez o nunca publican un
resultado negativo relacionado con "su" terapia. Esto significa que, en manos de tales
"expertos", el tratamiento en cuestión es eficaz en prácticamente todas las situaciones. De
manera similar, se ha demostrado repetidamente que los estudios de MTC de China casi nunca
informan resultados negativos (Tang et al. 1999; Vickers et al. 1998), y que la fabricación de
datos en China es un "secreto a voces", y afecta particularmente a CAM ( Ernst 2016c). Tales
fenómenos arrojan considerables dudas sobre la confiabilidad de la investigación publicada.

Muchos observadores independientes han señalado que gran parte de la investigación en CAM
está lejos de ser rigurosa. De hecho, iríamos un paso más allá y afirmaríamos que muchos
estudios en esta área engañan activamente al público sobre el valor de la CAM. Como esto puede
parecer una afirmación audaz, en el siguiente capítulo, tenemos la intención de proporcionar
evidencia al respecto, centrándose en ejemplos de investigación clínica que aborden las dos
cuestiones principales de eficacia y seguridad de las terapias de CAM. La mayoría de los ejemplos
que damos contienen más de un defecto; de hecho, el lector cuidadoso sin duda podrá detectar
muchas de las violaciones de los principios de la investigación médica ética que discutimos
anteriormente. Sin embargo, sería más allá del alcance del presente capítulo detallar todos y
cada uno de los defectos en los ejemplos de investigación de CAM: ¡simplemente son
demasiados! En su lugar, nos centraremos principalmente en los siguientes temas:

• Número insuficiente de participantes

• Falta de un grupo de control

• Grupo de control inapropiado.

• Grupo de control presente pero por lo demás defectuoso.

• Uso de puntos finales sustitutos.

• Mal uso de las estadísticas.

• Resultados 'Demasiado buenos para ser verdad'

• Investigación fraudulenta.

En el siguiente capítulo, consideraremos muchas instancias reales de investigaciones de CAM no


sólidas. Antes de hacerlo, abordaremos brevemente una pregunta que puede ser preocupante
para los lectores: ¿por qué la investigación CAM con fallas inherente termina siendo publicada?
Para ser publicados en una revista académica (en cualquier campo), los trabajos de investigación
deben pasar una evaluación inicial por parte de un editor y luego ser examinados por
(normalmente dos) pares

revisores A primera vista, este método tradicional ("revisión por pares") para filtrar documentos
de investigación parece ser riguroso y debería servir como una pantalla efectiva para la calidad.
De hecho, si los editores y los revisores son diligentes, están bien informados y son imparciales,
este método puede garantizar que no se publiquen documentos defectuosos. Sin embargo, este
sistema puede descomponerse de varias maneras. Los editores o, especialmente, los revisores
que son apresurados o insuficientemente expertos en el campo en cuestión pueden no
identificar los problemas. El problema de los revisores no diligentes y no expertos es un
problema en la publicación académica en general, y se ve agravado por el hecho de que el
modelo actual de revisión por pares se basa en el altruismo. En otras palabras, los revisores
pares no son recompensados por su trabajo. Esto puede llevar a los revisores a dedicar tiempo
insuficiente a la tarea. Otra consecuencia de la expectativa pro bono es que los investigadores
ocupados frecuentemente no están dispuestos a aceptar las solicitudes de revisión de las
revistas; por lo tanto, las revistas a menudo no tienen más opción que entregar la tarea a los
revisores que estén dispuestos pero con experiencia cuestionable.

Si bien los problemas anteriores no están de ninguna manera restringidos a las revistas CAM,
estas revistas son inherentemente más susceptibles a estos problemas que sus contrapartes
médicas tradicionales. Esto se debe a que pocos científicos competentes están dispuestos a
pasar un tiempo valioso en la revisión de la investigación CAM. De vez en cuando, incluso parece
dudoso que los editores de las revistas CAM realmente quieran que los científicos imparciales y
calificados examinen detenidamente los documentos presentados: si se pueden encontrar
científicos dispuestos, ¡el resultado más probable de su escrutinio será el rechazo! Pero los
editores deben llenar las páginas de sus revistas. En realidad, las revistas CAM asignan tareas de
revisión por pares a una gama limitada de entusiastas de CAM que a menudo han sido elegidos
por los autores del artículo en cuestión. La razón de ser de las revistas CAM y los investigadores
de CAM está inextricablemente ligada a la creencia en CAM, lo que resulta en una situación
autorreferencial que es permisiva para la aceptación de informes débiles o defectuosos de
eficacia clínica.

6. Conclusiones

La investigación es crucial en medicina clínica: es cómo se gana el conocimiento de la efectividad


y seguridad del tratamiento y cómo se hace el progreso. Es esencial que la investigación clínica
sea de la más alta calidad en términos de diseño, ejecución y comunicación. En las últimas
décadas, la ciencia médica tradicional se ha alejado de la dependencia de formas débiles de
evidencia, como los relatos anecdóticos, hacia estudios clínicos rigurosos de base experimental.
En términos de diseño del estudio, el ECA es el estándar de oro generalmente aceptado para
probar la eficacia de los tratamientos. Todos los ECA de calidad poseen ciertas características de
diseño clave en su protocolo y ejecución: se reclutan suficientes pacientes; estos sujetos son
asignados aleatoriamente a grupos de control y experimentales; todos los participantes en el
estudio, tanto los sujetos como los investigadores, están "ciegos" en cuanto a qué pacientes
reciben el tratamiento de prueba y cuáles el placebo; y la duración del ensayo es de una duración
adecuada para evaluar adecuadamente las respuestas al tratamiento.

Sin embargo, a pesar del gran progreso que se ha logrado en la mejora del diseño de la
investigación, muchos entusiastas de la CAM prefieren permanecer en la epistemia de las
edades oscuras y abogan por que la mejor fuente de evidencia de efectividad clínica reside en
el conocimiento tradicional y las observaciones subjetivas del profesional.
Sin embargo, algunos investigadores de CAM parecen ver la necesidad de ir más allá de la mera
tradición y las anécdotas, adhiriéndose a la idea de que los enfoques científicos establecidos
para la investigación proporcionan el mejor medio (o al menos un válido) para obtener un
conocimiento clínico confiable. Lamentablemente, sin embargo, cuando se analizan los artículos
publicados de los ensayos clínicos de CAM, con demasiada frecuencia se detecta un patrón
problemático común. A primera vista, el estudio parece ajustarse a las normas de una buena
investigación médica, pero en una inspección más cercana se hace evidente que esta apariencia
de rigor científico no es más que una apariencia que esconde la verdad, que el estudio fue
profundamente defectuoso en algún aspecto clave u otro . Además, el tratamiento estadístico
de los datos en los estudios CAM a menudo resulta ser fundamentalmente defectuoso.

Es crucial que los datos de los estudios clínicos se analicen cuidadosamente utilizando enfoques
estadísticos válidos. Desgraciadamente, se ha hecho evidente que, incluso en la investigación
médica general, este análisis se ha basado frecuentemente en suposiciones erróneas,
contribuyendo a la "crisis de reproducibilidad" que la ciencia en general está experimentando
actualmente. Sin embargo, los investigadores de buena fe están aprendiendo gradualmente a
mejorar sus enfoques para interpretar los datos, y de esta manera la ciencia está mostrando una
de sus características distintivas, a saber, la autocorrección. Sin embargo, el mundo de la
investigación CAM se está quedando atrás en estos desarrollos. Si bien los científicos han
publicado recientemente artículos académicos, artículos en Internet y publicaciones de blogs
sobre estos temas estadísticos, la comunidad CAM ha sido

Casi silencioso sobre el tema.

La investigación defectuosa, ya sea en la etapa de diseño, ejecución, análisis o informe,


corrompe el depósito de conocimiento médico confiable. En última instancia, esto conduce a
decisiones de tratamiento subóptimas y erróneas. Como quedará claro en el siguiente capítulo,
cuando examinamos una amplia gama de publicaciones típicas de investigación de CAM, este
tipo de enfoque éticamente reprensible es un lugar común en CAM.

18Por ejemplo, una búsqueda en la base de datos de publicaciones académicas Web of Science
(que incluye todas las principales revistas de CAM) que abarca el período 2007–2017 utilizando
varios términos de búsqueda relevantes (valor de p, crisis de reproducibilidad, piratería) dio
lugar a solo un documento de CAM. con el problema de la interpretación estadística
problemática de los datos clínicos (Benbassat 2016)

You might also like