Professional Documents
Culture Documents
Se dice con frecuencia que aquellos que han realizado investigaciones poco éticas son
culpables de "mala conducta de investigación". Tal mala conducta toma muchas formas
y viene en diferentes grados de severidad. Si bien la investigación de todo tipo puede no
cumplir con los estándares éticos, sugerimos que, en la CAM, tales fallas son mucho más
frecuentes, y generalmente mucho más profundas, que el caso de la investigación dentro
de los campos científicos y médicos.
El uso de células para probar agentes terapéuticos también puede ser útil y necesario; sin
embargo, dicha investigación es más valiosa en términos de responder preguntas
fundamentales sobre biología, en lugar de probar terapias. Esto se debe a que, eliminadas
de su entorno corporal, las células con frecuencia pueden reaccionar de una manera
diferente a una sustancia de prueba que los humanos. En el cuerpo, las sustancias
administradas están sujetas a alteración de muchas maneras (ruptura gastrointestinal,
procesamiento del hígado, efectos hematológicos, etc.) y las células aisladas pueden
responder de manera muy diferente a las células in situ, ya que el último contexto implica
muchas influencias adicionales (incluidos los efectos tisulares localizados, las respuestas
hormonales, los factores inmunológicos, etc.). En general, el establecimiento de la
seguridad y la eficacia de un prototipo de fármaco procede de la experimentación celular
in vitro, luego a estudios en animales y, finalmente, a ensayos en humanos. En total, este
proceso generalmente involucra muchos estudios realizados por varios grupos de
científicos especializados.
Un agente ficticio (placebo), como una pastilla de azúcar o una solución salina, puede
ejercer efectos positivos en el paciente. Por ejemplo, los pacientes que reciben un placebo
generalmente informan mayores mejoras en sus síntomas de dolor que los pacientes que
no reciben ningún tratamiento. Este fenómeno, que está mediado por procesos
psicosomáticos, se conoce como "efecto placebo" o "respuesta placebo" .1 Desde que el
Dr. Henry K. Beecher publicó en 1955 un artículo influyente titulado "The Powerful
Placebo" (Beecher 1955), Se ha sabido que el efecto placebo es fuerte y beneficioso. Al
observar varios estudios, Beecher encontró que el 35% de los pacientes que habían
recibido un placebo respondieron positivamente. El trabajo de Beecher ha sido criticado
posteriormente por varios científicos, y el resultado es que el alcance de la respuesta al
placebo es menor de lo que comúnmente se presume. Por ejemplo, una revisión científica
sustancial buscó la respuesta al placebo en artículos publicados que cubren una amplia
gama de condiciones (Hrobjartsson y Gotzsche 2010); los autores informaron que, aunque
en ciertos entornos, el efecto placebo puede mejorar algunos resultados subjetivos
(especialmente el dolor y las náuseas):
No encontramos que las intervenciones con placebo tengan efectos importantes en
general.
Por lo tanto, el efecto placebo tiende a ser muy exagerado en la imaginación común. De
hecho, es poco fiable, de corta duración y limitada en magnitud. A pesar de esto, algunos
defensores de la CAM, especialmente cuando se enfrentan a pruebas convincentes de que
su remedio favorito no funciona, recurren al efecto placebo como una justificación para
continuar tratando a sus pacientes con terapia ineficaz. Volveremos a este último refugio
de apologistas de CAM en un capítulo futuro. Por ahora, el punto importante es que la
posibilidad de una respuesta placebo hace que la evidencia anecdótica no sea válida: si el
paciente mejora después del tratamiento, es simplemente imposible separar el papel del
efecto placebo (si lo hay) de los efectos específicos del placebo efecto. Tratamiento (si
hay uno). En contraste, los ensayos clínicos bien diseñados están estructurados para
separar los efectos del placebo de los efectos reales, como veremos más adelante en este
capítulo.
1.2.4 El efecto de "mejorar en cualquier caso"
3. Fluctúa con el tiempo (mejora durante un tiempo y luego empeora, y luego mejora, en
un ciclo a largo plazo); Por ejemplo, la migraña y las alergias.
Cuando la historia natural típica de un trastorno es de cualquiera de los dos últimos tipos,
surge otro problema serio para el enfoque anecdótico. Los pacientes que buscan ayuda
para una queja médica son mucho más propensos a hacerlo cuando sus síntomas se han
vuelto particularmente molestos; por lo tanto, para condiciones en las que los síntomas
tienden a mejorar de forma natural con el tiempo, o fluctúan, es probable que estos
pacientes experimenten una reducción de sus síntomas después del tratamiento, incluso
si el tratamiento fue completamente ineficaz.
Además, cuando tomamos muchas medidas, inevitablemente habrá algunas
"Valores atípicos", valores que no están cerca del promedio pero que están
considerablemente por debajo o por encima de él. Si repetimos estas medidas, es probable
que se hayan desviado a la mitad. Este fenómeno estadístico se conoce como "regresión
a la media", y en el contexto actual se refiere a la tendencia de los síntomas inusualmente
intensos a regresar. Hacia un nivel más típico (o desaparecer) con el tiempo.
Las mediciones realizadas por McGorry et al. (2000) observar el carácter episódico del
dolor lumbar crónico y recurrente es un buen ejemplo de esto. El efecto de "mejorar de
todos modos". Los pacientes con dolor lumbar registraron su dolor en una escala de 10
puntos todos los días durante 5 meses (se les permitió tomar analgésicos a voluntad). Los
resultados para cuatro pacientes se muestran en el siguiente artículo de McGorry:
En promedio, los niveles de dolor permanecen bastante constantes durante cinco meses,
sin embargo, fluctúan mucho, con diferentes patrones para cada paciente. Los episodios
dolorosos que duran de 2 a 9 días se intercalan con períodos de dolor más bajo o ninguno
en absoluto.
Por lo tanto, el efecto "mejorar de todos modos" refuta aún más la noción de que vale la
pena. Hay evidencia de las anécdotas. En muchos casos, el paciente iba a mejorar de todos
modos; y simplemente, cuando se analiza un estudio de caso individual, no es posible
desentrañar los efectos (si los hay) de que una intervención terapéutica tenga el efecto de
"mejorar de todos modos" o el efecto placebo (completamente separado).
En el contexto de la CAM, la falacia post hoc ergo propter hoc interactúa con el
mencionado efecto de "mejorarse de todos modos", de modo que se cree firmemente que
las terapias ineficaces funcionan. Por ejemplo, supongamos que el Sr. Green ha estado
sufriendo de migrañas. Motivado por una serie de episodios de migraña particularmente
graves, busca la ayuda de un homeópata. Se le prescriben remedios homeopáticos: como
estos no contienen ingredientes activos, no hay nada en la "terapia" que pueda afectar el
cuerpo del Sr. Green. Sin embargo, él experimenta una marcada reducción en los síntomas
de la migraña, pero esto es simplemente porque su condición estaba lista para mejorar de
todos modos. No importa: la heurística de causalidad del Sr. Green entra en acción, y
llega a creer firmemente que la homeopatía redujo sus migrañas. Al observar la
"respuesta" de su paciente a la homeopatía, el homeópata de Green también concluye que
la homeopatía "funciona" para la migraña. Supongamos que el homeópata se imagina a
sí misma como investigadora; ella escribe el caso del Sr. Green en un documento
académico, que se presenta a una revista CAM que publica debidamente el documento.
Como resultado, la totalidad
2 Por ejemplo, supongamos que un humano ancestral come un hongo y unas horas más
tarde está violentamente enfermo. Si esta experiencia le hace creer que el hongo causó el
vómito, la ayudará a sobrevivir, ayudándola a evitar una posible fuente de
envenenamiento en el futuro. Este mecanismo de reconocimiento de patrones debe ser
propenso a errores en la dirección de hacer suposiciones falsas sobre la causalidad: si el
hongo no es realmente tóxico (y la enfermedad en realidad es el resultado de alguna otra
causa invisible), el conocimiento falso resultante conlleva algún costo (en particular).
términos de la evitación errónea de una posible fuente de alimento), pero es improbable
que esto amenace enormemente la supervivencia. Por el contrario, si el vínculo causa-
efecto no se logra en el caso de un hongo realmente tóxico, el costo probablemente sea
mucho mayor: si se comen más hongos, los efectos podrían ser letales. Así, las secuencias
genéticas. NOTA DE PAGINA
subyacente a la heurística de causa y efecto propensa a errores se transmite a las siguientes
generaciones a través de la selección natural. Está claro que tales presiones han influido
en la evolución del cerebro humano, de modo que tenemos una fuerte tendencia inherente
a hacer suposiciones propensas a errores acerca de la causalidad.
El homeópata que trató al Sr. Green, u otros homeópatas, puede recopilar y publicar todos
los casos que pueda encontrar, pero esto no agrega nada nuevo. El simple hecho de
catalogar más y más casos del mismo fenómeno, es decir, los efectos clínicos aparentes
que en realidad pueden deberse al efecto "mejorar de todos modos" entrelazado con el
post hoc ergo propter hoc, no debe en modo alguno conducir a una mayor confianza en
el "hallazgo". 'que la homeopatía puede ayudar a mejorar los síntomas de la migraña.
En resumen: los intentos de utilizar los estudios de pacientes individuales como fuente de
conocimiento clínico se ven acosados por varios problemas profundos, que incluyen la
falta de representación potencial de los casos individuales, la inevitabilidad de los
informes subjetivos, la interferencia del efecto placebo, la mejora de los síntomas debido
simplemente a la el efecto de mejorar de todos modos, y la atribución errónea de
causalidad a través de la fuerte tendencia humana a sucumbir al razonamiento post hoc
falaz. Estos elementos funcionan en combinación para hacer que la evidencia anecdótica
sea virtualmente inútil, y con frecuencia altamente engañosa, como un medio para evaluar
la efectividad terapéutica.
Por el contrario, los estudios "observacionales" no son experimentos, sino que implican
el examen de una situación existente. Por ejemplo, para averiguar si los ácidos grasos
omega-3 (presentes en varios alimentos, especialmente los pescados grasos y en los
suplementos de aceite de pescado) reducen la incidencia de los ataques de asma, a los
pacientes asmáticos se les puede pedir que participen en un estudio en el que se les
pregunta. para proporcionar información sobre: [a] sus hábitos alimenticios y cualquier
suplemento tomado; y [b] cuántos ataques asmáticos sufrieron durante un período de
tiempo. Los investigadores luego examinarían los datos para detectar posibles
correlaciones entre [a] y [b].
1.3.1 Debilidades de los estudios observacionales
Los estudios observacionales son intrínsecamente más débiles que sus contrapartes
experimentales, por varias razones, la más destacada es la naturaleza no intervencionista
del estudio: el investigador simplemente está mirando, en lugar de alterar activamente las
variables. Este problema significa que los datos obtenidos solo pueden mostrar una
correlación entre una variable (como la cantidad de omega-3 consumida) y un parámetro
observado (como la frecuencia de los ataques asmáticos). No se puede controlar la
función de muchas otras variables, como la condición física, el índice de masa corporal,
la calidad del aire, el historial de infecciones, las dificultades de nacimiento, la higiene
doméstica, la ocupación, el consumo de tabaco, el consumo de alcohol, etc., y, por lo
tanto, una correlación entre la variable. bajo observación (es decir, ingesta de omega-3)
y el parámetro clínico (ataques de asma) no puede interpretarse como la causa de la otra.
En el ejemplo del omega-3 y el asma, es cuestionable si los sujetos del ensayo podrán
recordar con suficiente precisión los detalles de sus dietas o la frecuencia con la que se
produjeron sus ataques de asma a lo largo del tiempo. Es probable que esto se vea
agravado por la conciencia de los sujetos de lo que el estudio está buscando: el
conocimiento de que existe una correlación "esperada" (por ejemplo, entre el consumo de
pescado y el asma) es muy probable que distorsione inconscientemente los informes de
los participantes.
Entonces, una vez más, nos encontramos con los mismos problemas que vimos en el
contexto de la evidencia anecdótica (arriba), en particular los problemas asociados con la
información subjetiva y el post hoc ad hoc adter hoc. En resumen, los participantes
pueden imaginar que cuando consumen más pescado disminuyen sus ataques de asma y
se lo comunican debidamente a los investigadores. Los "datos de observación" resultantes
obtenidos de los participantes pueden luego publicarse como si parecieran apoyar la idea
de que el omega-3 reduce los ataques de asma. Pero este "hallazgo" es injustificado; en
el mejor de los casos, puede mostrar un vínculo muy putativo entre la dieta y el asma, que
posiblemente requiera un estudio adicional (con un enfoque experimental). En el peor de
los casos, dicha investigación puede contaminar la literatura médica con asociaciones
engañosas, que pueden ser aprovechadas por personas con un gran interés, como los
entusiastas defensores de los supuestos beneficios para la salud del aceite de pescado y
los vendedores de suplementos alimenticios.
Los experimentos con humanos son la mejor manera de obtener información confiable
que muestre la causa y el efecto en la medicina. Al evaluar si un tratamiento dado
funciona, tales experimentos son esenciales. El consenso dentro de la investigación
médica es que un tipo particular de enfoque experimental, conocido como el "ensayo
clínico aleatorizado" (ECA), es la mejor herramienta para este propósito.
En un ECA ideal, los pacientes se asignan al azar a [un] grupo que recibe el tratamiento
bajo investigación o [b] un grupo, conocido como el grupo 'control', que no recibe el
tratamiento pero en cambio recibe una intervención con placebo, es decir, uno que es
inerte e indistinguible del tratamiento de prueba. Los resultados para el grupo [a] se
pueden comparar con los del grupo [b], para establecer si el tratamiento funcionó como
se esperaba. Esto significa que ambos grupos están expuestos a exactamente el mismo
rango y fortalezas de influencias, excepto por la terapia específica que se está
investigando.
Los ECA pueden usarse para probar una sustancia por sus efectos terapéuticos, como un
fármaco farmacéutico recientemente desarrollado, un suplemento como el omega-3 o un
remedio homeopático: los principios de los ECA son los mismos y se pueden aplicar a
cualquier medicamento. terapia. Las intervenciones físicas también pueden evaluarse
mediante ECA; Los ejemplos incluyen procedimientos quirúrgicos o procedimientos de
CAM como la acupuntura, la manipulación quiropráctica o la meditación. En tales casos,
los participantes del grupo de control podrían estar expuestos a una versión simulada del
tratamiento bajo investigación. La elección de la intervención para el grupo de control
siempre depende de la pregunta de investigación precisa.
¿Cuáles son las características de un RCT riguroso? En términos generales, un ECA debe
diseñarse de manera que permita una interpretación inequívoca de la causa y el efecto.
El diseño del estudio clínico es un tema en sí mismo, y una exposición de los aspectos
detallados y las variedades del diseño de ECA está fuera del alcance de este libro. Sin
embargo, los ECA bien fundados tienen una serie de características cruciales en común,
y las describimos a continuación.
1.4.1 Asignación a Placebo y Grupos Experimentales
Si la pregunta de investigación es "¿la terapia X se desempeña mejor que un placebo?",
Los participantes deben ser asignados al azar a dos grupos (o "brazos"): un brazo
experimental y un brazo de control (o "placebo"). Los primeros sujetos reciben la terapia
de prueba y los últimos reciben una versión indistinguible e inerte del tratamiento.
Algunos ECA tienen más de un brazo experimental, por ejemplo, cuando se comparan
dos fármacos con placebo, o donde se comparan dosis variables de un fármaco u otro
tratamiento. En todos los casos, es esencial que se incluya un número adecuado de sujetos
en cada brazo, con las asignaciones completamente aleatorias, a fin de maximizar las
posibilidades de variación biológica natural entre los sujetos que están aproximadamente
igualados entre los grupos.
Además de los efectos genuinos de placebo, una razón adicional para tener un grupo de
control se deriva de la trayectoria natural de muchos trastornos y el efecto asociado de
"mejorarse de todos modos". Como se mencionó anteriormente, los pacientes que buscan
atención médica tienden a hacerlo cuando sus síntomas son más problemáticos. Del
mismo modo, en su mayoría son individuos que muestran síntomas y signos relativamente
extremos quienes son reclutados en ensayos clínicos. Esto se debe a dos razones: en
primer lugar, es más probable que estos pacientes, a diferencia de sus contrapartes que
muestran manifestaciones clínicas más leves, entren en el marco del reclutamiento de
ensayos debido a que buscan atención médica; en segundo lugar, los ensayos clínicos
normalmente establecen umbrales para signos y síntomas, por lo que los pacientes cuyas
condiciones (en el momento del reclutamiento) no son lo suficientemente graves como
para cumplir con el umbral del ensayo serán excluidos del estudio.
Por lo tanto, los ensayos clínicos tienden a poblarse con individuos "extremos" cuyos
síntomas probablemente mejoren (aunque solo sea temporalmente) durante el ensayo
clínico, incluso si la terapia experimental es completamente inefectiva. Tenga en cuenta
que estas mejoras son bastante independientes de cualquier efecto placebo; incluso si
ninguno de los pacientes del ensayo muestra una respuesta de placebo, el efecto de
"mejorar-de todos modos" implica que todavía se observarán mejoras. Por lo tanto, un
grupo de control es necesario no solo para tener en cuenta los efectos del placebo, sino
también para controlar el efecto de mejorar de todos modos.
El último fenómeno puede ser más importante que el primero en términos de explicar por
qué los pacientes mejoran después de una terapia ineficaz. Independientemente de su
contribución relativa, es razonable suponer que ambos fenómenos funcionan en
combinación para producir mejoras observadas en los síntomas y signos que no tienen
nada que ver con la terapia bajo investigación. Un grupo de control es esencial porque,
en promedio, la combinación del efecto placebo más el efecto de "mejorar de todos
modos" será la misma en todos los grupos de un ensayo clínico bien diseñado.
Dependiendo de la pregunta de investigación precisa, un ensayo clínico idealmente
debería tener un grupo que reciba solo un placebo y ningún otro tratamiento. Sin embargo,
en algunos casos, no es ético usar un brazo de placebo puro. Esto se aplica, por ejemplo,
cuando una enfermedad es grave o potencialmente mortal y para la cual se dispone de una
terapia eficaz. En tales casos, un ECA podría evaluar si una nueva terapia tiene mayor
efectividad que el tratamiento estándar. O a todos los pacientes se les puede administrar
un tratamiento estándar y un grupo adicionalmente recibe el experimento, mientras que
el grupo de control recibe además el placebo.
1.4.2 Doble cegamiento
En los ensayos controlados con placebo, los sujetos no deben saber a qué brazo del ECA
se les asignó, de lo contrario, se perdería todo el propósito de tener un brazo con placebo
(como el anterior). Los pacientes en el brazo de placebo deben estar "ciegos" porque la
decepción de no recibir la terapia experimental puede llevar a resultados negativos o
mayores tasas de abandono. Esto último disminuiría el "poder" estadístico del ECA al
reducir el número de participantes y, por lo tanto, reduciría la confiabilidad de los
hallazgos del ensayo.
Se dice que los ECA son "doble ciego" donde no solo los sujetos, sino también los
investigadores y todo el resto del personal no saben quién está recibiendo el placebo o la
terapia experimental. El doble ciego garantiza que los pacientes no detecten indicios
involuntarios de los médicos o el personal de enfermería, lo que podría revelar a los
sujetos en qué brazo se encuentran. Además, si los investigadores no están cegados,
podrían tratar de manera consciente o inconsciente a los pacientes de los dos grupos de
manera diferente. Por ejemplo, se pueden transmitir expectativas positivas a los sujetos
en el brazo experimental, lo que lleva a sesgar sus resultados medidos. Además, la falta
de doble ciego aumentaría el riesgo de que investigadores sin escrúpulos cambien los
resultados para adaptarse al resultado esperado.
Los ECA con muy pocos participantes, denominados estudios "con poca potencia", son
problemáticos porque conllevan un alto riesgo de resultados poco fiables. Por analogía,
si le pedimos a 80 personas que arrojen una moneda una vez, podemos esperar un
resultado que está muy cerca de 40 cabezas y 40 colas. Si le pide a 8 personas que hagan
lo mismo, hay una posibilidad mucho mayor de obtener un resultado que
Cuando se encuentra que una terapia en los ECA es efectiva y, por lo tanto, se utiliza en
la práctica, se debe monitorear un gran número de pacientes para detectar efectos
secundarios y resultados clínicos durante los siguientes meses y años. Esto permite a los
investigadores detectar efectos adversos que son demasiado raros para ser notados en
ensayos relativamente pequeños de duración modesta.
1.4.5 Ambiente regulado y ejecución adecuada
Es importante que los factores extraños que podrían influir en los resultados del ensayo
se mantengan lo más iguales posible para todos los sujetos en el ECA. Por lo tanto, el
diseño ideal del estudio comprende un entorno residencial altamente controlado, en el que
los pacientes o voluntarios son monitoreados constantemente y se les proporciona
entornos casi idénticos.
Contabilizar todas las características anteriores puede hacer que los RCT rigurosos sean
muy costosos. Muchos investigadores no tendrán los recursos para realizar estudios
"ideales". La falta de recursos es particularmente común en la comunidad de investigación
de CAM. Por lo tanto, los investigadores de la CAM con frecuencia recortan esquinas y
realizan pruebas que no llegan al "ideal". Estos ensayos subóptimos generalmente
comprenden muy pocos sujetos y tienen una duración corta. Tales ensayos a pequeña
escala pueden, si cumplen con los otros requisitos clave de una buena experimentación
(asignación al azar, doble enlace, ejecución cuidadosa, etc.), en el mejor de los casos,
sugerir efectividad. Los hallazgos de estos mini-ECA deben ser siempre preliminares y
dependen de la replicación en estudios mejores y más amplios. Pero el problema es que
tales hallazgos publicados están listos para la selección de cerezas, como para presentar
una imagen engañosa o totalmente falsa. Desafortunadamente, este tipo de
La selectividad no ética es un lugar común en la CAM, como veremos más adelante.
A pesar del consenso entre los científicos médicos de que el ECA es el "estándar de oro"
para probar la efectividad, existen otros diseños de estudios experimentales mucho menos
rigurosos, y los investigadores de la CAM los utilizan con demasiada frecuencia. Por
ejemplo, a un grupo de pacientes se les puede administrar un tipo de terapia y el resultado
se registra posteriormente, pero sin grupo de control. Esta omisión tan básica significa
que nadie puede saber.
si el resultado observado fue causado por la terapia administrada per se u otro factor,
como el efecto placebo o el efecto de "mejorarse de todos modos".
2 analisis de datos
Es crucial que, antes del comienzo de un estudio, los investigadores definan un punto
final apropiado como el de interés principal. Idealmente, tales criterios de valoración
primarios deberían incluir los resultados clínicos más relevantes, es decir, cambios que
mejoren directamente la condición clínica del paciente. Los ejemplos incluyen el tiempo
hasta la recurrencia del cáncer, el tiempo de supervivencia, la aparición de un evento
cardíaco mayor, la tasa de muerte o la frecuencia de eventos adversos episódicos (por
ejemplo, episodio de migraña, ataques de asma). También se pueden utilizar resultados
más subjetivos, siempre que se midan utilizando métodos validados. Los ejemplos
incluyen el nivel de dolor, la intensidad de los síntomas y la gravedad de la depresión.
Considere, por ejemplo, un ensayo clínico en el cual el remedio herbal X (HRX) se prueba
como un tratamiento para la angina (la sensación de dolor en el pecho, asociada con un
flujo sanguíneo reducido a través de las arterias cardíacas). Se debe establecer un punto
final primario desde el principio: por ejemplo, la gravedad del dolor en el pecho. De
manera crucial, este punto final debe expresarse en la publicación final de los resultados
del estudio.
Como es habitual en los ensayos clínicos, en un estudio que analiza la HRX, los sujetos
también se evaluarán en varios parámetros secundarios, además del registro de la
gravedad del dolor de angina. Algunas de estas mediciones serán bastante generales e
incluirán, por ejemplo, cambios en el peso corporal, la presión arterial y los parámetros
sanguíneos estándar, junto con puntuaciones subjetivas (por ejemplo, para el cansancio y
la depresión). Además, se determinarán mediciones complementarias más específicas,
incluida una serie de parámetros fisiológicos y bioquímicos de la sangre directamente
asociados a la angina. Por ejemplo, los niveles de la hormona aldosterona se pueden
determinar, porque un aumento en la aldosterona tiende a aumentar la presión arterial y
la presión arterial elevada.
Se asocia positivamente con la angina. De manera similar, los niveles de sodio pueden
medirse, ya que un aumento en el sodio en la sangre conduce a un aumento de la presión
arterial. La evaluación de estos parámetros secundarios puede ser valiosa de varias
maneras; por ejemplo, ayudando a los investigadores a comprobar que la terapia
experimental no está teniendo ningún impacto negativo en la salud y, en última instancia,
ayudando a una comprensión más detallada de cómo la terapia bajo prueba realmente
reduce el dolor de angina, si es que puede hacerlo.
Sin embargo, los investigadores pueden sentirse tentados a redactar el ensayo basándose
únicamente en los datos de aldosterona, omitiendo mencionar el criterio de valoración
principal. Por consiguiente, el informe publicado prestará apoyo a la idea de que el HRX
puede ser útil para combatir el dolor de angina. Es probable que esto conduzca a
justificaciones injustificadas para realizar más investigaciones sobre un posible
tratamiento "prometedor" para la angina. El nivel de aldosterona es un "punto final
sustituto", es decir, una medida que no tiene una relación garantizada con el punto final
primario. El informe selectivo de los puntos finales sustitutos de esta manera es
claramente engañoso, y equivale a un comportamiento no ético.
El segundo subterfugio abierto a los investigadores sin escrúpulos es rastrear todos los
datos obtenidos del estudio en un intento de seleccionar cualquier parámetro que muestre
un cambio aparentemente "beneficioso" en los pacientes que recibieron el remedio a base
de hierbas. Esta forma de mala conducta de investigación es el dragado de datos, una
práctica que mencionamos anteriormente en el contexto de los estudios observacionales.
Está estrechamente relacionado con el uso indebido de puntos finales sustitutos, pero
conlleva un mayor riesgo de generar pistas médicas falsas y, por lo tanto, es incluso menos
éticamente aceptable. En nuestro ejemplo del rastro de HRX, quizás los participantes en
el brazo experimental informaron una reducción en los síntomas depresivos no
observados en el brazo de control. Por supuesto, tal cambio podría ser de interés y podría
explorarse en investigaciones separadas. Sin embargo, lo más probable es que este cambio
se haya producido puramente por casualidad: si uno observa suficientes datos aleatorios,
como lo han hecho estos investigadores, a menudo será posible encontrar algunos sucesos
aparentemente "significativos" que son simplemente artefactos estadísticos.
El ejemplo anterior de lanzamiento de monedas proporciona un ejemplo simple de este
tipo de problema: si una moneda se lanza varias veces, a menudo será posible encontrar
un número de cabezas inusualmente largo. Supongamos que ocurren seis cabezas
seguidas; la probabilidad de que esto ocurra en una prueba de lanzamiento de una sola
moneda (de seis lanzamientos) es del 1.6%, sin embargo, en el contexto de muchos
lanzamientos de monedas, este resultado no es sorprendente y es simplemente un hecho
aleatorio. Esto es análogo a la selección de una gran cantidad de datos, ya sea de estudios
observacionales o experimentales, en busca de correlaciones: descubierta de esta manera,
es probable que dichas correlaciones sean espúreas.
Aunque la mayoría de los artículos de CAM publicados son meramente de opinión, especulación
o encuesta, han surgido varios estudios empíricos dirigidos a examinar la eficacia de CAM.
Anteriormente en este capítulo, señalamos que, a pesar de varias posibles salvaguardas contra
el sesgo, los ensayos clínicos de las modalidades de CAM son a menudo menos rigurosos y sus
hallazgos menos confiables. Hay varios factores que pueden contribuir a este fenómeno. Ya
hemos mencionado que la investigación clínica de alta calidad tiende a ser costosa, y los fondos
de investigación son particularmente escasos en CAM. A esto podemos agregar los siguientes
dos factores:
• Los investigadores de CAM a menudo son entusiastas de los tratamientos que investigan. En
consecuencia, a menudo se permite que el sesgo se introduzca en sus estudios.
Muchos observadores independientes han señalado que gran parte de la investigación en CAM
está lejos de ser rigurosa. De hecho, iríamos un paso más allá y afirmaríamos que muchos
estudios en esta área engañan activamente al público sobre el valor de la CAM. Como esto puede
parecer una afirmación audaz, en el siguiente capítulo, tenemos la intención de proporcionar
evidencia al respecto, centrándose en ejemplos de investigación clínica que aborden las dos
cuestiones principales de eficacia y seguridad de las terapias de CAM. La mayoría de los ejemplos
que damos contienen más de un defecto; de hecho, el lector cuidadoso sin duda podrá detectar
muchas de las violaciones de los principios de la investigación médica ética que discutimos
anteriormente. Sin embargo, sería más allá del alcance del presente capítulo detallar todos y
cada uno de los defectos en los ejemplos de investigación de CAM: ¡simplemente son
demasiados! En su lugar, nos centraremos principalmente en los siguientes temas:
• Investigación fraudulenta.
revisores A primera vista, este método tradicional ("revisión por pares") para filtrar documentos
de investigación parece ser riguroso y debería servir como una pantalla efectiva para la calidad.
De hecho, si los editores y los revisores son diligentes, están bien informados y son imparciales,
este método puede garantizar que no se publiquen documentos defectuosos. Sin embargo, este
sistema puede descomponerse de varias maneras. Los editores o, especialmente, los revisores
que son apresurados o insuficientemente expertos en el campo en cuestión pueden no
identificar los problemas. El problema de los revisores no diligentes y no expertos es un
problema en la publicación académica en general, y se ve agravado por el hecho de que el
modelo actual de revisión por pares se basa en el altruismo. En otras palabras, los revisores
pares no son recompensados por su trabajo. Esto puede llevar a los revisores a dedicar tiempo
insuficiente a la tarea. Otra consecuencia de la expectativa pro bono es que los investigadores
ocupados frecuentemente no están dispuestos a aceptar las solicitudes de revisión de las
revistas; por lo tanto, las revistas a menudo no tienen más opción que entregar la tarea a los
revisores que estén dispuestos pero con experiencia cuestionable.
Si bien los problemas anteriores no están de ninguna manera restringidos a las revistas CAM,
estas revistas son inherentemente más susceptibles a estos problemas que sus contrapartes
médicas tradicionales. Esto se debe a que pocos científicos competentes están dispuestos a
pasar un tiempo valioso en la revisión de la investigación CAM. De vez en cuando, incluso parece
dudoso que los editores de las revistas CAM realmente quieran que los científicos imparciales y
calificados examinen detenidamente los documentos presentados: si se pueden encontrar
científicos dispuestos, ¡el resultado más probable de su escrutinio será el rechazo! Pero los
editores deben llenar las páginas de sus revistas. En realidad, las revistas CAM asignan tareas de
revisión por pares a una gama limitada de entusiastas de CAM que a menudo han sido elegidos
por los autores del artículo en cuestión. La razón de ser de las revistas CAM y los investigadores
de CAM está inextricablemente ligada a la creencia en CAM, lo que resulta en una situación
autorreferencial que es permisiva para la aceptación de informes débiles o defectuosos de
eficacia clínica.
6. Conclusiones
Sin embargo, a pesar del gran progreso que se ha logrado en la mejora del diseño de la
investigación, muchos entusiastas de la CAM prefieren permanecer en la epistemia de las
edades oscuras y abogan por que la mejor fuente de evidencia de efectividad clínica reside en
el conocimiento tradicional y las observaciones subjetivas del profesional.
Sin embargo, algunos investigadores de CAM parecen ver la necesidad de ir más allá de la mera
tradición y las anécdotas, adhiriéndose a la idea de que los enfoques científicos establecidos
para la investigación proporcionan el mejor medio (o al menos un válido) para obtener un
conocimiento clínico confiable. Lamentablemente, sin embargo, cuando se analizan los artículos
publicados de los ensayos clínicos de CAM, con demasiada frecuencia se detecta un patrón
problemático común. A primera vista, el estudio parece ajustarse a las normas de una buena
investigación médica, pero en una inspección más cercana se hace evidente que esta apariencia
de rigor científico no es más que una apariencia que esconde la verdad, que el estudio fue
profundamente defectuoso en algún aspecto clave u otro . Además, el tratamiento estadístico
de los datos en los estudios CAM a menudo resulta ser fundamentalmente defectuoso.
Es crucial que los datos de los estudios clínicos se analicen cuidadosamente utilizando enfoques
estadísticos válidos. Desgraciadamente, se ha hecho evidente que, incluso en la investigación
médica general, este análisis se ha basado frecuentemente en suposiciones erróneas,
contribuyendo a la "crisis de reproducibilidad" que la ciencia en general está experimentando
actualmente. Sin embargo, los investigadores de buena fe están aprendiendo gradualmente a
mejorar sus enfoques para interpretar los datos, y de esta manera la ciencia está mostrando una
de sus características distintivas, a saber, la autocorrección. Sin embargo, el mundo de la
investigación CAM se está quedando atrás en estos desarrollos. Si bien los científicos han
publicado recientemente artículos académicos, artículos en Internet y publicaciones de blogs
sobre estos temas estadísticos, la comunidad CAM ha sido
18Por ejemplo, una búsqueda en la base de datos de publicaciones académicas Web of Science
(que incluye todas las principales revistas de CAM) que abarca el período 2007–2017 utilizando
varios términos de búsqueda relevantes (valor de p, crisis de reproducibilidad, piratería) dio
lugar a solo un documento de CAM. con el problema de la interpretación estadística
problemática de los datos clínicos (Benbassat 2016)