You are on page 1of 8

Documento descargado de http://http://zl.elsevier.es el 17/10/2013.

Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

CONFERENCIA CLÍNICA
Editor: F. Cardellach Caso: 55-2002
47.948

Análisis multivariante en investigación biomédica: criterios para la inclusión de variables
Erik Cobo
Departamento de Estadística e Investigación Operativa. Universitat Politècnica de Catalunya. Barcelona.

Los modelos de regresión múltiple, sea lineal, Cox o logística, son muy populares en la investigación biomédica por la posibilidad que ofrecen para controlar el efecto de terceras variables. Sin embargo, a menudo los investigadores, autores y lectores se preguntan qué criterios se deben seguir para decidir qué variables incluir en el modelo. Estas líneas pretenden aportar algunas claves. Para ello, en primer lugar se recuerda la necesidad de considerar aquellas variables relevantes que podrían determinar la variable respuesta que se está analizando, ya que su olvido podría originar que se confundieran entre sí los efectos de variables que se presentan juntas o correlacionadas1,2. En segundo lugar, se exponen los modelos de regresión múltiple y las propiedades estadísticas que debe cumplir la estimación obtenida en un estudio. A continuación, mediante dos ejemplos, se muestran las dificultades, los retos y las trampas que puede presentar el análisis multivariante. Finalmente se exponen 4 criterios que se debe tener en cuenta a la hora de seleccionar las variables que se incluirán en un modelo. Necesidad del ajuste Supóngase que, por el motivo que sea, la evolución de los pacientes ingresados en un determinado centro es mejor que la evolución de los pacientes de otro. Por ejemplo, en el primer centro (C1), la razón (u odd) entre evolución favorable (Y+) y desfavorable (Y–) está 2 a 1 (es decir, los que evolucionan favorablemente doblan a los que no lo hacen: «2»); mientras que en el segundo centro (C2) está 1 a 2 (es decir, los que evolucionan favorablemente son la mitad de los que no lo hacen: «1/2»). El cociente de estas dos razones (u odds ratio) vale 4 (2/ 1/2 = 4), indicando que en el centro C1 la razón entre evolución favorable y evolución no favorable es 4 veces superior que en el centro C2:
Y+ Y– Razón

vestigador mantendrá igual la razón entre tratados y controles en ambos centros. Por ejemplo, diseñará un estudio como el siguiente, en el que el idéntico equilibrio entre tratados y controles en ambos centros se traduce por una OR igual a 1:
X=A X=B Razón

C1 C2

90 90

90 90

1a1 1a1

Razón de razones = OR = 1

Es decir, en este ejemplo, el tratamiento esta balanceado entre centros, ya que la razón tratados con A frente a tratados con B es idéntica en ambos. Si no existieran diferencias entre los tratamientos, se podría observar, en cada centro, una situación como la siguiente:
C1 Y+ Y– Razón

X=A X=B
C2

60 60 OR = 1
Y+

30 30 IC del 95% = 0,5-1,9
Y–

2a1 2a1
Razón

X=A X=B

30 30 OR = 1

60 60 IC del 95% = 0,5-1,9

1a2 1a2

C1 C2

120 60

60 120

2a1 1a2

Razón de razones = odds ratio (OR) = 4

Es decir, la respuesta depende del centro y en C1 se curan 4 veces más. Si se desea comparar cierto tratamiento (X = A) con un control (X = B) en estos centros, un buen inPalabras clave: Regresión. Análisis multivariante. Ajuste. Confusión. Diseños observacionales y experimentales.
Conferencia celebrada el 21-3-2002 en el Hospital Clínic de Barcelona. Correspondencia: Dr. E. Cobo. Departament d’Estadística i Investigació Operativa. Universitat Politècnica de Catalunya. Pau Gargallo, 5. 08028 Barcelona. Correo electrónico: erik.cobo@upc.es

En ambos centros por separado, el tratamiento no tiene efecto: en el centro 1, ambos tratamientos (X = A y X = B) tienen la misma razón «2 a 1» entre evolución positiva (Y+) y negativa (Y-), conduciendo a una OR de 1, que indica que el tratamiento no tiene efecto. Y lo mismo en el centro 2; aunque la tendencia es ahora hacia una evolución negativa «1 a 2», dado que esta tendencia se observa por igual en ambos grupos, tampoco existe relación (OR = 1) entre tratamiento y evolución. Si este investigador quisiera presentar los resultados comparativos de los tratamientos sin distinguir el centro en el que se han obtenido, obtendría los siguientes datos, concluyendo también que no existe relación entre tratamiento y evolución:
Y+ Y– Razón

X=A X=B

90 90 OR = 1

90 90 IC del 95% = 0,7-1,5

1a1 1a1

Es decir, estudiando ambos centros a la vez, el tratamiento tampoco muestra efecto alguno. En resumen, como era deseable, este investigador cuidadoso obtiene los mismos resultados cuando realiza el análisis teniendo en cuenta la tercera variable centro (OR = 1), que cuando no la considera (OR = 1).

230

Med Clin (Barc) 2002;119(6):230-237

lo habría previsto en el diseño del estudio. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES ¿Qué pasaría si el investigador no hubiera previsto la posibilidad de que diferentes hospitales puedan tener diferentes preferencias en cuanto al tratamiento? En el primer centro. hay la misma conclusión al ajustar por Z que al «olvidar» Z. el tratamiento no está balanceado entre centros: en C1 se usa el tratamiento A 25 veces más que en el centro 2. como el investigador anterior. Para esquematizar el diferente papel que desempeñan las variables en estudio conviene asignarles sistemáticamente las letras que las simbolizan. Copia para uso personal. La fuerte relación entre los tratamientos en comparación y la tercera variable provoca que se confundan sus efectos: un investigador poco atento podría atribuir al tratamiento una diferencia en el efecto que es explicable por el centro. Sin embargo. cuando X y Z son independientes (es decir. y el control en el centro 2. La respuesta se suele representar por Y. las preferencias de sus médicos les llevan a tratar a 5 pacientes con X = A por cada caso tratado con X = B (razón: 5 a 1). al estudiar ambos centros por separado.6-3.5 70 110 IC del 95% = 1.119(6):230-237 231 . Así. aparece una relación «espuria» TABLA 1 Opciones para el ajuste Opción Fase Nombre Ventajas Inconvenientes Restricción Diseño Análisis Criterios de inclusión Análisis de un subgrupo Bloques (apareamiento) Estratificación (apareamiento) Modelado Covariancia. como en el modelo siguiente observaría una OR de 1.6 a 3. esta comparación estará sesgada a favor del tratamiento. Relación «espuria» entre X e Y originada por no considerar la variable Z relacionada con ambas. que indica asociación entre tratamiento y evolución: Y+ Y– Razón X=A X=B 110 70 OR ≈ 2. y obtendrá una OR de 2. Si este investigador realizara el análisis ajustando por centro. Por supuesto. Med Clin (Barc) 2002. esquemáticamente puede decirse que. si X y Z no son independientes.4-2.5 con un intervalo de confianza de 1. COBO E.3 2a1 2a1 Razón Y+ Y– X=A X=B 10 50 OR = 1 20 100 IC del 95% = 0.5). En cambio. este investigador no tiene en cuenta el centro del que proceden los datos y estudia únicamente la tabla conjunta. regresión. Las consecuencias de este mal diseño son muy importantes.Documento descargado de http://http://zl. un buen investigador no cometería este error. ya que habría considerado la variable centro en el análisis de los datos y presentaría los resultados ajustando por centro. Una representación gráfica de este fenómeno puede verse en la figura 1: cuando no se tiene en cuenta la variable Z.8 11 a 7 7 a 11 Al estudiar ambos centros juntos.3 1a2 1a2 Una vez más.elsevier. Aquí no engaña la intuición: si el tratamiento se estudia más en el centro 1.8. si por brevedad o descuido. el tratamiento no tiene efecto. están equilibradas o balanceadas).es el 17/10/2013. y podría presentar los resultados sin necesidad de recurrir al ajuste. indicativo de que no existe relación entre tratamiento y evolución: C1 Y+ Y– Razón X=A X=B C2 100 20 OR = 1 50 10 IC del 95% = 0. que tiene mejores resultados. otros Control completo Barato Simple de diseñar Simple de analizar Potencia Eficiencia Sin premisas Directa Cálculo simple Factible con pocos casos Redondea efectos menores Permite predicciones Permite variables continuas Permite varias variables Reduce la generabilidad Limitado número de variables Posible confusión residual (si las restricciones son amplias) Pierde flexibilidad Coste Dispersión de casos en estratos Diferentes estratificaciones Difícil «sumarización» Muchas premisas Elección del modelo Elección de variables Interpretación Parametrización del software Análisis por subgrupos Diseño Análisis Modelado estadístico Diseño Análisis Adaptada de Kleinbaum et al3. O mejor aún.4-2. no se obtiene la misma conclusión al ajustar o controlar por Z que al olvidarla. el tratamiento o la «causa» en estudio por X y las terceras variables relacionadas con la respuesta («covariantes») por Z. Ahora. En resumen. que tiene peores resultados. 1. mientras que en el segundo las preferencias son justo al revés (razón: 1 a 5). este diseño poco elaborado conduce a diferentes resultados cuando el análisis tiene en cuenta la tercera variable centro (OR = 1) y cuando no la considera (OR = 2. se prohíbe la transmisión de este documento por cualquier medio o formato. el tratamiento parece tener un efecto que en realidad no tiene. Las consecuencias de un mal diseño y un mal análisis eran imaginables. lo que conduce a un desequilibrio global que la razón de razones (odds ratio) cuantifica en 25: X=A X=B Razón X Z Y X Y C1 C2 150 30 OR = 25 30 150 5a1 1a5 Fig.

como el hecho de curar o no curar. para así controlar o anular su posible efecto y poder estimar la relación de la variable de interés X habiendo suprimido las posibles interferencias de las terceras variables Z.10. a la vez que se dejan igual. Pichini et al8 investigan la influencia del hábito tabáquico de la embarazada (X) en las medidas somatotrópicas del recién nacido (Y) teniendo en cuenta otras características (Z). en palabras. en un ejemplo de un modelo con una sola variable.. incluidos los futuros. De aquí el gran atractivo de estos modelos: se pueden dejar fijas las terceras variables Z. y que la señal de la pendiente. En el tercero. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES entre las dos variables con las que Z está relacionada. la respuesta es el tiempo hasta cierto acontecimiento de interés. hay tres grandes grupos de modelos: en el modelo lineal. a pesar de que estas variables pueden estar correlacionadas entre sí. ¿Cuál sería el cambio en la respuesta Y cuando la variable X1 aumenta una unidad y todas las demás variables permanecen constantes? Nótese que el cambio asociado a la respuesta Y será. de forma similar.10. o «independiente».es el 17/10/2013.03 • CD4Sem0 + ei Los errores típicos de estos estimadores han sido. Esto es lo que significa «independientemente». Se dispone del número de linfocitos CD4 a las semanas 0. se puede decir que los coeficientes βi representan la variación esperada en la respuesta Y por un aumento unitario en la variable Xi que le acompaña.87.10) en la semana 12. los conocidos.87 y 0. Dado que la relación ZY es fija y viene predeterminada. así como las ventajas que ofrece la asignación al azar del tratamiento. Regresión múltiple En un modelo de regresión múltiple se predice una cierta respuesta (outcome) mediante la combinación de una serie de variables «independientes». Éstas son. 1. Ejemplo: predicción de la cifra de linfocitos CD4 a las 12 semanas de tratamiento antirretroviral. Este modelo es fácilmente interpretable: un aumento de una unidad (1.03. pero intrascendentes. ésta confunde al estudiar la relación entre X e Y». Y concluyen: «El habito tabáquico […] se asoció […] de forma negativa con medidas somatotrópicas del recién nacido […]. de β1 unidades. pues. En el segundo.. el tratamiento anterior) o como Z (p. respectivamente. En cambio. En general. En otras palabras más habituales: «si no se tiene en cuenta la variable Z. los resultados de un modelo de regresión multivariante. precisamente. No se abordan. Tras ajustar por otras características de las madres y del recién nacido. Copia para uso personal. 23. el modelo de regresión lineal que se observaría en un estudio concreto se representa: Yi = b0 + b1X1i + b2X2i +. 4. Y aumenta β1 veces el incremento experimentado por la variable X1. 8 y 12 de 19 pacientes sometidos a tratamiento antirretroviral. + bKXKi + ei Como es imposible disponer de todos los pacientes. los autores antes mencionados han debido recoger un volumen razonable de datos en los que estimar sus modelos. y b) Z y X deben estar correlacionadas (ser «colineales»). que apunten en la dirección correcta del valor poblacional β que se desea estimar. COBO E. X e Y. resultado de la muestra. Veamos tres ejemplos de cómo se interpretan.elsevier. se sabe que la señal aportada por el valor 52. Así. en cambio. Martín et al9 analizan los ingresos por problemas relacionados con la medicación (PRM = Y) y dicen: «al realizar el análisis multivariante. los detalles técnicos de estos modelos5-7. Estas posibilidades. Así. se utilizará el modelo lineal. la respuesta es una variable cuantitativa.Documento descargado de http://http://zl. se debe confiar en que las estimaciones muestrales b cumplen ciertas propiedades estadísticas. bien sea con un buen diseño.. es decir. Para que exista confusión deben darse dos condiciones: a) la tercera variable Z debe ser predictora de la respuesta Y. indepen- 232 Med Clin (Barc) 2002. como la presión arterial sistólica. la respuesta es una dicotomía. sin modificar. Eficiencia estadística de las estimaciones Para llegar a sus conclusiones. pero desconocidos. Significado «independiente» de los coeficientes Para estudiar el significado de las variables incluidas en un modelo de regresión múltiple. El reto de la inferencia estadística consiste precisamente en realizar la estimación de los coeficientes del modelo en las mejores condiciones posibles. lo que suele requerir muestras de cierto tamaño. las ventajas del ajuste en el análisis: complementan al diseño del estudio en el control de las terceras variables Z. Se verá más adelante la importancia de si estas variables predictoras deben etiquetarse como X (p. debe ser matizada por un ruido debido al proceso de estimación de 0. En el primero. en el modelo logístico. y b) que los valores obtenidos en diferentes muestras oscilen poco alrededor del valor poblacional. + βKXKi + εi donde Y representa la respuesta de interés y las X representan diferentes variables que ayudan a predecir o caracterizar el valor de esta respuesta Y. el centro anterior). el objetivo de estas líneas es considerar qué variables incluir como predictoras. valores del modelo en toda la población de pacientes reciben el nombre de «parámetros» y se representan por la letra griega β..56 + 1. todas las restantes. Así.119(6):230-237 . ya fueron comentadas con anterioridad4.56 se debe matizar por un ruido de 23. Sea cual sea el tipo de variables. bien sea en el análisis posterior mediante el ajuste estadístico. esta asociación negativa se confirmó». Para empezar. A continuación se expone cómo realiza este ajuste el modelo de regresión. Por ello. Sea cual sea el modelo utilizado. el modelo de regresión permite hablar del efecto de una ellas aislado. o también: «los efectos de X y Z en Y están confundidos». y en el modelo de riesgos proporcionales de Cox. se predice el valor de los linfocitos CD4 observado a las 12 semanas de iniciado el tratamiento a partir de los valores iniciales o basales obtenidos en la semana 0. mientras permanecen fijas todas las demás variables..00) de linfocitos CD4 en la semana 0 va acompañado de un aumento de 1.03 (EE = 0.. ej. Por otro lado. Los auténticos. Real et al10 concluyen: «El análisis de regresión logística demostró que […] fueron significativamente independientes en el modelo». las variables que han presentado una relación independiente con la presencia de ingreso por PRM han sido los antecedentes de ingreso por PRM y el nivel socioeconómico». ej. el atractivo de este modelo es que se puede estudiar el efecto del aumento de una sola de estas variables. Las dos fundamentales son: a) la ausencia de sesgo. Las opciones disponibles para controlarlas3 se resumen en la tabla 1. El error típico o estándar de la estimación cuantifica esta oscilación y se puede considerar como el nivel de ruido introducido por el proceso de muestreo. nuestro diseño no puede «romperla» y los esfuerzos se dirigen a anular la colinealidad. que tiene la forma siguiente: Yi = β0 + β1X1i + β2X2i + . se denominan «estimaciones» y se representan por la letra latina b. En función de la respuesta. Las estimaciones proporcionan el modelo siguiente: CD4Sem12 = 52. se prohíbe la transmisión de este documento por cualquier medio o formato. del efecto de las otras.

b3 = 0. La primera dificultad es la de su significado. Modelos univariantes y multivariante Semana R2 (%) Univariante b SE(b) R2 (%) Multivariante b SE(b) 0 4 8 86. por un lado. EE(b1) = 0.04 + 0. Med Clin (Barc) 2002. es decir. es decir. 2.02 0.06. casi tan grande como la señal. asumiendo que estos últimos permanecen constantes. un error 3 veces superior equivale al que hubiéramos obtenido en una muestra 9 veces inferior.58.06 • CD4Sem12 + ei En la tabla 2 puede observarse que las señales respectivas.25. ¿Y quién se cree los resultados de una muestra de dos casos? La paradoja es que se dispone de menos información a pesar de tener más variables.25 0. 4 y 8. pero por otro. 0.1 0.58 • CD4Sem8 + 0.31 + 0.0 1. SE(b): error típico de estimación de b («ruido»). todos los linfocitos CD4 están aumentados en 52. b2 = 0. Por otro lado.06 0. han disminuido. lo que apunta a la importancia de estos coeficientes.4 89.56 (EE = 23. continúa siendo relativamente superior a su ruido.31.119(6):230-237 233 . son muy similares. En cambio.92 0.08 93.elsevier.06 = 0. Nótese que el cociente entre la señal (el valor del estimador) y el ruido (su error típico) es en todos ellos superior a 10. Los resultados de repetir este modelo univariante que intenta predecir los valores a las 12 semanas a partir de los linfocitos CD4 de las 4 semanas.29.58 + 0. Se obtienen. En resumen. ¿puede darse esta situación? Dado que el número de linfocitos CD4 a las 0.31 • CD4Sem0 + 0. que incluye simultáneamente los linfocitos CD4 de las 0. 600 500 400 300 200 100 0 0 4 Semanas 8 12 dientemente del valor basal.es el 17/10/2013. la figura 2 indica que la variabilidad de éstos oscila desde casi 0 hasta casi 800. ahora. si se quiere saber cómo aumenta el peso al aumentar la altura. por un lado.Documento descargado de http://http://zl. Y el de la semana 12. EE(b3) = 0. fijas.87) unidades a las 12 semanas. Para la semana 0 hay una señal. se debe interpretar cada coeficiente recordando que las otras variables están. COBO E. Es un problema muy grave. EE(b2) = 0. los tres coeficientes suman.17 y 0. El coeficiente asociado a los linfocitos CD4 de la semana 8 significa la variación en el número de linfocitos CD4 a la semana 12 independientemente de los linfocitos CD4 a las semanas 0 y 4. se sabe que si una de estas variables cambia. La segunda dificultad que se ha visto es que el error típico de estimación se ha hecho unas 3 veces superior. Recuento de linfocitos CD4 de 19 pacientes al inicio (0) y a las 4.56 (EE = 23. al que se acercaba antes cada variable por separado. el valor 1 (0.17: es el único en el que la prueba de significación sería significativa.31 0. también lo harán las otras. prácticamente. Se verá que su interpretación es. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES 800 700 Linfocitos CD4 (×106/l) Fig.17 0. unos resultados coherentes y fácilmente interpretables. y un ruido. por otro.06 0. hay mayor precisión cuanto más amplia sea la perspectiva y mayor rango de alturas se estudie. incluso queda muy por debajo de su ruido de estimación. el modelo de regresión múltiple. Fuera cual fuera el valor basal. Sólo el de la semana 8.10 0. ambas derivadas de la elevada correlación o colinealidad entre las variables introducidas como predictoras. y de los de las 8 semanas.1 92. al que hay que estar muy atento. 8 y 12 semanas de iniciado el tratamiento antirretroviral. Copia para uso personal.87) unidades en la semana 12. 4 y 8 semanas representa la misma variable. ¿Qué ha pasado? ¿Hasta qué punto este nuevo modelo. En el ejemplo de los linfocitos CD4. han debido repartirse su capacidad predictiva: de hecho. los coeficientes. b1 = 0. pero cuando se deja fijo el valor de TABLA 2 Predicción de la cifra de linfocitos CD4 a las 12 semanas a partir del número observado en las semanas 0.29 R2: descenso porcentual en el error de predicción. se prohíbe la transmisión de este documento por cualquier medio o formato.95). Así. b: estimación del coeficiente de regresión («señal»). de unos dos casos en lugar de 19. más complicada. los linfocitos CD4 aumentan en 52. Dado que este error depende de la raíz cuadrada del tamaño muestral.86 0.29. por tanto. Pero. en el modelo. con tres variables.58 0. Tanto que se podría prescindir de algunos de los coeficientes. ¿Y por qué sucede? Por una razón muy simple: el error típico de estimación de los coeficientes de regresión es menor cuanto mayor es el rango de variabilidad de la variable independiente. es mejor que los anteriores con una sola? Consecuencias de la correlación entre variables «independientes» La estimación del modelo de los linfocitos CD4 presenta dos dificultades desde el punto de vista estadístico. así. 4 y 8 semanas es: CD4Sem12 = 22. ¿realmente podemos imaginar un incremento en los linfocitos CD4 de una de estas semanas sin que aumenten los otros?.25. introducir variables demasiado similares dificulta la interpretación de sus coeficientes. los errores típicos de estimación de los coeficientes de las tres variables han aumentado mucho: 0.

disminuye considerablemente la variabilidad de la edad del otro. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES los linfocitos CD4 de una semana concreta. además de la causa X y de la respuesta Y. Por poner un ejemplo muy simple. Este diseño no sería ético.es el 17/10/2013. pero es que además no tendría sentido práctico en nuestro entorno sociocultural. están las terceras variables Z. la mejor respuesta vendría de un diseño experimental en el que se estudiara la edad de cada uno de los padres dejando equilibrada la del otro. Nótese que no se precisa relación de causaefecto4. Por ejemplo. un tratamiento farmacológico o un consejo dietético pueden ser considerados como X. Así. ¿Se quiere realmente conocer el cambio que corresponde a un incremento de una unidad en los linfocitos CD4 de la semana 4 cuando se dejan fijos los de la semana 8? ¿Realmente pueden aumentar los linfocitos CD4 de una de estas semanas sin que aumenten los de las otras? ¿Puede darse esta situación? Por ello. por tanto. Y el médico no se plantea cambiar estos valores. difícilmente sería ético asignar un voluntario a este tóxico X. por lo que en el estudio confirmatorio del efecto de la causa X en la respuesta Y se puede obviar la prueba de hipótesis sobre la significación estadística de las variables Z y concentrar los riesgos estadísticos de error en el auténtico objetivo del estudio: la relación entre X e Y dadas las condiciones Z. ya que ambas variables van asociadas al desarrollo de un país. pero no tiene sentido aconsejar a un paciente varón que cambie de género. el género o la edad. para las que se desea saber si. Estudios previos deben haber establecido la relevancia de las variables Z como predictoras de la respuesta y. La probabilidad de tener un hijo con el síndrome de Down es aproximadamente de uno cada 600 embarazos en la población general. Así. por ejemplo. se puede reducir la incertidumbre sobre la mortalidad por cáncer de un país conociendo el nivel de uso de ordenadores. Claves para la inclusión de variables en el modelo Primera clave: ¿el objetivo es predecir o intervenir? En primer lugar. Estos conocimientos previos son los que aconsejan incluirlas en el modelo. como posibles elementos de confusión. hay dos preguntas muy diferentes: ¿cuál es el efecto de esta causa?. entonces el objetivo es predecir. un ensayo clínico sobre un nuevo fármaco. Puede existir una pregunta científica sobre si envejecen los gametos femeninos. Nótese que ésta es. Cuando el objetivo es predecir. ¿Cuál es el objetivo de establecer esta relación entre la edad de los padres y el riesgo de síndrome de Down: intervenir o predecir? Si lo que se pretende es cambiar la edad de la madre o del padre para disminuir el riesgo. Ahora bien. para poder establecer la necesaria relación causal. las variables Z se incluyen en el modelo porque son condiciones previas sobre las que se estudia el efecto de la hipotética causa. Sin embargo. En cambio. Ejemplo 1: síndrome de Down y madres añosas. en aquellas causas potenciales cuyos efectos cabe esperar que sean negativos. con padres de 20 y de 40 años. Por ejemplo. Su pregunta es: «En este paciente de estas características. Así. COBO E. también está adelantando la edad de su pareja. En el siguiente y último apartado se comentan 4 claves que deben ayudar a decidir qué variables se incluyen en el modelo. Si el objetivo es predecir. no se propondrá intervenir sobre el uso de la informática para hacer descender la mortalidad por cáncer. En ésta. Copia para uso personal. se trata de una intervención. y al igual que sucedía con los linfocitos CD4. En cambio. se utiliza el valor de una variable para acercarse al valor de otra. se prohíbe la transmisión de este documento por cualquier medio o formato.11. Finalmente. cuya formulación es mucho más exploratoria. pero si se desea seleccionar aquellos embarazos con elevada probabilidad de síndrome de Down. por supuesto. por ejemplo. Conviene distinguir si el efecto de esta causa X podría ser beneficioso o no. Las variables X representan las variables potencialmente intervenibles. Si el objetivo es más ambicioso y se pretende intervenir sobre una variable para cambiar el valor de otra. ¿se me irá el dolor de cabeza?». su única utilidad práctica es predictiva. es ético plantear un experimento en seres humanos. por otro. esta reducción de perspectiva aumenta la incertidumbre de la estimación.119(6):230-237 . Si la expectativa es de un efecto positivo. Usualmente se trata de condiciones o atributos de los casos como. existe una serie de variables independientes que se introducen en el modelo. es necesario que exista relación de causa-efecto. ¿es porque me he tomado una aspirina?». si se deja fija la edad de uno de los padres. pero en nues- 234 Med Clin (Barc) 2002. el mejor consejo que se puede dar es que se piense cuidadosamente antes de introducir variables en un modelo. de nosotros. simétrico. sino que las unidades ya se presentan con dicho valor. mientras que de la segunda sería: «se me ha ido el dolor de cabeza. los masculinos o ambos. Dado que se pretende cambiar el valor de X. si las variables de las que se quiere tener una interpretación independiente no son en absoluto independientes. cambiando su valor. ¿qué se puede hacer?».Documento descargado de http://http://zl. o se pretende intervenir sobre su curso? En la primera finalidad. todas ellas tienen un papel idéntico. es más importante cuantificar la capacidad predictiva del modelo (¿cuánto se reduce la incertidumbre?) que interpretar el significado concreto de un coeficiente del modelo de regresión. Nótese que el paciente llega al médico con un valor previo en estos atributos. se aparearían tanto las madres de 20 como las de 40 años. Sólo será posible obtener información a partir de estudios observacionales. aumentan los errores típicos de las estimaciones y los coeficientes del modelo pierden significado.elsevier. y ¿cuál o cuáles son las causas de este efecto? Un ejemplo de la primera sería: «si me tomo una aspirina. se puede modificar el curso de los acontecimientos que representa la respuesta Y. éste debe depender. Antes de introducir la tercera clave conviene aplicar las dos previas en sendos ejemplos muy cotidianos. Segunda clave: ¿cuál es el papel de cada variable en el modelo? Además de la respuesta Y en estudio. la interpretación de los coeficientes de regresión: β1 representa el cambio que se obtendría en la respuesta Y por cada incremento manipulado de una unidad en el efecto X1 a nivel constante de las demás variables. precisamente. si el objetivo es intervenir. Dado que su valor no es determinable o asignable por el clínico. se sabe que a mayor edad de uno. ¿Se plantea una madre o un padre buscar una pareja «independientemente» de su propia edad? Si una posible madre decidiera adelantar su edad de maternidad. En resumen. las de la semana siguiente son casi constantes: su variabilidad se ha reducido drásticamente. más concretas. adivinar acontecimientos futuros. La farmacología clínica y la epidemiología «prospectiva» suelen abordar preguntas del primer tipo. Si el objetivo fuera intervenir. cabe esperar mayor edad del otro. ¿y la edad del padre? Nótese la elevada correlación (colinealidad) entre la edad de los padres: por un lado. conviene distinguir entre las causas potenciales (X) y los meros atributos o condiciones (Z). en tanto que la farmacoepidemiología y la epidemiología «retrospectiva» se concentran en preguntas del segundo tipo. al menos potencialmente. es importante considerar la finalidad del modelo: ¿se desea predecir. pero asciende hasta uno cada 60 en las mayores de 36 años. es bien sabido que la esperanza de vida es mayor en las mujeres. por igual.

Cuarta clave: ¿el estudio es exploratorio o confirmatorio? La cuarta clave hace referencia a la perspectiva científica desde la que se analizan los datos: en un plano puramente exploratorio. Correlación del descenso de la presión arterial sistólica y diastólica (ambas en mmHg) en 10 ensayos clínicos12. Puede verse claramente que. En cambio. La discusión está servida. Es bien sabido que la evidencia que aporta una única muestra puede ser utilizada bien para construir una teoría o bien para contrastarla. donde se justifica todo el diseño y todo el análisis. para hacer la predicción. Ambas estuvieron significativamente relacionadas con un incremento del riesgo de ictus. más temprana en el tiempo. se debe reducir la dimensión del problema. ¿qué variables se deben aparear y cuáles no? Si se está estudiando el efecto del hábito tabáquico. Ciertamente. el patrón de relación entre la presión sistólica y el riesgo de ictus permaneció estable. sino que los transforma en nuevas variables con significados más interesantes.119(6):230-237 235 . se pretende sancionar una hipótesis previa. Si a un clínico le preocupa la presión arterial en general. muy similar al del número de linfocitos CD4. el consejo de Cox14 es que estudie el promedio de ambas. Por tanto. bien sea ratificándola y elevándola al rango de teoría. Copia para uso personal. En todas estas propiedades. el consejo del estadístico será que emplee la diferencia entre ambas presiones. no se deja fija la otra. pero no para ambos propósitos11. el modelo estadístico selecciona una de ellas. la edad de la madre antecede a la del padre.es el 17/10/2013. Desde una perspectiva exploratoria es lícito analizar los datos con cualquier herramienta de análisis e incluyendo cualquier tipo de variables. Todo vale: se torturan los datos en busca de nuevas ideas o de nuevas hipótesis. es difícil creer que se pueda modificar una de ellas dejando fijas las demás. desde una perspectiva confirmatoria. se pretende intervenir sobre la presión arterial para disminuir el riesgo de ictus. Entre los argumentos favorables destaca la casi independencia entre estas nuevas variables. formación relevante. sino que debe formularse la pregunta en términos más apropiados. En la tabla 3 y la figura 3 se indica el descenso alcanzado por cada uno de ellos en ambas presiones alteriales. Para solucionar tanto los problemas prácticos sobre el significado de los coeficientes como los teóricos sobre el incremento de la variancia de la estimación. lo comentado aquí sobre el ajuste durante el análisis también se aplica al ajuste durante el diseño: en un estudio apareado de casos y controles. en ausencia de un tratamiento que permita modificar sólo una de ellas sin alterar la otra. y su elevada colinealidad conduce a estimaciones inestables de los parámetros.973 40 Fig. No estamos defendiendo que se deba renunciar a recoger toda esta información. la hipótesis previa debe estar perfectamente documentada en el protocolo del estudio. ¿Está fallando el método estadístico o la formulación de la pregunta? Ahora el objetivo pretende ir más allá de la predicción. todos ellos aleatorios. El investigador no comunica los valores observados en cada determinación. ¿se puede bajar la PAD dejando fija la PAS? El mismo original12 presenta datos de 10 ensayos clínicos sobre fármacos antihipertensivos. con lo que se solucionan los problemas derivados de la alta correlación que tienen la sistólica y la diastólica. Tercera clave: ¿tienen las variables significado independiente? Así pues. se prohíbe la transmisión de este documento por cualquier medio o formato. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES tro entorno no es una pregunta con implicaciones cara a una intervención. pero ¿se puede reducir la presión arterial sistólica (PAS) dejando fija la diastólica (PAD)? O recíprocamente. bien definiendo una combinación que retenga la in- 25 15 5 10 20 30 r = 0. bien sea rechazándola y abandonándola. ya que le informan de la velocidad de absorción. mientras que el de la diastólica se diluyó»13. la otra. COBO E. si las variables que se introducen guardan entre sí una elevada correlación o colinealidad. o bien en un plano confirmatorio. más fiable (en el sentido de obtener valores más similares en sucesivas determinaciones) e incluso más fácil de interpretar. aquella variable que sea más barata. Se ha comentado el ejemplo de la presión arterial media y de la presión arterial diferencial. en el Copenhagen City Heart Study12 las incluyeron en modelos de regresión múltiple. Los investigadores suelen introducir ambas variables en el modelo. y en otras investigaciones. conocido como presión arterial media. 3. En unas investigaciones. mientras se está bajando una de las presiones. introducir ambas variables en un modelo de regresión múltiple carece de sentido. Ejemplo 2: ¿presión sistólica o diastólica? Otra pregunta habitual implica a las presiones arteriales sistólica y diastólica: «para determinar la importancia relativa de las presiones arteriales sistólica y diastólica en la predicción del riesgo de ictus. que deben siempre ser complementadas con el criterio clínico que les proporcione significado17. Y si lo que le preocupa al clínico es que pueda variar una presión mientras la otra permanece fija.elsevier. Ahora. Sin embargo.Documento descargado de http://http://zl. bien eliminando alguna de las variables. son las determinaciones múltiples en farmacocinética para conocer la concentración plasmática de sucesivos momentos a lo largo del tiempo. Si se acepta que el objetivo es identificar aquellos embarazos con una probabilidad de síndrome de Down lo suficientemente elevada para compensar los riesgos de exploraciones complementarias cruentas. al introducirse simultáneamente en el modelo. Otro ejemplo. Existen diferentes técnicas estadísticas para proponer estas nuevas variables mediante combinación de las variables originales15. Como análisis TABLA 3 Reducciones medias de la presión arterial sistólica (PAS) y diastólica (PAD) en 10 ensayos clínicos aleatorizados de antihipertensivos12 Reducción media (mmHg) PAS PAD 43 27 31 19 25 12 18 10 20 8 18 11 12 4 20 8 14 7 10 4. ya que recoge toda la información sobre la cantidad de presión contenida en ambas variables. se puede escoger.5 Med Clin (Barc) 2002.16. generador de ideas. de la velocidad de eliminación o de la cantidad de fármaco en la sangre. Y por supuesto. ¿debe dejarse fijo el consumo de alcohol? La respuesta depende de si se dispone de una intervención sanitaria que permita disminuir un hábito sin modificar el otro. se pretende también modificar el riesgo de ictus interviniendo sobre la presión arterial.

En resumen. ¿qué papel desempeña cada variable en el análisis?. quiero resaltar tres diferencias entre ambos. ¿Son realmente independientes? (Colinealidad) Perspectiva exploratoria o confirmatoria Reduzca la dimensión del problema Use variables que tengan significado «independiente» Use variables tempranas. Josep M. y. se prohíbe la transmisión de este documento por cualquier medio o formato. Objetivo del estudio 2.. Si se desea predecir. o bien basta con predecir el valor de esta variable para poder anticipar otras medidas?. COBO E. no tiene sentido introducir ambas en el modelo de regresión. Puede pensarse en una transformación de ambas. las terceras variables conocidas.. mediante la asignación aleatoria. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES Muestra A Conocimiento previo Análisis exploratorio Muestra B Hipótesis Análisis confirmatorio casos. Dr. Y es más arriesgado. En la tabla 4 se pretende resumir estas recomendaciones. Conclusión Se han comentado 4 claves que pretenden ayudar a definir las variables que se introducirán en el modelo. Se pretende «intervenir»: X ..119(6):230-237 . elíjanse aquellas variables que permitan realizar más cómodamente esta caracterización previa de los TABLA 4 Cuatro claves para la inclusión de variables 1. 236 Med Clin (Barc) 2002. Alejandro de la Sierra e Ilonka Zsolt me proporcionaron la bibliografía sobre los datos acerca de la presión arterial. Erik Cobo: Clásicamente se ha considerado el ensayo clínico como el «patrón oro» en investigación. Grau: ¿Qué estudios son mejores: los experimentales o los observacionales? Dr. del Hospital Universitari Germans Trias i Pujol.es el 17/10/2013. en segundo lugar. mientras que en la confirmatoria los datos deben ajustar el modelo («estos datos. en un cambio de variables con las que conceptualizar el entorno. Se desea controlar (Z: atributos. con una hipótesis previa perfectamente especificada. la única que es inherente a la experimentación es la tercera. De estas tres ventajas. como se hace con las determinaciones de los valores farmacocinéticos. se ajusta mejor a estos datos?»). mediante el ajuste. Con ello no pretendo afirmar que establecer una nueva dimensión sea fácil. segunda clave: especialmente en el caso de una intervención. covariantes relacionadas con la respuesta Y 3. estadístico. la auténtica investigación es aquella que puede resultar en un cambio de paradigma. Agradecimientos Teoría Fig. Los Dres. fiables Condicione sólo por variables previas Busque siempre la reproducibilidad de los resultados Si el estudio es confirmatorio. y cuarta clave: si se pretende que las conclusiones tengan la credibilidad de un estudio confirmatorio. Lluís Jover. Si una variable no puede variar a nivel fijo de otra. Nada más lejos del popular «ponlas todas y que elija el programa». que además de estas variables conocidas. los diseños experimentales también permiten controlar. por último. Copia para uso personal. los estudios experimentales suelen acompañarse de un diseño depurado que controla. baratas. Cualquier desviación le hace perder su carácter confirmatorio y lo convierte en exploratorio. condiciones. en primer lugar. Modificar . Papel de las variables Respuesta Y: variable cuyo valor se desea Independientes: variables que Debo agradecer a la Dirección de Docencia del Hospital Clínic de Barcelona su invitación para dar esta charla y a tres instituciones que en los dos años previos me permitieron ir depurándola: el Institut Municipal de la Salut de Barcelona. De todas maneras. debe tenerse muy claro qué se puede modificar (X) y en qué condiciones (Z). 4. En la figura 4 se esquematiza el momento del conocimiento científico en el que se emplea cada perspectiva de análisis.. Para recordar la diferencia entre ambas perspectivas. Carme Borrell.elsevier. Predicción Disponer de un modelo predictivo . el análisis debe seguir fielmente lo especificado en el protocolo. la necesidad de un protocolo en los estudios experimentales. La idea de preparar este tema surgió a raiz de una pregunta de la Dra.. podemos decir que en la exploratoria el modelo se ajusta a los datos («¿qué modelo. tercera clave: ¿hasta qué punto las variables introducidas en el modelo tienen significado independiente?. Si se acepta que las variables desconocidas puedan tener menor relevancia. hay metaanálisis18-20 que ofrecen resultados similares a los estudios experimentales y observacionales. Los datos sobre los linfocitos CD4 provienen del Dr... Sin embargo. las terceras variables desconocidas. no hay duda. primera clave: ¿se pretende modificar el valor de una variable mediante una intervención. Entre las personas que con generosidad me han aportado sus críticas. Objetivo del análisis estadístico según la existencia previa de hipótesis. ¿confirman o rechazan el modelo previo?»). Se utilizan para realizar la predicción Intervención Interpretar los coeficientes para estimar el efecto de la intervención . más simple. Anticipar . ¿sobre qué variables se desea realizar la intervención?.. Bonaventura Clotet. Guadalupe Gómez y José Antonio González. Sin embargo. ahora sólo vale lo especificado en el protocolo.. quiero destacar a los doctores Francesc Cardellach. Y si lo que se quiere es realizar una intervención. dado que implica un cambio del punto de vista.Documento descargado de http://http://zl. ¿cuáles representan simplemente atributos previos que definen las condiciones de la investigación?. el Servei d’Estadística de la Universitat Autónoma de Barcelona y la Fundació de Lluita contra la sida.. un estudio observacional con un buen protocolo y un buen diseño puede y debe ser muy informativo. siga fielmente el protocolo Ratifique la capacidad de predicción en una nueva muestra Complemente con criterios de Hill si no puede asignar X 4. garantiza el carácter confirmatorio de las conclusiones.

mediante los criterios de inclusión) se disminuye la necesidad de ajustes posteriores. introducirlas todas a la vez y que el programa estadístico seleccione las más significativas? Dr. 1999.117:377-85. Unos son mejores en algunos aspectos y otros en otros. el hecho de introducir o eliminar una variable con frecuencia cambia significativamente los resultados: ¿qué tipo de ajuste sería el aconsejado? Dr. unos criterios de inclusión muy estrictos pueden comprometer la selección de pacientes para el ensayo. Nielsen WB. 115:291-301. Med Clin (Barc) 2001. En cuanto al tipo de ajuste. Nose Y. Lo que debe hacerse en estas circunstancias es plantear al estadístico la posibilidad de emplear técnicas que permitan equilibrar los grupos sin necesidad de recurrir a criterios de inclusión más restrictivos. por ejemplo. Morineau A. 4. Pacifini R. Cobo E. tan sólo se detallan en manuales técnicos. Ascaso J. Copia para uso personal. quiero insistir en que en la fase de diseño deberían identificarse en el protocolo las variables relevantes por las que se desea ajustar. cuando se construye un modelo estadístico. Chalmers AF. Ascaso P. Kenjo Y. exploratorio.1-124.118:53-6. Buckingham: Open University Press.95:702-8. ej. Cox DR. 1998. Alejandro de la Sierra: Actuando así. 342:1887-92. 16. 1995.elsevier. Dr. Martínez-González MA. Emili Ros: Existen muchos programas de estadística a disposición de los investigadores y los resultados que proporcionan no siempre son idénticos: ¿cuál aconsejaría? En segundo lugar. 20. Por otro lado. controlled trials. 17. Tuset M. Concato J. Med Clin (Barc) 2002. Carné X. Logistic regression: a self-learning text. pero al menos se habrá logrado dar un primer paso. 3rd ed. McKee M. E. que deberían resolverse con un cambio o una selección previa de las variables. mi consejo es solicitar ayuda a un experto en metodología estadística. Cobo: Efectivamente. What is this thing called science? 3rd ed. New York: SpringerVerlag. Dr. 9. ¿Qué es una variable de confusión? Med Clin (Barc) 2001. Lindestrom E. Todas son significativas a nivel bivariante. Kupper L. N Engl J Med 2000. tanto si se introduce como si no se introduce una variable en el modelo. Altman DG. 7.1996.119(6):230-237 237 . random allocation system using the minimization method for multiInstitutional clinical trials.Documento descargado de http://http://zl. Josep Terés: Un problema que hay que tener en cuenta es que los estudios muy controlados en la fase de diseño con frecuencia no son representativos de la población general a la que se deberá aplicar el resultado. no hay que cerrar la puerta al mensajero y no debe considerarse más fácil el ajuste futuro que el presente. Jensen GB. Survival analysis: a self-learning text. 3. pero al introducirlas todas surgen los problemas ya comentados.111:73-7. y éste es un tema realmente opinable. Black N. 14. Elevated bood pressure as a risk factor for cardiovascular and renal disease. Dr. Royston P. Antoku Y. Smith H. Aun en esta situación. Hartz AJ. es más importante tener una idea clara de lo que en realidad ocurre. E. Vall O. Campbell MJ. con frecuencia las condiciones para incluir a un paciente son tan estrictas que los estudios no se pueden llevar a cabo por falta de pacientes. Is diastolyc hipertensión an independent risk factor for stroke in the presence of normal systolic blood pressure in the middles-aged and elderly? Am J Hypertens 1997. 5. BMJ 1990. Applied regression analysis. Horwitx RI. Med Clin (Barc) 2002. Med Clin (Barc) 2000. Quizá el método de control pueda adoptarse más adelante. A comparison of observational studies and randomized. Existe un procedimiento llamado minimización21 que pretende obtener el máximo equilibrio entre los grupos en comparación. COBO E. Handa E. Ribas J.2:I-iv. Draper N. observational studies. Irala J.. An easily customized. Buekens P. una práctica habitual es introducir en el modelo las variables que han resultado previamente significativas. 10.117:641-4 11. Aluja T. Problemas relacionados con la medicación como causa del ingreso hospitalario. Britton A.17(Suppl 2):7-13. intentaré contestar a una pregunta que se plantea con relativa frecuencia: ¿el ajuste final que proporcionan los modelos de regresión múltiple puede sustituir al engorroso ajuste previo en la fase de diseño? En mi opinión. cuanto antes se consideren las posibles dificultades. REFERENCIAS BIBLIOGRÁFICAS 1.342:1878-86. Dr. si la preocupación es controlar las variables que son posibles confusoras. 1982. De lo contrario. Cobo: Programas. existen diseños muy interesantes que siguen también a los pacientes que rehúsan la distribución aleatoria y permiten comparar si el efecto observado en los pacientes que la aceptan es el mismo que el observado en los pacientes que la declinan. E. Cobo: Es cierto. Whelton PK. Figueroa C. Sanderson C. Causality: some statistical aspects. De esta manera. Codina C. McPherson K. Basanta ML. ciertamente. Benson K. el efecto estimado de la causa en estudio cambia poco.118:205-10.es el 17/10/2013. Med Clin (Barc) 2002. se prohíbe la transmisión de este documento por cualquier medio o formato. New York: Wiley. factores de riesgo de una enfermedad. Factores asociados con el ingreso hospitalario de pacientes diabéticos con ulceración en el pie. 2. New York: Springer-Verlag. Por ello. et al. and the hierarchy of research designs. Si acaso. Luego ya se verá si estos resultados obtenidos en la pequeña población son generalizables. 15. 62:45-9. E. New York: Van Nostrand. Los diferentes resultados entre ellos suelen deberse a matices muy específicos que. Dr. Guillém-Grima F. Analysis of serial measurements in medical research. 8. hay muchos. Puig C. Si me lo permiten. Mathews JNS. lo mejor es especificar claramente las variables clínicamente relevantes en la fase de diseño. Barcelona: EUB. por el contrario. Lebart L. Health Technol Assessment 1998. 12. de mayor margen de maniobra se dispondrá para solucionarlas de la forma más eficiente posible. Necesidad y limitaciones de la asignación aleatoria. Martín MT. conviene recordar el ejemplo de los linfocitos CD4. Nogué S. J R Statist Soc (A) 1992.300:230-5. se puede hablar de análisis confirmatorio. Morgenstern H. Esteban Poch: Cuando se dispone de muchas variables como. Real J. Piron M. Esto sería perfectamente correcto en un estudio exploratorio. que podrá aconsejar y orientar en cada caso particular. Morineau A. Cabe recordar también que si se controla una variable confusora en la fase de diseño (p. Efectos neonatales del hábito tabáquico durante el embarazo y determinantes sociodemográficos en Barcelona. Randomized controlled trials. 19. Med Clin (Barc) 1990. 21. Shah N. He J. introducir en el modelo únicamente las variables que son significativas en el análisis bivariante o. por cuestiones comerciales. aunque en mi opinión. 18. Kinukawa N. Kleinbaum D. Necesidad y limitaciones del ajuste. 1996. Paris: Dunnod.10:634-9. Comput Meth Program Biomed 2000. Vestbo J. Pichini S. Kleinbaum D. Atrasar esta decisión resta credibilidad y potencia al estudio. Akazawa K. Valls M. Choosing between randomised and non-randomised studies: a systematic review. 6. pero no la decisión sobre qué variables ajustar y cómo hacerlo. Viguer A. lo que tiene poder de convicción es que. Epidemiologic research: principles and quantitative methods. N Engl J Med 2000. que tener una idea confusa de lo que quizá pueda ocurrir en una población más general. Kleinbaum D. lo que «se descubra» en la fase de análisis tendrá sólo un valor tentativo. Deben equilibrarse con cuidado los procedimientos de ajuste que se emplean. ¿qué es mejor. éstas son las únicas que deberían analizarse y las únicas que deberían quedar en el modelo. que terminara proponiendo hipótesis que deberían ser ratificadas en estudios posteriores. et al. Aprender de los datos: el análisis de componentes principales. aunque sea en una población muy restringida. Por otro lado. 1999. 13. Hypertension 1999. Cobo E. ANÁLISIS MULTIVARIANTE EN INVESTIGACIÓN BIOMÉDICA: CRITERIOS PARA LA INCLUSIÓN DE VARIABLES Dr. Cobo: Efectivamente. Statistique exploratoire multidimensionnelle. García-Algar O. Bain C.