You are on page 1of 6

Estadística aplicada a la

investigación:

Análisis de la relación entre dos


variables cuantitativas:
Correlación y Regresión

Universidad de Salamanca
De
Pregunta 1.

¿Un coeficiente de correlación significativo implica que entre las variables X e


Y existe una relación causa efecto?

No, en absoluto. Indica simplemente que X e Y covarían pero puede ser que
covarien simplemente por efecto de una tercera. Por ejemplo, el número de canas
y la presión arterial covarían por efecto de una tercera variable que es la edad.

Pregunta 2.

¿Un coeficiente de correlación no significativo implica que entre las variables


no existe una relación causa efecto?

No necesariamente. Si no están relacionadas es evidente que una no es causa de la


otra, pero puede ocurrir que exista relación y no la detectemos en el estudio por
falta de información, por ejemplo, por un bajo tamaño muestral.

Pregunta 3.

¿Un coeficiente de correlación cero (o próximo a cero) implica que las variables
X e Y son independientes?

No. Lo que es cierto es que cuando dos variables son independientes el coeficiente
de correlación de Pearson es cero, pero puede ser cero y las variables estar
relacionadas mediante una relación parabólica, por ejemplo.
Pregunta 4.

¿Podemos fiarnos de una publicación en la que aparece una recta de regresión


y no incluye ni el coeficiente de correlación ni el coeficiente de
determinación?

Podemos fiarnos, pero no es recomendable. Ya que no sabemos el poder


explicativo del modelo; es decir, qué porcentaje de puntos de la nube vienen bien
representados por el modelo. Sería como escribir la media y no acompañarla de
una medida de dispersión.

Pregunta 5.

Un modelo de regresión lineal, con alto valor explicativo (R2 próximo al 100%),
¿es un buen modelo para predecir?

Lo contrario si es cierto, si no tienen alto poder explicativo no es bueno para


predecir, pero puede tener alto poder explicativo y no ser bueno para predecir ya
que el modelo se estudia en un rango de valores y fuera de ese rango la relación
puede ser diferente. Por ejemplo, para unas dosis determinadas, puede existir un
modelo lineal que explique adecuadamente la relación entre la cantidad de un
nutriente y el crecimiento de una planta. Pero si aumentamos indefinidamente la
dosis, la planta no crecería hasta el infinito (como predeciríamos con el modelo
lineal) sino que puede incluso morir.
Pregunta 6.

¿Por qué se usa, en las publicaciones, el coeficiente de correlación en vez de la


covarianza, cuando en los textos de estadística siempre se explica primero la
covarianza?

La covarianza es el estadístico que captura realmente la información sobre si las


variables están o no, relacionadas linealmente. Pero, no está acotada y arrastra las
unidades de las dos variables, lo que hace difícil su interpretación. Por el
contrario, el Coeficiente de Correlación de Pearson recoge toda la información
capturada por la covarianza, y además es adimensional y está acotado. Todo esto
facilita considerablemente la interpretación y es la razón por la que se utiliza
mucho más en las publicaciones. Sin embargo, a nivel didáctico no tiene sentido
explicar el coeficiente de correlación sin haber explicado la covarianza.

Pregunta 7.

¿Es lo mismo el coeficiente de correlación que el coeficiente de regresión?

No. Ambos se calculan a partir de la covarianza y tienen por tanto, el mismo signo,
pero transmiten información muy diferente.

El coeficiente de correlación se calcula como la covarianza partida por el producto


de las desviaciones típicas de las dos variables y se utiliza para decidir si hay
relación lineal entre las variables, de qué tipo es (directa o inversa) y
cuantificarla.

El coeficiente de regresión se calcula como la covarianza partida por la varianza de


la variable independiente y se interpreta como el incremento (decremento) en la
variable respuesta por cada incremento unitario en la variable independiente.
Para que coincidieran tendría que ocurrir que la desviación típica de la variable
independiente y la desviación típica de la dependiente coincidieran, cosa muy
poco probable.

Pregunta 8.

¿Una nube de puntos muy dispersa puede llevar asociado un coeficiente de


correlación significativo?

Sí. Un coeficiente de correlación significativo sólo dice que existen indicios


suficientes para suponer que no son independientes, pero eso no equivale a
afirmar que será posible encontrar un buen modelo que nos permita estimar la
variable respuesta a partir del conocimiento de la variable independiente.

Pregunta 9.

¿Puede ocurrir que al estudiar la relación de una variable X1 con una variable Y
resulte significativa, al estudiar la relación entre X2 e Y, también sea
significativa y al estudiar la relación entre X1 y X2 e Y, alguna de las dos
variables X aparezca como no significativa?

Lamentablemente SI. Si X1 y X2 están relacionadas entre sí, una de las dos (por
ejemplo X2) aparecería como no significativa ya que no aportaría información
diferente de la ya capturada al estudiar la relación entre Y y la variable X 1.

Pregunta 10.

¿Puede ocurrir que si las variables explicativas X1 y X2 están fuertemente


relacionadas entre sí, al estudiar el modelo de regresión que relaciona Y con X 1
y con X2 aparezca un signo para el coeficiente de regresión contrario al real?
Lamentablemente sí. Cuando las variables explicativas están fuertemente
relacionadas se dice que hay colinealidad. En presencia de colinealidad pueden
aparecer como no significativas variables que sí están realmente relacionadas con
la respuesta y puede ocurrir que el signo que aparezca en el modelo de regresión
sea el contrario al esperado. Cuando esto ocurra lo mejor es contactar con un
especialista estadístico que le ayude en el tratamiento de los datos y le haga un
correcto diagnóstico de la colinealidad.