You are on page 1of 11

Correlacin entre variables

Apuntes de clase del curso Seminario Investigativo VI

Por:

Gustavo Ramn S.*

* Doctor en Nuevas Perspectivas en la Investigacin en Ciencias de la Actividad Fsica y el Deporte (Universidad de Granada). Docente Investigador del Instituto Universitario de Educacin Fsica, Universidad de Antioquia (Colombia). Correo: gusramon2000@yahoo.es

Correlacin entre variables La Correlacin es una tcnica estadstica usada para determinar la relacin entre dos o ms variables. La relacin entre la duracin de una carrera de distancia y el test del escaln, o la relacin entre las caractersticas de la personalidad y la participacin en deportes de alto riesgo. La correlacin puede ser de al menos dos variables o de una variable dependiente y dos o ms variables independientes, denominada correlacin mltiple. Coeficiente de correlacin El Coeficiente de Correlacin es un valor cuantitativo de la relacin entre dos o ms variables. La coeficiente de correlacin puede variar desde -1.00 hasta 1.00. La correlacin de proporcionalidad directa o positiva se establece con los valores +1.00 y de proporcionalidad inversa o negativa, con -1.00. No existe relacin entre las variables cuando el coeficiente es de 0.00.

Nombre Pedro Pablo Chucho Jacinto Jos

Masa corporal 60 70 80 90 100

Fuerza 130 150 170 190 210

Nombre Pedro Pablo Chucho Jacinto Jos

Masa corporal 1 2 3 4 5

Fuerza 1 2 3 4 5

Coeficiente de correlacin = r

Masa X 60 65 70 75 80 85 90 95 100 720

X2 3600 4225 4900 5625 6400 7225 8100 9025 10000 59100

Fuerza Y 100 105 102 135 95 125 140 130 148 1080

Y2 10000 11025 10404 18225 9025 15625 19600 16900 21904 13270

XY 6000 6825 7140 10125 7600 10625 12900 12350 14800 88065

1 2 3 4 5 6 7 8 9

Ecuaciones de Regresin La frmula general para una ecuacin de regresin lineal es: Y= a+bX donde Y es el valor predicho a es el intercepto b es la pendiente de la lnea y X es el predictor

a puede ser calculada a partir de la siguiente frmula: a = My - bMx , donde My es la media de Y, y Mx es la media de X b puede ser calculada a partir de la siguiente frmula: 4 b = r (Sy/Sx) , donde Sy es la desviacin estndar de Y, y Sx la de X

Intercepto = a = O Pendiente = b = Y / X = (5-0) / (5 0) = 1 Si X = 2 Y = O + 1*2 = 2

b= r (Sy/Sx)= 0.771 (19.71/13.69)= 1.110 a= My bMx= 120 - 1.110*80= 31.2 Con esta ecuacin de regresin podemos calcular los valores de los extremos para la masa corporal (60 y 100 kg): Y60 = 31.2 + 1.110*60 = 97.8 Y100 = 31.2 + 1.110*100 = 142.2

Valores reales para una masa corporal de 60kg era de 100 Kp y en el caso estimado fue de 97.8 (una diferencia de -2.2 kp) Para el 100 kg, era de 150 y su estimacin fue de 142.2 (una diferencia de -7.8kp). Esto sucede porque la correlacin no es de 1.00. error estndar de la estimacin.

En el anterior ejemplo, hicimos la recta de regresin de Y sobre los valores de X. Pero igualmente podramos calcular y dibujar la lnea de regresin de los valores de X sobre Y (X= 15.71 + O.536Y). El resultado final sera el grfico siguiente.

Se puede observar que ambas rectas se cortan en el punto correspondiente a la media de X y la media de Y. Se podra decir que la relacin entre las rectas de regresin gira en este punto comn. De manera que, cuando r es igual a 1, las rectas se superponen y cuando r es cero, las rectas son perpendiculares. Se pueden realizar diagramas de dispersin en los que aparece una sola recta de regresin: la que sirve para predecir Y a partir de los valores de X. Aunque este estudio se refiera a una sola recta, todas las conclusiones sern tambin aplicables a la recta que sirve para predecir X a partir de Y. La recta de regresin representa el mejor fundamento para predecir valores de Y a partir de valores conocidos de X. No todos los puntos que representan las calificaciones caen sobre la recta de regresin. Las desviaciones de los valores reales menos los valores predichos representan los errores de la prediccin.

Las tres sumas de cuadrados son:

1. Variaciones de los valores con respecto a la media de la muestra. Esta variacin est dada por (Y - Media) y es bsica para la determinacin de la varianza y de la desviacin estndar de la muestra. Es la variacin total.

2. Variacin de los valores reales con respecto a la recta de regresin (o valores predichos) Esta variacin est dada por (Y - Y) y se llama variacin no explicada. Si la correlacin fuese de 1.00, todos los valores caen en la recta de regresin y en consecuencia, se explicaran toda la variacin de los valores de Y en funcin de la variacin en X. Cuando existe una correlacin perfecta, no existe variaci6n no explicada. Cuando la correlacin no es perfecta, muchos de los puntos no caen en la recta de regresin. Las desviaciones de estos valores con respecto a la recta de regresin representan las variaciones que no pueden ser explicadas mediante la correlacin entre ambas variables, de ah el uso del trmino.

Variacin no explicada: Desviacin de valores estimados menos los reales

3. Variacin de los valores estimados respecto a la media de la distribucin. Esta variacin est dada por (Y- Media) y se la conoce como variacin explicada. Este nombre deriva, de manera anloga, a la dada para la variacin anterior.

Variacin explicada: Desviacin de valores Y con respecto a la prima.

Coeficiente de determinacin

r = raz (r) Puesto que r representa la proporcin de la variacin explicada, (1- r) representar la proporcin de la variacin que no es explicada, conocido como coeficiente de no determinacin y se representa por k. La relacin entre r y k es k+r = 1

You might also like