You are on page 1of 3

Regresin lineal y correlacin.

Anlisis de correlacin.
El anlisis de correlacin es in gripo de tcnicas estadsticas usadas para medir la fuerza de la
asociacin entre dos variables. Cuando se analizan datos, suele centrarse en dos grandes
objetivos: comparar grupos y estudiar relaciones.
Suele decirse que las personas ms frustradas son ms agresivos; que cuanto ms educacin tiene
una persona su renta ser ms alta; que los hombres sienten ms atraccin hacia las mujeres
entre veinte y treinta aos; que las personas se sienten ms motivadas en el trabajo si su
empleador mejora los incentivos y renta hacia el trabajador. En los casos recin mencionados
hablamos de la relacin existente entre dos variables.
Los diagramas de dispersin nos permiten graficar la relacin existente entre aquellas dos
variables.
Las variables dependientes son las variables que pueden ser precedidas o calculadas. Las variables
independientes proporcionan las bases para el clculo. Es la variable de prediccin.
El coeficiente de correlacin, r.
El coeficiente de correlacin (r) es una medida de la intensidad de la relacin lineal entre dos
variables. Requiere datos calculables que puedan ser de -1 a 1, estos valores indican la correlacin
perfecta y fuerte, los valores cerca de 0 indican la correlacin dbil. Los valores negativos indican
una relacin inversa y los valores positivos indican una relacin directa.
Correlacin negativa perfecta. Correlacin positiva perfecta.






Correlacin cero. Correlacin positiva fuerte.











Frmula para r

Para calcular el coeficiente de correlacin con las siguientes formulas:




Coeficiente de determinacin

El coeficiente de determinacin (r
2
) es la proporcin de la variacin total en la variable
dependiente (y) que se explica por la variacin en la variable independiente (x).
El coeficiente de determinacin es el cuadrado del coeficiente de correlacin que se
encuentra entre el rango 0 a 1, sin proporcionar informacin sobre la direccin de la
relacin entre las variables.

Anlisis de regresin.

En el anlisis de regresin utilizamos la variable independiente (x) para estimar la variable
dependiente (y). La relacin entre las variables es lineal, adems ambas variables deben ser por lo
menos escala del intervalo. Para este anlisis se utiliza el criterio de mnimos cuadrados
1
se utiliza
para determinar la ecuacin. Este es el termino (Y-Y`)
2
.
La ecuacin de regresin es: Y`= a+ bx donde:
- Y` es el valor pronosticado de la variable Y para un valor seleccionado de X.
- a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor estimado de Y
cuando X = 0.
- b es la pendiente de la recta, o el cambio de promedio en Y` para cada cambio de una
unidad en X.
- El principio de mnimos cuadrados se utiliza para obtener a y b.
El principio de mnimos cuadrados se utiliza para obtener a y b. Las ecuaciones para determinar
a y b son:


1
El principio de mnimos cuadrados es una tcnica de anlisis numrico enmarcada dentro de la
optimizacin matemtica, en la que, dados un conjunto de pares ordenados: variable independiente,
variable dependiente, y una familia de funciones, se intenta encontrar la funcin que mejor se aproxime a
los datos (un mejor ajuste), de acuerdo con el criterio de mnimo error cuadrtico.
| | ( ) ( ) | |
2 2 2 2
) ( ) (
) )( ( ) (
) 1 (
) )( (
Y Y n X X n
Y X XY n
s s n
Y Y X X
r
y x
E E E E
E E E
=

E
=




El error estndar de estimacin.

El erro estndar de estimacin mide la dispersin de los valores observados alrededor de la lnea
de regresin.
Las frmulas que se utilizan para comprobar el error estndar son:

2




Suposiciones que subyacen el anlisis de regresin lineal.

Para cada valor de X, hay un grupo de valores de Y, y estos valores de Y se distribuyen
normalmente. Las medidas de estas distribuciones normales de valores Y, caen todas en la recta
de regresin. Adems las desviaciones estndar de estas distribuciones normales son iguales. Los
valores de Y son estadsticamente independiente, lo cual significa que en la seleccin de una
muestra, los valores de Y elegidos para un valor particular de X no dependen de los valores de Y de
ningn otro valor X.
Intervalos de confianza

El intervalo de confianza para el valor medio de Y de un valor dado de C est dado por:

3





Intervalo de prediccin.
El intervalo de prediccin para un valor individual de Y para un valor dado de X se da por:


2
http://youtu.be/QezOS415Mpo
3
http://youtu.be/qfhtjcgnoGg
2
2
) (
2
2
.

E E E
=

' E
=
n
XY b Y a Y
n
Y Y
s
x y
n
X
X
X X
n
ts Y
x y
2
2
2
.
) (
) ( 1
1
E
E

+ + '

You might also like