Professional Documents
Culture Documents
CorrelacioÌ - N y Regresioì - N
CorrelacioÌ - N y Regresioì - N
Fuerza Dirección
Coeficiente de Correlación Lineal de Pearson
• La coeficiente de correlación lineal de Pearson de dos variables, r, nos
indica si los puntos tienen una tendencia a disponerse alineadamente
(excluyendo rectas horizontales y verticales).
* Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son
independientes: pueden existir todavía relaciones no lineales entre las dos variables.
• Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.
• Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos
variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción
constante.
𝑟 𝑥𝑦 Correlación
cercano
cercano a 1
a -1 a0
Relación Inversa No hay relación Relación Directa
Diagrama de
dispersión o Cada punto es la
de nube de unión entre X e Y
puntos
(‘scatterplot’) r = 0,87
Correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Correlaciones positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
y
• Directa y • Inversa
x x
Interpretación
Coeficiente Interpretación
Correlación Perfecta
Muy Alta
Alta
Moderada
Baja
Muy baja
Nula
Otros coeficientes de correlación
*Cuando las variables en vez de ser numéricas son
ordinales, es posible preguntarse sobre si hay algún
tipo de correlación entre ellas.
16
80
SI
50
Peso en Kg
40 unión entre X e Y
correlación? 30
r = 0,87 ? r = 0,87
20
Directa
10
Positiva
Muy Alta
0
140 145 150 155 160 165 170
Talla en cm
Regresión Lineal Simple
El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889)
refiriéndose a la “ley de la regresión universal”:
Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de
esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede
decirse de los padres muy bajos.
Simple Múltiple
20
Regresión
• El análisis de regresión sirve para predecir una medida en función de
otra medida (o varias).
Y
Y = Variable X = Variable
dependiente D
e independiente
predicha p
e predictora
explicada n
explicativa
di
e
n
t
e
Independiente X
Regresión
• En un modelo de regresión lineal • Mediante las técnicas de regresión
simple tratamos de explicar la de una variable sobre una
relación que existe entre la variable , buscamos una función
variable respuestay una única que sea una buena aproximación
variable explicativa . de una nube de puntos
250
200
(𝑥𝑖 , 𝑦 𝑖 )
150
Variable
Variable
Ecuación de la regresión
• El modelo entonces tiene la forma
(ordenada en el origen,
constante)
(pendiente de la recta)
^
𝛽 1 Es el efecto medio sobre la
variable Y
al aumentar en una unidad
X
^
𝛽0
𝑥 𝑥+1 X
En el modelo de regresión lineal simple, dado dos variables
Y (dependiente)
X (independiente, explicativa)
R2 puede ser pesado de calcular en modelos de regresión general, pero en el modelo lineal simple, la
expresión es de lo más sencilla: R2=r2
28
Regresión
29
La tabla de correlaciones nos muestra que r=0,759
Ejemplo: Correlaciones
Alta Correlación
Alturas de hijos y Altura del
lineal directa,
positiva.
padres (n=60 c/u)
Altura del hijo Padre
Correlación de Pearson Altura del hijo 1,000 ,759
Coeficientes no
El modelo de regresión lineal
180
estandarizados simple es
Modelo B Error típ. Altura hijo = b0 + b1 Altura del padre
1 (Constante) 89,985 9,180
Altura del Padre ,466 ,053
b0=89,985
170
b1=0,466
Altura del hijo
160
Altura del Padre R cuadrado Error típ. de la Altura del hijo = 89,985 + 0,46
Modelo R R cuadrado corregida estimación
1 ,759 a ,577 ,569 3,480
x 170= 168,185 cm
Diagrama de dispersión: se aprecia a. Variables predictoras: (Constante), Altura del Padre
peso 0,87417927 1
80
Coeficientes Error típico
70 Intercepción -58,8038644 15,40955949
Variable X 1 0,750902998 0,098317029
60
50
Peso en Kg
40
30
Estadísticas de la regresión
20 Coeficiente de correlación múltiple 0,874179271
Coeficiente de determinación R^2 0,764189398
10 R^2 ajustado 0,751088809
r = 0,87 Error típico 3,33257023
0 Observaciones 20
140 145 150 155 160 165 170
Talla en cm
Resolución Tarea: Correlación de pearson talla peso
MUY ALTA CORRELACIÓN LINEAL,
Regresión lineal simple
talla 1
DIRECTA, POSITIVA
peso 0,87417927 1
80
Coeficientes Error típico
70 Intercepción -58,8038644 15,40955949
Variable X 1 0,750902998 0,098317029
60
¿SI el Sujeto mide 170 cm, cuál será su peso?
50
Peso en Kg
La bondad del ajuste es de R2=0,8741= 87,41% (Se denomina porcentaje de variabilidad
explicado por el modelo de regresión) El modelo explica en un 87,41% la variabilidad del
modelo de regresión.
Gracias por su atención !!