You are on page 1of 4

Correlación entre variables y Regresión lineal

La correlación estudia cuan estrecha es la asociación entre dos variables y la regresión lineal
plantea un modelo a través del cual conocido el valor de una variable explicativa 𝒙
(independiente) se puede llegar a predecir el valor de la otra variable respuesta 𝒚
(dependiente). Definimos los siguientes términos:

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
7
689 𝑥6
𝑥 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 =
𝑛
7
689 𝑦6
𝑦 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 =
𝑛

7 ? 7 ?
689 𝑥6 − 𝑥 689 𝑥6 − 𝑛𝑥 ?
𝑆< = 𝑑𝑒𝑠𝑣. 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑥 = =
𝑛−1 𝑛−1

7 ? 7 ?
689 𝑦6 − 𝑦 689 𝑦6 − 𝑛𝑦 ?
𝑆A = 𝑑𝑒𝑠𝑣. 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑦 = =
𝑛−1 𝑛−1

7 7
689 𝑥6 − 𝑥 𝑦6 − 𝑦 689 𝑥6 𝑦6
− 𝑛𝑥𝑦
𝑆<A = 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 = =
𝑛−1 𝑛−1
𝑆<A
𝑟 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑒𝑎𝑟𝑠𝑜𝑛 =
𝑆< ∗ 𝑆A

¿Cómo interpretamos el valor del Coeficiente de Correlación?

Interpretación Valores de r (+) Valores de r (-)


Correlación perfecta 1 -1
Correlación excelente 0.90 < r < 1 -1 < r < -0.90
Correlación aceptable 0.80 < r < 0.90 -0.90 < r < -0.80
Correlación regular 0.60 < r < 0.80 -0.80 < r < -0.60
Correlación mínima 0.30 < r < 0.60 -0.60 < r < -0.30
No hay correlación 0 < r < 0.30 -0.30 < r 0
Estadística inferencial
Juan C. Acosta Jiménez
¿Cómo reconocemos una relación directa o inversa?

Por ejemplo, tenemos las alturas y los


pesos de 30 personas representadas en
el siguiente diagrama de dispersión.

Regresión lineal simple

El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
variables. El objetivo es buscar una ecuación de una línea recta que sirva para pronosticar un
valor de 𝑦 reemplazando un valor de 𝑥.

Recta de ajuste
𝑦 = 𝑎 + 𝑏𝑥
Donde 𝑏 es la pendiente de la recta y 𝑎 representa la interseción de la recta con el eje 𝑦.

Coeficientes de la recta
7
689 𝑥6 − 𝑥 𝑦6 − 𝑦 7
𝑆<A 𝐶𝑜𝑣(𝑥, 𝑦) 𝑛−1 689 𝑥6 𝑦6 − 𝑛𝑥𝑦
𝑏= = = 7 ? = 7
𝑆<< 𝑉𝑎𝑟 𝑥 689 𝑥6 − 𝑥
? − 𝑛𝑥 ?
689 𝑥6
𝑛−1

𝑎 = 𝑦 − 𝑏𝑥

Estadística inferencial
Juan C. Acosta Jiménez
Ejercicios de práctica

1) Observamos dos variables en una muestra de países, en donde 𝑋 representa el consumo


anual de vino (en litros por habitante) y 𝑌 representa el número de muertes por
enfermedad cardíaca por cada 100.000 habitantes.

a) ¿Qué podemos decir sobre la relación entre las dos variables?


b) ¿Podemos afirmar que a mayor consumo de vino menor número de muertes por
enfermedades cardiacas?
c) ¿Podemos predecir el valor de la variable 𝑌 si sabemos el valor de 𝑋?
d) ¿En cuánto se estima el número de muertes por enfermedad cardíaca de un cierto
país, en donde se consumieron 3.5 litros de vino al año?

2) Un economista del departamento de Recursos Humanos está proporcionando un estudio


sobre el comportamiento del consumidor. El recolectó los datos que aparecen en miles de
dólares para determinar si existe una relación entre el ingreso del consumidor y los niveles
de consumo.

a) Trace un diagrama de dispersión para estos datos.


b) ¿Parece razonable una relación lineal? Explique por qué.
c) ¿En cuánto se estima el consumo para una persona con ingresos de 28450 dólares?

Estadística inferencial
Juan C. Acosta Jiménez
3) Se realizó un estudio sobre la cantidad de azúcar convertida, en cierto proceso, a distintas
temperaturas. Los datos se codificaron y se registraron como sigue:

Temperatura (x) 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0
Azúcar Convertida (y) 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5

a) Estime la recta de regresión lineal.


b) Calcule la cantidad media de azúcar convertida que se produce cuando la
temperatura registrada es 1,75.

4) Un profesor de la Escuela de Negocios de una universidad encuestó a una docena de sus


colegas acerca del número de reuniones profesionales a que acudieron en los últimos
cinco años (X), y el número de artículos que publicaron en revistas arbitradas (Y) durante
el mismo periodo. A continuación se presenta el resumen de los datos:

𝑛 = 12 𝑥 = 4, 𝑦 = 12
7
= 232, 7689 𝑥6 𝑦6 = 318
?
689 𝑥6

Ajuste un modelo de regresión lineal simple entre 𝑥 y 𝑦 averiguando las estimaciones de la


intersección y la pendiente. Comente acerca de si la asistencia a reuniones profesionales
originaría una mayor cantidad de artículos.

Estadística inferencial
Juan C. Acosta Jiménez

You might also like