You are on page 1of 16

ESTADISTICA ADMINISTRATIVA II

Ing. William Sánchez Constantino | COPU 3a | Regresión Lineal y Correlación

.INTRODUCCION • Datos Bivariados: – Datos muestrales apareados • Relación Lineal: – Cuando se grafican los puntos bivariados se aproximan a un patrón de línea recta.

INTRODUCCION • Correlación: – Existe entre dos variables cuando una de ellas se relaciona con la otra de alguna manera • Diagrama de Dispersión: – Gráfica en la que datos muetrales apareados (x. Cada par individual se grafica como un solo punto .y) se grafican en un eje x horizontal y un eje y vertical.

la otra disminuye? – ejemplo – ¿A mayor cantidad de barcos.INTRODUCCION – ¿mientras una variable crece. mayor cantidad de manatíes muertos? MANATEE DEATHS FROM BOATS • Patrón: 90 80 70 60 50 40 30 60 70 80 REGISTERED BOATS 90 .

Correlación Negativa Perfecta entre «y» y «x» (r=-1). Sin Correlación entre «y» y «x» (r=0). Correlación Negativa entre «y» y «x» (r=-1). Relación no lineal entre «y» y «x».DIAGRAMAS DE DISPERSION • Correlación Positiva entre «y» y «x» (r=1). Correlación Positiva perfecta entre «y» y «x» (r=1). Correlación Alta Negativa entre «y» y «x» (r=-1). • • • • • • • Correlación Alta Positiva entre «y» y «x» (r=1). .

y) en una muestra. • ejercicio .COEFICIENTE DE CORRELACION LINEAL • Mide la fuerza de la relación lineal entre los valores cuantitativos apareados (x. -1 ≤ r ≤ 1 r ≅ 0 ⟹No hay correlación lineal significativa. r ≅ 1 o -1 ⟹ Hay una correlación lineal significativa entre «x» y «y». • 𝑟 = • • • • 𝑛 [𝑛 𝑥 2 )− 𝑥𝑦−( 𝑥)( 𝑦) 𝑥 2 ∗[𝑛 𝑦 2 )− 𝑦 2 ] n= número de pares de datos presentes. • También se conoce como coeficiente de correlación producto momento de Pearson (Honor a Karl Pearson).

(Ojo: solo lineal) • Ejemplo. • r mide la fuerza de una relación lineal. • El valor de r no cambia si todos los valores de cualquier variable se convierten a una escala diferente • El valor de r no se afecta por la elección de x o y. .PROPIEDADES DEL COEFICIENTE DE CORRELACION • El valor de r siempre está entre -1 y 1.

2.SUPUESTOS 1. . La muestra de datos apareados (x. Los pares de datos (x. los valores correspondientes de y contengan una distribución en forma de campana y para cualquier valor fijo de y los valores de x tengan también una distribución en forma de campana).y) tienen una distribución normal bivariada (para cualquier valor fijo de x.y) es una muestra aleatoria de datos cuantitativos.

71 70 60 Series1 50 Linear (Series1) 40 30 60 70 80 90 REGISTERED BOATS .112.2741x .INTERPRETACION DE R: VARIACION EXPLICADA • Si hay una correlación lineal significativa podremos obtener una ecuación lineal que exprese «y» en términos de «x». 90 80 MANATEE DEATHS FROM BOATS y = 2. • La ecuación de regresión se utiliza para predecir valores de «y» a partir de valores dados de «x».

regres 90 MANATEE DEATHS FROM BOATS centroide 80 70 60 50 40 30 60 70 80 REGISTERED BOATS 90 Linear (regres) . 𝑦) se denomina centroide. • Si los puntos del diagrama de dispersión tienden a aproximarse a una línea positiva.y» (apareados).CENTROIDE • Dado un conjunto de datos bivariados «x. el punto (𝑥 . los valores individuales del producto (x𝑥 )(y-𝑦) tienden a ser positivos debido a que la mayoria de los puntos se encuentran en el primero y tercer cuadrante.

112. regres 90 centr oide Linear (regre s) 80 MANATEE DEATHS FROM BOATS y = 2.71 70 60 50 40 30 60 70 80 90 REGISTERED BOATS . La pendiente en la ecuación de regresión representa el cambio marginal que ocurre en y cuando x cambia una unidad.2741x .CAMBIO MARGINAL • Es la cantidad que cambia cuando la otra variable cambia exactamente una unidad.

RESIDUAL • Es la diferencia entre un valor muestral observado y el valor de ŷ que es el valor de «y» predicho por medio de la ecuación de regresión. • Residuo = y observada – y predicha • 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙 = 𝑦 − 𝑦 .

y) es la distancia vertical 𝑦 − 𝑦. que es la distancia entre el punto (x. que es la distancia entre el valor predicho y la recta horizontal que pasa por la media.DESVIACION TOTAL.y) y la recta horizontal que pasa por la media muestral 𝑦. • Desviación explicada es la distancia vertical 𝑦 −𝑦. . • Desviación sin explicar es la distancia vertical 𝑦 − 𝑦. (Residual).y) y la recta de regresión. VARIACION EXPLICADA Y SIN EXPLICAR • Desviación total (a partir de la media) del punto (x. que es la distancia vertical entre el punto (x.

• variación Total (𝒚 − 𝒚)𝟐 = (𝒚 − 𝒚)𝟐 + (𝒚 − 𝒚)𝟐 = .DESVIACION TOTAL.19) • Desviación explicada: existe una correlación lineal significativa que está mejor descrita por la recta de regresión. VARIACION EXPLICADA Y SIN EXPLICAR • Existe correlación lineal significativa • Ecuación de la recta de regresión • La media de y es 9 • Uno de los pares de datos muestrales es (5.

• El valor de 𝑟 2 es la proporción de la variación de y que se explica por la relación lineal entre «x» y «y». a parte de x.COEFICIENTE DE DETERMINACION • Un valor predicho de «y» no será necesariamente el resultado exacto porque hay otros factores. que afectan a y. • 𝑟 2 = 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑇𝑜𝑡𝑎𝑙 .

ERROR ESTÁNDAR DEL ESTIMADO • Es una medida de las diferencias (o distancias) entre los valores muestrales de y observados y los valores predichos 𝑦 que se obtienen por medio de la ecuacuón de regresión. • 𝑆𝑒 = (𝑦−𝑦)2 𝑛−2 o 𝑦 2 −𝑏 𝑦−𝑚 𝑛−2 𝑥𝑦 .