You are on page 1of 2

Gráficas residuales Hacer predicciones

Es un diagrama de dispersión de los Modelo malo; si la ecuación de


valores (x, y) después de reemplazar cada
uno de los valores de la coordenada y por
regresiones no parece se útil no la
el valor del residuo. utilices.
Buen modelo; se utiliza solo si la
gráfica de la línea de regresión sobre
el diagrama de dispersión si se
ajusta razonablemente a los puntos. Correlación
Correlación; se usa solo s el
coeficiente de relación r indica que
existe una correlación lineal entre las
y regresión
dos variables.
Alcance; solo si los datos muestrales Regresion
van más allá del alcance de los datos PARTE I: Conceptos básicos de
muestrales
regresión
PARTE II: Más allá de los Línea de regresión, es la línea recta
fundamentos de la regresión que mejor se ajusta al diagrama de
dispersión de los datos.
Interpretación de la ecuación
de regresión: Cambio marginal Requisitos
El cambio marginal de una variable es la
cantidad que cambia cuando la otra se
modifica en exactamente una unidad. La muestra de datos pareados
es una muestra aleatoria de
Valores atípicos y puntos datos cuantitativos
influyentes Los puntos del diagrama de
Es un punto que cae lejos de los demás dispersión se aproximan a una
datos. Los datos muestrales pareados recta
puede incluir uno o más puntos los valores atípicos puede tener
influyentes. Que son puntos que afectan
fuertemente a la gráfica de la línea de un fuerte efecto en la ecuación
regresión. de regresión
Residuos y propiedad de los
mínimos cuadrados
El residuo es la diferencia entre el valor
muestral observado de x y el valor de y
que se predice usando la ecuación de
regresión.
Una línea recta satisface la propiedad
mínima de cuadrados si la suma de los
cuadrados es la suma más pequeña
posible
La desviación explicable Intervalos de predicción y
Es la distancia entre el valor predicho de y y
la línea horizontal que pasa a través de la
variación
media muestral de °y
Es un rango de valores utilizados para
estimar una variable. Mientras que un
intervalo de confianza es un rango de
La desviación inexplicable valores utilizados para estimar un
Es la distancia vertical entre el punto (x, y) y parámetro poblacional.
la línea de regresión y también se denomina
residuo.
Requisitos
Coeficiente de determinación
Para cada valor fijo de x, los
Es la proporción de la variación en y que se
explica por la línea de regresión. valores muestrales
correspondientes de y se
distribuyen normalmente al
rededor de la línea de regresión,
y esas distribuciones normales
tienen la misma varianza

La desviación total
Es la distancia vertical de y - °y , que es la
distancia del punto (x, y) y la línea
horizontal que se pasa a través de la media
muestral de °y

You might also like