You are on page 1of 6

Anlisis de regresin: Cmo interpretar

la constante (Interseccin)
Jim Frost 11 de julio 2013
0
205
59
4

El trmino constante en el anlisis de regresin lineal parece ser una cosa tan
simple.Tambin conocida como la interseccin, es simplemente el valor en el
que la lnea ajustada cruza el eje y.
Aunque el concepto es simple, he visto una gran confusin acerca de la
interpretacin de la constante. Eso no es sorprendente porque el valor del
trmino constante es casi siempre sentido!
Paradjicamente, mientras que el valor es por lo general carece de sentido, es
fundamental incluir el trmino constante en la mayora de los modelos de
regresin!

En este post, te voy a mostrar todo lo que necesita saber acerca de la constante
en el anlisis de regresin lineal.
Voy a usar grficos de lneas armarios para ilustrar los conceptos, ya que
realmente trae las matemticas a la vida. Sin embargo, una lnea de trama 2D
equipado slo puede mostrar los resultados de regresin simple, que tiene una
variable de prediccin y la respuesta. Los conceptos son vlidas para la
regresin lineal mltiple, pero no puedo graficar las dimensiones ms altas que
se requieren.

Configuracin Cero para todas las variables predictoras


es a menudo imposible
He visto a menudo la constante descrito como el valor de la respuesta media
cuando todas las variables predictoras se ponen a cero.Matemticamente, eso
es correcto. Sin embargo, un ajuste de cero para todos los predictores en un
modelo es a menudo una combinacin imposible / sin sentido, como en el
siguiente ejemplo.
En mi ltimo post sobre la interpretacin de los valores de p de regresin y
coeficientes , he usado una lnea argumental equipada para ilustrar un anlisis
de regresin de peso-por-altura. A continuacin, he cambiado la escala del eje Y
en esa lnea argumental equipada, pero los resultados de la regresin son los
mismos que antes.

Si usted sigue la lnea ajustada azul hacia abajo hasta donde intercepta el eje y,
que es un valor bastante negativa. A partir de la ecuacin de regresin, se
observa que el valor de intercepcin es -114.3. Si la altura es cero, la ecuacin
de regresin predice que el peso es -114,3 kilogramos!
Es evidente que esta constante no tiene sentido y que ni siquiera debera tratar
de darle sentido. Ningn ser humano puede tener altura cero o un peso
negativo!
Ahora imagine un anlisis de regresin mltiple con muchos predictores. Se
vuelve an ms improbable que todos los predictores de manera realista se
puede ajustar a cero.
Si todos los predictores no puede ser cero, es imposible interpretar el valor de la
constante. Ni siquiera lo intentes!

Cero Ajustes para todas las variables predictoras puede


estar fuera del rango de datos
Incluso si es posible para todas las variables predictoras de ser igual a cero, ese
punto de datos podra estar fuera del rango de los datos observados.
Usted nunca debe utilizar un modelo de regresin para hacer una prediccin
para un punto que est fuera del rango de los datos debido a que la relacin
entre las variables puede cambiar. El valor de la constante es una prediccin
para el valor de respuesta cuando todos los predictores son iguales a cero. Si no
recoja datos en este todo-cero rango, no se puede confiar en el valor de la
constante.
El ejemplo de altura-por-peso ilustra este concepto. Estos datos son de chicas
de secundaria y no podemos estimar la relacin entre las variables fuera del
rango de peso y la altura observada. Sin embargo, podemos tener una idea de
que la relacin cambia marcando el peso y estatura promedio para un beb
recin nacido en el grfico. Eso no es del todo la altura de cero, pero es lo ms
cerca que podamos conseguir.

Dibuj el crculo rojo cerca del origen de aproximar la altura y el peso medio de
los recin nacidos. Se puede ver claramente que la relacin debe cambiar a
medida que se ampla el rango de datos!
As la relacin vemos para los datos observados es localmente lineal, pero
cambia ms all de eso. Es por eso que usted no debe predecir fuera del rango
de los datos ... y otra razn por la constante de regresin puede ser sentido.

La constante es el recolector de basura para el modelo


de regresin
Incluso si un ajuste de cero para todos los predictores es un escenario plausible,
e incluso si usted recoge los datos dentro de ese todo ceros gama, la constante
an podra carecer de sentido!
El trmino constante se estima en parte por la omisin de predictores de un
anlisis de regresin. En esencia, sirve como un cubo de basura de cualquier
sesgo que no se explica por los trminos en el modelo. Puede represente esto
imaginando que la lnea de regresin flota hacia arriba y hacia abajo (por el
ajuste de la constante) a un punto en que la media de los residuales es cero, lo
que es un supuesto clave para el anlisis residual . Esta flotante no se basa en
lo que tiene sentido para la constante, sino ms bien lo que funciona
matemticamente para producir significa que cero.

Las garantas constantes que los residuos no tienen un sesgo positivo o


negativo en general, pero tambin hace que sea ms difcil interpretar el valor
de la constante, ya que absorbe el sesgo.

Por qu es fundamental incluir la constante en un


modelo de regresin?
Inmediatamente por encima, vimos una razn clave por las que debe incluir la
constante en el modelo de regresin. Se garantiza que sus residuos tienen una
media de cero.
Adems, si no se incluye la constante, la lnea de regresin se ve obligado a
pasar por el origen. Esto significa que todos los predictores yla variable de
respuesta debe ser igual a cero en ese punto. Si su lnea ajustada no
naturalmente pasan por el origen, sus coeficientes de regresin y predicciones
estarn sesgadas si no incluyen la constante.
Voy a usar el ejemplo de la altura y el peso de regresin para ilustrar este
concepto. En primer lugar, voy a utilizar Regresin general de Minitab software
estadstico para ajustar el modelo sin la constante. En la salida por debajo, se
puede ver que no hay una constante, slo un coeficiente de altura.

A continuacin, voy a superponer la lnea de esta ecuacin en la lnea ajustada


anterior parcela para que podamos comparar el modelo con y sin la constante.

La lnea azul es la lnea de ajuste para el modelo de regresin con la constante


mientras que la lnea verde es para el modelo sin la constante. Claramente, la
lnea verde no encaja. La pendiente es muy lejos y los valores previstos son
sesgadas. Para el modelo sin la constante, las predicciones de peso tienden a
ser demasiado alta para los sujetos ms cortas y demasiado bajo para los
sujetos ms altos.
Para finalizar, la constante de regresin general no vale la pena interpretar. A
pesar de esto, es casi siempre una buena idea incluir la constante en el anlisis
de regresin. Al final, el valor real de un modelo de regresin es la capacidad de
comprender cmo la variable de respuesta cambia cuando cambia los valores
de las variables de prediccin. No te preocupes demasiado por el constante!
Si usted est aprendiendo sobre la regresin, leer mi tutorial regresin !

Maestro Estadsticas cualquier momento y lugar


Quality Trainer te ensea cmo analizar sus datos en cualquier momento usted est
en lnea.

Toma el Tour!

You might also like