You are on page 1of 9

INSTITUTO TECNOLOGICO DE CALKINI Carrera: Ingeniera Industrial Docente: CP Luis del J.

Franco Prez Materia: Estadstica Fecha: Agosto 2011

1.1. Regresin Lineal Simple.


Introduccin El trmino "regresin" fue acuado por Sir Francis Galton (1822-1911), primo de Charles Darwin. Galton estudiaba la eugnica, trmino tambin introducido por s mismo para definir el estudio de la mejora de la raza humana a partir de los caracteres hereditarios.

Galton estudi la altura de los hijos con relacin a la altura de sus padres, y prob que la altura de hijos altos regresaba hacia la media de la altura de la poblacin a lo largo de sucesivas generaciones. En otras palabras, hijos de padres extraordinariamente altos tendan a ser en promedio ms bajos que sus padres, e hijos de padres muy bajos tendan a ser en promedio ms altos que sus padres. En la actualidad, el trmino de regresin se utiliza siempre que se busca predecir una variable en funcin de otra, y no implica que se est estudiando si se est produciendo una regresin a la media. Anteriormente a Galton se debe mencionar a Legendre (1752-1833), quien introdujo el mtodo de los mnimos cuadrados utilizndolos para definir la longitud de 1 metro como una diez millonsima parte del arco meridional. Con posterioridad a Galton, las propiedades de las tcnicas de regresin fueron estudiadas por Edgeworth, Pearson y Yule.

La tcnica de regresin lineal simple est indicada cuando se pretende explicar una variable respuesta cuantitativa en funcin de una variable explicativa cuantitativa tambin llamada variable independiente, variable regresora o variable predictora. Por ejemplo, se podra intentar explicar el peso en funcin de la altura. El modelo intentara aproximar la variable respuesta mediante una funcin lineal de la variable explicativa.

Las suposiciones que se realizan al aplicar las tcnicas de regresin lineal son: -El modelo propuesto es lineal (es decir existe relacin entre la variable explicativa y la variable explicada, y esta relacin es lineal). Es decir se asume que:

var.respuesta

0 var. explicativa 1

Siendo

0 el trmino independiente (constante o intercept), 1 el coeficiente de es una variable

regresin de la variable explicativa (pendiente o slope) y aleatoria que se llama error residual.

-La variable explicativa se ha medido sin error. -El valor esperado de del modelo es cero. -La varianza de (y por lo tanto de la variable respuesta) es constante. -Los son independientes entre s. -Si se desean realizar contrastes de hiptesis sobre los parmetros (coeficientes) o sobre el modelo, tambin es necesario que la distribucin de sea normal.

Para estudiar la validez del modelo es necesario confirmar estas hiptesis mediante el estudio de los residuos (valores observados - valores predichos): normalidad,

tendencias, etc. Cuando no se cumplen los criterios de aplicacin es necesario realizar transformaciones a las variables, o bien para obtener una relacin lineal o bien para homogeneizar la varianza.

Regresin lineal simple. Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi . Definicin VALOR MEDIO. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetra en la funcin de densidad, puede interpretarse que dicha constante nos seala la zona donde se sitan los valores de mxima probabilidad de la variable aleatoria. El valor medio o valor esperado de una variable aleatoria X se define como

siempre que dicho valor exista, donde f es la funcin de densidad de la variable.

Estimacin de parmetros.