You are on page 1of 33

INDICE 1 UNIDAD REGRESION LINEAL SIMPLE Y MULTIPLE

INTRODUCCION................................................................................................................1 1.1REGRESIN LINEAL SIMPLE.....................................................................................3 1.1.1.PRUEBA DE HIPTESIS EN LA REGRESIN LINEAL SIMPLE........................5 1.1.2. CALIDAD DEL AJUSTE EN REGRESIN LINEAL SIMPLE............................10 1.1.3. ESTIMACIN Y PREDICCIN POR INTERVALO EN REGRESIN LINEAL SIMPLE...............................................................................................................................13 1.1.4. USO DE SOFTWARE ESTAD STICO...................................................................1! 1.2. REGRESIN LINEAL M"LTIPLE...........................................................................21 1.2.1. PRUEBAS DE HIPTESIS EN REGRESIN LINEAL M"LTIPLE...................22 1.2.2. INTERVALOS DE CONFIAN#A Y PREDICCIN EN REGRESIN M"LTIPLE .............................................................................................................................................23 1.2.3. USO DE UN SOFTWARE ESTAD STICO............................................................25 1.3 REGRESIN NO LINEAL..........................................................................................2$ CONCLUSION ..................................................................................................................31 BIBLIOGRAFIA.................................................................................................................32

INTRODUCCION
Abordaremos en esta investigacin el modelo de regresin lineal mltiple, as como regresin lineal simple y mltiple. Una vez que la mayor parte de las tcnicas bsicas han sido presentadas y desarrolladas en el modelo de regresin lineal simple. or supuesto, tambin se pueden considerar e!tensiones modelos no lineales, mediante trans"ormaciones de las variables, como se indicen el captulo anterior. #n general, el ob$etivo de la regresin mltiple es tratar de e!presar una variable respuesta %numrica& en "uncin de varias posibles variables e!plicativas %todas ellas numricas&. #l caso ms simple de regresin lineal a$usta a la ecuacin de la recta los valores de la variable independiente '( a la variable dependiente ), es decir* ) + b,-b('(, .onde b, es la ordenada en el origen y b ( es la pendiente de la recta. #l a$uste a esta ecuacin %mediante mnimos cuadrados& se caracteriza por la obtencin de b,, b( y el coe"iciente de correlacin r. /a regresin lineal mltiple se basa en obtener una relacin lineal entre un con$unto de variables independientes ' (,.., 'n con una variable dependiente ), es decir*
INGENIERIA INDUSTRIAL %SIST. ABIERTO& 1

) + b,-b('(-b0'0-b1'1- 222 -bn'n. #l !ito de determinar una correlacin lineal mltiple es que e!ista una correlacin lineal simple de cada variable independiente con la variable dependiente. #l estudio de la relacin lineal simple y mltiple en 3 se realiza de la misma "orma y se recoge en el script_Regresion_Lineal... ara ello se utiliza la "uncin de regresin lineal lm(). .icha "uncin est de"inida por una variable dependiente, y una o varias variables independientes %si es una variable independientes estamos traba$ando con una regresin lineal simple4 si son varias las variables entonces es una regresin mltiple&. or ello, se ha de indicar a la "uncin () cul es la variable dependiente y cules son las independientes. /a "orma de e!presarse en 3 es* variable dependiente 5 variable6s independiente6s. 3egresin es una palabra un tanto rara. /a utilizan los bilogos, los mdicos, los psiclogos... y suena como 7ir hacia atrs7, 7volver al pasado7, y realmente este es verdadero signi"icado del vocablo. 8ue un bilogo y estadstico ingls, 9:3 83A;<:9 =A/>?; , quien introdu$o en (AAB el trmino regresin en #stadstica. #mple este concepto para indicar la relacin que e!ista entre la estatura de los niCos de una muestra y la estatura de su padre. ?bserv, que si los padres son altos, los hi$os generalmente tambin lo son, y si los padres son ba$os los hi$os son tambin de menor estatura. ero ocurra un hecho curioso* cuando el padre es muy alto o muy ba$o, aparece una perceptible "regresin" hacia la estatura media de la poblacin, de modo que sus hi$os retroceden hacia la media de la que sus padres, por cierto, estn muy ale$ados. Doy da, el trmino no se utiliza en ese sentido.
@

#n muchas ocasiones, se desea conocer algo acerca de la relacin o dependencia entre dos caractersticas cuantitativas, o ms de una, consideradas sobre la misma poblacin ob$eto de estudio %por e$emplo la talla y el peso&. Day muchos casos en los que ya de antemano se 7sospecha7 que puede e!istir algn tipo de relacin, y por consiguiente, se pretende saber por e$emplo, en el caso de que tengamos nicamente dos variables* 1.- 9i ambas variables estn realmente relacionadas entre s o si, por el contrario, pueden considerarse independientes. 2.- 9i e!iste dependencia, es necesario conocer el 7grado de relacin7, as como el 7tipo7 de relacin entre ambas.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

3.- 9i puede predecirse la variable que es considerada como dependiente a partir de los valores de la otra, que es considerada independiente, y si es as, con qu precisin. TIPOS DE REGRESIN 9i las dos variables ' e ) se relacionan segn un modelo de lnea recta, hablaremos de Regresin Line ! Si"#!e* )+a-b!. <uando las variables ' e ) se relacionan segn una lnea curva, hablaremos de Regresin n$ !ine ! $ %&r'i!(ne . Aqu podemos distinguir entre 3egresin parablica, #!ponencial, otencial, etc. <uando tenemos ms de una variable independiente %' (, '0,..., 'p&, y una sola variable dependiente ), hablaremos de Regresin ")!*i#!e, que se estudiar en detalle en el apartado E.0. A las variables ' i, se las denomina, regresoras, predictoras o independientes.

1.1 REGRESIN LINEAL SIMPLE


;os centraremos en primer lugar, en el caso de que la "uncin que relaciona las dos variables ' e ) sea la ms simple posible, es decir, una lnea recta. or ello pasaremos a interpretar los coe"icientes que determinan una lnea recta. >oda "uncin de la "orma )+a-b' determina, al representarla en el plano una lnea recta, donde ' e ) son variables y a y b son constantes. or e$emplo* )+1-0'. SIGNI+ICADO DE 0 1 ,a es la ordenada en el origen, es decir, es la altura a la que la recta corta al e$e ). 9e denomina tambin trmino independiente. b, tambin denominada pendiente es la inclinacin de la recta, es decir, es el incremento que se produce en la variable ) cuando la variable ' aumenta una unidad.

#n estadstica la regresin lineal o a$uste lineal es un mtodo matemtico que modela la relacin entre una variable dependiente, las variables independientes un trmino aleatorio. Regresin !ine ! si"#!e* >iene como ob$eto estudiar cmo los cambios en una variable, no aleatoria, a"ectan a una variable aleatoria, en el caso de e!istir una relacin "uncional entre ambas variables que puede ser establecida por una e!presin lineal, es decir, su representacin gr"ica es una lnea recta. <uando la relacin lineal concierne al valor medio esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

#s la que e!plica en "orma matemtica el comportamiento de una variable de respuesta en "uncin de una o ms variables independientes, se utiliza tambin para el clculo de pronsticos donde intervienen la variable descendiente y la variable independiente. #ste mtodo consiste en hallar una lnea recta que pase por la mayor cantidad de puntos de una gr"ica de demanda, lnea recta que se encuentra se le nombra lnea de regresin o tendencia. /a respuesta aleatoria al valor . de la variable controlada se designa por Y. y, segn lo establecido, se tendr

.e manera equivalente, otra "ormulacin del "$/e!$ /e regresin !ine ! si"#!e sera* si .i es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi . #l ob$etivo principal del anlisis de regresin lineal es establecer una relacin "uncional entre dos variables relacionados tomando datos mustrales %aleatorios que contribuyen a buenos estimadores de la correspondiente reaccin poblacional. Una vez estableciendo cuanti"ica mente esta relacin mediante la correspondiente ecuacin, es posible predecir o estimar el valor de una de las variables&, que dependiente una "uncin de la otra independiente. CALCULO DE LA ECUACIN DE REGRESIN Una vez recolectada la serie bidimensional que son pares de datos variados, estos se llevan a un sistema de e$es coordenados, la variable independiente ! se escribe en el e$e de abscisas, y la variable dependiente y en la variable de coordenadas. Al con$unto de puntos se le llama DIAGRAMA DE DISPERSIN de acuerdo con la "orma que tome dicho diagrama as ser la "uncin %ecuacin& que se utilizara, de tal "orma que describa adecuadamente la relacin entre variables. A continuacin aparecen las "ormas generales d diversas relaciones, denominadas "unciones o ecuaciones de prediccin. #cuacin de 0F grado o cuadrtica ecuacin e!ponencial y + #cuacin potencial.
INGENIERIA INDUSTRIAL %SIST. ABIERTO& 4

De0ini%in 1ALOR MEDIO. <onstante que representa el %en*r$ /e gr 'e/ / de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetra en la "uncin de densidad, puede interpretarse que dicha constante nos seCala la zona donde se sitan los valores de m!ima probabilidad de la variable aleatoria. #l ' !$r "e/i$ $ ' !$r es#er /$ de una variable aleatoria 2 se de"ine como

9iempre que dicho valor e!ista, donde 0 es la "uncin de densidad de la variable.

1.1.1. PRUE3A DE 4IPTESIS EN LA REGRESIN LINEAL SIMPLE


#n cualquier anlisis de regresin no basta hacer los clculos que e!plicaron antes que es necesario evaluar que tambin el modelo %la lnea recta& e!plica la relacin entre ' y ). Una primera "orma de hacer esto es probar una serie de hiptesis sobre el modelo. ara ello es necesario suponer una distribucin de probabilidad para el trmino error. #s usual suponer normalidad, se distribuye en "orma normal, independiente con media cero y varianza. or lo general la hiptesis de mayor inters plantea que la pendiente signi"icativamente di"erente de cero.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

#stimacin de parmetros.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

'

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

TRA3A5O POR E6UIPOS PARA PRESENTACION EN CLASE #n un grupo de A pacientes se miden las cantidades antropomtricas peso y edad, obtenindose los siguientes resultados* 3esultado de las mediciones ( A ( ( G G ( (H 0 , ( , I H I I H 1 H IE A 0 ( H , B B

eda d peso

J#!iste una relacin lineal importante entre ambas variablesK <alcular la recta de regresin de la edad en "uncin del peso y la del peso en "uncin de la edad. <alcular la bondad del a$uste J#n qu medida, por trmino medio, vara el peso cada aCoK J#n cunto aumenta la edad por cada Lilo de pesoK

1.1.2. CALIDAD DEL A5USTE EN REGRESIN LINEAL SIMPLE

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

10

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

11

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

12

1.1.3. ESTIMACIN Y PREDICCIN POR INTER1ALO EN REGRESIN LINEAL SIMPLE

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

13

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

14

Me/i%in /e ! /e%& %in /e! "$/e!$ /e regresin. - An7!isis resi/& !

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

15

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

1'

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

1$

1.1.8. USO DE SO+T9ARE ESTAD:STICO

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

1!

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

1(

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

20

1.2. REGRESIN LINEAL MLTIPLE

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

21

1.2.1. PRUE3AS DE 4IPTESIS EN REGRESIN LINEAL M;LTIPLE

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

22

1.2.2. INTERVALOS DE CONFIANZA Y PREDICCIN EN REGRESIN MLTIPLE

P)*+,- ./,)+ 0/+1202+34+. 2352625*-7+. D+ )+8)+.293.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

23

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

24

1.2.3. USO DE UN SOFTWARE ESTADSTICO

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

25

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

2'

1.3 REGRESIN NO LINEAL


9upongamos que al hacer la representacin gr"ica correspondiente la distribucin bidimensional, hemos obtenido la "igura E.(c. 9e observa una clara relacin entre las dos variables, pero desde luego, esa relacin no es lineal. or tanto, debemos buscar la "uncin que ha de describir la dependencia entre las dos variables. ;os limitaremos al estudio de las ms utilizadas* la "uncin parablica, la logartmica, la e!ponencial y la potencial. PAR<3OLA DE REGRESIN #n muchos casos, es una "uncin de segundo grado la que se a$usta lo su"iciente a la situacin real dada. /a e!presin general de un polinomio de 0M grado es* )+a-b'-c' 0 donde , - y % son los parmetros. #l problema consiste, por tanto, en determinar dichos parmetros para una distribucin dada. 9eguiremos para ello, un razonamiento similar al que hicimos en el caso del modelo de regresin lineal simple, utilizando el procedimiento de a$uste de los mnimos cuadrados, es decir, haciendo que la suma de los cuadrados de las desviaciones con respecto a la curva de regresin sea mnima*

.onde, siguiendo la notacin habitual, y a son los valores observados de la variable dependiente, e los valores estimados segn el modelo4 por tanto, podemos escribir . de la "orma*

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

2$

ara encontrar los valores de a, b y c que hacen mnima la e!presin anterior, deberemos igualar las derivadas parciales de . con respecto a dichos parmetros a cero y resolver el sistema resultante. /as ecuaciones que "orman dicho sistema se conocen como ecuaciones normales de Gauss %igual que en el caso de la regresin lineal simple&.

+UNCIN E2PONENCIAL= POTENCIAL Y LOGAR:TMICA #l problema de a$ustar un modelo potencial, de la "orma )+A' b y uno e!ponencial )+AN' se reduce al de la "uncin lineal, con solo tomar logaritmos. M$/e!$ #$*en%i !> 9i tomamos logaritmos en la e!presin de la "uncin potencial, obtendremos*
log) + logA -b log'

<omo vemos es la ecuacin de una recta* )+a-b', donde ahora a + logA. .e modo que el problema es sencillo, basta con trans"ormar ) en log) y ' en log' y a$ustar una recta a los valores trans"ormados. #l parmetro b del modelo potencial coincide con el coe"iciente de regresin de la recta a$ustada a los datos trans"ormados, y A lo obtenemos mediante el antilog%a&. M$/e!$ e.#$nen%i !> >omando logaritmos en la e!presin de la "uncin e!ponencial, obtendremos* log) + logA - logN ' >ambin se trata de la ecuacin de una recta )+a-b', pero ahora a$ustndola a log) y a '4 de modo que, para obtener el parmetro A del modelo e!ponencial, basta con hacer antilog%a&, y el parmetro N se obtiene tomando antilog%b&. M$/e!$ !$g r(*"i%$> /a curva logartmica ) + a - b log' es tambin una recta, pero en lugar de estar re"erida a las variables originales ' e ), est re"erida a log' y a ). Demos visto, cmo, a pesar de ser inicialmente modelos mucho ms comple$os que el de una recta, estos tres ltimos se reducen al modelo lineal sin ms que trans"ormar adecuadamente los datos de partida.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

2!

8igura E.G* <omparacin de una posible verdadera relacin entre cantidad de abono y crecimiento de una planta, con los resultados de una recta de regresin obtenida mediante el estudio de un rango limitado de valores de abono. C$rre! %in <omo hemos visto con anterioridad, al analizar las relaciones e!istentes entre dos variables aleatorias cuantitativas, deberemos responder a las preguntas, de si e!iste dependencia estocstica entre ellas y de qu grado. #l anlisis de correlacin nos dar respuesta a dichas preguntas. Pr&e- /e in/e#en/en%i /e /$s % r %*eres %& n*i* *i'$s .os variables ' e ) son independientes, es decir, no estn relacionadas, cuando la variable ) tiene el mismo valor, en media, sea cual sea el valor de la variable ' y viceversa. %Oer por e$emplo la "igura E.(a&. <omo vimos en la seccin E.(.1.(, la covarianza poda ser una medida que nos habla de la dependencia entre las dos variables. 9in embargo, la covarianza presenta el inconveniente de que no se trata de una medida adimensional, y por lo tanto se hace necesario conocer la "uerza de la relacin Psi e!isteP as como poder realizar comparaciones entre pare$as de variables que vienen medidas en unidades di"erentes. or ello, y dado que viene medida en unidades de la variable ' por unidades de la variable ), la dividimos entre las correspondientes desviaciones tpicas, obteniendo as, el denominado Coeficiente de correlacin lineal de Pearson y que denotamos con una r minscula*

#s importante "i$arnos en que hemos denominado a dicho coe"iciente* coe"iciente de correlacin lineal de earson. #l 7apellido lineal7 es conveniente utilizarlo porque dicho coe"iciente solo tiene potencia para analizar si la relacin entre las dos variables es o no de tipo lineal. 9i las variables son independientes, es un
INGENIERIA INDUSTRIAL %SIST. ABIERTO& 2(

hecho de que el coe"iciente de correlacin lineal debe ser cero. 9in embargo, si el coe"iciente de correlacin lineal es ,, no implica que las variables sean independientes, simplemente que la relacin no es lineal. <omo vemos, el coe"iciente de correlacin lleva asociado el mismo signo que la covarianza, por lo que si ste resulta ser positivo, indicar que se trata de una relacin lineal directa, mientras que si es negativo, la relacin ser inversa. Re! %in en*re r , R2 Una propiedad sumamente importante del coe"iciente de correlacin r es que si el procedimiento de a$uste de la recta de regresin es el del criterio de los mnimos cuadrados, resulta* r2 ? R2 #n el apartado E.(.1.0 vimos que el coe"iciente de determinacin era un valor acotado entre , y (. >eniendo en cuenta la relacin anterior, podemos asegurar que el coe"iciente de correlacin es un valor acotado entre P( y -(. 9i r+-(, e!iste una correlacin positiva per"ecta, y si r+P(, anlogamente pero negativa %en ambos casos 3 0+(, por lo tanto no hay errores, sera una dependencia "uncional&. A nivel muestra, es di"cil encontrarnos con un valor de r + , aun cuando las variables sean independientes, de modo que podramos pensar que cuanto ms se acerque a (, el grado de relacin entre ' e ) ser ms "uerte. J9in embargo, a partir de qu valor muestra de r decidiremos que las variables son independientes, y a partir de cul diremos que estn relacionadasK Dis*ri-&%in /e! %$e0i%ien*e /e %$rre! %in "&es*r ara dar respuesta a la pregunta anterior, se ha estudiado la ley de probabilidad de los coe"icientes de correlacin observados en muestras e!tradas al azar de una poblacin en la que se sabe que ' e ) son independientes, es decir, que el coe"iciente de correlacin poblacional es ,.

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

30

CONCLUSION
<on el estudio realizado podemos concluir que la relacin de los gastos e"ectuados en los via$es arro$o como resultado de relacin .E1.01Q, los cual no es buena relacin. <on el anlisis de comparativo nos dimos cuenta de que las variables a"ectan en la ecuacin de regresin pero no si signi"icativamente, la variable que mas a"ecta en la ecuacin de regresin "ue la del combustible ya que creemos que por que "ue en mayor cantidad pero la in"luencia que tiene es mnima ya que la liquidacin total no varia mucho en los cambios de dicha variable./a ecuacin de 3egresin /ineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba 8, relacin. #sta relacin se ha estimado en un 3 + B1.G, que indica una "uerte relacin positiva.Adems si consideramos el coe"iciente de determinacin 3R + AG.B podemos indicar que el AG.BQ de las variaciones que ocurren en el peso se e!plicaran por las variaciones en la variable estatura. 9i sabemos que e!iste una relacin entre una variable denominada dependiente y otras denominadas independientes %como por e$emplo las e!istentes entre* la e!periencia pro"esional de los traba$adores y sus respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y la cantidad de "ertilizantes utilizados, etc.&, puede darse el problema de que la dependiente asuma mltiples valores para una combinacin de valores de las independientes.
INGENIERIA INDUSTRIAL %SIST. ABIERTO& 31

/a dependencia a la que hacemos re"erencia es relacional matemtica y no necesariamente de causalidad. As, para un mismo nmero de unidades producidas, pueden e!istir niveles de costo, que varan empresa a empresa. 9i se da ese tipo de relaciones, se suele recurrir a los estudios de regresin en los cuales se obtiene una nueva relacin pero de un tipo especial denominado "uncin, en la cual la variable independiente se asocia con un indicador de tendencia central de la variable dependiente. <abe recordar que en trminos generales, una "uncin es un tipo de relacin en la cual para cada valor de la variable independiente le corresponde uno y slo un valor de la variable dependiente. #n estadstica, la regresin no lineal es un problema de in"erencia para un modelo tipo* y "! + % ,S & - T basado en datos multidimensionales !, y, donde " es alguna "uncin no lineal respecto a algunosparmetros desconocidos S . <omo mnimo, se pretende obtener los valores de los parmetros asociadoscon la me$or curva de a$uste %habitualmente, con el mtodo de los mnimos cuadrados&.

BIBLIOGRAFIA
http*66UUU.monogra"ias.com6traba$os0G6regresionPsimple6regresionP simple.shtmlVi!zz0!WDA1X=?

=.A.8 9eber and <.W. Yild. Nonlinear Regression. ;eU )orL* Wohn Yiley and 9ons, (BAB.

3.Z. Nethea, N.9. .uran and >./. Noullion. Statistical Methods for Engineers and Scientists. ;eU )orL* Zarcel .eLLer, :nc (BAI :9N; ,P A0HGPG00GP'

"ile*666<*6Users6>#Z .O:<>?36.oUnloads63egresiQ<1QN1nQ0,no Q0,lineal.pd"

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

32

http*66es.scribd.com6doc6(,IAI,HG(6#9>A.:9>:<AP:;8#3#;<:A/P::P /:N3?

INGENIERIA INDUSTRIAL %SIST. ABIERTO&

33