You are on page 1of 17
Te. O.0 0.0.0 0 Oe Oe ee i, le ee Ba pala arelvalor de una respuesta que coresponde an valor dado de una variable expli Si conocer el valor de una sola variable explicativa mejora la capacidad para pr redecir la res- puesta, pdriamos emplar las variables expictivasadicionales en nuestro beneficio, Para estudiar la relacién més complicada entre diferentes variables, utilizaremos una extension na~ tural del anlisis de regresion lineal simple conocido como regresion mille. Con ayuda de la regresién miltiple, estimaremos la ecuacién de poblacién Hytesrminte = FBX + Bak * FBX ‘en caso de que las demas variab ppermanezcan constantes. i 7 ‘Con el fin de hacer espacio a la variacién natural de las medidas de respuesta, prepa- ramos un modelo de la forma yaat An tBmt~ +h, +6 10s coeficientes de la ecuacién de regresién de poblacién se calculan con una muestra aleatoria de observaciones representada por (Xy Zy9s+u1Xqp Yi) 450 Copilo 19. Regrsign mile Sin embargo, del mismo modo que se plante6 una serie de suposicidnes para el modelo que implicaba una sola variable explicativa, asi también hay que establecer un conjunto logos para el modelo, més complicado, de regresién malt coaipacall os los cuales se considera 2 aise ig URTINIH e 5 Como en, el caso dela regresién simple, 19.1.1 Ecvacién de regresién de minimos cuadrados Para calcular Ia ecuacin de regresién de poblacién Pinner OB Hh tt By aplicamos el método de minimos cuadrados con el fin de ajustar el modelo Jrdthn that tage sta tenia equ edir al mini a Suma de os cadens dels resis, o, en es te caso, t = Sr é-fni-Aa—~ Aya? yp mies que ‘ riab) {que los céleulos son mis complejos que en el caso de los modelos con una sola variable ‘xplicativa, no presentan un problema cuando disponemos de una computadora, nal capitulo 18 enconrames una relacién lineal signfcativa ete le cireunferencia, de In cabeza y el periodo de gestacin en la poblacin de nis con bajo peso al nacer. La wt: recta de regresi6n ajustada de minimos. cuadrados cra . $= 3.9143 + 0.7801x, fica ae ces Ate, eee ee ee ee a, 19.1 Emodelo 451 también depende del peso al nacer imensional de la circunferencia de bajo peso al na inferencia de'la cabeza fica de dispersion bi ‘de una muestra de 100 nilos con. Podriamos preguntamos sila circu de un no. La figura 19.1 es una gr Ia cabeza en funcién del peso al nacer Boston, Massachusetts [1]. La “ejora el empleo del peso al nacer nuestra capac dad para predecir esta caractristica de un nifio? ‘Supongamos qu cou cién de regresin ajustada de minimos cuadrados ¢5 = 83080 + 04487, + 00047ry- Laintersecei6n-con el ejey de 8.3080 és} ent cabeza de nifos de bajo peso al nacer con un periodo de gest Sl nacer de O gramos. En este ejemplo, ni una edad de 0 ni un peso de 0 tes smo valor que cuando este perio- tocfiientealeulado de period de gestacién no tiene el mis caane eee variable expicativa en el model su valor ha disminuido de 0.7801 8 0.448% tea sapotienda que el exo alnacr de un nfo pemanece constant cade i ‘remento de una semana en el periodo de gestacin core entimettos en la circunerencia de la cabezs, en centmet® cnmo peso al nacer pero con peiodos de getacin tales que el del primer nio en oe cpa nae ago que el del segundo, l primer nif tends una circunferencia dels ‘Shezaaproximadamente 04487 cealimeres mis grande, Asimismo, el coeficienie d¢ PSA, Stnacer indica que si el periodo de gestacién de un nlfo no cambia, cada le humo en el peso al acer da como resultado en promedio un incremento de 0.0047 cetime- ttos en Ia eircunferencia de la cabeza. ori, el valor medio de la circunferencia de la tacién de 0 semanas y UN peso nen sentido. El forma equivaleate, si dos 32 28 ° Seo 0 eco nse 2A \aiale an fon one CGireunfecencia de la cabeza (ceatimetros) 20 500 750 1000 + ©-1250—=—«1500 eso al nacer (giamos) Figura 19. Cirenferencia defo cabeza en func del peso al nacer de una muestra de 100 nifos con bajo peto ol nacer. (452 Cope 19, Regresi mile 19.1.2 _Inferencia para coeficientes de regresién., Del misino modo que se apie el anlisis de regresi line simple, es posible wil modelo de regresin de minimos cuadrados ‘ shathntothe ‘para hacer una inferencia sobre ta. ‘ecuacién de regresin de poblacién See Les coefiientes de regen ya se alan con una macs de datos tomas de Tne SE aes Caran te elgir una mcs iret oc on tc ic adres dees entimadrs cone n.d ace alguna ices sobre ls verse purines de poli. ; ree Teac er mcs as pndetscoespondiente 8a po- tan eas setenv sab camo nel at el mse que cone nasa © _SECSSISMISSSUS Silents mero cuand se procs lain oe Phermenty 2B +B * HebmBas ex contrast con la hipitess tera € . Hebitbe ssuponemos que los valores de las demis variables explicativas x # xj permanecen constan- tes. Segundo, si a hipStesis nulaes verdader, el estaditico de prueba = Abo eG) no obedece a uns distibucién 1 con n—2 erados de libertad. Porelcontraro, tiene una dis- = ‘ibucibn cong] gradosdelibecad donde qe acai de variables expicatives {SE cimocein, Pura el matelo que conten el priodo de gestacia yet peso al nicer, ges {goale 2y i distrbuciin radecuada ene 100~ 2197 grados de libertad. Esta distibu- ‘Ssarrvesiza para eocontrar,l probbilidad de observa una penientecalulada tan ex- {tema o mis que en eso de qe a verdadera pendent de poblacia se Boe a el ase 6 los 100 niflos con bxj peso al nacernaidos en Boston, poede demos rane que 29) 19.1 models 453 Para llevara cabo un prosbabidimensona ea hiétesis ula de que 2 —Ia verdaders pot lente qu relaciona I crcunerenia dela cabeza con el periodo de gesacin, poner fue el valor dol peo al nacer permanezcaconstante— e5 igual 30, calculamos cles p= Aico P BO) _ 04487=0 0.0672 = 668, 66 ‘ ; Enel caso de una distibucién #con 97 grados de libertad, p< 0.001; por tanto, rechazamos ta hipbtesisnula en el nivel de signiGicanca 0.05 y concluimos que es mayor que 0. De manera similar para probar Ia histesis nla HeiBy= 0 en conraste con Ia hipStess alterna Hg b4, suponiendo que el periodo de gestacin permanece constant, calculamos i De nuevo, p< 0.001, y concluimos que f, es significatvamente mayor que 0. Por tanto, 1a Cecunferencia de Ia cabeza aumenta conforme se inerementan el periodo de gestacién o el peso al nace No obstante,debemos recordar que las prucbas miltiples de hipotesis basadas Ppl mismo coajunto de datos no son independientes. Si cada prueba individual se lleva a abo enel nivel de significancia ola probabilide total de cometer un error de tipo 1—o de rechazar une hipétesis nula verdadera— 5, de hecho, mayor que “Ademis de llevar a cabo prucbas de hipétesis nulas, también podemos ealcularintet~ valos de confianza para los coeficentes de regresi6n de poblacién. Asimismo, podemos Construr un intervelo de confianza para la media estimada de Y y un intervalo de prediccién para el valor individual estimado y correspondiente a un coajunto dado de valores para las Fariables explicativas. En todos los e803, ls procedimientos son anélogos alos que se lizaron evando participeba una sola variable explicativa 19.1.3 Evaluacién del modelo oeficiente de determinacién y uns Por ejemplo, a 4454 Copnlo 19 Regrsisnmiile al modelo mejora nuestra capacidad par P ‘ibm denis con bajo peso al nace. i ops nd comparaos cosines de to diferentes modelos El conocimiento del periodo de ses fos sobre Ia varablidad observade iodo de gestacién so Sasa as earn yadeoe o no. Nos gustaria cuanifict el efecto dela toxemia en circon: rattan comparando ifs cuyas madres padecieron esta enfermedad con nifos dela variable sleatoria nominal Te variable indicadora toxemia ala ecuacién de regresin que y= ‘Suponga que se afl hora se ignorard el peso al nacer. EI modelo de regre= contiene el priodo de gestacién. P ibn ajustado de minimos cuadrados es 14956-+ 08740, —141231y, que ide Oa 1. Una prucha de hipétesis mula cn contrast con la hipétess alterna suponicndo que el periodo de gestacién no eambia, da como resultado un etadistico de pruc- bade 1=-3.48 y p= 0.001, Por tanto, echazamos Ia hipétesis mula en el nivel de signfican- tin 5 y conlimos qe es menor que 0 dados dos niftos con perodos de getacin atcos, la eicunferencia dela cabeza sefa menor en promedio para el nifio cuya madre padecid toxemia durante el embarazo que para el nifio euya madre no la padeci AS6 Copihlo 19 Regreisn mile modelo de regresin que contenga una variable ex- plicativa continua y una variable expictivabinaria podemos considerar Ia ecuacién de Fe~ resin de minimos cuadrados ajustada a la muestra de 100 nlids éon bajo peso w! Hare Como dos modelos diferentes, que corresponden a los dos valores posibles de Ia variable sleatoriabinara toxemia, Cuando x, = 1, por ejemplo, que indica que & una mujer se le diag- * nosticé toxemia durante el embarazo, ‘Con el fin de comprender mejor un = 14956-40740, 14123) = 0.0833 + 0.8705, Six, =0, $= 1.4956 + 0.8740s, ~ 1.4123(0) = 1.4956 +0,8740%,. En cada grupo, un ineremento de una\semana en el period. de {gestacién se asocia con un ineremento de 0.8740 centimetros en la circunferencia de la‘ca~ beza en promedio. Esta es consecuencia del ajuste de un solo modelo de regresin para dos ‘diferentes grupos de nifios. Puesto que una recta se encuentra exactamente encima de Ia otra lo que se determi bign sugieren q Toxemia <1 1 Toxemia = 0 i ‘Grcunferencia de a cabeza (centimetros) came 2c 280s) misread ag Periodo de gestacin (semanas) FIGURA 19.3, Rectas de regresin ojstadas de minimos evedtados pare diferentes niveles de toxemia, 19.1 Elmedelo 457 emia. ‘Como ejemplo, un incremento de fa tener un efecto distinto en la circunferencia sho de si In madre habia padecido toxemia du- sta naturaleza, creamos 10 que S© uuna semana en el periodo de gestacién pod de la cabeza de un niio dependiendo del hee rante el embarazo, Con el fin de diseftar un modelo de = 17629 + 08646x, ~ 2.81508, + 00462% 15 Al probar Ia hipStesisnula Hf en funcin de la hipétesis alterna Hg B34, 4 ‘ ‘Debido a que eltérmino de interaccién no es estadisticamente signficativo, no se con- i i6n. No obstant, i ! ‘ecuacién de mnimos cuadrados seis = 1.7629 + 0,8646x, ~ 2.8150(1) + 0.0462x\(1) 1.0521 + 0.9108x,. i Six0, = 1.7629 + 0.86465, ~2.8150(0) + 0.04621,(0) 7629+ 0.8646. ASB Cogito 19. Regresion mile Toxemia = 1 Toxeria = 0 36 32 28 4 CCreunferencia de la cabeza (centimetros) 20 Somigaytae pyzeby ponmeaz net) 36 Pesiodo de gestacin (semanas) | FIGURA 19.4 > Rectos de regresién ojustodas de minimos cuadrades para diferentes niveles ‘de toxemia, incuid eltermino de interaeci6n. Estas dos recta aparecen en la figura 19.4, Observe que tienen diferentes intersecciones con clejey y diferentes pendientes. Sin embargo, en el intervalo de interés una recta todavia se LUbica completamente por encima dela otra Esto implica que para todos los valores relevan- tes del periodo de gestacién los nifios cuyas madres no padecieron toxemia promedian medi ciones mis grandes de citcunferencia de cabeza que los nifios a cuyas madres se diagnosticé este padecimiento. Sin embargo, para estudiar cabalmente el efecto de cada una de estas variables explicativas seria necesario llevar a cabo andlsis por separado de cada posible combinacién de variables. Los modelos resultantes podrian evaluarse ense- tenemos una gran cent epost prpcedimiento podria no ser factible. Por tanto, on iversos enfoques equiv ania de acuerdo con alginerteio estado. Ia “mejor? tevincion de regresién rei el nombre de enfoque de los posible. Este es el frecuencia recurrimos a uno de los tes para elegir un modelo de 19.2, Seleccién de modelos 459, por incluir la por tanto, explica la mayor proporcion de comenzand que, por tanto, a las otras variables en el modelo. Si a Seueeiate 72 no es estadisticamente signifi ‘iva, lavariable se elimina por completo del model procedimiento se repite hasta que La ecuacién se evalia en cada paso, el \ ras variable conservada en el modelo explique una POr- ign significativa de la variacién observada en Ia respuesta ‘Comenzamos como si uti- iets el roceditiento dea scleccién anterior, introduciendo una variable

F Hoan’ FL eas.dsséapsod-caenr | {6.672% 0-0004 weer 7 gan ssoese 6.62409 Crroral 99 1262.76000 root MSE 2.57567 Dep ean” 36.8200 ew. 6.99531 peraneter Standard for 10: variable" DP —Eatinate naeedparaneter0~ Probr!T! irencer 1 6.ze4326 3.19182426 1.969 00518 S:bese03 0:21210280 biseq 0.0002 a2ise1___0.0120 scrsmace 1 ‘Tor 3 -4caprsen__0.69399203 Tperiode de gestaclén aria deta oxemia Cuando 3, * 1, qe indica que una made padec6 toxemia rate ch embrazo, 9= 6284 + 1.070x,~ 1.7711) 4507+ 1.0705. Cusndo = 0, jab 20d 1.070, 17710) =6284+ 1.0708; oe Las dos recta aparecen ola gra 19.6, Observe que las rectstenen penieates ities asd cic ao, unicremento de una semana eet periodo de gestaciéncorespande rate cremento de 1,07 centimetos en Ia extatra en promedio, retina sun increment del priodo de getacién tiene un efecto distinto en I sett a cuyas madres es diagnostic toxemia en compaacién con aquclas dara oa le daprostic, ein una variable adicional: la imtraci etree => eet tacion ya toxeri ltrmino de interac se obtiene a mila los resale ado ot es doo vaiables alesorias que representin el perio de getacn y Ia stuacn ‘aie de a toxena, La slid de Sut comespondient este modelo aparece ca la abl wpe tas nla mesa de 10 fos con bao peso a acc, el modelo justado de ml- ios cuadradose6 = 6.608 + 1.058%, ~3.47%5, +0.0559% 5 464 Copinlo 19 Regresién mile ‘¢ Toxemia = 1 ‘& Toxemia =0 46 2 38 u 30 6 Estarura (centimetros) 2 18 Diemeamaze mater s0n 32) 34) 36 Periodo de gestacin (semanas) FIGURA 19.6 Recls de regresin ajustadas de minimos cuadrodos pare diferentes nivel de toxemia. TABLA 19.3 ‘ Solida de STATA que msi la regresin lineol de la estatvra sobre el periodo de gestacién, la toxemia y 3 ilaraccién. pee oe rato monty ce cea = 00 SS ws) 1 aove2 cas. san057 3206, 507968 Prob» 2 otobe0 G13.259803 98 “6. 70039485 po oesraidis = ae.cs0e Pace esc agar 204707 ae2.76 992798151 Aaj Rraguare > 9.4707 Gecaeuze | icon Beas Bie Poe 0950 cont Tntorvall gestege | 1-0sesse _aeass2 aaa @.000~——~.00077647 “1.300152 toe | Sdpneas elsiseser -o'e08 oleee—-f0.s0003 25.4340 aesctsr | éasou0“cayscesi 1200 O1asa— 44307929. i074? esses | agouzes— ssaee7 Yass v0e9 sisa3ans4_i3-74001 No podemos rechazar la hipétesis nula de que fy, ei coeficiente del término de interaccién, 3 iguala 0 (p = 0.84); la Rajustada ha disminuido de 48.0% a 47.5%. Adems, la alta co- rrelaciGn entre a toxemia y la interaccién periodo de gestacién-toxemia (el cocficiente de correlacién de Pearson es igual a 0.997), ha introducido Ia colinealidad en el modelo, Obser- ‘ve que el error estindar del coeficiente calulado de toxemia es aproximadamente 12 veces més grande de lo que lo fue en el modelo que no contenia el término de interaccién, Por tan- 19.4: Ejercicios de reporo, 465 “4 Residuo HO) on BZ fa} B4wins36. «288m eADn ily AZ Valor ajustado de estatura FIGURA 19.7 Residvos on funcién de valores ojustados de estatra to, concluimos que no hay evidencia de que el periodo de gestacién tiene un efecto distinto cen Ia estatura dependiendo de si una madre padecié toxemia durante e! embarazo. De regreso al modelo que contiene el periodo de gestacién y Ia situacién respecto de la toxemia, aunque no a su término de interacci6n, la figura 19.7 muestra una grifica de residuos. Alli parece haber un valor atipico en el conjunto de datos. Seria factible eliminar ese valor, reajusta la ecuacién de minimos cuadrados y comparar los dos modelos para determinar qué tfeeto tiene el punto en los coeficientes calculados. Sin embargo, las suposiciones de homos- cedasticidad no se han violado, y no parece ser necesaria una transformacién de variables. 1. 1Qué suposiciones hay que hacer cuando se utiliza el método de minimos cusdrados pa~ ra caleular una ecuacién de regresién de poblaci6n que contenga dos o més variables ex- plicativas? 2, Dado un modelo de regresién maitiple con un total de q diferentes variables explicati~ vvas, je6mo haria usted alguna inferencia sobre un solo coeficiente fj? 3. Explique como contribuyen el céeficiente de determinacién y la R* ajustada a evaluar el ajuste de un modelo de regresién miltiplea los datos observados. 4: {Cual es la'funcién de un término de interaccién en un modelo de regresién? {Como se crea un término de interaccién?

You might also like