You are on page 1of 6
11 Regressdo linear simples Oss a eet ace ages states a au ha razdes para Supor uma relagio de causs-efeito entre doas variiveis quamtitativas e se » escja expressar matematicamente essa relacio. Geralmente chama-se a varie ‘dependence (ou varidvelresposta) dey e a independente (ator, varidvelexplcativa ‘ou varvel preditiva) de x. As expresses a seguir, utlizadas em diferentes lingua- ) (gens, tém todas basicamente o mesmo significado: ~y depende de x (linguagem cotoquial) ) = 6 funelo de x (linguagem matemética); existe regressio de y sobre x (linguagem estattstica) O terme regressdo deve-se a sir Francis Galton, que publicou, em 1886, um. antigo no quel tentou explicar por que pais de alte estatura tinham filhos com estatura em média mais baixa do que a eles e pals de baixa estaturatinham filhos fem média mas altos. Esse fenémeno fot chamado de “regressio A média",termo ‘que, apeser de inadequado para expressar a dependéncia entre duns varidvels ‘Quantitativas, acabou sendo incorporado pelo uso a linguagem estaistica ‘Em um estudo de regressao, os valores da variével independente (x) geral- ‘mente sto escolhicios,e pare cada valor escolhido observa-se 0 valor de y corres- pondente, Por exemplo: se um pesquisador deseja estudar a forma pela qual a pressio arterial depende da idade, pode estudiar individuos com x = 30, 35, 40, 45, exe, anos de idade e ent medir suas pressbes arterais. No entanto, para que (0s resultados sejam fidecignos, o individu de 30 anos ndo é escolhido proposita- ‘amente, mas sotteado da subpopulagio de pessoas com essa idade, « mesmo ocortendo com 0 de 35, 0 de 40 anos e assim por diante. (Os objetivos do estudo da regressio sto: (2). avaliar uma possivel dependéncia de y em relagio ax; @)_expressar matematicamente esta relagio por meio de uma equacto, GRAFICO DE DISPERSAO “Todo estudio de tegresséo deve inicar pela elaboracio de um grifico de dlspersio dos pontos. Esse passo é fundamental, pois 0 grfico js dd uma boa iia da exis- Bicertatistce 8 séncia on nf deregesso, bem como evita o erode aplcar a écica a dados para os quais nao é adequada. . = Exemplo 1. Siponha que un bilogo ete extadando a reas ene a aquanidde (/1) de cetrminado poluene (8) éespejado por ame fbsica em mricho, eo caro eclepto nese cuca agua metico porum esate de can. Orvalores observados peo pesqusador eno Incendosnaabela 1 1, ¢2Figura 11Yapresenso gré6co de pontos correspondent Feo gt, pode notar ua lds dependéni entre o excore de dana e + conenragi do poente Sn gu tl dependéntn podera ser fepreentada ereexmae po a ha, posveneste une, mind scm ao jo rao or dese exisenes Ente os ponte experiments a nha propeta, alas soa eagben Ge cata flo que Poder se eoumides or as rer evtendo se, sen, oso de tabeas de dado pars mosar roagze, A anulse de rerio liner simples €um prozedimento que fomeceequagbes de Tnhas reas (por is, 0 terma “nest, que cesrevern fendmencs tm Hd tuna vase ndependete apenas (porie, simple). Neste capil, sito v- les pans eis ara ere aia laa eta or don pe Tera ox presupostos pare o tee da epresso 5 solues pare case em que essas pressuposiqbes ndo sdo satisfeitas, a 7 ARETA DE REGRESSAO LINEAR Equacio da rota Acequagio da reta pode ser dada por: y + Be TABELA 1 Escovedo cei nest pr stones cancers de pet iach R sme oe ‘Guana de pavers Gait azar de dao ecaiico 1 2 2 6 3 : 5 ° 5 2 as u 2 e a6 as ii i Toei eu eee eres pie etl tear % Sidia M. Callegari-Jacgues onde = vaiével dopendence; 2) pardmeto ou cofcent nent (valor de y quando x = 9} = pardmetr ou coeficiente angular (incinago da ret acréscimo ou de- cyéscime em y pare cada aréscimo de una unidads em; 1 = varivel independent. ‘A Figura 11.2 ilustea os coneceites. A linha reta corta 0 eixo y no valor 10, logo A = 10, e para cada sumento de uma unidade em x, ha um decréscimo correspondente de duas unidades em y, logo, B = -2. 0s pontos experimentais [No modelo matemético recém-indicado (y = A + Bx), a letra y representa um. valor que € Fixo e dependente de um determinado z, ito é y é wma quantidade ‘que alo pode variar quando x assume determinado valor. Com dados biolégicos, ho entanto, & comum verficarse variagio na varidvel dependente quando ela & Imedida pare um certo valor da variavel independence. Por exemplo, valores die rentes de pressio arterial (y) so observados para individuos da mesma idade (x). ‘Assim sendo, 0s pontos obtidos por um experimentador difcilmente se colocam texatamente em uma linka, embora se possa observar multas vezes que os dados tendem a um alinhamento, Oe “desalinhamentos” so interpretados como des- ios, ao acaso, do comportamento geral do fenémeno. # por esta razio que se pensa em ajustar uma linha reta a pontos que nlo estdo perfetamente alinhados: 2 eta vai fepresentar o comportamento médio dos valores de y A medida que x fumenta de valor, © modelo matematico proposto, neste caso, éy =A + Bx + 6, onde e representa a diferenga entre o valor observado € 0 esperado, segundo a ret, dey. 7 ‘A inha reta representa o comportanieiio Ue valores de y médios eaperados pata distintos valores dex, isto é, a reta representa uma médis que se modifica & edida que os valores dex aumentam. No caso do Exemplo 1, para x = 2 existe ‘um conjunta de valores possfveis de escore de dano que podem ser obtidos quan- oa concentragio do poluente $ & 2ug/L, sendo que a médis desses escores esté sobre a linha verdadeire, Quando a concentragio 63 ug/L («= 3), hé um outro FIGURA 1.2 sta que ttre» equagto y= 10~2x.Aabsla mosia valores esoohidoe de x9 08 Go yconeepondento seguro ost equa. conjunto observivel de valores de dno, cuja méia é um pouco maior do que a anterior e também esté sobre a rete assim sucessvamente. Bm cada uma destas “subpopulagbes, os valores de y variam ao redor da média deste grupo, como se pode ver na Figuta 11.3. Uma pressuposig importante para o test etatitico da regressio de que esa variago éa mesma nas varias cubpopulagées (homoce- Aasticidade), conforme serd visto mais adinte ‘Alina que se pretende usar para representar o fendmeno parte doz dados experiments, que consttvem um eoajunto de pontes mals ou menos deselinhe- dos, Pode-se persar, em um primeire momento, em tragi-la& mao live, buscando a reta que passa & menor distincia de todos os pontes. Dependendo da amostra, zo entanco, um desenho dessetpo vai estar sete am grau malor ou menor de erro de julgament sobre qual ¢ linha que melhor se ajusta acs dados. Na pr sna seg2o,Serdapresentado um métod0 analdeo para @obtencao da “melhor” Por outro lado, uma ver desenhada a ret, deseja-se multas vezes fate pe visSes para a partir de valores conhecidos de x. © procesto gréfic consiste em escolher um valor de x, levantar uma perpendicular até a retae, a partir dela, desenhar umalina horizontal até o eo y, buscando nele o valor esperado para. Tis previsbes esti sueltas aero, pois so fleas visualmente, com Date no fico. Se, no entanto, for pssivel defiaira equagHo que representa a ret, pode-se obteruina melhor estimativa para y, pois «equago fomnece previsdes indepen dentes de ulgamento grifico, Esta equaeko pode ser obtidae se denominaequc- go de regessto No cso da regressions simples, «equi de retest & uma rea de regress. Obtencao da reta de regressio [Areta de regressdo verdaclira seria obtida se fossem conhecldas os valores dexe 4 vats \ods os ldividuos da populacao, Nesse caso, serlam conheeidos a altura verdadeira da reta (0 coeficiente linear A) e a inclinagSo verdadelra da reta (0 cocficiente de regressdo B). No entanto, o mais comum ¢ estudar a regressio entre xe y uilizando uma mostra da populacio de pontos. Sao ealculados, entéo, ae b, que sio as estima FLGURA 11.3 Represenag io moseio ae rgtese ‘mosvance ® astibigso ce 0 redr da tna oe ragressa bara ust vores slocons fos dex Note que as mésias (a yestzo sobre a tana veta © (ue a vaegdoé a mesma nes (uate sutpopalagces. (Fons: Snedecar'e Cochran, 197! pass) ) 98 Sida Me Callegei-acquet sivas dos prdmtios A eB. Ess valores sto obids pelo Mo ds Minimos vas ds prt cham pe garante qu eta btn € gia paa agua aaron mde ao aad) ee valores obvervados O) € & propria eta (0 coeficiente b é calculado da seguinte maneire: Do Behe area cenquanto 0 coeficiente linear a € obtido por ae Foe onde F e ¥ sfo ap médias para y ex, respectivamente ‘A reta estimada de regressio € at bs sendo } o valor estimado (ou esperado) de,y pare cada valor de. ‘A Tabela 11.2 apresenta 05 céleulos necessérios para estimar a reta de re gressio que descreve 0 aumienio no escore de dano ecslégicoconforme a quant: dade de substancia § presente na agua do riacho R. ‘O valor de b para estes dados é: ‘enquanto que o valor dea é = by = (48/6) ~ 1,7101/6) Verificou-se,entio, que b= 1,71 graus de dano/ug/ sto 6 pars cada acrés” cimo positive de um (1) g/L-pa concentragio de $ parece haver urn aumento de -1.16.5) /ARELA 1.2 Detoinaie des uate ecoseris pata te Tee ans eo confome a cocanoan dover § oat) ene) = F z 3 7 ‘ s 37 2 : 2 4 2 oe 3 ; n 3 s oie ‘ © rr te 5 ° sos wt a é 2 a Sm ies Biocsatisica 1,7 no indice de dano ecolégico. Por outro lado, 0 escore de dano esperado quan. 0.0 concentragio for 2ero igual a 2,02. ‘A reta de regressio estimada para os dados da Tabela 11.2 &: p= 2,024 171%, sendo {0 valor estimado (ou esperadio) de dano para cada valor de concentracio des. ‘Ajustamento da reta estimada eos pontos experimentais, Para desenhar a eta estimada sobre os pontos do srdfico, escolhem-se dois valo res quaisquer de x (suficienterente afestados para diminuir erros no tragado da reta) e calculam-se os valores esperados () corvespondentes. Por exemplo: Sex=1, f =2,02+1,71(1) = 3,72. Sex=8, } =2,02 + 1,71(8) = 15,70. De posse desses valores, marcam-se dois pontos ((1; 2,72) ¢ (8: 15,70)) ne arifico de dispersto e, unindo-os,traga-se a reta obtida pelo método dos minimos quadrados. Na Figura 11.4 estéo os pontos experimentas ea reta ajustada. Note que os pontos observadios nio estio perfeitamente sobre a retaestimada, mas um pouco afastados, ito é, 0s valores de y observados nao sio iguais aos esperados ( ‘Tals dfecencas sio interpretadas como decorrentes das oscilagdes aleatorias dos valores de y em relagéo ao valor previsto. Fortanto, parece razoével, num primel- ro momento, estimar o escore esperado de dano ecclégico com base na equacio ‘obtida. Por exemplo, para uma concentragio de poluente igual a 4,5 estima-se que o dano sea: f= 2024 1,71(4,5) = 9,72. ‘ATTabela 11.2 apresenta, na iltima coluna, os valores de dano esperados segundo a reta proposta, para as diferentes eoncentragdes do poluente S exa- minadas. E importante lembras, no entanto, que a equagio fol abtida com base nos dads de urna mostra. Serd ela vilida para toda a populagao de valores de con- centracio passives? the inv apeccar co cane selene "jo 6 8 manors valores de. zo 6 ‘Concenracde de polonte 3 gh i) : is oe FGURAtSA Reta dorogoneo f=-202 eof é {7b asada oes srt excermen anforme a soeenrago do poluosle S na ogua.e faci.

You might also like