You are on page 1of 5
10 Correlacéo linear simples Ait gs ite teas en us aracerins quanta being de muitos estudos em biologiae cléncias da saide. Um ecologists pode estar interessado em saber, por exemplo, e ha associagao entre a quantidade de churn bo medida na 4gua eo volume de dejetos despejados em determinado rio; um rédico pode querer avaliar se a pressfo arterial esté relacionada a idade das pessoas. Quanco se pode demonstrar que existe associaglo entre duas varidvels ‘Quantitativas, isto &, quando se constata que elas variam juntas, diz-se que as varldvels estdo correlacionadas. Exemplo 1. Um professor deseja saber se existe comrelagao entre o tempo dedicado 20 estado e a desempenho dos alunos em determinada disciplina, Sorte. ‘dos 8 estudantes dessa disciplna, ao obtidas, por exemplo, as informacbes cons- tantes da Tebela 10.1, onde x representa o nlmero de horas de estudo, ey, @ nota ‘lila eu wine prove, para ceds sluno. Fiea dffel coneluir slguma coies obeer- ‘vendo diretamente 08 dados na tabels, pois ha grande variacio nos resultados. Por isso, o primeito pasco é tentar organizé-los em um gréfic, para melhor visua- licar as relagbes entre as varidveis. DIAGRAMA DE DISPERSAO Para se avaliar a correlagSo entre caracteristicas quantitativas,inicialmente os ‘dados slo representades em um grafico eartesiano de pontos, denominado dia- ‘rama de pontos ou diagrama de dspersao. Cada ponto do gréfico corresponde a lum aluno e é marcado segundo seu valor paraxe para y. Figura 10.1. apresenta esse grafico para os dados do Exemplo 1. ‘Analisanéo a Figura 10.1, pode-se observar que os alunos que estudaram durante mais tempo tendem a ter notas mais altas ¢ os que dedicaram menos horas ao estudo, ater um desempenho pior na prova. No entanto, podem-se ob- servar excegies (como 0 aluno D),o que indica que, embora pares existir uma assoriagao entre horas de estudo ¢ nota, ela néo é uma relacao perfeita Bisesatiica 88 TABELA 10-1 Nimoro dora de esti ola eb por alunos em us ro endo ts) ‘une ters To a @ 1” 8 7 3 € 5 4 > 3 @ E 3 6 F 8 5 S 5 7 H 2 ‘ 2 FIGURA 10.4 Diagram 36 ‘speedo corespndente 20 ° romero horas ce aude DOD tid por tins mt Hore 6 et 6 ad (COEFIGIENTE DE CORRELAGAO PRODUTO-MOMENTO (1) Uwe outa maueira de se avallar a correlagao € usar um coenclente, que tem a ‘vantagem de ser um mimero puro, isto é, independence da unidade de medida das varidveis. Ito interessa bastante, pois se pode ter duas unidades de medida diferentes para as variéveis (como nota e horas), 0 qve difcultaria interpretagio da associagdo. O coeicente de crrelagdo produto-momento (r) é uma medida da intensidade de associacao existente entre duas veriéveis quantitativas,e sua fér- ‘mula de eélculo foi proposta por Kar! Pearson em 1896. Por essa razao, é também. denominado coeficiente de correlagdo de Pearson. Porter sido primeiro a ser ro: posto (varios outros foram ctiados depois), muitas vezes rrecebe simplesmente rome de “coeficente de correlaco”. \VARIACAO NO COEFICIENTE DE CORRELAGAO. © coeficiente de correlacio pode variar entze -1 ¢ +1. Valores negativos de r indicam uma correlagéo do tipo inversa, isto é, cuando x aumenta, y em média diminui (ou vice-versa). Valores positivos para r ocorrem quando a correlacio € dive, eta 0 y variam no mesmo sentido. Ae tae eangiiineas de inculina & slicose apresentam cortelacio negativa; jé a taxa do horménio glucagénio tem correlagio positiva com a glicemia, 88 Sida M, Calg feegues valor mixin (antor = +1 comor =~ éobide quando tots potesdo diag ana oem urna eaincnad Cur 102289) Po oul, quando seerrconelago care xe, spontossecstbuem em nuvens slaves Figura ea. ncocagbes de peu Tatermeciri (rents O € ||) apreentan-se como wicca ncnads, de fone ein (Figura 102 de), sendo mas exes quato aaron fora corel (Figura 10:20) Se, no entano, a nuer elipice fr paella a mds eos do gic acomelagi € nla @gura 102 D. anno pons formare urn nuvem eyo exo prngial € uma cusva (Fi gure Doig by pvaler der ndo mece coretamente a asso.cho entre a varie aa eo cebng porque a enica para calcula ete cocfciente supse que os por- {Ste ran forma nue elites cp ea pte ¢ una resin, sea Beene pode eta apleaya de ua uanafrmagio, por exemplo a log aaah eg ambas as varldvels, ou eno usar dieramente um coeiente de ‘orrelacdo nao-patamétrico, como o coeficiente de Spearman. CALCULO 00 COEFICIENTE DE CORRELACAO EM UMA AMOSTRA ‘A férmula para se obter 0 coeficiente de correlagio de Pearson em uma amostra é x Y-HUeN—D Bieseatisica 8 Reslizando algumas simplifleagbee neeta férmula, resulta, © mumeradordocofiente de correlate ¢ cama de soma dos pad. tosay e¢tepreentado avevadamente por Pare ot clenenon qu oo Gey sac oats meee mines a ted elec ee tees econ cre one eee a estan Oat deeiseentiidin eka peter Pn » (50.50, ‘A formula a seguir é uma alternativa mais conveniente para se caleular r, pois, jé que nao envolve o calculo de desvios para ey, exige um nimero menot de operaghes aritméticas. Jy 2H : 22's, 27) ‘A formula alternativa foi usada para obtencdo do coef para os dados do Exemplo 1. Os céleulos intermedistis esto apresentados na ‘Tabela 10.2, € 0 coeficiente obtido foi e020 5618 ° = =058. [aaa ao aKI6 357TH BIB Note que o coeficiente de cortelacéo (7 = 0,58) ndo é acompanhado de qual- ‘quer unidade de medida TABELA 102 Quatutases necassig proce do contre de cont par os ‘dads da Tabela 10.1 Ee FIGURA 10.2 Diag de daperso, com os valores der comespondentes, ‘une z r = # o * @ 0 e 700 30 5 7 . “ 6 56 ° 6 4 6 6 24 D 3 8 ° ca By e 3 6 8 35 18 F 6 8 38 a 5 6 5 7 5 « 35 = © = 22 a, 200 i i | | i ) | ‘TESTE DE HIPOTESES SOBRE A CORRELAGAO Raclocinio do teste (Quando se calcula 0 coeficiente rem uma amostra, énecessério ter em mente que fe esté, na realidade, estimando a associacio verdadeira entre xe y existente na populagio. No exemplo anterior, oj obtido o valor der = 0,58. No entarto, nose poll ter eerteza de que na populagio de alunos haja, efetivamente, corre Enure horas de estudo e nota na prova, pois fol estudada apenas uma parte da populagio, © valor obtido poderia ser casual, representando um erro devido & Amostragem. Para realizar um teste de hipéteses sobre a existéncia de correlacao tha populacdo,usa-se um racioeinio analogo ao isto nos testes de hpdueses ube médias, como explicado a seguit. ‘A correlagio na populagio ¢ designada por p (ro = letra r miniscula, no alfabeto grego), SupSe-se nicialmente que nao existe correlagdo enttexey,entlo, p= 0. Realizando-se um processo de amostragem aleatéria, os valores der obti Gos nas amostras devem set, na sua maioria, préximos de zero. Pocem ocorrer ‘Valores mais afastados de zero, mas serdo pouco freqientes. A distibuigio amos- tral de valores de r € simétrica quando a correlagao populacional for 0, como se pode ver na Figure 10.3. Por outro lado, val ficando mais e mais assimétrica & medida que p afastase de zero. Para aveliar a significdncia do coeficiente de correlacio, geralmente test-se ahipétese nula de que p= 0, utilizando para tanto a distribuigéo 1 = “5 ° 35 + FIGURA 10.3 Distbuii erase da rparsp* Os p= 03, para amostas com =9. (Fonts: Heal ‘963; p.176) cuando oe dessa testa Netase de ave um valor citernte de zero, ¢ ness usar una eamaeSese pens yt Fetter Avanstarmagao de iaherporar8i7= on ( = 70. trae in lopertio rar Avanvel tem dtibugse sproxmadaents normal com madia G'sits avr = ple ere poset = ss ~ 3] O taste flo comparando-28 stated Zac (Pcie af eam um valor eten para z por exemple, 186. Bioetatitica 89 Etapas do teste de hipéteses da correlagao As etapes para o teste estatistico de um coeficiente de cortelagéo sio apresentadas a ‘segui juntamente com 2 andlise para 9 coefcienteobtido no Exempla 1, (1) Blaboragio das hipéteses estatisticas Hyp ='0 Hyip20 (2) Excolha do nivel de signficéncia a= 005 (8) Dererminagdo do valor ertico do teste: = tonne = 2-847 (gl = n—2, onde n &0.nimero de pares de valores V1 (4) Betermisagao do valor ealculado def re 058 058 5, ose 0339 (8) Como lea (©) Concasée Nao existe evidéncia de correlagio enite 0 tempo dedicado 0 estudo e 0 desempenho obtido na prov. O valor der obtigo fi casi 1,74 < tagsis = 2:45, nose rejeita Hy ‘Seponha, agors, que existam razSee para se acreditar que essa conclusio do espetha a realidade. Como interpretar o resultado obtida? (© teste estatistico esté indleando que os dados amostrais nao apéiam @ cexistencia de correlagio populacional. Isto pode ser devido ao fato de que: (a) Nao existe realmente correlagio entre x ey na populagio ¢ 0 valor r = 0,58 {oi um resultado espitio. (b) xiste correlagio entre xe, mas neste experimento nao foi possivel mos- trar esta essaciacéo, provavelmente por causa do pequeno tamanho da mostra, ara decidie por uma destas alternativas, s6 hd uma solugéo: aumentar 0 tamanho da amostra, Se, efetivamente, existir cortelagio ese ela tiver a magnitu de observada, um aumento em x ocasionaré uma redugio no erro padrio de r, com conseqiiente aumento n0 fj, tornando-o, eventualmente,significante do onto de vista estatistica, Por our® lado, se realmente nao exisircorrelagio entre ey, A medida que se aumenta 0 tamarho amostral, 0 valor de rtenderd a ze. ‘Com is0, 0a também tenderd a zero, delxando de ser estatisticamente signi cativo.

You might also like