You are on page 1of 139

ESTATSTICAEBIOESTATSTICA

NDICE GERAL

I - INTRODUO .............................................................................................................................................5 1. NOES GERAIS ..........................................................................................................................................6 2. POPULAO E AMOSTRA ............................................................................................................................9 3. MTODOS DE AMOSTRAGEM ....................................................................................................................11

3.1 AMOSTRAGENS PROBABILSTICAS E NO-PROBABILSTICAS .......................................................11


3.1.1 As Amostras Probabilsticas .................................................................................................................11 3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS ......................................................................................12 3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:............................................................................14

3.2 DETERMINAO DO TAMANHO DA AMOSTRA..................................................................................16


3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos)..............16 3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos) ................18 3.2.3 Determinao da Margem de Erro da Amostra................................................................................20 3.2.4 Determinao da Amostra sem conhecer os limites da populao.............................................20

3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21 3.4 VARIVEL ESTATSTICA....................................................................................................................22 3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24 3.6 PARMETRO E DADO ESTATSTICO ...................................................................................................24 3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25 3.8 REDUO DE UMA VARIVEL ESTATSTICA .....................................................................................29
3.8.1 Mdia...........................................................................................................................................................30 3.8.2 Mediana ......................................................................................................................................................33 3.8.3 Moda............................................................................................................................................................34 3.8.4 Quantis ........................................................................................................................................................38 3.8.5 Medidas de disperso .............................................................................................................................40 3.8.6 Coeficiente de disperso .......................................................................................................................49

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL...........................................................................51


3.9.1 A curva normal e os desvios-padro .................................................................................................53

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA ..............................................................................59 5. TESTES NO PARAMTRICOS PASSO-A-PASSO .....................................................................................63

5.1 TESTE DO QUI-QUADRADO................................................................................................................63 5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS ....................................................................67 5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES ...........................................................................69 5.4 TESTE U
DE

MANN-WHITNEY .........................................................................................................70

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS ....................................................................................74

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE MUDANAS .........................................................75


1 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE ........................................................................................................78 6.3 TESTE DOS SINAIS DE WILCOXON .....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82

7.1 TESTE DE KRUSKAL-WALLIS ...........................................................................................................82


8. TESTES PARA K AMOSTRAS RELACIONADAS ...........................................................................................87

8.1 PROVA DE COCHRAN ..........................................................................................................................88 8.2 TESTE DE FRIEDMAN .........................................................................................................................92


9. MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA .............................................................97

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK .............................................................97 9.2 O


COEFICIENTE DE CONCORDNCIA DE

KENDALL...........................................................................99

10. TESTES PARAMTRICOS PASSO-A-PASSO .........................................................................................106

10.1 CORRELAO ..................................................................................................................................106 10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111 10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115 10.4 ANLISE DE VARINCIA .......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho .....................................................................................119 10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123 10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS ..................................................125 10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127

ANEXOS ........................................................................................................................................................129

Anexo I ...................................................................................................................................................130 Anexo II ..................................................................................................................................................131 Anexo III.................................................................................................................................................132 Anexo IV ................................................................................................................................................133 Anexo V..................................................................................................................................................134 Anexo VI ................................................................................................................................................135 Anexo VII ...............................................................................................................................................136 Anexo VIII ..............................................................................................................................................137 Anexo IX ................................................................................................................................................138 Anexo X ..................................................................................................................................................139

2 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

NDICE DE ILUSTRAES

FIGURA 1: POPULAO E AMOSTRA......................................................................................................................................... 10 FIGURA 2: AMOSTRA ESTRATIFICADA ....................................................................................................................................... 13 FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO .................................................................................. 17 QUADRO 1: QUADRO GERAL DE SERIAO .............................................................................................................................. 25 QUADRO 2: QUADRO DE FREQUNCIAS .................................................................................................................................... 26 QUADRO 3: QUADRO DE FREQUNCIAS .................................................................................................................................... 27 QUADRO 4: QUADRO DE FREQUNCIAS .................................................................................................................................... 28 QUADRO 5: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 30 QUADRO 6: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 31 QUADRO 7: CLCULO DA MDIA PONDERADA .......................................................................................................................... 32 FIGURA 4: CURVA SIMTRICA .................................................................................................................................................. 35 FIGURA 5: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 36 FIGURA 6: CURVA ASSIMTRICA ESQUERDA .......................................................................................................................... 36 FIGURA 7: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 39 FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA) ..................................................................................................... 42 QUADRO 8: CLCULO DO DESVIO MDIO ................................................................................................................................ 44 QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES ......................................................................................................... 45 QUADRO 10: CLCULO DA VARINCIA .................................................................................................................................... 45 QUADRO 11: CLCULO DA VARINCIA .................................................................................................................................... 46 FIGURA 9: DISTRIBUIO NORMAL .......................................................................................................................................... 51 FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA .................................................................................................... 51 FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA ............................................................................................. 54 FIGURA 12: POSIO DE UM RESULTADO .................................................................................................................................. 55 QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB)............................................................................................................. 65 QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO ............................................................... 67 QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS ................................................................... 69 QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS .............................................................................................................. 71 QUADRO 16: TESTE MCNEMAR................................................................................................................................................ 75 QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ...................................................... 77 QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO ........................................................................................................... 79 QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES .......................................................................... 83 QUADRO 20: Q DE COCHRAN .................................................................................................................................................. 89 QUADRO 21: Q DE COCHRAN .................................................................................................................................................. 90 QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES ....................................................................................................... 93 QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK ......................................................................... 99 QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL.................................................... 100 FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ......................................................... 107 QUADRO 25: CORRELAO DE PEARSON ............................................................................................................................... 110 QUADRO 26: TESTE T NO RELACIONADO .............................................................................................................................. 114 QUADRO 27: TESTE T RELACIONADO ..................................................................................................................................... 117 QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS ................................................................................................ 118
3 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ........................................................................................................... 119 QUADRO 30: RECIDIVAS POR TRATAMENTO ............................................................................................................................ 121 QUADRO 31: ANOVA .......................................................................................................................................................... 123 QUADRO 32: POST-HOC DAS RECIDIVAS ................................................................................................................................. 124 QUADRO 33: MDIAS POR TRATAMENTO ................................................................................................................................ 125 QUADRO 34: ANOVA .......................................................................................................................................................... 127 QUADRO 35: POST-HOC ......................................................................................................................................................... 128

4 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

I - INTRODUO
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluodeproblemasdopresenteassimcomoparaaprevisodeacontecimentosfuturos.No entanto,osucessoquantoaesteobjectivosfoipossvelemdatamuitorecente:snofinaldo sculoXIXe,sobretudo,noprincpiodosculoXXque,comaaplicaodeprobabilidadesaos problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles. AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo, afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um pequenonmerodepessoassepreocupoucomestudosestatsticos,querpelanaturezadassuas investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo, tomaravilhosamentecomplexo,tantonopontodevistafsicocomosocial,levamnosasonhar queelesetorneobjectodeumconhecimentocomoasoutrascincias.Avidacorrentelevanosa decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso. Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de computador.

5 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1. NOES GERAIS
Paraalgumaspessoas,aEstatsticanosenoumquadrodecolunasmaisoumenoslongasde nmeros que dizem respeito populao, indstria ou ao comrcio, como se v frequentementeemrevistas;paraoutras,eladgrficosmostrandoavariaonotempodeum facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa, assimcomoseencontranosescritriosdeempresasprivadas. To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que, emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno namatria. AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais generalizadoesignificativoexistanumconjuntonumerosodeobservaes. O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em generalidadeoquesevaiperdendoemindividualidade. A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese progride,vaiseperdendoocontactocomasparticularidadesimediatas. Destemodo,aEstatsticanoseocupadoqueexcepcional,masapenasdoquegeral:nose interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio,masdeumconjuntodemedies. Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a sntesepelorecursoexclusivodosnmeros.

6 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcanaasnteseordenandoosecooperandocomeles. Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligaoquesempreexistiuentreambos; O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo informaroestadosobrerecursoshumanoseeconmicos. No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems, continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado. Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo: Sadepblica; Indstria; Comrcio; EstudosDemogrficos. Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele. Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso matemtica,introduzindooClculodasProbabilidades. O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje. Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo: Meteorologia; Antropometria; CinciasSociais; Economia; Biologia.

7 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

FrancisGalton(18221911),apresentanoesderegressoecorrelao; KarlPearson(18571936)apresentaamaisbelaeacabadateoriadeEstatstica,ficandotambm conhecidopelosseuscoeficientes; FishereosseustrabalhossobreinfernciaEstatsticaderamtambmumgrandecontributoao desenvolvimentodaEstatstica. Em 1943,dseumagrandereviravolta,umavezqueotratamentodedadosdeixadeserfeito manualmenteepassaasercomputadorizado. MtodoEstatstico: Tcnicausadaparaobter,analisareapresentardadosnumricos; Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas dosconjuntosdosfactos. OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases: Recolhadedadosestatsticos:obtenodaamostraapartirdapopulao, devendo depurar e rectificar os dados estatsticos, que no seu conjunto sodenominadossrieestatstica. Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre os dados estatsticos determinando a sua distribuio; procedese sua ordenao,codificaoerepresentaopormeiodequadrosetabelas. Anlise: consiste em tirar concluses sobre a distribuio da populao, determinaroseugraudeconfianaeaindaformularhipteses,tentando verificlas,quantoaofenmenoemestudo. Predio: uma previso do comportamento do fenmeno em estudo, tendoemcontaadefiniodadistribuioestatstica.

8 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. POPULAO E AMOSTRA
Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que estosujeitosaumaanliseestatstica,portereminteresseparaoestudo. Quantosuaorigempodeser: Conjuntodepessoas; Conjuntodeobjectos; Conjuntodeacontecimentos.

Quantosuanaturezapodeser: Podeaindaser: Amostra:umsubconjuntoretiradodapopulao,quesesupeserrepresentativodetodasas caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas conclusesvlidassobreapopulao. Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal formaqueapopulaointeiranosinteressaestejarepresentada OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra. Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtododeamostragemparadeterminadoestudo. Conjuntofinito; Conjuntoinfinito. Existenteoureal; Hipotticaounototalmenteexistente;

9 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critriosdeselecodosseuselementos. Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa partedaamostra: Aamplitudedaidadedosparticipantes; Condiesdesadeprecisas. Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:

Populao

Populao-alvo Amostra

Figura 1: Populao e Amostra

Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode concentrarsesomentenossujeitosquetiveramumanicaexperinciadestetipoeexcluremos outros. Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda populaoalvo.particularmenteimportantequeaamostrarepresentenosasvariveisem estudo,mastambmoutrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis estudadas,comoaidade,osexo,aescolaridade,orendimento,etc. ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.

10 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro. ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae osqueteriamsidoobtidosnapopulaoalvo. Duassoluesexistemparareduziraomnimooerroamostral: 1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra. 2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticasconhecidasdesta.

3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas
Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na estimaodosparmetrosdapopulao,reduzindooerroamostral. Aprincipalcaractersticadosmtodosdeamostragemprobabilsticaresidenofactodequecada elementodapopulaotemumaprobabilidadeconhecidaediferentedezero,deserescolhida, aquandodatiragemaoacasoparafazerpartedaamostra. Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.

11 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS


TiposdeAmostragem: a) AAmostragemAleatriaSimples; b) AAmostragemAleatriaEstratificada; c) AAmostragememCachos; d) AAmostragemSistemtica.

AMOSTRAGEM ALEATRIA SIMPLES

AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos) quecompeapopulaoalvotemigualprobabilidadedeserescolhidoparafazerpartedeuma amostra.Aamostragemaleatriasimplesconsisteemelaborarumalistanumricadeelementos deondesetira,comaajudadeumatabeladenmerosaleatrios,umasriedenmerospara constituiraamostra.


AMOSTRAGEM ALEATRIA ESTRATIFICADA

AAmostragemaleatriaestratificadaumavariantedaamostraaleatriasimples.Estatcnica consisteemdividirapopulaoalvoemsubgruposhomogneoschamadosestratoseaseguir tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor representatividadepossvel.

12 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o

2 0 0 0 e s tu d a n te s e m S o c ia is

C i n c ia s

C la s s ific a o

E s tr a t ific a o P r o p o r c io n a l
E s tra to 1 D o u to ra m e n to 400 = 20%
E s tra to 2 M e s tra d o 600 = 30%

E s tra to 3 L ic e n c ia tu r a 1000 = 50%

E s c o lh a A le a t r ia

E s tr a t ific a o N o - P r o p o r c io n a l A m o s tra = 2 0 0 E s c o lh a A le a t r ia d e 1 0 % e m c a d a E s tra to

4 0 E s tu d a n te s D o u to ra m e n to

6 0 E s tu d a n te s M e s tra d o

1 0 0 E s tu d a n te s L ic e n c ia t u r a

Figura 2: amostra estratificada

AMOSTRAGEM EM CACHOS

Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quandooselementosdapopulaoestonaturalmenteporcachoseporissodevemsertratados comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao alvo.
AMOSTRAGEM SISTEMTICA

Consistequandoexisteumalistaordenadadeelementosdapopulao.EstatcnicaconsisteK elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso. Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra. Exemplo:Sepretenderumaamostrade100indivduoseapopulaoforde1000osistemaser 1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10 indivduosapartirdo1.n.sorteado.

13 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Importante Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s consideradaprobabilsticaseosgruposforamescolhidosaoacasoantesdarepartioaleatria dossujeitosnosgrupos.

3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:


umprocedimentodeselecosegundooqualcadaelementodapopulaonotemamesma probabilidadedeserescolhidoparaformaraamostra. Estetipodeamostragemtemoriscodesermenosrepresentativaqueaprobabilsticanoentanto muitas vezes o nico meio de construir amostras em certas disciplinas profissionais nomeadamentenareadasade. TiposdeAmostragensNoProbabilsticas: a) b) c) d) AAmostragemAcidentaloudeConvenincia; AAmostragemporCotas; AAmostragemdeSelecoRacionalouTipicidade; AAmostragemporRedesouBoladeNeve.

AMOSTRAGEM ACIDENTAL OU DE CONVENINCIA

formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momentopreciso. Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar paraconstituirumaamostradepacienteshospitalizados. Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam

14 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

representativas da populaoalvo. So utilizadas em estudos que no tm como finalidade a generalizaodosresultados.


AMOSTRAGEM POR COTAS

Idnticaamostragemaleatriaestratificadadiferindodestaapenaspelofactodossujeitosno seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.
AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE

Temporbaseojulgamentodoinvestigadorparaconstituirumaamostradesujeitosemfuno doseucarctertpico. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma instituio.
AMOSTRAGEM POR REDES OU BOLA DE NEVE

Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase, redessociaisamizadeseconhecimentos. Porexemplo:ImigrantesdeLeste. Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que indiquemoutraspessoasdecaractersticassimilares.

15 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2 DETERMINAO DO TAMANHO DA AMOSTRA


Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para determinar as amostras existem vrias frmulas, consoante o parmetro em critrio. As mais utilizadasnasadesoasquesebaseiamnapercentagemdofenmeno:

3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos)


Aamostradependeda: 1. Extensodouniverso; 2. DoNveldeConfiana; 3. DoErroMximopermitido; 4. Dapercentagemcomqueofenmenoseverifica.
n= 2 . (p.q) e2

F rm ula:

n=Tamanhodaamostra =Nveldeconfianaescolhidoexpressoemndesviospadro(s) p=%comoqualofenmenoseverifica q=%complementar(100p) e=Erromximopermitido

16 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Sedesejarmosumnveldeconfianabastantealtosuperiora99%aplicaseafrmuladostrs desvios.

Figura 3: converso dos niveis de confiana em desvios padro

Logo,odesvio(s)2seriaiguala32=9 Seoerromximoforde2%oe2seriguala22=4 Exemplo:Seforpossveladmitirqueonmerodecaptaesdeguaemprofundidadesesituam porvoltados50%,noultrapassandoesta%,entop=50e,consequentemente,q=10050ouseja 50.Assim,temseaequao


n= 9 . (50.50) = 5625 4

Isto,paraatendersexignciasestabelecidas,on.decaptaesaanalisarseria5625. Setodavia,foraceiteonveldeconfianade95%(2desvios)eumerromximode5%on.de elementosserbemmenor. osclculos.


n=2 . (p.q) e2 n= 4 . (50.50) = 400 25

Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve utilizarsesemprep=50

17 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos)


Aamostradependeda: 1. Extensodouniverso; 2. DoNveldeConfiana; 3. DoErroMximopermitido; 4. Dapercentagemcomqueofenmenoseverifica.

Frmula

Onde: n=Tamanhodaamostra =nveldeconfianaescolhido,expressoemnmerosdedesviospadro p=percentagemdofenmeno q=percentagemcomplementar N=tamanhodapopulao e2=erromximopermitido Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas normasdehigieneeseguranadotrabalho. Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95% (2desvios)etoleraseumerroat3%. Ento,n=90,4Logodeveroserpesquisados90empregados. Confirmeaplicandoafrmula Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente referidos,ento:

n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)

18 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DETERMINAO DO TAMANHO DA AMOSTRA

Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde doisparmetrosestatsticos:amargemdeerroeonveldeconfiana MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim: seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma prevalnciaentre23%e27%(25%menos2%e25%mais2%). NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana, geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma probabilidadede5%,claro,dequetudodifira). Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:

Frmula
Onde: n=Tamanhodaamostra

p =

(p.q) n

p=Erropadrooudesviodapercentagemcomqueseverificadeterminadofenmeno p=percentagemdofenmeno q=percentagemcomplementar

19 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.3 Determinao da Margem de Erro da Amostra


Exemplo:Numapesquisaefectuadacom1000adultos,verificouseque30%bebemcafpelo menosumavezpordia.Qualaprobabilidadedequetalresultadosejaverdadeiroparatodoo universo.

p =

(30.70) 1000 p = 1,45

Comoovalorencontrado(margemdeerro)correspondeaumdesvio,entoparadoisdesvios (95,5%),temos1,45*2=2,90. Para3desviosotriplo(4,35). Istosignificaque,porexemplo,paraumnveldeconfianade95%(2desvios)oresultadoda pesquisaapresentarcomomargemdeerro2,90paramaisoumenos. provvel,portanto,queon.deconsumidoresdecafestejaentre27,10%(30%2,90)e32,90% (30%+2,90).

3.2.4 Determinao da Amostra sem conhecer os limites da populao


Z 2 ( /2 ) p (1 -p ) d2

Frmula
Emque p=fenmeno] =erro

{SeIC(intervalodeconfiana)=95%,=5%(0,05)}Ento /2=0,05/2=0,025 Z(/2)=Z(0,025)=1,96 d=nmerodedesvios

20 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:

Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30
CUIDADOS
A TER NA ESCOLHA DA AMOSTRA:

1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede seremescolhidos; 2. Representatividade: deve conter em proporo todas as caractersticas que a populao possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa; 3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por outroladopequenaparaeconomizartempo,dinheiroepessoal.

3.3 INDIVDUO OU UNIDADE ESTATSTICA


OestudoEstatsticorecaisobreaamostra,noentantoestefeitodemodopormenorizadoacada umdoselementosdaamostra,quesodesignadosporIndivduoouUnidadeEstatstica. Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua naturezatemquepossuirumadefinioprecisa. AsprincipaiscaractersticasdeumaboaunidadeEstatsticaso: 1. Propriedadeouadequaoaoobjectivodainvestigao; 2. Clareza; 3. Mensurabilidade; 4. Comparabilidade.

21 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

NoestudodecadaunidadeEstatstica,surgemresultadosindividuaiscomosquaissofeitasas infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico. DadoEstatstico:oresultadodoestudoefectuadoacadaunidadeEstatsticatendoemcontaa suaindividualidade,sendoestedepoistratadodemodoapermitirinferirsobreacolectividade queaintegra(populao).

3.4 VARIVEL ESTATSTICA


Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se tmemconta,umouvrios,sodenominadosporVarivelEstatstica. UmavarivelEstatsticapodeser: 1. Qualitativa:seasuanaturezaquevariadeelementoparaelemento. Asvariveisqualitativasdividem:seem: a. Variveisnominais:quandooseusignificadosseentendeemfunodonomee o nmero ou cdigo que se lhe atribua no nos d nenhuma informao (sexo, cordeolhos,graudeparentesco,tipodepatologia,presena/ausnciadefactores derisco,etc.). b. Variveis ordinais: quando existe uma ordenao possivel (gravidade de uma leso,classesocial,graudeescolaridade,etc.).

22 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa mensurveloureferencivel. Asvariveisquantitativasdividemseem: a. Variveisdiscretas:assumevaloresisolados,normalmenteinteiros(n.defilhos, n.defactoresderisco,n.dedependentes,n.derespostas,etc) b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo assumirqualquervalorreal(altura,peso,IMC,distncia,etc). Tendoemcontaonmerodeatributos(caractersticas)queestoaserestudadas,asvariveis podemser: 1. Unidimensionais:seapenascorrespondeaumatributo 2. Bidimensionais:secorrespondeadoisatributos; 3. Pluridimensionais:secorrespondeavriosatributos.

Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de resposta,podendoelasserduasoumais. Asmodalidadestmobrigatoriamentequeser: 1. Incompatveis:cadaunidadeEstatsticanopodepertencersimultaneamentea duasoumaismodalidades; 2. Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa modalidade. Aescolhadasmodalidadesdeveserfeitadeacordocomasinformaespossudas.Noentanto, surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.

23 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA


AEstatsticaDescritivarecolhe,organizaeanalisaosdadosdeumaamostra,semtirarqualquer conclusosobreumgrupomaior. A Estatstica Indutiva recolhe, organiza, analisa e estabelece relaes entre os dados para fazer infernciassobreapopulao.Combasenosresultadosobtidossobreaamostrapodemosinferir concluses vlidas sobre a populao (este ramodaEstatsticajexigeautilizaoderecursos matemticosespeciais,nomeadamenteaTeoriadasProbabilidades). Assim,aEstatsticaIndutivapermitenosfazerinfernciassobreapopulaoechegaraleisea teorias.

3.6 PARMETRO E DADO ESTATSTICO


Oparmetrotodaafunodefinidaapartirdosdadosnumricosdeumapopulao. Exemplo:consideremosasseguintesnotasemEstatstica101110159
Mdia =xi/n = 55/5 = 11

Ovalor11oparmetro(resultadodamdiaaritmtica).

Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra. Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico

24 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA


Depoisdetermosdefinidoalgumasnoesbsicasdeestatstica,tratarse,aseguir,dasegunda fasedeumestudoestatstico.Comojreferimos,osdadosnumricosrecolhidosregistamseem sriesestatsticase,paraseremanalisados,devemserordenadoserepresentadosemquadrose emgrficos. Quandotrabalhamoscomumavariveldiscretaoudescontnuafalamosemseriaoequando trabalhamoscomumavarivelcontnuafalamosemclassificao.
SERIAO DE UMA AMOSTRA

Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo: nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.). Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao

Varivel X1 X2 X3 Xi Xk

Frequncias absolutas n1 n2 n3 ni nk

Frequncias acumuladas n1 n1+ n2 n1+ n2+ n3 n1+ n2+ +ni n1+ n2+ +nk

Frequncias relativas n1 N n2 N n3 N ni N nk N 1

Frequncias relativas acumuladas n1 N n1+n2 N n1+ n2+n3 N n1+ n2++ ni N 1

Total N Legenda: Distribuio de frequncias de uma varivel discreta

Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna podesertambmdenominadaporxi. Nasegundacolunaapresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero devezesquecadavalorfoiobservadoouonmerodevezesquecadavalorsurgenaamostra.
25 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Estacolunapodetambmserdenominadaporni.Devemoslembraraquiqueonmerototalde indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n, devendosempreverificarsequeni=n. Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(xi).Assim,
N(xi) = ni xi<x

Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodoque,fi=1;afrequnciarelativaexpressa, emgeral,empercentagem. Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em percentagem. Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi 14 14 13 12 11 12 10 13 12

Quadro 2: Quadro de Frequncias

xi 10 11 12 13 14 ni = 9

ni 1 1 3 2 2

fi=ni/n 1/9 1/9 3/9 2/9 2/9

N(xi) 1 2 5 7 9

F(xi) 1/9 2/9 5/9 7/9 9/9

fi = 1

em que n = 9

26 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CLASSIFICAO DE UMA AMOSTRA

Como j referimos anteriormente, uma classificao implica que a varivel seja contnua (exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc. variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias

Frequncias Marcas da Classes classe absolutas acumuladas relativas acumuladas n1 c0-c1 c1-c2 c2-c3 ci-1-ci ci-1-ck Total X1 X2 X3 Xi Xk _ n1 n2 n3 ni nk n1 N n2 n1+ n2 N n3 n1+ n2+ n3 N n1+ n2+ +ni N n1+ n2+ +nk N 1 nk 1 N ni N n1+ n2++ ni N n1+ n2+n3 N n1+n2 n1 Frequncias Frequncias Frequncias relativas

Legenda: Distribuio de frequncias de uma varivel contnua

Naprimeiracolunatemosasclasses.Porconveno,asclassessoabertassuperiormente,com excepodaltimaclasse,naturalmente. Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A marcadeumaclasseopontomdiodessaclasse,ouseja,opontoequidistantedosextremos deumaclasse. Exemplo:classec0c1 x1=(c0+c1)/2

Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero devezesqueosvaloresdedeterminadaclasseforamobservados.Estacolunapodesertambm denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes populao/ouamostra,aquesechamaefectivototal). Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(i).
27 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1. Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valoresinferioresaumdeterminadovalor.Estacoluna podesertambmdenominadaporF(i). NumaclassificaohabitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre 5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo). Ento,
- Se K dado = A/K - Se dado K=A/ , sendo a amplitude do intervalo de classe e A a amplitude do intervalo da amostra

Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38] ni 2 5 7 10 4 2
Quadro 4: Quadro de Frequncias

Classes [20-22] [23-25] [26-28] [29-31] [32-34] [35-38]

ni 2 5 7 10 4 2

fi 2/30 5/30 7/30 10/30 4/30 2/30

N(i) 2 7 14 24 28 30

F(i) 2/30 7/30 14/30 24/30 28/30 30/30

x'i 21 24 27 30 33 36

ni

= 30

fi

= 1em que n = 30 e = 3

28 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8 REDUO DE UMA VARIVEL ESTATSTICA



CONCEITO DE REDUO E SUA CONVENINCIA

Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica. Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos quadros. Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas. H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos designamseporparmetrosdavarivelestatstica. Feitaarepresentaodosdadosestatsticospormeiodequadrose/oudegrficos,importafazer sobreosmesmosumestudonosentidodesepoderchegaraconcluses. Paratal,impeseumtrabalhodesimplificaoqueconsisteemprocederasnteses,emreduzir grandesquantidadesdedadosanmerossimplesquepermitamumaanliserpidaeumafcil comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente. Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so agrupadosemcategoriasconformeotipodeinformaoquefornecem.

29 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO

Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.

3.8.1 Mdia
MDIA ARITMTICA

Amdiaaritmticaopontodeequilbriodosdados,isto,tendoumconjuntodenvaloresx1, x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles. Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:


x = xi / n

Numaamostraseriadaosvaloresx1,x2,...,xkocorremn1,n2,...,nkvezes,respectivamente,a mdiaaritmticaser
x = nixi / n = fixi

Exemplo:Calculeamdiaaritmtica,sabendoque xi ni 4 2 6 4 7 5 8 3 10 2

Quadro 5: Quadro do clculo da mdia

xi 4 6 7 8 10

ni 2 4 5 3 2

nixi 8 24 35 24 20

=16 Ento,

=111

x = nixi / n = 111/16= 6,94


30 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de observaesdentrodecadaclasse,isto,quandoosdadosestoagrupadosemclasses,parao clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como representativo de todos os valores nela includos, pelo que aquela pode ser representada pela frmulamatemticaseguinte:
x = nix'i / n = fix'i

Exemplo:Calculeamdiaaritmtica,sabendoque
Classes ni [3-5[ 2 [5-7[ 4 [7-9[ [9-11[ [11-13] 5 3 2

Quadro 6: Quadro do clculo da mdia

Classes [3-5[ [5-7[ [7-9[ [9-11[ [11-13]

ni 2 4 5 3 2

x'i 3,5 5,5 7,5 9,5 12

nix'i 7 22 37,5 28,5 24

=16

=119

Ento: x = nix'i / n = 119/16 = 7,43

Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x

Relativamentespropriedadesdamdiaaritmticapodemosenunciarduas: Somandoousubtraindoumaconstanteatodososvaloresobservados,amdiaresultante ficaraumentadaoudiminuda,respectivamente,dessaconstante; Multiplicandooudividindoosvaloresobservadosporumaconstantediferentedezero,a mdiaresultanteficarmultiplicadaoudividida,respectivamente,poressaconstante.

31 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MDIA ARITMTICA PESADA OU PONDERADA:

Porsuavezassociaseax1,x2,...,xkcertosfactoresdeponderaooupesosp1,p2,...,pkque dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica damdiaser:


x p = pixi / pi

Exemplo 9: Umprofessordematemticaquersaberamdiapoderadadassuasavaliaesnas quatroturmasemquelecciona,sabendoqueotestetinhaumaponderaode30%eotrabalho umaponderaode70%: TurmaAMdiadanotadoteste=65% TurmaBMdiadanotadoteste=60% TurmaCMdiadanotadoteste=40% TurmaDMdiadanotadoteste=80% Determineamdiaponderadadasquatroturmasemconjunto.


xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) +

Mdiadanotadotrabalho=78% Mdiadanotadotrabalho=70% Mdiadanotadotrabalho=28% Mdiadanotadotrabalho=75%

((40*30)/100) + ((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada

xi 65 60 40 80 78 70 28 75

pi 30 30 30 30 70 70 70 70 400

pixi 1950 1800 1200 2400 5460 4900 1960 5250 24920

x p = pixi / pi=24920/400=62,3

32 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos fazerqualquerreferncia).

3.8.2 Mediana
Amedianadeumasriedenobservaesx1,x2,...,xndeumavarivelXovalorqueocupaa posiocentralquandoasobservaesestoordenadasporordemcrescenteoudecrescente,isto ,amedianadeumavarivelestatsticaovalordessavariveltalqueafrequnciadosvalores que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores. Representase,habitualmente,porMd. Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores. Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso emqueNpar.
N
MPAR:

Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2

Exemplo:Determineamedianaparaaseguintesriededados:
5 9 8 7 6

Ordenandoporordemcrescente,vem56789 ComoNmpar,ento Md=(N+1)/2=(5+1)/2=6/2=3

Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7

33 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PAR:

Amediananocoincidecomnenhumvalorobservadoficandocompreendidaentredoisvalores centrais classemediana;convencionousetomarparamedianaamdiadestesdoisvalores.A posioqueamedianaocupadadapelafrmula


Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1

Exemplo:Determineamedianaparaaseguintesriededados
5 6 12 9 8 7

Ordenandoporordemcrescente,vem5678912 ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4 Assim,aclassemedianaocupadapelasposies3e4,ouseja,pelosvalores7e8,peloquea Md=(7+8)/2=15/2=7,5

3.8.3 Moda
A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.
AMOSTRA SERIADA:

Amodaovalordavarivelcommaiorefectivo,isto,seumavariveldiscreta,a(s)moda(s) (so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia. Exemplo:Determineamodaparaaseguintesriedevalores xi ni 4 1 6 3 8 5 10 4 2 2

Amoda8.

34 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMOSTRA CLASSIFICADA:

Nestecasofalamosemclassemodal,tomandoseparamodaamarcadaclasse.Assim,amoda deumavarivelcontnuaXtodoovalordeXparaoqualafunodefrequncia(absolutaou relativa)atingeummximolocal. Exemplo:Determineamodaparaaseguintesriedevalores


classes [2-4[ ni [4-6[ 1 [6-8[ 7 [8-10[ 4 [10-12] 10 2

Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9

RELAO EMPRICA ENTRE A MDIA, A MEDIANA E A MODA

Pearson chegou concluso de que para as distribuies unimodais e moderadamente assimtricas,vigoraaseguinterelaoemprica: MdiaModa=3(MdiaMediana)

Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem

Figura 4: Curva simtrica

35 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 5: Curva assimtrica direita

Mdia > Moda Mdia > Mediana Mediana > Moda

Figura 6: Curva assimtrica esquerda

Moda > Mediana Moda > Mdia Mediana > Mdia


A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA
MDIA ARITMTICA:

A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao medianaemodavantagensapreciveis,taiscomo: facilmentecalculvel; aquemelhorseprestaaulterioresanlisesestatsticas; Dependedetodososvaloresdasrie; umamedidadetendnciacentralparticularmenteestvel,variandoomenospossvel deamostraparaamostraextradasdamesmapopulao; Existem,todavia,casosemqueainformaofornecidapelamedianaoupelamoda,pareceser maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar. Podesertratadaalgebricamente.

36 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIANA:

Estamedidadetendnciacentraldeverutilizarsequando: Sedesejaconheceropontomdioexactodadistribuio; Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque a mediana no influenciada pelos resultados extremos exemplo: na srie 10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1; A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a mdia,jquenodispomosdetodososvaloresdavarivel,sendo,noentanto,possvel calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.
MODA:

Estamedidadetendnciacentraldeverutilizarsequando: Umamedidarpidaeaproximadadatendnciacentralforsuficiente; Sedesejaconhecerovalormaistpicodeumadistribuioexemplos:descreveroestilo devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.

desalientarque,apesardasvantagensapresentadasparaamoda,estatemadesvantagemde serdedeterminaoimprecisa,nocasodasvariveiscontnuas.

37 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.4 Quantis
Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex talqueF(x)=p. Algunsquantistmdenominaesespeciais:
QUARTIS:

Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das observaes. Q1=1quartil(correspondeaoquantildeordemp=1/4) Q2=2quartil(correspondeaoquantildeordemp=1/2) Q3=3quartil(correspondeaoquantildeordemp=3/4) Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o valordavarivelestatsticaquedeixaatrsdesi50%dasobservaeseQ3ovalordavarivel estatsticaquedeixaatrsdesi75%dasobservaes.A(Q1Q3)chamaseintervalointerquartil eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa esquerda. de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o mesmonmerodeobservaes.
DECIS:

Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10% dasobservaes. D1=1decil(correspondeaoquantildeordemp=1/10) D2=2decil(correspondeaoquantildeordemp=2/10)
38 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CENTIS:

Oscentisdividemasrieordenadaem100partesiguais,contendocadaumadelas1/100ou1% dasobservaes. C1=1centil(correspondeaoquantildeordemp=1/100) C2=2centil(correspondeaoquantildeordemp=2/100)


RELAES ENTRE QUARTIS, DECIS, CENTIS E MEDIANA:

Comopodemosobservarnafigura18 Q1=C25 Q2=Md=D5=C50 Q3=C75 D1=C10 D2=C20

Figura 7: Curva assimtrica direita

39 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.5 Medidas de disperso


Uma medida de tendncia central no nos d, s por si, uma informao exaustiva da distribuio considerada; pelo contrrio, a capacidade que se lhe atribui de representar os elementos de uma distribuio depende do modo como estes se concentram ou dispersam em torno dela. Assim, podemos dizer que os parmetros de tendncia central no so suficientes para caracterizar uma srie estatstica, apesar de a mediana e os quantis darem j uma ideia sumriadomodocomoestodistribudasasobservaes. Consideremososeguinteexemplo:Doisgruposdealunoscomasseguintesclassificaes A B 2 8 3 9 10 10 16 11 19 12

A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito, enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado quenasegunda. Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta, menossignificativasdadistribuiovosendoasmedidasdetendnciacentral. Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos dados. Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis, desviomdio,varincia,desviopadroecoeficientededispersooudevariao.
AMPLITUDE TOTAL

Aamplitudetotaladiferenaentreomaiorvaloreomenorvalor,isto,aamplitudetotalde uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores

40 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

observados.aformamaissimplesdeavaliaradispersodosdados,detalmodoquequanto maiorforaamplitudetotalmaioradispersodosdados. A amplitude total pode ser tambm denominada de intervalo total ou campo de variao; representase,habitualmente,porAeapenasusavaloresextremos. Numaamostraseriada: A=xmximoxmnimo Numaamostraclassificada: A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de variao. Aamplitudetotalapresentaasseguintesdesvantagens: Emborasejafcildecalcular,aamplitudetotaldependesomentedosvaloresextremos,queso, geralmente,osmenosfrequenteseosmenossignificativosdeumadistribuio,desprezandose os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so vulgarmenteanmalosemuitovariveis,consoanteaamostraqueseretiredeumapopulao, detalmodoqueduasdistribuiespodemteramesmaamplitudetotal,masdispersesmuito diferentes. Outro inconveniente da amplitude total consequncia de no tomar em considerao as frequnciasdasobservaes. Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G= 2 3 10 16 19

A = xmximo - xmnimo = 19-2 = 17

41 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMPLITUDE INTERQUARTIS

Osquartisfornecemindicaoquantoformacomoasobservaessedistribuememtornoda mediana. Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo, respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a concentraodasobservaesemtornodamediana. AamplitudeinterquartispodeserdefinidacomoadiferenaentreoQuartil3eoQuartil1.Esta medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo quartlico. Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.

Q1

Md

Q3

Figura 8: Curva simtrica achatada (platocurtica)

Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88. Q=Q3Q1=177,46166,88=10,58 Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa, habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2

Adistribuiotantomaisdispersaquantomaiorforaamplitudeinterquartis. Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da amplitudesemiinterquartis:


42 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos extremos(Q1eQ3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a amplitudeinterquartisseramesma,queras50%dasobservaesseacumulemnumsponto, querestejamuniformementedistribudasporesseintervalointerquartis. As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu clculodependedetodososvaloresdasrie.
DESVIO

Dadosnvaloresx1,x2,...,xndeumavarivelX,chamasedesviodecadavalorxiemrelao constantec,adiferenadexiparac,isto,
xi - c

NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn valoresdavarivelXc.
DESVIO MDIO

Falamosemdesviomdioquandoconsideramososdesviosdecadavalorxiemrelaomdia aritmtica,isto:
xi-x

O simples total destes desvios no pode ser utilizado como medida de disperso, por ser identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0

Noentanto,oquocienteentreasomadosmdulosdestesdesvioseonmerodeles,jpodeser consideradocomomedidadedisperso
D.M.= |xi-x | / n

43 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo20:CalculeodesviomdioparaA=453
Quadro 8: Clculo do Desvio Mdio

xi 4 5 3

xi-x 4-4=0 5-4=1 3-4=-1 3-4=-1

|xi-x | 0 1 1

=12
x = xi / n =12/3=4 D.M.= |xi-x| / n = 2/3=0,67

= 2

Observao:tambmseutilizaodesviomdioemrelaoaqualqueroutramedidadeposio central. Numaamostraseriadatemos:


D.M.= ni |xi-x| / n = fi |xi-x|

Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio. Numaamostraclassificada,osdesviosemrelaomdiaaritmticasocalculadosapartirdos pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|

44 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Calcule o desvio mdio para

classes ni

[4-6[ 1

[6-8] 2

Quadro 9: Clculo do Desvio Mdio para classes

Classes

ni 1 2

xi 4,5 7

xi-x 4,5-6,2 7-6,2

|xi-x| 1,7 0,8

ni|xi-x| 1,7 1,6

[4-6[ [6-8]

=2,4 x' = nix'i / n = [(1x4,5) + (2x7)] / 3 = 6,2

=3,3

Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1

Odesviomdioapresentaaseguintedesvantagem: Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.
VARINCIA

Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso, em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia. Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase, habitualmente,pors2ous2xamdiaaritmticadosquadradosdosdesviosemrelaomdia dessasvalores,isto:
S2 = (xi-x)2 / n Exemplo 22: Calcule a varincia para X=17,18,19,20,21 Resoluo 22: x = xi / n = (17+18+19+20+21) / 5 = 19 Ento,avarincia:
Quadro 10: Clculo da Varincia

xi 17 18 19 20 21 N=5

(xi-x) 17-19=-2 18-19=-1 19-19=0 20-19=1 21-19=2

(xi-x)2 4 1 0 1 4 =10

S2 = (xi-x)2/ n = 10/5 = 2
45 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2

Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2

Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120] ni 12 25 38 85 93 16 9
Quadro 11: Clculo da Varincia

Classes 85-90 90-95 95-100 100-105 105-110 110-115 115-120

ni 12 25 38 85 93 16 9 278

xi 87 92 97 102 107 112 117,5

(nixi) 1044 2300 3686 8670 9951 1792 1057,5 28500,5

(xi-x) -15,5 -10,5 -5,5 -0,5 4,5 9,5 15

(xi-x)2 240,25 110,25 30,25 0,25 20,25 90,25 225

ni(xi-x)2 2883 2756,25 1149,5 21,25 1883,25 1444 2025 12162,25

x = (nixi) / n =28500,5/278 =102,5

Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491

Podemos,agora,enumeraraspropriedadesdavarincia: Somando ou subtraindo uma constante a todos os valores observados, a varincia resultantepermanecerinalterada;

46 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Multiplicandooudividindotodososvaloresobservadosporumaconstantediferentede zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo quadradodessaconstante.

CORRECODESHEPPARD: Aocalcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida

era
s2x =43,7491 - 52 12 s2x =41.666

DESVIOPADRO O desvio padro pode ser definido como a raiz quadrada da varincia, representandose, habitualmente,porsx,isto:
sx = s 2x

Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se exprimirnamesmaunidadeaqueestoreferidososdadosiniciais.Contudo,estadesvantagem poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase desviopadrooudesvioquadrtico. Numaamostraseriada,temos:

sx =

s 2x

47 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx = s2x = 2 = 1,414

Numaamostraclassificada,temos:
sx = s2x

Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra classificada4327,16.

sx =

s2x

=4327,16 = 65,78

AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO Amplitudetotal Utilizasequando: Osdadosforemmuitorarosoudemasiadodispersosparasejustificaroclculodeuma medidamaisprecisadedisperso; Amplitudeinterquartlica Utilizasequando: Amedianaamedidadetendnciacentralusada; Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira desproporcionada; Adistribuiotruncada; Adistribuioapresentaumaforteassimetria.
48 Margarida Pocinho e Joo Paulo de Figueiredo

Forapenasnecessriooconhecimentodosresultadosextremos; Desejamosumndicemuitorpidodedisperso.

ESTATSTICAEBIOESTATSTICA

Desviomdio Utilizasequando: DesviopadroeVarincia Utilizamsequando: Seprocuraumamedidadedispersoemrelaocomacurvanormal; Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas; Sedesejarobterumamedidaqueserevistadeummximodeestabilidade; Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia. Avarinciaintervmsobretudonaanliseestatstica. Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza; Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.

3.8.6 Coeficiente de disperso


As medidas de disperso a que anteriormente nos referimos so medidas que se exprimem na mesma unidade dos dados e, sendoassim,tornaseimpossvelcompararentresiasdisperses deduasdistribuiescujosvaloresnoserefirammesmaunidade. Exemplo: DistribuioA: xA=30 DistribuioB:xB=600 sA=10 sB=20

49 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em vezdecompararmososdesviospadres,aplicamosoutramedidadedispersorelativaqueo coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x

Exemplo26:Adistribuiodospesosedasalturasdeumgrupodeestudantesdedeterminada Universidadeconduziuaosseguintesresultados: Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual delasadispersorelativamaior. Vx=sx/x=7,5Kg/57,5Kg=0,130=13% Vy=sy/Y=7,1cm/170cm=0,042=4,2% X:Pesos Y:Alturas Mdia=57,5Kg Mdia=170cm DesvioPadro=7,5Kg DesvioPadro=7,1cm

Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X). Adispersomaiornadistribuioquetivermaiorcoeficientededisperso. Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso. Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior seradisperso.

50 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL


A distribuio normal apresenta uma curva em forma de sino, como mostra a figura 9. A sua principalcaractersticaadeastrsmedidasdetendnciacentralmdia,medianaemodaSe encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo menos,valoresmuitoprximos.SeOselementosqueconstituemumadistribuioestomuito prximosoumuitodispersos,encontraremosformassemelhantesdafigura10.

Figura 9: Distribuio normal

Figura 10 - Distribuio leptocrtica e platicrtica

Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe chamamosdistribuiogaussiana. Amaiorpartedosdadosrecolhidoscomorganismosvivostmestepadro.Podemosobservar que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias encontradas),enquantoamaioriadosresultadosseencontramjuntomdia.Vamosdebruar
51 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal, mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com dimensesgigantescasoumicroscspicas! Entoaspropriedadesdadistribuionormalsoasseguintes: 1)simtrica; 2)Temformadesino; 3) A mdia, a mediana e a moda encontramse no mesmo pontodacurva; 4)Temduaspontasquenuncatocamoeixohorizontal.

Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser consideradanormal?Geralmente,usamosduasabordagensparatomarmosestetipodedeciso; na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos procedimentos matemticos para determinar se um conjunto de resultados normalmente distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses procedimentos.Naverdade,improvvelquenestafasedasuacarreiraestatsticanecessitede saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste grficodevebastar.Noentanto,devesersensvelaoproblema.

52 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9.1 A curva normal e os desvios-padro


Suponhamos que temos um conjunto de nmeros cuja mdia 50 e cujo desvio padro 5. Chamamos a este valor (centmetros, segundos, pontos numa escala, ou outra coisa qualquer) um desvio padro. Dez centmetros, segundos, etc., seriam dois desvios padro e quinze centmetros,segundos,etc.,trsdesviospadro...semprecomrefernciaaoconjuntoatravsdo qual obtivemos o valor 5. como se pudssemos tirar o desvio padro e transformlo numa unidadedemedidadeumaescala;comosedissssemosqueumapolegadaso2,54cm.Nunca misturaramos polegadas e centmetros nos mesmos clculos, mas poderamos converter uma unidade na outra. Do mesmo modo, no misturamos resultados de desvios padro com resultadosreais,masconvertemosumaescalanaoutra. Voltemos s propores de nmeros em diferentes partes da distribuio. Se retirarmos uma partedacurvaentreamdia,queestamarcadanoeixohorizontaldafiguraqueseseguecomo 50,eumdesviopadro,marcadonoeixohorizontalcomo55,sabemosquedevemostercercade um tero de todos os resultados neste conjunto, porque o que acontece sempre com a distribuio normal. De uma forma mais precisa, a proporo exacta do nmero total de resultados que se encontram entre a mdia e um desviopadro acima da mdia(50e55neste caso)34,13%.Comoadistribuionormalsimtrica,deveverificarseamesmacoisaabaixo damdia,isto,devemosteroutros34,13%dosresultadosentreosvalores50e45sendo45o valordamdiamenosumdesviopadrode5pontos.Observemosasduaspartesasombreado. Aaritmticaelementardiznosque68,26%dototaldosresultadosseencontramentreosvalores 45e55,pertencendo31,74%aosvaloresextremosqueseencontramnosoutrosdoislados.Mais umavez,asimetriadacurvasignificaque,paraestaproporo,metadede31,74%,ouseja,15,87 %,encontrasedecadaumdosladosdadistribuio.Poroutraspalavras,cercade16%detodos osnmerosnesteconjuntoseromenoresdoque45,sendoamesmaquantidademaiordoque 55.

53 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 11: % de resultados 1 dp acima e abaixo da mdia

Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200 crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos resultados,isto,aquelesqueforamobtidoscomcercade136crianas,encontrarseoentreos 52eos68pontos.Cercade32crianas(16%)teroresultadosabaixode52ecercade32tero resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber, posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque tambmobtiveramresultadosacimadamdia.Poroutraspalavras,ospaispretendemsaber qualaposiorelativadodesempenhodofilho.Seosresultadosestivessemtodosmuitoperto da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas altas,acimade70.Noentanto,oprofessorsabequeodesviopadrodasnotasfoi8e,porisso, umterodetodososresultadosestavaentre60e68.Sabendoque50%dosresultadosobtidos estavamabaixodamdia,podemosperceberqueaposiodestacrianaestaonvelde84% dosresultados,napartesuperiordetodososresultados.Afinal,ospaistmrazesparaestarem contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e dois desviospadro acima da mdia);umanota84colocariaomeninonaposioinvejvelde estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto, 50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel, deestarapenasaquatrolugaresdofim. Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio padroobteremos44.Devemostercuidadoenomisturarosvaloresdosdesviospadrocom os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de querermos oresultadoqueestavadoisdesviospadroabaixodele.Subtramos16pontos,pois esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados. Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou exactamenteum,doisoutrsdesviospadroacimaouabaixodela.Temos,porm,deexaminar resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio dacriananacurvaseriaametadedadistncia,noeixohorizontal,entreoresultadodamdia (60)eumdesviopadroacima(68).

Figura 12: posio de um resultado

55 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse acrianaacimade67%doscolegas?Olhemoscuidadosamenteparaasduasporesdacurva que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da mdia,mas,nestecaso,soosresultadosmaiselevados,enoosmaisbaixos,queseencontram maispertodamdia.Hmuitomenosresultadosentre44e48doqueentre48e52,apesarde, em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado zsereferirsempreposiodeumpontoemrelaoamdia.Istovaitornarseclaroembreve. Paraj,pensemosqueumresultadozde1amesmacoisaqueumdesviopadrode1,queum resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces ,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos resultadoszcomomaisoumenos;aosdesviospadrodescrevemoloscomosituandoseacima ouabaixodamdia,emvezdemaisoumenos.Umdesviopadrotemumvalordefinidono varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio padroacimadamdia,podemosconsiderarqueosresultadoszeosdesviospadrosoiguais. No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.

56 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva normal(AnexoVIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz +0,5. Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5. Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85% acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro exemplo,destavezcomovalor65.Estevalorest5pontosacimadamdiaeodesviopadro paraoconjuntode8.Umresultadode5pontosacimadamdia5/8dedesviopadroacima damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a percentagemcorrectaparaumresultadozde0,6.Noentanto,onossoresultado0,63,peloque temosdeandartrscolunasdatabelaataovalor0,03,notopo.Estevalor,somadoaovalor0,6, dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver pelatabelaque49%detodasasnotasemcadaumdosladosdacurvaestoincludasnumzde 2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente, ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis. Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia, digamosumanota41naamostraoriginal.Estanotaest19pontosabaixodamdia,apenasum poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8ou2,375abaixo.Oseu zser2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas onossoresultadozovalorumpoucosuperiorde2,375.Anossatabelaspodeserusadacom duascasasdecimais,peloquevamosarredondarestevalorpara2,38.Paramos,destavez,junto dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na nossaamostrade200indivduos,1%,ouseja,doisindivduostenhamnotasinferioresa41.No
57 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

outroextremodasnotas,devemosesperarqueapenasdoisalunostenhamnotasde19oumais pontosacimadamdia,ouseja,notasqueexcedamos79%. Omododeobterovalorzdadopelaexpressoformal


Z= desvio da nota em relao mdia desvio-padro

Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda mdia,respectivamente,zficarcomosinalcorrecto. Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados atravs dos quais foram obtidos sigam uma distribuio normalOuaproximadamentenormal. Deoutromodo,arranjarconfuses

58 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA


Paramtricos:calculaasdiferenasnumricasexactasentreosresultados. Noparamtricos:apenasconsideramsecertosresultadossosuperioresouinferioresaoutros resultados. REQUISITOSPARAUTILIZAODETESTESPARAMTRICOS Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer comparaesentreamostras(testesparamtricos),existeumalistaderequisitosqueinclui,entre outros: 1. queavariveltenhasidomensuradanumnvelmnimointervalar; 2. queadistribuiosejasimtricaemesocurtica; 3. queacaractersticaestudada(varivel)tenhadistribuionormalnumadadapopulao. Semprequenosepode,honestamente,admitirasimetriaeanormalidadededistribuio,ou osdadosforamrecolhidosnumnveldemensuraoinferioraointervalar,devemosrecorrera testesquenoincluemanormalidadedadistribuioounvelintervalardemensurao.Esses testeschamamsenoparamtricos VANTAGENSDOSTESTESNOPARAMTRICOS Podemserutilizados,mesmoquandoosseusdadosspodemsermedidosnumnvelordinal, isto , quando for apenas possvel ordenlos por ordem de grandeza) podem ser utilizados mesmoquandoosseusdadossoapenasnominais,isto,quandoossujeitospodemapenasser classificadosemcategorias.

59 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PODERDEUMTESTE OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF). As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de significnciacommenospoderqueoscorrespondentesparamtricos. EMCONSEQUNCIA Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvelqueessarejeiosejafalsa(serejeitaraH0quandoelaverdadeiracometeumerrode tipoI;seaceitaraH0quandoelafalsacometeumerrodetipoII).Quandoosrequisitosdeum testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso() obvioqueosinvestigadoresquerem,atodoocusto,rejeitaraH0quandoelamesmofalsa, evitandoumerrodetipoI. Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso correcta,contudoestetesteidealraramenteexiste. Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta verdadeira. Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo: Umapessoainocenteatprovadocontrrio H0:Apessoainocente H1:Apessoaculpada

ErroI:Apessoacondenadamasestinocente ErroII:Apessoaabsolvidamasculpada

60 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entendesequemaisgravecondenarinocentesqueabsolvercriminosos. Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.

ASSIM Fixada a probabilidade do erro de tipo I (dimensodoteste),otestemaispotenteaqueleem que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm queestaregiocriticaamaispotente. Facilmenteseconcluiqueotestemaispotenteaqueleque,umavezfixadaaprobabilidadede rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesmahiptesequandoestafalsa. PRESSUPOSTOS Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padroeseoresultadoestiverentre2e2adistribuiosimtrica. Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica. Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa. Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia noparamtricos.

61 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO Distinguirseanossaamostraconstitudapelosmesmossujeitosemtodasassituaesouse formadapordiferentessujeitosparacadasituao

INTERSUJEITOSOUDESIGNNORELACIONADO estetipodedesignutilizadoquandoumindivduoouobjectoavaliadoapenasumavez.A comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no relacionados. Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondemtarefa. INTRASUJEITOSOUDESIGNRELACIONADO Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo). Aimportnciadestesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez queficamigualizadasemtodasassituaes. Desvantagem:Efeitodememriaeaprendizagem. AMOSTRASEMPARELHADAS Igualizamsesujeitosdiferentesmasemparelhados,emtermosdeidade,sexo,profissoeoutras caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular. estes tipos de designs podem ser considerados de designs relacionados, uma vez que controladonassuascaractersticasrelevantes. Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as caractersticasrelevantes. Dificuldadesarranjargrandesamostras.

62 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5. TESTES NO PARAMTRICOS PASSO-A-PASSO


5.1 TESTE DO QUI-QUADRADO
O QuiQuadrado (X2) de aderncia consiste em comparar os dados obtidos experimentalmente comosdadosesperadosdeacordocomalei.Dascomparaessurgemdiferenasquepodemser grandes ou pequenas: se forem grandes, a hiptese nula (H0) que pressupe um bom ajustamento dever ser rejeitada em favor da hiptese alternativa (H1); se forem pequenas, a hiptesenulanoserrejeitadaeasdiferenassoatribuveisaoacaso. OX2deindependnciaserveparaajudaradecidirseasduasvariveisestoounoamarradas umaoutraporumarelaodedependncia.

QUANDOUTILIZAR

Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos apenassepodemdistribuirossujeitosporumaoumaiscategorias. OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo distribudosporumadeterminadacategoria. OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).

OBJECTIVO

Oobjectivocompararfrequnciasobservadascomfrequnciastericasouesperadas,ouseja, verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se distribussemporessamesmacategoria,casonoexistissemdiferenas. OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para sersignificativo,ovalordeX2deverserigualousuperioraosvalorescrticosdatabela(Anexo I). INSTRUESPASSOAPASSO 1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais relevantesparacadaumaedividindopelonmerototaldesujeitos. 2.CalcularX2:

(O-E)2
X2 =
______________

emque: O=frequnciasobservadasparacadaclula; E=frequnciasesperadasparacadaclula.

3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)

emque r=nmerodelinhasdatabeladecontingncia c=nmerodecolunasdatabeladecontingncia

SeX2observado>X2crticorejeitaseH0 SeX2observado<X2crticonoserejeitaH0 Especificandoparaumatabeladeduplaentrada2X2: g.l.=(nmerodecolunas1)(nmerodelinhas1)=1X1=1

64 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A C A+C

B D B+D

A+B C+D N

N (AD - CB)2 X2 = _________________________________________ (A+C) (C+D) (A+C) (B+D)

Quandoumatabelatemmaisdeduasentradas: g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna) (total geral)

Exemplo:Suponhaquequerestudarseosestudantesdecinciassociaisutilizamummtodode estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia. Escolheramsedoisgrupos,umcompostopor50estudantesdecinciassociaiseooutropor50 estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo dirioregular,estudoirregularemperodosconcentradosdetrabalhointensivoouumamistura dosdois.Foramrecebidas44respostasdosestudantesdecinciassociaise42dosestudantesde tecnologia.Colocouseahipoteseexperimental(H1)dequeotipodeestudodependiadocurso frequentado Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde 1a6.
Quadro 12: Tabela de Contingncia (Crosstab)

Tipo de estudo Regular


Grupo 1 Estudantes de Cincias Sociais Grupo 2 Estudantes de Tecnologia Totais dos padres de estudo 1 6 E=8,19 4 10 E=7,81 16 5 8 E=11,23 23 2 15 E=11,77 6 24 E=22,95 47 42 N=86

Irregular
3

Misto
23 E=24,05

Total parcial do nmero de estudantes


44

65 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Resoluo49: InstruesPassoaPasso:

1.calcularasfrequenciaesperadas(E) Clula1:E=16X44/86=8,19 Clula2:E=23X44/86=11,77 Clula3:E=47X44/86=24,05 Clula4:E=16X42/86=7,81 Clula5:E=23X42/86=11,23 Clula6:E=47X42/86=22,95

2.Aplicarafrmula:

(O-E)2
X2 =
________________

E X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2 8,19 11,77 24,05 7,81 11,23 22,95 X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2 4. Consultar a tabela (Anexo I)

Para
p=0,05 e gl=2 x2 critico=5,99

Concluses:DadoqueovalorobservadodeX2apenasde3,12,ouseja,inferioraovalorcrtico de5,99parap<0,05,oresultadodaexperincianosignificativo.Aceitasehiptesenulade que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem, rejeitandosedestaformaanossahipoteseexperimental(H1).

66 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS


OstestesUdeMannWhitney;Wilcoxon;HdeKruskalWallis;rhodeSpearman;taudeKendall e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste sentidocomearemosporexplicarosprocedimentosdeordenaoderesultados Ordenamentoglobalderesultados(designsnorelacionadosparasujeitosdiferentes): 1. Atribua a ordem mais baixa 1 ao resultado mais baixo, a ordem seguinte 2 ao resultadoseguintemaisbaixo,eporafora. 2. Osresultadosnulosde0socontadoscomooresultadomaisbaixopossvel,sendo lheatribudaaordemmaisbaixa. 3. Quando existem resultados idnticos solhe atribudas ordens mdias, calculadas com base na globalidade das ordens que deviam ter sido atribudas a estes resultados.

Exemplo:ordenarumgrupoemfunodon.defactoresderisco:
Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco

N. de Factores de risco 6 3 12 4 7 5 8

Ordem
4 1 7 2 5 3 6

Se existir um zero este deve ser considerado o valor mais baixo.

Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.

67 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:
N. de FR.
1 2 1 4 1 3 4 6 5

Ordem
2 4 2 6,5 2 5 6,5 9 8

AssimossujeitoscomumFactorderiscoso3(1+1+1)queocupariamo1.2.3.lugar Ento3+2+1=6:(1+1+1)=2 Com4factoresderiscotemos2sujeitosqueocupariamo6.e7.lugar Ento6+7=13:(1+1)=6,5

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou emparelhados): 1. Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como fizemosparaosresultados,sendoatribudaaordemmaisbaixamenordiferenae poraadiante; 2. Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados idnticos,atribuindoseumaordemmdiaresultantedaglobalidadedeordensque essasdiferenasdeveriamocupar; 3. Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose calculamdiferenasentreresultados; 4. Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes experimentais, estes no so ordenados, sendo retirados da anlise; 5. Diferenaspositivasenegativassoordenadasemconjuntocomosesetratassede umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.

68 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um aparelhoauditivoeapsacolocaodaquele.
Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas
Sujeitos 1 2 3 4 5 6 7 8 9 10 N de frases correctas antes do aparelho auditivo 5 5 2 1 4 2 1 4 1 1 N de frases correctas depois do aparelho auditivo 6 7 3 5 5 5 5 4 7 6 diferenas 1 2 1 4 1 3 4 0 6 5 ordem 2 4 2 6,5 2 5 6,5 9 8

Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2 situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os resultados.

5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES


Ao estudarmos as diferenas entre dois grupos podemos utilizar grupos

relacionados/emparelhadosougruposindependentes.Nocasodeduasamostrasindependentes determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma diferenanosprocessosdetratamentoaelasaplicados. Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida importnciaou,enfim,porquesimplesmentenosedispedeparesadequados. Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar duasamostrasindependentes.Emtaisprojectos,asduasamostraspodemserobtidasporumde doismtodos: a) Podemserextradasaleatoriamentededuaspopulaes; b) Podemdecorrerdaatribuioaleatriadedoistratamentosaosmembrosde umaamostradeorigemarbitrria. Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.

5.4 TESTE U DE MANN-WHITNEY


QuandoUtilizar: Dadasduasamostras,detamanhosn1en2,possvel,medianteaprovaUdeMannWhitney, saberseambasasamostraspodemserconsideradasprovenientesdamesmapopulao. Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias, independenteseavarivelobservacionalprecisadeterdistribuionormalnapopulao.

O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes experimentais.

70 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaquequerinvestigaron.dequeixasdolorosasduranteumtratamentoa ummesmoproblemateraputico(controladaagravidadeeaextensodaleso)emquese utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas

Paciente 1 2 3 4 5 6 TOTAL MDIA

A 3 4 2 6 2 5 22 3,67

Ordem (1) 3 4 1,5 7,5 1,5 5,5 T1=23

B 9 7 5 10 6 8 45 7,5

Ordem (2) 11 9 5,5 12 7,5 10 T2=55

RACIONAL OracionalqueestportrsdotesteUdeMannWhitneybastantesemelhanteaodoteste deWilcoxon.Adiferenafundamentalentreasduasresidenofactodosegundoseaplicara designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto, sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes experimentais. Com um design norelacionado no temos uma base que nos permita comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos resultadosdetodosossujeitosemambasassituaescomosefossemapenasumconjunto simplesderesultados. Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas situaes.
71 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordenetodososresultadosparaambososgruposcomosesetratassedeumconjuntonicode resultados,atribuindoaordem1aoresultadoinferioreassimsucessivamente. OordenamentoglobaldetodososresultadosapresentadoemOrdens(1)eOrdens(2). Adicioneasordenstotaisparaogrupo1egrupo2emseparado.
T1=23 e T2=55

Seleccioneomaiortotaldasordens.
T2=55

CalculeovalordeUatravsdafrmula
U = n1.n2 + Nx (nx + 1) __________________ 2 - Tx

emque:
ClculodeU
6x7 U=6x6+
_______________

n1=nmerodesujeitosnogrupo1 n2=nmerodesujeitosnogrupo2 Tx=maiortotaldeordens

n1=6 n1=6 Tx=T2=55 Nx=6

Nx=nmerodesujeitosdogrupocomomaiortotaldeordens

- 55 = 36+21-55=2

Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de sujeitosemcadagrupo;noentanto,setiverdeutilizarumnmerodesigualdesujeitosemcada grupo,poderfazlo.Emcasodedvida,calculeUparaambasasordenstotais,seleccionando onapropriadoacadacasoe,depois,considereoUmaispequeno.

72 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


As Tabelas (Anexo II) apresentamlhe os valores crticos de U nos diferentes nveis de significnciadetestesunicaudaisebicaudais,paraasdiferentescombinaesden1en2dosdois grupos. O procedimento mais usual comear por verificar se o valor de U significativo ao nvel de significnciadep<0,05paratestesunicaudais)ouparatestesbicaudais.Umavezqueprevimos que a tcnica B produzia mais queixas, poderemos consultar a Tabela para testes unicaudais. Localizando n1=6 na linha superior e n2=6 na coluna do lado esquerdo, encontraremos o valor crticodeUnaintercepodosdois. Concluso: Uma vez que se convencionou utilizar o nvel inferior de U, o nosso valor de U=2 deve ser igual ou inferior ao valor crtico 7, o que acontece, podemos, desta forma, rejeitar a hiptesenulaeaceitarqueexistemdiferenassignificativasaonveldador(p<0,05).

73 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS


Empregamseasprovasestatsticasdeduasamostrasquandooinvestigadordesejadeterminar sedoistratamentossodiferentesouseumtratamentomelhordoqueooutro.Emcadacaso, comparase o grupo em que se aplicou o tratamento com outro que no sofreu nenhum tratamentoouquesofreutratamentodiferente. Em tais comparaes de dois grupos observamse, por vezes, diferenas significativas que no soresultantesdotratamentoaplicado. Umadasmaneirasdesuperaradificuldadedecorrentedaintroduodediferenasextrnsecas entredoisgruposconsisteemutilizarnapesquisaduasamostrasrelacionadas,isto,relacionar de alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido utilizandosecadaindivduocomoseuprpriocontroloouentoformandoparesdeindivduos e, em seguida, associando os dois membros de cada par s duas condies. Quando um indivduo serve como o seu prprio controlo, ele submetido a ambos os tratamentos em ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar seleccionarse,paracadapar,indivduosquesejamtosemelhantesquantopossvelemrelaoa quaisquervariveisextrnsecasquepossaminfluenciarosresultadosdapesquisa. Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo (contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao mtododeemparelhamento.Earazodissoquelimitadaanossacapacidadeparaformaros paresadequadamente,emconsequnciadonossodesconhecimentodasvariveisrelevantesque determinam o comportamento. A validade por emparelhamento est na razo directa do investigador para determinar como formar os pares, e essa capacidade quase sempre muito limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio controlo;nosepodepretenderrelacionamentosmaisprecisosdoqueaprpriaidentidade.

74 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE


MUDANAS
Quandoutilizar: A prova de McNemar para a significncia de mudanas particularmente aplicvel aos planeamentosdotipoantesedepois,emquecadaindivduoutilizadocomooseuprprio controlo e a mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser usada para testar a eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as prefernciaseleitoraisarespeitodevrioscandidatos. Nestescasos,cadapessoapodeservircomooseuprpriocontrolo,utilizandoseamensurao emescalanominalparaavaliarasalteraesdasituaoapsemrelaosituaoantes.
Exemplo: Suponha que um profissional de sade est interessado em estudar os comportamentos resultantes da iniciao de obesos prtica do exercicio fisico. Este profissional observou ao longo dos anos que os obesos utilizam preferencialmente o elevadorparasedirigiremsuaconsultacujoconsultrioerano1.andar.Colocaahipotese de que os obesos que tiveram como terapeutica exerccio fsico comeariam a usar preferencialmenteasescadas.Afimdetestarahipoteseotcnicoobserva25doentesemque ministrou como exerccio fsico caminhar uma hora por dia cinco vezes por semana. Decorrido um ms de exercicio ele observa os mesmos 25 doentes e faz a classificao comportamentos.Osdadossoosseguintes:
Quadro 16: Teste Mcnemar

Preferencia aps 30 dias de exercicio Escadas Preferncia antes da teraputica Elevador Escadas 4 4 (A) (C) Elevador 14 3 (B) (D)

HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o elevador(PD)eambassoiguaisa.Isto, H0:PA=PD=1/2 H1:PA>PD

75 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal (classificativa). Nveldesignificncia: p=0,05 Distribuioamostral: AdistribuioQuiquadradocom1graudeliberdadedumaboaaproximaodadistribuio amostraldeQuiquadrado,talcomocalculadapelafrmula. RegiodeRejeio: ComoH1especificaosentidodadiferenaprevista,aregioderejeiounilateral.Consistede todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade unilateral,associadasuaocorrnciasobH0nosuperiora0,05. Deciso: Estamosinteressadosnosobesoscujocomportamentoacusaalterao:representadosnasclulas AeD. Paraosdados,temos:
(A-D - 1)2 X2 =
_________________________

N=25

(4-3 - 1)2 =
__________________

(1 - 1)2 =
___________________

0 =
__________

=0

A+D

4+3

Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico, no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamosumx2criticode5,41.

Racional Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos

76 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizamossinais+eparaindicardiferentesreaces.

Quadro 17: Tabela de quatro casas para a prova de significncia de mudanas

ANTES
DEPOIS + A C + B D

Notesequeoscasosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude para+.Naausnciademodificao,oindivduoclassificadonaclulaB(reaco+antes edepois)ounaclulaC(reacoantesedepois). Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sobahiptesedenulidade,seriaque(A+D)acusassemmodificaesnumsentidoe(A+D) acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto naclulaAcomonaclulaD. NaprovadeMcNemardesignificnciademudana,estamosinteressadosapenasnasclulasA e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento

(A-D)2 X2 =
_____________

A+D

comgrausdeliberdade=1

77 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE


Aaproximao,peladistribuiodoQuiquadrado,dadistribuioamostraldafrmulatornase excelenteseseintroduzirumacorrecodecontinuidade.Talcorreconecessria,porquese utilizou um distribuio contnua (Quiquadrado) para aproximar uma distribuio discreta. Quando todas as frequncias esperadas so pequenas, tal aproximao pode ser fraca. A correcodecontinuidade(Yates,1934)constituiumatentativaderemoodessafontedeerro. Comacorrecodecontinuidade,temse:
(A-D - 1)2 X2 = ________________________________ A+D

com graus de liberdade=1

Estaexpressoindicaquesedevesubtrair1dovalorabsolutodadiferenaentreAeDantesde elevaraoquadrado.OgraudesignificnciadequalquervalorobservadodeQuiquadrado,tal comocalculadoatravsdafrmula,determinadomedianterefernciaaumaTabela(AnexoI). SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara determinadonveldesignificnciacomgl=1,aimplicaoqueexisteefeitosignificativonas reacesantesedepois.

INSTRUES PASSO-A-PASSO PARA CALCULAR X2


Enquadrarasfrequnciasobservadasnumatabelade4casas. DeterminarasfrequnciasesperadasnasclulasAeD

E=1/2 (A+D) Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio


provadeMcNemar. Seasfrequnciasesperadasnosoinferioresa5,calcularovalordeX2atravsdafrmula

(A-D - 1)2 X2 =
_______________________

A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor

78 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.

6.3 TESTE DOS SINAIS DE WILCOXON


Quandoutilizar OtestedeWilcoxondeveserutilizadonumdesignexperimentalrelacionado,comduas situaesexperimentaisquandosoutilizadososmesmossujeitosousujeitosemparelhadosem ambasassituaes.
Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de vocabulrioutilizadoporcrianasqueusamumaparelhoauditivoouporcrianasqueno usam. Este um bom exemplo dum caso em que essencial a utilizao de sujeitos emparelhados. Como bvio, no possvel utilizar os mesmos sujeitos, uma vez que nenhuma criana que no precisa de usar aparelho auditivo usa um mesmo tempo. Por outrolado,nopodemosescolheraleatoriamenteossujeitosparacadagrupo.Podedarseo caso,porexemplo,deossujeitosqueusamaparelhoauditivoseremmaisvelhos.Qualquer efeito encontrado neste grupo pode ficar a deverse unicamente a esta diferena. Os dois grupos com aparelho e sem aparelho necessitam de ser emparelhados em termos de idade, sexo, inteligncia e todas as outras variveis que achemos necessrio serem controladas. Apresentamos depois s crianas um teste que mea o seu vocabulrio, traduzindooemresultados,talcomomostradonatabelaseguinte.

Quadro 18: Resultados do teste do vocabulrio Ordem das Par de sujeitos Situao A (com aparelho) Situao B d (A-B) (sem aparelho) positivas negativas Ordem de d diferenas diferenas Ordem das

1 2 3 4 5 6 7 8 9 10 TOTAL MDIA

3 4 3 1 5 2 3 4 1 3 29 2,9

5 5 2 5 4 5 5 4 5 5 45 4,5

-2 -1 +1 -4 +1 -3 -2 0 -4 -2

5(-) 2(-) 2(+) 8,5(-) 2(+) 7(-) 5(-) 8,5(-) 5(-)

5 2 2 8,5 2 7 5 8,5 5 41

79 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

RACIONAL
OobjectivodotestedossinaisdeWilcoxoncompararasperformancesdecadasujeito(oupares de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados nasduassituaes.OsresultadosdaSituaoBsosubtradosdosdaSituaoAediferena resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas diferenassoordenadasemfunodasuagrandeza(independentementedosinalpositivoou negativo).Oordenamentoassimobtidodepoisapresentadoseparadamenteparaosresultados positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada. Aideiaqueseexistiremapenasdiferenasaleatrias,talcomopostuladopelahiptesenula, ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tantoparaasdiferenaspositivascomonegativas.Seseverificarumaprepondernciadebaixos resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as duassituaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


1. Calculeadiferenadentrecadaparderesultados,atribuindoosinalmaisoumenos. Vejaacolunad(AB) 2. Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior, ignorandoossinaispositivosenegativos. Vejaacolunaordenamentoded 3. Emseparado,juntetambmaordenaocorrespondenteaossinaisdiferentes(+ou). Vejaostotaisparaordenamentosdediferenaspositivasedediferenasnegativasnas respectivascolunas

80 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4.

ConsidereomenordostotaisdasordenscomoW. ValorobservadodeW=4,umavezqueototaldasordensparaasdiferenaspositivas omenor

5.

ConteonmerodeparesdesujeitosN(noconsidereasigualdades). N=101=9

CONSULTA DA SIGNIFICNCIA NA TABELA


A tabela anexada (Anexo III) apresentalhe o nvel de significncia de w tanto para os testes unicaudaiscomobicaudais.NacolunadaesquerdaencontraosvaloresdeN.Umavezqueno efectumosumaprevisodadireco(comoporexemplo,queobteramosmelhoresresultados no vocabulrio de criana em jardim de infncia) teremos de utilizar os nveis de significncia paraumahiptesebicaudal.SeleccioneovaloradequadoN=9everifiqueaolongodessalinhase o valor de W significativo. Uma vez que se convencionou utilizar o menor valor das ordens, entoovalorobtidodeWterdeserigualouinferioraovalorcrticodaTabela.Comoovalor obtidoW=4inferioraovalorcrticode6parap<0,05(bicaudal),poderejeitarahiptesenulae concluir que existe uma diferena significativa entre os resultados no vocabulrio dos dois gruposdesujeitosemparelhados. Suponha que tinhaefectuadoumaprevisonumadadadireco,porexemplo,queascrianas que usam aparelho auditivo (Situao B) obtm resultados mais elevados no teste de vocabulrio. O valor obtido de W=4, inferior a 6, que o valor crtico de W para p<0,025 (hipteseunicaudal),umaprobabilidadeinferiore,consequentemente,maissignificativadoque onveldesignificnciaparaumahiptesebicaudalp<0,05.

81 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

7. TESTES PARA K AMOSTRAS INDEPENDENTES


O investigador pode precisar de decidir se diversas variveis independentes devem ser consideradas como procedentes da mesma populao. Os valores amostrais quase sempre so um tanto diferentes e o problema determinar se as diferentes amostras observadas sugerem realmente diferenas entre as populaes ou se so apenas variaes casuais que podem ser esperadasentreamostrasaleatriasdamesmapopulao. Apresentamostcnicasparacompararasignificnciadediferenasentretrsoumaisgrupos deamostrasindependentes,ouseja,paracomprovarahiptesedenulidadedequeKamostras independentestenhamsidoextradasdamesmapopulaooudepopulaesidnticas. Asprovasnoparamtricastmavantagemdepermitirestudar,quantosignificncia,dados que so inerentemente classificados (escala nominal) ou se apresentam em postos (escala ordinal).

7.1 TESTE DE KRUSKAL-WALLIS


REQUISITOS PARA O USO DO TESTE DE KRUSKAL-WALLIS
OtestedeKruskalWallispressupeasseguintescondiesparaoseuadequadouso: a) Comparaodetrsoumaisamostrasindependentes; b) OtestedeKruskalWallisnopodeserusadoparatestardiferenasnumanicaamostra derespondentesmensuradosmaisdeumavez; c) Dadoscujonveldemensuraosejanomnimoordinal; d) Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja possvelatribuirpostosouordens; e) Otamanhomnimodecadaamostradeveserde6parasepoderrecorreraox2.
82 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).

QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando sujeitosdiferentessodistribudosportrsoumaissituaes.
Exemplo:Suponhaqueestamosinteressadosemdescobrirseexistemdiferenasnoacessoa uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes Sujeitos do grupo 1 (pgina muito ilustrada) Sujeitos do grupo 2 (pgina com algumas ilustraes) Sujeitos do grupo 3 (Pgina sem ilustraes)

Sabado Sabado Sabado Sabado TOTAL MDIA

1 2 3 4

Resul 19 21 17 16 73 18,25

Ordem 10 11 9 8 38

Resul 14 15 9 38 12,67

Ordem 6 7 1 14

Result. 12 12 13 10 47 11,75

Ordem 3,5 3,5 5 2 14

RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para compararresultadosdosmesmossujeitosoudesujeitosemparelhadosemdiferentessituaes, comocomotesteUdeMannWhitneyparadesignsrelacionados. Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas aleatriasentreassituaes,comopostuladonahiptesenula,deesperarqueordensaltase

83 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

baixassedistribuamdeformaaproximadamenteequivalentepelasdiferentessituaes.Mas,se pelocontrrio,houverumaprepondernciadealtosoubaixosresultadosemqualquerumadas situaes, provvel que tal facto reflicta diferenas significativas devidas varivel independente. OvalordasdiferenasentreostotaisdasordensdadopelaestatsticadesignadaporH.Desde queahipteseexperimentalprevejaaexistnciadediferenassignificativasentreassituaes,o valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que possaserconsideradosignificativo.

INSTRUES PASSO-A-PASSO PARA CALCULAR H


Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados, atribuindoaOrdem1aomenorresultadoeassimsucessivamente. Paraumordenamentoglobaldosresultados,vejaascolunasordemparaosgrupos1,2e3,em quetodososresultadossoconsideradosemconjunto Adicioneostotaisdasordensparacadasituao. CalculeovalordeHapartirdafrmula
T 2 12 c = ________________ __________ - 3 (N + 1) N (N + 1) n c

H
em que: N=nmerototaldesujeitos

N=11 n1=4;n2=3;n3=4

nc=nmerodesujeitosemcadagrupo

Tc=totaldeordensparacadasituao,ouseja, ostotaisdasordensparacadacoluna T1=38;T2=14;T3=14

Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado T12=382;T22=142;T32=142

84 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Tc2= somadosquadradosdostotaisdasordensparacadasituaodividido n c pelonmerodesujeitosdessasituao:

382/4 + 142/3 + 142/4 Clculo de H H


12 T 2 c = ____________ ______ - 3 (N + 1) N (N + 1) n c

12

H = _____________________ (382/4 + 142/3 + 142/4 )


11 (11 + 1) 12

- 3 (11 + 1)

H = ___________________ (1444/4 + 196/3 + 196/4 )


132

- 3 x 12

H = 0,091 (361 + 65,33 + 49) 36 H = 43,255 36 = 7,26


Calculeosgrausdeliberdade,ouseja,onmerodesituaes(C)menosuma. gl=C1=31=2

CONSULTA DA SIGNIFICNCIA NA TABELA


ATabela(AnexoIV)utilizaseemexperinciascomtrsgruposdesujeitos,ecomummximo decincosujeitosemcadagrupo.Paraummaiornmerodesujeitos,deveserutilizadaaTabela doQuiquadrado(AnexoI).Quandonosoutilizadosmaisdetrsgrupos,poderlocalizarna colunadaesquerdadaTabelaonmerodesujeitosdecadagrupo.Localizeentoacombinao queprocura(nonossocaso:4,4,3).Notequeaordemdonmerodesujeitosnoimportante, masacombinaoapropriadanaTabela4,4e3.Paraessacombinaoencontrarosvalores crticos de H para vrias probabilidades. Se o valor de H que obteve for igual ou superior ao valor crtico de um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso exemplo, o valor obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que podemosaceitarahipteseexperimentalaestenveldesignificncia. Sepossuirmaisdetrssituaes,e/ousujeitosemcadasituao,deverprocurarovalorcrtico na Tabela do Quiquadrado. Repare que para isso ter que calcular os graus de liberdade. Localizeosvaloresdosgrausdeliberdade(nonossoexemplo,gl=2)aolongodacolunadolado esquerdo e verifique ao longo da linha os valores crticos para as diferentes probabilidades. O
85 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

valorqueobtivemosH=7,26superioraovalorcrticode5,99parap<=0,05,peloquepodemos aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela especialmenteconcebidaparanosdarasprobabilidadescomumpequenonmerodesujeitose desituaes. Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.

86 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8. TESTES PARA K AMOSTRAS RELACIONADAS


Soestatsticasparacomprovarasignificnciadediferenasentretrsoumaisgrupos,ouseja, paracompararahiptesedenulidadedequeK(3oumais)amostrastenhamsidoextradasda mesmapopulaooudepopulaesidnticas. As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou maisamostrasoucondiesdeumexperimento,necessrioaplicarumaprovaestatsticaque indique se h alguma diferena global entre as K amostras ou condies, antes que possamos cogitardecomprovarasignificnciadadiferenaentreduasamostrasquaisquer. Squandoumaprovaglobal(provadeKamostras)nosautorizaarejeitarahiptesenulaque podemosempregarumprocessoparadeterminardiferenassignificativasentreduasquaisquer dasKamostras. Estas provas noparamtricas tm a vantagem de permitir o estudo da significncia de dados que,inerentemente,seapresentamapenassobaformaclassificativaouempostos. HdoisplanosbsicosparacompararKgrupos: 1. Noprimeirodeles,asKamostrasdeigualtamanhosopostasemcorrespondncia de acordo com determinado(s) critrio(s) que podem afectar os valores das observaes.Nalgunscasos,essacorrespondnciaobtmsecomparandoosmesmos indivduosoucasossobtodasasKcondiesouentocadaumdosNgrupospode ser mensurado sob todas as K condies. Em tais planos, devem usarse provas estatsticasparaKamostrasrelacionadas; 2. O segundo plano envolve K amostras aleatrias independentes (no necessariamente do mesmo tamanho), uma de cada populao. Em tais casos, devemosusarasprovasestatsticasparaKamostrasindependentes.

87 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.1 PROVA DE COCHRAN

Quandoutilizar: A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos correspondentes de frequncias ou propores diferem entre si significativamente. A correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de Cochranadaptaseespecialmenteaocasoemqueosdadosseapresentamnumaescalanominal ousobaformadeinformaoordinaldicotomizada. Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes: 1. 2. 3. Demonstrandointeresse,cordialidade,entusiasmo; Demonstrandoformalismo,reservaecortesia; Demonstrandomodoabrupto,formalismoeaspereza.

88 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: O entrevistador visitaria3gruposde18casas,aplicandootipo1deentrevistaa umgrupo,otipo2aoutrogrupoeo3aoterceirogrupo.Teramos,assim,18conjuntosde potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista). Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (N=18).Poderamos,pois,comprovarseasdiferenasfundamentaisnostiposdeentrevista influenciariam o nmero de respostas afirmativas sim dadas para aceitao de participaopelos3gruposdecorrespondentes.
Quadro 20: Q de Cochran

Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Resposta entrevista 1 1 2 1 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2

Resposta entrevista 2 1 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2

Resposta entrevista 3 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 2 1 1

RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas

HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas. H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.

PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.

NVEL DE SIGNIFICNCIA: p=0,01 N=18


89 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DISTRIBUIO AMOSTRAL:
Sobahiptesedenulidade,QtemumadistribuioaproximadamenteQuiquadradocomgl=1. Isto,aprobabilidadeassociadaocorrncia,sobHo,dequalquervalortograndequantoum valorobservadodeQpodeserdeterminadamedianterefernciaTabela.

REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua ocorrncia,sobHo,nosejasuperiorap=0,01.

DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran

Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Total

Resposta entrevista 1 0 1 0 0 1 1 1 0 1 0 1 1 1 1 1 1 1 1
G1=13

Resposta entrevista 2 0 1 1 0 0 1 1 1 0 0 1 1 1 1 1 1 1 1
G2=13

Resposta entrevista 3 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0
G3=3

Li 0 2 1 0 1 2 2 1 1 0 3 3 2 2 2 3 2 2

Li2 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4

Li=29 Li263

Li=nmerototalderespostasSimparacadalinha K=nmerodecolunas N=nmerodelinhas

90 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Substituindoestesvaloresnafrmula,vem:
(K-1) Q=

[K Gj

( Gj)2

]
=

(3-1)

[ 3X (13

+ 132 + 32) 292

]
= 16,7

_____________________________________________

______________________________________________________

K Li - Li2

3X29 - 63

Emque

K=n.degrupos Gj=n.totaldesucessos

ATabela(AnexoI)indicaqueQ16,7temumaprobabilidadedeocorrncia,sobHo,p<0,001, quandogl=K1=31=2.Essaprobabilidadeinferioraonveldesignificnciadep=0,01.Ovalor deQestnaregioderejeioe,consequentemente,anossadecisorejeitarHoemfavorde H1,concluindoqueonmeroderespostasSimdiferesignificativamenteemrelaoaostipos 1,2e3deentrevista.

RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K colunas,possveltestarahiptesedenulidadedequeaproporooufrequnciaderespostas dedeterminadotiposejaamesmaemcadacoluna,exceptuandoasdiferenasdevidasaoacaso. Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de duplaentrada),ento,seonmerodelinhasmuitopequeno

K(K-1) Q=

(Gj - G)2

__________________________________________

K Li - Li2

temdistribuioaproximadamenteQuiquadradocomgl=K1,emque: Gj=nmerototaldeSucessosnacolunaj
__

G=mdiadosGj Li=nmerototaldesucessosnalinhai

91 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos clculos:

(K-1) Q=

[K Gj ( Gj) ]
2 2

__________________________________________________

K Li - Li2

INSTRUES PASSO-A-PASSO PARA CALCULAR Q


Paradadosdicotomizados,atribuiroscore1acadaSucessoeoscore0acadaFalha. DisporosdadosnumatabelaK.N,comKcolunaseNlinhas(N=nmerodecondiesemcada umdosgrupos). DeterminarovalordeQ,aplicandoafrmula. AsignificnciadovalorobservadodeQpodeserdeterminadomedianteaobservaodoAnexo I, pois Q recorre distribuio do Quiquadrado com gl=K1. Se a probabilidade associada ocorrncia, sob H0, de um valor to grande quanto um valor observado de Q no supere p, rejeitaseH0.

8.2 TESTE DE FRIEDMAN


Quandoutilizar: EstetestepodeserconsideradoumaextensodotestedeWilcoxon,quandonecessrioutilizar trsoumaissituaesexperimentais.Deveserutilizadoparaumdesignrelacionadoquandoos mesmos sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes experimentais.

92 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes. pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.
Sujeitos Quadro 22: Avaliao de trs tipos de ilustraes Situao 1 Situao 2 Situao 3 (Ilustrao A) (Ilustrao B) (Ilustrao C) Result. Ordem Result. Ordem Result. 2 1 3 3 2 1 5 1 18 2,25 1 1 1 2 1 1 3 1 11 5 5 5 5 3 4 3 4 34 4,25 3 3 2,5 3 2 2,5 2 3 21 4 3 5 2 5 4 2 3 28 3,50

Ordem 2 2 2,5 1 3 2,5 1 2 16

1 2 3 4 5 6 7 8

TOTAL MDIA

RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados. Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamentodosresultadosdecadasujeitoparaastrscondiesserfeitahorizontalmenteao longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente2naSituao1,5naSituao2e4naSituao3,soatribudastrsordens,do menorresultadoparaomaior:Ordem1paraaSituao1,Ordem2paraaSituao3eOrdem3 paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4. Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperarqueestestotaissejamaproximadamenteiguaispartindodoprincpiodequesurgiriam algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se assituaesforemsignificativamentediferentes,deesperarqueseobtenhamtotaisdasordens

93 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais das ordens nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for igual ou superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordeneosresultadosdecadasujeitoemseparado,aolongodecadalinha,atribuindoaOrdem1 aomenorresultadoeporaadiante. (Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados correspondesordens1,2e3,dadoexistiremtrssituaes). Calculeototaldasordensparacadasituao.

CalculeovalordeXR2apartirdafrmula

XR2 = ________________________ Tc2


NC (C + 1)

12

- 3N (C + 1)

emque C=nmerodesituaes N=nmerodesujeitos C=3 N=8 T1=11;T2=21;T3=16 T12=112;T22=212;T32=162

Tc=totaldeordensparacadasituao

Tc2=quadradodototaldeordensparacadasituao

Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162 ClculodeXR2
12 XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1) (8 x 3) (3 + 1) 12 XR2 =
_____________________

(121 + 441 + 256) - (24 x 4)

24 x 4 12 XR2 =
_________________

x 818 - 96

96 XR2 = 6,25

94 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma. (gl=C1=31=2)

CONSULTA DA SIGNIFICNCIA NA TABELA


ExistemduastabelasparaconsultarosvalorescrticosdeXr2.Umadelas,aTabelaC(AnexoV), utilizadaquandoonmerodesituaesedesujeitospequeno.ATabelaC(1)apresentaos valoresdeXr2paratrssituaesquandoN(nmerodesujeitos)sesituaentre2e9.ATabelaC (2)apresentaosvaloresdeXr2paraquatrosituaesquandoN(nmerodesujeitos)de2,3ou 4. A Tabela D (Anexo V) a tabela de distribuio do Quiquadrado; pode utilizla quandoa amostra de sujeitos for superior s das Tabelas C (1) e C (2), uma vez que o Xr2 tem uma distribuiosemelhantedoQuiquadrado. ATabelaquedeveutilizarparaconsultarovalordeXr2,nocasodestaexperincia,aTabelaC (1),umavezquesetratade8sujeitosexpostosa3situaesexperimentais.Aquiloquetemosde fazer encontrar a coluna apropriada para N (nmero de sujeitos ou pares de sujeitos emparelhados)edescobrirnacolunapaprobabilidademaisprximaquesejainferioraosnveis de significncia convencionais. Consultando as probabilidades para N=8, o valor obtido de Xr2=6,25equivalenteaumaprobabilidadedep<0,047,queinferioraosnveisdesignificncia convencionais(p<0,05=).Paraconsiderarmosonveldesignificnciadep<0,01onossovalorde Xr2teriadeser9,00,dadoquep<0,009inferiorap<0,01.SeovalordeXr2noforapresentado naTabela,deverconsiderarovalorseguintemaisprximoquandoconsultaasprobabilidades. Porexemplo,seovalordeXr2for5,95terdeconsideraraprobabilidadeapresentadapara5,25, ouseja,p<0,079,quesuperiorap<0,05e,consequentemente,nosignificativa.Paraconsultaros valoresdaTabelaC(2)deverprocedertalcomoparaaTabelaC(1). Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer localizarosvaloresdosgrausdeliberdadeaolongodacolunadaesquerda(nonossoexemplo, gl=2, ou seja, nmero de situaes1). Depois siga ao longo da linha de probabilidades at que encontre um dos nveis de significncia convencionais. O valor que obtivemos de Xr2=6,25 superior ao valor crtico de 5,99 apresentado na Tabela do Quiquadrado, pelo que podemos aceitar que os nossos resultados so significativos ao nvel de significncia de p<0,05. Apesar disso, e dado que o nosso valor de Xr2 inferior ao valor crtico de 9,21 para p<0,01, no podemosrejeitarahiptesenulaaestenveldesignificncia.

95 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Apartirdaanliseestatsticadaexperinciapodeconcluirqueascrianasmostrampreferncias significativamentediferentespelostrstiposdeilustraes.Emfunodasmdiasapresentadas natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de tendncia.

96 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

9. MEDIDAS DE CORRELAO E SUAS PROVAS DE


SIGNIFICNCIA
Frequentemente,oinvestigadorquersabersedoisconjuntosdescoresestorelacionadosequal ograudesserelacionamento. Apresentamsemedidasnoparamtricasdecorrelaoedeprovasestatsticasparadeterminar a probabilidade associada ocorrncia de uma correlao to grande quanto a observada na amostra,sobahiptesedenulidadedequeasvariveissejamnorelacionadasnapopulao. Mas de muito maior interesse podermos afirmar se determinada associao observada numa amostradescoresindica,ouno,aprobabilidadedeassociaoentreasvariveisnapopulao da qual se extraiu a amostra. O coeficiente de correlao, por si s, representa o grau de associao.Asprovasdesignificnciasobreaquelecoeficientedeterminam,aumcertonvelde probabilidade, se existe a associao na populao da qual se extraiu a amostra que serviu de baseparaoclculodocoeficiente.

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMANRANK


CONDIES DE UTILIZAO
Estetipodecoeficientedecorrelaoutilizasequandotemos: Testenoparamtrico(semelhanteaumadistribuiolivre),isto,nocolocarestries quantoformadadistribuio;
97 Margarida Pocinho e Joo Paulo de Figueiredo

Escalademedidanomnimoordinal.

ESTATSTICAEBIOESTATSTICA

Podeacontecerqueoscaracteresestudadosnosejammensurveis,maspodemserordenados ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas duasclassificaes. Formulrio:
6(di2) =1________________

N(N2-1)

Emque: di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assimsucessivamente. Seasduasclassificaessoiguais,disemprezeroeentor=1eacorrelaoperfeita.Seas ordensmaisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese asduasclassificaessoinversas=1. Ento,
-1 1

INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).

98 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calcule,sabendoque:
xi yi 18 24 17 27 14 17 13 22 13 19 12 20 11 14 9 11 7 3 5 6

Quadro 23: Coeficiente de Contingncia de RHO de Spearman-Rank

xi 18 17 14 13 13 12 11 9 7 5

posio 1 2 3 4,5 4,5 6 7 8 9 10

yi 24 27 17 22 19 20 14 11 3 6

posio 2 1 6 3 5 4 7 8 10 9

d -1 1 -3 1,5 -0,5 2 0 0 -1 1

d2 1 1 9 2,25 0,25 4 0 0 1 1

=19,5

6x19,5 =1__________________=0,88 10(1021)

9.2 O COEFICIENTE DE CONCORDNCIA DE KENDALL


Quandoutilizar: O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de postosdeNobjectosouindivduos. Quando temos K conjuntos de postos, podemos determinar a associao entre eles utilizandoocoeficientedeconcordnciadeKendall(W).

99 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos, poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o processotornaseimpraticvel,umavezquetemosdecalcularinmeroscoeficientesdecorrelaode postos.

Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por postosdeSpearman,Kendalmostrouque KW1 rsav=__________ K1

Outro processo consiste em imaginar como se apresentariam dados se no houvesse concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel (perfeita).Demodoaproximado,Wumcoeficientedestanatureza. Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para preencheravaga.Atabelaseguintedos3conjuntosindependentesdepostosatribudospelos chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal

Candidato a 1 1 6 8 b 6 5 3 14 c 3 6 2 11 d 2 4 5 11 e 5 2 4 11 f 4 3 1 8

Chefe

X Y Z Rj

Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O candidatoqueos3chefestivessemconsideradoemsegundolugarreceberiaRj=2+2+2=6=2Keo menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam 3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h concordnciaperfeitaentreKconjuntosdepostos,obtemos,paravaloressignificativosdeRj,a sequnciaK,2K,3K,...,NK. Poroutrolado,senotivessehavidoconcordnciaentreos3chefes,entoosdiversosRjseriam aproximadamenteiguais. Desteexemplo,vemosqueograudeconcordnciaentreosKjulgamentosreflectidopelograu devarinciaentreasNsomasdepostos.W,coeficientedeconcordncia,funodessegraude varincia. Assim: S W=____________________

1/12 K2 (N3 N)
emque: S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj Rj/N)2; K=nmerodeconjuntosdepostos; N=nmerodeentidades(objectosouindivduosaqueseatribuempostos); 1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.

101 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento, =(8+14+11+11+11+8)/6=10,5

S=(810,5)2+(1410,5)2+(1110,5)2+(1110,5)2+(1110,5)2+(810,5)2= 6,25+12,25+0,25+0,25+0,25+6,25=25,5 Peloque


S 25,5 25,5 W=__________________________=_____________________________=_____________________= 1/12 K2 (N3 N) 25,5 =_______=0,16 157,5 1/12 x 32 (63 6) 1/12 x 9 x 210

W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6 candidatosaemprego.

desalientarquearazoporqueWnopodetomarvaloresnegativosque,quandoesto em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente discordantes.Porexemplo,seXeYdiscordam,eseXtambmdiscordadeZ,entoYeZ certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e discordncianosoopostossimtricos.Kjuzespodemtodosconcordar,masimpossvel todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo. NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos postosquelhescaberiamsenohouvesseempates. OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo: (t3 t) T=
_________________________

12 Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto

102 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento,afrmulaser: S ______________________________________ W= 1/12 K2 (N3 N) - T

INSTRUES PASSO-A-PASSO PARA CALCULAR W


SejaN=nmerodeobjectosouindivduosaseremclassificadosempostoseK=nmerodejuzes classificadores.DisporospostosobservadosnumatabeladotipoKXN. ParacadaindivduoouobjectodeterminarRj,somadospostosatribudosqueleindivduopelos Kjuzes. Determinar a mdia dos Rj. Exprimir cada Rj como desvio a contar dessa mdia. Elevar ao quadradoessesdesviosesomlos,obtendoS. SeaproporodeempatesnosKconjuntosgrande,paracalcularWutilizarafrmula

S W=_________________________________ 1/12 K2 (N3 N) - T

Emcasocontrrio,usar
S W=
_______________________________

1/12 K2 (N3 N)

Omtodoparadeterminarseovalorobservadosignificativamentediferentedezerodepende dotamanhodeN: SeN7aTabela(AnexoVI)dosvalorescrticosdeSassociadoscomosWs significativosaosnveisde0,05ede0,01; Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2 (AnexoI).

103 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


PROVA DE SIGNIFICNCIA
PEQUENAS AMOSTRAS:

UtilizandoseaTabelaestadovalordeSparaWssignificativosaosnveisde0,05ede0,01. Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser rejeitadaquelenvel. Por exemplo, vimos que quando K=3 chefes depessoalfictciosclassificaramN=6candidatosa emprego,aconcordnciadosjulgamentosfoiW=0,16.ATabelaindicaqueoSassociadoquele valordeW(25,5)nosignificativo,umavezqueScrtico(103,9)maiordoqueSobservado (25,5). QuandoN>7,adistribuioaproximadamenteumadistribuiodeQuiquadradocomg.l.=N 1,vindo: S 2=_______________________ X 1/12 KN (N + 1)

Noteseque: S

_____________________________

= K (N 1) W

1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto oWobservado. SeovalordeX2observadoigualaousuperaovalordaTabela(AnexoI)paraumdadonvelde significnciaeumparticularvalordeg.l.=N1,entoHo(nohrelaoentreosKconjuntosde postos)podeserrejeitadaquelenvel.
104 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os observadoresoujuizesestoaplicandoessencialmenteosmesmospadresaoatriburempostos aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos. KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois emambososcasosRj=0,omenorvalorobservado.

105 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10. TESTES PARAMTRICOS PASSO-A-PASSO


10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que podeexistirumarelaoentreeles. Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto querdizerqueexisteumafrmulaexprimindoamedidadosegundoemfunodadoprimeiro: P=2r. Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a alturamximadamarnoportodaFigueiradaFozeonmerodepassageirosdalinhaPorto Lisboa.Vsebemqueentreasduasestatsticasassimobtidasnoseencontranenhumarelao. Diremosqueosdoiscaracteressoindependentes. Masentreestesdoiscasosextremos,adependnciafuncionaleaindependncia,avidacorrente ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica. Existeumadependnciaestatsticaentreaspessoasquemorremcomfebretifideeaspessoas vacinadascontraestadoena. Desdequeosdoiscaracteressejamtaisqueassuasvariaessejamsemprenomesmosentido, ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos, ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles. EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom Pearson,nosfinsdosculoXIX.

106 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo EstatsticaDescritiva.Assim,importafazermosadistinoentreeles: A correlao pode ser definida como o grau de semelhana no sentido das variaes entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom adescriodarelaoentrevariveis. A regresso usada quando tentamos predizer uma varivel quando conhecemos a outra.

TIPOS DE COEFICIENTE DE CORRELAO


Basicamente,podemosconsiderardoistiposdecoeficientesdecorrelao: Coeficiente de correlao momentoproduto de BrawaisPearson, cujo smbolo r, e queumatcnicadeestatsticaparamtrica; Coeficiente de correlao Rho de SpearmanRank, cujo smbolo , e que uma tcnicadeestatsticanoparamtrica. Devemossalientarque,paraoclculodascorrelaes,necessriotermossempreduasmedidas paracadasujeito.

REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot ouscattergrame,genericamente,tomaaseguinteforma:
80

70

60

50

40 40 50 60 70 80

Figura 13: Diagrama de disperso de pontos ou scatterplot ou scattergram

107 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Suponhamosquetemosduassriesestatsticasformadaspelosvaloresxieyidedoiscaracteres. Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e obtendoanuvemdepontos. Segundoosdados,anuvemdepontospodeapresentardiversosaspectos. Porexemploospontospodemdistribuirsenasemelhanadeumalinharectaoudeumacurva: istosugereaexistnciadeumarelaofuncionalentreXeY. Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode acontecerqueospontoscubramumaporodoplanodaqualsepodedefinirocontorno;esta formasugerequeasduasvariveisestoligadas.Limitemonosaocasomaissimplesemquea nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a possibilidadedaexistnciadeumarectatalqueosvaloresestimadosporestarecta,apartirdos valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo dosmnimosquadradosumarectatalqueasomadosquadradosdosdesviossejamnima.Esta rectachamadarectaderegressodeYemXourectadeestimaodeYemX. Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados aolongodestarecta,apartirdeyi,constituamigualmenteboasaproximaesdexi.Estarecta chamadarectaderegressodeXemYourectadeestimaodeXemY. Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe ligao funcional linear e so perpendiculares quando h independncia. Compreendemos, assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso estejammaisprximasumadaoutra.

108 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

COEFICIENTE DE CORRELAO MOMENTO-PRODUTO DE BRAWAIS-PEARSON


Condiesdeutilizao: Estetipodecoeficientedecorrelaoutilizasequando: 1. 2. 3. 4. Formulrio
r= (XY) - X Y N. sx sy

Asduasvariveissocontnuas; Adistribuioseaproximadadistribuionormal; prefervelparadistribuiesunimodais; Escalaintervalardemedida.

Ento:
-1 r 1

Interpretao: Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso: r0,2

Correlaomuitobaixa(valoresdesprezveis) Correlaobaixa Valoressignificativos Altacorrelao Muitoaltacorrelao

0,2<r0,5 0,5<r0,7 0,7<r0,9 0,9<r1

Para Borg: 0,20<r0,35

Ligeira relao entre as variveis, embora j possam ser estatisticamentesignificativas

0,35<r0,65 Correlaoestatisticamentesignificativaparaalmdonvelde1% 0,65<r0,85 Correlaesquetornampossveisprediesdogrupodequesodignas r>0,85 ntimarelaoentreasvariveiscorrelacionadas

109 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para Byrman e Cramer, seEta,r,Rho,phi:

0,2 0,2<r0,39 0,4<r0,69 0,7<r0,89 0,9<r1

Correlaomuitofracaesemsignificncia Correlaofraca Correlaomoderada Correlaoforte Correlaomuitoelevada

Coeficientedecorrelaodnos: Adirecoqueindicadapelosinal+ou Aintensidadeouforaquedadapelovalorquevariaentre1e1.Seacorrelaofor zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).


Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas X, Y, Z e W:

Quadro 25: Correlao de Pearson

Estudante 1 2 3 4 5 6 7 8 9 10

X 75 70 70 65 60 60 55 50 50 45 600

Y 75 70 70 65 60 60 55 50 50 45 600

Z 45 50 50 55 60 60 65 70 70 75 600

W 45 50 50 55 60 60 65 70 70 75 600

XY 5625 4900 4900 4225 3600 3600 3025 2500 2500 2025 36900

XZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

XW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

YZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

YW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

ZW 2025 2500 2500 3025 3600 3600 4225 4900 4900 5625 36900

Sabeseque:

X=60
XY=36900 s2x= 90

Y=60
XZ=35100 s2y= 90

Z=60
s2z= 90

W=60
s2w= 90

a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente. b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.

110 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Resoluo 47: a) (XY) - X Y r=_____N______________ sx sy Ento, 36900 _ 60x60 10 r = _________________________________________ 90 x 90 r= = 1 Existe uma relao positiva muito forte entre X e Y b) r= Ento, 35100 _ 60x60 10 r=
________________________________________

(XZ) - X Z N .. sx sZ

90 x 90 r= = -1

ExisteumarelaonegativamuitoforteentreXeW,isto,quantomaiorXmenorYevice versa.

10.2 TESTE T DE STUDENT (NO RELACIONADO)

CARACTERSTICAS DO TESTE T:
1. 2. Testeparaacomparaodemdias; Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais grossasdoquenadistribuionormal; 3. 4. 5. 6. 7. Contnua; Simtrica; Deformacampanular; Variademaisinfinitoamenosinfinito; Mdia=0edesviopadrodavariveldeacordocomn;

111 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.

OusodeTpressupequeavarivelobservacionaltenhanapopulao(deondefoi colhidaaamostra)distribuionormal;

9.

No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da amostraexisteumadistribuio(umacurva)especfica;

10. medidaquencresce,ttendeaz(aaproximaoentretezcomeaaficarboaa partirden>=30). Requisitosparautilizarotestet: 1.Quandoasduasamostrastmamesmahomogeneidadedevarincia; 2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica; 3.Escalademedidaintervalar.

QUANDO UTILIZAR
Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente, quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados. O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos comparamdiferenasentredoisgrupos.

OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos resultadosentredoisgruposcomavariabilidadetotalnosresultadosdossujeitos.Asdiferenas previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos. Aestatsticatrepresentaotamanhodadiferenaentreasmdiasparaosdoisgrupos,tomando emconsideraoavarinciatotal.Paraqueovalorobservadodetsejasignificativoterdeser igualousuperioraosvalorescrticosdetapresentadosnatabela.

112 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado: 1. 2. 3. 4. Adicionarostotaisdosresultadosaoquadradoparacadagrupo; Elevaraoquadradotodososresultadosindividuaisparacadagrupo; Calcularamdiaparacadagrupo; Calculart:

1 - 2 t = _________________________________________________________________ x12 - ( x1)2 + x22 - ( x2)2 ______ ______ n1 n2 1 1 ____________________________________ __ + __ (n1 - 1) + (n2 - 1) n1 n2

emque: n1=nmerodesujeitosdogrupo1 n2=nmerodesujeitosdogrupo2 1=mdiadogrupo1 2=mdiadogrupo2

x12=somadosquadradosparaogrupo1 x22=somadosquadradosparaogrupo2
(x1)2=resultadostotaisdogrupo1aoquadrado (x2)2=resultadostotaisdogrupo2aoquadrado

Calcularg.l.:

g.l.=(n11)+(n21)

Setobservado>tcrticorejeitaseHo Setobservado<tcrticonoserejeitaHo

113 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:paraverificarseduasdietasparaemagrecersoigualmenteeficazes,ummdicoseparouao acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados estoapresentadosnoquadroquesesegue:
Quadro 26: Teste t no relacionado

______________________________________________________________________________________ Grupo 1 (dieta 1) Grupo 2 (dieta 2) ______________________________________________________________________________________ Resultados Resultados Resultados Resultados ao quadrado ao quadrado 10 100 2 4 5 25 1 1 6 36 7 49 3 9 4 16 9 81 4 16 8 64 5 25 7 49 2 4 5 25 5 25 6 36 3 9 5 25 4 16 _____________________________________________________________________________________ Total x1 = 64 x12 = 450 x2 = 37 x22 = 165 2 = 3,7 Mdia 1 = 6,4

InstruesPassoaPasso: 1.construiratabela 2.x1=64 x2=37 x12=450 x22=165

3.(x1)2=64X64=4096 (x2)2=37X37=1369

4.1=6,4

2=3,7

114 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6,4 - 3,7 t = _________________________________________________________ = 450 - 4096 + 165 - 1369 ______ ______ 10 10 _______________________________ 9+9 2,7 = ______________ 3,806. 0,2 6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18 = 3,547

1 __ 10

1 + __ 10

O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese bicaudal.

10.3 TESTE T DE STUDENT (RELACIONADO)

Quandoutilizar: Utilizaseparadesignsexperimentaiscomduassituaestestandoumavarivelindependente, quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.

OBJECTIVO
Oobjectivocompararasdiferenasentreasduassituaesexperimentaiscomavariabilidade total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as situaes.

115 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Aestatsticatapresentaotamanhodasdiferenasentreosresultadosdossujeitosparaasduas situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos databela(AnexoVII).

INSTRUES PASSO-A-PASSO
1.CalcularasdiferenasentreosresultadosdossujeitossubtraindoosresultadosdasituaoB paraasituaoA 2.Elevaressasdiferenasaoquadrado 3.Calcularosomatriodasdiferenasobtidas(d) 4.Calcularosomatriodoquadradodasdiferenas(d2) 5.Elevaraoquadradoasdiferenastotais(d)2 6.Calculart:
d t=
___________________________________

N d2 ( d)2 N-1

emque 7.Calcularg.l.: Setobservado>tcrticorejeitaseH0 Setobservado<tcrticonoserejeitaH0 g.l.=N1

d=somadasdiferenasdosresultadosAeB d2=somadosquadradosdasdiferenas
(d)2=somadasdiferenaselevadasaoquadrado N=nmerodesujeitos

116 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Paraverificarseaeficciadeumadietaerainfluenciadapeloministrardeumfrmaco,um mdicodecidiuadministrar,aumgrupodeindividuosqueotinhamprocuradoparaperderpeso,um placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos. Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar gorduras. Registouaperdadepesoquetinhaocorridonos30diasantecedentestomadadeplaceboetrintadias apsoplacebo.Osresultadosestonoquadroquesesegue

Quadro 27: Teste t relacionado

Situao A Situao B d d2 (com placebo) (s com dieta) (A-B) ____________________________________________________________________________ 1 10 2 8 64 2 5 1 4 16 3 6 7 -1 1 4 3 4 -1 1 5 9 4 5 25 6 8 5 3 9 7 7 2 5 25 8 5 5 0 0 9 6 3 3 9 10 5 4 1 1 ___________________________________________________________________________ Total 64 37 d=27 d2=151 Mdia6,43,7 Resoluo50: InstruesPassoaPasso:

Sujeito

1.construirtabela 2.calcularasmdias 3.d=27 4d2=151 5.(d)2=27x27=729

6. proceder aos calculos 27 t=


____________________________-

27 =
_______________

= 27 / 9,316 = 2,90

10 x 151 (27)2 10 - 1 7. g.l. = N - 1 = 10 - 1 = 9

86,78

117 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Comoovalorobservadodetde2,90superioraovalorcrticode2,821aonveldesignificncia de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso Oponto10.3explicacomocompararmdiasdeduaspopulaes,combaseemamostrasdessas populaes.Massvezesprecisocompararmdiasdemaisdeduaspopulaes.Porexemplo, paraverificarsepessoascomdiferentesnveissocioeconmicos,isto,alto,mdioebaixotm, emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes. ParacompararmdiasdemaisdeduaspopulaesaplicaseotesteF,naformaqueaseguirse descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro 28. As mdiasdessasamostrasestonaltimalinhadessequadro.Serqueasdiferenasdasmdias dasamostrassosuficientementegrandesparaquesepossaafirmarqueasmdiasdaspopulaesso diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.

Quadro 28: Dados de 4 amostras e respectivas mdias

A 11 8 5 8 8 40 8

B 8 5 2 5 5 25 5

C 5 7 3 3 7 25 5

D 4 4 2 0 0 10 2

118 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4 ANLISE DE VARINCIA

10.4.1 Anlise da Varincia com Igual Tamanho


Se a varivel em estudo tem distribuio normal ou aproximadamente normal, para comparar maisdeduasmdiasaplicaseotesteF. Primeiro,precisoestudarascausasdevariao.Porqueosdadosvariam?Umaexplicaoo factodeasamostrasproviremdepopulaesdiferentes.Outraexplicaooacaso,porqueat mesmoosdadosprovenientesdeumamesmapopulaovariam. O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos tratamentos (no exemplo, devido s amostras terem provindo de populaes diferentes) da variabilidaderesidual,isto,devidoaoacaso.ParaaplicarotesteFprecisofazerumasriede clculos,queexigemconhecimentodanotao. .

O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo, denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk totaisdetratamentos.

Quadro 29: Notao para anlise da varincia

1 x11 x12 . . . x1r Total N. de repeties Mdia T1 r 1

2 X21 X22 . . . X2r T1 r 2

3 X31 X32 . . . X3r T1 r 3

... ... . . .

K xk1 xk2 . . . Xkr T1 r k

Total

T=x N=kr

Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1.passo: a) b) c) 2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido pelonmerodedados. osgrausdeliberdade(gl)dosgrupos:k1 gldototal:n1 gldosresiduos:(n1)(k1)=nk

FORMULA:

C = (x)2 n

b)

calcularaSomadosQuadradosTotal(SQT)

FORMULA:
c)

SQT = x2-C

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

FORMULA:

SQTr = T2 - C r

d)

calcularaSomadosQuadradosdosResduos(SQR)

FORMULA:
e)

SQR = SQT-SQTr

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

FORMULA:

QMTr = SQTr k-1

f)

calcularoQuadradomdiodoTotaldoResiduo(QMR)

FORMULA:

QMR = SQR n-k

120 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

g)

calcularovalordeF

FORMULA:

F = QMTr QMR

3.Passo:compararoFcalculadocomovalordadonatabeladeF,aoniveldesignificncia estabelecido,observandoosk1grausdeliberdadenonumeradoreosnkgrausdeliberdadeno denominador(colunadaesquerda).


Exemplo:Umprofissionaldesaderecmcontratadoparaacompanharumconjuntodeatletasdealta competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o mesmo tipo de leso(emgraueextenso)tinhammaisrecidivasqueoutros,apesardascondiesde treino e o tempo de recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia deversdiferentesteraputicasqueeramutilizadasparatratarasmesmasleses.Osresultadospodem serobservadosnoquadroquesesegue:

Quadro 30: recidivas por tratamento

Tratamento A 11 8 5 8 8 40 8

Tratamento B 8 5 2 5 5 25 5

Tratamento C 5 7 3 3 7 25 5

Tratamento D 4 4 2 0 0 10 2

1.passo: a) b) c) osgrausdeliberdade(gl)dosgrupos:k1=41=3 gldototal:n1=201=19 gldosresiduos:nk=204=16

121 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedivididopelo nmerodedados.

C = (x)2 = (11+8+5+4+8+5+7+4+5+2+3+2+8+5+3+8+5+7)2 = 1002 = 500 N 20 20

b)

calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C = 112+82+52+42+82+52+72+42+52+22+32+22+82+52+32+82+52+72 - 500 = 658-500 =158

c)

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

SQTr = T2 C = 402+252+252+102 - 500 R 5 = 590-500 = 90


d) calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 158-90 = 68

e)

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 90 = 30 k-1 3

f)

calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 68 = 4,25 n-k 16

g)

calcularovalordeF

F = QMTr = 30 = 7,06 QMR 4,25


122 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela (3,24),conclumosqueasmdiasdasrecidivasdiferememfunodotratamento,paraumnvel designificnciade0,05. Aacompanharestecomentrio,osvalorescalculadosdevemserapresentadosnumquadro,da seguinteforma:
Quadro 31: ANOVA

Causas de gl variao Tratamentos Resduo Total 3 16 19 90 68 158 30 7,06 4,25 <0,05 SQ QM F p

Mas,comosepodeobservar,apesardatabelamostrarqueexistemdiferenassignificativas,no nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori (PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey;etc.),agrandediferenaentreelesresidenotipodedistribuioemqueassentameno tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.

10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


O teste Tukey permite estabelecer a diferena mnima significante, ou seja, a menor diferena entreasmdiasquedevesertomadacomosignificativaemdeterminadonveldesignificncia. Essadiferena(dms)dadapor:

dms =q

QMR r

Ondequmvalordadoemtabela(Anexo____) QMRoquadradomdiodoresiduodaANOVA ronmeroderepeties

123 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl noresiduode4,05.comoQMR=4,25er=5,temos:

dms =4,05 4,25 = 3,73 5

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor absolutodadiferenaentreelasforigualousuperioraovalordadms. Passemosentoobservaodosvalores:

Quadro 32: post-hoc das recidivas

Pares de mdias A-B A-C A-D B-C B-D C-D

Valor absoluto da diferena (8-5) 3 (8-5) 3 (8-2) 6 (5-5) 0 (5-2) 3 (5-2) 3

dms

p ns ns <0,05 ns ns ns

3,73

fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos recidivas

124 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS


Opesquisador,nemsempretemamostrasdomesmotamanho,mesmoassimpossivelconduzir uma anlise da varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da mesmaformaemambasassituaes. Assimemvezdefazerasomadosquadradospelafrmula

SQTr = T2 - C r

Utiliza: FORMULA: SQTr = T12 + T22 ++ Tk2 r2 rk r1


Onde C a correco definida anteriormente

-C

Paramaisfcildeentenderobserveoseguinteexemplo:

Quadro 33: mdias por tratamento

Tratamento A 15 10 13 18 15 84

Tratamento B 23 16 19 18

Tratamento C 19 15 21 14 16

76

85

1.passo: a) b) c) osgrausdeliberdade(gl)dosgrupos:k1=31=2 gldototal:n1=151=14 gldosresiduos:nk=142=12

125 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido pelonmerodedados.

C = (x)2 = 2452 = 4001,67 n 15

b) calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C = 152+102+132++162 4001,67 =159,33


c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTrat)

SQTrat = T12 + T22 ++ Tk2 - C r2 rk r1 SQTr = 842+762+852 4001,67 6 4 5 = 63,33


d) calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 159,33-63,33 = 96


e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 63,33 = 31,67 k-1 2

f) calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 96 = 8 n-k 12

g) calcularovalordeF

F = QMTr = QMR

31,67 8

= 3,96

126 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.passo:irtabelaFparaumnveldesignificncia(p)de5%(0,05)eobservarqualoFterico para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela (3,89),conclumosqueasmdiasdossujeitosdiferememfunodotratamento,paraumnvel designificnciade0,05. Osvalorescalculadosdevemserapresentadosdaseguinteforma:

Quadro 34: ANOVA

Causas de variao Tratamentos Resduo Total

gl 2 12 14

SQ 63,33 96 159,33

QM 31,67 8

F 3,96

p <0,05

Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post Hoc).OresultadodotestedeTukeyoseguinte:

10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


OtesteTukeyparaamostrascomtamanhosdiferentesdadapelaseguintefrmula:

dms =q

1+ 1 ri rj

QMR 2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:

dms (A;B) =3,77 dms (A;B) =4,87

1 + 6

1 4

8,00 2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:

dms (A;C) =3,77 dms (A;C) =4,57

1+ 6

1 8,00 5 2

Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:

127 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

dms (B;C) =3,77 dms (B;C) =5,06

1 + 4

1 5

8,00 2

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor absolutodadiferenaentreelasforigualousuperioraovalordadms. Passemosentoobservaodosvalores:

Quadro 35: post-hoc

Valor absoluto da Pares de mdias diferena A-B A-C B-C |14-19| = 5 |14-17| = 3 |19-17| = 2 4,87 4,57 5,06 <0,05 ns ns dms p

ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.

128 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

ANEXOS

129 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo I
TABELADOQUIQUADRADO(X2)

130 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo II
TABELADEU

131 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo III
TABELADEWILCOXON

132 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IV
TABELAH

133 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo V
TABELASDEFRIEDMAN

134 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VI
TABELAS(TABELADEKENDAL)

135 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VII
TABELAT

136 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VIII
TABELAZ

137 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IX
TABELAF

138 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo X
TABELADOSVALORESDEq

139 Margarida Pocinho e Joo Paulo de Figueiredo

You might also like