You are on page 1of 139

ESTATSTICAEBIOESTATSTICA

NDICE GERAL

I - INTRODUO .............................................................................................................................................5 1. NOES GERAIS ..........................................................................................................................................6 2. POPULAO E AMOSTRA ............................................................................................................................9 3. MTODOS DE AMOSTRAGEM ....................................................................................................................11

3.1 AMOSTRAGENS PROBABILSTICAS E NO-PROBABILSTICAS .......................................................11


3.1.1 As Amostras Probabilsticas .................................................................................................................11 3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS ......................................................................................12 3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS: ............................................................................14

3.2 DETERMINAO DO TAMANHO DA AMOSTRA..................................................................................16


3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos) ..............16 3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos) ................18 3.2.3 Determinao da Margem de Erro da Amostra................................................................................20 3.2.4 Determinao da Amostra sem conhecer os limites da populao.............................................20

3.3 INDIVDUO OU UNIDADE ESTATSTICA.............................................................................................21 3.4 VARIVEL ESTATSTICA....................................................................................................................22 3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA....................................................................24 3.6 PARMETRO E DADO ESTATSTICO ...................................................................................................24 3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA ........................................................................25 3.8 REDUO DE UMA VARIVEL ESTATSTICA .....................................................................................29
3.8.1 Mdia ...........................................................................................................................................................30 3.8.2 Mediana ......................................................................................................................................................33 3.8.3 Moda ............................................................................................................................................................34 3.8.4 Quantis ........................................................................................................................................................38 3.8.5 Medidas de disperso .............................................................................................................................40 3.8.6 Coeficiente de disperso .......................................................................................................................49

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL...........................................................................51


3.9.1 A curva normal e os desvios-padro .................................................................................................53

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA ..............................................................................59 5. TESTES NO PARAMTRICOS PASSO-A-PASSO .....................................................................................63

5.1 TESTE DO QUI-QUADRADO................................................................................................................63 5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS ....................................................................67 5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES ...........................................................................69 5.4 TESTE U
DE

MANN-WHITNEY .........................................................................................................70

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS ....................................................................................74

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE MUDANAS .........................................................75


1 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE ........................................................................................................78 6.3 TESTE DOS SINAIS DE WILCOXON .....................................................................................................79
7. TESTES PARA K AMOSTRAS INDEPENDENTES.........................................................................................82

7.1 TESTE DE KRUSKAL-WALLIS ...........................................................................................................82


8. TESTES PARA K AMOSTRAS RELACIONADAS ...........................................................................................87

8.1 PROVA DE COCHRAN ..........................................................................................................................88 8.2 TESTE DE FRIEDMAN .........................................................................................................................92


9. MEDIDAS DE CORRELAO E SUAS PROVAS DE SIGNIFICNCIA .............................................................97

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMAN-RANK .............................................................97 9.2 O


COEFICIENTE DE CONCORDNCIA DE

KENDALL...........................................................................99

10. TESTES PARAMTRICOS PASSO-A-PASSO .........................................................................................106

10.1 CORRELAO ..................................................................................................................................106 10.2 TESTE T DE STUDENT (NO RELACIONADO) ..............................................................................111 10.3 TESTE T DE STUDENT (RELACIONADO).......................................................................................115 10.4 ANLISE DE VARINCIA .......................................................................................................119
10.4.1 Anlise da Varincia com Igual Tamanho .....................................................................................119 10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................123 10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS ..................................................125 10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS ............................................................127

ANEXOS ........................................................................................................................................................129

Anexo I ...................................................................................................................................................130 Anexo II ..................................................................................................................................................131 Anexo III.................................................................................................................................................132 Anexo IV ................................................................................................................................................133 Anexo V..................................................................................................................................................134 Anexo VI ................................................................................................................................................135 Anexo VII ...............................................................................................................................................136 Anexo VIII ..............................................................................................................................................137 Anexo IX ................................................................................................................................................138 Anexo X ..................................................................................................................................................139

2 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

NDICE DE ILUSTRAES

FIGURA 1: POPULAO E AMOSTRA......................................................................................................................................... 10 FIGURA 2: AMOSTRA ESTRATIFICADA ....................................................................................................................................... 13 FIGURA 3: CONVERSO DOS NIVEIS DE CONFIANA EM DESVIOS PADRO .................................................................................. 17 QUADRO 1: QUADRO GERAL DE SERIAO .............................................................................................................................. 25 QUADRO 2: QUADRO DE FREQUNCIAS .................................................................................................................................... 26 QUADRO 3: QUADRO DE FREQUNCIAS .................................................................................................................................... 27 QUADRO 4: QUADRO DE FREQUNCIAS .................................................................................................................................... 28 QUADRO 5: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 30 QUADRO 6: QUADRO DO CLCULO DA MDIA .......................................................................................................................... 31 QUADRO 7: CLCULO DA MDIA PONDERADA .......................................................................................................................... 32 FIGURA 4: CURVA SIMTRICA .................................................................................................................................................. 35 FIGURA 5: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 36 FIGURA 6: CURVA ASSIMTRICA ESQUERDA .......................................................................................................................... 36 FIGURA 7: CURVA ASSIMTRICA DIREITA .............................................................................................................................. 39 FIGURA 8: CURVA SIMTRICA ACHATADA (PLATOCURTICA) ..................................................................................................... 42 QUADRO 8: CLCULO DO DESVIO MDIO ................................................................................................................................ 44 QUADRO 9: CLCULO DO DESVIO MDIO PARA CLASSES ......................................................................................................... 45 QUADRO 10: CLCULO DA VARINCIA .................................................................................................................................... 45 QUADRO 11: CLCULO DA VARINCIA .................................................................................................................................... 46 FIGURA 9: DISTRIBUIO NORMAL .......................................................................................................................................... 51 FIGURA 10 - DISTRIBUIO LEPTOCRTICA E PLATICRTICA .................................................................................................... 51 FIGURA 11: % DE RESULTADOS 1 DP ACIMA E ABAIXO DA MDIA ............................................................................................. 54 FIGURA 12: POSIO DE UM RESULTADO .................................................................................................................................. 55 QUADRO 12: TABELA DE CONTINGNCIA (CROSSTAB)............................................................................................................. 65 QUADRO 13: ORDENAO DE UM GRUPO EM FUNO DO N. DE FACTORES DE RISCO ............................................................... 67 QUADRO 14: ORDENAO PARA AMOSTRAS RELACIONADAS OU EMPARELHADAS ................................................................... 69 QUADRO 15: RESULTADOS DO REGISTO DAS QUEIXAS .............................................................................................................. 71 QUADRO 16: TESTE MCNEMAR................................................................................................................................................ 75 QUADRO 17: TABELA DE QUATRO CASAS PARA A PROVA DE SIGNIFICNCIA DE MUDANAS ...................................................... 77 QUADRO 18: RESULTADOS DO TESTE DO VOCABULRIO ........................................................................................................... 79 QUADRO 19: NMERO DE IDEIAS RELEMBRADAS PARA TRS TIPOS DE TESTES .......................................................................... 83 QUADRO 20: Q DE COCHRAN .................................................................................................................................................. 89 QUADRO 21: Q DE COCHRAN .................................................................................................................................................. 90 QUADRO 22: AVALIAO DE TRS TIPOS DE ILUSTRAES ....................................................................................................... 93 QUADRO 23: COEFICIENTE DE CONTINGNCIA DE RHO DE SPEARMAN-RANK ......................................................................... 99 QUADRO 24: POSTOS ATRIBUDOS A 6 CANDIDATOS A EMPREGO POR 3 CHEFES DE PESSOAL.................................................... 100 FIGURA 13: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM ......................................................... 107 QUADRO 25: CORRELAO DE PEARSON ............................................................................................................................... 110 QUADRO 26: TESTE T NO RELACIONADO .............................................................................................................................. 114 QUADRO 27: TESTE T RELACIONADO ..................................................................................................................................... 117 QUADRO 28: DADOS DE 4 AMOSTRAS E RESPECTIVAS MDIAS ................................................................................................ 118
3 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

QUADRO 29: NOTAO PARA ANLISE DA VARINCIA ........................................................................................................... 119 QUADRO 30: RECIDIVAS POR TRATAMENTO ............................................................................................................................ 121 QUADRO 31: ANOVA .......................................................................................................................................................... 123 QUADRO 32: POST-HOC DAS RECIDIVAS ................................................................................................................................. 124 QUADRO 33: MDIAS POR TRATAMENTO ................................................................................................................................ 125 QUADRO 34: ANOVA .......................................................................................................................................................... 127 QUADRO 35: POST-HOC ......................................................................................................................................................... 128

4 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

I - INTRODUO
Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluo de problemas do presente assim como para a previso de acontecimentos futuros. No entanto, o sucesso quanto a este objectivo s foi possvel em data muito recente: s no final do sculo XIX e, sobretudo, no princpio do sculo XX que, com aaplicaodeprobabilidadesaos problemassobreainterpretaodosdadosrecolhidos,foipossvelresolveralgunsdeles. AEstatsticaconquistou,hoje,oseulugarentreascincias.Opoderdoseumtodo,sobretudo, afirmado nas ltimas dcadas e aplicase, agora, nos domnios mais variados. At aqui, s um pequeno nmero de pessoas se preocupou com estudos estatsticos, quer pela natureza das suas investigaes, quer por causa da sua utilidade para as diferentes profisses. O valor e a importnciadomtodoestatsticoresidemnoesforoparamelhorcompreenderonossomundo, to maravilhosamente complexo, tanto no ponto de vista fsico como social, levamnos a sonhar que ele se torne objecto de um conhecimento como as outrascincias.Avidacorrentelevanosa decisesparapassardoconhecidoaodesconhecido,daexperinciapreviso. Este curso tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e saber interpretar resultados que podem ser obtidos atravs de programas de computador.

5 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1. NOES GERAIS
Para algumas pessoas, a Estatstica no seno um quadro de colunas mais ou menos longas de nmeros que dizem respeito populao, indstria ou ao comrcio, como se v frequentemente em revistas; para outras, ela d grficos mostrando a variao no tempo de um facto econmico ou social, a produo ou os nmeros relativos aos negcios de uma empresa, assimcomoseencontranosescritriosdeempresasprivadas. To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os contenha a todos. Apesar disso, apresentamos a seguir uma definio que, emboranecessariamenteincompletacomoqualqueroutra,temavantagemdeintroduziroaluno namatria. AEstatsticatemcomofinalidadeelaborardeumasntesenumricaqueevidencieoquedemais generalizadoesignificativoexistanumconjuntonumerosodeobservaes. O grande nmero de observaes de que se parte reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade se possa comear a entender logo, tornase necessrio reduzir sucessivamente as observaes, ganhandose em generalidadeoquesevaiperdendoemindividualidade. A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe de mais geral no conjunto das observaes; medida que a sntese progride,vaiseperdendoocontactocomasparticularidadesimediatas. Deste modo, a Estatstica no se ocupa do que excepcional, mas apenas do que geral: no se interessa pelo indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio,masdeumconjuntodemedies. Acrescentese,ainda,queasntesenumrica.Queristodizerqueseprescindeinteiramentedas palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcanase a sntesepelorecursoexclusivodosnmeros.

6 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcanaasnteseordenandoosecooperandocomeles. Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligaoquesempreexistiuentreambos; O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo informaroestadosobrerecursoshumanoseeconmicos. No sc. XVII d.C., a disciplina de Estatstica era j leccionada nas universidades alems, continuandocomafinalidadededescreveraspopulaeseasriquezasdoEstado. Aindanosc.XVII,dseaexpansodosseuscamposdeinvestigaoareascomo: Sadepblica; Indstria; Comrcio; EstudosDemogrficos. Os mtodos de inferncia estatstica surgem com Jonh Graunt (16201674), um modesto comerciante,quetiraconclusesvlidassobreumapopulaodesconhecidaporele. Fermat (16011665) e Pascal (16231662) permitem que o estudo do acaso tome uma expresso matemtica,introduzindooClculodasProbabilidades. O Clculo das Probabilidades e o aparecimento do Mtodo dos mnimos quadrados, vm credibilizaraEstatsticaconferindolheafundamentaomatemticaemqueelaassentahoje. Nosc.XVIIILambertQuetelet(17961874)introduziuaEstatsticaemreascomo: Meteorologia; Antropometria; CinciasSociais; Economia; Biologia.

7 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

FrancisGalton(18221911),apresentanoesderegressoecorrelao; Karl Pearson (18571936) apresenta a mais bela e acabada teoria de Estatstica, ficando tambm conhecidopelosseuscoeficientes; Fisher e os seus trabalhos sobre inferncia Estatstica deram tambm um grande contributo ao desenvolvimentodaEstatstica. Em 1943, dse uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito manualmenteepassaasercomputadorizado. MtodoEstatstico: Tcnicausadaparaobter,analisareapresentardadosnumricos; Mtodocientficocujafinalidadeoestudodaspropriedadesnumricas dosconjuntosdosfactos. OMtodoEstatstico,segundoateoriadeCramer,pressupeasseguintesfases: Recolha de dados estatsticos: obteno da amostra a partir da populao, devendo depurar e rectificar os dados estatsticos, que no seu conjunto sodenominadossrieestatstica. Descrio:conjuntodeoperaes,numricasougrficas,efectuadassobre os dados estatsticos determinando a sua distribuio; procedese sua ordenao,codificaoerepresentaopormeiodequadrosetabelas. Anlise: consiste em tirar concluses sobre a distribuio da populao, determinar o seu grau de confiana e ainda formular hipteses, tentando verificlas,quantoaofenmenoemestudo. Predio: uma previso do comportamento do fenmeno em estudo, tendoemcontaadefiniodadistribuioestatstica.

8 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. POPULAO E AMOSTRA
Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que estosujeitosaumaanliseestatstica,portereminteresseparaoestudo. Quantosuaorigempodeser: Conjuntodepessoas; Conjuntodeobjectos; Conjuntodeacontecimentos.

Quantosuanaturezapodeser: Podeaindaser: Amostra: um subconjunto retirado da populao, que se supe ser representativo de todas as caractersticas da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas conclusesvlidassobreapopulao. Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal formaqueapopulaointeiranosinteressaestejarepresentada OPlanodeAmostragemserveparadescreveraestratgiaautilizarparaseleccionaraamostra. Este plano fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtododeamostragemparadeterminadoestudo. Conjuntofinito; Conjuntoinfinito. Existenteoureal; Hipotticaounototalmenteexistente;

9 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critriosdeselecodosseuselementos. Certoscritriosdizemrespeitoscaractersticasrequeridasparaqueumelementoousujeitofaa partedaamostra: Aamplitudedaidadedosparticipantes; Condiesdesadeprecisas. Igualmentecertoscritriosdefinemossujeitosquenofaropartedoestudo:

Populao

Populao-alvo Amostra

Figura 1: Populao e Amostra

Um investigador interessado pela readaptao aps cirurgia de revascularizao, pode concentrarse somente nos sujeitos que tiveram uma nica experincia deste tipo e exclurem os outros. Umaamostraditarepresentativaseassuascaractersticasseassemelhamomaispossvelsda populaoalvo. particularmente importante que a amostra represente no s as variveis em estudo, mas tambm outrosfactoressusceptveisdeexerceralgumainflunciasobreasvariveis estudadas,comoaidade,osexo,aescolaridade,orendimento,etc. ARepresentatividadeavaliasecomparandoasmdiasdaamostracomasdapopulaoalvo.

10 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Comoseignorasetodasascaractersticasdapopulaoestopresentesnumaamostradadoque estassomuitasvezesdesconhecidas,admitesequeexistesempreumgraudeerro. ERRODEAMOSTRAGEM:adiferenaqueexisteentreosresultadosobtidosnumaamostrae osqueteriamsidoobtidosnapopulaoalvo. Duassoluesexistemparareduziraomnimooerroamostral: 1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra. 2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticasconhecidasdesta.

3. MTODOS DE AMOSTRAGEM
3.1 AMOSTRAGENS PROBABILSTICAS E NOPROBABILSTICAS
3.1.1 As Amostras Probabilsticas
Os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na estimaodosparmetrosdapopulao,reduzindooerroamostral. A principal caracterstica dos mtodos de amostragem probabilstica reside no facto de que cada elemento da populao tem uma probabilidade conhecida e diferente de zero, de ser escolhida, aquandodatiragemaoacasoparafazerpartedaamostra. Oobjectivodestaabordagemobteramelhorrepresentatividadepossvel.

11 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.1.1.1 TIPOS DE AMOSTRAGENS PROBABILSTICAS


TiposdeAmostragem: a) AAmostragemAleatriaSimples; b) AAmostragemAleatriaEstratificada; c) AAmostragememCachos; d) AAmostragemSistemtica.

AMOSTRAGEM ALEATRIA SIMPLES

AAmostragemaleatriasimplesumatcnicasegundoaqualcadaumdoselementos(sujeitos) que compe a populao alvo tem igual probabilidade de ser escolhido para fazer parte de uma amostra. A amostragem aleatria simples consiste em elaborar uma lista numrica de elementos de onde se tira, com a ajuda de uma tabela de nmeros aleatrios, uma srie de nmeros para constituiraamostra.
AMOSTRAGEM ALEATRIA ESTRATIFICADA

A Amostragem aleatria estratificada uma variante da amostra aleatria simples. Esta tcnica consiste em dividir a populao alvo em subgrupos homogneos chamados estratos e a seguir tirar de forma aleatria uma amostra de cada estrato. A Amostragem aleatria estratificada utilizadaquandoapopulaointeirareconhecidaporcertascaractersticasprecisas,taiscomoa idade, o sexo, a incidncia de uma condio de sade, tudo isto para assegurar a melhor representatividadepossvel.

12 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA
P o p u la o - A lv o

2 0 0 0 e s tu d a n te s e m S o c ia is

C i n c ia s

C la s s ific a o

E s tr a t ific a o P r o p o r c io n a l
E s tra to 1 D o u to ra m e n to 400 = 20%
E s tra to 2 M e s tra d o 600 = 30%

E s tra to 3 L ic e n c ia tu r a 1000 = 50%

E s c o lh a A le a t r ia

E s tr a t ific a o N o - P r o p o r c io n a l A m o s tra = 2 0 0 E s c o lh a A le a t r ia d e 1 0 % e m c a d a E s tra to

4 0 E s tu d a n te s D o u to ra m e n to

6 0 E s tu d a n te s M e s tra d o

1 0 0 E s tu d a n te s L ic e n c ia t u r a

Figura 2: amostra estratificada

AMOSTRAGEM EM CACHOS

Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quando os elementos da populao esto naturalmente por cachos e por isso devem ser tratados comogruposouquandonopossvelobterumalistagemdetodososelementosdapopulao alvo.
AMOSTRAGEM SISTEMTICA

Consiste quando existe uma lista ordenada de elementos da populao. Esta tcnica consiste K elementosdessalistasendooprimeiroelementodaamostraretiradoaoacaso. Ointervaloentreoselementoscorresponderazoentreotamanhodapopulaoedaamostra. Exemplo: Se pretender uma amostra de 100 indivduos e a populao for de 1000 o sistema ser 1000:100=10 (dez em dez o sistema), isto , ser includo um elemento da lista de 10 em 10 indivduosapartirdo1.n.sorteado.

13 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Importante Se se utilizar uma amostragem por cachos ou outros tipos de agrupamentos, a amostra s considerada probabilstica se os grupos foram escolhidos ao acaso antes da repartio aleatria dossujeitosnosgrupos.

3.1.1.2 TIPOS DE AMOSTRAGENS NO PROBABILSTICAS:


um procedimento de seleco segundo o qual cada elemento da populao no tem a mesma probabilidadedeserescolhidoparaformaraamostra. Este tipo de amostragem tem o risco de sermenosrepresentativaqueaprobabilsticanoentanto muitas vezes o nico meio de construir amostras em certas disciplinas profissionais nomeadamentenareadasade. TiposdeAmostragensNoProbabilsticas: a) b) c) d) AAmostragemAcidentaloudeConvenincia; AAmostragemporCotas; AAmostragemdeSelecoRacionalouTipicidade; AAmostragemporRedesouBoladeNeve.

AMOSTRAGEM ACIDENTAL OU DE CONVENINCIA

formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momentopreciso. Exemplo: pessoas hospitalizadas. Um investigador pode ter acesso a uma unidade hospitalar paraconstituirumaamostradepacienteshospitalizados. Nestetipodeamostratemavantagemdesersimplesemorganizarepoucoonerosa,todaviaeste tipodeamostraprovocaenviesamentos,poisnadaindicaqueasprimeiras30a40pessoassejam

14 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

representativas da populaoalvo. So utilizadas em estudos que no tm como finalidade a generalizaodosresultados.


AMOSTRAGEM POR COTAS

Idntica amostragem aleatria estratificada diferindo desta apenas pelo facto dos sujeitos no seremescolhidosaleatoriamentenointeriordecadaestratooudecadagrupo.
AMOSTRAGEM POR SELECO RACIONAL OU POR TIPICIDADE

Tem por base o julgamento do investigador para constituir uma amostra de sujeitos em funo doseucarctertpico. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma instituio.
AMOSTRAGEM POR REDES OU BOLA DE NEVE

Consisteemescolhersujeitosqueseriamdifceisdeencontrardeoutraforma.Tomaseporbase, redessociaisamizadeseconhecimentos. Porexemplo:ImigrantesdeLeste. Quando o investigador encontra sujeitos que satisfazem os critrios escolhidos pedelhes que indiquemoutraspessoasdecaractersticassimilares.

15 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2 DETERMINAO DO TAMANHO DA AMOSTRA


Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para determinar as amostras existem vrias frmulas, consoante o parmetro em critrio. As mais utilizadasnasadesoasquesebaseiamnapercentagemdofenmeno:

3.2.1 Clculo do Tamanho da Amostra para Populaes Infinitas (>100.000 elementos)


Aamostradependeda: 1. Extensodouniverso; 2. DoNveldeConfiana; 3. DoErroMximopermitido; 4. Dapercentagemcomqueofenmenoseverifica.
n= 2 . (p.q) e2

F rm ula:

n=Tamanhodaamostra =Nveldeconfianaescolhidoexpressoemndesviospadro(s) p=%comoqualofenmenoseverifica q=%complementar(100p) e=Erromximopermitido

16 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Se desejarmos um nvel de confiana bastante alto superior a 99% aplicase a frmula dos trs desvios.

Figura 3: converso dos niveis de confiana em desvios padro

Logo,odesvio(s)2seriaiguala32=9 Seoerromximoforde2%oe2seriguala22=4 Exemplo:Seforpossveladmitirqueonmerodecaptaesdeguaemprofundidadesesituam porvoltados50%,noultrapassandoesta%,entop=50e,consequentemente,q=10050ouseja 50.Assim,temseaequao


n= 9 . (50.50) = 5625 4

Isto,paraatendersexignciasestabelecidas,on.decaptaesaanalisarseria5625. Setodavia,foraceiteonveldeconfianade95%(2desvios)eumerromximode5%on.de elementosserbemmenor. osclculos.


n=2 . (p.q) e2 n= 4 . (50.50) = 400 25

Convmlembrarquesemprequenosejapossvelestimarumapercentagemdofenmeno,deve utilizarsesemprep=50

17 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.2 Clculo do Tamanho da Amostra para Populaes Finitas (<100.000 elementos)


Aamostradependeda: 1. Extensodouniverso; 2. DoNveldeConfiana; 3. DoErroMximopermitido; 4. Dapercentagemcomqueofenmenoseverifica.

Frmula

Onde: n=Tamanhodaamostra =nveldeconfianaescolhido,expressoemnmerosdedesviospadro p=percentagemdofenmeno q=percentagemcomplementar N=tamanhodapopulao e2=erromximopermitido Exemplo:Verificarquantosdos100empregadosdeumacantinacumpremcorrectamenteas normasdehigieneeseguranadotrabalho. Presumesequeessen.nosejasuperiora30%dototal;desejaseumnveldeconfianade95% (2desvios)etoleraseumerroat3%. Ento,n=90,4Logodeveroserpesquisados90empregados. Confirmeaplicandoafrmula Mas,seapopulaofossede10.000empregados,comosmesmoscritriosanteriormente referidos,ento:

n= 4 . (30.70).10000 = 853
(9.9999)+4.(30.70)

18 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DETERMINAO DO TAMANHO DA AMOSTRA

Otamanhoptimodeumaamostra,nodependetantodotamanhodapopulaomassimde doisparmetrosestatsticos:amargemdeerroeonveldeconfiana MargemdeerroUmaamostrarepresentaaproximadamente(enuncaexactamente)uma populao.Amedidadesteaproximadamenteachamadamargemdeerro,elidoassim: seumapesquisatemumamargemdeerrode2%eaDoenaCardacateve25%deprevalncia naamostrarecolhida,podemosdizerque,naqueleinstante,napopulao,elateruma prevalnciaentre23%e27%(25%menos2%e25%mais2%). NveldeconfianaAspesquisassofeitascomumparmetrochamadonveldeconfiana, geralmentede95%.Estes95%queremdizeroseguinte:serealizarmosumaoutrapesquisa,com umaamostradomesmotamanho,nasmesmasdataselocaisecomomesmoinstrumentode recolhadedados,humaprobabilidadede95%dequeosresultadossejamosmesmos(euma probabilidadede5%,claro,dequetudodifira). Quandojseefectivouumapesquisaesedesejaconheceramargemdeerroutilizadaaplicase:

Frmula
Onde: n=Tamanhodaamostra

p =

(p.q) n

p=Erropadrooudesviodapercentagemcomqueseverificadeterminadofenmeno p=percentagemdofenmeno q=percentagemcomplementar

19 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.2.3 Determinao da Margem de Erro da Amostra


Exemplo:Numapesquisaefectuadacom1000adultos,verificouseque30%bebemcafpelo menosumavezpordia.Qualaprobabilidadedequetalresultadosejaverdadeiroparatodoo universo.

p =

(30.70) 1000 p = 1,45

Comoovalorencontrado(margemdeerro)correspondeaumdesvio,entoparadoisdesvios (95,5%),temos1,45*2=2,90. Para3desviosotriplo(4,35). Istosignificaque,porexemplo,paraumnveldeconfianade95%(2desvios)oresultadoda pesquisaapresentarcomomargemdeerro2,90paramaisoumenos. provvel,portanto,queon.deconsumidoresdecafestejaentre27,10%(30%2,90)e32,90% (30%+2,90).

3.2.4 Determinao da Amostra sem conhecer os limites da populao


Z 2 ( /2 ) p (1 -p ) d2

Frmula
Emque p=fenmeno] =erro

{SeIC(intervalodeconfiana)=95%,=5%(0,05)}Ento /2=0,05/2=0,025 Z(/2)=Z(0,025)=1,96 d=nmerodedesvios

20 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assimparaumfenmenoquetenhaumaprevalnciade25%,osresultadosseriam:

Emtermosestatsticosconsideramosqueumaamostra:Pequenasen<30
CUIDADOS
A TER NA ESCOLHA DA AMOSTRA:

1. Imparcialidade:todososelementosdevemteramesmaprobabilidadeeoportunidadede seremescolhidos; 2. Representatividade: deve conter em proporo todas as caractersticas que a populao possui,qualitativaequantitativamente,demodoaquenosetornetendenciosa; 3. Tamanho: suficientemente grande de modo a fornecer as principais caractersticas, por outroladopequenaparaeconomizartempo,dinheiroepessoal.

3.3 INDIVDUO OU UNIDADE ESTATSTICA


OestudoEstatsticorecaisobreaamostra,noentantoestefeitodemodopormenorizadoacada umdoselementosdaamostra,quesodesignadosporIndivduoouUnidadeEstatstica. Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua naturezatemquepossuirumadefinioprecisa. AsprincipaiscaractersticasdeumaboaunidadeEstatsticaso: 1. Propriedadeouadequaoaoobjectivodainvestigao; 2. Clareza; 3. Mensurabilidade; 4. Comparabilidade.

21 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

No estudo de cada unidade Estatstica, surgem resultados individuais com os quais so feitas as infernciassobreapopulao.EstesresultadostmonomedeDadoEstatstico. Dado Estatstico: o resultado do estudo efectuado a cada unidade Estatstica tendo em conta a sua individualidade, sendo este depois tratado de modo a permitir inferir sobre a colectividade queaintegra(populao).

3.4 VARIVEL ESTATSTICA


Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se tmemconta,umouvrios,sodenominadosporVarivelEstatstica. UmavarivelEstatsticapodeser: 1. Qualitativa:seasuanaturezaquevariadeelementoparaelemento. Asvariveisqualitativasdividem:seem: a. Variveisnominais:quandooseusignificadosseentendeemfunodonomee o nmero ou cdigo que se lhe atribua no nos d nenhuma informao (sexo, cordeolhos,graudeparentesco,tipodepatologia,presena/ausnciadefactores derisco,etc.). b. Variveis ordinais: quando existe uma ordenao possivel (gravidade de uma leso,classesocial,graudeescolaridade,etc.).

22 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2. Quantitativa: se a sua intensidade que varia de elemento para elemento, tornandoa mensurveloureferencivel. Asvariveisquantitativasdividemseem: a. Variveis discretas: assume valores isolados, normalmente inteiros (n. de filhos, n.defactoresderisco,n.dedependentes,n.derespostas,etc) b. Variveis contnuas: em que possvel qualquer operao aritmtica, podendo assumirqualquervalorreal(altura,peso,IMC,distncia,etc). Tendo em conta o nmero de atributos (caractersticas) que esto a ser estudadas, as variveis podemser: 1. Unidimensionais:seapenascorrespondeaumatributo 2. Bidimensionais:secorrespondeadoisatributos; 3. Pluridimensionais:secorrespondeavriosatributos.

Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de resposta,podendoelasserduasoumais. Asmodalidadestmobrigatoriamentequeser: 1. Incompatveis: cada unidade Estatstica no pode pertencer simultaneamente a duasoumaismodalidades; 2. Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa modalidade. A escolha das modalidades deve ser feita de acordo com as informaes possudas. No entanto, surgemsituaesemquehnecessidadedeseaumentarumamodalidadesuplementar.

23 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.5 ESTATSTICA DESCRITIVA E ESTATSTICA INDUTIVA


A Estatstica Descritiva recolhe, organiza e analisa os dados de uma amostra, sem tirar qualquer conclusosobreumgrupomaior. A Estatstica Indutiva recolhe, organiza, analisa e estabelece relaes entre os dados para fazer infernciassobreapopulao.Combasenosresultadosobtidossobreaamostrapodemosinferir concluses vlidas sobre a populao (este ramo da Estatstica j exige a utilizao de recursos matemticosespeciais,nomeadamenteaTeoriadasProbabilidades). Assim, a Estatstica Indutiva permitenos fazer inferncias sobre a populao e chegar a leis e a teorias.

3.6 PARMETRO E DADO ESTATSTICO


Oparmetrotodaafunodefinidaapartirdosdadosnumricosdeumapopulao. Exemplo:consideremosasseguintesnotasemEstatstica101110159
Mdia =xi/n = 55/5 = 11

Ovalor11oparmetro(resultadodamdiaaritmtica).

Odadoestatsticotodaafunodefinidaapartirdosdadosnumricosdeumaamostra. Exemplo:consideremosaamostra:1010
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico

24 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.7 REPRESENTAO DE UMA VARIVEL ESTATSTICA


Depoisdetermosdefinidoalgumasnoesbsicasdeestatstica,tratarse,aseguir,dasegunda fase de um estudo estatstico. Como j referimos, os dados numricos recolhidos registamse em sries estatsticas e, para serem analisados, devem ser ordenados e representados em quadros e emgrficos. Quando trabalhamos com uma varivel discreta ou descontnua falamos em seriao e quando trabalhamoscomumavarivelcontnuafalamosemclassificao.
SERIAO DE UMA AMOSTRA

Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo: nmerodefilhosdeumcasal,nmerodedivisesdeumacasa,etc.). Oquadrogeraldeumaseriaoestexpressonoquadroquesesegue.
Quadro 1: Quadro Geral de Seriao

Varivel X1 X2 X3 Xi Xk

Frequncias absolutas n1 n2 n3 ni nk

Frequncias acumuladas n1 n1+ n2 n1+ n2+ n3 n1+ n2+ +ni n1+ n2+ +nk

Frequncias relativas n1 N n2 N n3 N ni N nk N 1

Frequncias relativas acumuladas n1 N n1+n2 N n1+ n2+n3 N n1+ n2++ ni N 1

Total N Legenda: Distribuio de frequncias de uma varivel discreta

Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna podesertambmdenominadaporxi. Na segunda coluna apresentamosasfrequnciasabsolutassimplesouefectivas,isto,onmero de vezes que cada valor foi observado ou o nmero de vezes que cada valor surge na amostra.
25 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Esta coluna pode tambm ser denominada por ni. Devemos lembrar aqui que o nmero total de indivduos pertencentes populao/ou amostra chamase efectivo total e designase por n, devendosempreverificarsequeni=n. Naterceiracolunapodemosvisualizarasfrequnciasacumuladas,isto,asomadasfrequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(xi).Assim,
N(xi) = ni xi<x

Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm denominada por fi, em que fi = ni/n e, de tal modo que, fi = 1; a frequncia relativa expressa, emgeral,empercentagem. Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por F(xi); a frequncia relativa acumulada expressa, em geral, em percentagem. Exemplo:ConstruaoquadrodefrequnciasparaavarivelXquetomaosseguintesvalores:
xi 14 14 13 12 11 12 10 13 12

Quadro 2: Quadro de Frequncias

xi 10 11 12 13 14 ni = 9

ni 1 1 3 2 2

fi=ni/n 1/9 1/9 3/9 2/9 2/9

N(xi) 1 2 5 7 9

F(xi) 1/9 2/9 5/9 7/9 9/9

fi = 1

em que n = 9

26 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CLASSIFICAO DE UMA AMOSTRA

Como j referimos anteriormente, uma classificao implica que a varivel seja contnua (exemplo:atemperaturadeumcorpo,aalturadeumapessoa,aduraodecertofenmeno,etc. variveisrelacionadascomoespao,otempoouamassa).
Quadro 3: Quadro de Frequncias

Frequncias Marcas da Classes classe absolutas acumuladas relativas acumuladas n1 c0-c1 c1-c2 c2-c3 ci-1-ci ci-1-ck Total X1 X2 X3 Xi Xk _ n1 n2 n3 ni nk n1 N n2 n1+ n2 N n3 n1+ n2+ n3 N n1+ n2+ +ni N n1+ n2+ +nk N 1 nk 1 N ni N n1+ n2++ ni N n1+ n2+n3 N n1+n2 n1 Frequncias Frequncias Frequncias relativas

Legenda: Distribuio de frequncias de uma varivel contnua

Na primeira coluna temos as classes. Por conveno, as classes so abertas superiormente, com excepodaltimaclasse,naturalmente. Nasegundacolunatemosasmarcasdaclasse.Estacolunapodesertambmdesignadaporxi.A marca de uma classe o ponto mdio dessa classe, ou seja, o ponto equidistante dos extremos deumaclasse. Exemplo:classec0c1 x1=(c0+c1)/2

Naterceiracolunaapresentamosasfrequnciasabsolutassimplesouefectivas,ouseja,onmero de vezes que os valores de determinada classe foram observados. Esta coluna pode ser tambm denominada por ni. Mais uma vez, ni = n (nmero total de indivduos pertencentes populao/ouamostra,aquesechamaefectivototal). Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias absolutas correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambmdenominadaporN(i).
27 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm denominadaporfi,emquefi=ni/ne,detalmodo,quefi=1. Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das frequncias relativas correspondentes a valores inferiores a um determinado valor. Esta coluna podesertambmdenominadaporF(i). Numa classificao habitualrepresentarmosporKonmerodeclasses(emgeralKvariaentre 5e20,inclusive)eporAaamplitude(emqueA=xmximoxmnimo). Ento,
- Se K dado = A/K - Se dado K=A/ , sendo a amplitude do intervalo de classe e A a amplitude do intervalo da amostra

Exemplo:Construaoquadrodefrequnciascomosseguintesdados:
Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38] ni 2 5 7 10 4 2
Quadro 4: Quadro de Frequncias

Classes [20-22] [23-25] [26-28] [29-31] [32-34] [35-38]

ni 2 5 7 10 4 2

fi 2/30 5/30 7/30 10/30 4/30 2/30

N(i) 2 7 14 24 28 30

F(i) 2/30 7/30 14/30 24/30 28/30 30/30

x'i 21 24 27 30 33 36

ni

= 30

fi

= 1em que n = 30 e = 3

28 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8 REDUO DE UMA VARIVEL ESTATSTICA



CONCEITO DE REDUO E SUA CONVENINCIA

Anteriormente definimos o conceito de varivel estatstica e construramse quadros e grficos estatsticos com vista a uma descrio numrica e grfica de uma varivel estatstica. Naturalmente, os grficos permitem uma primeira sntese das informaes registadas nos quadros. Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de duasoumaisvariveis,podemosfazerumaprimeiracomparaoentreelas. H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel estatstica, resumindose os dados a um pequeno nmero de elementos que bastam para caracterizla. Tal sntese consiste na reduo de dados e os elementos numricos obtidos designamseporparmetrosdavarivelestatstica. Feita a representao dos dados estatsticos por meio de quadros e/ou de grficos, importa fazer sobreosmesmosumestudonosentidodesepoderchegaraconcluses. Para tal, impese um trabalho de simplificao que consiste em proceder a snteses, em reduzir grandes quantidades de dados a nmeros simples que permitam uma anlise rpida e uma fcil comparaocomoutrassriesdamesmanaturezaoudenaturezadiferente. Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so agrupadosemcategoriasconformeotipodeinformaoquefornecem.

29 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO

Sobestadesignaoagrupamseosparmetrosque,ounosindicamalgodeassocivelaoncleo ou centro da distribuio, ou nos permitem compartimentla. Vamos considerar as seguintes medidasdetendnciacentraloudeposio:mdia,mediana,modaequantis.

3.8.1 Mdia
MDIA ARITMTICA

A mdia aritmtica o ponto de equilbrio dos dados, isto , tendo um conjunto de n valores x1, x2,...,xndeumavarivelXoquocienteentreasomadessesvaloreseonmerodeles. Amdiaaritmticapodeserrepresentadapelaseguintefrmulamatemtica:
x = xi / n

Numa amostra seriada os valores x1, x2, ..., xk ocorrem n1, n2, ..., nk vezes, respectivamente, a mdiaaritmticaser
x = nixi / n = fixi

Exemplo:Calculeamdiaaritmtica,sabendoque xi ni 4 2 6 4 7 5 8 3 10 2

Quadro 5: Quadro do clculo da mdia

xi 4 6 7 8 10

ni 2 4 5 3 2

nixi 8 24 35 24 20

=16 Ento,

=111

x = nixi / n = 111/16= 6,94


30 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Numa amostra classificada a frmula definidora da mdia no se pode aplicar directamente porque no conhecemos os valores exactos da varivel estatstica, mas apenas o nmero de observaes dentro de cada classe, isto , quando os dados esto agrupados em classes, para o clculo da mdia simples, devemos considerar o ponto mdio de cada classe (marca) como representativo de todos os valores nela includos, pelo que aquela pode ser representada pela frmulamatemticaseguinte:
x = nix'i / n = fix'i

Exemplo:Calculeamdiaaritmtica,sabendoque
Classes ni [3-5[ 2 [5-7[ 4 [7-9[ [9-11[ [11-13] 5 3 2

Quadro 6: Quadro do clculo da mdia

Classes [3-5[ [5-7[ [7-9[ [9-11[ [11-13]

ni 2 4 5 3 2

x'i 3,5 5,5 7,5 9,5 12

nix'i 7 22 37,5 28,5 24

=16

=119

Ento: x = nix'i / n = 119/16 = 7,43

Temos de salientar que quando usamos a marca da classe estamos a colocar um certo erro de agrupamento,peloquedevemosconsideraraCorrecodeSheppard,detalmodoque:
x semelhante a x

Relativamentespropriedadesdamdiaaritmticapodemosenunciarduas: Somandoousubtraindoumaconstanteatodososvaloresobservados,amdiaresultante ficaraumentadaoudiminuda,respectivamente,dessaconstante; Multiplicandooudividindoosvaloresobservadosporumaconstantediferentedezero,a mdiaresultanteficarmultiplicadaoudividida,respectivamente,poressaconstante.

31 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MDIA ARITMTICA PESADA OU PONDERADA:

Por sua vez associase a x1, x2, ..., xk certos factores de ponderao ou pesos p1, p2, ..., pk que dependemdosignificadoouimportnciaatribudasobservaes.Assim,afrmulamatemtica damdiaser:
x p = pixi / pi

Exemplo 9: Um professor de matemtica quer saber a mdia poderada das suas avaliaes nas quatro turmas em que lecciona, sabendo que o teste tinha uma ponderao de 30% e o trabalho umaponderaode70%: TurmaAMdiadanotadoteste=65% TurmaBMdiadanotadoteste=60% TurmaCMdiadanotadoteste=40% TurmaDMdiadanotadoteste=80% Determineamdiaponderadadasquatroturmasemconjunto.
xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) +

Mdiadanotadotrabalho=78% Mdiadanotadotrabalho=70% Mdiadanotadotrabalho=28% Mdiadanotadotrabalho=75%

((40*30)/100) + ((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Sepreferirmosemquadroaresoluoser
Quadro 7: Clculo da mdia ponderada

xi 65 60 40 80 78 70 28 75

pi 30 30 30 30 70 70 70 70 400

pixi 1950 1800 1200 2400 5460 4900 1960 5250 24920

x p = pixi / pi=24920/400=62,3

32 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia geomtrica, a mdia harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos fazerqualquerreferncia).

3.8.2 Mediana
A mediana de uma srie de n observaes x1, x2, ..., xn de uma varivel X o valor que ocupa a posio central quando as observaes estoordenadasporordemcrescenteoudecrescente,isto , a mediana de uma varivel estatstica o valor dessa varivel tal que a frequncia dos valores que lhe so inferiores a mesma que a frequncia dos valores que lhe so superiores. Representase,habitualmente,porMd. Amedianausadaquandonaamostrahvaloresexcntricosemrelaoaoutrosvalores. Paraoclculodamediana,temosdeconsiderarduassituaes:ocasoemqueNmpareocaso emqueNpar.
N
MPAR:

Amedianaumvalorobservado,detalmodoqueolugarqueocupadadopelafrmula
Md = (N +1) / 2

Exemplo:Determineamedianaparaaseguintesriededados:
5 9 8 7 6

Ordenandoporordemcrescente,vem56789 ComoNmpar,ento Md=(N+1)/2=(5+1)/2=6/2=3

Seamedianaocupaaterceiraposioouterceirotermo,oseuvalor7

33 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PAR:

A mediana no coincide com nenhum valor observado ficando compreendida entre dois valores centrais classe mediana; convencionouse tomar para mediana a mdia destes dois valores. A posioqueamedianaocupadadapelafrmula
Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1

Exemplo:Determineamedianaparaaseguintesriededados
5 6 12 9 8 7

Ordenandoporordemcrescente,vem5678912 ComoNpar,ento N/2=6/2=3;(N/2+1)=3+1=4 Assim, a classe mediana ocupada pelas posies 3 e 4, ou seja, pelos valores 7 e 8, pelo que a Md=(7+8)/2=15/2=7,5

3.8.3 Moda
A moda (ou valor modal) de uma srie de n valores x1, x2, ..., xn de uma varivel X o valor ondeafrequnciaatingeomximo(relativo).Representase,habitualmente,porMo.
AMOSTRA SERIADA:

A moda o valor da varivel com maior efectivo, isto , se uma varivel discreta, a(s) moda(s) (so)o(s)valor(es)davarivelestatsticaqueseobserva(m)commaiorfrequncia. Exemplo:Determineamodaparaaseguintesriedevalores xi ni 4 1 6 3 8 5 10 4 2 2

Amoda8.

34 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMOSTRA CLASSIFICADA:

Neste caso falamos em classe modal, tomandose para moda a marca da classe. Assim, a moda de uma varivel contnua X todo o valor de X para o qual a funo de frequncia (absoluta ou relativa)atingeummximolocal. Exemplo:Determineamodaparaaseguintesriedevalores
classes [2-4[ ni [4-6[ 1 [6-8[ 7 [8-10[ 4 [10-12] 10 2

Aclassemodal[810[,peloqueamoda=(8+10)/2=18/2=9

RELAO EMPRICA ENTRE A MDIA, A MEDIANA E A MODA

Pearson chegou concluso de que para as distribuies unimodais e moderadamente assimtricas,vigoraaseguinterelaoemprica: MdiaModa=3(MdiaMediana)

Vejamos,agora,arelaoexistenteentreestastrsmedidasnocasodasfigurasqueseseguem

Figura 4: Curva simtrica

35 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 5: Curva assimtrica direita

Mdia > Moda Mdia > Mediana Mediana > Moda

Figura 6: Curva assimtrica esquerda

Moda > Mediana Moda > Mdia Mediana > Mdia


A UTILIZAO DA MDIA ARITMTICA, DA MEDIANA E DA MODA
MDIA ARITMTICA:

A medida de tendncia central mais usada a mdia aritmtica, que apresenta em relao medianaemodavantagensapreciveis,taiscomo: facilmentecalculvel; aquemelhorseprestaaulterioresanlisesestatsticas; Dependedetodososvaloresdasrie; uma medida de tendncia central particularmente estvel, variando o menos possvel deamostraparaamostraextradasdamesmapopulao; Existem, todavia, casos em que a informao fornecida pela mediana ou pela moda, parece ser maiscompletadoqueafornecidapelamdiaaritmtica,comopassamosaindicar. Podesertratadaalgebricamente.

36 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

MEDIANA:

Estamedidadetendnciacentraldeverutilizarsequando: Sedesejaconheceropontomdioexactodadistribuio; Existemresultadosextremosqueafectariamgrandementeamdia.Importasalientarque a mediana no influenciada pelos resultados extremos exemplo: na srie 10,13,15,16,18,19,21,tantoamdiacomoamedianaso16;sesubstituirmos21por50eos restantesresultadospermaneceremosmesmos,amediana16eamdiaserde20,1; A distribuio truncada, isto , incompleta nas extremidades exemplo: desejamos medir os tempos de reaco em Psicologia e as vrias respostas ultrapassam as capacidades de medida do aparelho; vemonos, assim, impossibilitados de calcular a mdia, j que no dispomos de todos os valores da varivel, sendo, no entanto, possvel calcularovalordamediana,jqueconhecemosonmerodemedidasefectuadas.
MODA:

Estamedidadetendnciacentraldeverutilizarsequando: Umamedidarpidaeaproximadadatendnciacentralforsuficiente; Se deseja conhecer o valor mais tpico de uma distribuio exemplos: descrever o estilo devestidousadopelamulhermdia,salriopreponderanteemdeterminadaempresa.

de salientar que, apesar das vantagens apresentadas para a moda, esta tem a desvantagem de serdedeterminaoimprecisa,nocasodasvariveiscontnuas.

37 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.4 Quantis
Chamasequantildeordempcom0p1erepresentase,habitualmente,porCpaovalordex talqueF(x)=p. Algunsquantistmdenominaesespeciais:
QUARTIS:

Osquartisdividemasrieordenadaem4partesiguais,contendocadaumadelas1/4ou25%das observaes. Q1=1quartil(correspondeaoquantildeordemp=1/4) Q2=2quartil(correspondeaoquantildeordemp=1/2) Q3=3quartil(correspondeaoquantildeordemp=3/4) Assim, Q1 o valor da varivel estatstica que deixa atrs de si 25% das observaes; Q2 o valor da varivel estatstica que deixa atrs de si 50% das observaes e Q3 o valor da varivel estatstica que deixa atrs de si 75% das observaes. A (Q1 Q3) chamase intervalo interquartil eointervaloaoqualpertencem50%dasobservaes,deixando25%paraadireitae25%paraa esquerda. de notar que dizer que os quartis dividem a srie em 4 partes iguais no significa que, por exemplo, os intervalos (Q1, Q2) e (Q2, Q3) tm a mesma amplitude, mas sim que contm o mesmonmerodeobservaes.
DECIS:

Os decis dividem a srie ordenada em 10 partes iguais, contendo cada uma delas 1/10 ou 10% dasobservaes. D1=1decil(correspondeaoquantildeordemp=1/10) D2=2decil(correspondeaoquantildeordemp=2/10)
38 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CENTIS:

Os centis dividem a srie ordenada em 100 partes iguais, contendo cada uma delas 1/100 ou 1% dasobservaes. C1=1centil(correspondeaoquantildeordemp=1/100) C2=2centil(correspondeaoquantildeordemp=2/100)
RELAES ENTRE QUARTIS, DECIS, CENTIS E MEDIANA:

Comopodemosobservarnafigura18 Q1=C25 Q2=Md=D5=C50 Q3=C75 D1=C10 D2=C20

Figura 7: Curva assimtrica direita

39 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.8.5 Medidas de disperso


Uma medida de tendncia central no nos d, s por si, uma informao exaustiva da distribuio considerada; pelo contrrio, a capacidade que se lhe atribui de representar os elementos de uma distribuio depende do modo como estes se concentram ou dispersam em torno dela. Assim, podemos dizer que os parmetros de tendncia central no so suficientes para caracterizar uma srie estatstica, apesar de a mediana e os quantis darem j uma ideia sumriadomodocomoestodistribudasasobservaes. Consideremososeguinteexemplo:Doisgruposdealunoscomasseguintesclassificaes A B 2 8 3 9 10 10 16 11 19 12

A mdia e a mediana 10 e, contudo, estas distribuies so muito diferentes. Com efeito, enquanto no grupo A as notas apresentam desvios muito grandes, na distribuio B todos os valoresseaproximamde10.Adispersoouvariabilidadedaprimeirasriemaisacentuadado quenasegunda. Quer dizer: distribuies com a mesma tendncia central podem apresentar aspectos bastante diferentesnoqueconcernedispersoouvariabilidade,emedidaqueestadispersoaumenta, menossignificativasdadistribuiovosendoasmedidasdetendnciacentral. Assim,paramelhorcaracterizarmosumadistribuio,temosdeconsiderar,almdasmedidasde tendncia central, uma outra medida que exprima o grau de disperso ou variabilidade dos dados. Vamos considerar as seguintes medidas de disperso: amplitude total, amplitude interquartis, desviomdio,varincia,desviopadroecoeficientededispersooudevariao.
AMPLITUDE TOTAL

A amplitude total a diferena entre o maior valor e o menor valor, isto , a amplitude total de uma varivel estatstica a diferena entre o valor mximo e o valor mnimo dos valores

40 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

observados. a forma mais simples de avaliar a disperso dos dados, de tal modo que quanto maiorforaamplitudetotalmaioradispersodosdados. A amplitude total pode ser tambm denominada de intervalo total ou campo de variao; representase,habitualmente,porAeapenasusavaloresextremos. Numaamostraseriada: A=xmximoxmnimo Numaamostraclassificada: A=extremosuperiordaltimaclasseextremoinferiordaprimeiraclasse Se alguma destas classes for de amplitude indeterminada no possvel definir o intervalo de variao. Aamplitudetotalapresentaasseguintesdesvantagens: Embora seja fcil de calcular, a amplitude total depende somente dos valores extremos, que so, geralmente, os menos frequentes e os menos significativos de uma distribuio, desprezandose os valores intermdios que so os mais frequentes. Alm disso, os valores extremos so vulgarmente anmalos e muito variveis, consoante a amostra que se retire de uma populao, de tal modo que duas distribuies podem ter a mesma amplitude total, mas disperses muito diferentes. Outro inconveniente da amplitude total consequncia de no tomar em considerao as frequnciasdasobservaes. Exemplo:CalculeaamplitudetotaldogrupoG,sabendoque:
G= 2 3 10 16 19

A = xmximo - xmnimo = 19-2 = 17

41 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

AMPLITUDE INTERQUARTIS

Os quartis fornecem indicao quanto forma como as observaes se distribuem em torno da mediana. Como o 1 e o 3 quartis representam valores abaixo dos quais esto, grosso modo, respectivamente, 25% e 75% das observaes, entre eles existiro, assim, 50% das observaes centrais. Consequentemente, quanto mais aproximados estiverem estes quartis, maior ser a concentraodasobservaesemtornodamediana. A amplitude interquartis pode ser definida como a diferena entre o Quartil 3 e o Quartil 1. Esta medida de disperso pode ser tambm denominada de intervalo interquartis ou intervalo quartlico. Como podemos observar na figura 8, quanto mais achatada a curva, maior a amplitude e quantomaioraamplitudeinterquartlicamaisdispersaadistribuio.

Q1

Md

Q3

Figura 8: Curva simtrica achatada (platocurtica)

Exemplo:Calculeaamplitudeinterquartis,sabendoqueQ3=177,46eQ1=166,88. Q=Q3Q1=177,46166,88=10,58 Podemostambmcalcularaamplitudesemiinterquatisouintervalointerquartlicoouintervalo semiquartil ou desvio quartlico ou amplitude semiinterquartlico, que se representa, habitualmente,porQepodeserdefinidadoseguintemodo:
Q = (Q3-Q1) / 2

Adistribuiotantomaisdispersaquantomaiorforaamplitudeinterquartis. Podemos enumerar as vantagens e as desvantagens do uso da amplitude interquartis e da amplitudesemiinterquartis:


42 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Estas medidas so mais completas do que a amplitude total, porque usam dois valores menos extremos (Q1 e Q3).Noentanto,tmaindaalimitaodenoentrarememlinhadecontacoma disposio das frequncias nos intervalos definidos pelos valores separados exemplo: a amplitude interquartis ser a mesma, quer as 50% das observaes se acumulem num s ponto, querestejamuniformementedistribudasporesseintervalointerquartis. As medidas de disperso que passaremos a descrever no tm esta limitao, porquanto o seu clculodependedetodososvaloresdasrie.
DESVIO

Dados n valores x1, x2, ..., xn de uma varivel X, chamase desvio de cada valor xi em relao constantec,adiferenadexiparac,isto,
xi - c

NotesequeosdesviosdavarivelXemrelaoac,isto,(x1c),(x2c),...,(xnc)constituemosn valoresdavarivelXc.
DESVIO MDIO

Falamos em desvio mdio quando consideramos os desvios de cada valor xi em relao mdia aritmtica,isto:
xi-x

O simples total destes desvios no pode ser utilizado como medida de disperso, por ser identicamentenulo.Defacto,paranvaloressingulares,terse:
(xi-x)=0

No entanto, o quociente entre a soma dos mdulos destes desvios e o nmero deles, j pode ser consideradocomomedidadedisperso
D.M.= |xi-x | / n

43 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo20:CalculeodesviomdioparaA=453
Quadro 8: Clculo do Desvio Mdio

xi 4 5 3

xi-x 4-4=0 5-4=1 3-4=-1 3-4=-1

|xi-x | 0 1 1

=12
x = xi / n =12/3=4 D.M.= |xi-x| / n = 2/3=0,67

= 2

Observao: tambm se utiliza o desvio mdio em relao a qualquer outra medida de posio central. Numaamostraseriadatemos:
D.M.= ni |xi-x| / n = fi |xi-x|

Se os valores da varivel estiverem tabelados de modo que cada valor xi corresponda a frequnciaabsolutani,odesviomdioigualsomadosprodutosdasfrequnciaspelosvalores absolutosdosrespectivosdesviosemrelaomdia,divididapeloefectivodadistribuio. Numa amostra classificada, os desvios em relao mdia aritmtica so calculados a partir dos pontosmdiosdecadaclasse,ouseja:
D.M.= ni |x'i-x'| / n = fi |x'i-x'|

44 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Calcule o desvio mdio para

classes ni

[4-6[ 1

[6-8] 2

Quadro 9: Clculo do Desvio Mdio para classes

Classes

ni 1 2

xi 4,5 7

xi-x 4,5-6,2 7-6,2

|xi-x| 1,7 0,8

ni|xi-x| 1,7 1,6

[4-6[ [6-8]

=2,4 x' = nix'i / n = [(1x4,5) + (2x7)] / 3 = 6,2

=3,3

Ento,odesviomdio
D.M.= ni |x'i-x'| / n = 3,3 /3 = 1,1

Odesviomdioapresentaaseguintedesvantagem: Embora dependa de todos os valores observados, o desvio mdio tem a desvantagem de considerarosvaloresabsolutosdosdesvios,oqueimpedeoseutratamentoalgbrico.
VARINCIA

Outramaneiradeeliminarmosossinaisdosdesvios,consisteemelevlosaoquadrado.Porisso, em vez da mdia dos valores absolutos dos desvios considerase a mdia dos quadrados dos desvios.Obtmse,assim,umaoutramedidadedispersobastanteusadaavarincia. Dados n valores x1, x2, ..., xn de uma varivel X, chamase varincia e representase, habitualmente, por s2 ou s2x a mdia aritmtica dos quadrados dos desvios em relao mdia dessasvalores,isto:
S2 = (xi-x)2 / n Exemplo 22: Calcule a varincia para X=17,18,19,20,21 Resoluo 22: x = xi / n = (17+18+19+20+21) / 5 = 19 Ento,avarincia:
Quadro 10: Clculo da Varincia

xi 17 18 19 20 21 N=5

(xi-x) 17-19=-2 18-19=-1 19-19=0 20-19=1 21-19=2

(xi-x)2 4 1 0 1 4 =10

S2 = (xi-x)2/ n = 10/5 = 2
45 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Sex1,x2,...,xnocorremn1,n2,...,nkvezes,respectivamente,temos Paraumaamostraseriada:
S2 = ni (xi-x)2 / n = fi (xi-x)2

Paraumaamostraclassificada:
S'2 = ni (x'i-x ')2 / n = fi (x'i-x ')2

Exemplo23:Calculeavarinciaparaadistribuiocujamdia103
Classes [85-90[ [90-95[ [95-100[ [100-105[ [105-110[ [110-115[ [115-120] ni 12 25 38 85 93 16 9
Quadro 11: Clculo da Varincia

Classes 85-90 90-95 95-100 100-105 105-110 110-115 115-120

ni 12 25 38 85 93 16 9 278

xi 87 92 97 102 107 112 117,5

(nixi) 1044 2300 3686 8670 9951 1792 1057,5 28500,5

(xi-x) -15,5 -10,5 -5,5 -0,5 4,5 9,5 15

(xi-x)2 240,25 110,25 30,25 0,25 20,25 90,25 225

ni(xi-x)2 2883 2756,25 1149,5 21,25 1883,25 1444 2025 12162,25

x = (nixi) / n =28500,5/278 =102,5

Ento,avarincia
S'2 = ni (x'i-x)2/ n = 12162,25/ 278 = 43,7491

Podemos,agora,enumeraraspropriedadesdavarincia: Somando ou subtraindo uma constante a todos os valores observados, a varincia resultantepermanecerinalterada;

46 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Multiplicando ou dividindo todos os valores observados por uma constante diferente de zero, a varincia resultante vir multiplicada ou dividida, respectivamente, pelo quadradodessaconstante.

CORRECODESHEPPARD: Ao calcularseamdiaeavarinciadaamostraclassificadaatravsdadistribuioempricadas marcas, cometese um certo erro (erro de agrupamento), pois supomos que as observaes agrupadas em cada classe tm todas o valor da respectiva marca. Todavia, existem frmulas correctivas devidas a Sheppard, isto ,na variancia, ao valor calculado deve subtrairse 1/12 ao quadradodaamplitudedasclasses(a)
s2x = s2x' - a2/12 assim,nonossoexemploanterior,avarianciacorrigida

era
s2x =43,7491 - 52 12 s2x =41.666

DESVIOPADRO O desvio padro pode ser definido como a raiz quadrada da varincia, representandose, habitualmente,porsx,isto:
sx = s 2x

Ainda que a varincia nos d uma boa informao sobre a distribuio ou variabilidade dos valores observados em relao sua mdia, apresenta, no entanto, a desvantagem de no se exprimir na mesma unidade a que esto referidos os dados iniciais. Contudo, esta desvantagem poder ser eliminada se extrairmos a raiz quadrada da varincia. A nova medida chamase desviopadrooudesvioquadrtico. Numaamostraseriada,temos:

sx =

s 2x

47 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calculeodesviopadro,sabendoqueavarinciadeumaamostraseriada2.
sx = s2x = 2 = 1,414

Numaamostraclassificada,temos:
sx = s2x

Exemplo: Calcule o desvio padro, sabendo que a varincia corrigida de uma amostra classificada4327,16.

sx =

s2x

=4327,16 = 65,78

AUTILIZAODASMEDIDASABSOLUTASDEDISPERSO Amplitudetotal Utilizasequando: Os dados forem muito raros ou demasiado dispersos para se justificar o clculo de uma medidamaisprecisadedisperso; Amplitudeinterquartlica Utilizasequando: Amedianaamedidadetendnciacentralusada; Existirem resultados extremos que poderiam afectar o desvio padro de uma maneira desproporcionada; Adistribuiotruncada; Adistribuioapresentaumaforteassimetria.
48 Margarida Pocinho e Joo Paulo de Figueiredo

Forapenasnecessriooconhecimentodosresultadosextremos; Desejamosumndicemuitorpidodedisperso.

ESTATSTICAEBIOESTATSTICA

Desviomdio Utilizasequando: DesviopadroeVarincia Utilizamsequando: Seprocuraumamedidadedispersoemrelaocomacurvanormal; Tiveremdesercalculadosposteriormentecoeficientesdecorrelaoeoutrasestatsticas; Sedesejarobterumamedidaqueserevistadeummximodeestabilidade; Sesetratasomentededescreverumadistribuioprefereseodesviopadrovarincia. Avarinciaintervmsobretudonaanliseestatstica. Desejamosponderartodososdesviosemrelaomdiadeacordocomasuagrandeza; Osdesviosextremosinfluenciaremindeterminadamenteodesviopadro.

3.8.6 Coeficiente de disperso


As medidas de disperso a que anteriormente nos referimos so medidas que se exprimem na mesma unidade dos dados e, sendo assim, tornase impossvel comparar entre si as disperses deduasdistribuiescujosvaloresnoserefirammesmaunidade. Exemplo: DistribuioA: xA=30 DistribuioB:xB=600 sA=10 sB=20

49 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Qual a distribuio mais dispersa? Se compararmos os desvios padres a B, porque tem maiordesviopadro.Masavariaode20para600muitomaiordoque10para30.Assim,em vez de compararmos os desvios padres, aplicamos outra medida de disperso relativa que o coeficientedevariaooudedisperso,quepodeserdefinidopelafrmula
V = sx /x

Exemplo 26: A distribuio dos pesos e das alturas de um grupo de estudantes de determinada Universidadeconduziuaosseguintesresultados: Determineocoeficientededispersoparacadaumadasdistribuiese,depois,indiqueemqual delasadispersorelativamaior. Vx=sx/x=7,5Kg/57,5Kg=0,130=13% Vy=sy/Y=7,1cm/170cm=0,042=4,2% X:Pesos Y:Alturas Mdia=57,5Kg Mdia=170cm DesvioPadro=7,5Kg DesvioPadro=7,1cm

Assim,podemosdizerqueadispersorelativamaisacentuadanadistribuiodospesos(X). Adispersomaiornadistribuioquetivermaiorcoeficientededisperso. Se pretendermos estabelecer comparaes entre disperses absolutas, devemos usar o desvio padro,detalmodoquequantomaiorforodesviopadromaiorseradisperso. Se pretendermos estabelecer comparaes entre disperses relativas, devemos usar um coeficiente de disperso, de tal modo que quanto maior for o coeficiente de disperso V maior seradisperso.

50 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9 AS CARACTERSTICAS DA DISTRIBUIO NORMAL


A distribuio normal apresenta uma curva em forma de sino, como mostra a figura 9. A sua principal caracterstica a de as trs medidas de tendncia central mdia, mediana e moda Se encontrarem todas no mesmo ponto da curva, ou seja, todas terem o mesmo valor ou, pelo menos, valores muito prximos. Se Os elementos que constituem uma distribuio esto muito prximosoumuitodispersos,encontraremosformassemelhantesdafigura10.

Figura 9: Distribuio normal

Figura 10 - Distribuio leptocrtica e platicrtica

Estas no so distribuies normais, apesar de a mdia, a mediana e a moda se encontrarem todas no mesmo ponto ( isto que confere simetria distribuio); a distribuio normal tem sempre a forma de um sino. Como foi descoberta pelo matemtico Gauss, tambm lhe chamamosdistribuiogaussiana. A maior parte dos dados recolhidos com organismos vivos tm este padro. Podemos observar que, devido forma da curva, h poucos resultados muito baixos e poucos resultados muito eleva. dos (a curva cai nos extremos esquerdo e direito, o que se deve s baixas frequncias encontradas), enquanto a maioria dos resultados se encontram junto mdia. Vamos debruar
51 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

nossobreopadroderesultadosmuitoembreve,masnestafasereferiremosoutracaracterstica muito importante da distribuio normal. Tericamente, a curva nunca toca o eixo horizontal, mas aproximase dele infinitamente. Esta uma propriedade matemtica da distri buio que no se reflecte na recolha de dados real. No nos cruzamos com seres humanos com dimensesgigantescasoumicroscspicas! Entoaspropriedadesdadistribuionormalsoasseguintes: 1)simtrica; 2)Temformadesino; 3) A mdia, a mediana e a moda encontramse no mesmo pontodacurva; 4)Temduaspontasquenuncatocamoeixohorizontal.

Podemos perguntarnos quo rgida a distribuio normal relativamente aos elementos. Por outras palavras, quanto pode uma curva desviarse da forma de sino e continuar a ser considerada normal? Geralmente, usamos duas abordagens para tomarmos este tipo de deciso; na verdade, este problema mais importante do que o leitor pode pensar, pois existem testes estatsticos,descritosmaisfrente,quespodemrealizarseseoselementosforemnormalmente distribudos. Uma das abordagens baseiase na observao dos dados por averiguao, para lhe darmos um nome mais respeitvel. Se o conjunto de nmeros for extenso, tornarse mais fcil desenhar uma distribuio de frequncias. A outra abordagem reside em seguir um dos procedimentos matemticos para determinar se um conjunto de resultados normalmente distribudo. A verso do teste do quiquadrado que inclumos neste manual um desses procedimentos. Na verdade, improvvel que nesta fase da sua carreira estatstica necessite de saber com grande preciso se uma distribuio considerada normal ou no, pelo que o teste grficodevebastar.Noentanto,devesersensvelaoproblema.

52 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3.9.1 A curva normal e os desvios-padro


Suponhamos que temos um conjunto de nmeros cuja mdia 50 e cujo desvio padro 5. Chamamos a este valor (centmetros, segundos, pontos numa escala, ou outra coisa qualquer) um desvio padro. Dez centmetros, segundos, etc., seriam dois desvios padro e quinze centmetros, segundos, etc., trs desvios padro ... sempre com referncia ao conjunto atravs do qual obtivemos o valor 5. como se pudssemos tirar o desvio padro e transformlo numa unidadedemedidadeumaescala;comosedissssemosqueumapolegadaso2,54cm.Nunca misturaramos polegadas e centmetros nos mesmos clculos, mas poderamos converter uma unidade na outra. Do mesmo modo, no misturamos resultados de desvios padro com resultadosreais,masconvertemosumaescalanaoutra. Voltemos s propores de nmeros em diferentes partes da distribuio. Se retirarmos uma parte da curva entre a mdia, que esta marcada no eixo horizontal da figura que se segue como 50,eumdesviopadro,marcadonoeixohorizontalcomo55,sabemosquedevemostercercade um tero de todos os resultados neste conjunto, porque o que acontece sempre com a distribuio normal. De uma forma mais precisa, a proporo exacta do nmero total de resultados que se encontram entre a mdia e um desviopadro acima da mdia (50 e 55 neste caso) 34,13 %. Como a distribuio normal simtrica, deve verificarse a mesma coisa abaixo da mdia, isto , devemos ter outros 34,13 % dos resultados entre os valores 50 e 45 sendo 45 o valor da mdia menos um desviopadro de 5 pontos. Observemos as duas partes a sombreado. Aaritmticaelementardiznosque68,26%dototaldosresultadosseencontramentreosvalores 45 e 55, pertencendo 31,74 % aos valores extremos que se encontram nos outros dois lados. Mais umavez,asimetriadacurvasignificaque,paraestaproporo,metadede31,74%,ouseja,15,87 %,encontrasedecadaumdosladosdadistribuio.Poroutraspalavras,cercade16%detodos os nmeros neste conjunto sero menores do que 45, sendo a mesma quantidade maior do que 55.

53 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Figura 11: % de resultados 1 dp acima e abaixo da mdia

Exemplo: Suponhamos que o professor obtm os resultados de um teste de leitura feito a 200 crianas.Osresultadossonormalmentedistribudoscomumamdiade60eumdesviopadro de 8. A partir das propriedades da distribuio normal, sabemos que cerca de dois teros dos resultados, isto , aqueles que foram obtidos com cerca de 136 crianas, encontrarseo entre os 52 e os 68 pontos. Cerca de 32 crianas (16 %) tero resultados abaixo de 52 e cerca de 32 tero resultadosacimade68.Josreferimostodos.Suponhamosentoqueospaisdeumacrianaque obteve 68 gostariam de saber algo acerca do progresso do seu filho. Quando souberam que o resultado da criana estava acima da mdia, ficaram contentes, mas gostariam de saber, posteriormente,quoacimadamdiaseencontra,relativamenteaosoutros50%decrianasque tambm obtiveram resultados acima da mdia. Por outras palavras, os pais pretendem saber qual a posio relativa do desempenho do filho. Se os resultados estivessem todos muito perto da mdia, sendo a nota mxima 68, os pais continuariam encantados. Ficariam, porm, menos satisfeitos se soubessem que a nota mxima tinha sido 90, com um grande conjunto de notas altas, acima de 70. No entanto, o professor sabe que o desviopadro das notas foi 8 e, por isso, um tero de todos os resultados estava entre 60 e 68. Sabendo que 50 % dos resultados obtidos estavamabaixodamdia,podemosperceberqueaposiodesta crianaestaonvelde84% dos resultados, na parte superior de todos os resultados. Afinal, os pais tm razes para estarem contentes! Se a criana tivesse obtido 76, os pais teriam muito mais razes para estarem orgulhosos, pois saberiam que o seu filho estava acima de 98 % das outras crianas (nota 76 e dois desviospadro acima da mdia); uma nota 84 colocaria o menino na posio invejvel de estar acima de 99,87 % das outras crianas por outras palavras, num grupo de 200 crianas,
54 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

estaria, muito provavelmente, no topo. Os desviospadro cortam propores fixas da distribuio normal, a partir da mdia e at ao infinito (pelo menos teoricamente), nas duas direces.Devecertificarsedequepercebeucomoseobtmaposiorelativadanota76(isto, 50%+33%+15%)ecomosecalculaquenestegrupodecrianasexistemoutrasquatrocomnotas acimade76.Vejaseconseguecalcularanotaquecolocariaacriananaposio,menosinvejvel, deestarapenasaquatrolugaresdofim. Aresposta44.Paraobtermosestanotanecessitamosdesaberquenotarepresentadoisdesvios padro abaixo da mdia ou que nota corresponde a 2%. Partindo de 60, a mdia, se lhe subtrairmos o valor de dois desviospadro 16, duas vezes o valor de 8, que um desvio padro obteremos 44. Devemos ter cuidado e no misturar os valores dos desviospadro com os resultados reais. Neste exemplo no subtramos o valor 2 da mdia de 60, apesar de querermos o resultado que estava dois desviospadro abaixo dele. Subtramos 16 pontos, pois esteonmeroquecorrespondeadoisdesviospadroparaesteconjuntoderesultados. Resultados z Nos exemplos considerados os resultados encontravamse sempre na mdia, ou exactamente um, dois ou trs desviospadro acima ou abaixo dela. Temos, porm, de examinar resultados que no sejam to facilmente convertveis para desviospadro. Suponhamos, por exemplo,queumacrianacompaisansiososobteveumanota64numtestedeleitura.Aposio da criana na curva seria a metade da distncia, no eixo horizontal, entre o resultado da mdia (60)eumdesviopadroacima(68).

Figura 12: posio de um resultado

55 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A posio da criana exactamente a meio entre os pontos 60 e 68. Significar isto que a sua posionogrupoopontocentralentreamdiade50%e84%danota68?Isto,encontrarse a criana acima de 67 % dos colegas? Olhemos cuidadosamente para as duas pores da curva que est dividida pela linha ao nvel da nota 64. Sero simtricas? No e aqui temos um problemaquetornaoclculodeumaposiorelativamuitomaiscomplicadoecansativodoque gostaramos. Quanto mais nos afastamos da mdia, menos resultados correspondem s diferentes propores. Assim, se tivermos duas pores entre 60 e 64 e entre 64 e 68, haver menos resultados neste ltimo intervalo. Haver ainda menos no intervalo sguinte, entre as notas 68 e 72, e assim sucessivamente. Isto tambm verdadeiro para os resultados abaixo da mdia, mas, neste caso, so os resultados mais elevados, e no os mais baixos, que se encontram mais perto da mdia. H muito menos resultados entre 44 e 48 do que entre 48 e 52, apesar de, em ambos os casos, a variao de notas ser de 4 pontos, ou seja, meio desviopadro. Quando olhamosparaaformadeumadistribuionormal,otamanhodiferentedasproporesquecada desviopadro compreende parece bvio. No entanto, o problema de decidir a posio relativa de uma nota 64, quando comparada com os resultados, no desapareceu. Como podemos determinla? A resposta dada atravs de resultados z. Os resultados z correspondem a desviospadroe,naverdade,sovirtualmenteamesmacoisa,exceptonofactodeumresultado z se referir sempre posio de um ponto em relao a mdia. Isto vai tornarse claro em breve. Para j, pensemos que um resultado z de 1amesmacoisaqueumdesviopadrode1,queum resultado z de 2 e um dp 2, e assim por diante. Como no h, virtualmente, nada numa distribuionormaldepoisdoterceirodesviopadroouresultadozemqualquerdasdireces ,r,aroqueosdesviospadroouosresultadoszincluamovalor4.Ecomumreferirmonosaos resultados z como mais ou menos; aos desviospadro descrevemolos como situandose acima ou abaixo da mdia, em vez de mais ou menos. Um desviopadro tem um valor definido no varivel, enquanto um resultado z se refere a uma posio relativa na curva e referido em funo da mdia. Como, at agora, um resultado z tem o mesmo significado que um desvio padro acima da mdia, podemos considerar que os resultados z e osdesviospadrosoiguais. No entanto, um desviopadro pode referirse a um conjunto de resultados que distem um desviopadro de qualquer ponto da curva, enquanto os resultados z tm posies fixas. Um resultado z de + 1 corresponde exactamente a um desviopadro acima da mdia, e no a qualquer conjunto de resultados que constituam um desviopadro. Voltemos ao problema do resultadode64esuaposiorelativa.Sabemosqueasuaposioexactamentemetadedeum desviopadroacimadamdia,peloquelhedamosumresultadozde+0,5.

56 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

H tabelas que nos permitem ver muito facilmente onde os resultados z se situam na curva normal (Anexo VIII).Vejamoscomoutilizlas.Utilizaremosonossoexemplode64,cujovalorz +0,5. Lemos o valor na primeira coluna da esquerda, encabeada por z, at chegarmos ao valor 0,5. Olhamos para a coluna direita e vemos o nmero 19,15. Temos de somar 50%, de modo a obtermos o valor 69,15. Sabemos ento que h 69,15% dos resultados abaixo de 64 e 30,85% acima. Devemos arredondar os valores para 69% e 31%, respectivamente. Consideremos outro exemplo, desta vez com o valor 65. Este valor est 5 pontos acima da mdia e o desviopadro para o conjunto de 8. Um resultado de 5 pontos acima da mdia 5/8 de desviopadro acima damdia.Sefizermosascontas,sabemosquez+0,63.Comoseencontraacimadamdia,oseu valor positivo. Voltemos tabela 51. Como z tem, desta vez, duas casas decimais, os procedimentos vo ser um pouco diferentes. O valor imediatamente direita (22,7) a percentagem correcta para um resultado z de 0,6. No entanto, o nosso resultado 0,63, pelo que temos de andar trs colunas da tabela ataovalor0,03,notopo.Estevalor,somadoaovalor0,6, dnos o z de 0,63 ou seja, 23,57. Como o nosso z positivo, devemos somarlhe 50% para obtermos o valor final de 73,57. Assim, a nota 65 est frente de 74% da escala. Podemos ver pela tabela que 49% de todas as notas em cada um dos lados da curva esto includas num z de 2,33ouumbocadinhomaisabaixo,parasermosmaisprecisos).Notemosque,matematicamente, ascaudasdacurvanuncatocamoeixohorizontal,nemincluemtodososresultadospossveis. Reparemosagoranaposiorelativadeumapessoaqueobtenhaumresultadoabaixodamdia, digamos uma nota 41 na amostra original. Esta nota est 19 pontos abaixo da mdia, apenas um poucomenosdoquedoisdesviospadro.Parasermosprecisos,est19/8 ou2,375abaixo.Oseu zser 2,375.NatabelaSIiemanexovemosqueumzde+2,3inclui48,93%dosresultados,mas o nosso resultado z o valor um pouco superior de 2,375. A nossa tabela s pode ser usada com duas casas decimais, pelo que vamos arredondar este valor para 2,38. Paramos, desta vez, junto dacolunade0,08eobtemosovalor49,13.Assim,umzde+2,38inclui50%+49,13%=99,13%de todososresultados.Atagoratudobem,masoproblemaqueonossovaloreranegativo.Basta virarmosanossacurvaaocontrrioetrabalharmoscomasuaimagemaoespelho.Assim,como nosso valor 2,38 sabemos que 99,13% de todas as notas da distribuio esto acima dele e apenas0,87%abaixo.Seconsiderarmosestapequenaproporode1%,devemosesperarque,na nossa amostra de 200 indivduos, 1%, ou seja, dois indivduos tenham notas inferiores a 41. No
57 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

outro extremo das notas, devemos esperar que apenas dois alunos tenham notas de 19 ou mais pontosacimadamdia,ouseja,notasqueexcedamos79%. Omododeobterovalorzdadopelaexpressoformal
Z= desvio da nota em relao mdia desvio-padro

Seodesvioemrelaomdiativerumsinalpositivoounegativo,seestiveracimaouabaixoda mdia,respectivamente,zficarcomosinalcorrecto. Nota: : tenha cuidado quando trabalhar com z e dp, de modo a uslos sempre que os dados atravs dos quais foram obtidos sigam uma distribuio normal Ou aproximadamente normal. Deoutromodo,arranjarconfuses

58 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4. ESTATSTICA PARAMTRICA E NO PARAMTRICA


Paramtricos:calculaasdiferenasnumricasexactasentreosresultados. No paramtricos: apenas consideram se certos resultados so superiores ou inferiores a outros resultados. REQUISITOSPARAUTILIZAODETESTESPARAMTRICOS Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer comparaes entre amostras (testes paramtricos), existe uma lista de requisitos que inclui, entre outros: 1. queavariveltenhasidomensuradanumnvelmnimointervalar; 2. queadistribuiosejasimtricaemesocurtica; 3. queacaractersticaestudada(varivel)tenhadistribuionormalnumadadapopulao. Sempre que no se pode, honestamente, admitir a simetria e a normalidade de distribuio, ou os dados foram recolhidos num nvel de mensurao inferior ao intervalar, devemos recorrer a testes que no incluem a normalidade da distribuio ou nvel intervalar de mensurao. Esses testeschamamsenoparamtricos VANTAGENSDOSTESTESNOPARAMTRICOS Podem ser utilizados, mesmo quando os seus dados s podem ser medidos num nvel ordinal, isto , quando for apenas possvel ordenlos por ordem de grandeza) podem ser utilizados mesmo quando os seus dados so apenas nominais, isto , quando os sujeitos podem apenas ser classificadosemcategorias.

59 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PODERDEUMTESTE OpoderdeumtesteaprobabilidadederejeitarmosaH0quandoelarealmentenula Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuemprrequisitosmaisdifceisdesatisfazer(testesparamtricoscomoteF). As alternativas no paramtricas exigem muito menos prrequisitos mas produzem testes de significnciacommenospoderqueoscorrespondentesparamtricos. EMCONSEQUNCIA Ao rejeitarse a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvel que essa rejeio seja falsa (se rejeitar a H0 quando ela verdadeira comete umerrode tipo I; se aceitar a H0 quando ela falsa comete um erro de tipo II). Quando os requisitosdeum testeparamtricosoviolados,tornaseimpossvelconheceroseupodereasuadimenso() obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela mesmo falsa, evitandoumerrodetipoI. Otesteidealseriaaqueleque=0e=1,oqueimplicariaqueotesteconduziriasempredeciso correcta,contudoestetesteidealraramenteexiste. Aprobabilidadedoerrode1espciedeveserreduzida,fixandotericoem0,1;0,05ou0,01.o valor fixado para depende da importncia que se d ao facto de rejeitar a H0 quando esta verdadeira. Umailustraodestepontodevistapodeserfeitacomoseguinteexemplo: Umapessoainocenteatprovadocontrrio H0:Apessoainocente H1:Apessoaculpada

ErroI:Apessoacondenadamasestinocente ErroII:Apessoaabsolvidamasculpada

60 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entendesequemaisgravecondenarinocentesqueabsolvercriminosos. Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros sistemasjudiciaispodeadmitirque=0,05umvalorrazovel.

ASSIM Fixada a probabilidade do erro de tipo I (dimenso do teste), o teste mais potente aquele em que a escolha da regio critica minimiza a probabilidade do erro de 2 espcie. Dizse tambm queestaregiocriticaamaispotente. Facilmente se conclui que o teste mais potente aquele que, uma vez fixada a probabilidade de rejeitar a H0, quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesmahiptesequandoestafalsa. PRESSUPOSTOS Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padroeseoresultadoestiverentre2e2adistribuiosimtrica. Parasaberseumavarivelmesocurticadividimosocoeficientedeachatamento(Kurtosis)pelo erropadroeseoresultadoestiverentre2e2adistribuiomesocurtica. Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados intervalares; distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa. Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia noparamtricos.

61 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PARAESCOLHERQUALQUERTIPODETESTEESTATSTICO Distinguir se a nossa amostra constituda pelos mesmos sujeitos em todas as situaes ou se formadapordiferentessujeitosparacadasituao

INTERSUJEITOSOUDESIGNNORELACIONADO este tipo de design utilizado quando um indivduo ou objecto avaliado apenas uma vez. A comparao efectuado entre os grupos de sujeitos/ objectos cujos resultados so no relacionados. Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondemtarefa. INTRASUJEITOSOUDESIGNRELACIONADO Acomparaofeitaentreosmesmossujeitos(sujeitosdomesmogrupo). A importncia destesdesignsaeliminaodequaisquerparticularidadesindividuais,umavez queficamigualizadasemtodasassituaes. Desvantagem:Efeitodememriaeaprendizagem. AMOSTRASEMPARELHADAS Igualizamse sujeitos diferentes mas emparelhados, em termos de idade, sexo, profisso e outras caractersticasgeraisqueparecemimportantesparacadapesquisaemparticular. estes tipos de designs podem ser considerados de designs relacionados, uma vez que controladonassuascaractersticasrelevantes. Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as caractersticasrelevantes. Dificuldadesarranjargrandesamostras.

62 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5. TESTES NO PARAMTRICOS PASSO-A-PASSO


5.1 TESTE DO QUI-QUADRADO
O QuiQuadrado (X2) de aderncia consiste em comparar os dados obtidos experimentalmente comosdadosesperadosdeacordocomalei.Dascomparaessurgemdiferenasquepodemser grandes ou pequenas: se forem grandes, a hiptese nula (H0) que pressupe um bom ajustamento dever ser rejeitada em favor da hiptese alternativa (H1); se forem pequenas, a hiptesenulanoserrejeitadaeasdiferenassoatribuveisaoacaso. OX2deindependnciaserveparaajudaradecidirseasduasvariveisestoounoamarradas umaoutraporumarelaodedependncia.

QUANDOUTILIZAR

Utilizasequandoosdadossonominais,peloqueemvezdesemediremresultadosdossujeitos apenassepodemdistribuirossujeitosporumaoumaiscategorias. OQuiQuadrado(X2)testaahipteseexperimentalqueprevquantossujeitosdecadagruposo distribudosporumadeterminadacategoria. OX2umtesteestatsticonoparamtrico,sendoumdosmaisutilizadosebastanteaplicadoem diferentes planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica multivariada(nosentidodeobterograudeadernciaentreomodeloobtidoeoterico).

OBJECTIVO

O objectivo comparar frequncias observadas com frequncias tericas ou esperadas, ou seja, verificaroseugraudeaproximao,quepodesergrande(=0)oupequeno(>0).
63 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Assim,oobjectivocompararasfrequnciasobservadasemcadaumadasclulasdeumatabela de contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por uma determinada categoria com o nmero de sujeitos que se esperaria se distribussemporessamesmacategoria,casonoexistissemdiferenas. OtestedoX2reflecteotamanhodasdiferenasentreasfrequnciasobservadaseesperadas.Para ser significativo, o valor de X2 dever ser igual ou superior aos valores crticos da tabela (Anexo I). INSTRUESPASSOAPASSO 1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais relevantesparacadaumaedividindopelonmerototaldesujeitos. 2.CalcularX2:

(O-E)2
X2 =
______________

emque: O=frequnciasobservadasparacadaclula; E=frequnciasesperadasparacadaclula.

3.Calcularosgrausdeliberdade:
g.l. = (r-1) (c-1)

emque r=nmerodelinhasdatabeladecontingncia c=nmerodecolunasdatabeladecontingncia

SeX2observado>X2crticorejeitaseH0 SeX2observado<X2crticonoserejeitaH0 Especificandoparaumatabeladeduplaentrada2X2: g.l.=(nmerodecolunas1)(nmerodelinhas1)=1X1=1

64 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A C A+C

B D B+D

A+B C+D N

N (AD - CB)2 X2 = _________________________________________ (A+C) (C+D) (A+C) (B+D)

Quandoumatabelatemmaisdeduasentradas: g.l.=(nmerodecolunas1)(nmerodelinhas1)
X2 = (total de linha) (total de coluna) (total geral)

Exemplo: Suponha que quer estudar se os estudantes de cincias sociais utilizam um mtodo de estudo significativamente diferente daquele que utilizado pelos estudantes de tecnologia. Escolheramse dois grupos, um composto por 50 estudantes de cincias sociais e o outro por 50 estudantes de tecnologia. Enviouse um questionrio aos 100 estudantes pedindolhes que indicassememqualdasseguintescategoriasmelhorseenquadraoseumtododeestudo:estudo dirio regular, estudo irregular em perodos concentrados de trabalho intensivo ou uma mistura dos dois. Foram recebidas 44 respostas dos estudantes de cincias sociais e 42 dos estudantes de tecnologia. Colocouse a hipotese experimental (H1) de que o tipo de estudo dependia do curso frequentado Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de contingncia(crosstab).Asclulasquerepresentamcadaumadascategoriassonumeradasde 1a6.
Quadro 12: Tabela de Contingncia (Crosstab)

Tipo de estudo Regular


Grupo 1 Estudantes de Cincias Sociais Grupo 2 Estudantes de Tecnologia Totais dos padres de estudo 1 6 E=8,19 4 10 E=7,81 16 5 8 E=11,23 23 2 15 E=11,77 6 24 E=22,95 47 42 N=86

Irregular
3

Misto
23 E=24,05

Total parcial do nmero de estudantes


44

65 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Resoluo49: InstruesPassoaPasso:

1.calcularasfrequenciaesperadas(E) Clula1:E=16X44/86=8,19 Clula2:E=23X44/86=11,77 Clula3:E=47X44/86=24,05 Clula4:E=16X42/86=7,81 Clula5:E=23X42/86=11,23 Clula6:E=47X42/86=22,95

2.Aplicarafrmula:

(O-E)2
X2 =
________________

E X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2 8,19 11,77 24,05 7,81 11,23 22,95 X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

3.Calcularosgrausdeliberdade(gl)
g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2 4. Consultar a tabela (Anexo I)

Para
p=0,05 e gl=2 x2 critico=5,99

Concluses: Dado que o valor observado de X2 apenas de 3,12, ou seja, inferior ao valor crtico de 5,99 para p < 0,05, o resultado da experincia no significativo. Aceitase hiptese nula de que os padres de estudo dos estudantes de cincias sociais e de tecnologia no diferem, rejeitandosedestaformaanossahipoteseexperimental(H1).

66 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

5.2 PROCEDIMENTOS PARA ORDENAO DE RESULTADOS


OstestesUdeMannWhitney;Wilcoxon;HdeKruskalWallis;rhodeSpearman;taudeKendall e Friedman, exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste sentidocomearemosporexplicarosprocedimentosdeordenaoderesultados Ordenamentoglobalderesultados(designsnorelacionadosparasujeitosdiferentes): 1. Atribua a ordem mais baixa 1 ao resultado mais baixo, a ordem seguinte 2 ao resultadoseguintemaisbaixo,eporafora. 2. Os resultados nulos de 0 so contados como o resultado mais baixo possvel, sendo lheatribudaaordemmaisbaixa. 3. Quando existem resultados idnticos solhe atribudas ordens mdias, calculadas com base na globalidade das ordens que deviam ter sido atribudas a estes resultados.

Exemplo:ordenarumgrupoemfunodon.defactoresderisco:
Quadro 13: Ordenao de um grupo em funo do n. de factores de Risco

N. de Factores de risco 6 3 12 4 7 5 8

Ordem
4 1 7 2 5 3 6

Se existir um zero este deve ser considerado o valor mais baixo.

Noscasosemqueexistemresultadosiguaisutilizaseadoslugaresquedeviaocupar.

67 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:
N. de FR.
1 2 1 4 1 3 4 6 5

Ordem
2 4 2 6,5 2 5 6,5 9 8

AssimossujeitoscomumFactorderiscoso3(1+1+1)queocupariamo1.2.3.lugar Ento3+2+1=6:(1+1+1)=2 Com4factoresderiscotemos2sujeitosqueocupariamo6.e7.lugar Ento6+7=13:(1+1)=6,5

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou emparelhados): 1. Em geral, a atribuio de ordens s diferenas entre resultados efectuase tal como fizemos para os resultados, sendo atribuda a ordem mais baixa menor diferena e poraadiante; 2. Diferenasidnticasentreresultadossoordenadasdamesmaformaqueresultados idnticos, atribuindose uma ordem mdia resultante da globalidade de ordens que essasdiferenasdeveriamocupar; 3. Resultadosnulosde0socontadoscomooresultadomaisbaixopossvelquandose calculamdiferenasentreresultados; 4. Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes experimentais, estes no so ordenados, sendo retirados da anlise; 5. Diferenas positivas e negativas so ordenadas em conjunto como se se tratasse de umordenamentosimplesderesultados,ignorandoossinaispositivosenegativos.

68 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de crianas com suspeita de perda auditiva produziu antes da colocao de um aparelhoauditivoeapsacolocaodaquele.
Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas
Sujeitos 1 2 3 4 5 6 7 8 9 10 N de frases correctas antes do aparelho auditivo 5 5 2 1 4 2 1 4 1 1 N de frases correctas depois do aparelho auditivo 6 7 3 5 5 5 5 4 7 6 diferenas 1 2 1 4 1 3 4 0 6 5 ordem 2 4 2 6,5 2 5 6,5 9 8

Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2 situaes nula nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem, sendo que o resultado nem sequer considerado na anlise. No ordenamento de resultados negativos em amostras relacionadas ignoramse os sinais quando se ordenam os resultados.

5.3 TESTES PARA DUAS AMOSTRAS INDEPENDENTES


Ao estudarmos as diferenas entre dois grupos podemos utilizar grupos

relacionados/emparelhados ou grupos independentes. No caso de duas amostras independentes determinamos se as diferenas nas amostras constituem uma evidncia convincente de uma diferenanosprocessosdetratamentoaelasaplicados. Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos indiscutveis, a sua aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a utilizao dos indivduos como seus prprios controlos, tal como ocorre quandoavariveldependenteosuicidiotentado;umproblemaquepodeacontecerumanica vez. Pode ser tambm impossvel delinear um projecto que utilize pares de dados, talvez por
69 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

desconhecimento,porpartedoinvestigador,devariveisteisquepossamformarpares,oupela impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida importnciaou,enfim,porquesimplesmentenosedispedeparesadequados. Quandoautilizaodeduasamostrasrelacionadasnoprticaouadequada,podemosutilizar duas amostras independentes. Em tais projectos, as duas amostras podem ser obtidas por umde doismtodos: a) Podemserextradasaleatoriamentededuaspopulaes; b) Podem decorrer da atribuio aleatria de dois tratamentos aos membros de umaamostradeorigemarbitrria. Nota:Emnenhumdestescasosseexigequeasamostrastenhamomesmotamanho.

5.4 TESTE U DE MANN-WHITNEY


QuandoUtilizar: Dadas duas amostras, de tamanhos n1 e n2, possvel, mediante a prova U de MannWhitney, saberseambasasamostraspodemserconsideradasprovenientesdamesmapopulao. Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido mensurados, no mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias, independenteseavarivelobservacionalprecisadeterdistribuionormalnapopulao.

O teste U de MannWhitney deve ser utilizado em designs com duas situaes, no relacionados, quando so utilizados sujeitos diferentes em cada uma das situaes experimentais.

70 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Suponha que quer investigar o n. de queixas dolorosas durante um tratamento a um mesmo problema teraputico (controlada a gravidade e a extenso da leso) em que se utilizaram duas tcnicas diferentes. A hipotese experimental supe que durante a utilizaodatcnicaBqueodoenteseapresentamaisqueixoso.
Quadro 15: Resultados do registo das queixas

Paciente 1 2 3 4 5 6 TOTAL MDIA

A 3 4 2 6 2 5 22 3,67

Ordem (1) 3 4 1,5 7,5 1,5 5,5 T1=23

B 9 7 5 10 6 8 45 7,5

Ordem (2) 11 9 5,5 12 7,5 10 T2=55

RACIONAL O racional que est por trs do teste U de MannWhitney bastante semelhante ao do teste de Wilcoxon. A diferena fundamental entre as duas reside no facto do segundo se aplicar a designs relacionados e o U se aplicar a designs norelacionados, utilizando, portanto, sujeitos diferentes. O teste de Wilcoxon analisa as diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas situaes experimentais. Com um design norelacionado no temos uma base que nos permita comparardiferenasentreparesderesultados.Assim,otesteUdeMannWhitneyordenaos resultados de todos os sujeitos em ambas as situaes como se fossem apenas um conjunto simplesderesultados. Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, entoosresultadosdevemseraproximadamenteosmesmose,consequentemente,asordens devem ser tambm aproximadamente as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas ou baixas numa situao ou na outra, ento porque a diferenanototaldosresultadosordenadosparacadasituaodevidaaosefeitosprevistos da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para uma das situaes, ento ter de haver uma preponderncia de ordens elevadas na outra situao. Quanto menor for U mais significativas sero as diferenas entre as ordens das duas situaes.
71 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordene todos os resultados para ambos os grupos como se se tratasse de um conjunto nico de resultados,atribuindoaordem1aoresultadoinferioreassimsucessivamente. OordenamentoglobaldetodososresultadosapresentadoemOrdens(1)eOrdens(2). Adicioneasordenstotaisparaogrupo1egrupo2emseparado.
T1=23 e T2=55

Seleccioneomaiortotaldasordens.
T2=55

CalculeovalordeUatravsdafrmula
U = n1.n2 + Nx (nx + 1) __________________ 2 - Tx

emque:
ClculodeU
6x7 U=6x6+
_______________

n1=nmerodesujeitosnogrupo1 n2=nmerodesujeitosnogrupo2 Tx=maiortotaldeordens

n1=6 n1=6 Tx=T2=55 Nx=6

Nx=nmerodesujeitosdogrupocomomaiortotaldeordens

- 55 = 36+21-55=2

Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil verificar qual o maior total de ordens. Normalmente, prefervel ter um nmero idntico de sujeitos em cada grupo; no entanto, se tiver de utilizar um nmero desigual de sujeitos em cada grupo, poder fazlo. Em caso de dvida, calcule U para ambas as ordens totais, seleccionando onapropriadoacadacasoe,depois,considereoUmaispequeno.

72 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


As Tabelas (Anexo II) apresentamlhe os valores crticos de U nos diferentes nveis de significncia de testes unicaudais e bicaudais, para as diferentes combinaes de n1 e n2 dos dois grupos. O procedimento mais usual comear por verificar se o valor de U significativo ao nvel de significncia de p<0,05 para testes unicaudais) ou para testes bicaudais. Uma vez que previmos que a tcnica B produzia mais queixas, poderemos consultar a Tabela para testes unicaudais. Localizando n1=6 na linha superior e n2=6 na coluna do lado esquerdo, encontraremos o valor crticodeUnaintercepodosdois. Concluso: Uma vez que se convencionou utilizar o nvel inferior de U, o nosso valor de U=2 deve ser igual ou inferior ao valor crtico 7, o que acontece, podemos, desta forma, rejeitar a hiptesenulaeaceitarqueexistemdiferenassignificativasaonveldador(p<0,05).

73 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6. TESTES PARA DUAS AMOSTRAS RELACIONADAS


Empregamse as provas estatsticas de duas amostras quando o investigador deseja determinar sedoistratamentossodiferentesouseumtratamentomelhordoqueooutro.Emcadacaso, comparase o grupo em que se aplicou o tratamento com outro que no sofreu nenhum tratamentoouquesofreutratamentodiferente. Em tais comparaes de dois grupos observamse, por vezes, diferenas significativas que no soresultantesdotratamentoaplicado. Umadasmaneirasdesuperaradificuldadedecorrentedaintroduodediferenasextrnsecas entre dois grupos consiste em utilizar na pesquisa duas amostras relacionadas, isto , relacionar de alguma forma as duas amostras estudadas. Tal relacionamento pode ser conseguido utilizandose cada indivduo como seu prprio controlo ou ento formando pares de indivduos e, em seguida, associando os dois membros de cada par s duas condies. Quando um indivduo serve como o seu prprio controlo, ele submetido a ambos os tratamentos em ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar seleccionarse,paracadapar,indivduosquesejamtosemelhantesquantopossvelemrelaoa quaisquervariveisextrnsecasquepossaminfluenciarosresultadosdapesquisa. Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo (contrabalanando a ordem em que se aplicam os tratamentos ou mtodos) prefervel ao mtodo de emparelhamento. E a razo disso que limitada a nossa capacidade para formar os pares adequadamente, em consequncia do nosso desconhecimento das variveis relevantes que determinam o comportamento. A validade por emparelhamento est na razo directa do investigador para determinar como formar os pares, e essa capacidade quase sempre muito limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio controlo;nosepodepretenderrelacionamentosmaisprecisosdoqueaprpriaidentidade.

74 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.1 PROVA DE McNEMAR PARA A SIGNIFICNCIA DE


MUDANAS
Quandoutilizar: A prova de McNemar para a significncia de mudanas particularmente aplicvel aos planeamentos do tipo antes e depois, emquecadaindivduoutilizadocomooseuprprio controlo e a mensurao se faz ao nvel de uma escala nominal ou ordinal. Pode, assim, ser usada para testar a eficincia de determinada tcnica (reunies, folhetos, visita, etc.) sobre as prefernciaseleitoraisarespeitodevrioscandidatos. Nestes casos, cada pessoa pode servir como o seu prprio controlo, utilizandose a mensurao emescalanominalparaavaliarasalteraesdasituaoapsemrelaosituaoantes.
Exemplo: Suponha que um profissional de sade est interessado em estudar os comportamentos resultantes da iniciao de obesos prtica do exercicio fisico. Este profissional observou ao longo dos anos que os obesos utilizam preferencialmente o elevadorparasedirigiremsuaconsultacujoconsultrioerano1.andar.Colocaahipotese de que os obesos que tiveram como terapeutica exerccio fsico comeariam a usar preferencialmenteasescadas.Afimdetestarahipoteseotcnicoobserva25doentesemque ministrou como exerccio fsico caminhar uma hora por dia cinco vezes por semana. Decorrido um ms de exercicio ele observa os mesmos 25 doentes e faz a classificao comportamentos.Osdadossoosseguintes:
Quadro 16: Teste Mcnemar

Preferencia aps 30 dias de exercicio Escadas Preferncia antes da teraputica Elevador Escadas 4 4 (A) (C) Elevador 14 3 (B) (D)

HIPTESE DE NULA:
H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador para as escadas (PA) igual probabilidade de mudar de mudar das escadas para o elevador(PD)eambassoiguaisa.Isto, H0:PA=PD=1/2 H1:PA>PD

75 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

PROVA ESTATSTICA:
Utilizase a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras relacionadas, do tipo antesedepois e utiliza a escala de medida nominal (classificativa). Nveldesignificncia: p=0,05 Distribuioamostral: A distribuio Quiquadrado com 1 grau de liberdade d uma boa aproximao da distribuio amostraldeQuiquadrado,talcomocalculadapelafrmula. RegiodeRejeio: Como H1 especifica o sentido da diferena prevista, a regio derejeiounilateral.Consistede todos os valores de Quiquadrado que so to grandes que acusem uma probabilidade unilateral,associadasuaocorrnciasobH0nosuperiora0,05. Deciso: Estamos interessados nos obesos cujo comportamento acusa alterao: representados nas clulas AeD. Paraosdados,temos:
(A-D - 1)2 X2 =
_________________________

N=25

(4-3 - 1)2 =
__________________

(1 - 1)2 =
___________________

0 =
__________

=0

A+D

4+3

Sendo0valorobservadodex2=0,devemosconsultaratabela(AnexoI)paraobterovalorcritico, no esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamosumx2criticode5,41.

Racional Paracompararasignificnciadequalquermudanaobservada,porestemtodo,constriseuma tabela de frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos

76 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

indivduos. As caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizamossinais+eparaindicardiferentesreaces.

Quadro 17: Tabela de quatro casas para a prova de significncia de mudanas

ANTES
DEPOIS + A C + B D

Notese que os casosqueacusammodificaesentrea1ea2reacoaparecemnasclulasAe D.UmindivduolocalizadonaclulaAsepassoude+paraenaclulaDsepassoude para +. Na ausncia de modificao, o indivduo classificado na clula B (reaco + antes edepois)ounaclulaC(reacoantesedepois). Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sob a hiptese de nulidade, seria que (A+D) acusassem modificaes num sentido e (A+D) acusassemmodificaesnoutrosentido.Ouseja,(A+D)afrequnciaesperada,sobH0,tanto naclulaAcomonaclulaD. Na prova de McNemar de significncia de mudana, estamos interessados apenas nas clulas A e D. Portanto, A=nmero de casos observados na clula A, D=nmero de casos observados na clulaDe(A+D)=nmeroesperadodecasostantonasclulasAcomoD,ento

(A-D)2 X2 =
_____________

A+D

comgrausdeliberdade=1

77 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6.2 CORRECO DE CONTINUIDADE


Aaproximao,peladistribuiodoQuiquadrado,dadistribuioamostraldafrmulatornase excelente se se introduzir uma correco de continuidade. Tal correco necessria, porque se utilizou um distribuio contnua (Quiquadrado) para aproximar uma distribuio discreta. Quando todas as frequncias esperadas so pequenas, tal aproximao pode ser fraca. A correcodecontinuidade(Yates,1934)constituiumatentativaderemoodessafontedeerro. Comacorrecodecontinuidade,temse:
(A-D - 1)2 X2 = ________________________________ A+D

com graus de liberdade=1

Esta expresso indica que se deve subtrair 1 do valor absoluto da diferena entre A e D antes de elevar ao quadrado. O grau de significncia de qualquer valor observado de Quiquadrado, tal como calculado atravs da frmula, determinado mediante referncia a uma Tabela (Anexo I). SeovalorobservadodeQuiquadradoiguala,oumaiordoque,ovalorexibidonaTabelapara determinado nvel de significncia com gl=1, a implicao que existe efeito significativo nas reacesantesedepois.

INSTRUES PASSO-A-PASSO PARA CALCULAR X2


Enquadrarasfrequnciasobservadasnumatabelade4casas. DeterminarasfrequnciasesperadasnasclulasAeD

E=1/2 (A+D) Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio


provadeMcNemar. Seasfrequnciasesperadasnosoinferioresa5,calcularovalordeX2atravsdafrmula

(A-D - 1)2 X2 =
_______________________

A+D
Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valortograndequantoovalorobservadodeX2.Sesetratadeumaprovaunilateral,dividirpor

78 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2 o valor da probabilidade exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observadodeX2comgl=1,nosuperap,rejeitaseH0emfavordeH1.

6.3 TESTE DOS SINAIS DE WILCOXON


Quandoutilizar O teste de Wilcoxon deve ser utilizado num design experimental relacionado, com duas situaesexperimentaisquandosoutilizadososmesmossujeitosousujeitosemparelhadosem ambasassituaes.
Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de vocabulrio utilizado por crianas que usam um aparelho auditivo ou por crianas que no usam. Este um bom exemplo dum caso em que essencial a utilizao de sujeitos emparelhados. Como bvio, no possvel utilizar os mesmos sujeitos, uma vez que nenhuma criana que no precisa de usar aparelho auditivo usa um mesmo tempo. Por outro lado, no podemos escolher aleatoriamente os sujeitos para cada grupo. Pode darse o caso, por exemplo, de os sujeitos que usam aparelho auditivo serem mais velhos. Qualquer efeito encontrado neste grupo pode ficar a deverse unicamente a esta diferena. Os dois grupos com aparelho e sem aparelho necessitam de ser emparelhados em termos de idade, sexo, inteligncia e todas as outras variveis que achemos necessrio serem controladas. Apresentamos depois s crianas um teste que mea o seu vocabulrio, traduzindooemresultados,talcomomostradonatabelaseguinte.

Quadro 18: Resultados do teste do vocabulrio Ordem das Par de sujeitos Situao A (com aparelho) Situao B d (A-B) (sem aparelho) positivas negativas Ordem de d diferenas diferenas Ordem das

1 2 3 4 5 6 7 8 9 10 TOTAL MDIA

3 4 3 1 5 2 3 4 1 3 29 2,9

5 5 2 5 4 5 5 4 5 5 45 4,5

-2 -1 +1 -4 +1 -3 -2 0 -4 -2

5(-) 2(-) 2(+) 8,5(-) 2(+) 7(-) 5(-) 8,5(-) 5(-)

5 2 2 8,5 2 7 5 8,5 5 41

79 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

RACIONAL
O objectivo do teste dos sinais de Wilcoxon comparar as performances de cada sujeito (ou pares de sujeitos) no sentido de verificar se existem diferenas significativas entre os seus resultados nas duas situaes. Os resultados da Situao B so subtrados dos da Situao A e diferena resultante (d) atribudo o sinal mais (+) ou, caso seja negativa, o sinal menos (). Estas diferenas so ordenadas em funo da sua grandeza (independentemente do sinal positivo ou negativo). O ordenamento assim obtido depois apresentado separadamente para os resultados positivos e negativos. O menor dos valores deste segundo, dlhe o valor de uma estatstica designadaporW,quepodeserconsultadanaTabeladesignificnciaapropriada. A ideia que se existirem apenas diferenas aleatrias, tal como postulado pela hiptese nula, ento haver aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tanto para as diferenas positivas como negativas. Se se verificar uma preponderncia de baixos resultados para um dos lados, isso significa a existncia de muitos resultados elevados para o outrolado,indicandoumadiferenaemfavordeumadassituaes,superiorquiloqueseriade esperarseosresultadossedevessemaoacaso.DadoqueaestatsticaWreflecteomenortotalde ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes entre as duassituaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


1. Calculeadiferenadentrecadaparderesultados,atribuindoosinalmaisoumenos. Vejaacolunad(AB) 2. Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior, ignorandoossinaispositivosenegativos. Vejaacolunaordenamentoded 3. Emseparado,juntetambmaordenaocorrespondenteaossinaisdiferentes(+ou). Veja ostotaisparaordenamentosdediferenaspositivasedediferenasnegativasnas respectivascolunas

80 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

4.

ConsidereomenordostotaisdasordenscomoW. ValorobservadodeW=4,umavezqueototaldasordensparaasdiferenaspositivas omenor

5.

ConteonmerodeparesdesujeitosN(noconsidereasigualdades). N=101=9

CONSULTA DA SIGNIFICNCIA NA TABELA


A tabela anexada (Anexo III) apresentalhe o nvel de significncia de w tanto para os testes unicaudais como bicaudais. Na coluna da esquerda encontra os valores de N. Uma vez que no efectumos uma previso da direco (como por exemplo, que obteramos melhores resultados no vocabulrio de criana em jardim de infncia) teremos de utilizar os nveis de significncia paraumahiptesebicaudal.SeleccioneovaloradequadoN=9everifiqueaolongodessalinhase o valor de W significativo. Uma vez que se convencionou utilizar o menor valor das ordens, ento o valor obtido de W ter de ser igual ou inferior ao valor crtico da Tabela. Como o valor obtido W=4 inferior ao valor crtico de 6 para p<0,05 (bicaudal), pode rejeitar a hiptese nula e concluir que existe uma diferena significativa entre os resultados no vocabulrio dos dois gruposdesujeitosemparelhados. Suponha que tinha efectuado uma previso numa dada direco, por exemplo, que as crianas que usam aparelho auditivo (Situao B) obtm resultados mais elevados no teste de vocabulrio. O valor obtido de W=4, inferior a 6, que o valor crtico de W para p<0,025 (hiptese unicaudal), uma probabilidade inferior e, consequentemente, mais significativa do que onveldesignificnciaparaumahiptesebicaudalp<0,05.

81 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

7. TESTES PARA K AMOSTRAS INDEPENDENTES


O investigador pode precisar de decidir se diversas variveis independentes devem ser consideradas como procedentes da mesma populao. Os valores amostrais quase sempre so um tanto diferentes e o problema determinar se as diferentes amostras observadas sugerem realmente diferenas entre as populaes ou se so apenas variaes casuais que podem ser esperadasentreamostrasaleatriasdamesmapopulao. Apresentamos tcnicas para comparar a significncia de diferenas entre trs ou mais grupos de amostras independentes, ou seja, para comprovar a hiptese de nulidade de que K amostras independentestenhamsidoextradasdamesmapopulaooudepopulaesidnticas. As provas noparamtricas tm a vantagem de permitir estudar, quanto significncia, dados que so inerentemente classificados (escala nominal) ou se apresentam em postos (escala ordinal).

7.1 TESTE DE KRUSKAL-WALLIS


REQUISITOS PARA O USO DO TESTE DE KRUSKAL-WALLIS
OtestedeKruskalWallispressupeasseguintescondiesparaoseuadequadouso: a) Comparaodetrsoumaisamostrasindependentes; b) O teste de KruskalWallis nopodeserusadoparatestardiferenasnumanicaamostra derespondentesmensuradosmaisdeumavez; c) Dadoscujonveldemensuraosejanomnimoordinal; d) Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja possvelatribuirpostosouordens; e) Otamanhomnimodecadaamostradeveserde6parasepoderrecorreraox2.
82 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia Tabela do Quiquadrado (Anexo I). Para testar diferenas entre amostras de tamanhoinferiora6,deverecorreratabelasespeciais(AnexoIV).

QUANDO UTILIZAR
EstetestepodeserconsideradoumaextensodotesteUdeMannWhitneyquandonecessitamos de utilizar trs ou mais situaes. Deve ser utilizado em designs norelacionados quando sujeitosdiferentessodistribudosportrsoumaissituaes.
Exemplo: Suponha que estamos interessados em descobrir se existem diferenas no acesso a uma pgina da internet em funo da caracteristica: muito ilustrada, com algumas ilustraes e, sem ilustraes. Alocmos trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir verificmos o nmero de vezes que formam acedidas durantequatrosbadosseguidos.Osresultadosforam.
Quadro 19: Nmero de ideias relembradas para trs tipos de testes Sujeitos do grupo 1 (pgina muito ilustrada) Sujeitos do grupo 2 (pgina com algumas ilustraes) Sujeitos do grupo 3 (Pgina sem ilustraes)

Sabado Sabado Sabado Sabado TOTAL MDIA

1 2 3 4

Resul 19 21 17 16 73 18,25

Ordem 10 11 9 8 38

Resul 14 15 9 38 12,67

Ordem 6 7 1 14

Result. 12 12 13 10 47 11,75

Ordem 3,5 3,5 5 2 14

RACIONAL
Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais grupos. Uma vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a nica forma de verificarmos as diferenas entre as situaes ordenlas em conjunto, como se se tratassem apenas de um conjunto de resultados, tal como havamos efectuado no teste U de MannWhitney. Isto acontece porque, no temos uma base para comparar resultados dos mesmos sujeitos ou de sujeitos emparelhados em diferentes situaes, comocomotesteUdeMannWhitneyparadesignsrelacionados. Este ordenamento global, quando posteriormente adicionamos as ordens de cada coluna em separado,permitenosobterototaldasordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre as situaes, como postulado na hiptese nula, de esperar que ordens altas e

83 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

baixas se distribuam de forma aproximadamente equivalente pelas diferentes situaes. Mas, se pelo contrrio, houver uma preponderncia de altos ou baixos resultados em qualquer uma das situaes, provvel que tal facto reflicta diferenas significativas devidas varivel independente. O valor das diferenas entre os totais das ordens dado pela estatstica designada por H. Desde que a hiptese experimental preveja a existncia de diferenas significativas entre as situaes, o valor que obtivermos de H dever ser igual ou superior ao valor crtico da Tabela, para que possaserconsideradosignificativo.

INSTRUES PASSO-A-PASSO PARA CALCULAR H


Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados, atribuindoaOrdem1aomenorresultadoeassimsucessivamente. Para um ordenamento global dos resultados, veja as colunas ordem para os grupos 1, 2 e 3, em quetodososresultadossoconsideradosemconjunto Adicioneostotaisdasordensparacadasituao. CalculeovalordeHapartirdafrmula
T 2 12 c = ________________ __________ - 3 (N + 1) N (N + 1) n c

H
em que: N=nmerototaldesujeitos

N=11 n1=4;n2=3;n3=4

nc=nmerodesujeitosemcadagrupo

Tc=totaldeordensparacadasituao,ouseja, ostotaisdasordensparacadacoluna T1=38;T2=14;T3=14

Tc2=totaldasordensparacadasituao,cadaumelevadoaoquadrado T12=382;T22=142;T32=142

84 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Tc2= somadosquadradosdostotaisdasordensparacadasituaodividido n c pelonmerodesujeitosdessasituao:

382/4 + 142/3 + 142/4 Clculo de H H


12 T 2 c = ____________ ______ - 3 (N + 1) N (N + 1) n c

12

H = _____________________ (382/4 + 142/3 + 142/4 )


11 (11 + 1) 12

- 3 (11 + 1)

H = ___________________ (1444/4 + 196/3 + 196/4 )


132

- 3 x 12

H = 0,091 (361 + 65,33 + 49) 36 H = 43,255 36 = 7,26


Calculeosgrausdeliberdade,ouseja,onmerodesituaes(C)menosuma. gl=C1=31=2

CONSULTA DA SIGNIFICNCIA NA TABELA


A Tabela (Anexo IV) utilizase em experincias com trs grupos de sujeitos, e com um mximo de cinco sujeitos em cada grupo. Para um maior nmero de sujeitos, deve ser utilizada a Tabela do Quiquadrado (Anexo I). Quando no so utilizados mais de trs grupos, poder localizar na coluna da esquerda da Tabela o nmero de sujeitos de cada grupo. Localize ento a combinao que procura (no nosso caso: 4, 4, 3). Note que a ordem do nmero de sujeitos no importante, mas a combinao apropriada na Tabela 4, 4 e 3. Para essa combinao encontrar os valores crticos de H para vrias probabilidades. Se o valor de H que obteve for igual ou superior ao valor crtico de um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso exemplo, o valor obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que podemosaceitarahipteseexperimentalaestenveldesignificncia. Se possuir mais de trs situaes, e/ou sujeitos em cada situao, dever procurar o valor crtico na Tabela do Quiquadrado. Repare que para isso ter que calcular os graus de liberdade. Localize os valores dos graus de liberdade (no nosso exemplo, gl=2) ao longo da coluna do lado esquerdo e verifique ao longo da linha os valores crticos para as diferentes probabilidades. O
85 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

valor que obtivemos H=7,26 superior ao valor crtico de 5,99 para p<=0,05, pelo que podemos aceitar que o resultado significativo a este nvel. Dar conta que esta probabilidade menos significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa Tabela especialmente concebida para nos dar as probabilidades com um pequeno nmero de sujeitos e desituaes. Notar tambm que o teste de KruskalWallis apenas lhe pode dizer que existem diferenas globais nos resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia para consultar pginas com mais ilustraes do que sem ilustraes. Mas para podertestarseessatendnciarealmenteexiste,terdeutilizarumtestedetendncia.

86 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8. TESTES PARA K AMOSTRAS RELACIONADAS


Soestatsticasparacomprovarasignificnciadediferenasentretrsoumaisgrupos,ouseja, para comparar a hiptese de nulidade de que K (3 ou mais) amostras tenham sido extradas da mesmapopulaooudepopulaesidnticas. As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar simultaneamente mais de duas amostras ou condies. Quando se trata de comparar trs ou mais amostras ou condies de um experimento, necessrio aplicar uma prova estatstica que indique se h alguma diferena global entre as K amostras ou condies, antes que possamos cogitardecomprovarasignificnciadadiferenaentreduasamostrasquaisquer. S quando uma prova global (prova de K amostras) nos autoriza a rejeitar a hiptese nula que podemos empregar um processo para determinar diferenas significativas entre duas quaisquer dasKamostras. Estas provas noparamtricas tm a vantagem de permitir o estudo da significncia de dados que,inerentemente,seapresentamapenassobaformaclassificativaouempostos. HdoisplanosbsicosparacompararKgrupos: 1. No primeiro deles, as K amostras de igual tamanho so postas em correspondncia de acordo com determinado(s) critrio(s) que podem afectar os valores das observaes.Nalgunscasos,essacorrespondnciaobtmsecomparandoosmesmos indivduos ou casos sob todas as K condies ou ento cada um dos N grupos pode ser mensurado sob todas as K condies. Em tais planos, devem usarse provas estatsticasparaKamostrasrelacionadas; 2. O segundo plano envolve K amostras aleatrias independentes (no necessariamente do mesmo tamanho), uma de cada populao. Em tais casos, devemosusarasprovasestatsticasparaKamostrasindependentes.

87 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.1 PROVA DE COCHRAN

Quandoutilizar: A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem mais de duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras relacionadas, proporciona um mtodo para comparar se trs ou mais conjuntos correspondentes de frequncias ou propores diferem entre si significativamente. A correspondncia pode basearse em caractersticas relevantes dos diferentes indivduos ou no facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de Cochran adaptase especialmente ao caso em que os dados se apresentam numa escala nominal ousobaformadeinformaoordinaldicotomizada. Exemplo: Suponha que estamos interessados em saber se a atitude de um entrevistador influencia a aceitao de participao num estudo por inqurito. Poderemos treinar o entrevistadorparaefectuarassuasentrevistasdetrsmaneirasdiferentes: 1. 2. 3. Demonstrandointeresse,cordialidade,entusiasmo; Demonstrandoformalismo,reservaecortesia; Demonstrandomodoabrupto,formalismoeaspereza.

88 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: O entrevistador visitaria 3 grupos de 18 casas, aplicando o tipo 1 de entrevista a um grupo, o tipo 2 a outro grupo e o 3 ao terceiro grupo. Teramos, assim, 18 conjuntos de potenciais inquiridos com trs deles correspondendo em cada conjunto. Em cada conjunto atribuirseam aleatoriamente aos trs membros as trs condies (tipos de entrevista). Teramos, ento, 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (N=18). Poderamos, pois, comprovar se as diferenas fundamentais nos tipos de entrevista influenciariam o nmero de respostas afirmativas sim dadas para aceitao de participaopelos3gruposdecorrespondentes.
Quadro 20: Q de Cochran

Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Resposta entrevista 1 1 2 1 1 2 2 2 1 2 1 2 2 2 2 2 2 2 2

Resposta entrevista 2 1 2 2 1 1 2 2 2 1 1 2 2 2 2 2 2 2 2

Resposta entrevista 3 1 1 1 1 1 1 1 1 1 1 2 2 1 1 1 2 1 1

RespostasSim(1)eNo(2)dadaspordonasdecasaatrstiposdeentrevistas

HIPTESE NULA:
AprobabilidadedeumSimamesmaparaostrsgruposdeentrevistas. H1:AsprobabilidadesdeumSimdiferemconformeotipodeentrevista.

PROVA ESTATSTICA:
Escolhese a prova Q de Cochran, porque os dados se referem a mais de dois grupos relacionados(K=3)eapresentamsedicotomizadossobaformaSimeNo.

NVEL DE SIGNIFICNCIA: p=0,01 N=18


89 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

DISTRIBUIO AMOSTRAL:
Sob a hiptese de nulidade, Q tem uma distribuio aproximadamente Quiquadrado com gl=1. Isto , a probabilidade associada ocorrncia, sob Ho, de qualquer valor to grande quanto um valorobservadodeQpodeserdeterminadamedianterefernciaTabela.

REGIO DE REJEIO:
Consiste em todos os valores de Q to grandes quanto a probabilidade associada sua ocorrncia,sobHo,nosejasuperiorap=0,01.

DECISO:
RecodificmosSimpor1eNopor0.
Quadro 21: Q de Cochran

Conjunto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Total

Resposta entrevista 1 0 1 0 0 1 1 1 0 1 0 1 1 1 1 1 1 1 1
G1=13

Resposta entrevista 2 0 1 1 0 0 1 1 1 0 0 1 1 1 1 1 1 1 1
G2=13

Resposta entrevista 3 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 1 0 0
G3=3

Li 0 2 1 0 1 2 2 1 1 0 3 3 2 2 2 3 2 2

Li2 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4

Li=29 Li263

Li=nmerototalderespostasSimparacadalinha K=nmerodecolunas N=nmerodelinhas

90 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Substituindoestesvaloresnafrmula,vem:
(K-1) Q=

[K Gj

( Gj)2

]
=

(3-1)

[ 3X (13

+ 132 + 32) 292

]
= 16,7

_____________________________________________

______________________________________________________

K Li - Li2

3X29 - 63

Emque

K=n.degrupos Gj=n.totaldesucessos

A Tabela (Anexo I) indica que Q 16,7 tem uma probabilidade de ocorrncia, sob Ho, p < 0,001, quando gl=K1=31=2. Essa probabilidade inferior ao nvel de significncia de p=0,01. O valor de Q est na regio de rejeio e, consequentemente, a nossa deciso rejeitar Ho em favor de H1, concluindo que o nmero de respostas Sim difere significativamente em relao aos tipos 1,2e3deentrevista.

RACIONAL
Se os dados de uma pesquisa se dispem numa tabela de dupla entrada com N linhas e K colunas, possvel testar a hiptese de nulidade de que a proporo ou frequncia de respostas de determinado tipo seja a mesma em cada coluna, exceptuando as diferenas devidas ao acaso. Cochran mostrou que se a hiptese de nulidade verdadeira, isto , se no h diferena na probabilidade, digamos de Sucesso sob cada condio (o que equivale a dizer que os Sucessos ou Fracassos se distribuem aleatoriamente pelas linhas e colunas da tabela de duplaentrada),ento,seonmerodelinhasmuitopequeno

K(K-1) Q=

(Gj - G)2

__________________________________________

K Li - Li2

temdistribuioaproximadamenteQuiquadradocomgl=K1,emque: Gj=nmerototaldeSucessosnacolunaj
__

G=mdiadosGj Li=nmerototaldesucessosnalinhai

91 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Umaexpressoequivalentefrmulaanterior,efacilmentededutveldela,masquesimplificaos clculos:

(K-1) Q=

[K Gj ( Gj) ]
2 2

__________________________________________________

K Li - Li2

INSTRUES PASSO-A-PASSO PARA CALCULAR Q


Paradadosdicotomizados,atribuiroscore1acadaSucessoeoscore0acadaFalha. Dispor os dados numa tabela K.N, com K colunas e N linhas (N=nmero de condies em cada umdosgrupos). DeterminarovalordeQ,aplicandoafrmula. AsignificnciadovalorobservadodeQpodeserdeterminadomedianteaobservaodoAnexo I, pois Q recorre distribuio do Quiquadrado com gl=K1. Se a probabilidade associada ocorrncia, sob H0, de um valor to grande quanto um valor observado de Q no supere p, rejeitaseH0.

8.2 TESTE DE FRIEDMAN


Quandoutilizar: Este teste pode ser consideradoumaextensodotestedeWilcoxon,quandonecessrioutilizar trs ou mais situaes experimentais. Deve ser utilizado para um design relacionado quando os mesmos sujeitos (ou sujeitos emparelhados) so distribudos por trs ou mais situaes experimentais.

92 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Suponhaqueumeditordelivrosdeestatisticaproduziuumasriedelivrosequer escolher de entre trs tipos de ilustraes aquele que mais eficaz para os estudantes. pedido a oito universitrios que classifiquem as obras numa escala de cinco pontos, desde nadaboaatmuitoboa.Obtiveramseosresultadosapresentadosnatabelaseguinte.
Sujeitos Quadro 22: Avaliao de trs tipos de ilustraes Situao 1 Situao 2 Situao 3 (Ilustrao A) (Ilustrao B) (Ilustrao C) Result. Ordem Result. Ordem Result. 2 1 3 3 2 1 5 1 18 2,25 1 1 1 2 1 1 3 1 11 5 5 5 5 3 4 3 4 34 4,25 3 3 2,5 3 2 2,5 2 3 21 4 3 5 2 5 4 2 3 28 3,50

Ordem 2 2 2,5 1 3 2,5 1 2 16

1 2 3 4 5 6 7 8

TOTAL MDIA

RACIONAL
Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes,nosentidodeverificarmosemquesituaoobtmmaioresemenoresresultados. Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados de duas situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamento dos resultados de cada sujeito para as trs condies ser feita horizontalmente ao longo das linhas, tal como mostra a tabela. Por exemplo, aos resultados do sujeito 1, respectivamente 2 na Situao 1, 5 na Situao 2 e 4 na Situao 3, so atribudas trs ordens, do menor resultado para o maior: Ordem 1 para a Situao1,Ordem2paraaSituao3eOrdem3 paraaSituao2;esteprocedimentosemelhanteparatodosossujeitos.Claroqueseexistissem quatrosituaesexperimentais,osresultadosdecadasujeitoseriamordenadosde1a4. Oprximopassocalcularostotaisdeordensparacadasituao.Seexistiremapenasdiferenas aleatrias entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperar que estes totais sejam aproximadamente iguais partindo do princpio de que surgiriam algumasordensbaixas(baixosresultados)ealgumasordensaltas(altosresultados).Contudo,se as situaes forem significativamente diferentes, de esperar que se obtenham totais das ordens

93 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

significativamente diferentes, com algumas situaes a terem uma preponderncia de ordens baixas e outras uma preponderncia de ordens altas. O tamanho das diferenas entre os totais das ordens nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for igual ou superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos totaisdasordenssosuficientementegrandesparaquesepossamconsiderarsignificativas.

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Ordeneosresultadosdecadasujeitoemseparado,aolongodecadalinha,atribuindoaOrdem1 aomenorresultadoeporaadiante. (Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados correspondesordens1,2e3,dadoexistiremtrssituaes). Calculeototaldasordensparacadasituao.

CalculeovalordeXR2apartirdafrmula

XR2 = ________________________ Tc2


NC (C + 1)

12

- 3N (C + 1)

emque C=nmerodesituaes N=nmerodesujeitos C=3 N=8 T1=11;T2=21;T3=16 T12=112;T22=212;T32=162

Tc=totaldeordensparacadasituao

Tc2=quadradodototaldeordensparacadasituao

Tc2=somadosquadradosdostotaisdasordensparacadasituao:112+212+162 ClculodeXR2
12 XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1) (8 x 3) (3 + 1) 12 XR2 =
_____________________

(121 + 441 + 256) - (24 x 4)

24 x 4 12 XR2 =
_________________

x 818 - 96

96 XR2 = 6,25

94 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Calculeosgrausdeliberdade,ouseja,onmerodesituaesmenosuma. (gl=C1=31=2)

CONSULTA DA SIGNIFICNCIA NA TABELA


Existem duas tabelas para consultar os valores crticos de Xr2. Uma delas, a Tabela C (Anexo V), utilizada quando o nmero de situaes e de sujeitos pequeno. A Tabela C (1) apresenta os valores de Xr2 para trs situaes quando N (nmero de sujeitos) se situa entre 2 e 9. A Tabela C (2) apresenta os valores de Xr2 para quatro situaes quando N (nmero de sujeitos) de 2, 3 ou 4. A Tabela D (Anexo V) a tabela de distribuio do Quiquadrado; pode utilizla quando a amostra de sujeitos for superior s das Tabelas C (1) e C (2), uma vez que o Xr2 tem uma distribuiosemelhantedoQuiquadrado. A Tabela que deve utilizar para consultar o valor de Xr2, no caso desta experincia, a Tabela C (1),umavezquesetratade8sujeitosexpostosa3situaesexperimentais.Aquiloquetemosde fazer encontrar a coluna apropriada para N (nmero de sujeitos ou pares de sujeitos emparelhados)edescobrirnacolunapaprobabilidademaisprximaquesejainferioraosnveis de significncia convencionais. Consultando as probabilidades para N=8, o valor obtido de Xr2=6,25 equivalente a uma probabilidade de p<0,047, que inferior aos nveis de significncia convencionais (p<0,05=). Para considerarmos o nvel de significncia de p<0,01 o nosso valor de Xr2 teria de ser 9,00, dado que p<0,009 inferior a p<0,01. Se o valor de Xr2 no for apresentado na Tabela, dever considerar o valor seguinte mais prximo quando consulta as probabilidades. Por exemplo, se o valor de Xr2 for 5,95 ter de considerar a probabilidade apresentada para 5,25, ouseja,p<0,079,quesuperiorap<0,05e,consequentemente,nosignificativa.Paraconsultaros valoresdaTabelaC(2)deverprocedertalcomoparaaTabelaC(1). Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer localizar os valores dos graus de liberdade ao longo da coluna da esquerda (no nosso exemplo, gl=2, ou seja, nmero de situaes1). Depois siga ao longo da linha de probabilidades at que encontre um dos nveis de significncia convencionais. O valor que obtivemos de Xr2=6,25 superior ao valor crtico de 5,99 apresentado na Tabela do Quiquadrado, pelo que podemos aceitar que os nossos resultados so significativos ao nvel de significncia de p<0,05. Apesar disso, e dado que o nosso valor de Xr2 inferior ao valor crtico de 9,21 para p<0,01, no podemosrejeitarahiptesenulaaestenveldesignificncia.

95 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A partir da anlise estatstica da experincia pode concluir que as crianas mostram preferncias significativamente diferentes pelos trs tipos de ilustraes. Em funo das mdias apresentadas natabela,sabemosquepreferemaIlustraoB,querecolheuasordensmaiselevadas,seguindo seaIlustraoCe,porltimo,aIlustraoA.Contudo,otestedeFriedmanpodeapenasindicar que existem diferenas globais entre as situaes. Para verificar se existe uma tendncia para uma determinada ordem de preferncia das Ilustraes, necessita de utilizar um teste de tendncia.

96 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

9. MEDIDAS DE CORRELAO E SUAS PROVAS DE


SIGNIFICNCIA
Frequentemente, o investigador quer saber se dois conjuntos de scores esto relacionados e qual ograudesserelacionamento. Apresentamse medidas noparamtricas de correlao e de provas estatsticas para determinar a probabilidade associada ocorrncia de uma correlao to grande quanto a observada na amostra,sobahiptesedenulidadedequeasvariveissejamnorelacionadasnapopulao. Mas de muito maior interesse podermos afirmar se determinada associao observada numa amostra de scores indica, ou no, a probabilidade de associao entre as variveis na populao da qual se extraiu a amostra. O coeficiente de correlao, por si s, representa o grau de associao. As provas de significncia sobre aquele coeficiente determinam, a um certo nvel de probabilidade, se existe a associao na populao da qual se extraiu a amostra que serviu de baseparaoclculodocoeficiente.

9.1 COEFICIENTE DE CORRELAO RHO DE SPEARMANRANK


CONDIES DE UTILIZAO
Estetipodecoeficientedecorrelaoutilizasequandotemos: Teste no paramtrico (semelhante a uma distribuio livre), isto , no coloca restries quantoformadadistribuio;
97 Margarida Pocinho e Joo Paulo de Figueiredo

Escalademedidanomnimoordinal.

ESTATSTICAEBIOESTATSTICA

Pode acontecer que os caracteres estudados no sejam mensurveis, mas podem ser ordenados ou classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podemserexaminadossegundodoispontosdevista:conhecimentosepersonalidade.Estasduas qualidades no podem ser medidas, mas possvel para cada uma delas efectuar uma classificao dos candidatos. Podemos, assim, examinar se existe correlao entre estes dois caracteres; cada par de dados (xi, yi) formado pelas ordens ocupadas por um candidato nas duasclassificaes. Formulrio:
6(di2) =1________________

N(N2-1)

Emque: di=diferenaentreasposiesnasduasvariveis,isto,di=xiyi Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assimsucessivamente. Se as duas classificaes so iguais, di sempre zero e ento r=1 e a correlao perfeita. Se as ordens maisaltasdeumaclasseestoassociadassmaisbaixasdaoutrartornasenegativoese asduasclassificaessoinversas=1. Ento,
-1 1

INTERPRETAO
O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao momentoprodutodeBrawaisPearson(verestecoeficienteemtestesparamtricos).

98 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo:Calcule,sabendoque:
xi yi 18 24 17 27 14 17 13 22 13 19 12 20 11 14 9 11 7 3 5 6

Quadro 23: Coeficiente de Contingncia de RHO de Spearman-Rank

xi 18 17 14 13 13 12 11 9 7 5

posio 1 2 3 4,5 4,5 6 7 8 9 10

yi 24 27 17 22 19 20 14 11 3 6

posio 2 1 6 3 5 4 7 8 10 9

d -1 1 -3 1,5 -0,5 2 0 0 -1 1

d2 1 1 9 2,25 0,25 4 0 0 1 1

=19,5

6x19,5 =1__________________=0,88 10(1021)

9.2 O COEFICIENTE DE CONCORDNCIA DE KENDALL


Quandoutilizar: O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de postosdeNobjectosouindivduos. Quando temos K conjuntos de postos, podemos determinar a associao entre eles utilizandoocoeficientedeconcordnciadeKendall(W).

99 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

RACIONAL E EXEMPLO
Como soluo do problema da determinao da concordncia global entre K conjuntos de postos, poderia parecer razovel determinar os rs entre todos os pares possveis de postos e ento calcular a mdia desses coeficientes para determinar a associao global. Adoptando este procedimento, o processo tornase impraticvel, uma vez que temos de calcular inmeros coeficientes de correlao de postos.

Assim,oclculodeWmuitomaissimpleseWtemumarelaolinearcomovalormdioders relativo a todos os grupos. Denotando rsav o valor mdio dos coeficientes de correlao por postosdeSpearman,Kendalmostrouque KW1 rsav=__________ K1

Outro processo consiste em imaginar como se apresentariam dados se no houvesse concordncia alguma entre os conjuntos de postos e, em seguida, como se apresentariam se houvesse concordncia perfeita. O coeficiente de concordncia seria, ento, um ndice de divergnciaentreaconcordnciaefectivaacusadapelosdadoseaconcordnciamximapossvel (perfeita).Demodoaproximado,Wumcoeficientedestanatureza. Suponhamos que 3 chefes de pessoal estejam encarregados de entrevistar 6 candidatos a emprego e classificlos em postos, separadamente, segundo a capacidade de cada um para preencher a vaga. A tabela seguinte d os 3 conjuntos independentes de postos atribudos pelos chefesdepessoalX,YeZaoscandidatosaaf;altimalinhadatabelaRjdassomasdospostos atribudosacadacandidato.
Quadro 24: Postos atribudos a 6 candidatos a emprego por 3 chefes de pessoal

Candidato a 1 1 6 8 b 6 5 3 14 c 3 6 2 11 d 2 4 5 11 e 5 2 4 11 f 4 3 1 8

Chefe

X Y Z Rj

Se os chefes de pessoal apresentassem perfeita concordncia nos seus julgamentos sobre os candidatos, isto , se tivessem atribudo postos aos candidatos da mesma ordem, ento um candidato teria recebido trs postos 1 e assim a sua soma de postos, Rj, seria 1+1+1=3=K. O candidato que os 3 chefes tivessem considerado em segundo lugar receberia Rj=2+2+2=6=2K e o menospromissordoscandidatosseriaRj=6+6+6=18=NK.
100 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Defacto,nocasodaconcordnciaperfeitaentreos3chefes,asvriassomasdepostos,Rj,seriam 3,6,9,12,15,18, muito embora no necessariamente nesta ordem. Em geral, quando h concordncia perfeita entre K conjuntos de postos, obtemos, para valores significativos de Rj, a sequnciaK,2K,3K,...,NK. Por outro lado, se no tivesse havido concordncia entre os 3 chefes, ento os diversos Rj seriam aproximadamenteiguais. Deste exemplo, vemos que o grau de concordncia entre os K julgamentos reflectido pelo grau de varincia entre as N somas de postos. W, coeficiente de concordncia, funo desse grau de varincia. Assim: S W=____________________

1/12 K2 (N3 N)
emque: S=soma dos quadrados dos desvios observados a contar da mdia dos Rj, isto , S= (Rj Rj/N)2; K=nmerodeconjuntosdepostos; N=nmerodeentidades(objectosouindivduosaqueseatribuempostos); 1/12K2(N3N)=valormximopossveldasomadosquadradosdosdesvios,isto,ovalordeS queocorrerianocasodeconcordnciaperfeitaentreosKconjuntosdepostos.

101 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento, =(8+14+11+11+11+8)/6=10,5

S=(810,5)2+(1410,5)2+(1110,5)2+(1110,5)2+(1110,5)2+(810,5)2= 6,25+12,25+0,25+0,25+0,25+6,25=25,5 Peloque


S 25,5 25,5 W=__________________________=_____________________________=_____________________= 1/12 K2 (N3 N) 25,5 =_______=0,16 157,5 1/12 x 32 (63 6) 1/12 x 9 x 210

W=0,16 exprime o grau de concordncia entre os 3 colegas fictcios ao atriburem postos aos 6 candidatosaemprego.

de salientar que a razo porque W no pode tomar valores negativos que, quando esto em jogo mais de dois conjuntos de postos, esses conjuntos no podem ser completamente discordantes. Por exemplo, se X e Y discordam, e se X tambm discorda de Z, ento Y e Z certamente concordaro. Isto , quando esto em jogo mais de 3 juzes, concordncia e discordncia no so opostos simtricos. K juzes podem todos concordar, mas impossvel todoselesdiscordaremcompletamente.Portanto,Wdeveserzeroouumnmeropositivo. NOTA: Quando ocorrem empates, atribuemse s observaes empatadas a mdia dos postosquelhescaberiamsenohouvesseempates. OefeitodosempatesreduzirovalordeW.Seaproporodeempatespequena,oefeito desprezvel, podendo continuar a usarse a frmula anterior. Se a proporo de empates grande, pode introduzirse uma correco que aumentar ligeiramente o valor de W em relaoaovalorqueseapresentariasemcorreco.Oelementocorrectivo: (t3 t) T=
_________________________

12 Emquet=nmerodeobservaesnumgrupoempatadosemrelaoaumdadoposto

102 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Ento,afrmulaser: S ______________________________________ W= 1/12 K2 (N3 N) - T

INSTRUES PASSO-A-PASSO PARA CALCULAR W


Seja N=nmero de objectos ou indivduos a serem classificados em postos e K=nmero de juzes classificadores.DisporospostosobservadosnumatabeladotipoKXN. ParacadaindivduoouobjectodeterminarRj,somadospostosatribudosqueleindivduopelos Kjuzes. Determinar a mdia dos Rj. Exprimir cada Rj como desvio a contar dessa mdia. Elevar ao quadradoessesdesviosesomlos,obtendoS. SeaproporodeempatesnosKconjuntosgrande,paracalcularWutilizarafrmula

S W=_________________________________ 1/12 K2 (N3 N) - T

Emcasocontrrio,usar
S W=
_______________________________

1/12 K2 (N3 N)

O mtodo para determinar se o valor observado significativamente diferente de zero depende dotamanhodeN: Se N7 a Tabela (Anexo VI) d os valores crticos de S associados com os Ws significativosaosnveisde0,05ede0,01; Se N>7 podemos usar X2 = K (N 1)W para calcular um valor de X2 cuja significncia, para g.l.=N1, possa ser comparada recorrendo Tabela do X2 (AnexoI).

103 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

CONSULTA DA SIGNIFICNCIA NA TABELA


PROVA DE SIGNIFICNCIA
PEQUENAS AMOSTRAS:

Utilizandose a Tabela esta d o valor de S para Ws significativos aos nveis de 0,05 e de 0,01. Esta Tabela aplicvel para K de 3 a 20 e N de 3 a 7. Se um valor observado de S igual ou superior ao valor exibido na Tabela para um dado nvel de significncia, ento H0 pode ser rejeitadaquelenvel. Por exemplo, vimos que quando K=3 chefes de pessoal fictcios classificaram N=6 candidatos a emprego, a concordncia dos julgamentos foi W=0,16. A Tabela indica que o S associado quele valor de W (25,5) no significativo, uma vez que S crtico (103,9) maior do que S observado (25,5). Quando N>7, a distribuio aproximadamente uma distribuio de Quiquadrado com g.l.=N 1,vindo: S 2 _______________________ X = 1/12 KN (N + 1)

Noteseque: S

_____________________________

= K (N 1) W

1/12 KN (N + 1)
E, portanto, X2 = K (N 1) W, pelo que se pode usar esta frmula que mais fcil para determinaraprobabilidadeassociadaocorrncia,sobH0,dequalquervalortograndequanto oWobservado. Se o valor de X2 observado iguala ou supera o valor da Tabela (Anexo I) para um dado nvel de significncia e um particular valor de g.l.=N1, ento Ho (no h relao entre os K conjuntos de postos)podeserrejeitadaquelenvel.
104 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INTERPRETAO DE W
Um valor elevado ou significativo de W pode ser interpretado como indicando que os observadores ou juizes esto aplicando essencialmente os mesmos padres ao atriburem postos aos N indivduos em estudo. Frequentemente a sua ordenao conjunta pode servir como padro,especialmentequandonohcritriosexternosrelevantesparaordenarosindivduos. KendallsugerequeamelhorestimativadaverdadeiraclassificaodeNobjectos,quandoW significativo,sejadadapelaordemdasvriassomasdepostos,Rj.Seseaceitaocritriosegundo o qual diversos juizes concordarem na atribuio de postos a N indivduos, ento a melhor estimativa da verdadeira ordenao desses indivduos segundo aquele critrio dada pela ordemdasomadospostos.Assim,anossamelhorestimativaseriadadaaocandidatoaouf,pois emambososcasosRj=0,omenorvalorobservado.

105 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10. TESTES PARAMTRICOS PASSO-A-PASSO


10.1 CORRELAO
Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que podeexistirumarelaoentreeles. Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que existe uma relao entre eles que constante; neste caso temos dependncia funcional. Isto quer dizer que existe umafrmulaexprimindoamedidadosegundoemfunodadoprimeiro: P=2r. Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a altura mxima da mar no porto da Figueira da Foz e o nmero de passageiros da linha Porto Lisboa. Vse bem que entre as duas estatsticas assim obtidas no se encontranenhumarelao. Diremosqueosdoiscaracteressoindependentes. Mas entre estes dois casos extremos, a dependncia funcional e a independncia, a vida corrente ofereceumgrandenmerodeexemplosondeexisteumarelaoentreoscaracteres,masemque existe uma impossibilidade de a formular por uma lei: o caso da dependncia estatstica. Existe uma dependncia estatstica entre as pessoas que morrem com febre tifide e as pessoas vacinadascontraestadoena. Desde que os dois caracteres sejam tais que as suas variaes sejam sempre no mesmo sentido, ou em sentidos contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos, ento,queelesestocorrelacionadosouqueexisteumacorrelaoentreeles. EstesmtodosdecorrelaoforamcriadosporSirFrancisGalton,quetrabalhoujuntamentecom Pearson,nosfinsdosculoXIX.

106 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo EstatsticaDescritiva.Assim,importafazermosadistinoentreeles: A correlao pode ser definida como o grau de semelhana no sentido das variaes entreosvalorescorrespondentesdosdoiscaracteres,isto,acorrelaopreocupasecom adescriodarelaoentrevariveis. A regresso usada quando tentamos predizer uma varivel quando conhecemos a outra.

TIPOS DE COEFICIENTE DE CORRELAO


Basicamente,podemosconsiderardoistiposdecoeficientesdecorrelao: Coeficiente de correlao momentoproduto de BrawaisPearson, cujo smbolo r, e queumatcnicadeestatsticaparamtrica; Coeficiente de correlao Rho de SpearmanRank, cujo smbolo , e que uma tcnicadeestatsticanoparamtrica. Devemossalientarque,paraoclculodascorrelaes,necessriotermossempreduasmedidas paracadasujeito.

REPRESENTAO GRFICA
representaogrficadacorrelaochamamosdiagramadedispersodepontosouscatterplot ouscattergrame,genericamente,tomaaseguinteforma:
80

70

60

50

40 40 50 60 70 80

Figura 13: Diagrama de disperso de pontos ou scatterplot ou scattergram

107 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Suponhamos que temos duas sries estatsticas formadas pelos valores xi e yi de dois caracteres. Podemos fazer uma representao grfica dos dados representando todos os pontos (xi, yi) e obtendoanuvemdepontos. Segundoosdados,anuvemdepontospodeapresentardiversosaspectos. Por exemplo os pontos podem distribuirse na semelhana de uma linha recta ou de uma curva: istosugereaexistnciadeumarelaofuncionalentreXeY. Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da FigueiradaFozeonmerodepassageirosnalinhaPortoLisboa(independncia).Tambmpode acontecer que os pontos cubram uma poro do plano da qual se pode definir o contorno; esta forma sugere que as duas variveis esto ligadas. Limitemonos ao caso mais simples em que a nuvemtemumaformaalongadalembrandoumaelipseesuponhamosqueasuaorientaotal que desde que X cresa, a varivel Y tambm cresce. A forma desta nuvem sugere a possibilidade da existncia de uma recta tal que os valores estimados por esta recta, a partir dos valoresdexi,sejamboasaproximaesdosvaloresdeyi.Nspodemosdeterminarpelomtodo dos mnimos quadrados uma recta tal que a soma dos quadrados dos desvios seja mnima. Esta rectachamadarectaderegressodeYemXourectadeestimaodeYemX. Mas,poderamos,deummodosemelhante,procurarumarectatalqueosvaloresdexestimados ao longo desta recta, a partir de yi, constituam igualmente boas aproximaes de xi. Esta recta chamadarectaderegressodeXemYourectadeestimaodeXemY. Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe ligao funcional linear e so perpendiculares quando h independncia. Compreendemos, assim, que a correlao entre os caracteres tanto maior quanto maior as rectas de regresso estejammaisprximasumadaoutra.

108 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

COEFICIENTE DE CORRELAO MOMENTO-PRODUTO DE BRAWAIS-PEARSON


Condiesdeutilizao: Estetipodecoeficientedecorrelaoutilizasequando: 1. 2. 3. 4. Formulrio
r= (XY) - X Y N. sx sy

Asduasvariveissocontnuas; Adistribuioseaproximadadistribuionormal; prefervelparadistribuiesunimodais; Escalaintervalardemedida.

Ento:
-1 r 1

Interpretao: Ocoeficientedecorrelaoobtidopodeseinterpretadocombaseem:
Para Cardoso: r0,2

Correlaomuitobaixa(valoresdesprezveis) Correlaobaixa Valoressignificativos Altacorrelao Muitoaltacorrelao

0,2<r0,5 0,5<r0,7 0,7<r0,9 0,9<r1

Para Borg: 0,20<r0,35

Ligeira relao entre as variveis, embora j possam ser estatisticamentesignificativas

0,35<r0,65 Correlaoestatisticamentesignificativaparaalmdonvelde1% 0,65<r0,85 Correlaesquetornampossveisprediesdogrupodequesodignas r>0,85 ntimarelaoentreasvariveiscorrelacionadas

109 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Para Byrman e Cramer, seEta,r,Rho,phi:

0,2 0,2<r0,39 0,4<r0,69 0,7<r0,89 0,9<r1

Correlaomuitofracaesemsignificncia Correlaofraca Correlaomoderada Correlaoforte Correlaomuitoelevada

Coeficientedecorrelaodnos: Adirecoqueindicadapelosinal+ou A intensidade ou fora que dada pelo valor que varia entre1 e 1. Se a correlao for zeronoexistecorrelaoentreasvariveis(exemplo:cordosolhoseinteligncia).
Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas X, Y, Z e W:

Quadro 25: Correlao de Pearson

Estudante 1 2 3 4 5 6 7 8 9 10

X 75 70 70 65 60 60 55 50 50 45 600

Y 75 70 70 65 60 60 55 50 50 45 600

Z 45 50 50 55 60 60 65 70 70 75 600

W 45 50 50 55 60 60 65 70 70 75 600

XY 5625 4900 4900 4225 3600 3600 3025 2500 2500 2025 36900

XZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

XW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

YZ 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

YW 3375 3500 3500 3575 3600 3600 3575 3500 3500 3375 35100

ZW 2025 2500 2500 3025 3600 3600 4225 4900 4900 5625 36900

Sabeseque:

X=60
XY=36900 s2x= 90

Y=60
XZ=35100 s2y= 90

Z=60
s2z= 90

W=60
s2w= 90

a)CalculeocoeficientedecorrelaoentreXeYerepresentegraficamente. b)CalculeocoeficientedecorrelaoentreXeZerepresentegraficamente.

110 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Resoluo 47: a) (XY) - X Y r=_____N______________ sx sy Ento, 36900 _ 60x60 10 r = _________________________________________ 90 x 90 r= = 1 Existe uma relao positiva muito forte entre X e Y b) r= Ento, 35100 _ 60x60 10 r=
________________________________________

(XZ) - X Z N .. sx sZ

90 x 90 r= = -1

Existe uma relao negativa muito forte entre X e W, isto , quanto maior X menor Y e vice versa.

10.2 TESTE T DE STUDENT (NO RELACIONADO)

CARACTERSTICAS DO TESTE T:
1. 2. Testeparaacomparaodemdias; Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais grossasdoquenadistribuionormal; 3. 4. 5. 6. 7. Contnua; Simtrica; Deformacampanular; Variademaisinfinitoamenosinfinito; Mdia=0edesviopadrodavariveldeacordocomn;

111 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

8.

O uso de T pressupe que a varivel observacional tenha na populao (de onde foi colhidaaamostra)distribuionormal;

9.

No existe uma distribuio t, mas sim uma famlia. Para cada n tamanho da amostraexisteumadistribuio(umacurva)especfica;

10. medida que n cresce, t tende a z (a aproximao entre t e z comea a ficarboa a partirden>=30). Requisitosparautilizarotestet: 1.Quandoasduasamostrastmamesmahomogeneidadedevarincia; 2.Osdoisgrupostenhamamesmadistribuioaproximadanormalleptocrtica; 3.Escalademedidaintervalar.

QUANDO UTILIZAR
Utilizase para designs experimentais com duas situaes testando uma varivel independente, quandonessassituaesseencontramsujeitosdiferentesdesignsnorelacionados. O teste t no relacionado equivalente ao teste no paramtrico U de MannWhitney; ambos comparamdiferenasentredoisgrupos.

OBJECTIVO
O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos resultados entre dois grupos com a variabilidade total nos resultados dos sujeitos. As diferenas previstassocalculadascomoumadiferenaentreosresultadosmdiosentreosdoisgrupos. A estatstica t representa o tamanho da diferena entre as mdias para os dois grupos, tomando em considerao a varincia total. Para que o valor observado de t seja significativo ter de ser igualousuperioraosvalorescrticosdetapresentadosnatabela.

112 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

INSTRUES PASSO-A-PASSO
Elevaraoquadradocadaresultadoindividualparaambososgruposemseparado: 1. 2. 3. 4. Adicionarostotaisdosresultadosaoquadradoparacadagrupo; Elevaraoquadradotodososresultadosindividuaisparacadagrupo; Calcularamdiaparacadagrupo; Calculart:

1 - 2 t = _________________________________________________________________ x12 - ( x1)2 + x22 - ( x2)2 ______ ______ n1 n2 1 1 ____________________________________ __ + __ (n1 - 1) + (n2 - 1) n1 n2

emque: n1=nmerodesujeitosdogrupo1 n2=nmerodesujeitosdogrupo2 1=mdiadogrupo1 2=mdiadogrupo2

x12=somadosquadradosparaogrupo1 x22=somadosquadradosparaogrupo2
(x1)2=resultadostotaisdogrupo1aoquadrado (x2)2=resultadostotaisdogrupo2aoquadrado

Calcularg.l.:

g.l.=(n11)+(n21)

Setobservado>tcrticorejeitaseHo Setobservado<tcrticonoserejeitaHo

113 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: para verificar se duas dietas para emagrecer so igualmente eficazes, um mdico separou ao acaso um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para o seu grupodurante4meses.Omdicoregistouaperdadepesoemkgdecadapacienteporgrupo.Osdados estoapresentadosnoquadroquesesegue:
Quadro 26: Teste t no relacionado

______________________________________________________________________________________ Grupo 1 (dieta 1) Grupo 2 (dieta 2) ______________________________________________________________________________________ Resultados Resultados Resultados Resultados ao quadrado ao quadrado 10 100 2 4 5 25 1 1 6 36 7 49 3 9 4 16 9 81 4 16 8 64 5 25 7 49 2 4 5 25 5 25 6 36 3 9 5 25 4 16 _____________________________________________________________________________________ Total x1 = 64 x12 = 450 x2 = 37 x22 = 165 2 Mdia 1 = 6,4 = 3,7

InstruesPassoaPasso: 1.construiratabela 2.x1=64 x2=37 x12=450 x22=165

3.(x1)2=64X64=4096 (x2)2=37X37=1369

4.1=6,4

2=3,7

114 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

6,4 - 3,7 t = _________________________________________________________ = 450 - 4096 + 165 - 1369 ______ ______ 10 10 _______________________________ 9+9 2,7 = ______________ 3,806. 0,2 6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18 = 3,547

1 __ 10

1 + __ 10

O valor de t observado (3,547) superior ao valor crtico de 2,878 (Anexo VII), indicando um nvel de significncia de p < 0,05 para uma hiptese unicaudal ou p < 0,01 para uma hiptese bicaudal.

10.3 TESTE T DE STUDENT (RELACIONADO)

Quandoutilizar: Utilizase para designs experimentais com duas situaes testando uma varivel independente, quando os mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes design relacionado.OtestetrelacionadoequivalenteaotestenoparamtricodeWilcoxon.

OBJECTIVO
O objectivo comparar as diferenas entre as duas situaes experimentais com a variabilidade total nos resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem compararse pares de resultados obtidos por cada indivduo quando sujeito a ambas as situaes.

115 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

A estatstica t apresenta o tamanho das diferenas entre os resultados dos sujeitos para as duas situaes.Paraquesejasignificativoovalordetterdeserigualousuperioraosvalorescrticos databela(AnexoVII).

INSTRUES PASSO-A-PASSO
1. Calcular as diferenas entre os resultados dos sujeitos subtraindo os resultados da situao B paraasituaoA 2.Elevaressasdiferenasaoquadrado 3.Calcularosomatriodasdiferenasobtidas(d) 4.Calcularosomatriodoquadradodasdiferenas(d2) 5.Elevaraoquadradoasdiferenastotais(d)2 6.Calculart:
d t=
___________________________________

N d2 ( d)2 N-1

emque 7.Calcularg.l.: Setobservado>tcrticorejeitaseH0 Setobservado<tcrticonoserejeitaH0 g.l.=N1

d=somadasdiferenasdosresultadosAeB d2=somadosquadradosdasdiferenas
(d)2=somadasdiferenaselevadasaoquadrado N=nmerodesujeitos

116 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Exemplo: Para verificar se a eficcia de uma dieta era influenciada pelo ministrar de um frmaco, um mdico decidiu administrar, a um grupo de individuos que o tinham procurado para perder peso, um placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos. Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar gorduras. Registou a perda de peso que tinha ocorrido nos 30 dias antecedentes tomada de placebo e trinta dias apsoplacebo.Osresultadosestonoquadroquesesegue

Quadro 27: Teste t relacionado

Situao A Situao B d d2 (com placebo) (s com dieta) (A-B) ____________________________________________________________________________ 1 10 2 8 64 2 5 1 4 16 3 6 7 -1 1 4 3 4 -1 1 5 9 4 5 25 6 8 5 3 9 7 7 2 5 25 8 5 5 0 0 9 6 3 3 9 10 5 4 1 1 ___________________________________________________________________________ Total 64 37 d=27 d2=151 Mdia6,43,7 Resoluo50: InstruesPassoaPasso:

Sujeito

1.construirtabela 2.calcularasmdias 3.d=27 4d2=151 5.(d)2=27x27=729

6. proceder aos calculos 27 t=


____________________________-

27 =
_______________

= 27 / 9,316 = 2,90

10 x 151 (27)2 10 - 1 7. g.l. = N - 1 = 10 - 1 = 9

86,78

117 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Como o valor observado de t de2,90superioraovalorcrticode2,821aonveldesignificncia de p < 0,01 (unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o placebo,omdicoconcluiuqueoefeitodeplacebopositivonaperdadepeso O ponto 10.3 explica como comparar mdias de duas populaes, com base em amostras dessas populaes. Mas s vezes preciso comparar mdias de mais de duas populaes. Por exemplo, para verificar se pessoas com diferentes nveis socioeconmicos, isto , alto, mdio e baixo tm, emmdia,omesmopesocorporal,precisocompararmdiasdetrspopulaes. Para comparar mdias de mais de duas populaes aplicase o teste F, na forma que a seguir se descreve, desde que a varivel em estudo tenha distribuio normal ou aproximadamente normal.Masantesdemostrarcomosefazesseteste,convmapresentarumexemplo.
Imaginequequatrogrupos,todascomcincoelementos,conduziramaosdadosapresentadosnoquadro 28. As mdias dessas amostras esto na ltima linha desse quadro. Ser que as diferenas das mdias das amostras so suficientemente grandes para que se possa afirmar que as mdias das populaes so diferentes?Pararesponderaestapergunta,precisoumtesteestatstico.

Quadro 28: Dados de 4 amostras e respectivas mdias

A 11 8 5 8 8 40 8

B 8 5 2 5 5 25 5

C 5 7 3 3 7 25 5

D 4 4 2 0 0 10 2

118 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4 ANLISE DE VARINCIA

10.4.1 Anlise da Varincia com Igual Tamanho


Se a varivel em estudo tem distribuio normal ou aproximadamente normal, para comparar maisdeduasmdiasaplicaseotesteF. Primeiro, preciso estudar as causas de variao. Por que os dados variam? Uma explicao o facto de as amostras provirem de populaes diferentes. Outra explicao o acaso, porque at mesmoosdadosprovenientesdeumamesmapopulaovariam. O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos tratamentos (no exemplo, devido s amostras terem provindo de populaes diferentes) da variabilidade residual, isto , devido ao acaso. Para aplicar o teste F preciso fazer uma srie de clculos,queexigemconhecimentodanotao. .

O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo, denominamse repeties os elementos da mesma amostra). A soma das repeties (r) de um mesmotratamentoconstituiototaldessetratamento(T).Ototalgeral(T)dadopelasomadosk totaisdetratamentos.

Quadro 29: Notao para anlise da varincia

1 x11 x12 . . . x1r Total N. de repeties Mdia T1 r 1

2 X21 X22 . . . X2r T1 r 2

3 X31 X32 . . . X3r T1 r 3

... ... . . .

K xk1 xk2 . . . Xkr T1 r k

Total

T=x N=kr

Parafazeraanlisedevarinciaprecisocalcularasseguintesquantidades:
119 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

1.passo: a) b) c) 2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido pelonmerodedados. osgrausdeliberdade(gl)dosgrupos:k1 gldototal:n1 gldosresiduos:(n1)(k1)=nk

FORMULA:

C = (x)2 n

b)

calcularaSomadosQuadradosTotal(SQT)

FORMULA:
c)

SQT = x2-C

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

FORMULA:

SQTr = T2 - C r

d)

calcularaSomadosQuadradosdosResduos(SQR)

FORMULA:
e)

SQR = SQT-SQTr

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

FORMULA:

QMTr = SQTr k-1

f)

calcularoQuadradomdiodoTotaldoResiduo(QMR)

FORMULA:

QMR = SQR n-k

120 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

g)

calcularovalordeF

FORMULA:

F = QMTr QMR

3.Passo:compararoFcalculadocomovalordadonatabeladeF,aoniveldesignificncia estabelecido,observandoosk1grausdeliberdadenonumeradoreosnkgrausdeliberdadeno denominador(colunadaesquerda).


Exemplo: Um profissional de sade recm contratado para acompanhar um conjunto de atletas de alta competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o mesmo tipo de leso (em grau e extenso) tinham mais recidivas que outros, apesar das condies de treino e o tempo de recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia dever s diferentes teraputicas que eram utilizadas para tratar asmesmasleses.Osresultadospodem serobservadosnoquadroquesesegue:

Quadro 30: recidivas por tratamento

Tratamento A 11 8 5 8 8 40 8

Tratamento B 8 5 2 5 5 25 5

Tratamento C 5 7 3 3 7 25 5

Tratamento D 4 4 2 0 0 10 2

1.passo: a) b) c) osgrausdeliberdade(gl)dosgrupos:k1=41=3 gldototal:n1=201=19 gldosresiduos:nk=204=16

121 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedivididopelo nmerodedados.

C = (x)2 = (11+8+5+4+8+5+7+4+5+2+3+2+8+5+3+8+5+7)2 = 1002 = 500 N 20 20

b)

calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C = 112+82+52+42+82+52+72+42+52+22+32+22+82+52+32+82+52+72 - 500 = 658-500 =158

c)

calcularaSomadoQuadradodoTotaldecadarepetio(SQTr)

SQTr = T2 C = 402+252+252+102 - 500 R 5 = 590-500 = 90


d) calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 158-90 = 68

e)

calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 90 = 30 k-1 3

f)

calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 68 = 4,25 n-k 16

g)

calcularovalordeF

F = QMTr = 30 = 7,06 QMR 4,25


122 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3. passo: ir tabela F para um nvel de significncia (p) de5%(0,05)eobservarqualoFterico para 3 e 16 graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela (3,24), conclumos que as mdias das recidivas diferem em funo do tratamento, para um nvel designificnciade0,05. A acompanhar este comentrio, os valores calculados devem ser apresentados num quadro, da seguinteforma:
Quadro 31: ANOVA

Causas de gl variao Tratamentos Resduo Total 3 16 19 90 68 158 30 7,06 4,25 <0,05 SQ QM F p

Mas, como se pode observar, apesar da tabela mostrar que existem diferenas significativas, no nosinforma,quetratamentosqueproduzemdiferenasequaissosemelhantes.Semprequeas diferenas so significativas, e s nesse caso, temos que proceder s comparaes posteriori (PostHoc). Podemonos socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey; etc.), a grande diferena entre eles reside no tipo de distribuio em que assentam e no tipo de ajustamento). Apresentaremos de seguida apenas o teste de Tukey, por ser dos mais utilizadoseomaissimplesdecalcular,quandorecorremosaoclculomanual.

10.4.1.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


O teste Tukey permite estabelecer a diferena mnima significante, ou seja, a menor diferena entre as mdias que deve ser tomada como significativa em determinado nvel de significncia. Essadiferena(dms)dadapor:

dms =q

QMR r

Ondequmvalordadoemtabela(Anexo____) QMRoquadradomdiodoresiduodaANOVA ronmeroderepeties

123 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

assim,seconsultarmosatabelaverificamosqueoqparacompararquatrotratamentoscom16gl noresiduode4,05.comoQMR=4,25er=5,temos:

dms =4,05 4,25 = 3,73 5

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor absolutodadiferenaentreelasforigualousuperioraovalordadms. Passemosentoobservaodosvalores:

Quadro 32: post-hoc das recidivas

Pares de mdias A-B A-C A-D B-C B-D C-D

Valor absoluto da diferena (8-5) 3 (8-5) 3 (8-2) 6 (5-5) 0 (5-2) 3 (5-2) 3

dms

p ns ns <0,05 ns ns ns

3,73

fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos tratamentos D, em que o tratamento D aquele com que se obtm, significativamente, menos recidivas

124 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS


Opesquisador,nemsempretemamostrasdomesmotamanho,mesmoassimpossivelconduzir uma anlise da varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da mesmaformaemambasassituaes. Assimemvezdefazerasomadosquadradospelafrmula

SQTr = T2 - C r

Utiliza: FORMULA: SQTr = T12 + T22 ++ Tk2 r2 rk r1


Onde C a correco definida anteriormente

-C

Paramaisfcildeentenderobserveoseguinteexemplo:

Quadro 33: mdias por tratamento

Tratamento A 15 10 13 18 15 84

Tratamento B 23 16 19 18

Tratamento C 19 15 21 14 16

76

85

1.passo: a) b) c) osgrausdeliberdade(gl)dosgrupos:k1=31=2 gldototal:n1=151=14 gldosresiduos:nk=142=12

125 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

2.passo: a) calcularovalordeCorreco(C)quedadopelototalgeralaoquadradoedividido pelonmerodedados.

C = (x)2 = 2452 = 4001,67 n 15

b) calcularaSomadosQuadradosTotal(SQT)

SQT = x2-C = 152+102+132++162 4001,67 =159,33


c) calcularaSomadoQuadradodoTotaldecadarepetio(SQTrat)

SQTrat = T12 + T22 ++ Tk2 - C r2 rk r1 SQTr = 842+762+852 4001,67 6 4 5 = 63,33


d) calcularaSomadosQuadradosdosResduos(SQR)

SQR = SQT-SQTr = 159,33-63,33 = 96


e) calcularoQuadradomdiodoTotaldecadarepetio(QMTr)

QMTr = SQTr = 63,33 = 31,67 k-1 2

f) calcularoQuadradomdiodoResduo(QMR)

QMR = SQR = 96 = 8 n-k 12

g) calcularovalordeF

F = QMTr = QMR

31,67 8

= 3,96

126 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

3. passo: ir tabela F para um nvel de significncia (p) de5%(0,05)eobservarqualoFterico para 2 e 12 graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela (3,89), conclumos que as mdias dos sujeitos diferem em funo do tratamento, para um nvel designificnciade0,05. Osvalorescalculadosdevemserapresentadosdaseguinteforma:

Quadro 34: ANOVA

Causas de variao Tratamentos Resduo Total

gl 2 12 14

SQ 63,33 96 159,33

QM 31,67 8

F 3,96

p <0,05

Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post Hoc).OresultadodotestedeTukeyoseguinte:

10.4.2.1 TESTE DE TUKEY PARA COMPARAO ENTRE AS MDIAS


OtesteTukeyparaamostrascomtamanhosdiferentesdadapelaseguintefrmula:

dms =q

1+ 1 ri rj

QMR 2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeBtemse:

dms (A;B) =3,77 dms (A;B) =4,87

1 + 6

1 4

8,00 2

Nocasodoexemplo,paracompararamdiadeAcomamdiadeCtemse:

dms (A;C) =3,77 dms (A;C) =4,57

1+ 6

1 8,00 5 2

Nocasodoexemplo,paracompararamdiadeBcomamdiadeCtemse:

127 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

dms (B;C) =3,77 dms (B;C) =5,06

1 + 4

1 5

8,00 2

DeacordocomotestedeTukey,duasmdiassoestatisticamentediferentessemprequeovalor absolutodadiferenaentreelasforigualousuperioraovalordadms. Passemosentoobservaodosvalores:

Quadro 35: post-hoc

Valor absoluto da Pares de mdias diferena A-B A-C B-C |14-19| = 5 |14-17| = 3 |19-17| = 2 4,87 4,57 5,06 <0,05 ns ns dms p

ConcluisequeemmdiaAsignificativamentediferentedeB,aonveldesignificnciade0,05.

128 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

ANEXOS

129 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo I
TABELADOQUIQUADRADO(X2)

130 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo II
TABELADEU

131 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo III
TABELADEWILCOXON

132 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IV
TABELAH

133 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo V
TABELASDEFRIEDMAN

134 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VI
TABELAS(TABELADEKENDAL)

135 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VII
TABELAT

136 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo VIII
TABELAZ

137 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo IX
TABELAF

138 Margarida Pocinho e Joo Paulo de Figueiredo

ESTATSTICAEBIOESTATSTICA

Anexo X
TABELADOSVALORESDEq

139 Margarida Pocinho e Joo Paulo de Figueiredo

You might also like