Sum´rio a

1 Defini¸˜es e Conceitos em Bioestat´ co ıstica Aplicada 1.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . ca 1.2 Estat´ ıstica M´dica . . . . . . . . . . . . . . . . . . . e 1.3 Dados Biom´tricos . . . . . . . . . . . . . . . . . . . e 1.4 Os Conceitos da Bioestat´ ıstica . . . . . . . . . . . . 1.4.1 Popula¸˜o . . . . . . . . . . . . . . . . . . . . ca 1.4.2 Censo . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Amostra . . . . . . . . . . . . . . . . . . . . . 1.4.4 Parˆmetros . . . . . . . . . . . . . . . . . . . a 1.4.5 Estimativas dos Parˆmetros ou Estat´ a ıstica . . 1.4.6 Unidade de Amostragem . . . . . . . . . . . . 1.4.7 Vari´veis . . . . . . . . . . . . . . . . . . . . a 1.4.8 Vari´veis Aleat´rias (v.a.) . . . . . . . . . . . a o 2 Experimenta¸˜o Biom´trica ca e 2.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . ca 2.2 O Racioc´ ınio Indutivo da Biometria . . . . . 2.3 Delineamentos Experimentais . . . . . . . . . 2.3.1 Etapa de um levantamento estat´ ıstico 2.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o 2.4.1 Estudo de Caso-Controle . . . . . . . 2.4.2 Estudo de Coorte . . . . . . . . . . . . 2.4.3 Ensaios Cl´ ınicos Aleatorizados . . . . 2.4.4 Estudos Descritivos . . . . . . . . . . 2.4.5 Seccionais ou Transversais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 3 5 5 5 5 5 5 5 6 7 7 7 7 8 10 11 13 16 17 18 20 20 20 21 23 24 26 27 27 30 32 32 34 36

3 Estat´ ıstica Descritiva 3.1 Organiza¸˜o de Dados Estat´ ca ısticos . . . . . . . . . . . 3.1.1 Normas para a Apresenta¸˜o Tabular de Dados ca 3.2 Distribui¸˜o de Freq¨ˆncias . . . . . . . . . . . . . . . ca ue 3.3 Gr´ficos . . . . . . . . . . . . . . . . . . . . . . . . . . a 3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . 3.3.2 Histograma . . . . . . . . . . . . . . . . . . . . 3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . 3.4.1 Medidas de Tendˆncia Central ou de Posi¸˜o . e ca 3.4.2 Medida de Variabilidade ou de dispers˜o . . . . a 3.5 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . 3.5.1 Quartis, Decis e Percentis . . . . . . . . . . . . 3.5.2 Medidas de Simetria . . . . . . . . . . . . . . . 3.5.3 Medidas de Curtose . . . . . . . . . . . . . . .

1

4 Inferˆncia Estat´ e ıstica 4.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . ca 4.2 Problemas de Inferˆncia . . . . . . . . . . . e 4.3 Distribui¸˜o Amostral . . . . . . . . . . . . ca 4.4 Distribui¸˜es de Probabilidade . . . . . . . co 4.4.1 Distribui¸˜o Binomial . . . . . . . . ca 4.4.2 Distribui¸˜o de Poisson . . . . . . . ca 4.4.3 Distribui¸˜o Normal . . . . . . . . . ca 4.5 Verifica¸˜o da Adequa¸˜o do Modelo . . . . ca ca 4.6 Faixas de Referˆncia . . . . . . . . . . . . . e 4.7 Teorema do Limite Central . . . . . . . . . 4.8 Tamanho da Amostra . . . . . . . . . . . . 4.8.1 M´todo simples . . . . . . . . . . . . e 4.8.2 M´todo inferencial . . . . . . . . . . e 4.9 Testes de Hip´teses . . . . . . . . . . . . . . o 4.9.1 Constru¸˜o de um Teste de Hip´tese ca o 4.9.2 O p-valor . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

38 38 38 39 39 39 40 40 42 42 44 45 45 46 48 48 50

5 An´lise em Tabelas 2x2 e LxC a 51 5.1 Tabelas de Contingˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 e 5.2 Teste de Independˆncia e de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 e 6 Compara¸˜es Entre Grupos co 6.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ca 6.2 Resposta Dicotˆmica: Amostras Independentes . . . . . . . . . . . . . . . . o 6.2.1 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.3 Teste z para Compara¸˜o de Propor¸˜es . . . . . . . . . . . . . . . . ca co 6.3 Resposta Dicotˆmica: Amostras Pareadas . . . . . . . . . . . . . . . . . . . o 6.3.1 Teste de McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Resposta Cont´ ınua - Teste de M´dias para Amostras Independentes . . . . e 6.4.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Teste z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Resposta Cont´ ınua - Teste de M´dias para Amostras Pareadas . . . . . . . e 6.5.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Testes N˜o-Param´tricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a e 6.6.1 Teste U de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . 6.6.2 Teste H de Kruskal-Wallis para k amostras . . . . . . . . . . . . . . 6.6.3 Teste de Wilcoxon (Amostras Pareadas ou dependentes) . . . . . . . 6.6.4 Teste de Friedman para k tratamentos . . . . . . . . . . . . . . . . . 6.7 Outros Testes N˜o-Param´tricos . . . . . . . . . . . . . . . . . . . . . . . . a e 6.7.1 Teste de Concordˆncia ou de Replicabilidade (Coeficiente de Kappa) a 6.7.2 Teste de Cochran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 An´lise de Variˆncia a a 7.1 An´lise de Variˆncia para Experimentos ao Acaso . . . . . a a 7.2 Teste Param´trico para Compara¸˜es M´ltiplas . . . . . . e co u 7.2.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . 7.2.2 Teste Dunnett . . . . . . . . . . . . . . . . . . . . 7.3 Teste N˜o-Param´trico para Compara¸˜es M´ltiplas . . . a e co u 7.3.1 Teste Dunn-Bonferroni . . . . . . . . . . . . . . . . 7.4 An´lise de Variˆncia com N´mero Diferente de Repeti¸˜es a a u co 7.4.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . 7.4.2 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 61 61 63 65 65 66 67 67 68 69 69 71 71 74 75 78 79 79 80 83 83 86 86 88 89 89 91 93 94 94

2

8 Testes Cl´ ınicos 8.1 Introdu¸˜o . . . . . . . . . . . . . . . . . . . . . . . ca 8.2 Testes Diagn´sticos . . . . . . . . . . . . . . . . . . o 8.2.1 Sensibilidade e Especificidade . . . . . . . . 8.2.2 Valor das Predi¸˜es: VPP e VPN . . . . . . co 8.2.3 Decis˜es Incorretas: PFP e PFN . . . . . . o 8.2.4 Combina¸˜o de Testes Diagn´sticos . . . . ca o 8.2.5 Escolha entre Testes Diagn´sticos . . . . . . o 8.2.6 Rela¸˜o entre Sensibilidade e Especificidade ca 8.2.7 Curva ROC . . . . . . . . . . . . . . . . . . Referˆncias Bibliogr´ficas e a

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

95 . 95 . 95 . 96 . 97 . 98 . 98 . 101 . 104 . 104 107

3

u e ca c se est´ usando um m´todo estat´ a e ıstico. que cada vˆz que se toma a m´dia de duas leituras de pipeta. Quando um m´dico. Podemos encontrar muitos professores. a ca e e co o tem produzido um grande ceticismo em rela¸˜o ` estat´ ca a ıstica. e a e que qualquer coisa que exija prova estat´ ıstica n˜o pode ter valor pr´tico ou que procurar˜o um matem´tico a a a a se tiverem algum problema estat´ ıstico em seu trabalho. jornais e revistas m´dicas.Cap´ ıtulo 1 Defini¸˜es e Conceitos em co Bioestat´ ıstica Aplicada 1.2 Estat´ ıstica M´dica e A m´ utiliza¸˜o de dados m´dicos ou de outras ciˆncias. ou seja. na sua pr´tica profissional e de modo especial no avan¸o do a e a c conhecimento nesta ´rea espec´ a ıfica. argumenta-se que conceitos estat´ e ısticos tˆm importante papel a e desempenhar. a incidˆncia de ca o a e tumores por idade e por fam´ ılia. com interpreta¸˜es errˆneas ou mal intencionadas. Este objetivo ser´ alcan¸ado principalmente atrav´s da apresenta¸˜o e discuss˜o dos resultados de esa c e ca a tudos relevantes. Dever´ estar apto a responder ` pergunta da m˜e que o consulta e a a a 1 . tanto no estudo da sa´de de popula¸˜es. no entanto.1 Introdu¸˜o ca O objetivo deste cap´ ıtulo ´ ilustrar o papel que conceitos e t´cnicas estat´ e e ısticas tˆm na forma¸˜o do e ca estat´ ıstico especializado na ´rea biom´trica. depois de formado depender´ e e a necessariamente de trabalhos apresentados em reuni˜es. Do mesmo modo. usamos m´todos estat´ e ısticos para concluir que a press˜o arterial do paciente est´ normal ou que um tratamento cir´rgico ´ melhor que outro. e e por exemplo. Isto ´ ´bvio em pesquisa e verdadeiro ca e o tamb´m no diagn´stico. Convencionou-ser chamar de Bioestat´ ıstica o conjunto de conceitos e m´todos cient´ e ıficos usados no tratamento da variabilidade nas ciˆncias m´dicas e biol´gicas. dever´ decidir quando uma nova t´cnica o a e ou m´todo pode substituir os antigos. O estudante aprende na escola o melhor m´todo de diagnose e terapˆutica. u co 1. A Bioestat´ e e o ıstica fornece m´todos para se tomar e decis˜es ´timas na presen¸a de incerteza. Atrav´s destes exemplos. estabelecendo faixas de confian¸a para a efic´cia dos tratameno o c c a tos e verificando a influˆncia de fatores de risco no aparecimento de doen¸as. examinando um n´dulo no seio de uma paciente. como nos tratamentos individuais. de contagem ou mensura¸˜o. ou o n´mero m´dio de dias de interna¸˜o no hospital de pacientes com determinada doen¸a. Deste modo. assim como os progressos em diagnose e t´cnica cir´rgica. a a u e a Estat´ ıstica M´dica se constitui realmente nos princ´ e ıpios da Medicina Quantitativa. Portanto. Dentro da ´rea biol´gica. Muito da medicina depende. dever´ estar apto e e u a a avaliar por si pr´prio os resultados de outros pesquisadores. e A ˆnfase crescente do papel dos m´todos quantitativos na pr´tica da medicina torna imperativo que o e e a estudante de medicina assim como o m´dico tenham algum conhecimento de estat´ e ıstica. e c a o compreende-se por Biometria a ciˆncia que estuda as medidas de seres vivos. cl´ ınicos ou mesmo profissionais de ciˆncias b´sicas. ´ E importante compreender. leva em e o e o considera¸˜o sua idade e hist´ria familiar. para aprender novos o e m´todos de terapia. logo est´ usando dados quantitativos. direta ou indiretamente. que acham que “bom senso” ´ suficiente para tratar desses dados.

ca ca e 1. ca c Sempre que novos m´todos de terapia s˜o introduzidos. com a mesma seguran¸a. a M´todos estat´ e ısticos s˜o essenciais no estudo de situa¸˜es em que as vari´veis de interesse est˜o sujeitas. mas a quest˜o que desafia o ca e a m´dico ´ determinar quando uma varia¸˜o espec´ e e ca ıfica se torna patol´gica (referente ` doen¸a). atrav´s de t´cnicas estat´ ca e e ısticas adequadas. Assim. No entanto. Para cada medida ou e a o determina¸˜o fornecida pelo laborat´rio. ca o e ca e o e para saber quando uma dada varia¸˜o representa uma mudan¸a real no paciente.3 Dados Biom´tricos e ROSSI. Dever´ estar apto a dar ` fam´ do paciente seguran¸a quanto ao diagn´stico. s˜o freq¨entemente medidas como vari´veis categ´ricas. entretanto. ´ o reconhecimento de c˜ a a e e que os indiv´ ıduos diferem n˜o apenas uns dos outros. 2 sobre a vacina mais recente e. mil´ ımetros etc. o m´dico se vale da experiˆncia de eventos antee e riores. por´m. O dado qualitativo est´ fortemente presente nas ciˆncias da sa´de. ser capaz de selecionar. Os ca co c novos conhecimentos vir˜o atrav´s do trabalho de pesquisa realizado por ele pr´prio ou por outros. o o a c estudante deve aprender como medir a varia¸˜o em indiv´ ca ıduos normais e definir qual ´ o limite de varia¸˜o e ca ´ normal. Deve desenvolver um ceticismo sadio em rela¸˜o a tudo que lˆ. de animais experimentais e de fenˆmenos a e o o f´ ısicos e qu´ ımicos. a co a a inerentemente. no tempo de e sobrevida ap´s um tratamento adequado. verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos. Este ´ o caso da ´rea da sa´de principalmente na Medicina. Na realidade. causas de morte etc. no Hava´ decidiu-se pesquisar os pacientes com ı. por exemplo. como a a e ca a e a estat´ ıstica. aquelas que forem v´lidas e que resistirem a co a testes cient´ ıficos r´ ıgidos.1.3 Dados Biom´tricos e Nas ´reas m´dica e biol´gica coletam-se dados de pessoas. Portanto. ısticas de homens com Exemplo 1. Para ajudar o estudante a desenvolver tal atitude s˜o necess´rios certos conceitos estat´ a a ısticos b´sicos e uma certa familiaridade com a terminologia mais usada. Para isso. e a Deve-se notar. e O n´mero de falhas encontradas em publica¸˜es m´dicas enfatiza a necessidade de uma avalia¸˜o cr´ u co e ca ıtica da literatura. que ao tratar um paciente. classificadas e c a como qualitativas. vivenciada pessoalmente ou transmitida por outros atrav´s de livros e artigos. As caracter´ ısticas de interesse eram: . Deve aprender que h´ algum erro aleat´rio presente em cada medida ou contagem feita. c doen¸as. h´ varia¸˜es entre o a co diferentes pacientes para qualquer vari´vel de interesse cl´ a ınico. a flutua¸˜es aleat´rias. o que pode depender a a ılia c o de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais. ca e Uma no¸ao b´sica em planejamentos experimentais referentes ` pesquisa m´dica. como tamb´m no mesmo indiv´ e ıduo em ocasi˜es diferentes. eficiˆncia de a e medicamentos. as ciˆncias da sa´de ainda mostram preferˆncia pelas medidas cont´ a e u e ınuas de alta precis˜o: medir a em miligramas. Ser´ nacess´rio fazer-se a avalia¸˜o cr´ e e a a ca ıtica do estudo experimental. Com o objetivo de levantar conhecimento sobre algumas caracter´ doen¸as card´ c ıacas da cl´ ınica especializada de Honolulu. observa-se grande variabilidade. E altamente a o improv´vel que duas contagens sucessivas de gl´bulos. mas tamb´m em rela¸˜o a si pr´prios. comparabilidade dos grupos experiˆncia e controle e. Dosagens de caracter´ o ısticas hematol´gicas flutuam n˜o s´ entre o a o indiv´ ıduos. se o fator em prova foi o unico fator de diferen¸a entre o grupo experimental e o grupo controle. Engajado no conhecimento do bi´logo. mercˆ de sua tradi¸˜o c a u a o e ca escol´stica. sexo e outras condi¸˜es do paciente a uma determinada doen¸a. ´ necess´rio saber se s˜o realmente superiores. mais eficientes aos velhos m´todos. se a diferen¸a entre os ´ c c resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribu´ ao acaso. Deve. Interessam aos pesquisadores dessas ´reas dados sobre mortalidade infantil. para se estudar problemas cl´ ınicos. feitas na mesma amostra de sangue. Caracter´ a e u ısticas de pessoas. a e o portanto. a Estat´ e ıstica pode ser vista como ferramenta de organiza¸˜o e valida¸˜o do conhecimento m´dico. Apenas depois ıda da avalia¸˜o.1. o m´dico deve saber responder ` quest˜es como essa. aconselh´-la em rela¸˜o ` vacina antip´lio ou antic a ca a o sarampo. a o e Quando. Uma certa quantidade de varia¸˜o ´ normal. o m´dico deve conhecer a varia¸˜o que ´ parte do pr´prio m´todo. ordinais e quantitativas. como tamb´m de seu e conhecimento sobre a rela¸˜o da idade. o cientista da sa´de tende a isentar-se o u de reflex˜o sobre a importˆncia das estrat´gias de mensura¸˜o e an´lise providas por outras ciˆncias. e a e a a isto ´. sejam idˆnticas. uma diferen¸a se torna maior que o erro de mensura¸˜o? Para tratar seu paciente e c ca do melhor modo poss´ ıvel. de dia para a e ca o dia ou mesmo de hora para hora. incidˆncia de doen¸as. etc. Robson M. idade entre 45 e 67 anos. significˆncia da diferen¸a encontrada ´ que podemos tirar as conclus˜es e a c e o relativas ao novo m´todo. da fidedignidade dos resultados. ra¸a. Mesmo co o e a u tomando-se um grupo de pacientes homogˆneos. Os dados referem-se a vari´veis. ´ necess´ria uma metodologia capaz de tratar a variabilidade de forma adequada. da massa de informa¸˜es.

a organiza¸˜o. a ca descri¸˜o. baseando-se em estudos realizados sobre os dados de uma amostra. pode estar presente nas diversas etapas de uma ca e o e pesquisa. que permitem conclus˜es v´lidas e tomadas ca a ca o a de decis˜es razo´veis. desde o seu planejamento. at´ na interpreta¸˜o de seus resultados. a an´lise e a interpreta¸˜o de dados experimentais. influenciar na e ca condu¸˜o do processo da pesquisa. Estat´ ıstica Inferencial. a estat´ ca ıstica ´ dividida em trˆs grandes ´reas que atuam em conjunto: e e a Planejamentos de Experimentos e Amostragem. ´ Estat´ ıstica Descritiva: E a parte que tem por objetivo organizar. A estat´ ıstica inferencial tem sua estrutura fundamentada na teoria matem´tica das probabilidades. o a Classifica¸˜o: Usualmente. ca Defini¸˜o: Estat´ ca ıstica ´ um conjunto de conceitos e m´todos cient´ e e ıficos para a coleta.Idade – Fumante – Atividade f´ ısica – Taxa de glicose – Taxa de colesterol s´rico e – Press˜o sang¨´ a uınea sist´lica. tamb´m definida como um conjunto de m´todos para a tomada de decis˜es. ´ Amostragem e Planejamento de Experimentos: E a parte que tem por objetivo planejar a pesquisa e se preocupa com o mecanismo da coleta de dados. 3 1. apresentar e sintetizar dados observados de determinada popula¸˜o. sem preten¸˜es de tirar conclus˜es de car´ter extensivo. etc. e e o . induzir ou verificar leis de comportamento da popula¸˜o da qual a amostra foi ca retirada. dispers˜es. mostrando sua distribui¸˜o. procura inferir. podendo ainda.4 1 2 3 4 5 6 7 8 9 Os Conceitos da Bioestat´ ıstica – N´ de instru¸˜o ıvel ca – Peso – Altura . m´dia. ca co o a ´ Estat´ ıstica Inferencial ou Indutiva: E a parte que. a ´ E.4 Os Conceitos da Bioestat´ ıstica A estat´ ıstica pode ser utilizada simplesmente para descrever conjuntos de dados. Estat´ ıstica Descritiva e. Mas. o ROSSI.1. Robson M. pode ir al´m.

a partir dos resultados dessa amostra. Infla¸˜o. obter valores aproximados. O fabricante deve saber com anu a a a tecedˆncia se o lote fabricado pode ser colocado no mercado ou n˜o (Ele pode estar sujeito a riscos ! e a O Recall ´ um exemplo. Os elementos de uma popula¸˜o diferem entre si com respeito a fatores tais como: sexo. 10. a 8. com o prop´sito ca o de avaliar (inferir) sobre a qualidade de tempero de todo o alimento. para as caracter´ ısticas populacionais de interesse. medidas ca f´ ısicas. cesta b´sica.4 Os Conceitos da Bioestat´ ıstica ROSSI. Telecomunica¸˜es: A utiliza¸˜o da Internet gera informa¸˜es preciosas de clientes . Robson M. Seguro de Vida e/ou de autom´veis. em termos percentuais. agressividade. a co 5. extraindo do todo (popula¸˜o) uma parte (amostra). Estima¸˜o do tamanho populacional de a o ca certas esp´cies. co a e a e o 6. est´ ca ca a se fazendo uma amostragem. de que o candidato A ´ o prov´vel vencedor. Taxa de desemprego. de tal forma que os resultados da amostra sejam informativos para avaliar caracter´ ısticas de toda a popula¸˜o. susceptibilidade a doen¸a. Taxa de mortalidade/Natalidade. e 9. chamadas e consumo. etc. Desta forma. “Deve-se a a tomar muito cuidado” com a tomada de decis˜o. verificando a sua efic´cia. co . (A co u e e a previs˜o pode ser feita ap´s a contagem de 2% dos votos). a sele¸˜o dos elementos que ser˜o observados. Custo de vida. Desta forma o padr˜o de comportamento no qual c a o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. A amostragem ´ naturalmente usada na vida di´ria. Meteorologia: Informa que a “chance” de chuva para hoje ´ de 30% (utiliza¸˜o de m´todos estat´ e ca e ısticos de previs˜o). cor. cativeiro e outros. cujas vari´veis que se pretende estudar sejam pass´ a ıveis de serem mensuradas. Controle de tr´fego co ca co a telefˆnico. idade. pode-se provar (observar) uma pequena por¸˜o deste alimento. Farm´cia/Medicina: Analisar a entrada de um novo medicamento. a o 2. ou qualquer outro tipo de elementos. 4 A Estat´ ıstica est´ presente em diversas ´reas e em diversas abordagens. ´ c Indices de analfabetismo. 7. para verificar o tempero de um e a alimento em prepara¸˜o. Valor do sal´rio m´ ca a ınimo. Institui¸˜es Banc´rias/Cr´dito: An´lise de cr´dito. deve ser feita sob ca a uma metodologia adequada. a ca a 3. indiv´ ıduos de uma certa esp´cie. etc. Ind´stria: Teste de lˆmpadas “flash” para m´quinas fotogr´ficas. IBGE/´ ındices: Censo. estabelecimentos e industriais. ca e Pesquisas com vacinas animais entre outros. procurando lidar com o e as varia¸˜es inerentes. e Num levantamento por amostragem. Experimenta¸˜o Zoot´cnica: Estudo do desenvolvimento de um animal e an´lise de fatores que influenciam neste desenvolvimento tais como. Mercado de Valores: Decis˜o na compra ou venda de a¸˜es – “Risco”. tamb´m ´ ca e e muito comum se observar apenas uma amostra de seus elementos e. Podemos citar alguns exemplos a a de suas aplica¸˜es: co 1. onde ocorre a retirada ou troca de produtos devido a uma falha em algum e est´gio de fabrica¸˜o n˜o detectado pelo controle de qualidade). Por estas raz˜es. alimenta¸˜o. Pesquisas: Estudo sobre h´bitos migrat´rios de certo animal. ca e a 11. ca A popula¸˜o pode ser formada por pessoas da fam´ ca ılia. for¸am a utiliza¸˜o de modelos estat´ o c ca ısticos complexos. ou estimativas. ´ a ındices de pre¸os-INPC. Este tipo de pesquisa ´ usualmente chamado de levantamento por amostragem. ou seja.1. Por exemplo. a 4. Nas pesquisas cient´ ıficas em que se quer conhecer algumas caracter´ ısticas de uma popula¸˜o. Experimenta¸˜o Agr´ ca ıcola: Estudos de uma nova variedade de semente (modifica¸˜o gen´tica) ou de ca e fertilizantes. Melhoramento gen´tico. muitos trabalhos nas ciˆncias em geral tendem a ser de natureza comparativa. Elei¸˜es: An´ncio pr´vio.

Vari´veis Quantitativas a Quando seus valores podem ser descritos numericamente. quantidade de ´lcool consumido .: n´mero de filhos. estejam associadas ca a aos elementos da popula¸˜o.4. outras unidades f´ceis de serem selecionadas e que. m´dio. 1. etc). • Discreta quando seus valores resultam de contagem (ex. m´dia amostral. ou. As vari´veis apresentam variabilidade dentro da popula¸˜o..960 (Fonte: IBGE .. consumo de ´lcool (sim.http://www. Pode ser os pr´prios elementos ca o da popula¸˜o.405. Desvantagem quando a popula¸˜o ´ muito grande Ex. e 1. grau de instru¸˜o. etc). etc). 1.4 Os Conceitos da Bioestat´ ıstica ROSSI.: classe social. ca 1. gostar de c a a estudar .1.4. nota na prova. a . Robson M.. de alguma forma. imc. • Ordinal quando tem ordem (ex.. tendo pelo menos uma vari´vel em comum (Pode ser finita ou infinita).: A popula¸˜o brasileira estimada em novemca e ca bro/2004: 182.: Cor dos olhos. u u co n´mero de copos de ´lcool consumidos. 1.ibge.4 Parˆmetros a S˜o certas caracter´ a ısticas populacionais espec´ ıficas que se deseja descrever.3 Amostra Pesquisas utilizando amostras da popula¸˜o denominam-se ca ´ E qualquer subconjunto da popula¸˜o. consumo de ´lcool (pouco. ra¸a. ca pesquisas por amostragem. ca Obs. com o objetivo de avaliar parˆmetros descona a hecidos. Vari´veis Qualitativas a Quando seus valores forem expressos por atributos (n˜o-num´ricos). ca a e muito) .4. a 1. a e • Nominal quando tem nome (ex. n˜o)..: estatura. por exemplo. 5 1. sexo..5 Estimativas dos Parˆmetros ou Estat´ a ıstica S˜o os valores calculados a partir dos dados da amostra.4. u a ınua quando seus valores resultam de medi¸˜es e podem assumir qualquer valor em um intervalo co • Cont´ da reta (ex.gov. Podem ser a ca qualitativas ou quantitativas.2 Censo Pesquisas utilizando todos os elementos da popula¸˜o...br/).1 Popula¸˜o ca ´ E qualquer conjunto de elementos.4.4. n´mero de reprova¸˜es.7 Vari´veis a S˜o as caracter´ a ısticas medidas.6 Unidade de Amostragem ´ E a unidade a ser selecionada para se chegar aos elementos da popula¸˜o.4. etc).

ck. tem a o a a e a mesma chance de ocorrˆncia). discreta X: “n´mero de caras em dois lan¸amentos“.1.as. Considerando uma v. 6 1.) a o S˜o provenientes de Experimentos Aleat´rios (todos as possibilidades s˜o equiprov´veis.8 Vari´veis Aleat´rias (v. Coroa: k . 2}.2. u c temos: Cara: c possibilidades {cc. c Exemplo 1.a. As v.a. e a u que podem assumir qualquer um dos conjuntos de valores que lhe s˜o atribu´ a ıdos. Y ou W.4 Os Conceitos da Bioestat´ ıstica ROSSI. 1.kk}: → X : {0. existem duas possibilidades:“Cara ou Coroa“.4. isto ´. Robson M.kc. X. Em um experimento de lan¸ar uma moeda e observar a sua face. geralmente s˜o representadas por letras mai´sculas A.

Efetivamente.de tal modo que nenhuma situa¸˜o do sitema pode ser reproduzida exatamente. uma unica observa¸˜o constitui-se-ia em base suficiente para fazermos afirma¸˜es gerais. cor dos olhos e comportamento de pessoas c 7 .gen´ticos.2 O Racioc´ ınio Indutivo da Biometria Quando realizamos um experimento. teremos numerosos resultados que ´ variam entre si. devemos ent˜o enfrentar o problema: Qual ca a deve ser a fidedignidade da mensura¸˜o? Ou mesmo: Ser´ o efeito observado atribu´ ca a ıvel ao fator em que estamos interessados. o efeito geral da estat´ e ıstica ´ tornar um e observador mais cr´ ıtico e mais consciente quando. nunca podemos garantir que dois experimentos sejam exatamente iguais em cada min´cia de u suas circunstˆncias. e o grande problema no racioc´ ınio do particular ao geral ´ levar em devida conta essa incerteza. ambientais e de dea a e senvolvimento .aquilo que chamamos de erro experimental estar´ co a a presente . um experimento. 2. de fato. o problema da incerteza ´ muito s´rio. Esta ´ a atitude cient´ o a e ıfica. a observa¸˜o resultante ´ vista n˜o como um resultado a ˆsmo e ca e a e irreprodut´ ıvel. mas como um resultado que poderia vir a ser obtido outras vezes. Um dos fenˆmenos mais comuns ´ a ocorrˆncia de diferen¸as entre homens e o e e c mulheres. de tal sorte que nunca podemos garantir resultados identicamente reprodut´ a ıveis. e “provar”. exatemente. entre crian¸as e adultos. Essa incerteza ´ caracter´ e ıstica do racioc´ ınio indutivo.1 Introdu¸˜o ca Na medicina como em outros campos da ciˆncia aplicada. ou ser´ conseq¨ˆncia de alguma outra causa de varia¸˜o que n˜o pudemos reconhecer a ue ca a e certamente n˜o pudemos controlar? a 2. e Em Biologia. ele tem de agir com base ca em impress˜es ou opini˜o. De fato.Cap´ ıtulo 2 Experimenta¸˜o Biom´trica ca e 2. As observa¸˜es v˜o. Na pr´tica. entre as estaturas. ´ ca co a obviamente. Alguns princ´ e ıpios dessa procura de evidˆncias ser˜o estudadas neste cap´ e a ıtulo. com muita freq¨ˆncia o nosso problema ´ tentar distinguir um efeito que seja pouco maior do ue e que o de outros fatores que provocam a varia¸˜o do sistema. Poucas (se ´ que algumas) circunstˆncias a ca e a de um experimento podem ser supostas triviais em seus efeitos sobre os resultados e raramente conseguimos identificar um ou dois fatores cujos controles reduziriam o erro experimental a propor¸˜es desprez´ co ıveis. em lugar de um unico resultado que se repete exatamente. em geral ca elas n˜o podem ser reproduzidas nem com muita aproxima¸˜o.3 Delineamentos Experimentais Muitos trabalhos em pesquisas m´dicas s˜o acometidos de v´rios erros devido ao procedimento na coleta e a a e no tratamento de dados. e o melhor modo de come¸ar a adquir´ ´ procurar c ı-la e evidˆncias. pois organismos vivos e suas partes s˜o coisas e e a altamente vari´veis. As nossas generaliza¸˜es n˜o podem ser co a absolutamente precisas: devem levar em considera¸˜o o erro experimental e conter. em si. se consegu´ ıssemos repetir. pesos. Eles est˜o influenciados por uma riqueza de fatores . um elemento ca de incerteza. variar em maior ou menor grau . a generaliza¸˜o ´ feita sob a hip´tese de que o resultado co ca e o obtido ´ t´ e ıpico de uma classe de experimentos similares e.e. por falta de informa¸˜o segura. de acordo com o tamanho do erro experimental. sempre que o experimento fosse repetido nas mesmas condi¸˜es.

Quando? 1990.. como a Anatomia.. alguns aspectos estat´ co ısticos dever˜o ser analisados e o tipo de estudo a adequado dever´ ser abordado. a e ca a 4.2.The principles of quantitative medicine. Quem?.1... e Os principais delineamentos experimentais para a realiza¸˜o destas pesquisas ser˜o: ca a 1.(relativa `s medidas) 8. (GOHAM et al.3.. a Exemplo 2. Compara¸˜es regionais. Robson M. mas algumas a a a a mat´rias b´sicas do curso m´dico. Considere a seguinte hip´tese: ”Associa¸˜o entre incidˆncia de luz solar e cˆncer de o ca e a mama”.especialmente. 1990).(relativa ` enumera¸˜o) a ca 9. e ıcio mesmo se todos os professores enfatizassem a importˆncia da varia¸˜o.3 Delineamentos Experimentais ROSSI. n˜o iria ajudar muito. coisas ou fatos estudados) 4. sexo e idade. na antiga Uni˜o sovi´tica. O quˆ?. Pelo fato de quanto maior a luminosidade maior a s´ ıntese de vitamina D pela pele. Para quˆ? Verificar a associa¸˜o entre a taxa de incidˆncia de luz solar sobre indiv´ e ca e ıduos em diferentes lugares com luminosidades desiguais e a incidˆncia de cˆncer de mama. semelhante associa¸˜o tamb´m foi detectada..(referente ` interpreta¸˜o causal) e a ca Tomadas as devidas precau¸˜es. Consiste no planejamento da pesquisa que ser´ realizada: a Mainland. parece que largamente partilham essa responsabilidade. A evidˆncia ca e e sugere. D. h´ evidˆncias que a vitamina D possa ter elevo na redu¸˜o do risco de cˆncer de mama. ouve ou discute..(refere-se ao tempo) 6. Quanto?. criando um conceito artificial do ca a o corpo humano no in´ da carreira do estudante..1 Etapa de um levantamento estat´ ıstico A. Onde?.(relativa aos m´todos) e a 7.(relativa ao pesquisador) 2. Onde? Regi˜es diferentes que apresentam tamb´m diferentes incidˆncias de luminosidade na antiga o e e Uni˜o Sovi´tica. mostraram correla¸˜o negativa entre incidˆncia co a e ca e de luz solar e de cˆncer do seio: em locais de baixa luminosidade solar. Em muitos pa´ ıses. Quantos?. O quˆ? N´mero de mulheres com cˆncer de mama e incidˆncia de luminosidade no local destas onde e u a e habitam estas mulheres. parecem n˜o reconhecer tal fato. pr´tica na a ca a procura de evidˆncias e uma atitude cr´ e ıtica em face dos assuntos que lˆ. (1952) em Elementary medical statistics . e estudos adicionais devem ser feitos para esclarecer a mat´ria. Todas essa diferen¸as s˜o coletivamente chamadas varia¸˜o e a estat´ c a ca ıstica pode ser descrita como ciˆncia de tratar a e varia¸˜o. e a 3.. e 2. entre diferentes amostras da mesma substˆncia qu´ c a ımica “pura”. 8 da mesma ra¸a. ca Os seres humanos s˜o t˜o infinitamente vari´veis interna quanto o s˜o externamente.. Como?. Quem? GOHAM et al.. que a vitamina D possa ter papel de relevo na redu¸˜o do risco de cˆncer de ca a mama. sugere nove quest˜es que constituem um roteiro valioso para desenvolvimento dessa atitude: o 1.(refere-se ao local e ambiente) 5... e vice-versa. 2. Por quˆ?. A pseudoprecis˜o anatˆmica. segundo os autores.(refere-se a pessoas.. a n˜o ser que a ca a a o estudante adquirisse pr´tica em enfrentar problemas que surgem da varia¸˜o .. a e 5. Planejamento experimental. Para quˆ?.. foi encontrada alta incidˆncia deste a e tipo de neoplasia. . deixando de destacar e a e a esse profundo sentido da varia¸˜o humana.(relativa ao objetivo da pesquisa) e e 3.. Quando?..

A an´lise dos dados deve ser realizada pelo pesquisador. aplicando os recursos estat´ ısticos necess´rios para refutar ou n˜o as hip´teses previamente fora a o muladas. Os valores observados podem ser complementados por observa¸˜o. Por quˆ? Alguns cuidados tˆm que serem relevados como o v´ e e ıcio da sele¸˜o. e o comparando-se as taxas de fatores de riscos. existem 3 procedimentos: a observa¸ao direta. Compreende o estudo (planejamento) detalhado da coleta de dados. por exemplo. mas n˜o saberia dizer quanto sem revis˜o bibliogr´fica. ca ca c ıacas. a raz˜o de chances. por´m a e e em rela¸˜o ` popula¸˜o de mulheres ´ uma doen¸a pouco prevalente. e se tivessem dentro do tempo predeterminado a a entrariam no estudo. com a ajuda de um a a estat´ ıstico. 9 6. Objetivo geral: conhecer o perfil dos homens portadores de doen¸as card´ Hava´ Para dar seq¨ˆncia a esta pesquisa. An´lise e apresenta¸˜o dos resultados. um estudo de caso-controle em mulheres com cˆncer de mama j´ diagnosticado e a a exposto ` luminosidade solar por um per´ a ıodo de tempo predeterminado devendo ser razoavelmente grande. a o Observa¸˜o: ´ a observa¸˜o direta dos fenˆmenos em laborat´rios ou na natureza. tamb´m. poder-se-ia chegar a conclus˜o de associa¸˜o e em seguida a ca calcular o Odds Ratio. os objetivos espec´ ıficos. Faria tamb´m um grupo controle de mulheres daquela regi˜o para compara¸˜o dos e a ca dados. Como? (Metodologia): considerando que o cˆncer de mama ´ o que mais mata nas mulheres. poderia influenciar os resultados dos estudos. a ingest˜o de alimentos ricos em precursores e da pr´pria vitamina D bem a o como uso de suplementos alimentares com vitamina D (p´ ılulas). e a u a 7. ou seja. Inicialmente. Observa¸˜o: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa.3 Delineamentos Experimentais ROSSI. Se o n´mero de centros for muito grande e for muito o u dif´ abord´-los. cl´ c e u ınicas especializadas. ca Avalia¸ao de informa¸˜es existentes. e 8. Quantos? A amostra tentaria ser a maior poss´ para melhorar a confiabilidade dos resultados. ca a Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por outros indiv´ ıduos. Na entrevista retrospectiva perguntaria a a a as mulheres h´ quanto tempo residiam naquela regi˜o. A verifica¸˜o das hip´teses ser´ realizada no decorrer da pesquisa. Verifica¸˜o das hip´teses. ca Execu¸˜o da pesquisa. etc) das respectivas regi˜es a serem estudadas. c ıacas em Honolulu. Quanto? As medidas seriam o n´mero de mulheres diagnosticadas com cˆncer de mama comparadas a um n´mero semelhantes de mulheres sem o cˆncer (controles) separadas ap´s serem examinadas por u a o m´dicos. Exemplos de alguns desses objetivos. (a) conhecer a distribui¸˜o do grau de instru¸˜o dos portadores de doen¸as card´ . sortearia os centros para amostragem. Exemplo 2. J´ a luminosidade colheria as informa¸˜es com as centrais de meteriol´gicas locais ou algum e a co o centro de referˆncia deste assunto para o estudo. o c˜ question´rio ou interrogat´rio e a entrevista. Repetindo este mesmo estudo em mulheres de diferentes regi˜es com diferentes luminosidades. ıcil a 9. a C. Robson M. todas as pesquisas ca o ca estat´ ısticas comportam a formula¸˜o de hip´teses. a hip´tese ser´ ca o o a rejeitada ou n˜o. da realiza¸˜o do trabalho e da an´lise dos dados. de informa¸˜o e conca ca fundimento. j´ que ıvel a a doen¸a ´ pouco prevalente. Transtorno ca a ca e c Pr´-Menstrual. o B. Para o caso de dados retirados diretamente da fonte.2. Procuraria os centros de sa´des locais (hospitais. isto ´. Os dados coletados devem ser apresentados na forma de: a ca gr´ficos e/ou de tabelas. O question´rio ´ aplicado por a e ue a e meio de entrevista ou remetido pelo correio. Com exce¸˜o das pesquisas meramente descritivas. Delineamento da pesquisa. Por exemplo. Coleta dos dados e realiza¸˜o da an´lise estat´ ca ca a ıstica. Assim. ca e ca o o Question´rio: ´ uma seq¨ˆncia de perguntas previamente preparadas.2. Formula¸˜o de hip´teses. como. ue e ca de portadores de doen¸as card´ c ıacas. serem ca e aproveitados nas discuss˜es posteriores. ca o ca o a D. Com base nos dados observados. deve-se realizar um levantamento bibliogr´fico sobre c˜ co a o assunto para obter subs´ ıdios que podem representar valiosa colabora¸˜o para o estudo e. ´ preciso especificar melhor o que se quer conhecer da popula¸˜o ı.

Plano de amostragem. Levantamento de dados. Amostra 1 de respostas Sim ou Não.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o O objetivo central da pesquisa etiol´gica (parte da medicina que trata das causas das doen¸as) ´ detero c e minar se o fato de uma pessoa contrair uma dada doen¸a est´ associado com um dado fator. Figura 2.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. a e Esquematicamente: Meio A. quer-se avaliar se os meios utilizados s˜o equivalentes ou se um ´ mais a e eficiente que o outro. onde o pesquisador exerce controle sobre o m´todo e e utilizado. Delineamento da pesquisa: s˜o formados dois grupos de pacientes com tuberculose e a amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). c a por exemplo uma caracter´ ıstica pessoal.2: Esquema 2. 2.2. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das informa¸˜es contidas em uma amostra dos prontu´rios dos pacientes. o qual pode ser. Figura 2. Meio B.4. Grupo 1 de pacientes.1: Esquema 1. Amostra 2 de respostas Sim ou Não. Grupo 1 de pacientes.3. Em outras palavras. 10 (b) Conhecer a idade e o peso m´dio dos portadores de doen¸as card´ e c ıacas. Esquematicamente: População: Todos os portadores de doenças cardíacas de Honolulu. resultando em dois conjuntos. Exemplo 2. Dados observados. (d) Avaliar a condi¸˜o de sa´de dos portadores de doen¸as card´ ca u c ıacas. Dados observados: a detec¸˜o ca ou n˜o do bacilo foi registrada para cada amostra. Objetivo geral: Comparar a eficiˆncia de dois m´todos para detectar o bacilo causador de e e tuberculose. Este ´ um delineamento de pesquisa experimental. Exemplo 2. Amostra: Parte dos portadores de doenças cardíacas de Honolulu. Robson M. (c) Conhecer os h´bitos dos portadores de doen¸as card´ a c ıacas. alguma especificidade do ambiente onde viveu ou uma experiˆncia e . Dados observados: resultados de diversos co a atributos e medidas relativas aos pacientes selecionados para participarem da amostra. relativos a cada m´todo.

4. j´ se verificaram ou se confirmaram associa¸˜es entre fatores de risco e v´rios tipos de cˆncer. c Os grupos de casos e de controles podem ser formados de forma emparelhada ou de forma independente. este tipo de planejamento recebe o nome de Estudo Retrospectivo. Embora n˜o existindo associa¸˜o entre o fator e a doen¸a em quest˜o. Como as informa¸˜es s˜o obtidas de maneira retrospectiva. a a a S˜o particularmente adequados ao estudo de doen¸as raras. onde est˜o sendo tratados os pae ıdo a cientes do grupo de casos.1 Estudo de Caso-Controle Um estudo tipo caso-controle pode ser definido como um estudo no qual a determina¸˜o da associa¸˜o da ca ca doen¸a com um fator ´ baseada na observa¸˜o de freq¨ˆncias muito altas ou muito pequenas do fator entre c e ca ue as pessoas doentes. ou seja. Para que os resultados tenham validade. se a c desenvolvessem a doen¸a. Descreveremos abaixo alguns tipos de tendenciosidade aos quais os estudos caso-controle est˜o sujeitos. u Um estudo retrospectivo come¸a com um grupo de indiv´ c ıduos. antes de se envolver no planejamento de um tal estudo. Dizemos que houve V´ ıcio de Confundimento se a associa¸˜o observada ´ produto n˜o do fator considerado mas de outros fatores n˜o controlados no estudo. na sua totalidade. s˜o utilizados dados preexistentes. 2. A c e a quest˜o ´ saber se o fator de risco est´ presente mais freq¨entemente ou em n´ mais elevados entre os casos a e a u ıvel do que entre os controles. O caso particular do emparelhamento em que h´ apenas um controle para cada caso ´ denominado a e pareamento. e a co a a N˜o h´ dificuldades ´ticas para sua implementa¸˜o e. j´ que. s˜o mais cuidadosos ao a ca a levantar a hist´ria cl´ o ınica dos casos que dos controles. 11 pela qual passou. Outra ´ que obtemos ca ca e apenas informa¸˜o sobre associa¸˜o entre fatores e doen¸a e n˜o sobre causas da doen¸a.2. Deve-se escolher para o grupo controle pacientes de uma grande variedade de . a Atrav´s dela. parecido com o grupo de controles. mas tem liberdade de detera a a a minar quem entrar´ ou n˜o no estudo. A seguir obtem a hist´ria cl´ ıdo a a c o ınica de todos os pacientes selecionados a fim de averiguar a presen¸a ou ausˆncia do fator de risco que est´ sendo estudado. pessoas que. Discutiremos maneiras de se organizar um estudo etiol´gico. Se a evidˆncia for suficiente o pesquisador concluir´ que existe uma associa¸˜o e a ca entre o fator de risco e a doen¸a. os dados usados s˜o os de seres humanos. estudos tipo Coorte. O resultado de ca ca c a c tais estudos deve ser considerado um elo a mais em uma cadeia de evidˆncias que levar´ ao veredito de e a causalidade. seriam escolhidas como casos. Chamamos de V´ a ıcio de Informa¸˜o `quele ca a introduzido pelos pesquisadores que. Os estudos de caso-controle s˜o uma forma de pesquisa simples e eficiente. J´ na forma¸˜o de grupos a a ca de forma independente. a c ca A pesquisa etiol´gica ´ baseada em dados coletados em pacientes convenientemente escolhidos. Preocupa-se apenas em garantir que o grupo de casos seja. m´todos estat´ o e ısticos para se determinar quais fatores est˜o associados com o contrair da doen¸a e meios de se quantificar esta associa¸˜o. c Idealmente. e c Sua grande limita¸˜o ´ a suscetibilidade aos v´ ca e ıcios de informa¸˜o e de sele¸˜o. existem v´rias maneiras pelas quais a ca c a a uma associa¸ao pode aparecer em um estudo caso-controle. j´ desconfiando da associa¸˜o a ser constatada. a serem chamados de ”casos”. um grupo ”controle” c a a ca constitu´ de pacientes que n˜o est˜o sofrendo da doen¸a. os casos devem ser todos os que ocorreram durante um per´ ıodo de tempo em uma popula¸˜o ca finita. mas sem a doen¸a. Isto a a e ca a livra o pesquisador de dif´ ıceis generaliza¸˜es inerentes aos estudos desenvolvidos em animais. a pesquisa tem de ser a a planejada segundo modelos bem definidos. O pesquisador escolhe como padr˜o de compara¸˜o. Robson M. Esta experiˆncia ´ fundamental pois lhe dar´ conhecimento das formas espec´ e a e e a ıficas pelas quais estas tendenciosidades aparecem. O o e pesquisador n˜o controla quem ser´ exposto ou n˜o ao fator em quest˜o. Ocorre ca quando os casos ou os controles s˜o incluidos no estudo por causa de alguma caracter´ a ıstica que possuam e que est´ relacionada com o fator de risco sendo considerado. O tempo gasto co e os custos associados s˜o relativamente pequenos. conhecer mais profundamente a literatura m´dica da ´rea. portanto.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. No primeiro esquema. os controles n˜o escolhidos de forma associada a um caso espec´ a ıfico. Os controles devem ser pessoas compar´veis aos casos. O a leitor deve. ca e a a O grupo controle ´ usualmente constitu´ de pacientes de hospitais. porque o pesquisador come¸a com um grupo de a c c pessoas que comprovadamente tˆm a doen¸a. Os principais tipos de planejamento para estudos etiol´gicos o receberam os nomes de estudos tipo Caso-Controle. a co a freq¨entemente. Estudos Descritivos e Seccionais ou Tranversais. Uma delas ´ chamada V´ c˜ e ıcio da Sele¸˜o. que tenham contra´ ıdos a doen¸a em quest˜o. normalmente. por isso muito utilizada. Para isto um grupo de indiv´ ıduos afetados pela doen¸a em quest˜o ´ comparado com c a e um grupo controle de indiv´ ıduos n˜o afetados. para cada caso ou mais controles semelhantes s˜o escolhidos. Ensaios Cl´ ınicos Aleatorizados.

5. Como “controles” foram escolhidas pacientes com idade igual ` do “caso” (mais ou menos dois anos). realizou estudo caso-controle com o objetivo de avaliar a influˆncia de fatores de risco no cˆncer de mama. De acordo com esses crit´rios. O primeiro foi selecionado e no ambulat´rio de ginecologia e o segundo no registro geral do hospital.3: Esquema de Estudo Caso-Controle. j´ que ´ usual apresentar-se uma descri¸˜o detalhada e a a e ca dos controles utilizados. a data de admiss˜o ao hospital igual ` data de confirma¸˜o do diagn´stico do caso (mais ou menos seis a a ca o meses) e exame cl´ ınico da mama sem indica¸˜o de patologias mam´rias.84 vezes. entre v´rias a outras conclus˜es. A an´lise estat´ o a ıstica. O m´todo de sele¸˜o dos indiv´ u e ca ıduos do grupo controle ´ quase que inteiramente dependente das circunstˆncias espec´ e a ıficas do estudo. ca a e foram selecionados. 12 doen¸as. d : os quatro possíveis resultados (note o caráter retrospectivo) MENSURAÇÃO DA EXPOSIÇÃO FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO DA EXPOSIÇÃO Figura 2. c. Quando existe facilidade na coleta de dados o n´mero de pacientes do grupo controle pode ser at´ 4 u e vezes maior que o n´mero de pacientes do grupo de casos. e a Como “casos” foram escolhidas pacientes portadoras de cˆncer de mama registradas no Hospital das Cl´ a ınicas da UFMG. Gomes (1992). mostrou que a presen¸a na paciente de hist´ria familiar (retrospectivamente) de cˆncer o c o a de mama aumenta o risco desta patologia em 8.2. a EXPOSTOS b NÃO-EXPOSTOS DOENTES (GRUPOS DE CASOS) AMOSTRA DE CASOS POPULAÇÃO DE CASOS E DE CONTROLES ANÁLISE DE DADOS c EXPOSTOS NÃO-DOENTES (GRUPO DE CONTROLES) NÃO-EXPOSTOS d a. atrav´s de emparelhamento. Aqui tamb´m ´ fune e damental o conhecimento da literatura m´dica da ´rea. b. diagn´stico feito entre 1978-1987 e confirmado por exame an´tomo-patol´gico. dois controles para cada caso. tumor origin´rio do o a o a tecido epitelial e ter sido submetida a algum tipo de cirurgia na mama.  ¡¡¡ ¡¡ ¡¡¡ ¡              ¡¡¡  ¡¡  ¡¡¡  ¡              ¡¡¡ ¡¡ ¡¡¡ ¡  ¡ ¡ ¡¡ ¡¡ ¡ ¡¡            ¡¡¡ ¡¡ ¡¡¡ ¡            AMOSTRA DE CONTROLES   ¡  ¡¡  ¡¡  ¡¡  ¡  ¡          ¡ ¡¡ ¡¡ ¡¡ ¡ ¡  ¡¡ ¡¡ ¡¡ ¡¡¡         ¡  ¡¡  ¡¡  ¡¡  ¡  ¡          ¡ ¡¡ ¡¡ ¡¡ ¡ ¡  ¡¡ ¡¡ ¡¡ ¡¡¡       . utilizando dados de nosso meio. que satisfizeram os seguintes crit´rios de inclus˜o: idade na ´poca do diagn´stico entre 25 e 75 e a e o anos. Robson M. Isto protege os resultados de uma forma de v´ da sele¸˜o. Fatores de risco em cˆncer de mama. o estudo n˜o detecta uma associa¸˜o c ıcio ca a ca porque a doen¸a dos pacientes-controle e a doen¸a sendo estudada est˜o ambas associadas com o fator de c c a risco. em tese de doutorado na Faculdade de Medicina da UFMG.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. a Exemplo 2.

portanto n˜o indicado para doen¸as raras. Se essas taxas s˜o significativamente diferentes nos dois grupos. um estudo prospectivo avan¸a no tempo e coloca ˆnfase no c e fator de risco. a a Identificam-se um grupo exposto ao fator e o grupo controle. • Alto potencial anal´ ıtico.4. longos e normalmente caros. em maior ou menor propor¸˜o c a ca do que um grupo de indiv´ ıduos. ´ que os estudos de coorte nos permitem obter a e diretamente uma estimativa da magnitude do risco relativo. u a c Embora. mas n˜o expostos ao fator de risco. entretanto “Estudo Prospectivo” ´ a nomenclatura mais utilizada. que s´ poder´ ser completamente a a a o a apreciada ao se estudar a metodologia de an´lise de dados. o pesquisador tem muito mais liberdade sobre o que medir e como medir. ROSSI. • Vulner´vel a in´meros biases (sele¸˜o. c Desvantagens do Estudo de Caso-Controle • Incapaz de estimar risco (reduzido poder descritivo). Quanto mais rara a doen¸a em quest˜o. Os dois grupos s˜o acompanhados por um per´ a ıodo de tempo e as taxas de incidˆncia da e doen¸a calculadas.2 Estudo de Coorte Em contraste com um estudo retrospectivo. os Estudos de Coorte sejam melhores que os Estudos Caso-Controle. 13 2. ´ a . etc. c a Estudos de Coorte s˜o grandes. e Os Estudos de Coorte possuem v´rias vantagens. O pesquisador tem a possibilidade de usar crit´rios a e uniformes. • Adequado para estudar doen¸as raras. do ponto de vista te´rico.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o Vantagens do Estudo de Caso-Controle • Baixo custo relativo. compar´veis. desenvolvem a doen¸a em quest˜o. constitu´ de pessoas que n˜o foram ıdo a expostas a ele. a Em um estudo prospectivo. j´ a que n˜o se restringir´ ao uso de dados j´ coletados. Uma outra vantagem. Robson M. O Estudo de Coorte ´ uma forma de pesquisa que visa verificar se indiv´ e ıduos.2. o pesquisador conclui c a que h´ associa¸˜o significativa entre a doen¸a e o fator.) a u ca • Complexidade anal´ ıtica. quanto na verifica¸ao da ocorrˆncia da doen¸a nos v´rios exames de acompamento. o estes ultimos s˜o mais comuns. Nos dois grupos a comparabilidade c˜ e c a pode ser verificada no in´ do estudo e identificadas as vari´veis para as quais s˜o necess´rios ajustamentos ıcio a a a na an´lise dos dados. Isto significa que ´ poss´ quantificar o risco e ıvel de desenvolver a doen¸a comparando-se o grupo de expostos ao fator de risco com o grupo de n˜o expostos. a c a maior o n´mero de pacientes que precisam ser examinados. tanto na identifica¸˜o da presen¸a ou n˜o do fator de risco ao in´ ca c a ıcio do estudo. selecionados porque foram expostos ao fator de risco. a ca c Os epidemiologistas preferem o termo “Estudo Tipo Coorte” para este tipo de estudo.

levantando sua hist´ria cl´ a o ınica e seus h´bitos tabagistas. O segundo grupo. entrevistaram todos os pacientes internados com diagn´stico de cˆncer de o a pulm˜o. por um per´ a e ıodo inferior a um ano.2: Taxa de mortalidade por 1. a Para equalizar os per´ ıodos de acompanhamento nos v´rios grupos. e Em outubro de 1951.1 mostra os resultados a e obtidos. n˜o foi convincente o suficiente. com facilidade. em m´dia. na mesma faixa et´ria. a Assim. Mais de dois ter¸os dos m´dicos responderam co c e com detalhe suficiente para que seus dados pudessem ser inclu´ ıdos no estudo. 14 Sele¸˜o das Coortes ca Grupos de pessoas s˜o selecionadas para o Estudo de Coorte por uma variedade de raz˜es.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. A Tabela 2. a evidˆncia foi clara. O question´rio perguntava se o respondente j´ havia fumado ou n˜o. pois. a a a Em caso afirmativo. Fumo e cˆncer de pulm˜o. a Tabela 2. apenas 3 eram de n˜o-fumantes. a foi constitu´ por pacientes dos mesmos hospitais. O cl´ssico estudo de Doll & Hill (1964) sobre associa¸˜o entre cˆncer no pulm˜o e fumo ilustra a escolha a ca a a da coorte pelo fato de o grupo possuir caracter´ ısticas que facilitam a obten¸˜o dos dados sobre a exposi¸˜o ca ca ao fator e o seguimento dos pacientes.6.000 indiv´ ıduos. trabalhou-se com a taxa de incidˆncia a e por 1.000 pessoas-ano devida a cˆncer pulmonar (n´mero de mortes entre a u parˆnteses) para n˜o fumantes e fumantes.000 pessoas-ano de exposi¸˜o. a Grupo Fumantes N˜o-Fumantes a Total Cˆncer pulmonar a 647 2 650 Controle 622 27 649 Total 1269 29 1299 ` e A forma de organiza¸˜o deste estudo ´ chamada de Estudo Caso-Controle. ca e Tabela 2. Por isso. a A defini¸˜o de n˜o-fumante usada foi: um n˜o fumante ´ uma pessoa que fumou at´ no m´ximo um cigarro ca a a e e a di´rio. especiala a mente treinadas para o estudo. Assistentes sociais. A ´poca.1: N´mero de fumantes e n˜o fumantes entre pacientes do sexo masculino com diagn´stico de u a o cˆncer pulmonar e controles. Muitos outros estudos como os descritos anteriormente foram feitos em popula¸˜es o co variadas para se verificar o poss´ papel do fumo. Estas a a pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este cˆncer.2. os mesmos autores iniciaram um segundo estudo. Foram acompanhados m´dicos da Inglaterra desde o fim dos anos e 20. os pesquisadores enviaram um question´rio simples a todos os m´dicos da Inglaterra. e a N˜o-Fumantes a Cigarros di´rios (Fumantes) a 1-14 5-24 25+ 0. Atrav´s de complexo sistema de acompanhamento. a e aproximadamente 60. 136 mortes e associadas ao cˆncer pulmonar entre os m´dicos inclu´ a e ıdos no estudo. chamado de controle. cuja caracter´ ıstica b´sica ´ o fato de que o a e acompanhamento dos pacientes foi prospectivo. do ıdo o a a mesmo sexo e da mesma regi˜o de residˆncia que os casos anteriores. A associa¸˜o ´ clara e forte.57(22) 1. compararam-se dois grupos de pacientes. Apresentamos a o a seguir dois exemplos: a a Exemplo 2. a evidˆncia. O primeiro.39(54) 2. observaram-se nos primeiros 10 anos. publicado em 1950. Destas. Os valores desta taxa est˜o na Tabela 2. Este tipo de planejamento ´ chamado de Estudo de Coorte. o papel de agente ıvel e . estudo Caso-Controle e Estudo de Coorte. Em todos. sem diagn´stico de cˆncer. s˜o as formas usuais de organiza¸˜o a ca da pesquisa etiol´gica. O risco de morte por cˆncer ca a a pulmonar das pessoas que fumam mais de 25 cigarros di´rios ´ quase 32 vezes maior do que o mesmo risco a e para quem n˜o fuma. As respostas possibilitaram aos pesquisadores classificar cada respondente como fumante ou n˜o fumante. constitu´ ıdo de todos os casos de cˆncer de pulm˜o de um conjunto de hospitais londrinos. a No primeiro estudo.2. podia produzir associa¸˜es esp´rias.07(3) 0. Hoje. esta metodologia ca e era muito criticada.27(57) Estes dois planejamentos. embora co u e clara e forte. pedia informa¸˜es sobre o que e quanto. Robson M. um grupo f´cil de contactar e no qual todas as mortes s˜o rotineiramente bem documentadas.

n´ a ıveis de colesterol. Os resultados da Tabela 2. Personalidade e desenvolvimento de doen¸a coronariana. ao tempo em que a coorte ´ e ca e formada. sendo os primeiros mais agressivos. particularmente quando um grupo submetido a uma exposi¸˜o pouco comum ´ co ca e estudado.2 50-59 15. Faixa et´ria Personalidade a A B 39-49 8. . Nestes casos n˜o h´ necessidade de um grupo externo de compara¸˜o. usa-se tamb´m como base de compara¸˜es outra coorte formada por pessoas n˜o expostas.6 Finalmente.9 7. Robson M. ´ importante comparar o resultado observado com aquele esperado.4: Esquema de Estudo Coorte. d : os quatro possíveis resultados Figura 2.. DOENTES POPULAÇÃO EXPOSTOS ou grupo-experimental AMOSTRA PARA ESTUDO ¡¡¡¡¡¡¡¡¡¡¡¡¡¡                              ¡¡¡¡¡¡¡¡¡¡¡¡¡¡                        ¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡ ¡¡ ¡¡  ¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡ ¡¡ ¡¡                             ¡¡¡¡¡¡¡¡¡¡¡¡¡¡                        ¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡ ¡¡ ¡¡  ¡ ¡¡ ¡¡ ¡¡ ¡¡ ¡ ¡¡ ¡¡                             a NÃO-DOENTES b ANÁLISE DE DADOS DOENTES NÃO-EXPOSTOS ou grupo-controle FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO DA EXPOSIÇÃO MEDIÇÃO DOS EFEITOS c NÃO-DOENTES d a. 1972). Usa-se a experiˆncia da popula¸˜o em geral.154 trabalhadores do sexo masculino com idade de 30 a c 59 anos (Brand et al. considerando uma coorte a de radiologistas. Um Estudo de Coorte com o objetivo de avaliar o poss´ efeito da personalidade no risco de desenvolviıvel mento de doen¸a coronariana foi conduzido entre 3. As coortes do estudo de Framingham sobre doen¸as coran´rias (Kannel ıvel ca c a et al. 15 causador do cˆncer de pulm˜o ´ amplamente reconhecido e justifica a militˆncia cada vez mais organizada a a e a contra o fumo.3: Percentual de indiv´ ıduos que desenvolveram doen¸a coronariana segundo faixa et´ria e tipo de c a personalidade. Por exemplo. como padr˜o de compara¸˜o. Os indiv´ ıduos entraram no estudo entre 1960-61 e foram acompanhados por um per´ ıodo m´dio de 8 anos e meio. Seltser e Sartwell (1965) usaram como padr˜o de compara¸˜o dados de oftalmologistas e a ca otorrinolaringologistas. e co a parecidas nas caracter´ ısticas demogr´ficas com o grupo exposto.. foram constru´ ıdas dividindo-se o grupo acompanhado de acordo com h´bitos de fumo.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI.2. a a ca c Exemplo 2. a ca Tabela 2. b. Em muitos Estudos de Coorte os grupos de compara¸˜o s˜o obtidos ap´s o in´ do estudo. A e B.9 4. de acordo ca a o ıcio com o n´ de exposi¸˜o ao fator. Atrav´s de entrevista no in´ do estudo.7. foram classificados em dois e e ıcio tipos de personalidade.3 indicam que nas duas faixas et´rias consideradas os percentuais de indiv´ a ıduos do tipo A que desenvolveram doen¸a coronariana s˜o aproximadamente o dobro dos encontrados no outro c a grupo. competitivos e ansiosos. caso os indiv´ e ıduos n˜o tivessem a sido submetidos ao fator de risco. etc. Em outras situa¸˜es. c. 1976).

No grupo c tratamento. entretanto. que traz v´ ıcios ao estudo cl´ ınico. tipo de cirurgia e concentra¸˜o de receptor de ca estr´geno. idade inferior a 70 anos. e ca O conhecimento pelo paciente ou pelo m´dico do tratamento a ser administrado pode influir na evolu¸˜o e ca da doen¸a. constatou-se uma diferen¸a signie c ficativa em termos de tempo livre de doen¸a em favor das pacientes que receberam o tamoxifeno. Todo esfor¸o deve ser feito para oferecer os mesmos cuidados aos e c dois grupos. ou ao grupo tratamento. Robson M. longos e normalmente caros. ca o o . qual ´ o mais efetivo. nem sempre ´ fact´ e ıvel. pacientes de bom progn´stico. isto ´. 16 • Estudos de Coorte s˜o grandes. a Esta ´ uma forma experimental de pesquisa. no qual e a ambas as parte desconhecem o tratamento.3 Ensaios Cl´ ınicos Aleatorizados O Ensaio Cl´ ınico Aleatorizado ´ um experimento m´dico. o indistingu´ do tamoxifeno na aparˆncia e gosto. contribuiu decisivamente para a ado¸˜o do tamoxifeno como quimioterapia adjuvante logo ap´s a cirurgia em pacientes de bom progn´stico. entre dois e e ou mais tratamentos. e S˜o usados quando ´ incerto o valor de uma nova terapia ou os m´ritos da terapia existente est˜o em a e e a ´ disputa. Al´m disto. em contraposi¸˜o aos estudos observacionais. isto ´. o e a a a alocados de maneira aleat´ria ao grupo controle. • Facilidade de an´lise. c ue • Vulner´vel a perdas (biases). Naquela ´poca. a c a maior o n´mero de pacientes que precisam ser examinados. mas diretamente pelo processo de auto-sugest˜o. o tamoxifeno j´ era usado largamente no tratamento de pacientes com e a cˆncer de mama. o ensaio foi organizado na forma duplo-cego. que recebe a terapˆutica padr˜o. em que o pesquisador se restringe ca a ` coleta de dados. Foram criados dois grupos de pacientes atrav´s de aleatoriza¸˜o feita dentro de estratos o e ca definidos por idade e tamanho do tumor na an´lise cl´ a ınica. os pacientes s˜o. a Muitos avan¸os no tratamento do cˆncer de mama tˆm sido estabelecidos atrav´s de estudos realizados c a e e pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). sempre que poss´ ´ e ıvel. Tamoxifeno e cˆncer de mama. experimentos cegos.4. disciplinados pela conven¸˜o de Helsinque. Terminado o experimento. com cˆncer de mama oper´vel e linfonodos axilares negativos ao exame histol´gico. Em 1985.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o Vantagens do Estudo de Coorte • Produz medidas diretas de risco. discutia-se a necessidade de se submeter ` quimioterapia ou hormonioterapia. ıvel e e Ap´s acompanhamento das pacientes por um per´ o ıodo de at´ 4 anos. Por isto est´ sujeita a costrangimentos a ca a ´ticos. E o efeito a ´ placebo. havia evidˆncias de v´rias origens de que o tamoxifeno poderia melhorar ainda mais o progn´stico e a o dessas pacientes. o pesquisador interfere deliberadamente no curso e e natural dos acontecimentos. ou duplo-cego. (1989). Um grupo recebeu tamoxifeno (10 mg por dia. Este ideal. logo ap´s a cirurgia. 83% estavam livres da doen¸a aos quatro anos ap´s a cirurgia. a Desvantagens do Estudo de Coorte ROSSI. t´cnicas estat´ e ısticas s˜o usadas para se decidir se h´ ou n˜o diferen¸a a a a c na efic´cia das terapias envolvidas.2. Quanto mais rara a doen¸a em quest˜o. aquelas com tumores com receptor de estr´geno o e o a a positivo (>10 fmol ). • Alto poder anal´ ıtico. duas vezes ao dia) e o outro. via oral. realizado com o objetivo de verificar. E a metodologia apropriada para a compara¸˜o de tratamentos. placebo. Exemplo 2. Em a o o particular. nos quais o paciente ou o m´dico n˜o conhece o tratamento. ca Ap´s um crit´rio de admiss˜o ter sido definido. A unica maneira de eliminar o efeito placebo nos grupos comparados ´ realizar. Portanto este estudo ´ inadequado para u e doen¸as de baixa freq¨ˆncia. o NSABP iniciou o protocolo B-14 para determinar a efic´cia do tamoxifeno a a em pacientes consideradas de bom progn´stico.8. ` medida que entram no experimento. o e a que recebe a terapˆutica sendo testada. sem alterar a dinˆmica do processo em considera¸˜o. enquanto que no grupo placebo c o esta porcentagem era de 73%. publicado por Fisher et al. Diante disto. Este estudo. a 2. n˜o atrav´s de fatores estr´ c a e ınsecos.

c • A varia¸˜o regional na utiliza¸˜o de servi¸os de sa´de.da´ serem considerados ı estudos n˜o-controlados. em termos quantitativos. ca ca c u • A tendˆncia do coeficiente de mortalidade por tuberculose. com maior riqueza de detalhes. d : os quatro possíveis resultados Figura 2.2. ca co Vantagens do Estudo de Casos • Em geral. e ´ Estudo de Caso Trata-se de observar um ou poucos indiv´ ıduos com uma mesma doen¸a ou evento e. 17 EFEITO: PRESENTE POPULAÇÃO EXPOSTOS À INTERVENÇÃO ou grupo-experimental AMOSTRA PARA ESTUDO  ¡¡¡¡¡ ¡ ¡¡ ¡ ¡¡¡ ¡ ¡ ¡ ¡¡¡¡¡¡¡¡¡¡¡¡¡¡¡                          ¡¡¡¡¡ ¡ ¡¡ ¡ ¡¡¡ ¡ ¡ ¡                        ¡¡¡¡¡ ¡ ¡¡ ¡ ¡¡¡ ¡ ¡ ¡    ¡¡¡¡¡ ¡ ¡¡ ¡ ¡¡¡ ¡ ¡ ¡                                       ¡¡¡¡¡ ¡ ¡¡ ¡ ¡¡¡ ¡ ¡ ¡ a EFEITO: AUSENTE b ANÁLISE DE DADOS EFEITO: PRESENTE NÃO-EXPOSTOS À INTERVENÇÃO ou grupo-controle FORMAÇÃO DOS GRUPOS POR ALEATORIZAÇÃO E APLICAÇÃO DOS TRATAMENTOS MEDIÇÃO DOS EFEITOS c EFEITO: AUSENTE d a. O estudo de casos ´ empregado para enfocar grupos espec´ e ıficos da popula¸˜o ou um particular aspecto ca de interesse. • As principais causas de ´bito da popula¸˜o residente em um dado munic´ o ca ıpio. nos ultimos anos. o estudo de caso ´ relativamente f´cil de ser realizado e de baixo custo. n˜o h´ forma¸˜o de grupo-controle para a e e a a ca compara¸˜o dos resultados. n˜o devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de a suplementa¸˜o de informa¸˜es.4 Estudos Descritivos As investiga¸˜es de cunho descritivo. a • Os padr˜es de crescimento e desenvolvimento de crian¸as normais ou daquelas acometidas por uma o c determinada doen¸a. e a . tˆm o objetivo de informar sobre a distribui¸˜o de um evento. a Exemplos de temas de estudos descritivos • A incidˆncia de infec¸˜o chag´sica em habitantes rurais. de um munic´ a e ıpio. • O estado imunit´rio de pr´-escolares.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. frente ` poliomielite. ca Elas podem ser de incidˆncia ou de prevalˆncia. na co e ca popula¸˜o. • As caracter´ ısticas demogr´ficas e socioeconˆmicas dos pacientes que sofrem de artrite reumat´ide ou a o o das pessoas que fumam. para difundir ca ca os resultados destes estudos. de uma cidade. e ca a e a a ca • A prevalˆncia da hepatite B entre os volunt´rios ` doa¸˜o de sangue. tra¸ar um perfil das suas principais caracter´ c ısticas. Muitas revistas cient´ ıficas apresentam uma se¸˜o de ”relato” ou ”apresenta¸˜o de casos”. Nelas. c. ao menos na forma como ´ feita nos estudos anal´ ca e ıticos . b. a partir de descri¸˜o c ca dos respectivos casos.5: Esquema de um Ensaio Cl´ ınico Aleatorizado. 2.4. Robson M.

muitos dos quais s˜o complee ´ a mentarmente investigados com o aux´ de outros m´todos. ` luz da a a observa¸˜o de poucos indiv´ ca ıduos. e mesmo d´cadas. As vezes. aos casos de evolu¸˜o at´ co ca ıpica. conv´m real¸ar. Um aspecto o positivo. e e e Vantagens do Estudo Seccional • Simplicidade e baixo custo. c e e a a c c Seria conveniente saber se os sadios tamb´m beberam ou n˜o ´gua do mesmo po¸o. c e a e • Em cl´ ınica. • Boa op¸˜o para descrever as caracter´ ca ısticas dos eventos na popula¸˜o. duas limita¸˜es a ca co principais est˜o presentes no estudo de casos: a • a falta de controle . 18 • O relato pode restringir-se a uma simples descri¸˜o ou ir mais al´m. ca . como ele tem sido ca ca atualmente empregado na ´rea cl´ a ınica. de modo a sugerir explica¸˜es ca e co sobre elementos pouco conhecidos. em investiga¸˜o de um surto de diarr´ia. aos quais pode ser oferecida aten¸˜o especial. ca c • A falta de indiv´ ıduos-controle.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. ca • O estudo de casos constitui-se em um verdadeiro invent´rio do que acontece genericamente. chegando-se a um quadro e ıvel e repleto de detalhes sobre aspectos evolutivos de uma dada condi¸˜o. se os casos beberam ca e a ´gua de um certo po¸o a evidˆncia ´ ainda fr´gil para incriminar a ´gua do po¸o na etiologia da doen¸a. ´ a possibilidade de observa¸˜o intensiva de cada caso. para comparar resultados. a observa¸˜o restringe-se a ca situa¸˜es incomuns de enfermos graves. s˜o chamadas de estudos seccionais ou de corteu a transversal-seccional. co a ca u ca com base na avalia¸˜o individual do estado de sa´de de cada um dos membros do grupo.2. para identificar casos na comuca nidade e para detectar grupos de alto risco.eles serviriam para contornar problemas de aferi¸˜o e compara¸˜o acima menca ca cionados.5 Seccionais ou Transversais Investiga¸˜es que produzem ”instantˆneos” da situa¸˜o de sa´de de uma popula¸˜o ou comunidade.4. especialmente. na generaliza¸˜o. ´ • E um enfoque qualitativo e explorat´rio. muito raramente. embora muitas facetas possam ser quantificadas. pode fazer com que simples coincidˆncias e sejam dif´ ıceis de interpretar: por exemplo. • N˜o h´ necessidade de seguimento das pessoas. de rea¸˜o inusitada ca ou de resultado terapˆutico inesperado. outras vezes. ılio e 2. a a • Alto potencial descritivo (subs´ ıdio ao planejamento). e c e ca Desvantagens do Estudo de Casos ` • Os indiv´ ıduos observados costumam ser altamente selecionados. • o n´mero pequeno de indiv´ u ıduos inclu´ ıdos para observa¸˜o . sob vigˆncia ou n˜o de terapˆutica. apesar das vantagens referentes ` facilidade de realiza¸˜o e baixo custo. ca Desvantagens do Estudo Seccional • Vulnerabilidade a biases ou v´ ıcios (especialmente de sele¸˜o). tais como os fatores implicados na etiologia ou no curso de uma doen¸a. • Rapidez. abrange pacientes em todas as faces de e manifesta¸˜o da doen¸a. O Estudo Seccional tamb´m ´ conhecido como Estudo Transversal ou da Prevalˆncia. e a a c Em s´ ıntese. e da´ produzindo ca u ı indicadores globais de sa´de para o grupo investigado. Robson M. ´ poss´ acompanhar pacientes durante anos. ´ util para levantar problemas.o que aponta para a prudˆncia na inca e terpreta¸˜o dos resultados de estudos de casos.

Indique qual forma de pesquisa foi utilizada nos seguintes problemas: 1. sendo e que um gˆmeo do par tinha cˆncer no c´lon e o outro n˜o. e • N˜o determina risco absoluto (ou seja.1. logo tˆm dificuldades operacionais. Ao final deste per´ ıodo comparou-se a mortalidade infantil nos dois grupos.A famosa p´ e e ılula azul pode tamb´m ser eficaz para diab´ticos que tem a fun¸˜o er´til comprometida. (e) 300 pacientes portadores de diabetes mellitus foram alocados aleatoriamente em dois grupos. refere-se ` ´poca de realiza¸˜o do estudo e pode ca ca c ae ca n˜o ser a mesma da ´poca de aparecimento da doen¸a. nos Estados Unidos. identificou-se cada crian¸a nascida na cidade de Pelotas e procedeu-se c a revis˜o dos registros de nascimento com o objetivo de conhecer.4 Aspectos Estat´ ısticos dos Estudos Etiol´gicos o ROSSI. forma identificadas 100 pacientes internadas por cˆncer de mama (casos novos) em um hospital geral a durante um per´ ıodo de dois anos. 19 POPULAÇÃO AMOSTRA PARA ESTUDO   ¡¡¡  ¡¡   ¡ ¡¡¡ ¡          ¡¡¡  ¡¡            ¡¡¡  ¡¡   ¡ ¡¡¡ ¡ ¡  ¡¡¡  ¡           ¡¡¡  ¡¡   ¡¡¡¡¡        ¡¡¡ ¡¡         ¡¡¡ ¡¡        FORMAÇÃO DOS GRUPOS POR OBSERVAÇÃO SIMULTÂNEA DE EXPOSIÇÃO E DOENÇA EXPOSTOS E DOENTES a EXPOSTOS E NÃO-DOENTES b NÃO-EXPOSTOS E DOENTES c NÃO-EXPOSTOS E NÃO-DOENTES d ANÁLISE DOS DADOS Figura 2. Mas uma pesquisa realizada com 268 e homens pela Universidade de Creighton. o peso ` a a ao nascimento. o • Condi¸oes de baixa prevalˆncia exigem amostra de grande c˜ e tamanho. cada um com 150. Os pacientes foram acompanhados por seis meses e o grau de controle metab´lico dos pacientes nos dois grupos foi comparado atrav´s das determina¸˜es o e co de glicemia capilar (di´rias) e da hemoglobina glicosilada (aferida a cada dois meses). ıvel ca a (d) Com o objetivo de avaliar uma poss´ associa¸˜o entre uso de reserpina e cˆncer de mama. Para cada caso eram entrevistados quatro controles.2. Informa¸˜es sobre o teor de fibras co da dieta foram coletadas para cada um dos indiv´ ıduos afim de estimar seu efeito na ocorrˆncia do e cˆncer no c´lon. Robson M. Estas pacientes foram entrevistadas sendo colhida a informa¸˜o ca quanto ao uso pr´vio de reserpina. O primeiro grupo recebeu uma droga hipoglicemiante nova.300g e baixo peso c <2. a o (c) Durante o ano de 1982. Estudos preliminares e e ca e haviam descartados a eficiˆncia do Viagra nesses casos.300g) sendo seguidas por um ano. a e • A associa¸˜o entre exposi¸˜o e doen¸a. mostrou que 56 % dos pacientes que tomaram Viagra tiveram melhoras contra 10 % dos que ingeriram placebo. selecionae dos aleatoriamente dentro do grupo de mulheres internadas por outros diagn´sticos durante o o mesmo per´ ıodo do caso. a e c Exerc´ ıcio 2. enquanto os demais permaneceram em uso de clorpropamida. entre outras vari´veis. no 1535 de 03/03/1999) . (b) Um estudo foi conduzido em um grupo de gˆmeos monozigotos e dizigotos do mesmo sexo. (a) ”Viagra para os diab´ticos” (Revista isto ´. Todos foram de universidades do e a o a sudoeste dos Estados Unidos durante um per´ ıodo de 5 anos. • Baixo poder anal´ ıtico (inadequado para testar hip´teses causais). As crian¸as eram classificadas em dois grupos (peso normal 2. se detectada. a incidˆncia).6: Esquema de um Estudo Seccional. a .

a b. Coluna indicadora: S˜o as indica¸˜es que especificam o conte´do das linhas. Chamada ´ E a informa¸˜o de natureza espec´ ca ıfica. ca 20 . o 1. As regras que prevalecem no Brasil foram fixadas pelo Conselho Nacional de Estat´ ıstica. a co u c.1 3. a co u 2. que serve para complementar determinado dado usado na confec¸˜o da tabela. Consiste em dispor os dados em linhas ca e ca e e colunas.1. Elementos complementares a. Uma tabela estat´ ıstica comp˜e-se de elementos essenciais e elementos complementares. b.Cap´ ıtulo 3 Estat´ ıstica Descritiva 3. a co e ca c. fazendo referˆncia ao local e ao tempo e em que foi observado. Nota S˜o informa¸˜es que esclarecem crit´rios usados na confec¸˜o da tabela. segundo algumas regras pr´ticas adotadas pelos diversos sistemas a estat´ ısticos. distribu´ ıdas de modo ordenado. Fonte ´ E a entidade respons´vel pelos dados contidos na tabela. T´ ´ E a indica¸˜o da natureza do fato estat´ ca ıstico observado. Cabe¸alho: c S˜o as indica¸˜es que especificam o conte´do das colunas. Elementos essenciais ıtulo: a.1 Organiza¸˜o de Dados Estat´ ca ısticos Normas para a Apresenta¸˜o Tabular de Dados ca A representa¸˜o tabular ´ uma apresenta¸˜o num´rica dos dados.

2: Total de alunos matriculados na UEM em 2002.90 0.78 0. 10.75 0.55 0.55 Os dados.85 1. a a ca ue Em publica¸˜es mais antigas sobre constru¸˜o de tabelas de freq¨ˆncias. s˜o chamados brutos. que das 25 observa¸˜es o menor valor ´ xm´ = 0. ca co ue Exemplo 3. das quais foram obtidas medidas de intoxica¸˜o c ca alimentar por uma substˆncia desconhecida (g).78 0.65 0.75 0.9 23.2 Distribui¸˜o de Freq¨ˆncias ca ue ROSSI.75 0.58 0. A seguir ´ apresentado um roteiro para ca ca ue a e constru¸˜o de distribui¸˜es de freq¨ˆncia. e c AT = xm´x − xm´ a ın . Esse procedimento ´ aconselh´vel como uma a ılio e a primeira visualiza¸˜o da distribui¸˜o de freq¨ˆncias de uma vari´vel.78 0.99 Dados em ordem crescente 0.79 0.52 0.5 7. Considere uma amostra de 25 crian¸a. logo f´z-se necess´rio organiz´-los.78 1.75 0. e ue Tabela 3. como apresentados acima.77 0.78 0.55 0.65 0.79 0.0 50. Quando a vari´vel em estudo ´ do tipo cont´ a e ınua e assume muitos valores distintos.05 0.6 10 ` 19 a 20.05 1.75 0.65 1. agora. os dados devem ser colocados em ordem crescente: 0.52 0. Robson M.75 0.3 20 ` 59 a 45. ca a a a a ´ usual fazer uma Tabela de freq¨ˆncias. o agrupamento dos dados em classes ser´ sempre necess´rio na constru¸˜o das tabelas de freq¨ˆncias.6 18.10 Fonte: Dados hipot´ticos e 0. 55 e o maior ´ xm´x = 1.61 0. Para organizar os dados provenientes de uma vari´vel qualitativa.58 0.75 0. co e e ın a Amplitude (AT): ´ a diferen¸a entre o maior e o menor valor do conjunto de dados observados. h´ f´rmulas para determina¸˜o co ca ue a o ca do n´mero de classes de acordo com o n´mero de dados.65 0.80 0. 21 Tabela 3. Inicialmente.2 Fonte: IBGE 3.3.85 0.78 0.02 0. estes s˜o apresentados de forma desorganizada e de dif´ o a ıcil manipula¸˜o. ca a Idades (Anos) 1980 (%) 1991 (%) 0`9 a 27.90 Pode-se observar.10 0.85 0.55 Fonte: Dados hipot´ticos e 1.96 0.2 Distribui¸˜o de Freq¨ˆncias ca ue Geralmente ap´s a coleta de dados.96 Dados brutos 0. Essas f´rmulas eram uteis.85 0. a 0.99 0.9 ≥ 60 6.02 1. pois a constru¸˜o u u o ´ ca dos gr´ficos era muito custosa sem o aux´ do computador. Sexo Freq¨ˆncia ue Feminino 7545 Masculino 5905 Total 13450 Fonte: UEM/2002.75 0.77 0.1: Popula¸˜o brasileira por faixa et´ria.1.80 0. pois n˜o foram ainda submetidos a nenhum a a tipo de tratamento.61 0.

00 (0. que permitem uma melhor ue co ue visualiza¸˜o dos dados. neste caso : 0. 58 Observe que esse exemplo cont´m um n´mero pequeno de observa¸˜es (n = 25). 64 0. (f´rmula de Sturges).2 Distribui¸˜o de Freq¨ˆncias ca ue ROSSI. Para isso. pode-se simplificar o processo agrupando os dados em certo n´mero de classes. 10 − 0.3. utilizando esse valor pode-se obter os limites inferiores e superiores das classes: i) o limite inferior da primeira classe pode ser o menor valor da s´rie. cujos limites u ser˜o denominados limite inferior e limite superior. u ca e a Nesses casos. 12) = 0. a e 0.1: k = 25 = 5 ou k = 1 + 3. 52 + 0. e ii) os demais limites ser˜o obtidos somando aos limites inferiores o valor de h. Lembrando que a nota¸˜o ( ) significa que se esta incluindo os valores iguais ao limite inferior e excluindo ca os valores iguais ou superiores ao limite superior. Robson M. li : limite inferior e Li : limite superior da classe i. 22 log n . 12 k 5 Obs. aconselha-se escolher o n´mero mais pr´ximo de AT que resulte h = u u o em k um n´mero inteiro. 52 = 0. 12. pode ser obtido de uma das f´rmulas seguintes: u o i) k = √ n . 00 (1. o √ Para o exemplo 2. 22 Para os dados acima: AT = 1.52. u Agora. quando h´ um grande e u co a n´mero de dados observados o processo de ordena¸˜o ´ trabalhoso e a listagem final pouco representar´. os limites das classes tamb´m devem ser a u e AT n´meros inteiros. u a iv) o n´mero total de classes n˜o deve ser inferior a 5 e nem superior a 25. ii) k = 1 + 3. A quantidade de classes e a amplitude destas devem a ser obtidas observando as seguintes normas: i) as classes devem cobrir a amplitude total. 58 ∼ = = 0. 22log(25) 5. O n´mero de classes (k). 52 0. A partir da listagem ordenada das classes. ca Freq¨ˆncia: ´ o n´mero de valores que aparecem no dom´ ue e u ınio de uma classe. 76 (0. 88 1. Dividindo a amplitude total (AT ) por k = 5 chega-se ao tamanho ou amplitude de cada uma das classes: h= AT 0. 76 0. 76 + h) = 0. 88 + h) = 1. ii) o extremo superior de uma classe ´ o extremo inferior da classe seguinte. . 00 + h) = 1. representa a m´dia dos pontos limites da classe. 64 + h) = 0. Isto ´. 2 ii) n ´ o tamanho da amostra. e iii) cada valor observado deve enquadrar-se em apenas uma classe. 50. e e ue e iv) Fi ´ a freq¨ˆncia absoluta da i-´sima classe.: quando os valores observados s˜o n´meros inteiros. e e e e xi = li + Li . 52 + h = 0. Um quadro de freq¨ˆncias completo deve conter as seguintes informa¸˜es: ue co i) xi ´ o ponto m´dio da i-´sima classe. 64 (0. 88 (0. pode-se construir os chamados quadros (ou tabelas) de freq¨ˆncia ou distribui¸˜es de freq¨ˆncia.

n Assim.. ii. faci = e ue e Faci . Setores. e e Reticˆncia ( .) .00 - Outras informa¸˜es: co Nenhuma cela ( casa ) deve ficar em branco . (c) Por Superf´ ıcies. Histogramas. e a o Interroga¸˜o ( ? ) .3 Gr´ficos a Os gr´ficos s˜o representa¸˜es pict´ricas. ) .. indica que o valor num´rico ´ nulo.20 5 0. 2.58 5 0. 23 v) fi ´ a freq¨ˆncia relativa da i-´sima classe.52 0. a a co o a ca Os principais gr´ficos utilizados na representa¸˜o estat´ a ca ıstica s˜o: a 1. iv. i.76 0. Robson M.12 22 1.3 Gr´ficos a Fi . 0. 3.32 19 0. Diagramas. a distribui¸˜o de freq¨ˆncia pode ser da seguinte c ca ue forma: Tabela 3. (a) Por Pontos. ii. H´ ıfen ( .64 0. Barras.64 0.44 0.20 0. ca ıvel ca Classes xi Fi fi Fac 0. . fi = e ue e vi) Faci ´ a freq¨ˆncia acumulada da i-´sima classe. iii.76 0.3. ca 3.12 25 Total 25 1 Fonte: Dados hipot´ticos e fac 0.82 8 0. Poligonais.88 0.00 0.00 ).24 11 0.94 3 0. indica d´vida quanto a exatid˜o do valor num´rico. indica valor muito pequeno em rela¸˜o a unidade utilizada. n ROSSI. em em em em Colunas.3: Distribui¸˜o do n´ de intoxica¸˜o.70 6 0. (b) Por Linhas. no caso da amostra de 25 crian¸a intoxicadas. e ue e vii) faci ´ a freq¨ˆncia relativa acumulada da i-´sima classe.76 0. Estereogramas. ca u a e Zeros ( 0 . de grande valia na compreens˜o e visualiza¸˜o dos dados.06 3 0. indica que n˜o se disp˜e do dado. i. Curvas.88 1. 0. Cartogramas.88 1.0 .12 1.00 1.

3. pontos extremos tec. a Diagramas por Linha Poligonal: ´ ´ E a representa¸˜o gr´fica de uma s´rie estat´ ca a e ıstica por meio de uma linha poligonal.0 y 5. o 3.5 5. em intervalos iguais ou n˜o. um ponto P do plano est´ determinado pelos n´meros reais a u X e Y. Assim.3 Gr´ficos a ROSSI. 24 3. Para suas contru¸˜es co pode-se utilizar a proporcionalidade entre s´rie de n´meros ou do sistema retil´ e u ınio ortogonal. num sistema retil´ ıneo ortogonal. a Diagramas por Pontos (Diagramas de Dispers˜o): a ´ E a representa¸˜o gr´fica dos dados de forma bruta e geral.1: Diagrama de Dispers˜o de Pontos. tomados sobre dois eixos divididos em segmentos unit´rios.0 Jul May Jun Oct Nov Aug x Figura 3.1 Diagramas S˜o representa¸˜es gr´ficas de s´ries estat´ a co a e ısticas por interm´dio de linhas e superf´ e ıcies.3. As linhas utilizadas s˜o as poligonais e as curvas.0 4.5 6. y 0 0 2 4 6 8 10 2 4 x 6 8 Figura 3. o que pode fornecer uma id´ia da variabilidade ca a e dos dados. Este sistema estabelece uma correspondˆncia biun´ e ıvoca entre os pares de n´meros reais e os pontos de um plano. a e Sep Dec Jan Feb Mar Apr . Robson M. Tais conjuntos a co a de dados constituem as chamadas s´ries hist´ricas ou s´ries temporais. u de modo geral. e as superf´ a ıcies s˜o retˆngulos. Traduzem o comportamento de um e o e fenˆmeno em certo intervalo de tempo. representa observa¸˜es feitas ao longo do tempo. E um dos mais importantes gr´ficos.2: Gr´fico para S´ries Temporais.5 4. c´ a a ırculos e quadrados.

3 −3 −2 −1 0 1 2 3 Amostra Figura 3. Este tipo e a co de gr´fico proporciona comparar grandezas.0 −4 0. 25 O pol´ ıgono de freq¨ˆncia ´ um gr´fico que se obt´m unindo por uma poligonal os pontos correspondentes ue e a e a `s freq¨ˆncias das diversas classes.3: Suaviza¸˜o do pol´ ca ıgono de freq¨ˆncia. Robson M. ue Obs. consiste de uma linha poligonal das Fac ou das fac .4: Diagrama por Linha Curva.3 Gr´ficos a ROSSI. ue Ogiva A Ogiva ou Pol´ ıgono de Freq¨ˆncia Acumulada. Diagrama por Superf´ ıcie em Colunas: ´ E a representa¸˜o de uma s´rie estat´ ca e ıstica por interm´dio de retˆngulos em posi¸˜es verticais.3. centradas nos respectivos pontos m´dios.1 0. ca Probabilidade 0. a . Para obter as interse¸˜es do ue e co pol´ ıgono com o eixo. cria-se em cada extremo do histograma uma classe com freq¨ˆncia nula.: Suavizando a linha poligonal que define o pol´ ıgono obt´m-se uma curva que visualiza a tendˆncia e e de varia¸˜o dos dados. Pode ser utilizada para representar uma tendˆncia do tipo linear. e y 0 20 40 60 80 −2 0 x 2 4 6 Figura 3.2 0. ue Diagramas por Linha Curva: ´ E a representa¸˜o de uma s´rie estat´ ca e ıstica por meio de uma linha curva.

a 0 5 10 15 20 25 0 1 2 3 4 5 6 Figura 3. a e a . devem ser proporcionais c a a `s ´reas dos retˆngulos a serem tra¸ados. e a a ue Freqüência 0 −3 5 10 15 20 −2 −1 0 1 2 amostra Figura 3.3. dados pela s´rie estat´ a e ıstica ou suas diferen¸as.2 Histograma Diagrama por Superf´ ıcie em Histogramas: O Histograma ´ um conjunto de retˆngulos com bases sobre um eixo dividido de acordo com os tamanhos e a de classe.3 Gr´ficos a ROSSI. a 3.5: Gr´fico em Barras Verticais. Diagrama por Superf´ ıcie em Setores (Pizza): ´ E a representa¸˜o gr´fica de uma s´rie estat´ ca a e ıstica por interm´dio de superf´ e ıcies setoriais. construir retˆngulos de bases iguais e que tenham a e respectivamente. Por´m em virtude da proporcionalidade das ´reas dos setores de um c´ e a ırculo com seus ˆngulos centrais. os valores da vari´vel independente e os pontos marcados. por meio de cada base. A representa¸˜o ´ e ca e feita tomando como figura b´sica um c´ a ırculo que ´ dividido em setores.6: Histograma. Para tanto pode-se utilizar o sitema retil´ a c ınio ortogonal marcandose os pontos de forma j´ indicada. ´ E utilizado quando se pretende comparar os valores de uma s´rie com a sua soma total. e a partir do eixo dos x. podem-se dividir os valores considerados na s´rie proporcionalmente a estes ˆngulos. 26 Os valores da vari´vel dependente. centrados nos pontos m´dios das classes e ´reas proporcionais `s freq¨ˆncias. O quociente entre a soma dos valores e da s´rie e a ´rea do c´ e a ırculo deve ser o mesmo que entre cada valor da vari´vel dependente e a respectiva ´rea a a do setor representativo.3. Robson M.

3. 25 xB . .4 3. ıcie 3.3). dado no in´ ca ıcio desta parte. 27 B A C D Figura 3. A m´dia ser´ dada por: e a N µ= i=1 n xi ( dados populacionais ). A m´dia ser´ dada por: e a 25 x= xA = i=1 xi = n 19. para os dados agrupados (Tabela 3. a e Exemplo 3. 7864. 53 = 0. . com k classes. para dados n˜o-agrupados em tabelas de freq¨ˆncias. Robson M. o conjunto de dados da amostra retirada da vari´vel n´ a ıvel de intoxa¸˜o. Essas ca medidas representam quantitativamente os dados. Seja (x1 .4 Medidas Descritivas ROSSI. . 66 = 0. .1 Medidas Descritivas Medidas de Tendˆncia Central ou de Posi¸˜o e ca S˜o medidas que objetivam representar o ponto central de equil´ a ıbrio de uma distribui¸˜o de dados. ou 25 5 xB = Observe que xA ¯ i=1 xi Fi = n 19. quando os dados agrupados em tabelas de freq¨ˆncias. 7812. para dados n˜o-agrupados em tabelas de freq¨ˆncias. para os dados brutos. xn ) um conjunto de dados. a ue N i=1 xi ( dados amostrais ).4. sendo as mais utilizadas em an´lise: a M´dia e Representa o ponto de equil´ ıbrio de um conjunto de dados. ue n Quando os dados s˜o agrupados em intervalos de classes. xi corresponde ao ponto m´dio do intervalo.2. a ue x= n k i=1 xi Fi ( dados amostrais ). ¯ .7: Diagrama por Superf´ em Setores (Pizza). Considere do Exemplo anterior.

a a e Em outros casos. 90. pela propriedade: y = x + 2 = 4 + 2 = 6. 5. a e 3 . 2. 2. k i=1 di = (2 − 4) + (3 − 4) + (7 − 4) = 0. 5. isto ´. 3.A soma alg´brica dos desvios tomados em rela¸˜o a m´dia ´ nula. Existem s´ries de dados e ue e e em que nenhum valor aparece mais vezes que outros.E facilmente calculada. 15. S˜o s´ries amodais. Robson M. . 30. tem-se Y = {10. 5 . Diz-se ent˜o. Vantagens e desvantagens da M´dia: e ´ 1 . a todos os valores de uma vari´vel. 5. / ´ 3 .x = 5. 35. 7} → x = 4. Isto ´. um aluno tenha as seguintes notas em uma disciplina: 30. k Para k = +5. tem-se: Y = {4. 28 1 .em geral n˜o ocupa a posi¸˜o central do conjunto (ocupa a posi¸˜o do centro de equil´ a ca ca ıbrio). e 2 . a m´dia do conjunto fica multiplicada ou dividida por essa constante. 25. 6. . e o a e ´ conclu´ ımos que 50 ´ um valor falho para medir o aproveitamento do aluno. 35} → y = 20. ca ´ 4 . e ca e e e k i=1 di = k i=1 (xi − x) = 0 . pˆr uniformizar os dados. 95. a m´dia do conjunto a e fica aumentada ou diminu´ dessa constante. trimodal ou multimodal).4 Medidas Descritivas Propriedades da M´dia: e ROSSI.3.Multiplicando-se ou dividindo-se todos os valores de uma vari´vel por uma constante k. 25 35.E uma medida que.k = 0. yi = k · xi ⇒ y =k·x e yi = xi k ⇒ y= x . pela propriedade: y = 5. 2. . ıda yi = xi ± k ⇒ y =x±k Para k = +2. Como a m´dia deve traduzir o e 10 aproveitamento do aluno durante o ano e a m´dia 50 s´ foi conseguida ` custa das trˆs ultimas notas. pode aparecer dois ou mais valores de concentra¸˜o. 100. n˜o representa bem os conjuntos que revelam tendˆncias o a e extremas.4 = 20.Serve para compararmos conjuntos semelhantes. i = 1. . 7.E a medida de posi¸˜o mais conhecida e de maior emprego. uma vez que a mesma ser´ grandemente influenciada pelos valores discrepantes. . 6 .Depende de todos os valores do conjunto de dados. X : {2. ela nem sempre faz parte do conjunto de dados e e e (x ∈ X). 7 . 35. 5. 6. 500 Um c´lculo r´pido nos mostra que sua m´dia final foi x = a a e = 50. Moda A Moda (Mo ) ´ o valor que ocorre com maior freq¨ˆncia em uma s´rie de dados. . 2. que a s´rie tem duas ou ca a e mais modas (bimodal. 2 . a Suponha por exemplo.Somando-se ou subtraindo-se uma constante k.A m´dia nem sempre tem existˆncia real. Neste caso n˜o apresenta moda. n pela propriedade: X = {2. 9} → y = 6. 8} → Mo = 2 (unimodal). que durante um ano letivo.

n˜o-agrupados em classes. 7 Quando o conjunto de observa¸˜es tem um n´mero par de valores. co ue e ent˜o a mediana ´ dada pela express˜o abaixo. para os dados agrupados da amostra dada na Tabela 3. 2 x1 3 x2 5 x3 5 x4 6 x5 7 5+6 x6 → Md = = 5. a Quando o conjunto de observa¸˜es tem um n´mero ´ co u ımpar de valores. dada a seguir. para calcular o valor que representa a moda: ( onde i ´ a ordem e da classe de maior freq¨ˆncia). ue “Czuber”: Mo = li + Outras modas: “Pearson”: Mo = 3. ıvel ue e Mediana A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza. 2 x1 3 x2 5 x3 5 x4 6 x5 → Md = 5. a 2 h(p − Fac−1 ) Md = li + Fi Exemplo 3.x e “King”: Mo = li + h. i = 3 (Classe de maior freq¨ˆncia) ue h = 0. onde 2 n p= . Calcular a mediana para os dados agrupados da amostra da Tabela 3. onde onde i representa a classe mediana. 76 + 0. ent˜o a co u a a xp + xp+1 mediana ser´.3. a classe onde a e a n estar´ presente o valor de p = .3. n˜o-agrupados em classes. (Fi − Fi−1 ) + (Fi − Fi+1 ) Exemplo 3. 29 Quando os dados se apresentam agrupados em tabelas de freq¨ˆncias ´ necess´rio utilizar a express˜o de ue e a a “Czuber” (a mais precisa). 5.4. ´ o valor situado e de tal forma no conjunto que o separa em dois subconjuntos de mesmo n´mero de elementos (´ o valor u e que est´ no meio !). Fi−1 + Fi+1 h(Fi − Fi−1 ) .Md − 2. 12(8 − 6) (8 − 6) + (8 − 3) 0. isto ´. 76 Fi = F3 = 8 Fi−1 = F2 = 6 Fi+1 = F4 = 3 Mo = 0. Calcular a moda de Czuber. 12 l3 = 0. Robson M.3.794 g. onde p = e a .Fi+1 . a m´dia aritm´tica dos dois n´meros que ocuparem o meio da s´rie: Md = a e e u e .4 Medidas Descritivas ROSSI.3. ent˜o a a n+1 a mediana ´ dada pela express˜o: Md = xp . 7 2 Quando o conjunto de observa¸˜es se apresenta agrupados em classes em uma tabela de freq¨ˆncias. 794 Isto significa que o n´ de toxicidade mais freq¨ˆnte ´ de 0. .

ca e e Desvio m´dio em rela¸˜o ` m´dia para dados n˜o tabulados: e ca a e a n n Desvio m´dio em rela¸˜o ` m´dia para dados tabulados: e ca a e n Dm = i=1 |xi − x| ¯ Dm = Variˆncia a i=1 |xi − x| Fi ¯ n ´ Variˆncia [Var(X)]. ou variabilidade do conjunto de observa¸˜es a co pesquisados. em rela¸˜o a uma medida de tendˆncia central. 12 Fi = 8 Fac−1 = 11 (freq¨ˆncia acumulada da classe anterior) ue l3 = 0. Por ´ a e o co exemplo. c ıvel 3.4 Medidas Descritivas ROSSI. 5 − 11) Md = 0. Robson M. ca e ¯ Uma unica medida n˜o ´ suficiente para descrever de modo satisfat´rio um conjunto de observa¸˜es. desvio-padr˜o (σ a a a a ou s) e coeficiente de varia¸˜o (CV). E a medida que fornece o grau de dispers˜o.4. a As principais medidas de dispers˜o s˜o: amplitude total (AT).3.2 Medida de Variabilidade ou de dispers˜o a S˜o medidas estat´ a ısticas que indicam o grau de dispers˜o. 5 est´ na terceira linha −→ olhar em Fac a 2 h = 0. ou variabilidade dos valores do a a conjunto de observa¸˜es em torno da m´dia. por exemplo.783 g. variˆncia (σ 2 ou s2 ). Brutos s = 2 i=1 k (xi − x) ¯ n−1  2 D. Ela ´ calculada somando os quadrados dos desvios em rela¸˜o co e e ca a e ` m´dia: Amostral n Populacional 2 N D. Agrupados s = 2 i=1 (xi − x) Fi ¯ n−1 ou s = 2 k i=1 2 σ = 2 (xi −µ)2 N i=1 1 n−1  k   x2 Fi − i=1 i xi Fi n     k σ = 2 (xi −µ)2 Fi N i=1 . a dispers˜o de um e e a pode ser muito maior que a dispers˜o do outro. 12(12. 783 8 Isto significa que o 50% das crian¸as apresenta n´ de toxicidade acima de 0. no entanto. 76 + 0. x. ca Amplitude total ´ Amplitude total (AT): E a diferen¸a entre o maior e o menor valor observado c AT = xm´x − xm´ a ın Desvio absoluto m´dio e ´ Desvio absoluto m´dio (Dm ): E a m´dia aritm´tica dos valores absolutos dos desvios tomados em e e e rela¸˜o a uma das seguintes medidas de tendˆncia central: m´dia ou mediana. dois conjuntos de dados podem ter a mesma m´dia aritm´tica e. 30 n = 25 n i = 3 p = = 12. 76 0.

mais representae ca ca tiva dos dados ser´ a m´dia. a e b constantes reais. Y = Y = X k X k ⇒ ⇒ V ar(Y ) = DP (Y ) = V ar(X) k2 DP (X) |k| ⇒ ⇒ V ar(Y ) = k 2 · V ar(X) DP (Y ) = |k| · DP (X) ⇒ ⇒ V ar(Y ) = V ar(X) + 0 DP (Y ) = DP (X) + 0 4 . Como a variˆncia calculada a partir do quadrados dos desvios. sua unidade a a ´ quadrada em rela¸˜o ` vari´vel estudada. como ´ uma divis˜o de elementos de mesma unidade. E uma medida relativa da dispers˜o ou variabilidade dos dados: ca a CV(x) = s σ (amostral) ou CV(x) = (populacional). denominada desvio padr˜o.V ar(X) ≥ 0 =⇒ DP (X) ≥ 0. o que. (amostral) Note que o coeficiente de varia¸˜o. imaginou-se uma nova medida que tem utilidade e interpreta¸˜o pr´tica. sob o ponto de vista pr´tico ´ um inconveniente. 2 .3. a variˆncia e o a a desvio-padr˜o do novo conjunto permanecem inalterados: a Y =X ±k Y =X ±k X: Vari´vel Aleat´ria e k: constante real. Coeficiente de varia¸˜o ca ´ Coeficiente de varia¸˜o (CV). tem-se: a o Y = aX ± bW Variˆncia Relativa a A variˆncia relativa de uma s´rie X ´ indicada por VR(X) e definida por: a e e V R(X) = s2 (¯) x 2 ⇒ V ar(Y ) = V ar(aX ± bW ) = a2 V ar(X) + b2 V ar(W ).Somando-se ou subtraindo-se uma constante k. tal que Y = aX ± bW. Robson M. x ¯ µ Crit´rios para interpreta¸˜o: Quanto menor for o coeficiente de varia¸˜o (CV ≤ 25%). pode ser expresso em percentual.4 Medidas Descritivas ROSSI. a e . a todos os valores de uma vari´vel.Sejam X e W vari´veis aleat´rias independentes. k. a variˆncia e a a o desvio-padr˜o do novo conjunto s˜o alterados da seguinte forma: a a Y =k·X Y =k·X e para k = 0.Multiplicando-se ou dividindo-se todos os valores de uma vari´vel por uma constante. ´ um n´mero puro. Por isso e ca a a a e mesmo. 31 Desvio-padr˜o a Desvio-padr˜o [DP(X)]. ca a a definida como a raiz quadrada da variˆncia e representada por: a Amostral √ s = s2 Populacional √ σ = σ2 Propriedades da Variˆncia e do Desvio-Padr˜o a a 1 . ca e a e u Portanto. a o 3 .

32 Exemplo 3.1 Medidas Separatrizes Quartis. 92 2. assim: 1. Decis e Percentis As medidas de posi¸˜o denominadas “Separatrizes” para valores agrupados s˜o calculadas atrav´s da ca a e express˜o: a Sk = li + h(p − Fac−1 ) Fi onde SK : ´ a medida de posi¸˜o separatriz desejada (Md : M ediana. o desvio-padr˜o e o coeficiente de varia¸˜o para o conjunto de dados a a ca amostrais apresentados na tabela abaixo. 51 cv = 0.2% > 25%. 25 n 2 4. Tabela 3. 12. o desvio-padr˜o e o coeficiente de varia¸˜o para o conjunto de dados a a ca da amostra X: {2. 29. Calcular a variˆncia. 3) s2 = i=1 = 4.2  7 k 2 i=1 2 2 2 (xi − x) Fi ¯ n−1  s2 = 2. h´ indicativo de que a m´dia n˜o ´ representativa).4: Exemplo de Tabela de Freq¨ˆncia.4 + 5.5. e w : ´ o divisor. 51.5 3.2 + (3 − 3) . 3) + (3 − 4. Qk : Quartil. e . 3) + (7 − 4. 25 Exemplo 3. 29 8−1 8 7 √ logo. 3.2 = 3. 3) + (5 − 4.4 + (5 − 3) .5 Medidas Separatrizes ROSSI. 7}. a e a e 4. 29 1. 3. Sabemos que x = 4. k : ´ a ordem da medida. 5. temos 8 = (1 − 3) . 522 (sendo CV=52.3. 50 (h´ indicativo de que a m´dia n˜o ´ representativa). s = 2.5. Dk : Decil ou Pk : e ca P ercentil de ordem k). ou s2 = 1 n−1  k   x2 Fi − i=1 i 2 x i Fi n    = s2  1 (24) 16 88 − = 2. 12 CV = 0. ent˜o: a (xi − x) ¯ 2 2 2 2 (2 − 4.2 + 3. Robson M. ue xi Fi 1 2 3 4 5 2 Total 8 3 sendo x = k i=1 i=1 xi Fi = 2 n 1. a e a e 3 = 3. 92 3 √ n−1 s = 4. Calcular a variˆncia.6. assim: 2.

52 0..3. 3 1. } a 25.88 1. 12(6.12 22 0. 12 Fi = F2 = 6 li = 0. 76 + 0. ıvel ca isto ´. 2. Q2 . 665 6 Obs.58 5 0.76 0.9 1.12 1. dado por: e ca ca k 1 1. 12 Fi = 8 li = 0. 12(18. w = 4.k w w 2 4 10 100 p= Exemplo 3. 665 representa o n´ de intoxica¸˜o que deixa 25% dos demais valores abaixo dele.: O valor Q2 0.2 p= = 12.: O valor Q1 = 0.. P10 e P90 para os dados da Tabela 3. 75 − 11) Q3 = 0.06 3 0. 025 = 0. 2.7. 5 − 11) 0.24 11 0..76 0. } a 25.3 p= = 18.5: Distribui¸˜o do n´ de intoxica¸˜o (g) em 25 crian¸as.64 0. 64 + 0.00 Total 25 1 Fonte: Dados hipot´ticos e Solu¸˜o: ca C´lculo de Q1 : {k = 1.5 Medidas Separatrizes ROSSI. 64 + = 0.3.00 1. Tabela 3. 76 Fac−1 = 11 0.20 0.88 1. 25 − 5) Q1 = 0. 25 (i = 2 : olhar em Fac ) 4 h = 0.12 25 1. Calcule o Q1 .44 0.20 5 0. 76 + 8 Obs. ´ o valor mediano. } a 25. 783 = Md Q2 = 0.1 p= = 6. 876 8 . 5 (i = 3) 4 h = 0.70 6 0. e e C´lculo de Q3 : {k = 3. D7 . 33 Sk Md Q D P p : ´ a posi¸˜o da observa¸˜o. 783 representa o o n´ de intoxica¸˜o que deixa 50% dos demais valores abaixo dele.94 3 0.32 19 0. Q3 .64 0.82 8 0. ca ıvel ca c Classes xi Fi fi Fac fac 0. 12 Fi = 8 li = 0.76 0.. . Robson M. w = 4.99 n. 76 Fac−1 = 11 0... ıvel ca C´lculo de Q2 : {k = 2. 2. w = 4. 12(12. 64 Fac−1 = 5 0. . 75 (i = 3) 4 h = 0.00 0.88 0.

76 + 0. 76 Fac−1 = 11 0.: O valor D7 0.: O valor P90 = 1. 00 Fac−1 = 22 0. 876 representa o n´ de intoxica¸˜o que deixa 75% dos demais valores abaixo dele. 12(22. 5 (i = 1) 100 h = 0. ıvel ca C´lculo de P10 : {k = 10. 12 Fi = 5 li = 0. 52 Fac−1 = 0 0. Quando a m´dia ´ menor que a mediana que ´ menor que a moda. ıvel ca C´lculo de D7 : {k = 7. 5 − 11) D7 = 0.7 p= = 17.10 = 2.90 p= = 22. 858 8 Obs. 858 representa o o n´ de intoxica¸˜o que deixa 70% dos demais valores abaixo dele. 3. 5 (i = 3) 10 h = 0. 58 5 Obs. ıvel ca C´lculo de P90 : {k = 90. } a 25. } a 25. 52 + = 0. } a 25. 12(2.5. 12 Fi = 8 li = 0. (B) Distribui¸˜o Sim´trica. 58 representa o o n´ de intoxica¸˜o que deixa 10% dos demais valores abaixo dele. moda e mediana s˜o iguais.5 Medidas Separatrizes ROSSI. 5 (i = 1) p= 100 h = 0. 02 representa o o n´ de intoxica¸˜o que deixa 90% dos demais valores abaixo dele ıvel ca ou 10% acima dele. w = 100. ca ca e e e e (A) Distribui¸˜o Assim´trica negativa. Quando a m´dia. . 12 Fi = 3 li = 1. 34 Obs. 5 − 0) P10 = 0. ca e e a o (C) Distribui¸˜o Assim´trica positiva. 5 − 22) P90 = 1 + = 1.: O valor P10 = 0. w = 10. 12(17.: O valor Q3 0.3. 02 3 Obs. w = 100.2 Medidas de Simetria Tem por objetivo b´sico medir o quanto a distribui¸˜o de freq¨ˆncias do conjunto de valores observados a ca ue se afasta da condi¸˜o de simetria. Robson M. ou muito pr´ximas. Quando a m´dia ´ maior que a mediana que ´ maior que a ca e e e e moda.

153 .8: (A) Assim´trica Negativa (¯ < Md < Mo ) e x Figura 3. e s 0.9: (B) Sim´trica (¯ = Md = Mo ) e x Figura 3. 794. 786 − 0. Considerando o conjunto de dados da Tabela 3. 35 Figura 3. sabemos que: x = 0.8. 04967 (Ap < 0 : assim´trica negativa ).10: (C) Assim´trica Positiva (Mo < Md < x) e ¯ Uma das medidas para quantificar a assimetria de uma distribui¸˜o pode ser dada pelo primeiro coeca ficiente de assimetria de Pearson (Ap ) : Ap = x − Mo ¯ 3 (¯ − Md ) x ou Ap = s s Outra ´ atrav´s do coeficiente quartil´ e e ıtico de Bowley (Ab ) : Ab = Q3 + Q1 − 2Md Q3 − Q1 Em ambos temos: Se A < 0 a distribui¸˜o ´ assim´trica negativa. assim: x − Mo ¯ 0. s = 0. ca e e Exemplo 3.3. 153 e Mo 0.3. ca e e Se A = 0 a distribui¸˜o ´ distribui¸˜o sim´trica. Robson M. 794 Ap = = −0. 7864. obter Ap . ca e ca e Se A > 0 a distribui¸˜o ´ assim´trica positiva.5 Medidas Separatrizes Gr´fico das distribui¸˜es quanto ` assimetria a co a ROSSI.

3.5. (A) Distribui¸˜o Leptoc´ rtica. Quando a distribui¸˜o apresenta uma curva de freq¨ˆncia mais “aberta” ca u ca ue que a da distribui¸˜o Normal. Quando a distribui¸˜o apresenta uma curva de freq¨ˆncia mais “fechada” ca u ca ue que a da distribui¸˜o Normal.3 Medidas de Curtose A curtose ou achatamento mede a concentra¸˜o ou dispers˜o dos valores de um conjunto de valores ca a em rela¸˜o `s medidas de tendˆncia central em uma distribui¸˜o de freq¨ˆncias conhecida (a distribui¸˜o ca a e ca ue ca Normal). ca (C) Distribui¸˜o Platic´ rtica. ca (B) Distribui¸˜o Mesoc´ rtica.5 Medidas Separatrizes ROSSI. 36 3. ca Gr´fico das distribui¸˜es quanto ` curtose a co a Figura 3.11: Leptoc´rtica u Figura 3.13: Platic´rtica u As medidas de curtose podem ser calculadas atrav´s da express˜o: e a k= Obs1 : k : coeficiente de curtose (Q3 − Q1 ) 2(P90 − P10 ) . Quando a distribui¸˜o apresenta uma curva de freq¨ˆncia “idˆntica” a ca u ca ue e da distribui¸˜o Normal.12: Mesoc´rtica u Figura 3. Robson M.

665.3. Q3 = 0. u 2(P90 − P10 ) 2(1. temos: Se k4 > 0 a distribui¸˜o ´ leptoc´rtica ca e u Se k4 = 0 a distribui¸˜o ´ mesoc´rtica ca e u Se k4 < 0 a distribui¸˜o ´ platic´rtica ca e u Exemplo 3. para dados e tabelados: (xi − x)4 Fi ¯ Fi k4 = −3 σ4 Lembrando que σ4 = σ2 e s = s 4 2 2 2 = (xi − x)2 Fi ¯ N (xi − x)2 Fi ¯ n−1 2 (populacional). 58 e P90 = 1. Sabemos que Q1 = 0. 2 = (amostral). obter k. 02 . o coeficiente de curtose baseado nos momentos centrados (k4 ). 58) . temos: a ca Se k < 0. 263 ( leptoc´rtica ) u Se k = 0. 263 : leptoc´rtica). 876. 02 − 0. 263 ( platic´rtica ) u Podemos utilizar tamb´m. o coeficiente de curtose interquartil´ ıtico. 665) k= = = 0. 2398 (k < 0. P10 = 0. Considerando o conjunto de dados da Tabela 3.3. Analogamente. 876 − 0. 37 Obs2 : Q3 − Q1 ´ denominado Desvio Interquartil´ e ıtico. Relativamente ` curva da distribui¸˜o Normal.5 Medidas Separatrizes ROSSI. ent˜o: a (Q3 − Q1 ) (0. Robson M.9. 263 ( mesoc´rtica ) u Se k > 0.

1 Introdu¸˜o ca Inferˆncia Estat´ e ıstica ou Estat´ ıstica indutiva ´ a parte da estat´ e ıstica que utiliza m´todos cient´ e ıficos para fazer afirma¸oes e tirar conclus˜es sobre caracter´ c˜ o ısticas ou parˆmetros de uma popula¸˜o. um processo de racioc´ e ınio em que. Esse fato ´ fundamental para que uma inferˆncia possa ser considerada estat´ e e ıstica.Cap´ ıtulo 4 Inferˆncia Estat´ e ıstica 4. partindo-se do conhecimento de uma parte. Evidentemente. e e a n˜o h´ informa¸˜es nem sobre os parˆmetros. Essas s˜o decis˜es baseadas em c a a o procedimentos amostrais. mas se desconhece a forma da curva. co ´ a E f´cil perceber que um processo de inferˆncia ou indu¸˜o ( em estat´ e ca ıstica) n˜o pode ser exato. Basta observar como uma cozinheira verifica se o prato que ela est´ preparando a a tem ou n˜o a quantidade adequada de sal. co dizendo tamb´m. e com que a e e probabilidade. A a Inferˆncia Estat´ e ıstica.2 Problemas de Inferˆncia e O objetivo da Inferˆncia Estat´ e ıstica ´ obter afirma¸˜es sobre uma dada caracter´ e co ıstica da popula¸˜o. procura-se tirar conclus˜es o sobre a realidade no todo. e faz parte dos objetivos da Inferˆncia Estat´ e ıstica. ap´s experimentar um a o peda¸o de uma laranja numa banca de feira. Mas isso raramente acontece. entretanto. O objetivo ´ procurar a conceitua¸˜o formal desses princ´ e ca ıpios intuitivos do dia-a-dia para que possam ser utilizados cientificamente em situa¸˜es mais complexas. Por exemplo. O uso de informa¸˜es da amostra para concluir sobre o todo faz parte da atividade co di´ria da maioria das pessoas. co Essa caracter´ ıstica de interesse pode ser representada por uma vari´vel aleat´ria. a partir de informa¸˜es colhidas de uma amostra. fosse conhecida n˜o haveria necessidade de ca a a colher uma amostra. isto o e ca ´. Ent˜o. o uso de uma amostra a a co a a permite ter uma id´ia sobre o comportamento da vari´vel na popula¸˜o. Ou ainda. nem sobre a forma da curva. Se informa¸˜es completa a o co sobre a distribui¸˜o de probabilidade da vari´vel em estudo. a Segue-se que a teoria da Inferˆncia Estat´ e ıstica recorre intensamente a conceitos e resultados do C´lculo a de Probabilidades. O pr´prio termo “indutiva” decorre da existˆncia de um processo de indu¸˜o. pode-se ter uma id´ia da m´dia e variˆncia. Ou ainda. usando-se as ca e ca a propriedades estudadas anteriormente. Em suma. a altura dos brasileiros adultos. na ca qual se tem interesse. quando uma dona de casa. qual a precis˜o desses resultados e com que probabilidade se pode confiar nas conclus˜es e a o obtidas. decide se as compra ou n˜o. ir´ dizer at´ que ponto pode-se estar errando nas inferˆncias. e a ca 38 . 4. a Inferˆncia Estat´ e ıstica busca obter resultados sobre as popula¸˜es a partir das amostras. baseando-se em a ca resultados de uma amostra. Toda afirma¸˜o desejada seria obtida atrav´s da distribui¸˜o da vari´vel. Em ca a e a a outros casos. A informa¸˜o que se tem a respeito ca da vari´vel ´ parcial ou nada se conhece. a forma como as inferˆncias ser˜o realizadas ir´ depender de cada tipo de problema. e a a conforme ser´ estudado posteriormente. apresenta uma a e distribui¸˜o normal. mas os parˆmetros que a caracterizam (m´dia e variˆncia) s˜o desconhecidos.

. com um certo parˆmetro de interesse.1 Distribui¸˜o Binomial ca Considere n ensaios independentes e todos com a mesma probabilidade de sucesso p. 39 4. 4. Xn ) assume todos os valores poss´ ıveis. A decis˜o ser´ baseada em uma estat´ ca a a ıstica calculada em fun¸˜o da ca amostra. nem sobre a forma da curva. de n a a o ca elementos sorteados dessa popula¸˜o. com reposi¸˜o. apresenta uma distribui¸˜o Normal? ca • a prevalˆncia (propor¸˜o) de uma determinada doen¸a infecciosa segue uma distribui¸˜o Binomial? e ca c ca • o n´mero de filhos de um casal humano segue uma distribui¸˜o de Poisson ? u ca • o tempo de vida de pacientes soropositivos segue uma distribui¸˜o Exponencial? ca Se n˜o h´ informa¸˜es nem sobre os parˆmetros.. 2.4. Atrav´s de suas caraca e a ca e ter´ ısticas e atrav´s de testes de aderˆncia. Uma popula¸˜o X. calcula-se o valor da estat´ ıstica. Ent˜o. Robson M. ca a e Exemplos: • a altura dos brasileiros adultos.. a o Se informa¸˜es completa sobre a distribui¸˜o de probabilidade da vari´vel em estudo. Os valores da estat´ ıstica formam uma nova popula¸˜o. ca a Isto ´. ca a 2. A informa¸˜o que se tem a respeito da vari´vel ´ parcial ou nada se conhece..X2 . Didaticamente. ou a distribui¸˜o a a ca ´ produzida atrav´s de simula¸˜o computacional. Nestes casos um novo modelo dever´ ser produzido. toda afirma¸˜o desejada seria obtida atrav´s desta a a ca e distribui¸˜o. (X1 . 1. q = 1 − p.. A vari´vel aleat´ria discreta que conta o n´mero total de sucessos ´ denominada Binomial com parˆmetros a o u e a n e p. cuja distribui¸˜o recebe o nome de distribui¸˜o ca ca ca amostral da estat´ ıstica. qual a distribui¸˜o da estat´ e ca ıstica quando (X1 . podemos verificar qual o modelo probabil´ e e ıstico (conhecido) ser´ mais adequado aos dados. isto ´ e X ∼ Bin(n. ent˜o. 4. de acordo com um certo procedimento. x = 0.3 Distribui¸˜o Amostral ca ROSSI.4 Distribui¸˜es de Probabilidade co O objetivo da Inferˆncia Estat´ e ıstica ´ obter afirma¸˜es sobre uma dada caracter´ e co ıstica da popula¸˜o. co Essa caracter´ ıstica de interesse pode ser representada por uma vari´vel aleat´ria.. segundo o plano amostral adotado. na ca qual se tem interesse. que o problema da Inferˆncia Estat´ a e ıstica ´ fazer uma afirma¸˜o sobre parˆmetros da popula¸˜o e ca a ca atrav´s da amostra. n. A validade da resposta seria melhor compreendida se fosse conhecido o que acontece com a estat´ ıstica. Ser´ utilizado uma amostra aleat´ria simples. a Muitas vezes isto n˜o acontece. fosse conhecida co ca a n˜o haveria necessidade de colher uma amostra..4. Suponha que uma afirma¸˜o deva ser feita sobre um parˆmetro populacional (m´dia. a partir de informa¸˜es colhidas de uma amostra. o uso de uma a a co a a amostra nos d´ uma id´ia sobre o comportamento da vari´vel na popula¸˜o. quando todas as amostras de uma popula¸˜o conhecida s˜o retiradas. ca 3. tem-se o seguinte esquema: 1. Todas as amostras retiradas da popula¸˜o.. Xn ).X2 .. p) onde sua fun¸˜o de probabilidade ´ dada por: ca e P (X = x) = n x n−x p q . ca Mas isso raramente acontece. x . e ca a e variˆncia ou qualquer outra medida). Para cada amostra. e e ca 4.3 Distribui¸˜o Amostral ca J´ foi visto. Esta distribui¸˜o ´ chamada de distribui¸˜o amostral da estat´ ca e ca ıstica e desempenha papel fundamental na teoria de Inferˆncia Estat´ e ıstica..

dos quais haveria pequena quantidade de baixos e altos. A Distribui¸ao de Probabilidade Normal.2. conforme figura ca abaixo. . encontrar´ ıamos diversos valores. 2.4..: Se X tem uma distribui¸˜o Binomial ent˜o ca a m´dia : e variˆncia : a E(X) = np V ar(X) = npq 4. ca e Calcular as probabilidades de chegadas desses pacientes: Tabela 4.1.149 8 0. apresenta varia¸˜es dentro de um o o co intervalo definido. Qual a probabilidade de todos serem curados? ca a X P (X ∼ = Bin(15.050 7 0. c e u Dentre os que tˆm essa doen¸a. 1. 0.003 3 0.4.4. ou Distribui¸˜o Gaussiana (curva de Gauss). 215−15 15 0.2 por Distribui¸˜o de Poisson ca Uma vari´vel X tem distribui¸˜o de Poisson com parˆmetro λ > 0 se sua fun¸˜o de probabilidades ´ dada a ca a ca e e−λ λ . e grande quantidade em torno dos valores centrais.224 9 0.1: Distribui¸˜o de Poisson com parˆmetro λ = 3.008 2 0. x = 0.050 4. nesses casos. sorteamos 15 pacientes que ser˜o submetidos ` cirurgia.101 12 0. Numa representa¸˜o gr´fica dos dados obtidos. 0352 ou 3.168 11 0. encontrar´ ca a ıamos uma distribui¸˜o normal. x! com parˆmetro λ sendo usualmente referido como a taxa de ocorrˆncia. se caracteriza por c˜ ca reunir um grande n´mero de valores em torno da m´dia. . 815 0. λ ´ e o e a freq¨ˆncia m´dia ou esperada de ocorrˆncias num determinado intervalo de tempo. Se colet´ssemos os dados quanto ao peso de mil indiv´ a ıduos. que diminuem gradualmente de freq¨ˆncia ` medida u e ue a que se afastam dela. ue e e Exemplo 4.4 Distribui¸˜es de Probabilidade co ROSSI.001 4 0.000 5 0. e c a a Fazendo alguma suposi¸˜o adicional que julgar necess´ria. em especial os biol´gicos. ca a x P(X = x) x P(X = x) 0 0. 52%. A nota¸˜o utilizada ser´ a e ca a P (X = x) = X ∼ P o(λ). 8) 15 15) = 0.000 ≥ 13 ≈0 6 0. Obs. Robson M. 40 Exemplo 4. Uma certa doen¸a pode ser curada atrav´s de procedimentos cir´rgicos em 80% dos casos. Chegada de pacientes em um pronto socorro. Suponha que o n´mero de pacientes que chegam a um pronto socorro de uma pequena cidade durante a u madrugada tenha distribui¸˜o de Poisson com m´dia 3 (λ = 3). O modelo Poisson ´ um modelo discreto muito utilizado em experimentos biol´gicos e.3 Distribui¸˜o Normal ca A maioria dos fenˆmenos da natureza.022 1 0.224 10 0..

10) mmHg. Robson M. 1) σ Exemplo 4. tˆm distribui¸˜o Normal com m´dia : µ e desvio-padr˜o : σ. − ∞ < x < +∞ X ∼ N (µ. e e ca e a Devido a complexidade da fun¸˜o de probabilidade. 28% das pessoas jovens e sadias tˆm press˜o sist´lica acima de 140 mmHg.4.1: Distribui¸˜o Normal. e e a o . 26% 95. 45% 99. 28%. ´ cont´ e ınua.2 0. ca A distribui¸˜o de probabilidade ´ dada por: ca e P (X = x) = 1 √ σ 2π 1 x−µ σ e 2 − 2 . a curva em forma de sino.0 −4 0. 2. 4. a o a Suponha que a press˜o arterial sist´lica em pessoas jovens gozando de boa sa´de tenha distribui¸˜o a o u ca N (120. conforme abaixo: e ca a µ±σ µ ± 2σ µ ± 3σ = = = 68. constru´ atrav´s da transforma¸˜o na vari´vel X: ıda e ca a Z= Caracter´ ısticas: 1.3 −3 −2 −1 0 1 2 3 Amostra Figura 4. Qual ´ a probabilidade de se encontrar uma pessoa com press˜o sist´lica acima de 140 mmHg ? e a o X −µ 140 − 120 = =2 σ 10 P (X ≥ 140) = P (Z ≥ 2) = P (Z ≤ −2) = 0. Z= Isto ´. a curva de inflex˜o ocorre nos pontos x = µ ± σ. a Como j´ dissemos. ´ unimodal. Press˜o sist´lica em jovens saud´veis. 73% X −µ ∼ N (0. a e 6.3. 41 Probabilidade 0. 0228 ou 2. ´ sim´trica: a m´dia (µ) = a moda (Mo ) = a mediana (Md ). a ´rea subordinada ` curva normal representa 100% das freq¨ˆncias. fazemos uso da Tabela Normal-Padr˜o ou Normalca a Reduzida.4 Distribui¸˜es de Probabilidade co ROSSI. Em torno da a a a ue m´dia determinamos intervalos com utiliza¸˜o do desvio-padr˜o. e 5. ue e e e 3. σ) Lˆ-se: O conjunto de dados X. que engloba o total de freq¨ˆncias ou 100%. 2.1 0. o desvio-padr˜o ´ σ.

5 Verifica¸˜o da Adequa¸˜o do Modelo ca ca ROSSI. e Para a distribui¸˜o Normal. em especial. 42 4. se p-valor < 5% ent˜o rejeitamos H0 . sabemos que: ca µ±σ µ ± 2σ µ ± 3σ = = = 68.s ¯ .s ¯ 2 . 26% 95. inicialmente. se for verificado que pelo menos o p-valor de um teste ´ significante (p < α%).s ¯ x ± 1. e a • Testes de aderˆncia: Kolmogorov-Smirnov (K-S) [µ e σ conhecidos]. os dados s˜o normalmente distribu´ e a ıdos.5 Verifica¸˜o da Adequa¸˜o do Modelo ca ca Na pr´tica n˜o podemos fazer suposi¸˜es arbitr´rias a respeito da distribui¸˜o de probabilidade dos a a co a ca dados. na pr´pria apresenta¸˜o do resultado. e a ¯ Tabela 4. ıvel ca Outros crit´rios: e • T´cnicas Gr´ficas: Normal-plot. • Devemos fixar. e ca ca A verifica¸˜o pode ser baseada nas caracter´ ca ısticas do modelo. . muitos laborat´rios j´ indicam os limites e a o ca o a inferiores e superiores para o valor da medida que devem servir de base ao racioc´ ınio cl´ ınico. conseq¨enteıvel a a mente os dados n˜o s˜o normalmente distribu´ a a ıdos. x ± Z α . e a Isto ´ t˜o comum que. Robson M.2: Faixas de Cobertura (1 − α)% 90% 95% 99% . para um n´ de significˆncia de 5%. . e Faixa x ± 1. respectivamente]. 4. (1 − α)% Referˆncia. logo usamos de t´cnicas para fazer uma verifica¸˜o da adequa¸˜o do modelo suposto. o n´ de confian¸a (1 − α)% ou cobertura. 73% Grandes discrepˆncias entre as freq¨ˆncias relativas observadas e as probabilidades te´ricas acima sitadas. ca a a isto ´. . 96. a hip´tese de a e o normalidade da distribui¸˜o deve ser rejeitada. a ue o indicam uma poss´ falta de adequa¸˜o ao modelo gaussiano. Shapiro Wilks (W) e/ou Lilliefors e (L) [µ e σ desconhecidos e estimados pelos dados atrav´s de x e s. e caso contr´rio se houver concordˆncia dos testes W e L.s ¯ x ± 2. . 58.6 Faixas de Referˆncia e Toda medida laboratorial ´ analisada confrontando-se seu valor com uma faixa padr˜o.4. Q-Q-plot e P-P-plot. 45% 99. e ¯ A hip´tese de normalidade nos dados deve ser da seguinte forma: o H0 : Ha : Os dados s˜o normalmente distribu´ a ıdos Os dados n˜o s˜o normalmente distribu´ a a ıdos u Por exemplo. ıvel c • Calculamos atrav´s da amostra de pessoas supostamente saud´veis: x e s. em gr´ficos especiais e em testes de a aderˆncia. Na pr´tica. 64.

(Software Statistica vers˜o 6. ca Para a Amostra 1. Faixa de referˆncia para identificar o Pseudomonas sp. Os testes confirmam isto: Para a Amostra 2 obtemos p-Lilliefors <0. indicando ajuste dos dados a e distribui¸˜o Normal. ”Adequado” o .20 e p-W = 0. e Um pesquisador deseja criar um padr˜o para identificar presen¸a de infec¸˜o bacteriana (Pseudomonas a c ca sp) no trato respirat´rio atrav´s de cultura de escarro. Para isto.0). a Observe atrav´s da Figura 4. 41] colˆnias.01 e p-W < 0. 43 1-alfa alfa/2  ¡ ¡ ¡ ¡ ¡ ¡¡¡¡¡                  ¡¡¡¡¡   ¡¡¡¡¡         ¡ ¡ ¡ ¡ ¡  ¡¡¡¡¡    ¡ ¡ ¡ ¡ ¡        ¡ ¡ ¡ ¡ ¡  ¡¡¡¡¡         ¡¡¡¡¡   ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡        ¡¡¡¡¡   ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡        ¡ ¡ ¡ ¡ ¡ alfa/2  ¡ ¡ ¡ ¡ ¡ ¡ ¡¡¡¡¡¡                     ¡¡¡¡¡¡    ¡¡¡¡¡¡        ¡¡¡¡¡¡    ¡ ¡ ¡ ¡ ¡ ¡        ¡¡¡¡¡¡         ¡¡¡¡¡¡    ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡         ¡ ¡ ¡ ¡ ¡ ¡    ¡¡¡¡¡¡  ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡   ¡ ¡ ¡ ¡ ¡ ¡        ¡¡¡¡¡¡        -Z alfa/2 +Z alfa/2 Figura 4.6 Faixas de Referˆncia e ROSSI. 40] colˆnias. Robson M. coletaram-se dados de pessoas sabidamente o e sadias e determinou-se o n´mero de colˆnias encontradas em cada cultura.4.000013. 96. em duas etapas amostrais distintas. foram realizados os testes de normalidade e indicaram ajuste dos dados j´ que pa Lilliefors >. Amostra 1: 20 26 30 32 35 21 26 30 32 35 23 27 30 32 36 24 28 30 33 36 25 29 30 33 37 25 29 31 33 37 25 29 31 34 38 25 29 31 34 38 25 29 32 34 41 25 30 32 35 42 Amostra 2: 17 24 25 35 51 22 24 26 35 54 23 23 28 35 56 23 25 28 36 56 23 25 29 40 56 23 25 30 41 58 24 25 30 41 60 24 25 31 41 68 24 25 31 42 79 Observe atrav´s da Figura 4. Foram encontrados os seguintes u o resultados.3 o ajuste dos dados (pontos) linearizados. 9] [21. indicando que os dados n˜o seguem uma distribui¸˜o e a ca Normal. ”Adequado” o Observe que devido a normalidade temos praticamente a mesma faixa.2: Faixa de Referˆncia e Exemplo 4. utilizando o m´todo dos pere centis: [21. 7 ± 1.4.s] : x [30.8892.4. Neste caso duas metodologias distintas dever˜o ser utilizadas para construir faixas de referˆncia: a e • Met´do de Gauss para a Amostra 1: o [¯ ± 1.4 uma assimetria do Histograma comparado ` Normal assim como a n˜o e a a aderˆncia ou desajuste dos dados (pontos) sob a reta. 96.

Para amostras aleat´rias simples (X1 .03 amostra2 20 40 60 80 0. obter uma faixa de inclua. ”Inadequado” o Um teste estat´ ıstico a ser usado depende do tipo de vari´vel e do tipo de planejamento. n .0 0.4.7 Teorema do Limite Central ROSSI.04 0.4: Histograma e Q-Q Plot da Amostra 2 • e Met´do dos Percentis para a Amostra 2. se opt´ssemos pelo m´todo de gauss ter´ a e ıamos: [7.3: Histograma e Q-Q Plot da Amostra 1 0.. Robson M. retiradas de uma popula¸˜o com m´dia o ca e µ e variˆncia σ 2 . 95% dos o e elementos. a distribui¸˜o amostral da m´dia aproxima-se de uma distribui¸˜o normal com m´dia µ e a ca e ca e σ2 variˆncia a .01 0. 63] colˆnias.5% valores menores e os 2. A seguir ser˜o a a apresentados os testes mais comuns para quatro situa¸˜es: vari´vel dicotˆmica (amostras independentes e co a o pareadas) e vari´vel cont´ a ınua (amostras independentes e pareadas).. quando n→ ∞. 4. por exemplo.06 amostra 0. isto ´. isto ´ e n σ2 ¯ . 44 0. 68] colˆnias. excluindo os 2.00 20 30 40 50 60 70 -2 -1 0 1 2 Figura 4.08 Freqüências 0.7 Teorema do Limite Central Teorema. ”Adequado” o Observe que agora..10 0.5 % maiores valores [22.04 Freqüências 0.02 0. X ∼ N µ.05 Q-=Q Plot 0. Xn ).02 20 25 30 35 40 Q-QPlot 20 25 30 35 40 -2 -1 0 +1 +2 Figura 4.X2 .

o desvio-padr˜o populacional. e ca E0 : erro amostral toler´vel. se o indiv´ ıduo possui a caracter´ ıstica. a e 4. e a popula¸ao pode ser considerada como a vari´vel aleat´ria X. pois por maior que seja a amostra. podemos obter um IC com uma confian¸a ca e c de (1 − α)%. p. Pode-se. Ser´ abordado c´lculo do tamanho da amostra para o a a amostragem aleat´ria simples. para a propor¸˜o populacional. o tamanho da amostra necess´rio para se fazer inferˆncias. se a distribui¸˜o da popula¸˜o ca e o e e a a ca ca tem outra distribui¸˜o. ca a No caso de amostras pequenas. Assim. usa-se uma aproxima¸˜o atrav´s da distribui¸˜o t − student : ca e ca s ¯ IC(µ) : X ± t(n−1. α ) . Robson M. 45 Utilizando-se deste teorema.8. O calcular do tamanho m´ ınimo de uma amostra aleat´ria simples ´ dado por: o e Sejam: N: tamanho (n´mero de elementos) da popula¸˜o. 2 n onde s ´ o desvio-padr˜o amostral. a . sua convergˆncia ´ r´pida. utilizado quando n˜o se conhece σ. existe sempre o risco do sorteio gerar uma amostra com caracter´ ısticas bem diferentes da popula¸ao de onde ela foi extra´ c˜ ıda. se o indiv´ ıduo n˜o possui a caracter´ a ıstica p. Para determinar o tamanho da amostra o pesquisador deve especificar o erro amostral toler´vel. n 4. Como regra pr´tica. para n suficientemente grande. o A diferen¸a entre a estat´ c ıstica descritiva dos elementos da amostra e o verdadeiro valor do parˆmetro a que se deseja estimar como o erro amostral. 2 n Se a popula¸˜o original ´ pr´xima da normal. Analogamente ao processo de obten¸˜o do IC para a m´dia. fixo: ıvel a σ ¯ IC(µ) : X ± Z α . ˆ 2 p. considerando um n´ de significˆncia. 0. essa convergˆncia ´ mais demorada. pode-se considerar a distribui¸˜o amostral de p do seguinte modo: ca ˆ p∼N ˆ p. para um c n´ de significˆncia.8 Tamanho da Amostra ROSSI. entretanto. √ .4. calcular. j´.(1 − p) n onde a propor¸˜o de indiv´ ca ıduos portadores da caracter´ ıstica na amostra ´ dada por: e p= ˆ Y n sendo que Y ´ o total de indiv´ e ıduos portadores da caracter´ ıstica na amostra. fixo: ca ıvel a IC(p) : p ± Z α . assim. tal que: c˜ a o X: 1. u n0 : uma primeira aproxima¸˜o do tamanho da amostra. e a a a Seja uma popula¸˜o em que a propor¸˜o de elementos portadores de uma certa caracter´ ca ca ıstica ´ p.1 M´todo simples e Tamanho de uma amostra aleat´ria simples. A especifica¸˜o do erro amostral toler´vel deve ser feita sob um enfoque probabil´ ca a ıstico. u ca n: tamanho (n´mero de elementos) da amostra.8 Tamanho da Amostra O assunto pertence ` Teoria da Amostragem. √ . podemos construir um Intervalo de Confian¸a de (1 − α)% para µ. ou seja. para algumas situa¸˜es a co especiais. aceita-se que para amostras ca e e a com mais de 30 elementos a aproxima¸˜o j´ pode ser considerada muito boa.(1 − p) ˆ ˆ . quanto ele admite errar na avalia¸˜o dos parˆmetros de a ca a interesse. α. α.

Observe que: Para manter o mesmo erro amostral. ´: e n= 200. por isso. que os erros amostrais n˜o ultrapassem 4% (E0 = 0.8. 46 1 . ou uma propor¸˜o. pode-se usar os intervalos de confian¸a anteriormente e e ca c estabelecidos para obter n. e no Exemplo 4. portanto.04)? a Solu¸˜o: O valor de n0 continua sendo o mesmo do exemplo anterior. c .2 M´todo inferencial e Tamanho da amostra sem conhecimento de N : Tamanho da Popula¸˜o. errˆnea a id´ia de que para uma amostra ser representativa ca o e deva abranger uma percentagem fixa da popula¸˜o. N + n0 Exemplo 4. Para isto. com alta confian¸a.625 200. Qual deve ser o tamanho m´ ca ınimo da amostra aleat´ria simples. o tamanho da amostra. E. o tal que se possa admitir. Suponha agora que a popula¸˜o fosse de N = 200. tal que se possa admitir. a O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos subgrupos da popula¸˜o. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas caracter´ ısticas da popula¸˜o de pacientes.000 + 625 623 pacientes.8 Tamanho da Amostra onde n0 = ROSSI. tem-se: ca n= 200. Qual ca deve ser o tamanho m´ ınimo da amostra aleat´ria simples.3% da popula¸˜o. que o c os erros amostrais n˜o ultrapassem 4% (E0 = 0. ´ comum o pesquisador n˜o ser muito exigente na precis˜o das estimativas ca e a a nos subgrupos. Robson M. ´ preciso calcular o tamanho da amostra para cada uma destas partes. tolerando erros amostrais maiores. Nesta ca situa¸˜o.6. em fun¸˜o do tamanho N da popula¸˜o. Com objetivo de conhecer algumas caracter´ ısticas dos pacientes de uma cl´ ınica com 35 pacientes. Exemplo 4. com alta confian¸a. pois n˜o depende de N. ca Se o objetivo ´ estimar a m´dia. Fazendo a ca a corre¸˜o em termos do novo valor de N.7 abrange ca ´ 0. E a corre¸˜o ca ca em termos do novo valor de N.625 200 + 625 152. 4. ca Tamanho da amostra em subgrupos da popula¸˜o ca ´ E muito comum termos interesse em estudar separadamente certos subgrupos da popula¸˜o. O tamanho total da ca e amostra vai corresponder ` soma dos tamanhos das amostras de cada parte. ´ preciso fixar o maior erro aceit´vel e o n´ e a ıvel de confian¸a com que se quer trabalhar. 0.625 35 + 625 34. enquanto no Exemplo 4. tem-se: ca ca n= 35.7.04)? c a Solu¸˜o: Uma primeira aproxima¸˜o ´ dada por: ca ca e n0 = 1 = 625 pacientes.5. ca Solu¸˜o: Da mesma forma. E0 Conhecendo N o tamanho da popula¸˜o. pode-se corrigir o c´lculo: ca a n= N.6 a amostra abrange 76%.000. Exemplo 4.n0 . o valor de n0 continua sendo o mesmo dos exemplos anteriores. 042 Corrigindo.000 pacientes. no Exemplo ?? foi necess´ria uma amostra abrangendo a quase 100% da popula¸˜o. Suponha que na clinica do Exemplo anterior a popula¸˜o fosse de N = 200 pacientes.4.

tamanho amostral poder´ ser obtido atrav´s de: a e n0 n= n0 . 47 Sendo o tamanho m´ximo do erro aceit´vel : e (fixo). Z α ˆ q 2 2 + (N − 1).(1 − p0 ) p ˆ e n= onde ou so e = Zα √ 2 n Zα .8 Tamanho da Amostra ROSSI. temos as f´rmulas ca e e ca o para o c´lculo do tamanho amostral. Z α p q 2 p0 . temos tanto para o caso em que estudamos vari´veis quantitativas discretas. 1+ N Exemplo 4.02 ? a Sol.090 2 . tem-se: ca Z α . o ıvel c tamanho da amostra nescess´ria para uma popula¸˜o de tamanho N = 100. e conhecendo N . (N − 1). para a m´dia e para a propor¸˜o: a e ca n= n= N. 96.so 2 2 e Zα . 32) Tamanho da amostra com o conhecimento de N : Tamanho da Popula¸˜o. Determine n.0.ˆ0 . respectivamente. apresentou um valor igual a 22%. 05 139. 2 e 1. Para estimar o tamanho da amostra para novo projeto sobre hansen´ ıase. o intervalo de a a confian¸a de n´ c ıvel 100(1 − α)% ser˜o. em uma amostra de 500 fam´ cidade. qual o tamanho da amostra necess´rio para que tenhamos 95% de confian¸a em que o erro da a c estimativa n˜o seja superior a 0. ca Para o caso em que a popula¸˜o ´ finita e pequena.ˆ0 . onde a amostragem ´ sem reposi¸˜o. quanto a a cont´ ınuas.10. 2 2 n≤ 2e onde p0 e so s˜o estimativas da propor¸˜o e da dispers˜o. com probabilidade (1 − α) (fixo).so 2 e 2 1. Exemplo 4. utilizamos as f´rmula descritas anteriormente.e2 Zα 2 2 + 4(N − 1).4. realizado para investigar a prevalˆncia de hansen´ e ıase em trabalhadores rurais. 68.so 2 2 2 2. e tomamos n = n0 .ˆ0 . 2 ılias que possuem aparelho de televis˜o em certa a Exemplo 4. 02 2. obtidos atrav´s de uma amostra ˆ a ca a e piloto. Numa amostra de classifica¸˜o de veteranos de um col´gio com. Determinado trabalho.: Trate as 500 fam´ ılias como uma mostra preliminar que fornece a estimativa p0 = 0.so 2 ou n≤ e N.9.e2 Alternativamente. haja 340 com televisor em cores.: n = = Z α . 68. 3 0. Robson M. para a m´dia e para a propor¸˜o.000. considerando a a e ca popula¸˜o infinita.ˆ0 . Suponha que. a ca .8. Se o objetivo ´ estimar o n´mero de fam´ e u ılias que possuem televisor em cores.(1 − p0 ) p ˆ 2 . respectivamente. x = 2. Z α 2 2 N.(0. qual ca e ¯ deve ser o tamanho da amostra para que tenhamos 95% de confian¸a em que erro da estimativa de µ n˜o c a supere 0. 2 2 n= . Ent˜o: ˆ a n = = = Zα .05? Sol.0. respectivamente. 96 0. Z α . desejamos um n´ de confian¸a de 95% e erro de amostragem de 5%.ˆ0 .e2 + Z α . o c´culo de o n. 6 e so = 0. 3.

em geral. Tais hip´teses. 4. consistem de afirma¸˜es sobre os parˆmetros populacionais co a ou sobre as distribui¸˜es de probabilidade das popula¸˜es. a o O objetivo ´ fornecer ferramentas que nos permitam validar ou refutar uma hip´tese. ca H0 : Ha : θ = θ0 θ = θ0 . 78) logo. Veja o a a item (3. a distribui¸˜o dos pesos dos pacientes adultos do hospital X ´ normal. ca e Os processos que nos permitem decidir por rejeitar ou n˜o rejeitar uma hip´tese. ou determinar se a o amostras observadas diferem significativamente dos resultados esperados s˜o chamados Testes de Hip´teses.0.9 Testes de Hip´teses o Freq¨entemente ´ necess´rio tomar decis˜es sobre parˆmetros ou distribui¸˜es populacionais com base u e a o a co em informa¸˜es amostrais. para a constru¸˜o de um teste. Na tomada de decis˜es. e As hip´teses estat´ o ısticas para um parˆmetro q.65m.(0. deve-se formular duas hip´teses a cerca da afirma¸˜o: ca o ca (a) Hip´tese Nula (H0 ): ´ uma afirma¸˜o que diz que o parˆmetro populacional ´ tal como especificado.ˆ0 .: n0 n0 n0 = = Zα . o tamanho da amostra corresponder´ a: a n n n n0 n0 1+ N 264 = 264 1+ 100. as quais s˜o denominadas decis˜es estat´ co a o ısticas.(1 − p0 ) p ˆ 2 . s˜o o a formuladas hip´teses que ser˜o rejeitadas ou n˜o rejeitadas. 40). que podem ser verdadeiras ou o a a o n˜o. o e ca a e (b) Hip´tese alternativa (Ha ): ´ uma afirma¸˜o que oferece uma alega¸˜o alternativa (isto ´. 96 0. como por exemplo: co co 1. 3.9 Testes de Hip´teses o Sol. 48 .000 = 263. = 4. atrav´s de resultados e o e da amostra. Teste Unilateral ` Direita: ca a quando utilizamos a “cauda” direita da distribui¸˜o. (b) Param´tricos: quando formulamos hip´teses com respeito ao valor de um parˆmetro populacional. a e o a ca ca Estes testes n˜o dependem dos parˆmetros populacionais. Robson M.) acima. 2 e 1. chamam-se hip´teses estat´ a o ısticas e. Os Testes de Hip´teses podem ser de dois tipos: o (a) N˜o Param´tricos: quando formulamos hip´teses com respeito ` natureza da distribui¸˜o da popula¸˜o.1 Constru¸˜o de um Teste de Hip´tese ca o Inicialmente. 22. e e ca c e 2. a propor¸˜o de brasileiros com a doen¸a X ´ 40% (p = 0. 05 264 2 ROSSI.4. e o a Veja itens (1. Teste Bilateral: quando utilizamos ambas as “caudas” da distribui¸˜o. podem ser formuladas como segue: a 1. nem de suas respectivas estimativas. o parˆmetro o e ca ca e a ´ diferente do valor alegado).9.) acima.) e (2. a m´dia populacional da altura dos brasileiros ´ 1.

o A seq¨ˆncia abaixo pode ser usada sistematicamente para qualquer teste de hip´tese: ue o 1. se a hip´tese pode ou n˜o rejeitada com o n´ de significˆncia pr´-fixado. A hip´tese nula ser´ a o a rejeitada para aqueles n´ ıveis de significˆncia cujos valores sejam maiores que a probabilidade calculada. o 2. Esta conclus˜o ´ tomada com o a ıvel a e a e base na Regi˜o Cr´ a ıtica (RC: cuja ´rea corresponde a α) que ´ constru´ de modo que: a e ıda P (ˆ ∈ RC|H0´´ verdadeira) = α.4. θ ee RA ´ denominada Regi˜o de n˜o rejei¸˜o cuja ´rea corresponde a 1 − α. e a a ca a O procedimento que ser´ utilizado para a constru¸˜o de um teste de hip´tese ´ o que consiste em a ca o e apresentar o n´ descritivo ou p-valor (p-value). com o valor de a. Passo 1: Definir as hip´teses H0 e Ha . o que se deseja verificar ´. a 3. Teste Unilateral ` Esquerda: quando utilizamos a “cauda” esquerda da distribui¸˜o. α. Passo 4: Com o valor da estat´ de significˆncia p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido. ıvel 1-alfa alfa/2  ¡ ¡¡ ¡¡ ¡¡¡¡¡                    ¡¡¡¡¡   ¡¡¡¡¡               ¡ ¡¡ ¡¡  ¡¡¡¡¡        ¡ ¡¡ ¡¡              ¡ ¡¡ ¡¡  ¡¡¡¡¡            ¡¡¡¡¡       ¡ ¡¡ ¡¡   ¡¡ ¡¡  ¡            ¡¡¡¡¡       ¡ ¡¡ ¡¡   ¡ ¡¡ ¡¡               ¡ ¡¡ ¡¡ alfa/2 ¡¡¡¡¡¡      ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡               ¡ ¡ ¡ ¡ ¡ ¡ ¡¡¡¡¡¡                ¡ ¡ ¡ ¡ ¡ ¡ ¡¡¡¡¡¡              ¡¡¡¡¡¡      ¡ ¡ ¡ ¡ ¡ ¡  ¡  ¡  ¡  ¡  ¡  ¡ ¡¡¡¡¡¡                 ¡¡¡¡¡¡  ¡ ¡ ¡ ¡ ¡ ¡     ¡ ¡ ¡ ¡ ¡ ¡  ¡ ¡ ¡ ¡ ¡ ¡             ¡¡¡¡¡¡              -Zalfa/2 +Z alfa/2 Figura 4. 49 2. a . p-valor. Passo 5: Conclus˜o. Compare a probabilidade obtida. Teste Unilateral ` Direita: quando utilizamos a “cauda” direita da distribui¸˜o. Passo 3: Escolher o n´ de significˆncia a e utilizando as informa¸˜es fornecidas pela amostra para ıvel a co encontrar o valor do estimador do parˆmetro (estat´ a ıstica) que est´ sendo testado. a ca H0 : Ha : θ = θ0 θ < θ0 Ao se testar uma hip´tese.9 Testes de Hip´teses o ROSSI. atrav´s de uma estat´ o e e ıstica obtida de uma amostra. a 5. Robson M. a ıstica observada na amostra encontrar a probabilidade (probabilidade 4.5: Teste de Hip´tese Bilateral. a ca H0 : Ha : θ = θ0 θ > θ0 3. Passo 2: Use a teoria estat´ ıstica e as informa¸˜es para decidir qual a distribui¸˜o da estat´ co ca ıstica (estimador) que ser´ utilizada no julgamento de H0 .

Robson M.9 Testes de Hip´teses o ROSSI. na dire¸˜o da regi˜o cr´ ca a ıtica. quando a hip´tese nula H0 ´ verdadeira. Isto ´. ´ informado se o valor observado para a estat´ e e ıstica de teste que levou ` a rejei¸˜o de H0 est´ pr´xima da fronteira da RC regi˜o cr´ ca a o a ıtica (baixa evidˆncia contra H0 ) ou se est´ muito e a afastada da fronteira (alta evidˆncia contra H0 ). 50 4.2 O p-valor O procedimento de teste de hip´tese descrito acima fornece informa¸˜o sobre a for¸a da evidˆncia contra o ca c e H0 obtida a partir dos dados. menor ser´ o p-valor.4. Quanto maior o e for a for¸a da evidˆncia contra H0 . c e a . e O p-valor ´ a probabilidade de ocorrˆncia do valor particular observado para a estat´ e e ıstica de teste ou de valores mais extremos.9.

c Neste caso a educadora pode delinear sua pesquisa de duas formas: 51 . atrav´s de exemplos. m´dio. Suponha que ela categoriza a o desempenho dos alunos em trˆs grupos: baixo. por´m este teste ´ menos poderoso que o teste ca a e e param´trico. e Vejamos quando estamos tratando de um teste de independˆncia e quando estamos tratando com um teste e de homogeneidade.1 Tabelas de Contingˆncia e Segundo o dicion´rio Webster o termo “contingency” significa the quality or state of having a close a connection or relationship. que ´ muito util. Mas ´ talvez de muito maior interesse podermos afirmar que determinada associa¸˜o observada em uma e ca amostra de escores indica. e 5. O teste chi-quadrado (χ2 ) pode ser usado para avaliar a rela¸˜o entre duas vari´veis qualitativas. categoriza a participa¸˜o e e ca ca ca dos pais em dois grupos: participa¸˜o ativa. pois n˜o precisa da suposi¸˜o de normalidade das vari´veis e a e e ´ a ca a para analisar o grau de associa¸˜o entre as duas vari´veis. do mesmo modo. 1956). incerteza se uma coisa vai acontecer ou n˜o e “contingente” significa que pode ou n˜o suceder. onde as observa¸˜es o ca a o co podem ser classificadas em uma das v´rias categorias (n´ a ıveis ou c´lulas) mutuamente exclusivas. 5. Segundo o Aur´lio. “contingˆncia” significa qualidade do que ´ e a e e e contingente. incerto. Logo. alto e.Cap´ ıtulo 5 An´lise em Tabelas 2x2 e LxC a Neste t´pico estudaremos a rela¸˜o entre duas vari´veis categ´ricas (ou qualitativas). participa¸˜o fraca. e O problema de mensura¸˜o do grau de associa¸ao entre dois conjuntos de escores ´ de car´ter bem ca c˜ e a diferente do teste da simples existˆncia de uma associa¸ao em determinada popula¸˜o. ou n˜o. h´ e c˜ ca a interesse em avaliar o grau de associa¸˜o entre dois conjuntos de escores referentes a um grupo de indiv´ ca ıduos. Naturalmente. e Dentro deste teste devemos distinguir dois tipos de testes: o de independˆncia e o de homogeneidade. a a eventual. O termo “contingency table” se refere ao fato de que as tabelas constru´ ıdas s˜o a usadas para testar a existˆncia de rela¸˜es entre duas vari´veis. Observamos que infelizmente este termo e co a em portuguˆs n˜o tem o mesmo significado.2 Teste de Independˆncia e de Homogeneidade e Suponha que uma educadora quer analisar se existe rela¸˜o entre a participa¸˜o ativa dos pais dos ca ca alunos nos deveres extra-escolares e o desempenho dos alunos em Matem´tica. quando nos referimos a palavra “contingˆncia” estamos tomando o e mesmo significado da l´ ıngua inglesa. Este ca a teste ´ um teste n˜o-param´trico. em estat´ ıstica. Suponha que ela deseja trabalhar com 300 crian¸as. probabilidade de associa¸˜o entre as vari´veis na popula¸˜o da qual se a ca a ca extraiu a amostra (Siegel.

Robson M. a u ca que. neste caso estamos frente a um teste de independˆncia a o e de vari´veis.3. e Desempenho do aluno em Matem´tica a Total Baixo M´dio e Alto Teste de Aleat´rio =⇒ Independˆncia o e Aleat´rio o Aleat´rio Aleat´rio o o Aleat´rio o 300 Participa¸˜o ca dos pais Ativa Fraca Total Por´m ela pode fixar o n´mero de alunos de acordo com seu desempenho. logo os totais das o colunas ser˜o fixos. das colunas e das linhas. Pegar uma amostra aleat´ria de tamanho 100 de cada grupo de alunos. do que fixar pela participa¸˜o dos pais.1: Exemplo de tabela de contingˆncia. Teste de Independˆncia e Apresentaremos a l´gica do teste com um exemplo bastante simples. Tabela 5. O que se deseja saber ´ se a escolha do comercial est´ relacionado ao gˆnero da crian¸a: pois e a e c suspeita-se de que o gˆnero pode estar influenciando na escolha do comercial. logo o unico valor fixo ser´ o total geral que ser´ de 300. Mas os totais de colunas e de linhas ´ a a ser˜o frutos da pesquisa. sobre cereais c e para caf´ da manh˜. aleat´rios. s˜o chamados de “totais marginais”.5. 52 Caso 1. linha ou coluna ´ fixado pelo pesquisador ent˜o ´ chamado de teste de e a e homogeneidade. o teste de associa¸˜o ´ chamado de independˆncia. No exemplo da educadora. a Logo a tabela de contingˆncia ser´: e a Tabela 5.3.1. Ap´s a exposi¸˜o foi solicitado a cada crian¸a para indicar qual dos comerciais ela e a o ca c gostou mais. u c e Tipo de comercial Gˆnero e A B C Total Meninos 30 29 16 75 Meninas 12 33 5 50 Total 42 62 21 125 Analisando atentamente a Tabela 5.2 Teste de Independˆncia e de Homogeneidade e ROSSI.3: N´mero de crian¸as segundo tipo de comercial escolhido e gˆnero. percebemos: . apriori ser´ quase imposs´ a ıvel. e u Caso 2. observemos que para ela ´ e muito mais f´cil fixar o n´mero de alunos segundo seu desempenho. e quando ca e e um dos conjuntos. Os dados podem ser apreciados e na Tabela 5. o Exemplo 5. e Desempenho do aluno em Matem´tica a Total Baixo M´dio e Alto Teste de Aleat´rio =⇒ Homogeneidade o Aleat´rio o 100 (fixo) 100 (fixo) 100 (fixo) 300 Participa¸˜o ca dos pais Ativa Fraca Total Os valores totais. mas os totais das linhas ser˜o aleat´rios e assim estaremos frente a um teste de a a o homogeneidade: Logo a tabela de contingˆncia ser´: e a Tabela 5. Selecionar uma amostra de crian¸as aleatoriamente e examinar em que c´lula cada uma est´ c e a alocada. Quando os totais a marginais variam livremente. Isso vai depender do pesquisador. Suponha que 125 crian¸as foram expostas a trˆs tipos de comerciais de TV.2: Exemplo de tabela de contingˆncia. composta por valores absolutos. portanto.

sobre a suposi¸˜o de independˆncia: ca e . e Y: gˆnero (meninos. B e C) → qualitativa. sob a hip´tese de nulidade.5 observamos que as meninas tem uma forte preferˆncia pelo comercial B. como deveriam ser os valores a serem o e a observados? A l´gica nos diz que esses valores devem estar muito pr´ximos da estrutura percentual global. a Cada valor esperado ser´ calculado supondo que a estrutura percentual global se mantenha em cada a coluna: Calculando os valores esperados.5: Porcentagem de crian¸as por gˆnero e tipo de comercial escolhido. o e e c Hip´tese alternativa (Ha ): A preferˆncia pelo comercial depende do gˆnero da crian¸a (ou. Essa inspe¸˜o intuitiva. ou seja e retirar a influˆncia da amostragem. Tipo de comercial Gˆnero e A B C Total Meninos 71% 47% 76% 60% Meninas 29% 53% 24% 40% Total 100% 100% 100% Observe cuidadosamente a Tabela 5. mostradas na Tabela 4. e Tabela 5.5. e u e • no comercial B essa rela¸˜o se inverte. agora precisamos e e e saber at´ que ponto essas diferen¸as se devem ao acaso. tamb´m. o o Esses valores s˜o chamados de valores esperados. Portanto. Se a preferˆncia das e e crian¸as pelos comerciais independe do gˆnero. intuitivamente percebemos que existe interferˆncia do gˆnero na preferˆncia. esperar´ c e ıamos que a estrutura percentual para cada comercial ficasse em torno de 60% para os meninos e 40% para as meninas. 53 Contudo.4. Robson M. a primeira coisa a fazer ´ analisar as estruturas percentuais. onde 60% da amostra ´ composta por meninos. Assim.5. o gˆnero o e e c e interfere na preferˆncia pelo comercial). essa an´lise fica prejudicada pela composi¸˜o da amostra. e ca a ca e pode ser feita analisando a estrutura dentro de cada gˆnero como mostra a Tabela 5. ca ROSSI. temos: Ho H1 : independˆncia de vari´veis e a : dependˆncia de vari´veis e a Como deveriam ser os valores a serem observados se as vari´veis fossem independentes?. c e Tipo de comercial Gˆnero e A B C Total Meninos 40% 39% 21% 100% Meninas 24% 66% 10% 100% Total 33% 50% 17% Analisando a Tabela 5. que tem mais meninos do que menia ca nas.3. e Analogamente. enquanto e que os meninos se dividem entre o comercial A e B. ou dito de outra a forma.2 Teste de Independˆncia e de Homogeneidade e • a amostra est´ composta por mais meninos do que meninas. meninas) → qualitativa. desvios grandes destes percentuais estariam mostrando evidˆncias de que existe alguma rela¸˜o entre essas vari´veis.4: Porcentagem para os valores absolutos de crian¸as por tipo de comercial escolhido e gˆnero c e apresentados na tabela anterior. e Hip´tese nula (H0 ): A preferˆncia pelo comercial independe do gˆnero da crian¸a. ou a existˆncia de associa¸˜o entre as duas vari´veis: e c e ca a X: preferˆncia pelo comercial ( A. de independˆncia de vari´veis. e Tabela 5. a • nos comerciais A e C o n´mero de meninos ´ maior do que meninas.

comercial A: 60% de 42 = 25.2 di = +4. no canto superior esquerdo colocamos o valor observado. no canto superior direito e o valor esperado (sob a hip´tese de independˆncia) e.1)×(no linhas ..2 29 37.2 42 62 Gˆnero e Meninos Meninas Total C 16 12.8 -8.2 Teste de Independˆncia e de Homogeneidade e ROSSI..2 12 16.(1−α)%] (Tabelas L × C) .1) Para testar as hip´teses.2 . se as vari´veis fossem independentes.. Logo.5.2 Valor esperado comercial A.8 33 24.6 +3. Tanto faz fixar a linha ou a coluna pois: Ei = Tl × Tc Tc Tl = Tl × = Tc × T T T Por exemplo.4 21 Total 75 50 125 Dentro de cada c´lula.7% de 75 = 25. 54 Valores percentuais Tipo de comercial Gˆnero e A B C Meninos 60% 60% 60% Meninas 40% 40% 40% Total 42 62 21 Valores absolutos Valores esperados Total Gˆnero e A B C e 60% Meninos 25 37 13 40% Meninas 17 25 8 125 Total 42 62 21 Tabela 5. na parte inferior. caso contr´rio haver´ ind´ a a ıcios de dependˆncia.8 +8. comercial B: 60% de 62 = 37. temos a estat´ o ıstica teste qui-quadrado com corre¸˜o de continuidade de Yates: ca χ2 cY = k i=1 |Oi − Ei | − Ei 1 2 2 ∼ χ2 [L−1×C−1. menino: 33. A pergunta agora ´: quando a e e distˆncia ´ pequena ou grande? Para isto devemos calcular o valor (χ2 ) qui-quadrado da amostra: a e χ2 amostra = k (O − E )2 (observado − esperado)2 i i = esperado Ei i=1 i=1 k que ter´ uma distribui¸˜o chi-quadrado com graus de liberdade igual ao produto do n´mero de linhas menos a ca u um vezes o n´mero de colunas menos um. O mesmo teria acontecido se fixarmos primeiro o comercial: Valor esperado comercial A.7: Tipo de comercial A B Oi = 30 Ei = 25. a distˆncia entre o observado e o o e a esperado. menina: 33.4 5 8. calculemos o valor esperado da primeira linha e primeira coluna: Ei = 75 × 42 42 75 = 75 × = 42 × = 25.8 . Robson M.6: Total 75 50 125 Valor esperado menino. 2 125 125 125 Assim calculando os valores esperados para todas as c´lulas temos: e Tabela 5.7% de 50 = 16.4 -3.2 Valor esperado menino.. as distˆncias entre os valores observados e esperados a a deveriam ser muito pequenas. isto ´: u e 2 χ2 amostra ∼ χν ⇒ ν : graus de liberdade ν : (no colunas .8 -4.

01058. as freq¨ˆncias observadas tendem a ficar perto das a a ue esperadas. mas e a o os totais para cada coluna e linha s˜o aleat´rios. como o valor da amostra ´ maior que o valor e e cr´ ıtico. os pesquisadores selecionaram aleatoriamente 125 crian¸as. com dois graus de liberdade. temos: ca χ2 amostra = = = ROSSI.2 Teste de Independˆncia e de Homogeneidade e No nosso exemplo sem a corre¸˜o de Yates. Ele n˜o fixou o numero de meninos e o n´mero de meninas. a u Vejamos um exemplo de teste de homogeneidade. 808 + 0. a o Exemplo 5. Infelizmente. 2 12. 2 37. ıvel a ıvel Obs. o teste qui-quadrado n˜o permite concluir como se d´ a rela¸˜o. 8)2 (+8. calcula o p-valor. 4)2 + + + + + 25. e a 2. 991.8: N´mero de alunos segundo seu desempenho em Matem´tica e participa¸˜o dos pais nas atividades u a ca extra-escolares. 371 + 2. c das quais 75 eram meninos e 50 meninas. por exemplo. No caso do exemplo anterior. 6 16. 8 24. Robson M. 917 + 1. 914 + 1. logo rejeitamos a hip´tese nula. 376 9. concluindo que o gˆnero interfere na preferˆncia pelos comerciais. via de regra. No nosso caso o p − valor = 0.5. Examinando a distˆncia entre o a a a valor observado e esperado. 2)2 (−3. Neste caso. Retomemos o exemplo inicial e suponhamos que a professora fixou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes: Tabela 5. a rejeitamos ao n´ de 5% mas n˜o ao n´ de 1%. ou seja. observamos que as meninas tem uma maior preferˆncia pelo e comercial B. o valor de χ2 deve ser pequeno. uma vˆz que ele testa a a ca e apenas a hip´tese geral de que as duas vari´veis s˜o independentes. 4)2 (−4. O teste ´ idˆntico ao teste de independˆncia. contra a hip´tese alternativa que indica que existe pelo menos uma propor¸˜o o ca diferente. o pesquisador s´ controla o tamanho total da amostra. por´m n˜o podemos concluir nada. este.2. e e e . Nesse caso usamos outra estrat´gia: o teste e exato de Fisher. Desempenho em Matem.0106) onde v = (2 − 1) × (3 − 1) = 1 × 2 = 2 Para aceitar ou rejeitar a hip´tese devemos conhecero valor de χ2 o calculado na tabela qui-quadrado. Para α = 5%. Participa¸˜o ca Baixo M´dio e Alto Total dos pais Ativa 5 25 70 100 Fraca 95 75 30 200 Total 100 100 100 300 H0 H1 : p11 = p12 = p13 → igualdade de propor¸˜es co : p1i = p1j . Uma outra limita¸˜o do teste qui-quadrado ´ que o valor esperado das c´lulas n˜o deve ser menor ou ca e e a igual a 5 e devido a isso torna vulner´vel a estat´ a ıstica. 4 0. o e e No caso de dispormos de um pacote estat´ ıstico. nesse caso ´ s´ e o comparar esse valor com o n´ ıvel de significˆncia desejado.: Quando as vari´veis s˜o independentes (H0 ). 8 8. 8)2 (−8. 2)2 (+3. 55 (+4. Limita¸˜es do teste χ2 : co 1. o valor cr´ ıtico ´ 5. 09818 (p-valor : 0. Teste de Homogeneidade Quando testamos independˆncia de vari´veis. para algum i = j → existe pelo menos uma propor¸˜o diferente ca A hip´tese nula esta testando que a propor¸˜o de alunos com baixo desempenho ´ igual a propor¸˜o de o ca e ca alunos m´dio e igual a propor¸˜o de alunos com desempenho alto quando seus pais participam ativamente e ca das atividades extra-escolares. 711 + 1.

Este resultado indica uma fraca associa¸˜o entre X: preferˆncia pelo comercial e Y: gˆnero. Os exemplares foram coletados em zonas considerada de alta. Os dados foram comparados entre si e com um ca ıvel de 1% de significˆncia se existem evidˆncias de associa¸˜o a e ca grupo-controle n˜o-urbano. a ca Exerc´ ıcio 5. a a a Para facilitar a interpreta¸˜o. 09818 = 0. ´ uma caracter´ e e ıstica rara na popula¸˜o. Crian¸as hospitalizadas e alimentadas por nutri¸˜o endovenosa `s vezes apresentam colestase. 1993).4. e O coeficiente de contingˆncia ´ uma medida do alcance da associa¸˜o ou rela¸˜o entre dois conjuntos de e e ca ca atributos.χ2 . 26047. Chamaremos de k o menor ca ca entre l (no de linhas da tabela) e c (no de colunas da tabela). a colestase. Ele ´ calculado em fun¸˜o do valor calculado na tabela de contingˆncia e independe de ordena¸˜o e ca e ca das categorias das vari´veis: a C= χ2 .2 Teste de Independˆncia e de Homogeneidade e ROSSI.χ2 (k − 1)(χ2 + n) 2. e χ2 + n Exemplo 5. isto ´. o H0 H1 : : C=0 C=0 Se o p-valor associado for menor que alfa rejeitamos H0 e conclu´ ımos de que existe associa¸˜o entre as ca vari´veis. O chamado coeficiente de contingˆncia modificado (C ∗ ) ´ dado por: e e C∗ = k.(9. a e k C∗ = = = = min{2. 3684 ou 36. isto ´: e k = min{l. Os valores de C ∗ em torno de 50% podem ser o ca interpretados como associa¸˜o moderada.2. 09818) (2 − 1)(9. 1993).5. somente quando houver completa independˆncia e a a e ser´ 1 quando houver associa¸˜o perfeita. o coeficiente de contingˆncia ser´: e a C= 9. Como o desfecho. enquanto a ca o ca que valores de C ∗ pr´ximos de 0 indicam associa¸˜o fraca. 84%. c}. 09818 + 125 Para testar a significˆncia deste coeficiente ter´ a ıamos que recorrer a tabela pr´pria. Valores de C ∗ pr´ximos de 1 descrevem associa¸˜o forte. usaremos uma modifica¸˜o deste coeficiente.um c ca a bloqueio do fluxo da bile que pode produzir c´lculos biliares e outros problemas. 56 O Coeficiente de Contingˆncia.1. o risco relativo ca foi estimado atrav´s do Odds Ratio (Fonte: Carvalho. No exemplo dos comerciais de TV. Suponha que foi realizado um a ca estudo do tipo caso-controle para avaliar o efeito (α = 5%) de uma infec¸˜o grave sobre o risco de colestase em crian¸as com nutri¸˜o parenteral. 9. A Tabela abaixo mostra o resultado de um estudo feito em 113 crian¸as c ca c hospitalizadas. caso contr´rio n˜o. A freq¨ˆncia da invers˜o F do cromossomo IIL foi estudada em popula¸˜es urbanas de ue a co Drosophila willistoni. C´lculo do coeficiente de contingˆncia para os dados do exemplo anterior. m´dia e baixa urbane iza¸˜o. onde n ´ o tamanho da amostra. Ser´ 0. (k − 1)(χ2 + n) O valor C ∗ sempre estar´ no intervalo de 0 a 1. Robson M. ca Exemplo 5. 3} = 2 k. na cidade de Porto Alegre ( Valente et al. ca e e Exerc´ ıcio 5. Verifique ao n´ a entre a invers˜o F e a Urbaniza¸˜o.3. e . 09818 + 125) 0.

3. 57 Tabela 5.10: Presen¸a de colestase em crian¸as com nutri¸˜o endovenosa.2 Teste de Independˆncia e de Homogeneidade e ROSSI. som e sem infec¸˜o grave. Tabela 5. Com o objetivo de avaliar fatores de risco para o cˆncer intra-epitelial da c´rvice uterina. Robson M.5. A c ca Tabela 2 apresenta dados relativos ` presen¸a do alelo DQB1*03. ca a ca Urbaniza¸˜o ca Invers˜o F a Alta Intermedi´ria Baixa Controles Total a Sim 63 421 641 223 1349 N˜o a 475 1201 1542 658 3875 Total 538 1622 2183 881 5224 % Invers˜o F 12% a 26% 29% 25% 26% Tabela 5.11: Associa¸˜o entre cˆncer intra-epitelialda c´rvice uterina e presen¸a do alelo DQB1*03. Em caso afirmativo determine o risco de desenvolver a neoplasia e seu c ıvel respectivo IC.9: Associa¸˜o entre Invers˜o F e Urbaniza¸˜o quando comparadas a um controle. c c ca ca Colestase Infec¸˜o grave Sim N˜o ca a Sim 19 61 N˜o a 1 32 Exerc´ ıcio 5. a e Soares (1998) estudou 43 casos com essa doen¸a e 63 mulheres controles da popula¸˜o de Porto Alegre. ca a e c Presen¸a do alelo c Cˆncer a DQB1*03 Outro Casos 33 10 Controles 24 39 . Teste a associa¸˜o entre a c ca a doen¸a e o fator ao n´ de 5%. do sistema HLA.

Na Tabela 4. est˜o os n´meros observados o a u de animais com diferentes tipos de enzim´ticos. ıvel Tabela 5. ca a o Margem do rio Enzima Esquerda Direita GLO 2 72 74 GLO 2-3 22 3 . c˜ Tipo do cromossomo Idade do touro Acrocˆntrico Submetacˆntrico e e 1 a 2 anos 21 17 3 anos ou + 30 7 Exerc´ ıcio 5.2 Teste de Independˆncia e de Homogeneidade e ROSSI. (1993) encontraram varia¸˜o nas freq¨ˆncias de dois tipos de enzimas glioxalase (GLO) ca ue em animais que vivem nas margens do rio Jamari.13: Associa¸ao entre tipo de cromossomo e idade do touro. em Rondˆnia. 58 Exerc´ ıcio 5. coletados nas margens esquerda e direita desse rio. ca ca c Tipo do cromossomo Contamina¸˜o racial aparente Acrocˆntrico Submetacˆntrico ca e e Sim 38 16 N˜o a 13 8 Tabela 5.4. Silva et al. Robson M.5. Verificar se a freq¨ˆncia dos dois tipos de cromossomos Y est´ relacionado com o grau de ue a mistura racial aparente e com a idade do touro ao n´ de 5%. e ca a ıvel Tabela 5. Em um estudo gen´tico realizado em macacos amazˆnicos da subesp´cie ”Saimiri sciureus e o e ustus”.14: Associa¸˜o entre tipos enzim´ticos e margem do rio Jamari-Rondˆnia.12: Associa¸˜o entre tipo de cromossomo e contamina¸˜o de ra¸a aparente. Verifique a se existem evidˆncias de associa¸˜o entre as vari´veis ao n´ de 1%.5.

Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares.5. nos anos de 1989 e 1990. e ca a ıvel G3: enfisema. e o e coletados em trˆs localidades do Rio Grande do Sul. e o e coletados em trˆs localidades do Rio Grande do Sul. c a o Existem evidˆncias de associa¸˜o entre as vari´veis ao n´ de 5%? e a 1%? G1: asmas. Teste a hip´tese de igualdade de propor¸˜es entre as localidades ao n´ de 5% e a 1%. c o c Grupo quanto a pneumopatia Eosin´filos no escarro G1 G2 G3 o G4 Sim 142 26 32 28 N˜o a 55 19 41 41 Exerc´ ıcio 5. ıvel Tabela 5.7. o co ıvel Tabela 5.8. Robson M. e Tipo sang¨´ uıneo Localidade A B AB O Cidade I 43 9 1 47 Cidade II 29 17 9 45 . Verifique se as localidades a seguir diferem quanto a freq¨ˆncia dos diferentes grupos ue sang¨´ uıneos do sistema ABO. classificando-os segundo a presen¸a ou n˜o de eosin´filos no escarro e o tipo de pneumopatia diagnosticada. G2: broncoespasmo.17: N´mero de indiv´ u ıduos da esp´cie Chauliognathus com diferentes padr˜es de manchas nos ´litros. G4: outras doen¸as.6. que s˜o amarelos. e Padr˜o do ´litros a e Localidade Claro Intermedi´rio Escuro a Porto Alegre 67 20 4 S˜o Leopoldo a 68 29 19 Caxias do Sul 26 3 6 Exerc´ ıcio 5.15: Presen¸a de eosin´filos no escarro e tipo de doen¸a pulmonar em 384 pacientes porto-alegrenses. ao n´ de 5%.2 Teste de Independˆncia e de Homogeneidade e ROSSI. O cole´ptero chauliognathus flavipes pode apresentar 10 diferentes padr˜es para as manchas o o pretas que ocorrem sobre os ´litros (asas). c Tabela 5.16: N´mero de indiv´ u ıduos da esp´cie Chauliognathus com diferentes padr˜es de manchas nos ´litros. Machado e Ara´jo (1994) coletaram insetos e a u dessa esp´cie em v´rias localidades do Rio Grande do Sul. 59 Exerc´ ıcio 5. como mostra a Tabela e a 6.

determine o OR e seu respectivo IC.5. Um estudo foi conduzido para investigar se existe uma associa¸˜o entre doen¸a card´ ca c ıaca e apn´ia (ronco).18: Associa¸˜o entre doen¸a card´ ca c ıaca e apn´ia. Reestruture os dados para uma tabela 2x2 considerando apenas sim ou n˜o para a apn´ia. o ıvel . a e em seguida teste a mesma hip´tese ao n´ de 5%. 60 Exerc´ ıcio 5. Teste esta hip´tese ao n´ de 5%. e o ıvel Tabela 5.2 Teste de Independˆncia e de Homogeneidade e ROSSI.10.9. Robson M. e Apn´ia e Doen¸a card´ c ıaca n˜o ocasionalmente quase toda noite todas as noites a Sim 24 35 21 30 N˜o a 1355 603 192 224 Exerc´ ıcio 5.

imagine que um pesquisador obteve. exceto a no que se refere ao tratamento recebido. como o desenvolvimento de uma doen¸a de certo a e e c atributo.1: Distribui¸˜o quanto ` ocorrˆncia de um evento. ca a e Grupo Ocorrˆncia do Evento e Total Sim N˜o a I a b n1 = a + b n2 = c + d II c d Total m1 = a + c m2 = b + d n = n1 + n2 61 . ´ preciso comparar condi¸˜es experimentais. O problema de compara¸˜es das probabilidades de ocorrˆncia do evento co e ou do atributo nos dois grupos (p1 e p2 ) ´ formulado atrav´s das hip´teses: e e o H0 : p1 = p2 Ha : p1 = p2 “n˜o h´ diferen¸a significativa entre os grupos” a a c “h´ diferen¸a significativa entre os grupos” a c 6. a e O efeito do tratamento ´ dado pela compara¸˜o dos dois grupos. o 6.2.Cap´ ıtulo 6 Compara¸˜es Entre Grupos co 6. a idade em que cada uma delas come¸ou a falar. Os indiv´ e ıduos no par s˜o semelhantes. A vari´vel de interesse ´ a ocorrˆncia de um evento. para compara¸˜o de dois tratamentos observam-se caracter´ u ca ısticas ou mede-se o valor da vari´vel resposta de interesse que as caracter´ a ısticas importantes dos indiv´ ıduos que integram o mesmo par sejam t˜o semelhantes quanto poss´ a ıvel.1 Teste Qui-Quadrado A Tabela 6. para saber se um tratamento e co tem efeito positivo. Por exemplo. O tratamento ´ administrado a um dos elementos do par e o outro ´ e e mantido como controle. por exemplo. organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste (´ o e grupo tratado). aparecendo com freq¨ˆncia em todos os tipos de estudos cl´ e ue ınicos.1 Introdu¸˜o ca ` As vezes. a Outras vezes. e ca Freq¨entemente. e o e a Tabela 6.1 apresenta dados gen´ricos de uma situa¸˜o envolvendo a compara¸˜o de dois grupos e que e ca ca a resposta de interesse ´ dicotˆminca: a ocorrˆncia ou n˜o de um evento.2 Resposta Dicotˆmica: Amostras Independentes o Comparar dois grupos atrav´s do resultado observado em uma vari´vel dicotˆmica ´ um problema comum e a o e na pesquisa m´dica. ´ preciso comparar duas popula¸˜es. albinismo. Em algumas situa¸˜es o par ´ constitu´ do mesmo indiv´ co e ıdo ıduo em duas ocasi˜es diferentes (amostras dependentes). enquanto o outro n˜o recebe o tratamento (´ o grupo controle). para e co um grande n´mero de crian¸as. o pesquisador ter´ que comparar os dados dos dois sexos. Para verificar se meninos u c c e meninas aprendem a falar na mesma idade. A vantagem do procedimento ´ clara. Por exemplo.

ca a .35) parece indicar que o uso de contraceptivos orais ´ mais freq¨ente entre os casos (infartos). nos indica. • n > 40 e Ei ≤ 5 para algum i. Estudo sobre a associa¸˜o entre o uso corrente de contraceptivos e o infarto de mioc´rdio.(1−α)% (Tabelas 2 × 2) n1 n2 m 1 m 2 Exemplo 6. ca a a Grupo Uso recente Total Sim N˜o a Casos 9 12 21 Controles 33 390 423 Total 42 402 444 Entre os casos. ca a Shapiro et al. a co ca e ca e a Esta corre¸˜o deve ser feita quando: ca • n < 40. Robson M. 08. com alto grau de confian¸a (95%) afirmar que existe associa¸˜o entre o uso de contraceptivos orais e infarto do mioc´rdio para pacientes entre 30 e 34 anos. ou seja. 84 = χ2 a c c 1. 43 e entre os controles.2. entre as pacientes que tiveram um infarto do mioc´rdio.(1−α)% Ei i=1 2 k ou.95% .6. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes s˜o a mostrados na Tabela 6.1. para Tabelas 2×2: χ2 = c n (ad − bc) ∼ χ2 1. = 0. 76 > 3. • 20 < n < 40 e Ei ≤ 5 para algum i.2 Resposta Dicotˆmica: Amostras Independentes o A estat´ ıstica teste ser´: a χ2 = c ROSSI. temos 2 n |ad − bc| − n 2 χ2 = ∼ χ2 cY 1. logo a corre¸˜o de Yates (1934) ´ necess´ria. Mas ser´ e u a que este resultado n˜o ocorreu por mero acaso? a A express˜o χ2 = 24. a propor¸˜o de uso recente a ca 9 33 de contraceptivos ´ e = 0. Para testar as hip´teses acima citadas temos a estat´ o ıstica teste qui-quadrado com corre¸˜o de continuidade ca de Yates. 62 (Oi − Ei )2 ∼ χ2 1. Tabela 6.2: Distribui¸˜o de uso de contraceptivo oral segundo grupo que sofreu ou n˜o infarto do mioc´rdio.(1−α)% (Tabelas 2 × 2) n1 n2 m1 m2 H´ restri¸˜es para aplica¸˜o do χ2 em tabelas contingˆncia. A diferen¸a entre estas duas propor¸˜es c co 21 423 (0.

0015.2 Resposta Dicotˆmica: Amostras Independentes o ROSSI.3: Associa¸ao entre o tipo de tratamento e mortalidade por AIDS. X1 e X2 . em que n ´ a menor freq¨ˆncia verificada na tabela. divididos em dois grupos. com freq¨ˆncias observadas em cada casela muito c˜ baixas. a probabilidade de ocorrˆncia deste valor e de uma freq¨ˆncia menor ainda.1.5): Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos.0263). para α = 0. Robson M. apresentada como a Tabela 5. 024. 63 6. pode-se concluir que h´ diferen¸a quanto ` mortalidade em rela¸˜o ao tipo de tratamento. que ser˜o denominadas tabelas ou matrizes extremas. por apresentarem uma disfun¸˜o e ca pancre´tica com diminui¸˜o da capacidade de produ¸˜o de insulina. Suponha um grupo de dezesseis ratos. as e freq¨ˆncias observadas tˆm distribui¸˜o hipergeom´trica e a probabilidade de ocorrˆncia i ser´ dada por: ue e ca e e a pi = n1 !n2 !m1 !m2 ! a!b!c!d!n! i=0 pi . Um estudo foi realizado para verificar a existˆncia de associa¸˜o entre o tipo de tratamento e ca e mortalidade por AIDS. a Como este p ´ menor que o n´ de significˆncia.2 Teste Exato de Fisher Nos casos em que formamos uma tabela de contingˆncia com formato 2 × 2. o n´mero de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela u 6.2. a p0 = Exemplo 6. 05 a decis˜o correta ser´ rejeitar H0 . no qual estimamos. 0255 (p-valor : 0. com os totais marginais fixos. a partir da menor ca freq¨ˆncia contida na tabela.3 apresenta os dados. 024 + 0. A matriz a . e ue Exemplo 6. c˜ Tratamento Mortalidade Total Sim N˜o a A 7 5 12 B 1 9 10 Total 8 14 22 Sendo p = 1 i=0 pi .2. temos p1 = 12!10!8!14! = 0. sendo B mais e a c a ca efic´z. Imagine que. a literatura apresenta a utiliza¸˜o do teste exato de Fisher. O grupo experimental ´ formado por 9 animais geneticamente modificados. e O teste exato de Fisher consiste em elaborar. ue e ue fazendo-se p = n Numa tabela de contingˆncia 2 × 2. 8!4!0!10!22! O valor de p ser´ 0. com pequeno n´mero de e u o u ue observa¸oes (n < 20 ou pr´ximo) e.3. com base nos totais marginais do fator discriminante da tabela original. experimental e normal. conseq¨entemente. A Tabela 6. enquanto a sobrevida para o grupo experimental ´ de apenas 11%. c˜ Tratamento Mortalidade Total Sim N˜o a A 8 4 12 B 0 10 10 Total 8 14 22 assim 12!10!8!14! = 0. 0015 = 0. duas outras tabelas.4: Associa¸ao entre o tipo de tratamento e mortalidade por AIDS. isto e ıvel a a a ´.6. Tabela 6. 7!5!1!9!22! e Tabela 6. ap´s um ano e meio em a ca ca o ambiente controlado.

o e a . 035 ou 3.2 Resposta Dicotˆmica: Amostras Independentes o ROSSI.7: Matriz X 2 . logo.3!.10!. Grupo Sobrevida + 1.6! FX2 : = 0. 01505 + 0. p = F0 + FX1 + FX2 = 0.5%.0!. Portanto. Nenhum rato do grupo experimental sobreviveu. pela matriz X2 (Tabela 6.6): Tabela 6. o valor de significˆncia para o teste ´ calculado segundo a f´rmula apresentada anteriormente: a e o Para a matriz original: 7!.6! FX1 : = 0.7!.9!.9!. 0236 + 0.16! Para a matriz X 2 : 7!. Robson M. X2 .5 ano Total Vivos Mortos Normal 5 2 7 Experimental 1 8 9 Total 6 10 16 extrema 1 ´ a matriz em que todos os animais mortos pertencem ao grupo normal (s˜o 10 mortos. 64 Tabela 6.16! Para a matriz X 1 : 7!.10!. os 9 mortos que restaram pertencem ao grupo experimental. de que as vidas dos ratos normais e dos transgˆnicos s˜o iguais). a afirma¸˜o de que a sobrevida dos ratos geneticamente alterados ´ menor que a dos ratos ca e normais envolve uma probabilidade de erro de 3.6!. Finalmente. Ent˜o.6: Matriz X 1 . 0009 = 0.16! Finalmente.9!.6. mas o e a grupo normal tem 7 ratos. Sobrevida + 1.9!. Ou seja. corresponde a uma tabela com os mesmos totais marginais. 02360 2!. os outros 3 que morreram pertencem ao grupo experimental) e todos que sobraram do grupo experimental est˜o vivos (todos os vivos.5 ano Vivos Mortos Normal 6 1 Experimental 0 9 Total 6 10 Grupo Total 7 9 16 Observe que existe um ´bito no grupo normal.1!. a resulta na Matriz X1 (Tabela 6.5!. 5%. ao n´ de 5% de significˆncia.6! F0 : = 0.5 ano Vivos Mortos Normal 0 7 Experimental 6 3 Total 6 10 Total 7 9 16 A matriz extrema 2.10!. rejeita-se a ıvel a hip´tese de nulidade (ou seja.8!. Desta forma. Obviamente. mas com todos os animais vivos no grupo normal. ca a Grupo Sobrevida + 1. 0105 0!.7): a Tabela 6.5: Estudo em ratos sobre disfun¸˜o pancre´tica. pois o n´mero de ratos do grupo normal ´ maior que o de o u e ratos que sobreviveram. 0009 6!.1!. pois sobraram 9-3 = 6 ratos).

estamos investigando a equivalˆncia entre os dois tratamentos.76) 200 0. Finalmente. e a a a compara¸ao de dois ´rg˜os no mesmo indiv´ c˜ o a ıduo. Sejam p1 e p2 as a o ˆ ˆ propor¸˜es de sucesso referentes aos tratamentos a serem comparados. Outra situa¸˜o ´ a que um o ca e tratamento ´ administrado e as vari´veis de interesse s˜o observadas antes e depois do programa. Compara¸˜o de drogas contra n´usea. Trata-se ca co de um teste aproximado que requer amostras grandes para sua aplica¸˜o. Um grupo recebeu a p´ ılula A e o outro a p´ ılula B. H´ a a indica¸˜es de que a efic´cia da p´ co a ılula A e B ´ a mesma? e Sol. 22 (p-valor : 0. e e Apresentaremos uma alternativa para o teste qui-quadrado para a compara¸˜o de propor¸˜es. segundo alguma c caracter´ ıstica estudada tamb´m constitui um auto-pareamento. e O pareamento natural consiste em formar pares t˜o homogˆneos quanto poss´ a e ıvel. Robson M. fatores que podem influenciar de maneira relevante a ıvel o o u vari´vel resposta. tais como.: Sejam pA e pB as propor¸˜es de marinheiros que n˜o enjoam. 76. nB = 200. ˆ O teste ´ baseado em e p1 − p2 ˆ ˆ ∼ N (0.3 Resposta Dicotˆmica: Amostras Pareadas o Podemos disting¨ir trˆs tipos de pareamento: auto-pareamento. idade. 66. sendo que o pareamento aparece de forma natural. respectivamente. em geral. 65 6. + Fixando-se o n´ de significˆncia em 5%. 76 − 0. H´ indica¸˜o de que a p´ a a a ca ılula A oferece maior prote¸˜o contra n´usea comparada ca a a ılula B. e a No pareamento artificial escolhe-se indiv´ ıduos com caracter´ ısticas semelhantes.6. as co a propor¸˜es amostrais baseadas em amostras de tamanhos n1 e n2 . Queremos testar as co hip´teses: o H0 Ha : p1 = p2 : p1 = p2 isto ´. pernas. estado de sa´de ou.66) 200 = 2. pareamento natural e pareamento artifiu e cial. pode-se concluir que as duas p´ ıvel a ılulas n˜o s˜o igualmente efetivas. 1). que s˜o estimadas por p1 e p2 . Um crit´rio ´ exigir que n1 p1 e ca e e ˆ n2 p2 excedam o valor 5. gˆmeos univitelinos s˜o muitos usados. logo tem-se: Z= 0. a . narinas. olhos. n´ s´cio-econˆmico.76(1−0. como bra¸os. ` p´ 6. rejeita-se H0 . respectivamente para as p´ co a ılulas A e 152 132 ˆ ˆ B. Temos que nA = 200. pA = 200 = 0.4. sendo que no primeiro grupo 152 n˜o enjoaram durante uma tempestade e no outro grupo apenas 132. Zc = ˆ ˆ p1 (1−p1 ) ˆ ˆ + p2 (1−p2 ) n1 n2 Exemplo 6. Por exemplo. ca a Com o objetivo de comparar a efic´cia de dois preventivos contra n´usea.0281). em experimentos de laborat´rio pode-se formar pares de cobaias selecionadas da mesma ninhada.66(1−0. controlando os fatores que possam interferir na resposta. pB = 200 = 0. como na situa¸˜o em o ca que um indiv´ ıduo recebe duas drogas administradas em ocasi˜es diferentes.3 Resposta Dicotˆmica: Amostras Pareadas o ROSSI. Portanto. dividiu-se aleatoriamente uma a a amostra de 400 marinheiros em dois grupos de 200.3 Teste z para Compara¸˜o de Propor¸˜es ca co Denotamos os dois resultados poss´ ıveis da vari´vel dicotˆmica por sucesso e fracasso. O auto-pareamento ocorre quando o indiv´ ıduo serve como seu pr´prio controle. sexo. em investiga¸˜es o co cl´ ınicas.2. 66 0.

portanto. a hip´tese fundae a o mental na constru¸˜o do teste de probabilidade constante de malignidade n˜o ´ razo´vel aqui. Suponhamos que dois patologistas examinaram. para dados pareados.1 Teste de McNemar O exemplo a seguir ilustra a necessidade de desenvolvimento de um teste espec´ ıfico para a situa¸˜o de ca dados pareados em que a resposta ´ dicotˆmica. e a Neste caso. avaliado por dois patologistas. Robson M.9. e Os dados a serem analisados no processo de compara¸˜o podem ser resumidos no formato da Tabela 6. 1 b+c : p1 = p2 : p1 = p2 A hip´tese nula dever´ ser rejeitada quando χ2 cN > χ2 . a hip´tese a o de interesse ´: e H0 Ha A Estat´ ıstica Teste: (B/C) χ2 cN = M (|b − c| − 1)2 ∼ χ2 . separadamente. apenas 100. isto ´. ca a Diagn´stico de B o Diagn´stico de A o Total Malignos Benignos Malignos 9 1 10 Benignos 9 81 90 Total 18 82 100 ´ E importante observar que a unidade de an´lise aqui ´ o tumor. ca e Tabela 6.9: Apresenta¸˜o de dados obtidos em uma classifica¸˜o de dados pareados. o material de 100 tumores e os classificaram como benignos ou malignos. na realidade.8: Classifica¸˜o de dois patologistas (A e B) quanto ` malignidade de tumores.3 Resposta Dicotˆmica: Amostras Pareadas o ROSSI. alguns tumores ser˜o claramente mais malignos do que outros e. ca Tabela 6.8. Isto explica ca a e a a necessidade de desenvolvimento de teste espec´ ıfico. o a 1 M . Embora a e tenham sido feitas 200 an´lises. a forma adequada de apresenta¸˜o dos dados ´ mostrada na Tabela 6. respectivamente. A quest˜o de interesse ´ saber se os patologistas diferem nos a e seus crit´rios de decis˜o. a e Al´m disto.3. ca ca Controle Tratamento Total Sucesso Fracasso Sucesso a b n1 Fracasso c d n2 Total m1 m2 n Se p1 e p2 s˜o as probabilidades de sucesso nos grupos controle e tratamento. 66 6.6. o total de tumores ´. e o Exemplo 6.5.

imagine que um pesquisador obteve.6. como o de Vianna et al. Por exemplo. a Doen¸a de c Controle Total Hodgkin Operados N˜o operados a Operados 26 15 41 N˜o operados a 7 37 44 Total 33 52 85 O valor da estat´ ıstica do teste de McNemar ´: e χ2 cN = M (|15 − 7| − 1)2 = 2.10: Distribui¸˜o de pacientes com e sem doen¸a de Hodgkin em um estudo caso-controle pareado ca c segundo ` amigdalectomia. 67 e Exemplo 6.4. 23 (p-valor : 0. ao analisarem retrospectivamente a hist´ria cl´ o ınica de pacientes de doen¸a de c Hodgkin.10. doentes ca versus n˜o doentes) em rela¸˜o a uma resposta cont´ a ca ınua. e Sejam µ1 e µ2 as m´dias da vari´vel estudada para os dois grupos. a Nesta se¸˜o apresentamos a metodologia para comparar dois grupos de pacientes (por exemplo. Esta c a a ca c conclus˜o n˜o est´ de acordo com trabalhos anteriores. a Logo ap´s a publica¸˜o. a e Tabela 6. um tipo de cˆncer no tecido linf´ide. dados os dois e e ıvel a grupos.4 Resposta Cont´ ınua . Para verificar se meninos u c c e meninas aprendem a falar na mesma idade. α. utilizando as informa¸˜es o ca a a co do artigo. pela remo¸˜o da ”barreira linf´tica” representada a c ca a pela am´ ıgdala.6. press˜o sist´lica. ´ preciso comparar duas popula¸˜es. que ´ baseada nos dados da Tabela 6.1 Teste t Se a vari´vel em an´lise tem distribui¸˜o normal ou aproximadamente normal. Depois. Robson M.4 Resposta Cont´ ınua . a idade em que cada uma delas come¸ou a falar. neste caso. o pesquisador ter´ que comparar os dados dos dois sexos. respectivamente.Teste de M´dias para Amostras Indepene dentes ` As vezes. entretanto.Teste de M´dias para Amostras Independentes ROSSI. c Johnson & Johnson (1972). para e co um grande n´mero de crian¸as. 15 + 7 Este valor dever ser comparado com 3. A conclus˜o relatada a no artigo foi feita. v´rios autores observaram a impropriedade da an´lise e. Amigdalectomia e doen¸a de Hodgkin. n˜o encontraram evidˆncias que sustentassem a hip´tese de a o a e o que a amigdalectomia aumenta a suscetibilidade ` doen¸a. Ou seja. a o a igualdade das m´dias das respostas de dois tratamentos. (1971). com uma a confian¸a de 95% acreditamos que n˜o h´ associa¸˜o entre a doen¸a de Hodgkin e a amigdalectomia. calculam-se: a) as m´dias de cada grupo: e x1 ¯ x2 ¯ : m´dia do grupo 1 e : m´dia do grupo 2 e b) as variˆncias ou os desvios-padr˜es de cada grupo: a o s1 s2 : : desvio-padr˜o do grupo 1 a desvio-padr˜o do grupo 2 a . aplica-se o teste t para a a ca comparar duas m´dias. fizeram a an´lise correta. a a a 6. Testa-se. Mas primeiro ´ preciso estabelecer o n´ de significˆncia.1356). usaram um planejamento do tipo caso-controle pareado. com uma an´lise apropriada para dados provenientes de grupos independentes.84 para um n´ ıvel de significˆncia de 5%. 1 e 2. Neste estudo. As hip´teses a serem e a o testadas s˜o: a H0 Ha : µ1 = µ2 : µ1 = µ2 6. por exemplo.

para o a ¯ ¯ p 2 1 α = 5%.4 Resposta Cont´ ınua .s2 . s2 s2 1 2 + n1 n2 Exemplo 6. 13. O halotano ´ uma droga bastante utilizada para induzir a anestesia geral. s2 = 5. Robson M. com um odor relativamente agrad´vel. assim: tc = 12 − 15 4. 902 ∈ Regi˜o de rejei¸˜o de H0 . 4.7. 68 e c) a variˆncia ponderada: a s2 = p (n1 − 1)s2 + (n2 − 1)s2 1 2 n1 + n2 − 2 x1 − x2 ¯ ¯ s2 p 1 1 + n1 n2 d) o valor da estat´ ıstica teste.4. Trata-se de um poderoso e anest´sico de inala¸˜o. um m´dico separou.Teste de M´dias para Amostras Independentes ROSSI. a A estat´ ıstica teste usada ser´: a x1 − x2 ¯ ¯ Zc = ∼ N (0. temos: x1 = 12. em quilogramas. a e a a 6. ao acaso. n˜o inflam´vel e n˜o explosivo.8. 4 p − valor : 1 1 + 10 7 = −2. logo podemos a ca 1 1 + n1 n2 0. temos t15. definida por: tc = ∼ tn1 +n2 −2.2 Teste z Um pressuposto importante para aplicar o teste t visto anteriormente ´ que os dois grupos comparados e tenham a mesma variabilidade. 010947 concluir que. a substˆncia chega aos pulm˜es tornando poss´ a passagem para o estado anest´sico o ca a o ıvel e mais rapidamente do que seria poss´ com drogas administradas de forma intravenosa. ıvel . um a e conjunto de pacientes em dois grupos. s2 = 4. x2 = 15.11: a Tabela 6. em quilogramas. ca Ap´s a inala¸˜o. tc . e Os dados est˜o apresentados na Tabela 6. ca Para verificar se duas dietas para emagrecer s˜o igualmente eficientes. o que nem sempre acontece na pr´tica.6. desta forma. Decorrido certo tempo. em m´dia. ou seja.α% . e a Em termos pr´ticos. o m´dico obteve a perda (ou ganho) de peso. Compara¸˜o entre tratamentos para dieta. No caso de amostras grandes (n1 e a n2 ≥ 30) dispomos de um teste em que n˜o ´ necess´rio qualquer suposi¸˜o adicional sobre σ 2 e σ 2 . 1 15 19 15 12 13 16 15 2 12 8 15 13 10 12 14 11 12 13 Ap´s alguns c´lculos preliminares. as perdas de peso de pacientes submetidos aos dois tipos de dieta s˜o diferentes. s2 = 4. x ¯ p Exemplo 6. a perda de peso ´ maior quando os pacientes s˜o submetidos ` dieta 2. a e a ca 1 2 as varˆncias podem ser iguais ou diferentes.11: Perdas de peso. Cada paciente seguiu a dieta designada para seu grupo.5% = ±2.α% O intervalo de confian¸a para (µ1 − µ2 ) ser´: c a (¯1 − x2 ) ± tn1 +n2 −2. Efeito do halotano em cirurgias card´ ıacas. 1). Pode ser e ca a a a a administrado ao paciente com o mesmo equipamento usado para sua oxigena¸˜o. de cada paciente de cada grupo. segundo a dieta.

Tamb´m s˜o feitos experimentos em que se observam os mesmos indiv´ e a ıduos duas vezes. enquanto e e o outro permanece sem o tratamento (controle). isto ´.12: M´dia e desvio-padr˜o da press˜o sang¨´ e a a uınea (mmHg) segundo o tipo de anestesia. observa¸˜es no mesmo indiv´ co ıduo). para verificar o efeito de um tratamento sobre press˜o arterial. necessitamos dos resultados apresentados na Tabela 6. 84 12. e a a 6. 9 − 73. Conahan et al.Teste de M´dias para Amostras Pareadas e Teste t Para estudar o efeito de um tratamento.4 n 61 61 Nas condi¸˜es do problema. indicando que os dois anest´sicos n˜o s˜o equivalentes. dois lados de um indiv´ a co e ıduo. e em outros per´ ca e o a ıodos importantes durante a opera¸˜o. devemos testar a diferen¸a entre as press˜es sang¨´ e c o uıneas m´dias de indiv´ e ıduos anestesiados com halotano ou morfina. comparam-se os dois lados dos mesmos indiv´ ıduos. Para obter duas amostras compar´veis. Ha : µ1 = µ2 isto ´. Como as amostras s˜o grandes. 61| > ıvel a e a 1. Por exemplo. o resultado ´ estatisticamente significativo. j´ que | − 2. Informa¸˜es co Anestesia sobre a amostra Halotano Morfina M´dia e 66. e deixar o outro lado sem tratamento (controle).2 Desvio-Padr˜o a 12.9 73. ap´s a anestesia mas antes da incis˜o. uma vez e antes. 30 = −√ = −2. Por exemplo. 69 Entretanto. Por exemplo. os efeitos colaterais incluem a depress˜o do sistema respirat´rio e cardiovascular. A quest˜o que surge ´ se o efeito do halotano e da morfina na press˜o sang¨´ ca a e a uınea ´ o mesmo. foram registradas vari´veis hemodinˆmicas. Todos esses exemplos s˜o de observa¸˜es pareadas (pares de gˆmeos. quando as observa¸˜es s˜o pareadas. Com o objetivo a de estudar o efeito desses dois tipos de anestesia. muitas vezes comparam-se pares de indiv´ ıduos. Alguns ca a a anestesistas acreditam que esses efeitos podem causar complica¸˜es em pacientes com problemas card´ co ıacos e sugerem o uso da morfina como um agente anest´sico nesses pacientes devido ao seu pequeno efeito na e atividade card´ ıaca. 61 (p-valor : 0. 2 14. par estudar o efeito de um tratamento para preven¸˜o de c´ries. as hip´teses s˜o: co o a H0 : µ1 = µ2 .1 Resposta Cont´ ınua .Teste de M´dias para Amostras Pareadas e ROSSI. o dentista pode aplicar o tratamento em um lado da arcada dent´ria ca a a de cada paciente. 5.12 a seguir: e Tabela 6. podemos usar o teste Z. Outras vezes. como press˜o a a a sang¨´ uınea antes da indu¸˜o anest´sica. depois de administrar o tratamento. sensibia o liza¸˜o a arritmias produzidas por adrenalina e eventualmente o desenvolvimento de les˜o hep´tica. outra vez.5 6. os pacientes foram alocados aleatoriamente a cada tipo de anestesia. 2 2 2 Adotando um n´ de siginificˆncia de 5%.5.5 Resposta Cont´ ınua . Para testar o efeito de um tratamento. cujo valor da estat´ a ıstica do teste ´: e Zc = 6.6. 96. em alguns estudos de psicologia comparam-se pares de gˆmeos: um dos gˆmeos recebe o tratamento. .2 14. co a aplica-se o teste t. Robson M. antes e depois de administrar a e a o tratamento. 4 + 61 61 66. (1973) compararam esses dois agentes anest´sicos em um grande n´mero de pacientes e u submetidos a uma cirurgia de rotina para reparo ou substitui¸˜o da v´lvula card´ ca a ıaca.0103). Para comparar os dois grupos. o m´dico pode obter a press˜o arterial de seus pacientes.

0) ´ menor do que o valor da tabela. √ n Exemplo 6. 0 (p-valor : 0.´ de 3. e ıvel a ¯ d = s2 logo tc = = 30 = −3.13: Pesos em Kg de 9 pessoas antes e depois da dieta para emagrecimento. 25 9 Ao n´ de siginificˆncia de 1% com g. ser´ dado por: c a S ¯ d ± tn−1. di = x2 − x1 : a diferen¸a entre as unidades de cada um dos n pares e c c n ¯ d= i=1 di n s2 : variˆncia das diferen¸as.36. S˜o dados os pesos de 9 pessoas. = 8. a Tabela 6. concui-se que o tratamento n˜o tem efeito significativo. e a Em termos pr´ticos.1% . antes e depois da dieta para emagrecimento. o experimento n˜o provou que a dieta emagrece.α% onde: ¯ d : m´dia das diferen¸as. 33 9 25 − −3. 70 ¯ d s2 n ∼ tn−1. ´ preciso primeiro estabelecer o n´ de significˆncia.α% .080516).9.l. Como o valor ıvel a e absoluto de tc (2. a c Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn−1.Teste de M´dias para Amostras Pareadas e Estat´ ıstica teste: tc = ROSSI. Robson M. 33 = −2. a a . di . Dieta Antes Depois di 77 80 3 62 58 -4 61 0 61 80 76 -4 90 79 11 72 69 -3 86 90 4 59 51 -8 88 81 -7 Total -30 Para fazer o teste. Seja α = 1%.α% . o valor de t tabelado para t8.5 Resposta Cont´ ınua . conclui-se que o tratamento tem efeito ao n´ α% estabelecido.6. ıvel O intervalo de confian¸a para d.

9 262.9 219.9 184.. Quando a u e a ca ocorre a presen¸a de valores iguais no conjunto.3 377.14: Avalia¸ao morfoquantitativa dos neurˆnios mioent´ricos nadh-diaforase reativos do estˆmago c˜ o e o de ratos com diabetes induzido por estreptozootocina e suplementados com ´cido asc´rbico. a o aglanB aglanA aglanTotal glanB glanA glanTotal Grupos 101.1 213.9 426 253 231. Quanto ao procedimento mais adequado para a aplica¸˜o do teste. para testar a diferen¸a de dois a a ca e c ou mais grupos quando a distribui¸˜o subjacente ´ assim´trica ou dos dados foram coletados em uma escala ca e e ordinal.24 121.43 c 146.1 92. todas a ca e as N observa¸˜es recebem uma pontua¸˜o atrav´s dos n´meros naturais 1.3 ds 164.3 214. ca a sendo: n1 (n1 + 1) − T1 U1 = n1 n2 + 2 e n1 (n1 + 1) − T2 U2 = n1 n2 + 2 onde n1 e n2 s˜o os tamanhos das duas amostras de T1 e T2 .3 334.1 448.4 216.1 394.6 133.7 484 ds 251.6.2 344. Tabela 6. 6.7 186.7 269.44 96.4 464.3 d 232.4 485.5 114.14 92.47 123.5 290.7 311 520.6 123.6 429.8 581.7 d 237. verificar se existe diferen¸a de tamanho entre as regi˜es glandular a c o e aglandular.5 ds 201. 3.6 271.8 d 139.2 246. o posto de um valor de um conjunto de n valores corres-ponde a um n´mero u natural que indicar´ a sua posi¸˜o no conjunto anteriormente ordenado (posto. n˜o afetando o posto seguinte. ca utilizando. Assim.37 193. Avalia¸˜o morfoquantitativa dos neurˆnios mioent´ricos nadh-diaforase reativos do estˆmago ca o e o de ratos com diabetes induzido por estreptozootocina e suplementados com ´cido asc´rbico (Mestrado em a o Morfologia-UEM).3 409. num conjunto de seis valores j´ ordenados {7-12-18-18-19-23} os postos ser˜o {1-2-3.1 138.1 Teste U de Mann-Whitney Este teste corresponde a mais uma alternativa para a compara¸˜o de duas amostras independentes.1 d 222.4 143.1. n.3 263. c e a Portanto.5 159. entre as sub-regi˜es aglandular (A e B) e glandular (A e B) e entre o estˆmago como um todo..6 Testes N˜o-Param´tricos a e Os testes n˜o-param´tricos s˜o boas op¸˜es para situa¸˜es em que ocorrem viola¸˜es dos pressupostos a e a co co co b´sicos necess´rios para a aplica¸˜o de um teste param´trico.83 100.5 110.5 272.5 158. ou vice e versa.4 249.2 805.5 484. Robson M.5 190.1 367. score ou rank ).3 477.6.6 Testes N˜o-Param´tricos a e ROSSI. considera-se um ponto m´dio.4 438.3 191.1 217.6 246. Parte dos a a dados est˜o dispon´ a ıveis na Tabela (6.1 c 94.5-5-6}.94 149.8 c 139.6 328 c 203. ao menor valor co ca e u se dar´ o n´mero 1.4 d 234. baseamo-nos no c´lculo de U1 e U2 . .4 269. como os demais testes n˜o-param´tricos. que receber´ a maior pontua¸˜o.2 237.1 468. o o e verificar se o diabetes afeta mais a regi˜o glandular do que a regi˜o aglandular.9 207. a a respectivamente. isto ´. 71 Exerc´ ıcio 6.2 297.8 c 97.5-3.4 193.9 197.3 240. Este trabalho teve entre v´rios objetivos.1 191. 4. os n´meros naturais para classifica¸˜o conjunta dos a e u ca valores observados. Portanto.. que correspondem as somas dos pontos (postos) a atribu´ ıdos aos valores das duas amostras. e assim sucessivamente at´ o valor maior.2 ds 6. 2.6 193.6 424. . Por exemplo.14) a seguir.

ıvel . 63. sendo ca µ(u) = n1 n2 e σ(u) = 2 n1 n2 (n1 + n2 + 1) . Portanto as amostras diferem entre si ao n´ de 5% de significˆncia. ca Para amostras grandes (n > 20) Neste caso o teste pode ser aplicado por aproxima¸˜o normal.7 12 8(8 + 1) − 85 = 7 2 7(7 + 1) − 35 = 49. 2 Como Uc ≤ UT rejeitamos Ho .6 Testes N˜o-Param´tricos a e ROSSI. 72 Para amostras pequenas (n ≤ 20) Uc = m´ ın{U1 .7 + U2 = 8.3 (5) 2. n2 = 7.10.4 (7) 2.013986).0 (2) 2. e 8. 1). 0 T2 = 35.6. σ(u) Exemplo 6. e Amostra A Amostra B 2.n2 e conclu´ ımos para a rejei¸˜o de Ho se Uc ≤ UT . U2 } Obtemos uma estat´ ıstica tabelada : UT = Uα.8 (12) 2.n1 .7 n1 n2 8. ıvel a Suponho n ≥ 20 O teste pode ser aplicado tanto para U1 ou U2 . a express˜o do teste ser´: a a Z= u1 − µ(u) ∼ N (0.3 (5) 2. Considera-se e a que as amostras diferem entre si ao n´ de 5% de significˆncia.9 (13) 2. respectivamente ser˜o: a U1 = 8. 43 (p-valor : 0.3 (15) T1 = 85.15: Dados hipot´ticos.2 (3) 3. c Tabela 6. ou seja. quando α = 5%.6 (9.3 (5) 2.5) 2. rejeitamos H0 . 12 Neste caso. Z= 8. Robson M. a ca ca o Temos ent˜o n1 = 8.8 (1) 3. a O valor de U1 e de U2 .96.49} = 7 O valor da estat´ ıstica tabelada ser´ de: a UT = Uα. 0 Procede-se ` ordena¸˜o dos valores para obten¸˜o dos seus postos e posteriormente seu somat´rio.n1 .n2 = U5%.7 + Assim Uc = m´ ın{7. 63 Como o valor de |Z| ´ maior do que Zα .8.6 (9. o valor 1.7 (11) 1.5 (8) 2. Verificar se os dados das duas amostras apresentam diferen¸a significativa.7(8 + 7 + 1) = = 28 e σ(u) = = 8.5) 2. µ(u) = 2 2 12 Sendo assim: 7 − 28 = −2. T1 = 85 e T2 = 35. pois ambos s˜o sim´tricos em rela¸˜o ` a e ca a m´dia 28.2 (14) 2.

o a o Exerc´ ıcio 6. com objetivo de detectar pacientes com osteoporose coletou-se uma o o amostra de 30 pacientes aleatoriamente em um Hospital Universit´rio.3. De cada paciente realizou-se um a cadastro onde tinha as seguintes vari´veis: idade. Diagn´stico e tratamento da Osteoporose. Os locais mais e c a e comuns s˜o v´rtebras. ra¸a e outras como. o u A massa ´ssea aumenta durante a infˆncia e principalmente adolescˆncia. Ap´s a parada do crescimento ´sseo.stw e verifique se existe diferen¸a c entre os grupos: Tabagismo e Ingest˜o. do risco de fratura. algumas doen¸as (hipogonadismo. levando a uma c o ca o ca perda de massa ´ssea em torno de 1% ao ano. Assim. a reabsor¸˜o ´ssea se manifesta o ca o mais precocemente nas regi˜es ricas em osso trabecular. conseq¨entemente. s´ a a c c ındromes disabsortivas) e drogas (cortic´ide) s˜o fatores de risco que aceleram a perda ´ssea. Peso e IMC. Robson M. 73 Exerc´ ıcio 6. o ingest˜o adequada de c´lcio. em um o o ca ca ca processo denominado de remodela¸˜o ´ssea. levando a um aumento da fragilidade ´ssea e.2. ca o Com o avan¸o da idade cronol´gica. tabagismo. o Na osteoporose p´s-menopausa (desencadeada pelo hipoestrogenismo). e A osteoporose ´ uma doen¸a assintom´tica at´ o paciente apresentar alguma fratura. peso. A quantidade de osso presente no adulto ´ proporcional ao o e pico de massa ´ssea atingido. altura. levando ` fratura na regi˜o distal do radio e colapso o a a central das v´rtebras dorsais e lombares. onde a ca a IM C = * Considere α = 5%. atingindo seu pico em torno o a e dos 25 anos na mulher e 30 a 35 anos no homem. P eso . atividade f´ a ısica. a forma¸˜o ´ssea torna-se menor que a reabsor¸˜o.6 Testes N˜o-Param´tricos a e ROSSI. com rela¸˜o entre as vari´veis: Altura. Utilize o banco de dados em anexo de nome: osteporose ex. Altura2 . As principais complica¸˜es das fraturas s˜o a e a a e co a dor crˆnica e deformidade ´ssea. hist´ria de fratura materna.6. a forma¸˜o e a reabsor¸˜o ocorrem na mesma propor¸˜o. o Osteoporose ´ uma doen¸a esquel´tica sistˆmica caracterizada por baixa massa ´ssea e altera¸˜o da e c e e o ca micro-arquitetura. regi˜o distal do r´dio e colo do fˆmur.

Assim os valores acima receberiam a seguinte numera¸˜o. c a e co Da mesma forma que nos outros testes. 0 T2 = 69. 74 6. − 3(N + 1) tal que H ∼ χ2 (k−1) N (N + 1) i=1 ni em que: Ti : ´ a soma das ordens atribu´ e ıdas ao tratamento i. a e . ser´ uma maneira de verificar se a estas diferen¸as s˜o devidas ao acaso ou se as amostras prov´m de popula¸˜es diferentes. Radioterapia (n1 = 7) Quimioterapia (n2 = 8) Cirurgia (n3 = 8) 17 (11) 20 (12) 32 (17) 14 (9) 5 (3) 35 (20) 4 (2) 9 (6) 26 (15) 8 (5) 13 (8) 34 (18.6 Testes N˜o-Param´tricos a e ROSSI. • ni ≥ 6. conforme os valores a ca ca j´ entre parˆnteses. na cidade de Cabrob´. a express˜o ´ definida por: a a e HK−W = k T2 12 i . a e Ele ´ utilizado para que se verifique o contraste entre k amostras independentes.6. u c˜ N : o total de observa¸˜es em todos os tratamentos k.5) 29 (16) 34 (18. procedeu co u mos ` ordena¸˜o dos valores. de pacientes atendidos na cl´ do hospital X.2 Teste H de Kruskal-Wallis para k amostras O teste de Kruska-Wallis foi criado como um substituto ao teste F na an´lise param´trica.5) 21 (13) 6 (4) 2 (1) 45 (21) 15 (10) 11 (7) 50 (23) 22 (14) 47 (22) T1 = 57. u ni : o n´mero de observa¸oes em cada tratamento k e. 5 Quest˜es: H´ diferen¸a sifnificativa entre os tempos de sobrevivˆncia? Qual o tratamento recomendado o a c e baseado no tempo de sobrevida? Independentemente do n´mero de observa¸˜es em cada grupo e utilizando os n´meros naturais. co ınica de abdˆmen o Exemplo 6. ser˜o consideradas as hip´teses nula (H0 ) e alternativa (Ha ). ca • Dados ordinais (que possam ser ordenados). o Tabela 6.11. e Requisitos: • Compara¸˜o entre 3 ou mais grupos independentes. em meses. isto a o ´: e H0 Ha : “n˜o h´ diferen¸a significativa entre os tratamentos”. Os valores obtidos nas diversas amostras diferem entre si e portanto. Robson M. 5 T3 = 149. a c Quanto ` metodologia usada no teste de Kruskal-Wallis. a a c : “h´ diferen¸a significativa entre os tratamentos”.16: Tempo de sobrevida. k : corresponde ao n´mero de tratamentos ou amostras a comparar.6. Analisar o tempo de sobrevida.

A aplica¸˜o deste teste pressup˜e que as duas amostras sejam casualizadas e independentes. portanto. atribui-se maior valor para co c a maior diferen¸a encontrada. Em seguinda. Obter o valor da estat´ ıstica calculada Tc = m´ ın{|T− |. 52 149.n . ent˜o H ∼ χ(3−1) ⇒ χ2. c c Procedimento 1. obt´m-se os totais do ranks da amostra de menor tamanho. e consultando-se a tabela (anexo) do referido teste.6. Robson M.stw para verificar se existe diferen¸a entre as Ra¸as. considerando as vari´veis: Altura.n 6. |T+ |} 5. e que as ca o vari´veis em confronto sejam cont´ a ınuas. 7) − 72 46 11.3 Teste de Wilcoxon (Amostras Pareadas ou dependentes) Trata-se de um teste n˜o-param´trico para comparar dois tratamentos quando os dados s˜o obtidos a e a atrav´s do esquema de pareamento. Calcular di : diferen¸a entre as obseva¸˜es c co di = xi 2. a ca atribuir aos mesmos seus “ranks”. Ignorar os sinais e atribuir postos 3. (2) − xi (1) . 75 1 572 69. Calcular a soma dos postos (T+ e T− ). + + − 72 46 7 8 8 1 . Concluir pela rejei¸˜o de H0 se Tc ≤ Tα. A metodologia do teste consiste em se proceder ` ordena¸˜o dos valores das amostras e. 52 . ca Pequenas Amostras (n ≤ 25) No confronto de dois grupos quando desejamos identificar se existe diferen¸a significativa entre os mesmos c quanto `s medidas encontradas. Peso e IMC. Obter o valor da estat´ ıstica Tabelada (Anexo) Tα. diminuindo este valor de acordo com as menores diferen¸as existentes.4. conclu´ ımos pela rejei¸˜o de H0 e conseq¨entemente.0025). posteriormente.6 Testes N˜o-Param´tricos a e Ent˜o: a HK−W = = = = = k T2 12 i . Dada a grandeza das diferen¸as observadas. 99 e χ2. pois apresenta maiores valores aos tempos de sobrevida. Utilize o banco de dados citado no exerc´ ıcio anterior: osteoporose ex. considerando que o valor encontrado de HK−W = 11. ao n´ de 5%. 4. pela indica¸˜o de que o tratamento cir´rgico ca u ca u se destaca dos demais.5% = 5. 21. empregamos o teste de Wilcoxon quando a varia¸˜o dos valores apresenta-se a ca de forma acentuada. A prova de Wilcoxon avalia a grandeza das diferen¸as quando e c comparados postos de observa¸˜es. (3861.6. 95 (p-valor : 0. tanto para α = 5% como para e α = 1%. 2 2 2 Como HK−W ∼ χ2 a (k−1) . − 3(23 + 1) 23(23 + 1) i=1 ni ROSSI. − 3(N + 1) N (N + 1) i=1 ni 3 T2 12 i .1% = 9. Exerc´ ıcio 6. 95 ´ maior do que os valores da tabela. c c a ıvel 6.

4 (3) 1. Os n´ ıveis de anticorpos corresponderam a: Tabela 6.6. pr´-determinado. ca Grandes Amostras (n > 25) Nos casos de grandes amostras. para Tc = m´ ın{57.0 (4) 6.3 (9) 11.8 (5) 20.5 = 0 > 34 (no Statistica o p-valor : 0. cinco pacientes. 1) n(n + 1)(2n + 1) 24 em que: n : n´mero de elementos da menor amostra. n˜o apresentam-se com diferen¸a siginificativa.4 (6) 9. ent˜o. que os valores comparados.1 (7) 0. Assim. para a compara¸ao de conjuntos de medidas. 76 Exemplo 6.6 Testes N˜o-Param´tricos a e ROSSI. u . 34} = 34 consultando-se a Tabela de Wilcoxon. Foi realizado um ensaio cl´ ınico em que foram utilizadas duas drogas A e B.4 (10) 2.17: N´ ıveis de anticorpos. Robson M.8927). que os valores de n´ a c a ıveis de anticorpos em rela¸˜o aos dois tipos de drogas se comportam de forma semelhante. referentes `s drogas A a a e B.n = T5%. α.4 (13) T1 = 57 T2 = 34 Logo. verifica-se que Tα.9 (2) 17. estas apresentam valores com distribui¸˜o normal e. ou seja.2 (12) 16. portanto. ca a e ca S˜o enunciadas naturalmente as hip´teses. provenientes de duas amostras.12. ıvel a e Assim.5 (11) 3. ser´ necess´rio c˜ a a utilizar a express˜o de W ∗ : a n(n + 1) Tc − 4 W∗ = ∼ N (0. a comca para¸˜o das medidas ser´ realizada atrav´s de determina¸˜o de um valor W ∗ . Tratamento A B 7. podemos afirmar que n˜o rejeitamos H0 . Com a droga A foram tratados oito pacientes e com a droga B. Conclui-se.8 (8) 19.7 (1) 12. H0 ser´ rejeitada se o valor de W ∗ for maior ou igual a Zα a o a para um n´ de significˆncia.

5 (+) 1 (+) 3 (+) 2 (-) 8 (-) 14 (-) 9. c . Evolu¸˜o do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no ca primeiro e no ultimo dia: ´ Tabela 6.5 (-) 7 (-) 4. rejeitamos H0 .003).6. 6} = 6 De acordo com a Tabela de Wilcoxon. para o valor de Z5% = ±1. 96.5 (-) 11. 14(14 + 1)(2.5 (-) 4.18: Tratamento com tianeptina. os valores dos dois conjuntos apresentam diferen¸as significativas. 77 Exemplo 6. 92 (p-valor : 0.14 + 1) 24 6− Postos (-) 11.14 = 21 Como 6 < 21. 92 est´ na ´rea de rejei¸˜o de H0 . Robson M. a a ca rejeitamos H0 . Tianeptina ´ Primeiro dia (m = 8) Ultimo dia (n = 8) d 24 6 -18 46 33 -13 26 21 -5 44 26 -18 27 10 -17 34 29 -5 33 33 0 25 29 +4 35 37 +2 30 15 -15 38 2 -36 38 21 -17 31 7 -24 27 * * 34 * * 32 26 -6 Sendo assim temos: |T− | = 99 e |T+ | = 6.n = T5%.5 (-) 9.5 (-) 13 * * (-) 6 W∗ = Considerando que o valor de W ∗ = −2.13. ou seja. Tα. ent˜o a Tc = m´ ın{99.6 Testes N˜o-Param´tricos a e ROSSI. Supondo n grande teremos: 14(14 + 1) 4 = −2.

34.4(4 + 1) i=1 12 . ca e co u Assim. Dentro de cada um do n blocos formados procede-se ca e a a ` classifica¸˜o das i-´simas observa¸˜es em k tratamentos. 04 ´ maior do que os valores da tabela. Robson M. [121 + 196 + 400] − 75 100 14.6.19: Dados de quatro procedimentos t´cnicos. conclu´ ımos pela rejei¸˜o de H0 . utilizando-se n´meros naturais.6. tem-se a estat´ ıstica teste: HF r = k 12 . O tratamento C apresentou melhores resultados em rela¸˜o aos demais grupos.00285). a A forma de realiza¸˜o do teste ´ an´logo aos demais.5% = 7. Ti2 − 3n(k + 1) tal que HF r ∼ χ2 (k−1) nk(k + 1) i=1 Exemplo 6. procura-se fazer a compara¸˜o de tratamentos em que s˜o formados blocos com a inten¸˜o de que isto resulte em um ca a ca pareamento consider´vel entre os diversos tratamentos.4 Teste de Friedman para k tratamentos O teste de Friedman ´ recomendado como um substituto do teste F. considerando que e o valor encontrado de HF r = 14. S˜o prescritos quatro procedimentos t´cnicos para determina¸˜o de certa vari´vel. tem-se: a HF r = = = 4 12 . Na verdade.1% = 11. e Tratamentos A B C D 12 (2) 13 (3) 16 (4) 7 (1) 9 (3) 12 (4) 5 (1) 8 (2) 14 (2) 20 (3) 22 (4) 6 (1) 17 (3) 16 (2) 21 (4) 11 (1) 12 (2) 15 (3) 16 (4) 10 (1) T1 = 11 T2 = 14 T3 = 20 T4 = 5 Substituindo-se os valores na express˜o no teste. 2 2 2 Como HF r ∼ χ2 a (k−1) .5(4 + 1) 5. ent˜o HF r ∼ χ(4−1) ⇒ χ3. 82 e χ3. 04 (p-valor : 0. Ti2 − 3. tanto para α = 5% como para α = 1%. quando procede-se ` e a compara¸˜o de k amostras relacionadas ou dependentes cujas observa¸˜es apresentam valores ca co com acentuadas varia¸˜es e em cada tratamento s˜o constitu´ co a ıdos blocos. ca . logo verifica-se que h´ diferen¸a significativa entre as medidas dos ca a c tratamentos. Foram a e ca a formados cinco blocos e obtidos os seguintes valores: Tabela 6.6 Testes N˜o-Param´tricos a e ROSSI.14. portanto. 78 6.

: ausˆncia de les˜o hep´tica. 1 − pc Exemplo 6.m2 n2 po − pc . 8 ≤ k < 1 k=1 Concordˆncia a nenhuma leve moderada forte perfeita a+d n n1 .+ + + + : presen¸a de les˜o hep´tica c a a .7 Outros Testes N˜o-Param´tricos a e ROSSI.15. foi avaliado o grau de les˜o do tecido hep´tico. a 17 18 19 20 + + + - Com base nesses resultados. em 20 e a a cobaias `s quais foi administrada uma certa substˆncia t´xica. Em uma determinada experiˆncia. Robson M. 4 0. Os resultados dos exames efetuados por dois a a o patologistas foram o seguinte: Tabela 6.21: Teste Kappa Cobaia 1 2 Patologista 1 + + Patologista 2 + + para a concordˆncia entre patologistas quanto a 3 4 5 6 7 8 9 10 11 12 + + + + .+ + + + + .20: Concordˆncia entre o diagn´stico de dois especialistas.7. ´ poss´ construir a tabela abaixo: e ıvel .6. 4 ≤ k < 0.7 6. 79 6.1 Outros Testes N˜o-Param´tricos a e Teste de Concordˆncia ou de Replicabilidade (Coeficiente de Kappa) a O coeficiente de Kappa ´ utilizado para verificar a concordˆncia entre os diagn´sticos de dois especialistas. 8 0. e a a ao grau de les˜o do a 13 14 15 16 + + + - tecido hep´tico.20) abaixo: Tabela 6.m1 + n2 . a o Diagn´stico o Diagn´stico Especialista 1 o Total Especialista 2 Presente (+) Ausente (-) Presente (+) a (++) b (+-) n1 = a + b Ausente (-) c (-+) d (–) n2 = c + d Total m1 = a + c m2 = b + d n C´lculos auxiliares: a • Propor¸˜o de concordˆncia observada: ca a po = ca a • Propor¸˜o de concordˆncia casual: pc = • Coefficiente: Kappa = Classifica¸˜o: ca Kappa k=0 k < 0. e a o Observe a Tabela (6.+ + + .

atribui o escore 1 a cada “sucesso” e o escore 0 a cada “falha”. e ´ E uma extens˜o da prova de McNemar para a significˆncia de mudan¸as. 5 Kappa = = = 0. al´m disso. a o 6. k−1 G2 − j n k j=1 Gj i=1 Lj − i=1 L2 j Quando Q > χ2 a decis˜o a ser tomada ´ de rejei¸˜o de H0.22: Concordˆncia entre o diagn´stico de dois especialistas. cada unidade experimental ´ avaliada em rela¸˜o a mais de dois a e e ca tratamentos distintos.m2 15. + L2 n 1 2 j 2 Estat´ ıstica teste:  (k − 1)k  Q= k k j=1 n   ∼ χ2 . Posiciona os dados numa tabela CxI com C colunas.m1 + n2 . 5 2 2 n 20 400 po − pc 0. que correspondem ao n´mero k de tratamentos I u linhas. c˜ ıvel A prova de Cochran para k amostras relacionadas proporciona um m´todo para comprovar se trˆs ou e e mais conjuntos correspondentes de freq¨ˆncias ou propor¸˜es diferem entre si significativamente: ue co Os mesmos indiv´ ıduos s˜o observados sob condi¸˜es diferentes.. a o h´ perda de informa¸˜es. 5. 75 n 20 n1 . u Utiliza o somat´rio dos resultados correspondentes a cada grupo e os somat´rios dos escores de cada o o bloco. a o Diagn´stico o Diagn´stico Patologista 1 o Total Patologista 2 Presente (+) Ausente (-) Presente (+) 10 5 15 Ausente (-) 0 5 5 Total 10 10 20 Ent˜o temos: a a+d 10 + 5 = = 0. 5 po = Conclui-se que existe uma concordˆncia apenas moderada entre os diagn´sticos dos patologistas. + Ln L2 = L2 + L2 + .7 Outros Testes N˜o-Param´tricos a e ROSSI. + Gk Lj = L1 + L2 + . o que caracteriza a dependˆncia ou o pareamento das unidades amostrais.10 200 pc = = = = 0. a co Para escores ordinais dicotomizados. a e ca k−1 N˜o se conhece exatamente o poder da prova de Cochran.6.2 Teste de Cochran O teste de Cochran ´ utilizado quando as respostas do tratamento s˜o do tipo ”Sucesso” ou ”Insucesso”. o e a Quando se utiliza a prova de Cochran em dados que n˜o sejam nominais ou naturalmente dicotˆmicos. pois as provas param´tricas n˜o se aplicam a tais dados.. em que cada indiv´ ıduo ´ utilizado como seu pr´prio controle e e o a mensura¸ao se faz ao n´ de uma escala nominal ou ordinal. 80 Tabela 6. Grupo k j=1 Bloco n i=1 n i=1 Gj = G1 + G2 + .. 1 − pc 1 − 0. que coincidem com o n´mero de casos em cada um dos k tratamentos.7. a co .10 + 5. Particularmente ´ aplic´vel a a c e a aos planejamentos do tipo “antes e depois”. e a ”Alterado” ou ”N˜o alterado” e. a A no¸˜o de poder-eficiˆncia n˜o tem sentido quando se aplica a prova de Cochran a dados nominais ou ca e a naturalmente dicotˆmicos... 75 − 0.. Robson M.

7. reserva e cortesia. formalismo ´spero. Ter´ ıamos ent˜o 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (n = 18). cordialidade. e e H1 : As probabilidades de um “sim” diferem conforme o tipo de entrevista. aplicando aleatoriamente o tipo 1 de entrevista a um e grupo. o a Etapa 6: Como Q > χ2 cr´ ıtico (16.no total de respostas sim para entrevista 1 G2 = 13 . ıvel a Etapa 5: C´lculo da Estat´ a ıstica teste: Calculando os somat´rios dos resultados correspondentes a cada grupo e o somat´rio dos escores de cada o o bloco (Li ) temos: G1 = 13 . a Etapa 4: Estabelecendo os valores cr´ ıticos para gl = k − 1 = 3 − 1 = 2 e n´ de significˆncia = 0. 01. 7 > 9.no total de respostas sim para entrevista 3 ap´s c´lculos Q = 16. a Tabela 6. Desea jamos comprovar se as diferen¸as fundamentais nos tipos de entrevista influenciariam o n´mero de respostas c u afirmativas (“sim”) dadas a determinada pergunta. modo abrupto. Etapa 1: H0 : A probabilidade de um “sim” ´ a mesma para os trˆs tipos de entrevista. ent˜o rejeita-se H0 . Suponha que estejamos interessados em estudar a influˆncia da atitude de um entrevistador e sobre as respostas das donas de casa a determinada pesquisa de opini˜o. o tipo 3 ao terceiro grupo. entusiasmo. e a Resposta Resposta Resposta Conjunto Li a ` entrevista 1 a ` entrevista 2 ` entrevista 3 a 1 0 0 0 0 2 1 1 0 2 3 0 1 0 1 4 0 0 0 0 5 1 0 0 1 6 1 1 0 2 7 1 1 0 2 8 0 1 0 1 9 1 0 0 1 10 0 0 0 0 11 1 1 1 3 12 1 1 1 3 13 1 1 0 2 14 1 1 0 2 15 1 1 0 2 16 1 1 1 3 17 1 1 0 2 18 1 1 0 2 L2 i 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4 O entrevistador visitaria trˆs grupos de 18 casas.no total de respostas sim para entrevista 2 G3 = 3 . o tipo 2 a outro grupo. entrevista tipo 3 – demonstrando desinteresse.16.23: Influˆncia do pesquisador em pesquisas de opini˜o. Etapa 2: Estabelecendo o n´ de significˆncia: α = 0.7 Outros Testes N˜o-Param´tricos a e ROSSI. ıvel a Etapa 3: Estabelecendo a estat´ ıstica de teste: Q de Cochran porque os dados se referem a mais de dois grupos relacionados (k = 3) e se apresentam dicotomizados sob forma “sim” ou “n˜o”. ou seja. 2 e 3 de entrevista. entrevista tipo 2 – demonstrando formalismo. Robson M. 01 um valor de 9. 21. 21).6. ca . o n´mero de respostas “sim” a u difere significativamente em rela¸˜o aos tipos 1. 81 Exemplo 6. a Poderemos treinar um entrevistador para efetuar suas entrevistas de trˆs maneiras diferentes: entrevista e tipo 1 – demonstrando interesse.

ca o Tabela 6. por c Gen´tipo: 39. a Exerc´ ıcio 6. Comparar quatro t´cnicas de treinamento aplicadas a seis blocos de funcion´rios do setor de e a marca¸˜o de luz de uma empresa cinematogr´fica.stw ) O objetivo principal do trabalho foi o de investigar se existe diferen¸a entre os tratamentos: PCR. foram os que constam no quadro abaixo. 32.stw. Os resultados obtidos na escala de avalia¸˜o de desempenho.7 Outros Testes N˜o-Param´tricos a e ROSSI.1: Gr´fico para o teste de Cochran.5.24: Teste em funcion´rios do setor de marca¸ao de luz de uma empresa cinematogr´fica. aplicada ap´s o treinamento. 20 e 19 e por Fase: Aguda ou Crˆnica. Rea¸˜o em cadeia da polimerase (PCR) em sangue de camundongos infectados com clones ca de trypanosoma cruzi pertencentes a diferentes gen´tipos. ELISA. Cada bloco foi formado de modo que os quatro funcion´rios ca a a que o constitu´ ıam eram equivalentes em seu desempenho atual no cargo.6. HEMO e ESF de modo global (para toda a amostra).stw e Psi1 ex. o o Exerc´ ıcio 6.6.7. a c˜ a Tratamentos Blocos X1 Escore X2 Escore X3 Escore X4 Escore A 7 1 9 1 10 1 6 0 B 8 1 12 1 11 1 5 0 C 6 0 7 1 8 1 4 0 D 3 0 5 0 6 0 6 0 E 9 1 10 1 8 1 2 0 F 4 0 7 1 5 0 9 1 Total 3 5 4 1 Exerc´ ıcio 6. 82 Figura 6. o (Banco de dados: Analises Clinicas ex. Robson M. . leia as informa¸˜es e fa¸a o que se co c pede. Utilize o bancos de dados: Pediat ex.

7. e Por exemplo.1. A soma das r repeti¸˜es de um mesmo tratamento constitui o co co total desse tratamento. que exigem e e e a conhecimento de nota¸˜o. Outra explica¸˜o ´ o caso. O total geral ´ dado pela soma dos k totais de tratamentos. e 83 . todas com cinco elementos mas cada uma proveniente de uma popula¸˜o. em m´dia. alto. e co Para comparar m´dias de mais de duas popula¸˜es normais ou aproximadamente normais. Por exemplo. conduziram aos dados apresentados na Tabela 7. para verificar se pessoas e e co com diferentes n´ ıveis de renda. porque mesmo dados provenientes co ca e da mesma popula¸˜o variam. cada um com r repeti¸˜es (no exemplo. isto ´. Por que os dados variam? Uma explica¸˜o ´ o fato de e c˜ ca e as amostras provirem de popula¸˜es diferentes. apresenta os dados de k tratamentos. ´ preciso um teste estat´ e co a e ıstico.1 An´lise de Variˆncia para Experimentos ao Acaso a a Primeiro. e Amostras A B C D 11 8 5 4 8 5 7 4 5 2 3 2 8 5 3 0 8 5 7 0 x1 = 8 x2 = 5 x3 = 5 x4 = 2 ¯ ¯ ¯ ¯ Ser´ que as diferen¸as das m´dias das amostras s˜o suficientemente grandes para que se possa afirmar a c e a que as m´dias das popula¸˜es s˜o diferentes? Para responder a esta pergunta. ´ preciso estudar as causas de varia¸ao. se um pesquisador separa. ´ preciso e e e e e comparar m´dias de trˆs popula¸˜es. um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo. o mesmo peso corporal. ca O teste F ´ feito atrav´s de uma an´lise de variˆncia. devido `s amostras terem provindo de popula¸˜es diferentes) da variabilidade a co residual. e e co Outras vezes. Para aplicar o teste F ´ preciso fazer uma s´rie de c´lculos. ´ preciso comparar v´rias situa¸˜es experimentais.Cap´ ıtulo 7 An´lise de Variˆncia a a ` As vezes ´ preciso comparar m´dias de mais de duas popula¸˜es.2. devido ao acaso. ca Tabela 7. imagine que 4 amostras casuais simples. denominam-se co repeti¸˜es os elementos da mesma amostra). aplica-se o e co teste F. e a co ao acaso. ter´ que a comparar m´dias de quatro ”popula¸˜es”. isto ´. Neste caso conv´m verificar antecipadamente a normalidade dos dados. Por exemplo.1: Dados de 4 amostras e respectivas m´dias. m´dio e baixo tˆm. que separa a variabilidade devido aos “tratae e a a mentos” (no exemplo. ca A Tabela 7.

. dado pelo total geral elevado ao quadrado e dividido pelo n´mero de dados... ao n´ de significˆncia e ıvel a estabelecido e com (k − 1) graus de liverdade no numerador e (n − k) graus de liberdade no denominador. que as m´dias de tratamentos s˜o iguais. a e a . . xkr Tk r xk ¯ Total T = x n = kr Para fazer a an´lise de variˆncia ´ preciso calcular as seguintes quantidades: a a e 1. o valor de F F = SQT r k−1 SQR n−k T2 −C r x2 − C QM T r QM R Em seguida.. os graus de liberdade: (a) de tratamento: k − 1 (b) de total: n − 1 (c) de res´ ıduo: (n − 1) − (k − 1) = n − k u e 2.. Robson M.. a soma de quadrados total: SQT = 3.. ´ preciso comparar o valor calculado de F com o valor tado em tabela. . Toda vez que o valor calculado de F for maior ou igual do que o da tabela conclui-se.. O valor C ´ chamado corre¸ao. c˜ ( x)2 C= n 3. x12 x22 x32 .. a soma de quadrados de res´ ıduos: SQR = SQT − SQT r 5. No de repeti¸˜es r co r r . o valor C. x11 x21 x31 . o quadrado m´dio de tratamentos: e QM T r = 6. M´dia e x1 ¯ x2 ¯ x3 ¯ de variˆncia. a k xk1 xk2 . o quadrado m´dio de res´ e ıduo: QM R = 7.. 84 Tabela 7. x1r x2r x3r Total T1 T2 T3 .1 An´lise de Variˆncia para Experimentos ao Acaso a a ROSSI. a soma de quadrados de tratamentos: SQT r = 4.7. .2: Nota¸˜o para a an´lise ca a Tratamentos 1 2 3 . ao n´ ıvel de significˆncia estabelecido.. .

7.1

An´lise de Variˆncia para Experimentos ao Acaso a a

ROSSI, Robson M. 85

Exemplo 7.1. Para os dados apresentados na Tabela 7.1, proceder uma an´lise de variˆncia para verificar a a se existe diferen¸a significativa entre os tratamentos. c 1. os graus de liberdade: (a) de tratamento: k − 1 = 4 − 1 = 3 (b) de total: n − 1 = 20 − 1 = 19 (c) de res´ ıduo: (n − 1) − (k − 1) = n − k = 20 − 4 = 16 2. o valor C: C= 3. a soma de quadrados total: SQT = x2 − C = 112 + 82 + ... + 02 − 500 = 658 − 500 = 158 ( (11 + 8 + ... + 0)2 x)2 = = 500 n 20

3. a soma de quadrados de tratamentos: SQT r = T2 402 + 252 + 252 + 102 −C = − 500 = 590 − 500 = 90 r 5

4. a soma de quadrados de res´ ıduos: SQR = SQT − SQT r = 158 − 90 = 68 5. o quadrado m´dio de tratamentos: e QM T r = 6. o quadrado m´dio de res´ e ıduo: QM R = 7. o valor de F F = SQT r 90 = = 30 k−1 3

SQR 68 = = 4, 25 n−k 16 QM T r = 7, 06 QM R

As quantidades calculadas s˜o apresentadas numa tabela de an´lise de variˆncia. Veja a Tabela 7.3: a a a Tabela 7.3: An´lise de variˆncia dos dados da Tabela 6.1. a a Causas da varia¸˜o GL SQ QM ca F p Tratamentos 3 90 30 7,06 0,003086 Res´ ıduo 16 68 4,25 Total 19 158 Ao n´ ıvel de significˆncia de 5%, o valor de F tabelado, com 3 e 16 graus de liberdade (numerador e a denominador, respectivamente), ´ de 3,24. Como o valor obtido ´ maior do que 3,24, conclui-se que as e e m´dias n˜o s˜o iguais, ao n´ de significˆncia de 5%. e a a ıvel a

7.2

Teste Param´trico para Compara¸˜es M´ ltiplas e co u

ROSSI, Robson M. 86

7.2
7.2.1

Teste Param´trico para Compara¸oes M´ ltiplas e c˜ u
Teste Tukey

Uma an´lise de variˆncia permite estabelecer se as m´dias das popula¸˜es em estudo s˜o, ou n˜o s˜o, estaa a e co a a a tisticamente iguais. No entanto, esse tipo de an´lise n˜o permite detectar quais s˜o as m´dias estat´ a a a e ısticamente diferentes das demais. Por exemplo, a an´lise de variˆncia apresentada na Tabela 6.3 mostrou que as m´dias a a e das popula¸˜es n˜o s˜o iguais, mas n˜o permite concluir que ´, ou quais s˜o, as m´dias diferentes das demais. co a a a e a e O teste de Tukey permite estabelecer a diferen¸a m´ c ınima significante (d.m.s), ou seja, a menor diferen¸a c de m´dias de amostras que deve ser tomada como estatisticamente significante, em determinado n´ e ıvel. Essa diferen¸a (d.m.s) ´ dada por: c e QM R d.m.s = q. r onde q ´ um valor dado em tabela, QMR ´ o quadrado m´dio do res´ e e e ıduo da an´lise de variˆncia e r ´ o a a e n´mero de repeti¸˜es de cada tratamento. u co Considere agora os dados da Tabela 7.1. A an´lise de variˆncia apresentada na Tabela 7.3 mostra um a a valor F significante ao n´ de 5%. Ent˜o as m´dias de A, B, C e D n˜o s˜o estat´ ıvel a e a a ısticamente iguais. Mas qual ´, ou quais s˜o, as m´dias diferentes entre si? e a e A pergunta pode ser respondida com a aplica¸˜o do teste de Tukey. Ao n´ ca ıvel de significˆncia de 5%, a o valor de q para comparar 4 tratamentos (A,B, C e D), com 16 graus de liberdade no res´ ıduo, ´ de 4,05. e Como QMR = 4,25 e r = 5, segue-se que: d.m.s = 4, 05. 4, 25 = 3, 73. 5

De acordo com o teste de Tukey, duas m´dias s˜o estatisticamente diferentes toda vez que o valor absoluto e a da diferen¸a entre elas for igual ou superior ao valor da d.m.s. No caso do Exemplo, o valor da d.m.s. ´ 3.73 c e ´ a e os valores absolutos das diferen¸as entre as m´dias est˜o apresentados a seguir. E f´cil ver que a diferen¸a c e a c entre as m´dias A e D ´ maior do que a d.m.s. Ent˜o, ao n´ de 5%, a m´dia de A ´ significativamente e e a ıvel e e mair do que a m´dia de D. e Tabela 7.4: Compara¸˜es entre as m´dias via Tukey. co e Pares de m´dias Valor absoluto da diferen¸a e c AeB |8 − 5| = 3 AeC |8 − 5| = 3 AeD |8 − 2| = 6 BeC |5 − 5| = 0 BeD |5 − 2| = 3 CeE |5 − 2| = 3

7.2

Teste Param´trico para Compara¸˜es M´ ltiplas e co u

ROSSI, Robson M. 87

Exemplo 7.2. Com base nos dados apresentados na Tabela 7.5 abaixo, verifique se existe diferen¸a estat´ c ıstica entre os grupos. Note que s˜o trˆs grupos em compara¸˜o. No grupo operado foi feita a remo¸˜o das glˆndulas a e ca ca a salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cir´rgicos, mas nenhuma u glˆndula foi removida (Banco de dados: Tukey1 ex.stw). a Tabela 7.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias, segundo o grupo. Grupo Operado Pseudo-operado Normal 96 90 86 95 93 85 100 89 105 108 88 105 120 87 90 110,5 92,5 100 97 87,5 95 92,5 85 95 Sol.: A tabela de an´lise de variˆncia resume os c´lculos: a a a Tabela 7.6: ANOVA para a taxa de glicose. Causas da varia¸˜o GL ca SQ QM F p Grupos 2 717,25 358,625 6,73 0,005509 Res´ ıduo 21 1118,75 53,274 Total 23 1836,00 Para aplicar o teste de Tukey ao n´ de significˆncia de 5%, tem-se: ıvel a q3;21 e d.m.s. = 3, 57 53, 247 = 9, 21. 8 3, 57

Os valores absolutos das diferen¸as de m´dias est˜o apresentados na Tabela (7.7). c e a Tabela 7.7: Compara¸oes para as taxas m´dias de c˜ e Pares de m´dias e Valor absoluto da diferen¸a c Operado vs pseudo |102, 375 − 89, 0| = 13, 375 Operado vs normal |102, 375 − 95, 125| = 7, 25 Pseudo vs normal |89, 000 − 92, 125| = 6, 125 glicose. p 0,0004 0,1403 0,2368

A taxa de glicose ´, em m´dia, maior nos operados do que nos pseudo-operados, ao n´ de significˆncia e e ıvel a de 5.

respectivamente. QM R : proveniente da ANOVA (Quadrado M´dio dos Res´ e ıduos)..08 (p-valor = 0. todas em rela¸˜o e u co ca a um unico grupo denominado “Controle”. estabelecida pelo teste Dunnett e (espec´ ıfico para este caso) ser´: a d. .2.m. Deseja-se comparar o efeito de cinco drogas na diminui¸ao da press˜o arterial.(k−1). 25 5 .m. Tabela 7. k − 1 : µi = µc c: controle O procedimento de Dunnett ´ an´logo ao teste t. mas modificado. 30 indiv´ ıduos participaram no experimento. ni : no de observa¸˜es do tratamento i.f . ¯ ¯ e Exemplo 7.17 470.. A d. Neste caso.8: Diminui¸ao da press˜o arterial.s = d. Ao todo. e a d. tem-se: o a a Tabela 7.17 Como o valor de F apresentado ´ de 13. x ¯ QM R. Robson M. segundo o tratamento. co xi e xc : m´dias.000003 Res´ ıduo 24 864 36 Total 29 3218. ´ razo´vel e e ıvel e a procurar um teste para comparar as m´dias dos tratamentos.QM R = 2. 2. Para isto c˜ a utilizou-se cinco grupos distintos e foram comparadas suas m´dias em rela¸˜o a m´dia de um grupo controle. rejeitamos H0 se: ıvel c |¯i − xc | > dα.000003) ´ significante ao n´ de 5%. e u co Considerando um n´ de confian¸a α. u Causas da varia¸˜o GL ca SQ QM F p Grupos 5 2354.f est´ tabelado (Tabela Dunnett) para k − 1 comara¸˜es e f : no de observa¸˜es dos tratamentos co (exceto o controle).36 = 10.9: ANOVA para os dados de press˜o arterial.m. A Tabela abaixo apresenta os valores referentes a diferen¸a entre a press˜o arterial no in´ c a ıcio e no fim do experimento (mmHg).s = d.7.s.08 0. em mil´ c˜ a ımetros de merc´rio.2 Teste Param´trico para Compara¸˜es M´ ltiplas e co u ROSSI.. ´ e Teremos (k − 1) compara¸˜es a serem realizadas em rela¸˜o ao controle e queremos testas as seguintes co ca hip´teses: o H0 Ha : µi = µc i = 1. 1 1 + ni nc onde: a co dα.2 Teste Dunnett Em muitos experimentos. o test Dunnett (1964) ´ apropriado. em mil´ a ımetros de merc´rio.(k−1). e ca e que recebeu placebo. 2. ´ comum a necessidade de se realizar m´ltiplas compara¸˜es. do tratamento e controle. u Tratamento A B C D E Controle 25 10 18 23 11 8 17 -2 8 29 23 -6 27 12 4 25 5 6 21 4 14 35 17 0 15 16 6 33 9 2 Ap´s a an´lise de variˆncia. 88 7.3.QM R r onde r ´ o n´mero de repeti¸˜es. segundo o tratamento. 2. co nc : no de observa¸˜es do controle.83 13. 70 r 2.

Rejeitamos H0 . u a Decis˜o: Se o n´mero 0 n˜o pertencer ao IC.032024 ´ E facil observar que os tratamentos A. a um n´ de significˆncia de 1%. 25 Press˜o arterial.m. = Z1− 2Q N (N + 1) 12 1 1 + ni nj onde k(k − 1) . Robson M. resultados melhores que os do e controle. 25 D vs Controle |29 − 2| = 27 > 10. ıvel 7. 25 E vs Controle |13 − 2| = 11 > 10.7. 29. 15. ao n´ de 5%.s. 35. Grupo III (sexo) 23.3 Teste N˜o-Param´trico para Compara¸˜es M´ ltiplas a e co u ROSSI.10: Compara¸˜es entre as m´dias dos dados de co e Pares de m´dias Valor absoluto da diferen¸a e c A vs Controle |21 − 2| = 19 > 10. c . e Desta forma teremos: Tabela 7.s. desejamos saber entre quais.s. 2 Intervalo de Confian¸a via Dunn-Bonferroni para os contrastes: c Q= IC(1 − α)% = (Mi − Mj ) ± d. Tabela 7. D e E apresentam.m.11: Tempo de percurso de Grupo I (comida) 30.3 7.11. 18. 70 ´ proveniente da Tabela Dunnett com 24 graus de liberdade. do labirinto. 31 27. 89 Obs. 25 C vs Controle |10 − 2| = 8 < 10. um rato at´ sair e 33. 21.1 Teste N˜o-Param´trico para Compara¸˜es M´ ltiplas a e co u Teste Dunn-Bonferroni Analogamente ao processo do Teste de Tukey para comparar tratamentos atrav´s de parˆmetros popue a lacionais como a m´dia. a Exemplo 7. representam tempos em segundos que cada a rato precisou para sair de um labirinto de pesquisa. O valor d = 2. Grupo II (´gua) a 28. em m´dia.4.162730 0. a p 0. 34 26 20 Desejamos saber se existe evidˆncia suficiente para afirmar. que existe e ıvel a diferen¸a entre os grupos.) para os contrastes (em pares): α d. Os resultados mostrados na Tabela 7. ´gua e sexo. Deseja-se comparar 3 Grupos.392329 0. e Hip´teses a serem testadas: o H0 Ha : Mi = Mj (m´dias) e : Mi = Mj .3.m. e se houver.000182 0. para algum i = j.000007 0. 25. A diferen¸a m´ c ınima significativa (d. o M´todo de Dunn-Bonferroni pode ser utilizado para o caso N˜oe e a Param´trico. por exemplo. de 15 ratos (5 cada) em trˆs tipos de incentivos distintos: e comida. 25 B vs Controle |8 − 2| = 6 < 10.

95. 18.12: Postos do tempo de percurso de Tratamento xi Grupo I (comida) 12 13 11 15 Grupo II (´gua) a 9 6 10 8 Grupo III (sexo) 5 4 2 1 A estat´ ıstica teste: HK−W = = = = k T2 12 i .: a k(k − 1) 3(3 − 1) Q= = =3 2 2 assim. ser´ o de determinar qual(is) pares de tratamentos (contrastes) ocasionaram esta a rejei¸˜o. 35 : (−3. 83) = 8. e Ti = xi ni xi ¯ 14 65 5 13 7 40 5 8 3 15 5 3 (0. 35) ˆ L2 = x1 − x3 = 10 10 ± 8. a c ROSSI. as ratas tendem a correr mais para sair do labirinto.: Utilizando o teste de Kruskal-Wallis para k provas. podemos concluir que os tratamentos ˆ 2 : motiva¸˜o pela comida e motiva¸˜o sexual.m.13: Contrastes para os dados de tempo de percurso de um rato at´ sair do labirinto. Isto que diferem significativamente s˜o dados pelo contraste L a ca ca ´.s. e a . 35 : (1. a u a ˆ ˆ Observando que o 0 (zero) pertence somente aos IC de L1 e L3 . a a c : h´ diferen¸a significativa entre os tratamentos. 12. 13. 5 652 + 402 + 152 5 − 48 2 como H ∼ χ2 (k−1) ⇒ χ(1%. e sendo HK−W = 12.2) = 7. 35 Contrastes: Tabela 7. 38. 13. Rejeitamos H0 . quando estimuladas ` comida e ao sexo. 38.(2. O passo seguinte. temos a Tabela 7. Rejeita-se H0 .m.12 com os postos das observa¸˜es. e Contraste IC(1 − α)% ˆ L1 = x1 − x2 = 5 ¯ ¯ 5 ± 8. Robson M. = Z1− 0. 98. − 3(15 + 1) 15(15 + 1) i=1 5 um rato at´ sair do labirinto. 05). 5 > 7.01 2.s.3 15(15 + 1) 12 1 1 + 5 5 = 2.7. co Tabela 7. − 3(N + 1) N (N + 1) i=1 ni 3 T2 12 i . 35 : (−3.3 Teste N˜o-Param´trico para Compara¸˜es M´ ltiplas a e co u Hip´teses: o H0 Ha : n˜o h´ diferen¸a significativa entre os tratamentos. 90 Sol. 35) ¯ ¯ ˆ L3 = x2 − x3 = 5 ¯ ¯ 5 ± 8. 66. ca C´lculo do d. 98. d. 35) Decis˜o: Se o n´mero 0 n˜o pertencer ao IC.

´ poss´ conduzir a an´lise de variˆncia. x1r x2r x3r xkr Total T1 T2 T3 . Robson M. primeiro observe a Tabela 7.4 An´lise de Variˆncia com N´ mero Diferente de Repeti¸˜es a a u co Muitas vezes o pesquisador disp˜e de diversas amostras. Para entender como se calcula a soma de quadrados de tratamentos quando os tratamentos n˜o tˆm o a e mesmo n´mero de repeti¸˜es. u co Tabela 7... mas o ca essas amostras n˜o tˆm todas o mesmo tamanho. xk1 x12 x22 x32 .. com exce¸˜o da soma de quadrados de tratamentos.14: Nota¸˜o para a an´lise de variˆncia com diferentes repeti¸˜es.7.. s˜o feitos na forma j´ apresentada a a ca a a anteriormente.4 An´lise de Variˆncia com N´ mero Diferente de Repeti¸˜es a a u co ROSSI.. . ca a a co Tratamentos 1 2 3 .14.. a ca o e .. todos os c´lculos... xk2 .. k Total x11 x21 x31 . 91 7. . cada uma proveniente de uma popula¸˜o. rk M´dia e x1 ¯ x2 ¯ x3 ¯ xk ¯ A soma de quadrados de tratamentos ´ dada pela f´rmula: e o SQT r = 2 T1 T2 T2 + 2 + . Tk T = x No de repeti¸˜es r1 n = kr co r2 r3 . . a e e ıvel a a Ali´s.. Mesmo assim. + k − C r1 r2 rk onde C ´ a corre¸˜o j´ definida anteriormente.. . . e ca a ´ E mais f´cil entender a aplica¸˜o de f´rmulas atrav´s de um exemplo.

An´lise de variˆncia para os dados da Tabela 7.l. 96 QM R 8. 00 5. a soma de quadrados de tratamentos: SQT r = 842 762 852 T2 −C = + + − 4001.89. o quadrado m´dio de res´ e ıduo: QM R = 7. 33 = = 31. o valor de F tabelado ´ de 3.15. 67 k−1 2 96 SQR = = 8. o valor de F F = SQT r 63.96. as f´rmulas para a diferen¸a m´ ca o c ınima significante ficam como segue: .16. 92 Exemplo 7. 33 r 6 4 5 4.5. menor do que 3. 00 n−k 12 QM T r 31. + 162 − 4001. 67 = 159.4 An´lise de Variˆncia com N´ mero Diferente de Repeti¸˜es a a u co ROSSI.. Robson M. o valor C: C= 3. com 2 e 12 g. e Os m´todos de compara¸˜o de m´dias apresentados anteriormente tamb´m podem ser usados quando o e ca e e a u co n´mero de repeti¸˜es por tratamento n˜o ´ constante.. o quadrado m´dio de tratamentos: e QM T r = 6.. a a Tabela 7. a soma de quadrados de res´ ıduos: SQR = SQT − SQT r = 159.. + 16)2 = = 4001.15: Dados de 3 amostras e respectivas m´dias.7. 67 n 15 3. 33 ( x)2 (15 + 10 + . 33 = 96. a soma de quadrados total: SQT = x2 − c = 152 + 102 + .. 00 Os valores calculados est˜o apresentados na Tabela 7. 33 − 63. Se ri e rj s˜o o n´mero de repeti¸˜es dos tratamentos u co a e em compara¸˜o. 67 = = 3. 67 = 63. e Amostras A B C 15 23 19 10 16 15 13 19 21 18 18 14 15 16 13 x1 = 84 x2 = 76 x3 = 86 ¯ ¯ ¯ 1. a Ao n´ ıvel de significˆncia de 5%. a e conclui-se que as m´dias diferem entre si. os graus de liberdade: (a) de tratamento: k − 1 = 3 − 1 = 2 (b) de total: n − 1 = 15 − 1 = 14 (c) de res´ ıduo: (n − 1) − (k − 1) = n − k = 15 − 3 = 12 2.

pode-se aplicar o teste de Tukey que.m.67 3. 77 Para comparar A com C. Como o valor c e a a absoluto da diferen¸a entre A e B ´ maior do que a respectiva d. = 3. A difere de c e e B. ao n´ de significˆncia de 5%.m.m. = 3.96 Res´ ıduo 12 96 8 Total 14 159. 2 1 1 + 6 5 8 = 4. neste caso.7.s. = 3. porque os tratamentos tˆm n´meros diferentes de repeti¸˜es.16: An´lise de variˆncia.s.. 2 1 1 + 6 4 8 = 4. 57. 93 Tabela 7. tem-se: d.04784 7.2272 BeC |19 − 17| = 2 0. = q 1 1 + ri rj QM R 2 onde ri ´ o n´mero de repeti¸˜es do i-´simo tratamento e rj ´ o n´mero de repeti¸˜es do j-´simo tratamento.s.33 p 0.4. Robson M.1 Teste Tukey Para comparar as m´dias de tratamentos duas a duas.m. tem-se: d. 77 1 1 + 4 5 8 = 5. 87. conclui-se que.m.33 31.) ´ dada pela f´rmula: e o d. a a Causas da varia¸˜o GL ca SQ QM F Tratamentos 2 63. para comparar a m´dia de A com a m´dia de e e B. e u co e e u co e No caso do Exemplo anterior com dados na Tabela 7. em m´dia. ıvel a Tabela 7. ´ e e aproximado. 77 Para comparar B com C.s.s. co e Pares de m´dias Valor absoluto da diferen¸a e c p AeB |14 − 19| = 5 0.17: Comapara¸˜es entre m´dias.0443* AeC |14 − 17| = 3 0.5589 .15.m. tem-se: d.s.4 An´lise de Variˆncia com N´ mero Diferente de Repeti¸˜es a a u co ROSSI. A diferen¸a m´ e u co c ınima significativa (d. 2 Os valores absolutos das diferen¸as entre as m´dias est˜o s˜o apresentados a seguir. 06.

94 7. pode optar pelo teste t ou pelo teste Duncan (N˜o apresentado neste e a a material-Ver Vieira.7.) ´ dada pela f´rmula: e o d.m. fica aqui um alerta: todos os procedimentos para a compara¸˜es de m´dias tˆm co e e vantagens e desvantagens. ent˜o.) ´ dada pela f´rmula: e o d.s.s.de efeitos colaterais desconhecidos . muitas vezes s´ ´ razo´vel indicar uma nova droga . Estes dois testes tˆm caracter´ e ısticas similares.3 Teste Dunnett A diferen¸a m´ c ınima significativa (d. Entretanto. Esta situa¸˜o pode ocorrer ıvel a ca quando se comparam novas drogas terapˆuticas com uma droga conhecida.quando a o e a existem indica¸˜es seguras de que essa nova droga ´ melhor do que a convencional.m. e Ent˜o. o e a c deve optar pelo teste de Tukey ou de Dunnett. Estes testes a teriam. o teste de Tukey a 10% tem maior poder do que o teste de Tukey a a 5%.m. Por exemplo.2 Teste t A diferen¸a m´ c ınima significativa (d. e talvez por isso. Toda droga tem efeitos colaterais. com baixo n´ de significˆncia. a . Tamb´m ´ de aplica¸˜o mais f´cil. mas o teste t ´ mais antigo e. o pesquisador tamb´m pode e e ca a e optar por aplicar o teste de Tukey ou de Dunnett. maior poder. 1999).s.4 An´lise de Variˆncia com N´ mero Diferente de Repeti¸˜es a a u co ROSSI. mais conhecido. = t 1 1 + ri rj QM R 7. Se o pesquisador quer ter alta chance de rejeitar H0 : de que as m´dias s˜o iguais. co e De qualquer forma.s. Um pesquisador que pretende somente rejeitar a hip´tese de que as m´dias s˜o iguais com muita confian¸a. Robson M. com n´ ıvel de significˆncia mais elevado. = d 1 1 + ri rj QM R Considera¸˜es co A escolha apropriada de um teste ´ muito flex´ e ıvel.m.4.4. Ainda n˜o existe um teste definitivamente “melhor” que todos os outros.

o e Freq¨ˆntemente. O ue ´ a e ideal seria que. recebem nomes especiais: a 95 . e ıvel e por exemplo: a presen¸a de uma doen¸a ap´s a observa¸˜o de um teste positivo. Para chegar ao diagn´stico. al´m de considera¸˜es cl´ o e co ınicas. o conhecimento de medidas que caracterizam a sua qualidade intr´ ınsica: a sensibilidade. Um dos objetivo deste cap´ ıtulo ´ mostrar como se mede o n´ de certeza da ocorrˆncia de um evento. interessa conhecer duas probabilidades condicionais. a especificidade e os parˆmetros que refletem a a sua capacidade de produzir decis˜es cl´ o ınicas corretas: Valor da Predi¸˜o Positiva e o Valor da Predi¸˜o ca ca Negativa. Os e a e e ca o objetivos s˜o v´rios. 8.2 Testes Diagn´sticos o O bom uso de um teste diagn´stico requer.Cap´ ıtulo 8 Testes Cl´ ınicos 8. um unico teste n˜o ´ suficiente. o diagn´stico de doen¸as e o acompanhamento ou a a o c progn´stico da evolu¸˜o de um paciente. fossem determinados os testes a serem inclu´ ıdos no processo diagn´stico o e a melhor forma de combin´-los. que a o por suas importˆncias. para cada patologia. Na an´lise da qualidade de testes diagn´sticos. e portanto deve-se combinar dois ou mais testes. a c e c Estudaremos os ´ ındices nos quais o conceito de qualidade de um teste diagn´stico ´ usualmente desmenbrado. c c e N˜o existe teste perfeito. o m´dico considera v´rias possibilidades. incluindo a triagem de paciente. o ca o e a com n´ ıveis de certeza que variam de acordo com as informa¸˜es dispon´ co ıveis. Apresentaremos as formas mais comuns de combina¸˜es de testes e como a co medir a qualidade do teste conjunto. aquele que com certeza absoluta determina a presen¸a ou ausˆncia da doen¸a.1 Introdu¸˜o ca Uma das experiˆncias mais rotineiras da pr´tica m´dica ´ a solicita¸˜o de um teste diagn´stico. Consideraremos o teste c c o ca positivo quando indicar a presen¸a da doen¸a e negativo quando indicar a ausˆncia.

c+d n2 o c Exemplo 8. a a a De acordo com a Tabela 8. O teste foi considerado positivo quando se observou mais de 1 mm de c depress˜o ou eleva¸˜o do segmento ST.1. Al´m. Tabela 8. denotada por s. o teste ´ ca a c e e espec´ ıfico para a doen¸a em quest˜o. Diagn´stico de doen¸a coronariana. a rea¸˜o do teste em pacientes n˜o portadores da doen¸a.1. ca a e Fator Total Doen¸a c Presente Ausente Presente a b n1 = a + b Ausente c d n2 = c + d Total m1 = a + c m2 = b + d n = n1 + n2 os ´ ındices s e e s˜o estimados por: a s= e e= a a = a+b n1 d d = . ´ definida como a probabilidade de o teste ser negativo dado que o e paciente examinado n˜o ´ doente: a e e = Pr(T− |D− ) Os nomes s˜o descritivos: sensibilidade mede a capacidade de rea¸˜o do teste em um paciente doente a ca enquanto que especificidade. o e sintetiza os resultados encontrados. O diagn´stico definitivo foi feito atrav´s de angiografia (gold). Tabela 8. 740.2. um teste diagn´stico que sempre produz e a o resultados corretos. por no m´ a ca ınimo 0.1: Distribui¸˜o quanto ` ocorrˆncia de um evento. Robson M. estamos assumindo a existˆncia de um padr˜o ouro (gold-standart). 96 8. isto ´. ou seja.7%. A Tabela 8. c a A an´lise da defini¸˜o desses dois ´ a ca ındices (s e e) mostra que. subjacentemente a estes conceitos. 797 1023 tolerˆncia a exerc´ a ıcios em 1465 Total 1023 442 1465 327 = 0.08 s. Wiener et al.2: Resultados da avalia¸˜o da aplica¸˜o do teste ergom´trico de ca ca e pacientes. disso assumimos que os pacientes s˜o classificados apenas como doentes e n˜oe a a doentes n˜o se admitindo est´gios intermedi´rios. e e= . 442 O teste ergom´trico tem uma sensibilidade de 79.2. denotada por e. ligeiramente superior que sua especificidade (74%). ´ definida como a probabilidade de o teste ser positivo dado que o paciente e examinado ´ doente: e s = Pr(T+ |D+ ) A especificidade. em compara¸˜o com os resultados obtidos ca com o paciente em repouso.8. compararam os resultados do teste ergom´trico de tolerˆncia a exerc´ e a ıcios entre indiv´ ıduos com e sem doen¸a coronariana.1 Sensibilidade e Especificidade A sensibilidade.2 Testes Diagn´sticos o ROSSI. Doen¸a c Teste ergom´trico e Coronariana Positivo (T+ ) Negativo (T− ) Presente (D+ ) 815 208 Ausente (D− ) 115 327 Total 930 535 A sensibilidade e a especificidade s˜o estimadas por: a s= e 815 = 0.

02 × 0. antes de qualquer informa¸˜o. ps + (1 − p)(1 − e) De forma an´loga. tem uma limita¸˜o s´ria: n˜o ajudam a decis˜o da equipe m´dica que.2 Testes Diagn´sticos o ROSSI. e .43%. 797 + (1 − 0. considerando-se os ”verdadeiros-negativos” obtemos o valor da predi¸˜o negativa a ca V PN = (1 − p)e . ap´s o ca c o resultado do teste negativo esta chance ´ de apenas 0. ca a o Exemplo 8. 97 8. 02) × 0. a chance de n˜o haver uma doen¸a coron´ria ´ de 99. Diagn´stico de doen¸a coronariana (Continua¸˜o). uma estimativa da prevalˆncia da doen¸a na o e c popula¸˜o de interesse. a A maneira mais f´cil de se calcular o VPP e o VPN ´ atrav´s das f´rmulas sugeridas por Vecchio (1966). o valor de predi¸˜o positiva ´ baixo enquanto que o valor de predi¸˜o negativa ´ bastante alto. 0. o c ca Para uma popula¸˜o cuja prevalˆncia de doen¸a coronariana ´ de 2%. Da´ a necessidade a o a o e ı destes dois outros ´ ındices que refletem melhor a realidade pr´tica. ca e ca e Se o resultado da ergometria for negativo. precisa avaliar se o paciente est´ ou n˜o doente. ca ca definidos respectivamente por: V P P = Pr [D+ |T+ ] e V P N = Pr [D− |T− ] . Estas s˜o probabilidades de resultados corretos de diagn´stico. N˜o se pode a a a depender apenas da sensibilidade e da especificidade. o paciente tinha uma chance de 2% de apresentar a doen¸a. 89%. Neste momento. p(1 − s) + (1 − p)e Ambas as express˜es dependem do conhecimento de p. 797 V PN = = 99. o que n˜o acontece no consult´rio m´dico. Estes a e valores s˜o probabilidades condicionais. 797 = 5. aquele que na a e pr´tica acontece primeiro. interessa mais conhecer a os seguintes ´ ındices denominados valor da predi¸˜o positiva (VPP) e valor da predi¸˜o negativa (VPN). c e O valor de predi¸˜o positiva ´ obtido dividindo-se a freq¨ˆncia dos ”verdadeiros-positivos” (oriundos de ca e ue pacientes doentes). 797 Portanto. a probabilidade do paciente n˜o estar doente quando o resultado do teste ´ negativo. VPP ´ a probabilidade do paciente estar realmente doente quando o resultado do teste ´ e e positivo e VPN. 02) × 0. isto ´. tal que o evento condicionante ´ o resultado do teste. a e e o Tabela 8.2 Valor das Predi¸˜es: VPP e VPN co A sensibilidade e a especificidade.8. 02)(1 − 0. pelo total de positivos V PP = ps . embora sendo ´ ındices ilustrativos e bons sintetizadores das qualidades gerais de um teste. a c a e Se. 34%. Popula¸˜o Propor¸˜o ca ca Propor¸˜o com resultado ca Positivo Negativo Doente p ps p(1 − s) Sadia 1−p (1 − p)(1 − e) (1 − p)e Total p + (1 − p) ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e Seja p = Pr(D+ ) a prevalˆncia da doen¸a na popula¸˜o de interesse. 74) + (1 − 0. recebendo um ca e a a e paciente com resultado positivo do teste. 02 × (1 − 0.3: Probabilidade necess´rias para o c´lculo dos ´ a a ındices VPP e VPN. Robson M. Em palavras. os valores de predi¸˜o do teste ca e c e ca ergom´trico s˜o: e a 0.2. 74) e (1 − 0.2. a propor¸˜o de pessoas e c ca e ca doentes. pois estes ´ ındices s˜o provenientes de uma situa¸˜o a ca em que h´ certeza total sobre o diagn´stico. V PP = 0.9934).66% (1-0. ou a probabilidade de doen¸a pr´-teste. 02 × 0.

65 99.23 0.4: Valores da VPP.01 1/50 90.00 1/10. decis˜es incorretas baseadas e o no teste diagn´stico.47 99. Por outro lado.01 1/500 48. pouqu´ ca e ıssimos n˜o doentes deixar˜o de ser detectados e. 98 8.54 100.46 0.89 9. respectivamente. ao ”falso-positivo” e ao ”falso-negativo”. a primeira a se difundir no Brasil foi o a c ELISA (Enzymelinked immunosorbent assay). a a portanto. Isto sugere um cuidado b´sico: um resultado positivo dever ca e a ser reconfirmado atrav´s de teste baseado em tecnologia diferente do ELISA. Em 1985 esta foi simultaneamente comercializada por v´rios a laborat´rios americanos.99 67. Os ca ıs. este ´ considerado positivo se os dois testes individuais s˜o positivos. ca Prevalˆncia VPP(%) VPN(%) PFP(%) PFN(%) e 1/100.79 0.000 4. Robson M. Formas de Combina¸˜o de Testes ca As maneiras mais simples de se formar um teste m´ltiplo a partir dos resultados de dois testes s˜o os u a esquemas em paralelo e em s´rie. este ´ muito caro ou oferece grande risco e/ou desconforto ao paciente.53 0.01 1/200 70.77 99. para o diagn´stico de certa doen¸a dispomos apenas de testes com VPP ou VPN baixo o c ou.000 32. A a ca u e ca associa¸˜o de testes eleva a qualidade do diagn´stico.2. PFP e PFN para o teste ELISA para a detec¸˜o do HIV.4 mostram que em um programa de uso do teste em larga escala.8. Nestas e circunstˆncias. Alguns detalhes podem ser encontrados em Hirsh & Rielgelman (1996). Teste ELISA para detec¸˜o do HIV. e e e e a . aquele composto pela agrega¸˜o de dois ou mais testes individuais.00 99. Alguns deles reportaram.4 apresenta os valores dos ´ ındices VPP e VPN para a implementa¸˜o do teste ELISA e v´rios ca a supostos valores da prevalˆncia. o Uma dificuldade com rela¸˜o ` estes ´ ca a ındices ´ que muitos autores admitem.4 Combina¸˜o de Testes Diagn´sticos ca o Muitas vezes.47 100.99 1725 0. e Exemplo 8.00 95. e Tabela 8. diminuindo o n´mero de resultados incorretos. grande parte dos pacientes com resultado positivo consiste na realidade de falsos-positivos. em seus testes preliminares.99 29.8%. se existe um bom teste. Nada justifica esta hip´tese.3 Decis˜es Incorretas: PFP e PFN o P F P = Pr [D− |T+ ] = 1 − Pr [D+ |T+ ] = 1 − V P P As probabilidades e P F N = Pr [D+ |T− ] = 1 − Pr [D− |T− ] = 1 − V P N referem-se. Este procedimento se usado sistematicamente.75 99. u ca Restringiremos ao caso de apenas dois testes e as id´ias apresentadas a seguir podem ser estendidas para o e caso de mais de dois testes. e c e resultados da Tabela 8.00 1/1. o valor da predi¸˜o positiva ´ muito pequeno. ca o u Quando dois ou mais testes s˜o usados para se chegar a um diagn´stico ´ preciso saber como s˜o obtidos a o e a os ´ ındices de qualidade do teste m´ltiplo.2. No teste em s´rie. ca Entre as v´rias tecnologias para detectar a presen¸a do HIV. e 8.35 0.2 Testes Diagn´sticos o ROSSI.01 1/100 82. VPN. que a e prevalˆncia que ocorre na tabela ´ a mesma na popula¸˜o de interesse e assim usam tabelas 2 × 2 para e e ca calcular os valores de predi¸˜o. uma op¸˜o freq¨entemente usada ´ o uso de uma combina¸˜o de testes mais simples. implicitamente. segundo Marwick (1985). isto ´. em outra palavras. ca o leva a erros s´rios. se um dos dois testes ´ positivo o teste e e conjunto tamb´m o ´.53 0. sensibilidade de 95% e o especificidade de 99. o valor de predi¸˜o negativa ´ alto.11 Considerando-se a popula¸˜o total de um pa´ a AIDS ´ uma doen¸a de prevalˆncia pequena.99 51.3.21 99. Os valores para os outros laborat´rios s˜o parecidos.000 0. o a A Tabela 8. No caso do teste em paralelo.

a especificidade do teste em paralelo (ep ) ´ dada por e ep = eA × eB . Tabela 8. . facilmente calculamos a sensibilidade e a especificidade de um teste em paralelo a partir das sensibilidades e especificidades dos testes A e B. como para pacientes provenientes de lugares distantes. Al´m disso. Combina¸˜o em Paralelo ca Nesse caso. quando se necessita de uma abordagem e r´pida.5: Resultado do teste em paralelo dependendo da classifica¸˜o dos testes individuais A e B. O teste s´ ser´ considerado positivo.8. Robson M. e a prevalˆncia da popula¸˜o de interesse. seja pela ca e quest˜o finaceira. ou por outro tipo de conveniˆncia. Portanto. A Tabela 8. A Tabela a e 8. pode-se calcular a especificidade de a um teste em paralelo da seguinte forma: Pr[Tp− |D− ] = Pr[A− ∩ B− |D− ] = Pr[A− |D− ] × Pr[B− |D− ] ou seja. Admitindo-se que os resultados dos dois testes s˜o independentes. os testes s˜o aplicados consecutivamente. se pelo menos um dos testes apresentar a ´ resultado positivo. o teste em paralelo de Tp e o em s´rie de Ts . utilizando-se agora a sensibilidade e especificidade da combina¸˜o a ca em paralelo. e se a considera¸˜o de custo ´ importante. e usando a linguagem e de eventos temos: Tp+ = A+ ∪ B+ e Ts+ = A+ ∩ B+ . sendo o segundo teste aplicado apenas se o primeiro a apresentar resultados positivo.5 apresenta de forma expl´ ıcita o procedimento proposto. a sensibilidade do teste em paralelo (sp ) ´ dada por e sp = sA + sB − sA × sB . a e Chamando os testes originais de A e B. E de maior utilidade em casos de urgˆncia. pelo risco ou desconforto induzidos pelo exame. ca Teste A Teste B Teste em paralelo + + + + + + + Em analogia ` express˜o para obter a sensibilidade temos: a a Pr[Tp+ |D+ ] = Pr[A+ ∪ B+ |D+ ] = Pr[A+ |D+ ] + Pr[B+ |D+ ] − Pr[A+ ∩ B+ |D+ ] ou seja. ca e e o sendo de grande utilidade quando a quest˜o do custo ´ relevante. 99 A associa¸˜o de testes em s´rie ´ bastante empregada. os parˆmetros VPP e VPN s˜o calculados da e a a mesma forma j´ vista para testes isolados. As sensibilidade e especificidade de Tp e Ts s˜o calculadas com o aux´ das regras de c´lculo de probaa ılio a bilidades de eventos. tanto em triagens como no diagn´stico individual. se o resultado dos dois testes for positivo.6 apresenta de forma expl´ a ıcita o procedimento proposto. o resultado do teste ser´ considerado positivo.2 Testes Diagn´sticos o ROSSI. o a Esse procedimento ´ indicado em situa¸˜es em que n˜o h´ necessidade de r´pido atendimento e quando o e co a a a paciente pode ser acompanhado ao longo do tempo. e ca Combina¸˜o em S´rie ca e Nesse caso.

98 e eC = 0. que ambos os testes de ultrasom (A) e tomografia o computadorizada (B) do pˆncreas sejam solicitados. e e ıvel mas a especificidade ´ menor. 9 − 0. Entretanto.8. 1981). 8 + 0. o custo desse tipo de combina¸˜o ´ menor.4. 100 Tabela 8. a possibilidade de cˆncer do pˆncreas ´ freq¨entemente levantada. n˜o se pode garantir que isto ocorra sempre. Robson M. n˜o h´ uma forma anal´ a a ıtica simples para se obter tais ´ ındices para um teste composto.7: Sensibilidade e especificidade dos testes de ultra-som e tomografia computadorizada no diagn´stico do cˆncer de pˆncreas individualmente e em conjunto. quando utilizados separadamente e em conjuto (Griner et al. 72 eD = 0. 6 × 0. 9 = 0. Em s´rie: e sD = 0. a independˆncia a ca e e dos dois testes ´ crucial. Tabela 8. o a ca e Uma discuss˜o sobre a ordem mais indicada para a aplica¸˜o dos testes a serem combinados em s´rie pode a ca e ser encontrada em Soares & Parenti (1995). 9 = 0. temos as o seguintes sensibilidades e especificidades combinadas: Em paralelo: sC = 0. 6 × 0. Quando um ou outro teste ´ positivo. e ca Teste A Teste B Teste em s´rie e desnecess´rio a + + + + Como s´ ser˜o aplicados dos testes se o primeiro for positivo. Quando os testes n˜o e a a forem independentes. 8 × 0. Diagn´stico de cˆncer pancre´tico. Na ausˆncia e de uma explica¸˜o para estes sintomas. Admitindo e que os resultados dos dois testes sejam independentes e usando as express˜es vistas anteriormente. . 6 + 0. 9 − 0. 96. 9 = 0.2 Testes Diagn´sticos o ROSSI. o a a Imagine um paciente idoso com dores persistentes nas costas e no abdomem e perda de peso. 9 = 0.6: Resultado do teste em s´rie dependendo da classifica¸˜o dos testes individuais A e B.. Se os dois testes A e B s˜o independentes.7 apresenta dados hipot´ticos sobre os a e ´ ındices s e e dos testes. a sensibilidade (ss ) e a especificidade (es ) par o teste combinado a em s´rie s˜o obtidos sa seguinte forma: e a Pr[Ts+ |D+ ] = Pr[A+ ∩ B+ |D+ ] = Pr[A+ |D+ ] × Pr[B+ |D+ ]. e Portanto. A Tabela 8. Exemplo 8. 8 × 0. a sensibilidade combinada ´ maior que o mais sens´ dos testes. ss = sA × sB e es = eA + eB − eA × eB . ca a a e u ´ E comum para se verificar esta possibilidade diagn´stica. Para os c´lculos da sensibilidade e especificidade da associa¸˜o em s´rie e em paralelo. 54. o a a Teste Sensibilidade (%) Especificidade (%) A: Ultra-Som 80 60 B: Tomografia 90 90 C: A ou B positivo 98 54 D: A e B positivo 72 96 Note que os esquemas C e D correspondem respectivamente a testes em paralelo e em s´rie.

especificidade s´rie e em paralelo considerando-se uma e Teste A B Paralelo S´rie e e valores de predi¸˜o de testes individuais A e B e dos testes em ca prevalˆncia de 1%. vamos inicialmente considerar duas o situa¸˜es extremas. e ca o e Exemplo 8.7. os testes utilizados devem ter alta sensibilidade e especificidade.6. Portanto. Nesse caso.9500 0. sendo que a ca a a combina¸˜o em s´rie proporcionou o melhor resultado (V P P = 0. o valor de referˆncia (k :Ponto de corte) foi obtido atrav´s dos valores de s e e e e e que tinham a maior soma. o O primeiro fato importante ´ que os valores de predi¸˜o (VPP e VPN) dependem conjuntamente de s. 1977).99) mas sua especificidade ´ menor que a dos ca e testes isolados. co e Embora o teste tenha parˆmetros de qualidades razo´veis.8.9000 0. os testes usados na combina¸˜o s˜o dependentes entre ca a si.7600 0. Entretanto. apreca a a a sentaremos alguns argumentos baseados nas medidas de qualidades.8000 0. o VPP ´ baix´ a a e ıssimo para popula¸˜es de baixa co prevalˆncia. VPP e VPN. tem sensibilidade de 0. e.9976 A combina¸˜o em paralelo apresenta alta sensibilidade (0.9994 0.9500 0.9950 0. Torna-se necess´rio um trabalho de pesquisa realizado em um grupo de pacientes a nos quais s˜o utilizados o teste padr˜o (gold test) e teste combinado (Di Magno et al. j´ que v´rios fatores devem ser considerados. e co Para simplificar o racioc´ ınio sobre a escolha de testes diagn´sticos. na pr´tica nem a ´ sempre existem testes dispon´ ıveis com caracter´ ısticas ´timas. Galen & Gambino (1975) sugeriram uma medida de eficiˆncia definida pela soma da sensibilie dade e especificidade. a ca Em processos de escolha do ponto de corte (ponto limite para decidir se um paciente ´ doente ou sadio). que podem ajudar na escolha de um teste diagn´stico. mas a sensibilidade ´ e menor.5 Escolha entre Testes Diagn´sticos o Idealmente. n˜o ´ poss´ determinar os valores dos parˆmetros de qualidade conhecendo-se apenas os valores a e ıvel a de cada teste em separado. O exemplo a seguir ilustra numericamente este fato. tornando o exame sem utilidade nessas condi¸˜es.95.995) enquanto que a sensibilidade a ca e ´ relativamente baixa comparada com testes isolados..0876 0. quando o crit´rio para a positividade do teste ´ que tanto o ultra-som como a tomografia a e e sejam positivos.2 Testes Diagn´sticos o ROSSI. obviamente sem interesse pr´tico. co a co . Sensibilidade e especificidade de testes em paralelo e em s´rie.2.1391 0. os valores acima tendem a superestimar o verdadeiro valor dos ´ ındices dos testes combinados. os valores de predi¸˜o negativa s˜o altos. E relativamente comum a situa¸˜o em que h´ o ca a mais de um teste e ent˜o surge a necessidade da compara¸˜o entre eles para uma escolha mais adequada. Diagn´stico da gonorr´ia.9979 0. Qual seria a melhor escolha? Embora a avalia¸˜o de um teste n˜o seja trivial. a sugest˜o seria o teste em s´rie. 101 Ao contr´rio.9900 0. e Como esperado. tanto para os testes isolados como para as ca a duas formas combinadas dos testes. e a Tabela 8. e depois vamos estender para situa¸˜es masi gerais. e e ca e p.80 e o e especificidade de 0. Portanto.9999 0. e por exemplo. ca e ´ E importante lembrar que. supondo uma prevalˆncia de 1%. os valores de predi¸˜o positiva n˜o s˜o altos. Entretanto. J´ a combina¸˜o em s´rie apresenta alta especificidade (0.5.8550 0. Soares & Parenti (1995) apresentam um estudo detalhado atrav´s de gr´ficos que ilustram claramente e a o efeito da prevalˆncia nos valores de predi¸˜o. ent˜o teremos os seguintes valores: s. a e Exemplo 8. desenvolvido para o diagn´stico de gonorr´ia.8: Sensibilidade.9 para quatro ca a popula¸˜es com diferentes prevalˆncias. e s e VPP VPN 0. Suponha que dois testes diagn´sticos est˜o dispon´ o a ıveis: um com alta sensibilidade mas relativamente baixa especificidade e o outro com alta especificidade e relativamente baixa sensibilidade. Robson M. 6056). Os valores da predi¸˜o positiva e negativa s˜o apresentados na Tabela 8. isto ´. a especificidade combinada ´ maior que o mais espec´ e ıfico dos dois. a a 8.0645 0.6056 0. e Consideremos dois testes A e B com sensibilidade e especificidade apresentados na Tabela 8. na maioria das vezes. O teste Gonosticon Dri-Drot.

toda a popula¸˜o tem a doen¸a e e c e ca c em quest˜o.9780 0.0748 0.8989 0.80 0.00 Suponhamos que p = 0. c 2. Al´m disso. ou que p = 1.90 0.99 0.9999 0.4762 0.9986 0. e p VPP 0 0 1 1 e propor¸˜o de resultados falsos (PFP e PFN) para casos ca PFP 1 0 VPN 1 0 PFN 0 1 A extens˜o para o caso mais geral de p pequeno (doen¸a rara) e p grande (doen¸a comum) pode ser feita a c c pela an´lise das express˜es j´ estudadas variando-se as quantidades envolvidas (s. um teste com alta sensibilidade dever ser usado para achar e c e os casos e para uma doen¸a de alta prevalˆncia.3548 0.9999 0. Tabela 8.99 0. c e Esse racioc´ ınio n˜o coincide com os argumentos apresentados.830 0.99 0.0388 0. A Tabela 8.9975 valores de sensibilidade e especificidade para Prevalˆncia de 90% e VPP VPN 0.9863 0. e e Embora este n˜o seja um estudo exaustivo. o VPP ´ pr´ximo de 1.90 0. o valor de predi¸˜o positiva (VPP) ´ mais influenciado pela especificidade.9878 0. e Prevalˆncia de 1% e s e VPP VPN 0.0909 0.020 D 0.11: Valores de predi¸˜o (VPP e VPN) para alguns ca prevalˆncias de 1% e 90%.80 0. e Para a prevalˆncia alta.90 0.3333 0.9759 0.99 0.9: Valores de predi¸˜o (VPP e VPN) do teste ca Popula¸˜o p ca A 0.10: Valores de predi¸˜o (VPP e VPN) ca extremos de prevalˆncias.8.020 1. para quaisquer valores de s e e.9889 0. um teste com alta especificidade deve ser escolhido.9988 0.90 0.0435 0.4469 0.0476 0.500 B 0.0833 0.4706 0.9990 0.9167 0. mas nos restringimos a o a a apresentarmos uma an´lise num´rica.100 C 0. o VPN ´ influenciado mais pela sensibilidade do que pela especificidade.9730 0. existem evidˆncias para as seguintes conclus˜es: a e o 1.80 0.99 0.9980 0. como era de se esperar. a Outro tipo de simula¸˜o ´ apresentado nas Figuras 8.99 0.5238 0.10.640 0.990 0.9989 0. ningu´m tem a doen¸a. isto ´.2 Testes Diagn´sticos o ROSSI.5000 0.80 0.9989 0. e e p).001 Gonosticon Dri-Drot para quatro prevalˆncias (p).9978 0. Facilmente chagamos nos valores apresentados na Tabela 8. e c e c mesmo que o teste tenha relativamente baixa especificidade. 102 Tabela 8. a Tabela 8.940 0. Um teste com alta especificidade deve ser usado quando a prevalˆncia da doen¸a ´ relativamente baixa e c e (doen¸a rara). isto ´.9987 0. e VPP VPN 0.80 0. e e ca e O valor de predi¸˜o negativa (VPN) ´ pouco influenciado tanto pela sensibilidade quanto pela especificidade ca e e ´ alto.9091 0.80 0.90 0.11 mostra os valores de predi¸˜o para prevalˆncias de a e ca e 1% e 90%.9999 0.3077 Quando a prevalˆncia ´ baixa.2 para algumas situa¸˜es espec´ ca e co ıficas: .250 0.90 0. ´ E comum a id´ia de que se a doen¸a ´ rara.980 0.5000 0.1 e 8. mesmo que o teste tenha relativamente baixa sensibilidade. Um teste com alta sensibilidade deve ser usado quando a prevalˆncia da doen¸a ´ alta (doen¸a comum). independente dos valores da sensibilidade e da especifie e o cidade. Robson M.

2 Testes Diagn´sticos o ROSSI. o impacto ´ bastante grande. ao reduzir apenas a sensibilidade (s = 70% e e = 99%).1: Valor Preditivo Positivo em Fun¸˜o da Prevalˆncia ca e Prevalência 0% 100% 20% 40% 60% 80% 100% VPN 50% s = 70%. e = 99% s = 95%. ocorre uma dr´stica a redu¸˜o no VPN. Dessa forma.2 que. Esse impacto se acentua nas prevalˆncias e ca e e muitos elevadas. para qualquer situa¸˜o. para um mesmo teste diagn´stico (exce¸˜o apenas para s = 70% e e = 99%). o . quanto maior a prevalˆncia da doen¸a. menor do que quando se reduz e apenas um pouco a sensibilidade e a especificidade conjuntamente (s = 95 e e = 95%). e = 99% 0% Figura 8. quando a ca e essa mesma diminui¸˜o ocorre na especificidade. a o Note na Figura 8. o impacto e o ca do aumento da prevalˆncia na redu¸˜o do VPN ´ muito pequeno. Robson M. da sensibilidade e fundamentalmente e ca e c da especificidade. a co e a Entretanto. ca e c maior o valor preditivo positivo. Ao se reduzir apenas a ca especificidade (s = 99% e e = 70%). Como na pr´tica cl´ a ınica.8. percebe-se que praticamente n˜o houve impacto nos valores preditivos positivos em fun¸˜o da prevalˆncia. ao se diminuir a sensibilidade mantendo-se a especificidade elevada (s = 70% e e = 90%).2: Valor Preditivo Negativo em Fun¸˜o da Prevalˆncia ca e Inicialmente percebe-se na Figura 8. Note tamb´m que.1 que. Uma outra situa¸˜o ocorrer´ ao se modificar apenas uma das caracter´ ca a ısticas do teste. o VPN ir´ sofrer apenas pequena varia¸˜o ao se modificar a especificidade de um teste a ca diagn´stico e mesmo ao se modificar pouco a sensibilidade. 103 Prevalência 0% 100% 10% 20% 30% 40% 50% VPP 50% s = 99%. e = 95% s = 70%. mostrando o grande impacto que essa medida exerce no VPN. Por exemplo. e = 70% s = 95%. Entretanto. diminuindo-se muito o valor ca e preditivo positivo do resultado mesmo para prevalˆncias mais elevadas. e = 99% 0% s = 99%. as doen¸as estudadas comumente possuem prevalˆncias relatic e vamente baixas. o impacto no VPN ´ muito pequeno. e = 99% Figura 8. pode-se afirmar que o e valor preditivo positivo de um teste ´ fun¸˜o da prevalˆncia da doen¸a. esta situa¸˜o sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e ca especificidade do teste (s = 95% e e = 95%). e = 95% s = 99%. e = 70% s = 99%. Para um teste com sensibilidade e especificidade elevadas (s = 99% e e = 99%) o seu valor preditivo positivo ser´ muito alto mesmo em situa¸˜es de prevalˆncia n˜o muito elevada. conforme j´ fora observado na f´rmula anterior.

quando um delas c aumenta a outra diminui e vice-versa. Entretando. Ao contr´rio. identificando perfeitamente todos os indiv´ a ıduos sadios e doentes (gold test).4). em geral. Nesse caso. se localiza no extremo da curva pr´ximo o o ao canto superior esquerdo do gr´fico.3: Ponto de corte com o m´ ınimo erro poss´ ıvel 8. a a o Um teste diagn´stico ideal.e). uma determinada propriedade do teste (por exemplo. Figura 8. o poder discriminat´rio do o c o teste. a acur´cia global. a sensibilidade) somente pode ser aumentada `s custas da diminui¸˜o da especificidade e vice-versa. ou seja. escolhe-se um ponto de corte onde exista o menor erro poss´ ıvel. o teste a n˜o possuiria erro. ıda Note que quanto mais pr´xima a curva estiver do canto superior esquerdo do gr´fico. A partir dos dados apresentados na Tabela 8. quanto a e a a maior for a ´rea tanto melhor ser´ o teste diagn´stico. pior ser´ o o o e a a seu poder de discriminar doentes e n˜o doentes. o teste diagn´stico n˜o possuiria nenhum poder e o a para discriminar doentes de n˜o-doentes. ou seja. tanto de falsos positivos quanto de falsos negativos (Figura 8. Para um teste sem nenhuma utilidade. Neste caso.2. n˜o o a existiria erro em seu resultado. melhor ser´ o poder o a a discriminat´rio do teste diagn´stico e quanto mais distante. freq¨entemente. at´ o limite da diagonal do gr´fico. Neste caso. partindo do canto inferior esquerdo at´ o canto superior direito. pode se mensurado atrav´s do c´lculo da ´rea sob a curva ROC. a e Sua constru¸˜o ´ feita colocando-se os valores da sensibilidade (propor¸˜o de verdadeiros ca e ca positivos) no eixo Y (ordenadas) e o complemento da especificidade (1 .12 foi constru´ a curva ROC (8. por exemplo) ´ necess´rio determinar um ponto de corte (cut off ) entre os valores considerados normais e os e a anormais. al´m de auxiliarem na identifica¸˜o do melhor ponto de corte. Neste caso. isso n˜o ´ poss´ a a e ıvel. a ´rea total seria igual o a a 1 (um).8. s˜o muito utilizadas para e ca a comparar dois (ou mais) testes diagn´sticos para a mesma doen¸a. a ca Freq¨entemente.2. Esta curva foi primariamente desenvolvida ca na d´cada de 1950 para avaliar a detec¸˜o de sinais de radar (da´ a sua denomina¸˜o).3). a u existe uma contra-balan¸o (trade-off ) entre essas duas propriedades de tal modo que.2 Testes Diagn´sticos o ROSSI. para um teste expresso em uma escala cont´ ınua (glicemia. com 100% de sensibilidade e 100% de especificidade. a propor¸˜o de falca sos positivos no eixo X (abscissas) para diferentes pontos de corte. na pr´tica. Robson M. 104 8. ou seja. A curva ROC pode servir como orienta¸˜o para a escolha a ca do melhor ponto de corte de um teste diagn´stico que. Assim.7 Curva ROC Uma forma de expressar graficamente a rela¸˜o entre a sensibilidade e a especificidade ´ atrav´s da conca e e stru¸˜o da curva ROC (receiver operating characteristic curve). embora somente e ca ı ca recentemente tenha se tornado comum o seu uso na ´rea m´dica. a As curvas ROC. a . ou seja. na pr´tica cl´ u a ınica. a “curva” seria uma linha reta em diagonal.6 Rela¸˜o entre Sensibilidade e Especificidade ca O teste diagn´stico ideal seria aquele na qual a sensibilidade e a especificidade fossem 100%. a “curva” seria coincidente com o lado esquerdo e o topo do gr´fico.

6 8.3 100.12: Trade-off entre Sensibilidade e Especificidade no tratamento de Diabetes (Glicemia p´s-prandial o 2(h) mg/100 ml). que classifica sem erro doentes e n˜o-doentes. Precision e e Advantage.8 0.5 130 64.4 100 88.3 96.4 0.5 7.8. em um estudo para avalia¸˜o de equipamentos para dosagem glicˆmica capilar O a ca e objetivo do trabalho foi o de escolher o melhor equipamento entre trˆs analisados: Glucotrend.0 0 1 .Hospital Universit´rio da Universidade a Estadual de Maring´. Glicemia p´s-prandial Sensibilidade (%) Especificidade (%) 1 .9 120 71.4: Curva ROC da Glicemia p´s-prandial (2h) mg/100 ml o Exemplo 8.2 Testes Diagn´sticos o ROSSI.1 99.8 91.9 100.2 110 85.1 100.3 47.6 69.6 100.13 foram obtidos na UEM/HU . 2.4 160 47. Os dados da Tabela 8. .8 30. O teste Colorim´trico foi ser utilizado como e Gold Standard (Teste Ouro).6 150 50. *1 foram utilizadas duas fitas por falha na leitura do equipamento.0 0 180 38.2 170 42.7.: 1.6 52.0 99.1 140 57.Especificidade 0% 100% 20% 40% 60% 80% 100% Sensibilidade 50% 0% Figura 8. *3 equipamento apresentou erro.0 0 200 27. 3.1 15. a Obs.Especificidade (%) o (2h) mg/100 ml 70 98.1 25.2 80 97. Obs.0 0 190 34.4 92.5 90 94. Os testes foram realizados em 21 indiv´ ıduos.6 0.7 84. *2 foram utilizadas quatro fitas por falha na leitura do equipamento.: Valores de referˆncia: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hie poglicemia) e acima de 120 (hiperglicemia)). Robson M.9 3. 105 Tabela 8.5 74.1 99.

usando a prevalˆncia da doen¸a obtida atrav´s da Tabela Cruzada. Determine as Tabelas Cruzadas: Gold X G. G x A e P x A de forma paralela e em s´rie. recalcule os itens anteriores. 106 Tabela 8. Determine os valores de predi¸˜o positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para cada um dos testes. e c a e 5. Interprete-os. Qual a melhor combina¸˜o ? porquˆ ? ca e .8. ca e Indiv´ ıduo Gold-Calorim´trico G-Glucotrend P-Precision A-Advantage e 1 282 310 336 283 2 121 115 143 137 3 71 71 76 66 4 101 *3 85 99 5 161 *3 215 177 6 192 215 134 *2 211 7 99 97 123 134 8 105 152 156 *1 136 9 190 200 208 205 10 64 69 76 69 11 108 125 105 115 12 99 97 95 116 *1 13 107 107 109 108 14 68 75 81 64 15 81 86 94 91 16 82 84 49 *1 89 17 88 90 93 93 18 71 76 88 77 19 76 90 91 96 20 98 107 89 *1 105 21 87 86 90 96 Exerc´ ıcio 8. Determine a sensibilidade e especificidade de cada testes acima . Gold X P e Gold X A.1. Baseado nestes resultados qual (quais) o(s) melhor(es) teste(s) ? ca 3. Robson M. 2. e c e 4. Considerando que a prevalˆncia para a doen¸a em quest˜o ´ de 1%. considerando uma prevalˆncia e e de 1%. Utilize o banco de dados referentes a Tabela 8.13 e: 1.13: Resultados da avalia¸˜o de equipamentos para dosagem glicˆmica capilar. Combine os testes: G x P.2 Testes Diagn´sticos o ROSSI.

1a Ed.. Chapman & Hall. 1975. Goiˆnia: Ed. [9] DANIEL. 1999. Freeman. Psicoestadistica-Contrastes Param´tricos y no Param´tricos. C. Editora McGraw Hill do Brasil Ltda. Estat´ ıstica aplicada. RJ. J. R. S. c˜ [3] CAMPOS. S.F.. Elementos de Estat´ ıstica (com aplica¸˜es `s ciˆncias m´dicas e biol´gicas). A. [10] DOWNING. 1999. G. 2003. RJ. 2003. [8] COLLET. New York: John Wiley.. H. [21] SOUNIS. Artmed. 1a Ed. Epidemiologia. F.. S. Ao livro u t´cnico S. K. New York: W. M. M´todos estat´ e ısticos em medicina e biologia.Modelling survival data in medical research. e e Ediciones Piramide S. A. Thonson. a e [18] SOARES. SP.. F.. UFMG. [11] FORANTTINI. Guanabara Koogan S.R. 1983. Bioestatistics: a foundation for analysis in the health sciences. M. J. Rio co a e e o de Janeiro: UFRJ.. P.A. F e BARTMAN. Curso de Estat´ ıstica aplicada ` Biologia. e ıstica. e [14] MEDRONHO.. D e CLARK. a e [4] CARVAJAR. a [16] RODRIGUES. 1988. EdUFF. e GUEDES. Estat´ ıstica n˜o-param´trica. R. IMPA/CNPq. 4a Ed. 2002. 1980. Epidemiologia: Teoria e Pr´tica.A. e PAGANO. P. P. H. 2 Ed. S.. London.. 1a Ed. RS.. S. R. RJ. 1995. aplica¸˜o ` ciˆncias ca a e biol´gicas. Bioestat´ ıstica . J. Ed.. 1981. o 107 . a [19] SOARES. R. 1995. 14o Col´quio Brasileiro o de Matem´tica. 1970.. USP/ESALQ. Epidemiologia Geral. 1989.. [15] PEREIRA. Tests in statistical science.Referˆncias Bibliogr´ficas e a [1] ARANGO. Atheneu. C. Madrid. 2a Ed. RJ. D.. [5] CASTELLANOS. Ltda. [12] GAUVREAU. Ed. o [2] CALLEGARI-JACQUES. Bioestat´ ıstica.Para profissionais de sa´de. metodologia.G. Guanabara & Koogan. e SIQUEIRA. O. [6] CENTENO. A. Bioestat´ ıstica: Te´rica e computacional. L. S. J. 2a Ed. e [20] SOKAL. S. ıstica (com aplica¸˜es `s ciˆncias m´dicas e biol´gicas). a a a 1981. Revisada. Princ´ ıpios fundamentais. Estat´ ıstica Experimetal N˜o-Param´trica. McGraw-Hill. 2004. R. E.. 4a Ed. W. Principios de Bioestat´ [13] GUEDES. 1970. estat´ ıstica. Ed. 2002. Rio co a e e o [7] CARVAJAR.. Bioestat´ ıstica: Princ´ ıpios e Aplica¸oes. S. RJ. 1994. W. A. Artes M´dicas.. Ed.L. Bioestat´ ıstica. Elementos de Estat´ de Janeiro: UFRJ. Introdu¸˜o ` estat´ ca a ıstica m´dica. J. 2001. 2a Ed. 1983. Biometry: The Principles and Practice of Statistics in Biological Research. [17] SIEGEL. Saraiva.A. SP. S e MERINO. Universidade Federal de Goi´s. M.

1980. S. ca [25] VIEIRA. 2. 108 [22] STEEL.G. R. J&S. Introdu¸˜o ` Bioestat´ ca a ıstica.D. [24] VIEIRA. S.A. NY.2 Testes Diagn´sticos o ROSSI. Estat´ ıstica Experimental. 2a Edi¸˜o.. Ed. 5a Edi¸˜o Revista e Ampliada. Ed Atlas S. Biostatistics. ca . Principles and Procedures of Statistics a Biometrical Approach.. A foundation for analysis in the health sciences.8. [23] WAYNE. 1999. D.1980. Robson M. W.1999. 7a Ed. New York: Mc Graw-Hill.. Editora Campus. SP.

Sign up to vote on this title
UsefulNot useful