You are on page 1of 8
a Sumdrio 5B a 3 a & B Organizacao de dados quantitativos. Medidas de tendéncia central ou de posicao .. Medidas de dispersao ou de variabilidade... Distribui¢do normal ou de Gauss Distribuicao amostral das média: Testes de hipéteses . Distribuicao ¢ Comparagao entre as médias de duas amostras independentes... Comparacdo entre médias de duas amostras pareadas... Cortelacao linear simples .. ESecevaGaene Regressio linear simples » NS Organizacao de dados qualitativos m wo Probabilidade em varidveis qualitativas ... - & Distribuigéo binomial .. e a Distribuigéo qui-quadrado Amostras Andlise da variancia bee OBI a Testes nao-paramétricos Exercicios .. Respostas dos exercicios Tabelas Referéncias bibliograficas indice .. Introducdo N: literatura cientifica, consultada por profissionais das dreas biolégica e da satide, encontramos expressées como “diferenca estatisticamente significativa”, “teste qui-quadrado de associacao” e “P < 0,01”, que refletem a importancia, cada vez maior, dada pelos pesquisadores ao tratamento estatistico de seus dados, Quais serio as razGes para o emprego de métodos estatisticos nos trabalhos cientificos? Em primeiro lugar, a estatistica, longe de ser mais uma complicagéo matematica, tem se mostrado um instrumento extremamente itil na organizagio e na interpreta. ‘cao dos dados. Em segundo lugar, esta ciéncia propicia uma avaliac&o adequada da variabilidade observada nos processos biolégicos. f sabido que existem diferencas entre os individuos e que eles reagem de forma diferente a estimulos idénticos; por outro lado, o mesmo individuo apresenta variacGes de um momento para outro, Em vista disto, o pesquisador consciencioso deseja saber qual 0 grau de confiabilidade de seus resultados. Ele se pergunta, por exemplo, se os resultados poderiam ter sido obtidos por acaso, se o novo tratamento proposto foi realmente mais eficiente, se a associagaio observada entre as varidveis € real, se o método de selecao de individuos foi adequado, se a andlise dos dados empregou os métodos adequados as varidveis estudadas. Todas essas questées podem ser respondidas com 0 auxilio da estatistica. © papel da estatistica na investigacao cientifica vai além de indicar a seqiién- cia de céleulos a serem realizados com os dados obtidos. No planejamento, ela auxilia na escolha das situagdes experimentais e na determinacdo da quantidade de individuos a serem examinados. Na andlise dos dados, indica técnicas para Tesumir e apresentar as informacGes, bem como para comparar as situacdes expe- rimentais. Na elaboracao das conclusées, os varios métodos estatisticos permitem generalizar a partir dos resultados obtidos. De um modo geral, nao existe certeza sobre a corrego das conclusées cientificas; no entanto, os métodos estatisticos permitem determinar a margem de erro associada as conclusées, com base no conhecimento da variabilidade observada nos resultados. Inicialmente, a estatistica ocupava-se em descrever quantitativamente os varios aspectos dos assuntos de um governo ou estado, remontando a época em que surgiram as primeiras cidades. Comecava, ento, a necessidade de se enumera- Tem coisas e pessoas para a avaliagio das riquezas e para 0 cadastramento das pro- priedades. Os censos jé eram realizados anualmente em Atenas e, a cada quadriénio, em Roma, nas festas de purificac&io da comunidade, quando era necessério saber se todos estavam presentes ou representados. Um dos primeiros censos de que se tem noticia escrita foi o ordenado pelo imperador romano César Augusto, realizado na Palestina, por volta do ano zero 14. Sidia M. Callegari-Jacques da era crista. Outro recenseamento famoso foi o realizado, na Inglaterra, por Gui- Iherme I, duque normando que havia derrotado os ingleses. O cadastro geral das coisas inglesas com fins de tributagao, feito em 1085-1086, foi chamado pelos ingleses de “Domesday (ou Doomsday) Book”, 0 livro do juizo final, nome que bem. revela as expectativas da populacéo quanto A carga tributaria por vit. Por muito tempo, o aspecto descritivo da estatistica manteve-se como a tini- ca faceta desta ciéncia. As coisas comegaram a mudar no século XVII, com as primeiras interpretacées de dados. Em 1693, foram publicados, em Londres, os primeiros totais anuais de falecimentos, discriminados por sexo. Eram o resultado de levantamentos iniciados em 1517, quando a peste atacava periodicamente a Europa. Christian Huygens (1629-1695), fisico e astrénomo holandés, construiu depois uma curva de mortalidade a partir dos dados publicados. Oestudo formal da teoria de probabilidades, iniciado por Blaise Pascal (1623- 1662) e Pierre de Fermat (1601-1665), constitui-se em importante marco no de- senvolvimento da estatistica. Gragas a esses conceitos, a estatistica comecou a ser estruturada de modo a poder desempenhar seu papel mais nobre, o de auxiliar na tomada de decisdes cientificas. Estudiosos de diferentes campos do conhecimento fizeram a ligagao entre os aspectos tedricos de probabilidade e estatistica e a pratica. Lambert Adolphe Jac- ques Quetelet (1796-1874), astrénomo e matematico belga, foi o primeiro a usar a curva normal fora do contexto da distribuicao dos erros e aplicou conhecimen- tos estatisticos na solucao de problemas de biologia, medicina e sociologia. Fran- cis Galton (1822-1911), por sua vez, empregou a estatistica no estudo da variagao biolégica e tentou, sem sucesso, resolver problemas de hereditariedade!. Karl Pe- arson (1857-1936) também interessou-se pela aplicagao dos métodos estatisticos A biologia, em especial, a estudos sobre a selecdo natural. Além de ser o pai do teste qui-quadrado, a ele se devem intimeros estudos e medidas de correlagéo entre variaveis. Um aluno de Pearson, William S. Gosset (1876-1937), dedicou-se a solucionar problemas préticos com amostras pequenas. Um dos resultados de seus estudos é a distribuigao t, de ampla aplicacéo em varios campos da ciéncia Uma das figuras modernas mais importantes da bioestatistica (e da estatisti- ca em geral, jd que desenvolveu métodos para solucionar varios tipos de proble- mas) foi, sem duvida, Sir Ronald Aylmer Fisher (1890-1962), que assentou as bases pata a experimentacao estatisticamente controlada. Varios modos de anali- sar os dados de amostras pequenas foram propostos por Fisher, que também tem importantes contribuicées na andlise simultanea de muitas varidveis, dando con- siderAvel impulso ao uso da estatistica em intmeras areas do conhecimento, par- ticularmente na agronomia, na biologia e na genética. . ALGUNS CONCEITOS BASICOS Estatistica? & a ciéncia que tem por objetivo orientar a coleta,oresume, a apresen- -odem ser identificadas duas grandes + 0 problema é que Galton se dedicou a genética de caracteristicas quantitativas, que so muito mais dificeis de estudar do que as determinadas por um nico gene, como as analisadas por Gre- ‘gor Mendel (1822-1884). 2 Do grego statistés, de statizo, “estabelecer’, “verificar’, acrescido do sufixo ~ica Bioestatistica 18 dreas de atuacdo desta ciéncia: a estatistica envolvida como resumoea apresentagio dos dados, e a estatistica que ajuda a concluir sobre con- juntos maiores de dados quando apenas partes desses conjuntos (as amosttas) foram estuda métodos da estatistica inferencial so ferramenta imprescindivel no Na verdade, mais do que uma seqiiéncia de métodos, a estatistica é uma forma de pensar ou de ver a realidade varidvel, j que seu conhecimento ndo apenas fornece um conjunto de técnicas de andliise de dados, mas condiciona toda uma sobre sua interpretacdo e a elaboracao de conclusdes sobre os dados. Considera- statistica a aplicagao dos métodos estatisticos & solu- cdo de ase Algumas técnicas sio empregadas com maior freqiiéncia no ambito das ciéncias bioldgicas ou médicas. f 0 caso, por exem- plo, da regressio logistica, das tabelas de sobrevivéncia e das técnicas de en- saios bioldgicos. Por essa razo, tais métodos costumam ser encontrados com mais facilidade em textos sobre bioestatistica, o que contribui para se caracte- rizar este ramo da estatistica. Alguns termos usados em estatistica tem um conceito ligeiramente dife- rente do utilizado na linguagem coloquial. Para evitar dtividas, siio apresenta- dos, a seguir, alguns dos conceitos fundamentais usados no contexto estatisti- Unidad experimental e unidade de observasio sf0 a menor-unidade a fome- ‘As unidades podem ser pessoas, animais, plantas, objetos, so aqueles individuos submetidos a uma situa- por exemplo, ratos de laboratério colocados em um labirinto para estudar-se o comportamento antes e apés a administracéio de uma droga. Em uma situacao experimental, o pesquisador interfere no processo, controlando nao 6 fatores intervenientes, como temperatura, nivel de ruido, ida. de dos animais, como a designacio dos individuos as diferentes condigdes experi- mentais. Em [Ser RET? por outro lado, ele se limita a registrar 0 gue ocor, sem interfer; nest caso, a unidade dita de oberg, Otratamen- to estattstico dado as unidades experimentais e as unidades de observacio é ge- ralmente o mesmo, de modo que o termo “unidade experimental” é, muitas-vezes, usado para designar genericamente os individuos que esto sendo estudados. RHI sao as luformagées (ERR) obtidas de uma unidade experimental ou de observacdo. Na afirmacdo “Fulano tem 25 anos e é fuman- te”, os dados sao “25 anos” e “fumante”. Por outro lado, quando se comenta que no dia tal ocorreu um acidente de trénsito com morte de uma pessoa, a unidade (observacional) é 0 acidente de transito e o dado, a modalidade de acidente (com morte). “Varad € toda caracteristica que, observada em uma unidade experimental, i lade de uma pessoa e seus habitos quanto ao fumo, o sexo de rado na natureza, a estatura em jogado- res de basquete, a cor de sementes de uma espiga de milho, a quantidade de acido acetilsalicilico em comprimidos com o nome comercial NC, o nivel de hemoglobi- na no sangue constituem exemplos de varidveis. E importante identificar que tipo de varidvel esta sendo estudado, uma vez que séo recomendados procedimentos estatisticos diferentes em cada situagio. A principal diviséo ocorre entre varidveis quantitativas e qualitativas. 16 Sidia M. Callegari-Jacques Varidveis quantitativas so aquelas cujos dados séo valores numéricos que expressam quantidades, como a estatura das pessoas, o nivel sérico de célcio em roedores ou 0 nimero de sementes integras em uma vagem. Elas podem ainda ser classificadas em: (@)_Varidveis quantitativas discretas sio aquelas em que os dados somente po- dem apresentar determinados valores, em geral, ntimeros inteiros. Por exem- plo: nimero de filhos nascidos vivos, niimero de obras catalogadas, ntimero de baixas hospitalares por paciente, mimero de células aneupldides por an- tera. (b) Varidveis quantitativas continuas so aquelas cujos dados podem apresentar squalquer valor dentro de um intervalo de variacao possivel. Por exemplo: a quantidade de écido acetilsalicilico em certo comprimido pode ser qualquer valor entre 499 mg e 501 mg. O valor 499,5 mg € possivel, assim com 0 valor 499,53 mg. Note que se fala aqui de “possivel” no sentido tedrico: muitas vezes, um valor representa uma impossibilidade pratica, como é 0 caso de uma estatura igual a 167,26 cm para um estudante universitdrio (mesmo que o antropémetro possua divisdes para o centimetro, um resultado com tal Precistio € pouco confidvel quando se trata da estatura). A distincdo entre uma variével continua e uma discreta é que nesta nao existe a possibilidade, mesmo teérica, de se observar um valor fraciondrio: uma mulher nao pode ter tido 1,3 abortos. Varidveis qualitativas (ou varidveis categéricas ou atributos) so as que forne- cem dados de natureza nao-numérica, como a cor de uma flor, a raga de uma ovelha ou o sexo de um paciente. Mesmo que os dados possam ser codificados numericamente (masculino = 1, feminino = 2), os mimeros aqui sio apenas sim- bolos sem valor quantitativo. Neste tipo de varivel, as diferentes categorias que a compéem podem ter sido obtidas segundo dois niveis de mensuracio: (a) Nivel nominal: Como o nome implica, nesse nivel diferencia-se uma catego- ria da outra somente por meio da denominacdo da categoria. Assim, classifi- ca-se um coelho como do género masculino ou feminino e um paciente psi- quidtrico como psicdtico ou neurético. As varidveis nominais podem ainda ser divididas em binominais, bindrias ou dicotémicas, quando compostas por duas categorias (como é 0 caso de pessoas Rh+ e Rh-) e polinominais ou politémicas, quando apresentam mais de duas categorias possiveis (como 0s grupos A, B, AB e O do sistema sangtiineo ABO). (b) Nivel ordinal: Nesse nivel, nao sé é possivel identificar diferentes categorias, mas também reconhecer graus de intensidade entre elas, o que possibilita uma ordenacdo das varias categorias. £ necessério, no entanto, que a grada- ao seja inerente a varidvel e nao imposta por conveniéncia do pesquisador. Quando avaliados quanto a uma varidvel ordinal, os individuos podem ser classificados desde “o pior” até “o melhor”. Exemplos de varidveis ordinais sdo a sensacao dolorosa, que pode apresentar 10 gradagées desde “nenhuma dor” até “dor insuportavel”; 0 comportamento de um animal, que poderia ser “submisso”, “neutro” ou “agressivo”, e a cor de determinada flor, desde “branca” até “vermelho”, passando por diversas tonalidades de “rosa”. Bioestatistica {7 Populagdo ou universo: Esse termo é usado em estatistica com um sentido bem mais amplo do que na linguagem coloquial. E entendido aqui como todo conjunto de unidades experimentais (ou observacionais) que apresenta uma ou mais caracteristicas em comum. A abrangéncia de uma populacao € determinada pelas caracterfsticas em comum, escolhidas conforme o interesse do estudo a ser realizado e que definem claramente as unidades que pertencem a populacao-alvo. Sao exemplos: a populacdo de colegiais de oito anos de Porto Alegre (que tém em comum a idade ¢ 0 local onde vivem), a populacao de pinheiros do municipio de Canela, a populacio de comprimidos do lote 53/1998 de um determinado medi- camento, a populacao de acidentes de transito ocorridos no Rio Grande do Sul no ano de 1999. 0 objeto dos estudos so sempre as populacGes, pois, somente assim, as con- clusdes dos trabalhos cientificos nao se restringem apenas as unidades neles estu- dadas. No entanto, como as populacées sao constituidas de um nimero muito grande de elementos, sao estudadas por intermédio de alguns desses elementos, 08 quais constituirao 0 que se denomina uma amostra. Amostra € qualquer fracao de uma populagéo. Como sua finalidade é repre- sentar a populacdo, deseja-se que a amostra escolhida apresente as mesmas carac- terfsticas da populagao de origem, isto é, que seja uma amostra “representativa” ou “ndo-tendenciosa”. Uma amostra de colegiais de oito anos do Colégio Farroupi- Iha nao é uma amostra representativa dos colegiais de oito anos de Porto Alegre, pois foi obtida em uma escola apenas; 80 comprimidos do lote 53/1998 consti- tuem uma amostra representativa desse lote, desde que escolhidos por um proces- so casual. Tanto o mimero de individuos selecionados para a amostra quanto a técnica de selegio sdo extremamente importantes para que os resultados obtidos no estudo sejam generalizados para a populacdo. Alguns aspectos sobre processos de amostragem serao vistos mais adiante. Pardmetro é um valor que resume, na populagio, a informacdo relativa a uma varidvel. Por exemplo, 45% dos alunos matriculados na disciplina D, em 1999, eram do sexo masculino. Todos os alunos matriculados nesse ano foram estudados; portanto, a informagio é referente A populacdo toda. No caso, 45% é um parametro. Da mesma forma, se a estatura média de todos esses alunos foi 175 em, essa média é um pardmetro. Estatistica, além de ser o nome de uma ciéncia, é a denominagio dada a uma quantidade, calculada com base nos elementos de uma amostra, que descreve a informacao contida nesse conjunto de dados. A média, a percentagem, o desvio padrao, 0 coeficiente de correlacdo, calculados em uma amostra, sio estatfsticas. As estat{sticas variam de uma amostra para outra; portanto, sio, elas préprias, variaveis aleatérias. Os pardmetros sio dificeis de se obter, pois implicam 0 estudo de toda a populacdo e costumam ser substitu/dos por valores calculados em amostras repre- sentativas da populagao-alvo. Se tivesse sido examinada uma amostra de 50 estu- dantes matriculados na disciplina D, e 40% fossem do sexo masculino, esse valor constituiria uma estimativa do parametro “percentagem de homens matriculados naquela disciplina”. A estimativa é 0 valor numérico de uma estatistica, usado para realizar inferéncias sobre o parametro. Da mesma forma, o valor numérico da média para a estatura desses 50 alunos, digamos 173 cm, é uma estimativa da média populacional. 18 Sidia M. Callegari-Jacques UMA NOTA FINAL A aplicagéo de uma técnica estatistica sofisticada nem sempre é 0 caminho mais adequado para melhor analisar os dados de pesquisa. Nenhuma técnica substitui 0 planejamento adequado, a aleatorizacdo, 0 trabalho cuidadoso no laboratério ou no campo € 0 controle das varidveis intervenientes. Pode alguém pensar, por exemplo, que os testes nao-paramétricos sao a panacéia para observacées descui- dadas ou experimentos mal executados. Nada mais longe da verdade. Tais testes apenas contornam as situagdes nas quais os testes cléssicos nao podem ser usados, como nos casos em que a distribuicéo dos dados esta muito afastada da normal ¢ nao ha possibilidade de correcio por transformacdes. Alids, sobre a esperanca de utilizacdo desses testes para remediar um conheci- mento insuficiente sobre o material experimental, R.A. Fisher (1971; p. 49) disse: Na logica indutiva, entretanto, uma pressuposigdio equivocada de ignordncia (sobre © material experimental) ndo é inécua; ela freqiientemente leva a absurdos flagran- tes. Os pesquisadores deveriam lembrar que eles e seus colegas geralmente sabem mais sobre 0 tipo de material com que esto lidando do que os autores de livros-texto escritos sem essa experiencia pessoal, e que no é provavel que um teste mais com- plexo, ou menos inteligivel, sirva melhor, em qualquer sentido, aos propésitos deles do que aqueles (testes) de valor comprovado no campo de trabalho dos préprios (pesquisadores)? O uso da afirmacao de Fisher neste texto nao tem a intengio de simplificar 0 problema da anélise dos dados, especialmente no caso em que muitas caracteris- ticas so usadas para descrever um fendmeno e realmente sio exigidas técnicas mais sofisticadas de anélise multivariada. Ela pretende chamar a atencdo, nesta era dos computadores pessoais e dos pacotes estatisticos de facil acesso, para o fato de que a estatistica é uma ferramenta e nao um ornamento de uma publica- cdo técnica e que o emprego excessivo e ndo-fundamentado de métodos estatisti- cos nao contribui para tornar o trabalho mais confidvel, sugerindo, pelo contrério, um artificio para encobrir a pobreza dos dados. "In inductive logic, however, an erroneous assumption of ignorance is not innocuous; it often leads to manifest absurdities. Experimenters should remember that they and their colleagues usually know more about the kind of material they are dealing with than do the authors of text-books written without such personal experience, and that a more complex, or less intelligible, test is not likely to serve their purpose better, in any sense, than those of proved value in their own subject.

You might also like