You are on page 1of 28
CAPITULO 2 FLUXOGRAMAS E QUESTOES CIENTIFICAS Ciéncia é uma arte, e arte diz respeito & comunicaggio. Um pintor vé uma palsagem e determina o que ele quer retratar (p. ex. harmonia, quietude, grandiosidade) e representa esta qualidade essencial em duas dimensées, usando cor, textura @ forma. Dependendo da escola a que o artista pertenca, ele pode querer transmitr algo a respeito da paisagem ou de si mesmo, (ou ambos. Um cientista faz quase a mesma coisa. 0 ecélogo, olhando para a paisagem, pode pensar em reduzi-a a uma qualidade essencial (ex. competigéo, mutualismo, restrigdes fisicas, metabolismo) e representa esta qualidade em duas dimensdes, usando palavras, gréfioos e férmulas mateméticas. Muitas vezes 0 cientista acredita que sua representagéo da Tealidade @ “objetiva" e a Unica que uma pessoa racional podera fazer. Contudo, cedo ou tarde ele aprende, através de sua cexperiéncia pessoal ou pelo estudo da historia da ciéncia, que sua representagéo é apenas parcial ¢ que esta distorcida pelos filtros de sua cultura @ de sua época. Assim, ele considera alternativas e tenta calcular a probabilidade de estar errado. Este ppracesso ¢ formalizado na matemética da estatistca inferencial. Em ciéncia, espera-se que 0 autor esteja comunicando mais sobre a paisagem do que a respeito de si mesmo. ‘A principal conrbuigao do lider de um grupo integrado de pesquisa 6 a elaboranéo de um ciagrama bi-dimensional do, sistema que esta send ivestigado. Vamos chamar este desenho de ‘furograma”. Contudo, um engenheiro chamaria isto da “andlise de sistemas’, enquanto um psicblogo falaria em *madelos causais". Eoéiogos frequentemente fazem “andlses de caminhos” (Path Analyses) Os detalhes desses métodos néo importam no momento, 0 importante é entender que diferentes pessoas enfrentando problemas complexos fazem uso de técnicas similares e essas téicas ndo sto propriedade de uma ou cutra disciplina. Hé uma arte para fazer flurogramas ¢ algumas regras basicas, mas apenas a prética leva & competéncia, Nés descobrimas que, dos modelos complcados, os fluxogramas so 0s mals fécels de serem entendidos pelos estudantes e, portanto, é um bom lugar para se comegar a tratar da complexidede da natureza. Alguns estudantes mais avangados professores de cursos de bioestatistica podem querer procurar em Higashi e Burns (1991) outras maneiras de conectar elementos ds ecossistemas. ase SM MAEM CComece por decidir o que vocé esta estudando, Isto precisa ser alguma coisa mensuravel. Conceitos complexos como qualidade aniverta’ “edad de conser? e“hysina sta sn Kem imRNeeR, os yee mene cn WM CANES CE podem ser reconhecidas pela maioria das pessoas @ por isso néo ser4o Utes. O que & que reaimerti Se Geseja medi? Cuaitace ‘ambiental podetia signticar condigbes que propiciem longas expectatvas de vida para seres humanos, condiqdes que propiciem ‘a seres humanos uma ampla variedade de atividades ao ar livre, condigdes que permitam a perpetuagéo de comunidades de ‘animais ou plantas que existiam no local quando as populagGes humanas eram pequenas, ou qualquer outra de uma muttidéo ce condigdes que qualquer pessoa considere indicativa de “qualidade”. E preferivel envoler toda a equipe no processo de decisdo sobre quais sto as questbes do estudo, mesmo quando aparentemente as questées tenham sido determinadas pela agéncia financiadora. Esta parte do estudo ¢ usualmente a mais dice, por essa razdo,é evitada na meaioria das propostas. Néo hd questdes implicitas ou dbvias em um projeto de pesquisa. ‘Se a questo nao foi explcitamente colocada, signitica que o lider do projto esté confuso, ou é incompetente, ou pior ainda, esonesto, Sao palavras duras, mas a consequéncia de questies vagas é o desperdicio de temp, dinheiro e credibilidade dos cientistas. Hobbs (1988) apresenta um fluxograma engracado, mas ao mesmo tempo trégico, que representa a contribuigdo de pesquisas ecoldgioas na tomada de decisées. Cada centavo desperdicado em uma pesquisa rum, poderia ser usado para salvar vidas de criangas carentes, Temas trabalhado em palses e regides pobres e admitimos que nos tomas intolerantes com esforgas de pesquisa desperdigados. Ha muitos textos sobre processos de decisdo disponiveis nas lvrarias @ nao vamos nos ‘alongar neste assunto, Uma boa introdugéo a esta discusséo pode ser encontrada em Tukey (1960, 1980) e no capitulo 1 de Caughley e Sinclar (1994). Uma discussdo mais ‘estatistca” dos problemas na selecio das questées € medidas em estudos integrados pode ser encontrada em Osenberg et al. (1996). Vamos assumir que @ questo ou a varavel a ser investigada ja fol determinada e focalizar no problema de decidir o que pode afetar esta varivel e de que manera Construindo a hipdtese inicial \oo® pode comegar com a preissa de que qualquer coisa éconectaéa oom tudo o alse tentarcooca tudo em Se ‘modelo, [sto andlago a um escultor querer colocar uma montanha intra sobre o seu pedestal - uma perda de tempo. Por outro lado, vocé pode montar um sistema tdo simples que ele ndo tenha mais semelhanga com o mundo real e, novamente, desperdigar esforgos. Nosso modelo deve ser simples o suficiente para ser manejével, mas complexoo sufciente para capturaraidéia central io problema. Esta é a arte do cientista. Uma boa discussdo sobre construcdo de madelos pode ser encontrada em Starfield € Bleloch (1991). Os leitores que se sentem confortéveis com uma matemética um pouco mais complexa podem consultar bei? FLUXOGRAMAS E QUESTOES CIENTIFICAS Burnham ¢ Anderson (1998). Contudo, estamos interessados em um nivel muito mais geral do que estes autores e @ construgdo de modelos 6 uma arte que vem com a ] experiéncla. Néo se envergonhe se seus primeiros modelos néo parecerem bons. Mesmo um modelo ruim é util, nem que seja para mostrar as limitagdes do pesquisador ou de seus dados. Neste capitulo, ¢ no resto deste livro, iremos tratar de modelos ¢ suas premissas. Por vezes, construgdo de modelos aparenta ser um processo técnico. Entretanto, modelos envolvem conceitos filos6ficos mais complexos do que @ matematica. ‘Apresentamos duas citagdes de Allen (1998), que refletem também 0 nosso ponto de vista filosdfico. "Modelos, que no passam de réplicas dos sistemas reais, no podem ser a representaco fel dos sistemas em todas as siuagGes. Portanto, todos os modelos so err6neos, no sentido de diferirem das observagoes. Obviamente, a nocdo de certo e errado nao serve para nada ‘em modelagem, € dizer que um modelo, que tenha sido construido com légica € consisténcia, & acertado ou erréneo, no vem ‘ao caso... Todas as premissas séo falsas em algum nivel, portanto, a corregéo das premissas esta fora das possibilidades, e também néo vem ao caso". A ciéncia néo diz respeito & obtengao de respostas para tudo; refere-se a encontrar situagdes onde se possa ir adiante com uma premissa — e ainda conseguir que 0 modelo tena alguma utilidade. Se vocé espera respostas absolutamente certas para todas as questdes, sugerimos que abandone este livro @ procure suas respostas na teologia, embora, ‘talvez fosse adequado antes fazer uma leitura de Dawkins (2009) para uma reflexao sobre as dificuldades em se obter respostas absolutas. Vamos comecar com um exemplo simples, relacionada com uma questio evoldgica (figura 2.1). A mesma légica pode ‘ser aplicada a estudos em outras escalas, como em experimentos laboratorials sobre fisiologia ou questoes sobre padroes biageograficos em escalas continental. Este fluxograma 6, obviamente, uma simpliicacdo to grande que néo permite a andlse na presente forma. Mas, ainda assim, vamos usé-io para discutir 0s mecanismos de construgao de um diagrama. Este fluxograma preliminar é importante ‘porque ilustra a hip6tese inical e as premissas. Voc® est interessado na densidade de uma espcie de lagostim, presumivelmente porque ele tem importéncia comercial ou por estar sendo considerado como ameagado de extingdo, ou alguma outra razdo que justiique os gastos. Caso se descubra que os membros da equine néo esto de acordo com a questio geral, voc® deveria repensar o problema antes de submeter a proposta Examinando 0 fluxograma mostrado na figura 2.1, descobrimos que a equipe acredita que os fatores mais importantes que esto afetando a densidade do lagostim sao o fitoplancton, a poluigéo do corpo de agua e peixes predadores. Espera-se que experiéncia, informagao da literatura e bom senso sejam usados | para decidir quals os fatores mais importantes a serem estudados. minares de oures coisas que potencialmente podem ser importantes, como predagdo por péssaros, tipo de substrato e doengas nao foram incluidas, Esta 6 uma deciséo subjetiva e os pesquisadores podem estar errados, Entretanto, eles corajosamente rmastrarar ques ftores eles acredtam ser prioréios para a pesquisa ¢ 0s leitores podem facimente ver quaisfatores foram 7 ‘stage seu nureoa deixados de fora. les serio criticados por muitos biélogos de escritrio, que exortardo a necessidad de incluso de iniimeras ‘utras variaveis que poderiam ter afgum efelto sobre o lagostim. Este é 0 prego da honestidade e intsgrdade. Além disso, alguns dos revisores podem até tecer orticas realmente construtivas. yom \ DENSIDADE DE LAGOSTINS ya POLUIGAO. FITOPLANCTON Figura 2.1 ‘A primeira coisa a notar no fuxograma, é que as setas indicam a diregdo do feito, Uma seta com pontas nas duas extremidades indica que cada uma das variaves influencia 4 outra. Se nao ha pontas de fecha no trago que une duas variéveis, indica que elas variam conjuntamente, mas nenhuma afeta diretamente a outra. Embora teoricamente possivel, nenhuma destas duas situacées 6 itil para modetagem ¢ o litor deveria procurar uma terceira variével que explique a relacao. ‘A‘igura 2.2 mostra uma correlacdo, que pode ser substtuida peta figura 2.3. Se duas vardveis tém uma relagdo causal, ‘como aparece na figura 2.4, deveriamos ser capazes de incluir um ou mais fatores que explicassem esta causalidade, ca forma exemplificada na figura 2.5. wt? FLUXOGRAMAS E QUESTOES CIENTIFICAS CAPACIDADE PROFISSIONAL ee Figura 22 EDUCAGAO, fp ks ae CAPACIDADE PROFISSIONAL “Se SAUDE Figura 2.3 EDUCAGAO CAPACIDADE PROFISSIONAL SAUDE ya Figura 2.4 stars en wareuta, EDUCAGAO, | CAPACIDADE ESCOLARIDADE HIGIENE PROFISSIONAL SAUDE Figura 2.5 Este exercicio resuitou em fluxogramas que mastram os fatores que julgamos importantes para o processo em estudo € ‘© que afeta o qué. € caro que todos os modelos apresentados até agora demandam ainda muito trabalho e pode ser afc! admitir ‘que eles so vitals como ponto de partida de estudos cientficos. Eles ndo sto ‘sofisticadas" no sentido orginal da palavra, que ‘era “desnecessariamente complexos", e ndo contém aqueles hierdglfos que usualmente associamos com textos cientticas, como “P< "QU" y=..." Surpreendentemente, estes diagramas so neoessérios para interpretar a malora das andlses estatstcas. Os estudos cientficos investigam uma, ou algumas vezes muitas, das flechas de um fluxograma, Raramente ocorre de os pesquisadores Investigarem todas as setas de seus modelos, mas sem o diagrama é dificil erxergar onde o estudo se encaira dentro de todo 0 esquema. Veremos, também, que s6 poderos determinar a validade da maioria das andlises estatistcas se soubermos onde elas se encaixam no fluxograma, Retomnando ao exemplo do lagostim, vemos que sua densidade presumivelmente depende de muitas outras variaves. Isto justfica sua designacio de "varidvel dependente" no jargao estatstco. Entretanto, pademos notar que algumas das outras variéveis em nosso modelo (chamadas de “variéveis independentes') so, de fato, dependentas umas das outras. Isto pode complicar nossas andlises. Além disso, algumas das vardveis que afetam diretamente @ densidade dos lagostins produzem também efeitos indiretos, porque elas influenciam outras varidveis que afetam a densidade do lagostim. Por exemplo, 0 cdesmatamento afeta diretamente a densidade do lagostim, mas também afeta indiretamente, porque 0 desmatamento afeta @ ppoluicdo do riacho, que afeta a densidade do lagostim. Existem técnicas estatisticas para lidar com efeitos indretos e variaveis independentes quando elas néo so realmente indenendentes umas das outras, como as descritas no capitulo 11, mas, pa favor, ‘no pule para este capitulo ainda, Raramente poderemos satisfazer as premissas destas andlses e a maioria dos pesquisadores de sua equipe estara focalizada em partes limitadas do seu diagrama, Antes, precisamos considerar os diferentes modos dos pesquisadores estudarem as setas que lhes cabem do diagrama, porque a maiara destes modos nao contribul para gerar os dados nevessérios para a andlise estatistica do fluxograma global 20 (uno? FLUXOGRAMAS E QUESTOES CIENTIFICAS Trés tipos de estudo 1. Isto é real? ‘A questéo basica, ¢ frequentemente a Unica questio deste tipo de estudo, é determinar se um efeito existe. Isto equivale ‘a perguntar se nds deveriamos mesmo incluir esta seta em nosso diagrama. Pode parecer simples provar que um eteito existe, mas nada 6 tio simples assim. Alguns poucos cientistas calculam a probabilidade de que a seta exista, langando méo da estatistica Bayesiana (Capitulo 14), e sem divida os cientistas adeptos da estatistica Bayestana tém faclidade de se comunicar ‘com polticas e com 0 piiblioo em ger. Albert (1997) nos da uma explanagdo facil de ser digerida de como a estatistica Bayesiana pode ser usada para responder questes simples. Eniretanto, a estatistica Bayesiana néo 6 facil de se entender ou ccalcular (Moore 1997), ¢ Guttman (1985) refere-se a ela como "uma cura pior do que a doenga’. A maioria dos testes estatisticos, dos textos de estatistica e dos programas estaistioos para computadores sao baseados em técnicas frequentistas e caloulam a probabilidade de a seta nd exstir em nossos fluxogramas. Isto esté longe do que o senso comurm indicaria como o procedimento l6gico e no & 0 tipo de probablidade com que a maioria das pessoas se sente & vontade, No entanto, a maiovia dos testes ‘estatisticas cue os membros de sua equipe i usar seré baseada em técnicas frequentistas (/e. na filosofia Popperiana). Portanto, se o leitor nfo é familirizado com a filosofia Popperiana, devera lero capitulo 5. € importante entender que frequenterente os testes estatistioos mais poderosos nao respondem a questo “O efeito ormalmente existe?", mas sim & questo “Se todas as outs variaveis forem mantidas constantes, a mudanca desta variével produz algum efeto?". Estes testes consideram anenas 0s efeitos drets, torrando os efeitos indietas impassiveis de serem ‘avessados, porque constrangem as outras varveistratando-as como constantes. Esta diferenga no é trivial. Alguns fatores que ‘no tém efeitos diretos nas variéveis-resposta padem ser muito importantes no mundo real € algumas varidveis que normalmente t8m um pequena efit dreto, cfc de ser detectado em campo, podem ter grande potencal para a medicina ou agricltura, se seus nivels puderem ser manipulados artficialmente, ‘Amaneira mais convincente de mostrar que efeitos diretos esto atuando 6 através de um experimento que manipule 0 sistema, de forma que apenas as variavels estudadas possam influenciar o resultado, Diz-se que os resultados destes cexperimentos permitem uma “inferéncia forte" (sensu Platt 1964), j4 que as variéveis que poderiam estar confundindo 0 resultados foram eliminadas. Contudo, 0 resuttados obtidos podem néo ter muita relevdncla para o mundo real (p. ex. Carpenter, 1999) e os ecélogos sero sempre capazes de sugerir um ou mais fatores que poderiam ter algum efeto Tukey 1991, Johnson +1999), mesmo que estes efeitos ndo tenham muita importéncia nos sistemas nao menipulados. O ide ¢ os membros do grupo precisam se assegurar de que as questdes formuladas por cada um dos pesquisadores da equive sejam relevantes para a questéo geral a esac su naretrex 2. Qual é a forma e a magnitude do efeito? Descobrir que um efeitoé ou néo diferente de zero frequentemente nao é muito tl (p. ex. Rosenthal & Rubin 1994). segunda fase da pesquisa requentemente lvanta questes a respeito da forma da relacio existente ou que se presume xis ‘Armaioria dos modelos 6 construida sobre relagbes ineares simples ou lnearizadas © nosso fluxograma reflete ist. Poderiamos achar que, para cada pei predador aorescentado ao sistema, raduzims a densidad do lagostim em ts indvduos por metro de riacho. Mas, um resultado simples como este é improvavel. Multos estudos ecoldgicos tém mostrado que o efeto de predadores sobre as densidades das presas no é simplesmente ume func linear de suas densidades. Caughey @ Sinclair (1904: Captulo 11) fomecem muitos exemplos. Lagstins em pequenas densidades podem rio ser sufcientes para manter opulages de pees. Em alas densidades de lagstns, @populagdo de peies pode ndo ser limtada pela cispanbleade de ‘alimento, mas por outros fatores, como, por exemplo, a densidade de seus prbprios predadares. Muitas valves que afta processos biolégions se comportam desta forma, nao produzindo efits em baixos nies, efeitos postvos em nivels intermedérios efeitos negatvos em niveis elevados. A figura 2.6 mosia a relagéo entre @ temperatura © a proporgo da popuiago de um insetohipottico em adade. Pensem quantas relagdes em seu campo de estudo t8m esta forma. £ importante conhecer a forma da relagdo entre as vardveis para decidir como vamos incorporé-ias €m nosso modelo, se devemos mudar as unidades de medida das varvels (au sea, transformé-as), ou se vamos decidir investigar apenas uma ‘gama liitada de condi, entes que possamos aplcar a malaria dos testes estatisticos ou ténicas de modelagem. Na verdade,¢ dbvio que precisamos de informagéo sobre a forma da relagéo antes de testar se um efeto existe. Se compararmos cos nveis de atividade do inseto a 5°C @ a 20°C, concluiremos que a temperatura tem pouco ou nenhum efeto, ao passo que, ‘se compararmos os nveis de atvidade nas tempeaturas de 5°C e de 15°C, conciremos que a temperatura tem um efeto muito forte. Este problema é frequente quando séo aplcados testes para determinar a existéncia de fendmenas com premissas incorretas quanto ao formato da rela, ou quando os pesquisadores nao investigaram todos os rivels passives do fendmeno. ‘Vamos considerar mais sobre estas questdes nos capituios 8 e 10. BILD? FLUXOGRAMAS E QUESTOES CIENTIFICAS 75 T 7 T T eof 4 & ast A 3 30} 4 é 15 1 a 1 . 0 5 10 18 20 25 TEMPERATURA) Figura 2.6 3. 0 que acontecerd se as condigées mudarem? Muitos pesquisadores gostariam de responder 4 questo “Quanto efeito uma variével tem sobre a outra” e este ¢ 0 terceiro nivel do estudo. Infelizmente, quase sempre, a resposta é “depende”. Para responder a esta questo, devemos investigar ‘os niveis em que esta variével normalmente ocorre no sistema, nas frequéncias em que estes niveis ocorrem. Entéo, normalmente _as manipulagdes experimentais recomendadas para a “inferéncia forte” nao sao apropriadas para responder a esta questo. Alem disso, quando 0 efeito de uma variével depende dos niveis de outras varidveis ‘independentes", como ocorre no mundo real, nao hé uma nica resposta correta (i.e. a resposta é “depende”). Usualmente, as pessoas que se dedicam & modelagem de sistemas nao tentam fazer previsdes precisas e ndo esto interessadas em experimentos de “inferéncia forte". Elas tentam simular como. ‘0s sistemas funcionam, usando um computador e relagdes matematicas simples. Elas modificam o nivel e/ou a variabilidade de cada fator € rodam o modelo centenas ou milhares de vezes para tentar determinar quais as varidveis mais importantes do ‘Sistema, Alguns pesquisadores, especialmente aqueles que empregam métodos bayesianos, usam Cadeias de Markov em procedimentos de Monte Carlo com milhées de simulagdes, para obter estimativas de parémetros baseadas em médias ponderadas de todas as simulagdes. Se vocé tem um modelador em sua equipe, vocés deveriam discutir logo as necessidades dele, porque geralmente os modeladores nao podem fazer uso do tipo de dados que a maioria dos pesquisadores coleta. Osenberg e colaboradores (1999) fomecem uma boa discussdo sobre as dificuldades enfrentadas em estudos integrados, mesmo quando todos os pesauisadores esto ostensivamente estudando a mesma questéo simples, S@ @ complexidade das estatisticas que os pesquisadores de seu time empregamo ] atordoa, considere delinear o estudo para permitir andlises mais simples, ao invés de ficar tentando reparar os erros amostrais por meio do emprego intensivo de matematica. 2 ST Se aE Vimos que 05 pesquisadores podem ter questées muito diferentes, mesmo quando esto aparentemente estudando mesmo fenémeno, Alguns cientistas tentam encontrar uma situagaa intermediaria, colatando dados de uma maneira que permita fazer inferéncias sobre a probablidade de um efeito ocorrer, e também obtém os dados necessérios para os madeladores de sistemas. Provavelmente, eles serdo criticados por todo mundo. No ha uma resposta correta,e a ciéncia tem avangado espetacularmente com pesquisadores diferentes trabalhando com diferentes abordagens. Entretanto, em estudos integrados, tanto o lider quanto os colegas de equipe devem conhecer que tipo de coleta e andlise de dados cada membro pretende fazer, e precisam decidir o quanto esses dads serdo utes para os demais, Delineamentos amostras integrados so frequentemente os mais efcientes e dscutiremos alguns daqui a pouco, mas antes, vamos considerar a escala da questi. Qual o tamanho do problema? Muitas das controvérsias na literatura cientfica ocorreram porque pesquisadores trabalharam sobre o mesmo problema ‘em escalas diferentes, A densidade de uma espécie de planta pode ndo ser relacionada com caracteristcas do solo em uma scala de dezenas de metros, embora as caacteisticas do solo expliquem grande parte da variagéo na densidade de plantas entveregdes. Mas em uma escala mais ampla ainda, por exemplo, em uma escala continental, pode no haver relay ene @ ocorrénca de espéciese os tipos de solos. resposta para a questo de se o solo afta a dstibugao de espécies & “no, sim, ro", Se tvéssemos examinado outras escalas, poderiamas ter obtido outras combinagdes de sim e no. Portanto, néo ¢ surpreendente que os ltores de revistascientficas quem contusos com os “avangos" da ciénciae 0 pblicogeral ainda als ‘len e Sar (1962) apesentam uma série de fotogratias de um jogo de futebol que mostra como a escala na qual se observa tm sistema determina o que podemas descobrit. Quando visto de um avo, ndo possivel tar conciusbes a respeto do jogo, embora possamos ver todo o esto e ter uma boa iia. do comparecimento do pico, Mals pero, pademos ver os jogadores ras ao fundo, a imagem do pblico nas arqibancadas se mistura& dos ogadores. Na aproximagdo sequin, é posse observar a agio de jogadoes indus eo jogo em progresso. Numa escala ainda mais prxima, em um ponto de vita n interior a bola, a fotografia € completamente negra. Os pesquisadores pensam bastante nestes aspectos quando vao assist a jogos de futebol, mas, surpreendenterente, costumam dar pouca atengéo a eles quando planejam seus studs cients. caro que nfo hé uma escata “coreta para os estudos cientficos, Muito artigo recentes tim dscutido a importncia da escala (9, ex. Peterson & Parker 1998, Lavton 1999, Pascual & Levin 1999, Petersen et a 1999), Alguns Gos avangos cients mais importantes vem de estuds em escals diminutas e outros em escalas muito grandes. Entetanto, em um estudo stegrado, especialmente um desentado para subsiiar 0s potics na tomada de devisbes, averé um que Timitado de escalas 4 GinTiLO? FLUXOGRAMAS E QUESTOES CIENTIFICAS apropriadas para atender a necessidade geral do estudo,e estas escalas s40, usualmente, grandes radshaw 1998, Ormerod ‘etal, 1999), Para decidir em que escalatrabalhar voc® deveria primeiro considerara érea/populagdo/periodo de tempo/situagdes fisicas/quimicas'socials a que voo8 deseja que os resultados se apliquem. isto é chamado de seu universo de interesse Potencialmente, todos os membros da equipe podem trabalhar em escalas similares, mas os cientistas tendem a copiar seus desenhos amastrais de publicagdes recentes na itratura especalzada de sua area. Pode ser cfcll convencer um membro da equipe que ele deveria usar uma determinada escala de amostragem, se um famoso cientista acabou de publicar na revista de maior prestigio da area, um estudo a respelto do mesmo organism (ou processo), usando uma escala de amostragem ‘completamente diferente, Embora muito seja feito para inovar a ciéncia, a maioria dos cientistas acredita que serdo criticados or seus colegas se desafiarem os dogmas estabelecdos, inclusive no que tange a escala de amostragem — € eles estdo certs, Nos casos mais extreras,o lider da equipe deve decidir o quanto de prestiglo pessoal ele esté disposto a sacrificar pelo bem o projeto. Para onde ir? Em geral, os pesquisadores decidem qual método de andlise iréo usar copiando um dlsponivel na literatura, e no consideram a especificidade de suas questées. Por causa disso, as andlises tendem a defini as questdes, ao invés de as questées definirem as andlises (Yoocoz 1991). Portanto, & importante que o lider e cada membro da equipe tenam algum conhecimento sobre os conceitos que emlbasam os tinos de andlises mais comumente empregados pela maioria dos cientistas. ‘Afortunadamente, as andlses estatisticas mais usadas séo baseadas em poucos conceitos basioos, Para usév-s, precisaremos ‘ser capazes de construrfluxogramas, interpretar grficos simples e entender aflosofia que esta por trés dos testes de hipdteses. Os fluxogramas que construimos mostram onde pensamos estar. Eles nos sugerem experimentos criicos ou observagoes que precisamos fazer. Plat (1964) disse que deveriamos “devotar de 30 a 60 minutos por dia para reflexdo e andlise, anotando explictamente, em um cademo de notas permanente, as altemativas lOgicas referentes aos nossos experimentos crticos". Infelzmente, estas habilidades néo séo ensinadas na maioria dos cursos de estatistica para bidlogos. Tentaremos considerar alguns dos aspectos bésioos destas habilidades nos prOximos capitulo 2% CAPITULO 4 DESCREVENDO A NATUREZA: CONVENGOES “CIENTIFICAS” E ALGUMAS TECNICAS UTEIS Neste capitulo, vamos discutir algumas estatisticas simples, que so usadas para descrever dados ou as populagdes de medidas das quais eles foram obtidos. Técnicas estatisticas podem ajudar a elucidar padrées ocultos nas dados, se 0 modelo representado pelo nosso fluxograma for complexo, como veremos nos capitulos 8 e 10. Entretanto, a maioria das estatisticas fencontradas na literatura cientiica relaciona-se com situagées extremamente simples, e escondem mais os padres do que revelam, Seré util para os letores conhecer os termas, assim poderdo ler a literatura cientfica e conversar com seus colegas. ‘Mas, na verdade, apenas poucos conceitos serdo importantes para os préximos capitulos, © estes so conceitos faciimente visualizados em grétioos bidimensionais Vamos considerar um pesquisador interessado em lagostins, dentre todos os possiveis organismos aquaticos que ‘ocorrem nos rachos de sua area de estudo. 0 pesquisador amostrou 5 rlachos e apresenta os dados como o nimero de lagostins por 100 m de riacho. Os dados poderiam ser apresentados como uma lista de densidades (1, 3, 4, 5, 7 lagostins/100 mm Contud, estes dados sao frequentemente apresentados juntamente com autros dads para comparagao (veja capftulos 6 e 7]. Portanto, vamos refletir sobre como eles podem ser apresentados da forma mais proveitosa. A forma mais simples seria colocé- los em um gratico figura 4.1, 0 gréfico ocupa muito espaga no papel, mas possitilita @ avaliagéo instanténea do valor geral dos dados (médla) e a vvariablidace em torno da média. A maioria dos pesquisadores sabe instinvamente 0 qué a média reoresenta, mas no o que vrias estatisticas descritoras da variabilidade significam. A maioria dos iniciantes usaria a amplitude (a diferenga entre o maior 2 0 menor valor) para descrever a variabiidade, mas Isto tem a desvantagem de usar apenas informagao de dois dos cinco Pontos. Uma alternativa um pouco mais complexa, mas ainda intuitva, seria usar o desvio médio absolut, ou seja, a média das cistincias de cada ponto até a mécia. A figura 4.2 mostra estas distancias, exceto para a distancia do valor "4", que est & cisténcia zero da média, Poderiamos resumir os dados expressando a média=4 ¢ o desvio médio absoluto=(3+1 +0+1+3)/5=1,6. Usamos o desvio absoluto (médulo do desvio) porque a soma dos desvios simples serd sempre zero, ja que os desvios dos pontos sitvadas abaixo da média sempre séo negatvos. a strc ea marta 8p-— al Tr . blk | 5 & st . a S 4b . 2 2 . f 2 S 2 z | pe ee eee ee LAGOSTINS Figura 4.1 & & 8 9 & 2 5 2 re Beier eee LAGOSTINS Figura 4.2 (Com um pouco de prtica, a maori dos pesquisadores pode olar para um gro ¢ repidamenteestimar qual a reigo do gréfico compreendida entre a mécia menos um desvio absoluto¢ a médla mals um desvio absoluo. 0 desvo absolut ¢ Teo intutvo que se podera esperar que fosse a estatistioa mats usada para descrever a varablidade dos dados. No entarto, ele @ 2 ietulo| DESCREVENDO A NATUREZA: CONVENGOES “CIENTIFICAS” E ALGUMAS TECNICAS UTEIS raramente usado, e uma outra estatistica, o desvio padréo, ou alguma derivagdo dele, 6 0 descritor de varlabilidade mais ‘requentemente empregado, 0 desvio padrdo tem vantagens relacionadas com algumas andlises mais complexas, que sero consideradas em capitulos posteriores. Entretanto, ele esta longe de ser intuitvo. Entre uma a trés vezes por ano, nos iltimos 15 anos, temas solicitado @ nossos alunos de pés-graduagaa, que indiquem onde deve passar a linha que coresponde ao desvio padiéio de cada lado da mécla em gréficos simples como o da figura 4.1. Pouces puderam aproximar a posigdo corretae, destes, ‘quase nenhum soube explicar porque escolheram aquela posigo. Muitos destes estudantes ja haviam publicado trabalhos nos ‘quais usaram 0 desvio padrdo para descrever seus dados. Foi preocupante constatar que eles néo sabiam o que estavam ddeserevendo e que néo eram capazes de interpretar os resultados de outros autores que usaram o mesmo destritr. 0 desvio padido ¢ as estatisticas relacionadas séo usados to frequentemente que vale a pena despender um pouco de. tempo para visuaizar o que ele representa, Entretanto, lembrem-se que ha indmeros outros descritores de dispersao que podem ef mals apropriados em muitas situacdes (\glewicz 1983). Assim como 0 desvio absoluto, o desvio padréo ¢ baseado nas ciferengas do valor de cada observago em relagdo 4 média, s6 que, no caso do desvio padrdo as diferencas séo elevadas a0 ‘quadrado. Se somarmos os dasvios quacrados, teremos uma quantidade chamada “soma de quadrados”. Isto néo é muito iti para descrever a variablidade, porque, sendo uma soma, esta quantidade aumenta com cada observagéo extra. Contudo, se tomarmos a média dos desvios quadrados, teremias um descritor que é independente do tamanho da amastra. Isto é charmado de variincia, Mas, ao contrério da média absoluta, o desvio quadrado médio (variéncia)ndo ¢ util para descrever a variablidade, porque esté em uma poténcia diferente daquela dos dados originals e provavelmente nem iré caber em nossos grificos. Por ‘exemplo,é dificil de se visualizarlagostins com comprimenta mécio de cinco centimetros + quatro centimetros quadrados! Para ‘raver a medida de variagéo de volta & escala original em que as medidas foram tomadas, podemas extrair aralz quadrada. A ralz quadrada da média dos desvios quadrados é chamada de desvio padréo, Isto parece uma rota sinuosa para se chegar a um valor que ¢ diferente, mas no muito diferente, do desvio médio absoluto. (0s valores de um desvio médlo absolute (mostrados como estrelas na figura 4.3) e de um desvio padro de cada lado ia métia (pentgonos) sao quase Idénticos. Amos os desvios foram calculados para a populago ao invés de para a amostra, mas néo vamos explcar as diferengas aqui JA que, para a interpretagéo gréfica a diferenga é trivial, exceto para amostras extramamente pequenas. Vamos discutir sobre os usos do desvio padro posteriormente, mas, por hora, basta interioizar que o valor do desvio pacrao usuaimente no ¢ muito diferente da média dos desvios absolutes e, portanto, podemos imaginar a posigdo aproximada de um desvio padrdo em cada lado da média, em um gréfico. Ito deverd ajudé-los a entender as descrigdes que outros pesquisadores fazem de seus dados. sg sm woes 8 7 6 gE g5 ce 2 3 . = 3 2 o LAGOSTINS Figura 4.3 TTemos discutido a respeito de descritores de dados. Como os dados usualmente so amostras tiradas de populacoes muito maiores, estamos descrevendo apenas as amostras. Estes descritores, chamados “estatisticas’ so frequentemente usados como estimativas dos descrtores reals das populagGes eslatstcas, estes Uitimas chamados de “parametros". Alguns ‘autores usam terminologia um pouco diferente, mas, em geral, pardmetros s4o caractersticas das populagdes @ estatisticas sao estimativas dos pardmetros, baseadas em amostras, Note que, quando fatamos “populagdes estatisioas” estamos nos referindo ‘a populagies de nimeres, que podem ou nao estar relacionadas com populagdes bioldgioas. A populagdo de atures de homens possui uma média muito maior do que a média da populacdo de alturas de mulheres, ¢ estamos nos referindo a populagtes estatisticas. Mas quando se fala em “populagdo humana", estamos nos referindo a uma populagao biologica que consiste aproximadamente em metade de homens e metade de mulheres. A altura média de uma espécie de antlope pode ser igual & altura média de homens, mas isto ndo significa que homens e antilopes pertengam & mesma populagao biolagica. 0 desvio pacdréo é um pardmetro itl para descrever a variabilidade em uma populagao de medidas, se a populagdo de medidas tem uma dstribuigdo de frequéncias que se conforma a distribuigdo teérica chamada de “normal”. Neste ca80, cerca de 68% dos valores esti compreendido no intervalo de um desvio padréo em torno da média e cerca de 85% dos valores est ‘compreendido no intervalo de dois desvios-padres em torno da média. Se a astriouigdo no é normal, o desvio padrdo nao tem utlidade para descrever a variabilidade da populagdo (Mosteler & Tukey 1968), um fato que parece ter sido esquecido pela mmaioria dos pesquisadores. Podemos também calcular 0 desvio padro de parémetros, que 6 chamado de “erro padrao" (EP). Em geral, quando os ‘autores tratam de erro padto, sem especticar de qual parémetro, estao se referindo ao erro padréo da meédia. Para ilustrar isto, a DESCREVENDO A NATUREZA: CONVENGOES como IENTIFICAS” E ALGUMAS TECNICAS OTEIS usamos um gerador de nmeros aleatrios para produzi 300 medidas de uma distbuigéo com media € desvo pedro iguals aos dos dados que aperecem na fou 4:3. Eno, trams 60 amostras de cinco elementos, obtendo 60 médias, uma para cada mostra, A primeira amosta encontra-se ao lado das 60 médias na figura 4.4 @ a media que corresponde a esta amastra esta assinalada como um circulo cheio entre os cioulos vazios que simbolizam as outras médias. NUMERO AMOSTRA — MEDIA Figura 4.4 ‘Aamostra 1 tem uma média (2,4) que € bastante diferente da média real das 300 medidas (4), Entretanto, a média das {80 médias (2,6) fol mais préxima da médla real. Obviamente, a média de 60 amostras traz muito mais informagao do que ume inica amostra de cinco elementos. Com 60 médias, podemos também estimar 0 desvio padrdo das médias (erro padro) com razoével acuracia. 0 desvio padrdo das 60 médias foi 0,77. Portanto, esperamos que cerca de 68% das médias tradas desta populagio estejam compreendidas entre 4 + 0,77 e 4 — 0,77. A distribuigdo das médias tende & normalidade, mesmo se a istribuigdo das medidas originais ndo fosse normal. Isto € consequéncia do “Teorema do Limite Central” e é o que justia 0 uso de testes estatisticas baseados na distrbuiggo normal quando a papulagao de medidas originals no segue esta distibuigao, Se todas estas médias de médias e pardmetros de pardmetros os delxaram confusos, no se preocupem, ndo varTos sar muito estes conceitos, a ndo ser para examinar como alguns pesquisadores apresentam seus dadas, ¢ como eles poderiam aoresenté-los de forma mais simples ¢ efetiva. Ninguém usa 60 amostras para calcular um erro padro, porque os estatisticos ros dizem que podemos estimar 0 erro padrao a partir de uma inica amostra. Ha um erro padréo diferente para cada tamanho de amostra que desejarmos tra. Entretanto, com uma Gnica amostra de cinco elementos, podemos, teoricamente, estimar 0 desvio padrdo das médias vélido para um grande nimero de amostras de cinco elementos. 45 estas se etc ‘A formula "magica" ¢ apenas dividr a estimativa do desvio padréo da populagdo baseada na amostra pela raiz quadrada do niimero de observagdes da amostra. Em nosso caso, sabemos que 0 erro padréo das médias das amostras de cinco elementos esté proximo de 0,77. A figura 4.5 apresenta a cistbuigdo das 60 estimativas de erro padrdo, baseada em nassas 60 amostras. Nés acrescentamos nesta figura o erro padréo baseado no desvio padrdo das 60 médias, chamando-o de ‘real’, porque ele deve ser muito préximo do valor real do erro padrao, que desconhecido 15 1.0) NUMERO. 05 00 —- EPREAL ESTIMADOS Figura 4.5 Obviamente, as estimativas dos erros pacdo baseadas em amastras de cinco elementos so imprecisas. Multas esto distantes da melhor estat. Quanto maior 0 tamanno da amostra, mais acuradas as estimativas obtidas pela formula magica. Eniretanto,raramente elas podem ser melhor interpretadas por um estatistico do que um gréfico dos dads brutos, ¢ a maloria ‘dos pesquisadores (os letores de seus trabalhos) t8m apenas uma vaga idéla do que elas representam. & possivel inferr intervalos de confianga baseados na estimativa do erro padréo eno tamanho da amostra Os estudantes nterpretam um intervalo de contanga de 95% em torno da méia como se houvesse 95% de chance de que o parmetro real estivesse neste intervalo. Do ponto de vista da estatstica cdssica, esta explcago néo tem sentido. Qu a média cal no intervalo ou néo. A interpretagéo correta do interval de conflanga de Neyman (1937) & que, se um experimento for repetido muitas vezes, com o mesmo tamanho ‘amostral, e 0 intervalo de confianca for calculado para cada um deles, aproximadamente 95% dos intervalos calculads {rao incluir a média real (Bard 1974). Entretanto estes intervals de confianga sé funcionam se fore aplioads em todas os casos. Se intervalos de conflanca forem apicados apenas apds algum teste estatstioo ter tdo resultado significative, como é a prética Corrente, entéo os intervalos de confianga calculados usando as férmulas dos livros texto so pequenos demais (Meeks & cWito4 DESCREVENDO A NATUREZA: CONVENCOES, “CIENTIFICAS” E ALGUMAS TECNICAS UTEIS D'Agostino 1983). Poucos pesquisadores entendem estes conceitos. De qualquer modo, a maloria dos erros padréo é ‘apresentada em gréficos sem qualquer informagdo do tamanho da amostra na legenda (Magnusson, 2000a). Frequentemente, ha diferentes tamanhos de amostras em diferentes partes do gréfico. Isto demonstra cultura “cientfica”, mas no comunica muito mais do que isto. ‘A seguir lustraremas diferentes métodos para apresentar dads em gréficos e debvaremas que os litores decidam quals ‘0s melhores para comunicar informagées sobre os dados obtidos. Primero, vamos considerar um gréfico mostrando dados de uma amostra pequena (figura 4.6) 25) 20 15 NUMEROS POR 100m NUMEROS POR 100m LAGOSTINS: Figura 4.6. ‘A figura 4.6a mostra os dados de densidades de lagostins em diferentes riachos.A figura 4.60 foi baseada nos mesmas dados da figura 4.6. Ela mostra algumas estatisticas usadas para sumarizar dados e que frequentemente aparecem em € g ae ern ara B ° ° ° ° ° fei 1 % courenes sorreies courses eure coureies sarees Figura 6.1 St sarin sen TEMA Fete processo, que Dytham (1998) chamou de ‘coleta de dados substitutos" ("collecting dummy data’) parece ser trivial, mas 6 uma das maneiras mals poderosas de se planejar a pesquisa, Connolly et al. (2001) chamaram de “experimento de ppensamento® (thought experiment, Ha muitas formulas mateméticas elegantes para decidir quantas observacdes séo necessérias para se detectar um efelto de uma dada magnitude (p. ex. Kebs 1980), enretanto todas requerem amostras preliminares @ a Imaioria somente pode ser aplicada em situagdes trvaimente simples. Em geral, solicitar a um pesquisador experiente que esboce um grfico mostrando a varablidade esperada para aqueles dados ¢ quase tdo bom quanto qualquer um dos métodos ‘que empregam computagées matemticas. Apenas va aumentando 0 niémero de pontos no gréfico, até que o padréo parega convincente, Hé algumas “dicas" que podem ser usadas, se voc® néo conseguir extra dos seus colegas de equipe informagéo Util em relagdo as questdes na escala proposta para o projeto. Dados ecoldgicos usualmente mostram variablidade semelhante Aquela da figura 6.1. Assim, para comparagdes entre categorias, devera haver pelo menos quatro observagSes por categoria Ou preferivelmente mais, Entretanto, geralmente ndo ha vantagem em ter mals que dez observacbes por categoria, a ndo ser que 1 dados possam ser coletados facilmente e a um bavo custo, ou se hd alguma razao especial para desejarmos detectar dferengas muito pequenas entre as categorias. Vamos ofereoer outras dicas de como decidir 0 tamanho da amostra nos wbrimos capiules, nas quatro cheer aghes por categoria ao funconar bem para a malaria ds casos, quando as varaveis de interesse so de fato categoricas. Qual a qualidade da informagaéo? Para responder a questio “Quanta informacdo é suficiente?" precisamos primeiro responder “Qual a qualidade da informagéo?". Esta 6 uma pergunta importante, porque nossas questées estatisticas devem refleir as questées biol6gicas, Em ‘meados da década de 80, 0 estatstico Stuart Hubert alert 0 mundo a respeto de um tio de erro que vinha coorrendo em ‘grande parte das andiises ecoldgicas, e que ele denominou de “pseudorrepetigao”. Repetigdes sto 0 que os estatsticas chamam de observagdes independentes. Geralmente, espera-se que a quantidade de informagao disponivel aumente com o nimero de ‘observagées, mas nem sempre é assim. Quando uma nova observacéo foneve apenas a mesma informacéo que tinhamos em ‘observagGes anteriores, ela ro aumenta a quantidade total de conhecimento cisponive para nds, e pode nos confundir ¢ nos fazer acreditar que dispomos de mais informacdo do que realmente temos. Porque esta observacdo néo é uma repetigao real, ro sentido de fornecer mais informagdo, Hurlbert denominou-a “pseudorrepeticdo", que significa falsa repeticao. Hurlbert (1984) forneceu muitos exemplos bons, mas vamos continuar com nosso exemplo do lagostim. Lembrem que & questéo bioldgica era eterminar se a presenca de pees predadores inluencia na densidade dos lagostns. O que aconteoeria se nosso biologo ‘amostrasse cinco segées de um riacho sem peixes e cinco segGes de um riacho com pelses predadores? Todas as segdes do primeio riacho poderiam ter menas lagastins porque este riacho era menos pradutvo, ou porque fora polio ou por causa de 52 (wills QUANTA EVIDENCIA £ NECESSARIAZ ma epidemia no passado recente ou qualquer um de uma multiddo de fatores que poderlam afetar os lagostins, Para @ nossa ‘questdo, uma observagéo da densidade de lagostins em um riacho obviamente néo é independente de outras observagies no ‘mesmo riacho, Portanto, as cinco observagdes no carregam muito mais informagao do que uma tnica observacéo. Este erro simples permeia a Iteratura cientfica, Kruskal (1988) fornece varios exemplos de falta de independéncia em sttuagées que ndo tim nada aver com cléncia. Cada coisa est conectada com tudo o mais e¢extremamente dll determinar auando as observagtes s40 reelmente independentes. A engenhsidede dos clentista revla-se em sua capacidade de coletar cservagdes realmente independentes em relagdo a suas questdes, mas é uma qualidade rra.Portanto, os membros de grupos integrados precisam se certificar de que as observagdes que estdo sendo feltas por seus colegas de equipe no s40 pseudorepetigées em relacdo questéo global. to ¢ uma taref fl, porque nenhuma observago &inerentemente vida ou invdida, Uma pseudorepetigdo para uma questi pode ser uma reptico vada para outra, Por exemplo, se o nosso bidlogo estivese interessado em dferengas nas densidades do lagostim entre os dis rachos e apenas entre os dois), as 5 observagées em cada corpo «gua poderiam ser reptigdes perfetamente vidas, cada uma trazendo mais informagdo a respelto da ‘ensidade do lagostim em cada rach. ‘As pseudorrepetigGes podem ser espaciais, temporas, flogenéticas ou técnicas. Nés discutimos um exemplo de pseudorrepetigao espacial e Hurlbert (1984) fomece indmeros outros. Este é o tipo de pseudorrepetigao mais comum, mas também & a que pode ser evitada com maior facilidade. Os membros da equipe vao atribuir suas pseudorrenetiodes espaciais a ificuldades logisticas, mas 0 tempo e dinheiro gastos em transporte usualmente so mais do que compensados pela solidez das conclusdes que podem ser tradas de evidéncias de alta qualidade, coletadas na escala espacial apropriada. PseudorrepetigSes temporais so mais dfceis de se detectar e evitar. Qoortem porque o estado de um sistema néo pode mudar instanteneamente, Se uma érvore est produzindo frutos em um més chuvoso, provavelmente ainda estaré produzindo frutos no més sequinte,¢ a precipitagéo nesse més provavelmente ainda seré alta, Parace haver uma grande associagdo entre atta precpitagdo e produgéo mensal de rutos, embora 0 evento que determinoy o inicio do processo de frutficagéo tenha ‘oorido muitos meses antes, ainda durante a estagéo seca, Por esta razdo, as questées envolvendo sazonalidad no podem ser respondidas em um tnico lugar em apenas um ciclo, Décadas de trabalho em um nico lugar ou estudes em muitos lugares com alferentes padrdes climéticos so necesstrios para se determinar os efeitos de mudangas estacionais em sistemas biologicos. A despeito disso, muitos membros da equipe vo querer estudar sazonalidade, porque eles acreditam que os efeitos da sazonalidade s20 to ébvios que eles certamente conseguiréo resultados “significatives”. Variaghes temporais séo extremamenteaificeis de se estudar(p. ex. Powell & Steele 1995, von Ende 1993) e as membros de equipes deveriam procurar ‘-aconselhamento de estatistcos especialzados, antes de incluirem variagdo temporal nos abjtivas gers de seus estudos. Pseudorrepetigdofilagenética 6 um tépico complexo e, na maloria das vezes, esté associada a estuds onde espécies ‘io as unidades amostrals. 0 leltores mais interessados podem consultar Garland et a. (1992), um bom ponto de partida para este tépico. Estudos com sementes, girins e larvas de insetos frequentemente sotrem de pseudorrepeticdo flogenética, porque sas seu enti (0 organismos usados nos experimentos tém estreit parentesco. Sementes de uma tnica érvore, girinos de uma mesma desova ‘ou larvas de insetas encontradas em um local em particular so frequentemente muito similares, por causa do material genético (u efeito do aprovisionamento matemo e usualmente néo apresentam todo 0 espactro de respostas exibido por populagdes maiores. Em vez de tentar fazer corregdes para excuir efeitos filogenéticos, usualmente ¢ preterveltentar coletar indviduos no relacionados entre si para os experimentos. Se a escala de amostragem for apropriada para a questo, isto deverd acontecer quase naturalmente Pseudorrepetigzo técnica ocorre quando diferentes observacores ou instrumentos sao usados em diferentes partes do experimento, Quando no é detectada, ela recai no que Hurlbert chama de “intruso demoniaca”, mas hé poucas desculpas para este tipo de erro na maioria dos estudos bem planejados. Ocasionalmente, ha falhas de equipamento ou acidentes de percurso {que podem alterar os resultados. Nestes casos, admit honestamente a possibidade de psaudorrepeticao € a Unica opco. Retornando ao nosso grtico, 0 efeito de pseudorrenetigao ¢ reduzir 0 nimero de observagdes realmente independentes, {que podem ser representadas por pontos no grafico. Se apenas dois riachos foram amostrados, todos os pontos mostrados na figura 5.2a ficam reduzidos aos dois pontos da figura 5.2b. Poucos biélogos, menos estatisticas, e nenhum computador, sero ‘capazes de perceber que a maior parte da informagao mostrada na figura 5.2a ndo pode ser interpretada em relago & questo Inicial, Dados somente so iteis se fornecem informagdo. Se nossos gréficas so enganadores, nossas andlises também o serao € nao teremos feito uma apreciagao honesta das evidéncias. HA algumas téonicas estatisticas que podemos usar para levar em Cconsideragao 0 fato de que nem todas as observagées foram independentes (p. ex. andlse de variancia hierérquica), mas ‘somente serdo itis se as pesquisadores puderem reconhecer @ falta de independéncia e informar este fato ao estatistico ou ao ‘computador. Nenhuma destas técnicas ¢ tio boa quanto reconhecer que 0 desenho proposto lava a pseudorrepetigies € re-delinear 0 sistema de amostragem para evité-las. | : ( COMPEXES SEM PEIKES COMPEDES SEM PEXES 10) LAGosTINS Figura 6.2 54 cushutos QUANTA EVIDENCIA £ NECESSARIA? Para decid quanta evidéncia € sufciente,temos de pensar em quantos pontos terems que colocar em cada gréfco & os assegurarmos de que estes pontos carregam informagdo independente em relagéo & nossa questo. No é preciso ser um siatistco ou um bidlogo para fazer isto, e 0 processo é notadamente simples. Entretanto, pola falta deste prmeiro passo, @ ‘aloria dos resultados publicados em trabalhos cienttios é, na melhor das hipdteses, ndo intepretavele na pior, enganosa. \vamos dar um passo adiante e fazer consideragdes sobre um teste do qual quase todos jé ouviram falar, o teste do qui-quacrado em tabelas de contingéncia. Andlises de tabelas de contingncia quase nunca so apropriadas para questées estatisticas (Hulbert 1984, Magnusson 1999), ¢ isto se retaciona com o que é uma observagdo independent em relagdo a uma questo. Um bidiogo estudando a dieta de uma espécie de pete formula a pergunta de se a dieta dos adults ¢ diferente da dos alevinos, ¢ produz 2 tabela 5.1, que contrasta 0 ndmero de copépodos e algas encontrados nos estémagos de alevinos e pebves adultos. Poeeen COPEPODOS ALGAS: ADULTOS: 3217 18 ‘ALEVINOS 23 2936 CO bidiogo sabe que serd praticamente impassive publicar os resultados sem um teste estatistco e entao aplica um teste de tabela de contingéncia, que resulta nas seguintes hierégifos: z?,=6020, P<0,001. Nao se preccupe se voo8 néo sabe 0 que els signiticam. A maloria dos letores va rever 0 que eles achavam que isto sigificava, apds ler mais alguns capitulas. O importante aqui é que a meloria dos enélogos ira iterpretar este resultado como inicativo de que é muito improvavel que peixes adultos e alevinos tenham a mesma dieta, Contudo, esta impresséo muda quando vemos 0 cademno de anotagBes do bblogo (tabeta 5.2). uae ‘ADULTO 1 0 6 ADULTO 2 3211 ADULTO 3 6 5 ALEVINO 1 8 2908 ALEVINO 2 8 1 ALEVINO 3 7 29 6 Escasion ea areca ‘Agora, ninguém acrecita em uma diferenca eral na data de adultos e alevinos. Por acaso, um adulto encontrou um ‘grupo de copépads e um alevino fez um banquete em um aglomerado de algas. Por qué o teste nos deu uma resposta falsa? Porque a andlise assumiu que o registro de cada copépodo ou alga fol Independente dos outros. Os dados nao refletem ccontingéncia, Nés poderiamas levar a cabo um teste de contingéncia vido, se pegdssemos ao acaso apenas um item por cada estomago de peixe, e descartissemos todo 0 resto da amosta. Isto iia requerer 6194 individuos de peixes, cada um coletado em um cardume diferente, Obviamente, esta seria uma maneira muito ineficente de atacar a questao. E justamente 0 fato de ‘que as tabelas de contingéncia requerem observagdes independentes e somente acumulam informacdo na forma de presenga/ ‘uséncla que as faz to ineficientes para a maioria das quest6es ecolégicas.. Quando o leitor encontrar uma andlise de tabela de contingéncia, pode estar razoavelmente seguro de suspeitar que 0 pesquisador tenha cometido pseudorrepeticao e que as inferéncias estatisticas sao desprovidas de sentido. Hé uma pequena chance de a andlise estar correta e neste caso 0 desenho amostral provavelmente foi muito ineficiente, Agora o leitor pode ver porque cursos de estatistica basica frequentemente examinam apenas probabilidades referentes a se retirar bolas pretas e brancas de um bartil. Barris ndo se repraduzem, néo nadam em cardumes € no mudam muito com o tempo. Por isso eles so faceis de modelar’ ‘matematicamente. Entretanto, eles podem ndo ter muita relevdncia para a maioria dos ‘ecdlogos. ‘A melhor maneira de evtar pseudorrepetigbes ¢ desenhar um mapa conceltual da distbuigéo dos objetos de interesse fem seu estudo, Cada ponto no seu diagrama deve representar uma unidade de amostragem em potencial. A unidade de ‘amostragem pode ter diferentes nomes, dependendo da discipina, Pode ser chamada de transecto,parcela, grupo focal, rio, piel, etc, Unidades de amostragem séo frequentemente relacionadas com a érea, mas pode ser uma espécie, um intervalo de tempo, unidades experimantais ou outros objets. Etas sfo sempre a menor unidade em que se pode medi, e que ainda faa sentido em relagéo & questéo investigada (Capitulo 1), 0 diagrama deve cobrir todo 0 universo de interesse. Este pode ser chamado de universo de inferéncia, escala de inferéncia, escop0, extenséo, imagem e outros nomes. Estes diagramas néo precisam ser acurados ou atsticos; servem apenas para proporcionar uma impresséo geral DDois exemplos reais podem ilustrar a técnica. Uma estudante quer comperar 0 comportamento de pssaras nos cerrados amazénicos e do Brasil central. Ela estuda muitos incviduos, mas quando mapeia os cerads de interesse (a figura 5:3a é uma representagdo conceitual do mapa), ela descobre que seu universo amostral nao & 0 mesmo que o universo de interesse, Note ‘que este mapa conceltual simples, com formas irregulares representando grandes éreas de cerrado, uma linha retarepresentando ‘a borda entre os dois biomas e trés pontos pretos representando dreas amostras ¢ suflciente para mostrar que o universo de “amostragem no corresponde ao universo de interesse da. questéo original {A figura 6.30 mostra 0 universo de interesse de um estudante que trabalha com passaros migratrios @ desea fazer inferéncias sobre migragbes de longas disténcias. Embora ele se interesse por varias espécies de passaros (epresentados pelos pontos cinza), amostrou apenas uma das espécies que fazem aqusla migragdo (representada pelo ponto preto na figura 56 ll0s QUANTA EVIDENCIA £ NECESSARIA? Um diagrama simples como 0 da figura 5.38, com especies de interesse representadas por pontes, fl suficiente para ‘ostraro quanto o universo de amastragem do estudante ea imitado em relago ao seu universo de nteresse. Consequentemente, fe compreendeu que, antes de fazer inferéncias fortes ele deveria aumentar 0 nimero de espécies amastradas ou restringir sua ‘questo a apenas uma espécie, Mapas conceituais quase sempre irdo dar uma boa idéla de se 0 pesquisador esta usando os <éados apenas como uma vaga pista (sem repetigdes verdadleiras), como uma inferéncia forte (inimeras evidéncias indenendentes), ‘ou algum meio termo. O que parece ser mapear as unidades amostras, na verdade, é um processo para se decidir qual a questo ‘que pode ser atacada, a b U" Amaztnia | Brasil Central \ Figura 5.3. Nos capitulos seguintes, vamos aiscutir como Qrande parte das andlises estatisticas pode ser vista como métodos de se reduzir problemas complexos a problemas com duas dimensées, de forma que possam ser apresentados em simples graficos de dispersdo. se os membros de equipes de pesquisa nao puderem representar os resultados esperados de suas analises em forma de gréficos simples, eles ndo compreendem aquelas andlises & nao deveriam usé-las. Entretanto, quando confrontados com sua incapacidade de produzir gréficos bidimensionais que Tepresentem seus resultados, os lideres de equipe ido clamar que 0 objetivo de um estudo cientifico ndo é produzir graficos ‘simples, que podem ser entendidos por qualquer pessoa. Eles dirdo que 0 objetivo dos estudos cientificos ¢ estimar probabilidades. Nos préximos captulos vamos considera a estranha defini de probabiidade usada pela maloria dos cientistas. 57

You might also like