You are on page 1of 4
18 Sidia M. Cullegari-faegues UMANOTA FINAL, ‘A aplicagio de uma técnica estatistica sofstcada nem sempre 6 0 caminho mais, adequado para melhor analisar os dedos de pesquisa. Nenhma técnica substitu o planejamento adequado, a slestorizagio, 0 trabalho cuidadoso no laboratério uno campo e 0 controle das variéveis intervenientes. Pode alguém pensar, por exemplo, que os testes ndo-paramétricos sao a panacéia para abservagSes descui- ddadas ou experimentos mal executados. Nada mais longe da verdade. Tais testes apenas contornam as situagées nas quais os teste cléssicos nio podem ser usados, como nos casos em que a distribuicso dos dados esté muito afastada da normal ¢ rio hé possibilidade de correcio por transformagées. ‘Alida, sobre a experanga de utlsagio desscs testes para remediar um cones! ‘mento insuficiente sobre o material experimental, LA. Pisher (19715 p. 49) disse 'Na gia induiva, entretant, uma prestuposigieequivocada de ignordnca obre ‘omaterial experimental) ndo € indeua; ela freghentements leva aabsutéos gran tes, Os pesquisadores deveriam lembrar que eles e seus colegas geralmente saber ‘mais sabre. tipo de material com que et lidando do que of autores de livros tet9 seta sem essa experitncia pessoal, e que no é provivel que um teste mais con plex, ou manos inelgival,srva melhor, em qualquer sentido, aos propésios doles do que aqueles (testes) de valor comprovado no campo de trabalho dos préprios (pesquisadores) © uso da afiemacio de Fisher neste texto nio tem a intengio de simplifcar 0 problema da andlise os dacos, especialmente no caso em que muitas caracteris- ticas séo usadas para descrever um fenémeno e realmente sio exigidas técnicas ‘mais soisticadas de anslise multivariada, fla pretende chamar a atengéo, nesta, cera des computadores pessosis © dos pacates estatstcos de facil acesso, para 0 fato de que a estatistics & uma ferramenca e nfo um ornamento de uma publica (fo téeniea e que o emprego excessivo e nio-fundamentado de métodos esatit- 0s ndo contribul para tornar o trabalho mals confével, sugerindo, pelo contrério, lum arifielo para encobrir a pobreza dos dads, >in inductive log, howaver, an eronsous assumption oflgnarance i ot innocuous; tote esd tomas! absicites, Exoermenters shoud rerensor al hey athe caleapuee sun trom ‘more abou the kindof matral they ae ceaing wih than tha suhors oft boos wien vitot sich personal experience, a that more compe, or ess inal, et sna ly 0 ere te purpose bt any sense, Ian ose of proved vale nto ov bjt 1 Organizacdo de dados quantitativos Unmanntiisoimorsant a evtatitea no manejo das informages fo criagdo de procedimentos para a organizacdo e o resumo de grandes quanti dates de dados. A descrigio das varidveis ¢ imprescindivel como um passo prévio paraaadequada interpretacio dos resultados de uma invesigagio, ¢a metodolo- gis empregada faz parte da estatistica descitva (0s dados podem ser organizadas em tabelas ou gréficos. Neste capitulo, se ro apresentados conceitas bisicas para a mantagem e a apresentasio cesses es- truturas quando os dados sfo quantitative. Para a descrigao dos dadas podem. se ulizar,além de tabelas e gréficos, medides de tendéncia central ede dispersio, {que serdo abordadas em capftules subseqiientes. ‘Suponha que, ao estudar a quantidade de albumina no plasma de pessoas ‘cam determinada doenga, um pesquisador obtena, em 25 individuos, os segun- tes valutes (eu y/100 ni). 51 49 49 S147 50 $0 50 S154 52 52 49 53 5,0 45 54 51 47 55 480 S153 53 5,0 Dos dados obtidos, o pesquisador pode conchuirinicialmente que: Q) Osvalores de albumin nos pacientes variam de individuo para individus. 2) Alguns individuos apresentam valores igual. ) Os valores oscilam entre 4,5 €55. ‘As duas primeiras conclusbes so obtidas de forma imediata, mas a terceira ‘exige paciencia e atencio, especialmente se a amostra for grande. Organizando os ‘dados em tabelas de freqigncias, nas quas se indicam os valores obtidos ¢ a fre~ {iiéncia com que ocorrem, estas ¢ outras conclusBes podem ser obtidas mais rai ‘damente e com menor probabilidade de erro. 20 Sita M. Calories DISTRIBUIGOES DE FREQUENCIAS: TABELAS Tabola de grupamonto simples [As tabelas de grupamento simples mostram os valores obtidos ¢ o nimero de vvezes que cada valor foi observado. Inieia-se a construgio de uma tabela de gru- ‘pamento simples procurando:se o menor valor obtido. A partir dele, organiza-se ‘uma lista por ordem crescente dos valores que padem ocorrer (coluna 1 da Tabela 1.2). segult, voltase aos valores anotados de forma desorganizada e, lenda um ‘um, marca-se um trago vertical ao lado do valor correspondente na tabela (tab lagdo ou contagem), TABELA1L4 Tex de aura (7100 ml) no plasms de 25 paints ‘Aburina sy Congo ——F a F = a5 7 7 ‘308 7 08 as ° 00 1 004 a ¥ 2 Dos 3 ou 49 7 : Be 4 e168 as a 3 on 7 O28 50 i» 5 920 2 Oat a 5 020 a 8 52 2 2 0 @ O76 53 n 3 ot 2 038 Ba a 2 08 m 098 55 fi i oe 35 $00 Zou soma 25 00 = s Recomenda-se reunit of tragos de 5 em 5, cortando quatro tragos com 0 uinto, para facilitar a contagem. O método de procurar cada valor ao longo de toda a amostra, verificendo quantas vezes ele ocorre, & bastante desaconselhado, pois leva facilmente a erro, além de exigir que a seqiiéncia de dados seja lida varias vezes. ‘Costuma-se chamar de x os valores da varidvel quantitativa em estudo. © ‘total de tragos obtidos em cada valor de x & denominado frequéncia absolutasim- ples, sendo indicada por f O sinal 3 (sigma maiisculo; letra S no alfabeto grego) ‘€ usado para indicar “soma”. Observe que a soma dos valores de f (2) ¢ igual 20 ‘numero de incividuos examinados, que também costuma ser indicado por n. Por: tanto, 3 =. Dividindo f por 3f, obtém-se a freqincia relatva simples (), que representa ‘ proporgéo com que cada valor ocorre. Os valores mais frequentes apresentados na Tabela 1.1 siox = 5,0 ex 5,1, tendo, cada um, uma freqliéneia relativa fr 0,20 (ou 20% do total de individuos estudades). Atabela pot, ainda, indiear as fregiiéncias cumuladas (F), que identifica {quantos individuos tém caxa de albumina igual ou menor do que un deverminado valor. Observando-se acoluna fda Tabela 1.1, € posstvel wow yue quauo pessuas possuem uma taxa de albumina igual ov menor do que 4,8. As freqiéncias acu: rmuladas sio obtidas somando-se a freqiiéncia simples (D da linha desejada (x) Biveeativica 2 com as freqiéncias simples dos valores de x menores do que © considerado. A soma da colina Pnéo tem 0 menor sentido Para saber a proporgio de pessous com taxa dealbumina igual ov menor do que 4,8, caleulase a feiénca acumlada relative (), obtida ou por meio da divisio de F por 34/25 = 0,16 04 16%) ou pela soma acumulada des a partir do valor de interes If (4.8) = 0,04 + 0,08 + 0 + 0,08 = 0,16) Qualquer reqiénclarelativa (ou F) pode ser transformad em freqiéncia percentval, bastando multiplics-a por 100. ‘AFF pode se usa pata se obter percetis, quantidades bastante usadas em certasdreas da medicna 0 percentil de ordem k (9, éo valor dex que & precedi- do por K3 valores e seguido por (100-4)% dos valores. Por exemplo, Pa, £0 valor ties que € prewedi por 259% du valoues (os 25% neue de Sie) e seid pelos restantes 75%. Os percents Ps, Pap Pra divide o conjunto de dados em {quatto pares iguas; por ss, reeciem o nome de quarts eso respecivamente @squartisQy,Qg€0, Na Tabela 1.1, 0 percent Pay €um valor enre 460 49,5 ‘que 169% das individuos t2m valores iguais ou menores do que 4,8 ¢ 289% das psoas tm niveis de albuminaiguais ou menores do que 49. Esima-se, enti0, 0 percent pela media entre 4,8 € 49, obtendo-se Pa, ~ 485, Sdo bastante popula Fesos percentis Pye Py que delimitam 0s 5% valores menores, 0: 90% centralise ‘05 5% maiores de um conjunto de dades. As tabelas elaboras para realizar célculosestatsticosnio se prstam para publicago em relatéios ou artigos cientiicos. Em tabeles para publiagio,ndo se apresenta a tabulagéo dos dads. Tempouco se apresentam informagdes redun- dances: se for indicedo f ndo se apresenta fr ow a percentegem. Alem disso, a estrutura da tabela segue regras determinadas. As prineipais si: (0) Attabela deve ser precedida de um titulo, suficlentemente claro para que © Ieitor ndo necessite voltr o texto para entender 0 contedido da mesma, ) Avahela é limitada por uma linha Timitante superior e outa inferior, qne indica seu final. O cabecalho deve ser separado do restante do texto por uma linha horizontal (@)_Nao'se usam linhas verticais separando as colunas; usam-se espacos em bran. (4) As abrevisturas e os simbolos pouco conhecids devem ser explicados no rodapé da tabla (5) Deve ser indicada a fonte dos dados. Tabela de grupamento por intervalo de classe (Quando os valores de uma caracterstica variam muito, como é o caso da estacura cu do peso das pessoas, uma tabela como a Tabela 1.1 tendetia a ser muito exten- sa, perdendo a propriedade de condensar a informagio. A solugéo & grupar os {dados por intervalos de classe, como foi feito na Tabela 1.2 para valores de peso em 256 universtérias gaichas. Cada intervalo de classe possui um extremo ou limite inferior e um extremo ‘ou limite superior. O inal -indica que o extremo inferior esta inciuido no inter~ valo, mas 0 superior, néo. Intervalos indicados por esse sinal séo denominados intervalos abertos d divetae sho os mais comumente usados. 22_Sidia M. Callegr-Saegues ‘TABELA 1.2 Pesos (hg) de 255 lunes da Univesidade Fedoral do Rio Grande do Sul bio ro prose de 1980 21090 [eadosorgeizndos om ntraios de ste) Peso a) 0 z wrs 2 O36 Es 3s ones rss i 08 5/60 % ots cof 55 5 oor BEM " Bes eT 7 oer ime) 5 020 eas 1 008 = 2 1.000 Anotagio envolvendo intervalos abertos direta (|), abertos @ esquerda (A) 01 fechados em ambos os lados (|) & muito itil quando se quer elaborar tabolas de freqiiéncias pare varidveis continuas, pols ndo permite ambighidade na locagio dos valores nos intervalos. Note, porém, que é comum encontrar, refe- rindo-se d idade de criancas, por exemplo, a notagio 3-4 anos, 5-6 anos, 7-8 ‘anos para indiear 3.2 4 anos, § a 6 anos, 7 a 8 anos. A notacio é de intervalo ‘aberto, mas a idéia transmitida é a de intervale fechado ema ambas as extrem dades! ‘© niimero escolhido de classes fica geralmente entre 6 e 8, podendo oscilar centre 5 e20, dependendo do detalhamento desejado pelo investigador e do tama- sho da amostra ‘Nas tabelas de grupamento por intervalo de class, além de fe fr podese ‘aloular Fe Fr. do mesmo modo como foi explicado para tabelas de grupamento simples. DISTRIBUIGOES DE FREQUENCIAS: GRAFICOS A representagio grfica é bastante interessante, porque da uma visio mais ime: diara de como se distribuem os individuos nos diferentes valores da varidvel. Nas publicagoes, os gréficos dever ser chamados de figuras. O titulo do gréfio deve ser claro, para evitar que o leitor volte ao texto para entender aque se refere, sendo colocade ao pé do desenho, ao contro da tabela que tem o titulo colocado na sua parve superior. Ohistograma 6 gréfico mais utilizado para variivets continuas. Consiste de uma sucestio de retingulos contiguos, cuja base é 0 intervalo de classe, ea altura, a ‘requéncia relatva em cada classe dividida por ha amplitude do Intervalo de clase, Se as clases forem todas de igual amplitude, néo € necessério realizar a divisio. No final, tem-se uma figura geométrica, com fea total considerada como rr FIGURA 1.1 Peto (tg) obseusco am 256 atunas 68 Univer ‘de Federal do Ris Grande do Sat, Binetstica 2B 100%60u 1 soma de todas as freqién- cas relativas). A Figura 1.1 apresenta fo histograma relativo 20 peso corporal de estudantes do sexo feminino da Uni- versidade Federal do Rio Grande do Sul (UFRGS), obtido no periodo 1980: 1999, Ogi Augiva du gidfeo adequado para re presentar as freqdéncias acumuladas (F (uF). No eixo horizontal, 80 eoloca- das 05 intervalos de classe. No ponto médio de cada intervalo, levanta-se ma uma perpendicular imagindria e mar- 7% + ‘ase im ponto na altura carresponden- ceca om zie ounsy te freqiéncia acumulada na classe. A seguit, 0s pontos sia unides por seg: rmentos de reta, ‘A ogiva € itil para se identifiear sraficamente percents de interesse, como, por exemplo, a mediana (percent 50), [A Figura 1.2 apresenta a ogiva cortespondente a dados ce pressio arterial, sistdlica medida nas primeiras 24 horas de vida, em 96 recém-nascidos de Porto ‘Alegre (Oliveira, 1991; Tabela 1.3). Desenhando uma linha auxilir a partir da ‘reqigncia acumulada igual a 50% até a ogiva e desta para o eixo horizontal, pode-se obter graficemente uma estimativa para a mediana da pressio arterial Sidlien nesses recdmonaseidas (eid: 65 mmHe) Diagrama de bastoos A representagio gréfica apropriada para varliveis quantitativas discreta éo di igrama em bastio, Esse grifco é parecida com um histograma, com uma impor fante diferenca: as freqiéncias para cacla valor de x sio agora representadas por os, na plate 24¢horas do via PAS (eer) 0 Fr 35-58 3 0038 s3i63 5 pest ele 0 0800 een 24 070 new 15 2.06, BE 3 sso nines 1 u Tea % = 2A Side M. Callegarisacques Biocsasiica 28 104 {AME 14a emi inp sans vets RES is ) Pa gs = aor ) Bo 20 0.24 — 2 4“ 058 3 2 0,30, ) - 2 7 0.98 : rotna tape 3 %S ‘at esting) #006 8 fecbmassacon, nae pk (Ponte: Ofeia, 1991), [No histograma relative a estes dados (Figura 1.1), a drea do reténgulo refe rente a0 intervalo 45 |— 50 eorresponde a 14% da drea de todo o histograma (200%). Porcanto, a area deste retangulo é a representacdo geométrica da proba- bilidade estimada de se encontrar valotes entre 45 e 50 na populagdo. No grafico de bustbes, a probabilidade estimada para cada valor 62 altura do bastdo. bastées endo retangulos, pois inexiste continuidade entre os valores. A Tabela 14 ea Figura 1.3 apresentam um exemplo de representagio tabular e grfica para dados deste tipo, FREQUENCIA RELATIVA E PROBABILIDADE ) A freqéncia relativa Gr) de um valor estima a probabilidace verdadelea de acer rencia deste valor, que $6 & conhecida tendo-se informagio quanto a todos os individuos da populagdo. A freqiéncia relativa associada a x = 2 irmios, confor ‘me mostra a Tabela 1.4, de 0,35 na amostra estudada, Pode-se, entfo, estimar fem 359% a fragdo de universitirios que tém dois irmios. Isto equivale também a dizer que se estima em 0,35 a probabilidade de que um universitaria, selecionado 40 acaso desta populagdo, tenha dois irméos. » Estas conclusdes so vélidas se a amostra for representativa da populagéo de estudantes da UFRGS. Por outro lado, quanto maior for uma amostra representa melhor serd a idéia da ocorréncia relativa (fr) do valor x = 2 na populagéo, 10 €, melhor seré a estimativa da probabilidade verdadeira ‘© mesmo raciocinio vale para as tabelas de dades grupados por intecvalo de ) ‘lasse (Tabela 1.2), A probabilidade estimada de que uma estudante tenha peso centre 45 ¢ 50 kg € 0,14, ) 2 20 ) 10 I FIGURA 1.3. Numero de ° Re, o12 3 45 67 8 8 ‘clones unhoioe Ga UFRGS, Name de mts

You might also like