You are on page 1of 8

Universidade Estadual de Alagoas – UNEAL. Campus II – Santana do Ipanema. Curso: Ciências Biológicas. Disciplina: Bioestatística.

Professor: Wellyngton Chaves Monteiro da Silva Estatística Descritiva: organização dos dados 1 - Distribuição de freqüências Uma distribuição de freqüência é um método de grupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o número, ou a percentagem (isto é, a freqüência) de cada classe. Isso proporciona uma forma de visualizar um conjunto de números sem precisar levar em conta os números individuais. O número ou percentagem numa classe chama-se freqüência de classes. Constitui-se em uma forma de sintetizar os dados brutos em informações de fácil compreensão. É uma forma simples, elegante e com grandes potenciais de uso para sintetizar o comportamento de uma variável qualitativa, seja ela nominal ou ordinal (posteriormente veremos que também podemos trabalhar com variáveis quantitativas). A tabela de freqüências apresenta as categorias da variável em uma coluna inicial e na seguinte mostra as contagens de quantos casos (indivíduos, observações) estão em cada categoria. Em geral, quando a variável é nominal, vem acompanhada de uma terceira coluna com as porcentagens que estas contagens representam do total de casos, e se ela for ordinal ainda podemos ter uma quarta coluna com as porcentagens acumuladas.

1.1 - Distribuição de freqüências para dados nominais Vejamos as tabelas 1 e 2 que seguem: Tabela 1. Dados da pecuária do Estado de Alagoas – efetivo do rebanho de pequenos animais no ano de 2007. Efetivo/Rebanho Quantidade (cabeça) f f% Coelhos 692 0,17 Caprinos 67.549 16,31 Ovinos 201.273 48,60 Suínos 144.652 34,93
Fonte: Censo Agropecuário – IBGE/2007 (sítio do SIDRA/IBGE, em 29/07/2009).

Tabela 2. Comparecimento dos alunos de ambos os gêneros ao evento “Semana de Biologia da UNEAL”, em Santana do Ipanema, Alagoas. Agosto de 2009. Sexo Freqüência Masculino Feminino Total Fonte: dados fictícios. (f) 65 35 100

Podemos observar que as categorias não têm uma ordem intrínseca, ou seja, não possuem uma relação de hierarquia (a variável é nominal), portanto, é melhor apresentar a tabela, ordenando-as a partir das suas freqüências ou percentagens de suas freqüências, isso possibilita uma interpretação mais fácil dos dados, onde imediatamente nos detemos nas categorias que mais se destacam (por valores menores ou valores maiores). É importante destacar que qualquer tabela, de freqüência ou outras tabelas mais complexas que estudaremos mais tarde, devem ser esteticamente agradáveis, apresentar os dados de forma a não induzir interpretações erradas e também, deve ter sempre uma legenda e, quando necessário, notas explicativas, que devem aparecer abaixo da tabela.

Professor Wellyngton Chaves Monteiro da Silva Página 1/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais, ordinais e intervalares)

mesmo que haja diferenças nos totais de freqüências. da “Semana de Biologia da UNEAL”. e possibilita a comparação de grupos. percebe-se que o minicurso de Saúde Pública atraiu mais alunos que o de Parasitologia. Pelo exposto. temos: Tabela 4. A utilização da percentagem na padronização das distribuições de freqüência torna esses dados mais claros. percebe-se que nos dois minicursos realizados. conforme se verifica na Tabela 3. em Santana do Ipanema. apesar de em maior número no minicurso de Saúde Pública. e que as freqüências foram aquelas exibidas na Tabela 4. Igualmente. Alagoas. supondo que ocorreu a presença de 125 alunos ao mini-curso de Parasitologia. em Santana do Ipanema. realizada em agosto de 2009.Também podemos comparar duas distribuições de freqüências para ampliar as informações. f f(%) = x 100 N Assim. Professor Wellyngton Chaves Monteiro da Silva Página 2/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais. Alagoas. Entretanto. apesar da pouca presença de alunos do sexo masculino. Agosto de 2009. Matrícula dos alunos de ambos os sexos ao mini-curso de Parasitologia e ao mini-curso de Saúde Pública da “Semana de Biologia da UNEAL”. ordinais e intervalares) . Agosto de 2009. Matrícula dos alunos de ambos os sexos aos mini-cursos de Parasitologia e Saúde Pública. Tabela 3. houve maior presença de alunos do sexo feminino do que do sexo masculino. estes compareceram em maior proporção no minicurso de Parasitologia. principalmente no minicurso de Saúde Pública. e 525 alunos no mini-curso de Saúde Pública. Comparecimento às palestras Sexo (f) Masculino Feminino Total 50 75 125 Parasitologia % 40 60 100 (f) 105 420 525 Saúde Pública % 20 80 100 30 70 100 Saúde Pública (f) 20 80 100 Resultados e comentários acerca da Tabela 4: A Tabela 4 apresenta o resultado do comparecimento dos alunos de ambos os sexos aos minicursos Parasitologia e Saúde Pública da Semana de Biologia da UNEAL/Campus II. Matrícula nos mini-cursos Sexo Parasitologia (f) Masculino Feminino Total Fonte: dados fictícios.

Participação dos alunos de ambos os sexos no mini-curso de Parasitologia. Professor Wellyngton Chaves Monteiro da Silva Página 3/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais. Alagoas. Os gráficos de barras são muito usados na representação de dados. Exemplo: Gráfico 1. em torno de 360°. ou seja.REPRESENTAÇÃO GRÁFICA O gráfico setorial é um dos mais simples recursos gráficos. realizada na Semana de Biologia da UNEAL. em Santana do Ipanema. Participação dos alunos de ambos os sexos nos mini-cursos de Parasitologia e de Saúde Pública. 500 450 400 350 300 250 200 150 100 50 0 75 50 105 Masculino Feminino 420 Frequência Drogas na adolescência Sexo na adolescência Palestras x Sexo do aluno Gráfico 2. Torna-se útil quando se deseja verificar diferenças na freqüência de algumas categorias. ordinais e intervalares) . Alagoas. que constitui na distribuição das freqüências em torno de um círculo. em Santana do Ipanema. realizados na Semana de Biologia da UNEAL. Agosto de 2009. Agosto de 2009. pois possuem a característica de aceitar qualquer quantidade de categorias de qualquer nível de mensuração.

Professor Wellyngton Chaves Monteiro da Silva Página 4/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais. Polígono de freqüências acumuladas (Ogiva). 200 180 Frequência acumulada 160 140 120 100 80 60 40 20 0 a b c d Categorias examinadas e f g Gráfico 4. muito utilizados. sendo muito aplicado na apresentação de dados ordinais ou intervalares. ordinais e intervalares) . também chamada de ogiva. Polígono de freqüências. ajustam-se a uma ampla variedade de situações. Uma variação deste tipo de gráfico é o polígono de freqüências acumuladas. 50 45 40 35 Frequência 30 25 20 15 10 5 0 a b c d e f g Categorias examinadas Gráfico 3.Os polígonos de freqüências.

5 36. Um gráfico muito usual para dados ordinais seria a Ogiva: Gráfico 5.2 .Distribuição de freqüências para dados ordinais Vamos agora construir algumas tabelas de freqüência para variáveis de tipo ordinal.0 Total 44 100.1. Freqüência Percentagem Percentagem acumulada Escolaridade (f) ( f %) ( f % ac.5 Elementar 4 9.5 4. ordinais e intervalares) .7 Especialização 10 22. Distribuição de freqüência dos funcionários da UNEAL/Campus II de acordo com o nível de escolaridade. Alagoas.2 31. Professor Wellyngton Chaves Monteiro da Silva Página 5/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais.3 97. Para esta tabela não podemos alterar a ordem de apresentação das categorias na primeira coluna já que esta é uma ordem intrínseca das mesmas.4 Superior Completo 5 11. na qual vão sendo somadas as percentagens de cada categoria.4 47.8 Superior Incompleto 2 4. pois se trata de uma variável ordinal.0 100.7 Doutorado 1 2. e isto faz sentido e tem um uso importante (bem como para as variáveis quantitativas contínuas).1 13. Para isso vejamos a tabela 5: Tabela 5.5 Mestrado 12 27.0 Fonte: dados fictícios.7 70.3 100. Neste caso estas percentagens acumuladas devem ser apresentadas.0 100. Distribuição dos funcionários da UNEAL/Campus II de acordo com o nível de escolaridade.6 Médio 8 18. Santana do Ipanema.0 Pós-doutorado 0 0. julho de 2009. Como se trata de uma variável ordinal inclui-se na tabela uma coluna adicional para "percentagem acumulada".) Analfabeto 2 4.

ou seja: 59.0 Limite superior: 144. temperatura.8 117.2 132.5 144.0 = 59. 2) Determinar a amplitude total.9 125.0 135.0 Limite superior: 156.3 128. 3) Determinar o número de classes (entre 5 e 15).0 kg Máximo: 167. 4) Determinar a amplitude de classe.9 135.0.0 133.7 120.0 119. volume. altura. ou seja. 5) Estabelecer os intervalos de classe: 1ª classe = Limite inferior: 108. e as Quantitativas Discretas quando temos uma amplitude muito grande de dados.9 132.3 143.3 139.0. basta dividir a Amplitude Total pelo Número de Classes.0 166.0 122. as variáveis Quantitativas Contínuas são essencialmente intervalares.4 149. para garantirmos que todos os valores estejam representados na distribuição de freqüências.2 2) Determinar a Amplitude Total: Mínimo: 108. Limite superior: 120.0 167.0 123.3 116.8 166.84  12 5 Neste caso.0.2 143.0 Limite superior: 168.0 1) Organizar os dados brutos em rol: 108.8 119.6 117.8 149.5 165. o Número de Classes nesse exemplo será igual a 5.0 142. 6) Construir uma tabela de freqüência.5 118.6 167.2 127.9 116.9 120.6 156. Consiste de uma escala verdadeiramente quantitativa.5 155. existe um intervalo constante entre as categorias.3 125.Distribuição de freqüências para dados intervalares Dizemos que os dados se enquadram em um nível intervalar quando eles podem ser ordenados e é possível quantificar a diferença entre as observações.0 123.0 128.0 135.2 149.2  11.3 149.4 133.3 123.3 .2 122. 2ª classe = Limite inferior: 120.1.0 6) Construir uma tabela [com a distribuição] de freqüência: Professor Wellyngton Chaves Monteiro da Silva Página 6/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais. Neste caso.2 3) Determinar o número de classes: Uma regra prática é extrair a raiz quadrado do número total de dados envolvidos ( N ) Número de Classes = 30  5.8 123.8 143. etc. 5) Estabelecer os intervalos de classe. ordinais e intervalares) .0 156. recomenda-se que arredondemos o valor “para cima”.6 125.2 132. 3ª classe = Limite inferior: 132. 4) Determinar a amplitude de classe: Para isso.2 – 108.0.7 142. Exemplo: Considere os dados brutos das alturas (em cm) de 30 alunos de uma escola do ensino fundamental: 125.9 139.8 132.3 135. 5ª classe = Limite inferior: 156.2 165.8 108.8 118. 4ª classe = Limite inferior: 144.2 kg Amplitude Total = 167.48  5 Portanto.0 144.3 143. Etapas para a construção de uma distribuição de freqüências para dados intervalares: 1) Organizar os dados brutos em rol.8 127.0 Limite superior: 132. São exemplos de variáveis com nível intervalar: peso.0.3 155.

0) 5 [120. Julho de 2009.0) Intervalo de Classes Gráfico 7: Altura de 30 alunos de uma escola de ensino fundamental. 168. Vejamos a representação desses dados graficamente: 10 9 8 Frequência 7 6 5 4 3 2 1 0 [108. 156. 156.0) [156.0) [156. 168. 144. 144.0) [144.0 .0) [132. 132. 132.0) 4 [156. Professor Wellyngton Chaves Monteiro da Silva Página 7/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais.0 . 120.0 .0) 8 [132. 120.0) [120. 156.0 .0) 4 Total 30 Os histogramas são os gráficos mais adequados para a descrição de dados oriundos de variáveis quantitativas. Julho de 2009.0 .0) 9 [144.0 . 10 9 8 Frequência 7 6 5 4 3 2 1 0 [108.0 .0) [132.Tabela 6: freqüência das alturas de 30 alunos de uma escola de ensino fundamental.0 .0) [120.0) Intervalo de Classes Gráfico 6: Alturas de 30 alunos de uma escola de ensino fundamental.0 .0 . 120. Julho de 2009.0 .0 . bem como o polígono de freqüências.0 . 168. Altura dos alunos Número de alunos (Intervalos de classe) (f ) [108.0) [144. 144. 132.0 . ordinais e intervalares) .0 .

Universidade Estadual de Alagoas – UNEAL. Professor Wellyngton Chaves Monteiro da Silva Página 8/8 Estatística Básica – Estatística descritiva: distribuição de freqüências (dados nominais. Em seguida. Campus II – Santana do Ipanema. entre o histograma (variável quantitativa) ou o gráfico de barras (variável qualitativa).Informações biométricas de uma espécie de roedor encontrada em uma determinada área de um município qualquer. ordinais e intervalares) . A Tabela 1 apresenta informações para a construção de distribuição de freqüências com os três tipos de dados estatísticos estudados. os dados ordinais (pelagem e número de filhotes). construa a distribuição de freqüências para cada uma dessas variáveis. Professor: Wellyngton Chaves Monteiro da Silva Nome: ___________________________________________________________________. apresente uma análise dos dados. Número de Filhos Peso médio (em gramas) 348 275 327 267 309 276 251 243 200 295 271 206 201 339 315 322 251 234 264 210 256 235 216 316 243 226 215 260 365 209 Idade (em meses) 6 1 8 4 5 1 6 4 8 7 5 9 4 2 4 6 5 5 4 8 5 8 4 3 6 6 7 9 5 4 Animal Sexo Pelagem 1 Macho Branca 2 0 Fêmea Branca 3 Macho Parda 4 5 Fêmea Marrom 5 Macho Marrom 6 0 Fêmea Parda 7 3 Fêmea Branca 8 4 Fêmea Preta 9 6 Fêmea Branca 10 Macho Parda 11 5 Fêmea Branca 12 4 Fêmea Marrom 13 7 Fêmea Parda 14 Macho Marrom 15 Macho Branca 16 Macho Branca 17 6 Fêmea Branca 18 5 Fêmea Parda 19 6 Fêmea Preta 20 3 Fêmea Marrom 21 5 Fêmea Parda 22 4 Fêmea Branca 23 6 Fêmea Branca 24 Macho Preta 25 4 Fêmea Branca 26 5 Fêmea Branca 27 2 Fêmea Parda 28 6 Fêmea Preta 29 Macho Branca 30 4 Fêmea Branca Fonte: dados fictícios usados apenas para resolução de exercício. Curso: Ciências Biológicas. Agosto de 2009. e dados intervalares (peso médio e idade). Tabela 1 . e utilize o gráfico que melhor represente os dados. ou ainda outro que melhor se enquadre aos dados apresentados. os dados nominais (sexo). Disciplina: Bioestatística. Sendo assim.