You are on page 1of 26

07 Estatstica (Distribuio de Frequncias) CONCEITOS BSICOS

1.1 ESTATSTICA
A estatstica constitui uma parte da matemtica aplicada que tem como finalidade obter concluses sobre os verdadeiros parmetros do universo, utilizando para isso a coleta, a organizao, a descrio, a anlise e a interpretao dos dados.

1.2 ESTATSTICA DESCRITIVA


o ramo da estatstica que se preocupa apenas em descrever os dados observados da amostra, sem se preocupar em fazer previses sobre os parmetros do universo. Na estatstica descritiva temos a coleta, organizao e descrio dos dados.

1.3 ESTATSTICA INFERENCIAL


A estatstica inferencial ou estatstica indutiva a parte mais importante da estatstica, pois a inferncia estats-tica que permite a anlise e a interpretao dos dados atra-vs de estimativas de parmetros do universo.

1.4 POPULAO OU UNIVERSO


qualquer conjunto de elementos ou indivduos, com pelo menos uma caracterstica comum ao objeto em estudo.

Exemplo:
A populao de alturas dos candidatos ao concurso de AFRF/2000; A populao de escolas de estatstica no Brasil em 2000; A populao de computadores em So Paulo. A populao pode ser dita finita ou infinita conforme o n-mero de elementos que possui. Por exemplo a populao dos pesos dos candidatos ao concurso do ICMS/2002 finita. Porm se cada aluno sorteado e recolocado no conjunto para novo sorteio, teramos a populao de pesos infinita. Na prtica consideramos como infinitas aquelas populaes com nmero de elementos muito grande.

1.5 CENSO
O censo o processo que consiste no exame de todos os elementos da populao. Na prtica, a coleta de dados sobre a populao requer: 1. Disponibilidade de tempo 2. Preciso dos dados coletados 3. Recursos financeiros 4. Planejamento das etapas de coleta Portanto, so muitas as dificuldades para a realizao de um censo, logo, nos geralmente utilizamos os processos de amostragem.

1.6 AMOSTRA
Amostra qualquer subconjunto no vazio da populao. Para a seleo da amostra devemos tomar cuidado para que a amostra seja representativa da populao, considerando a aleatoriedade da seleo e o tamanho da amostra.

1.7 EXPERIMENTO ALEATRIO


Experimentos Aleatrios so aqueles que, repetidos nas mesmas condies, produzem resultados possveis e diferentes.

Exemplo:
O lanamento de uma moeda honesta vrias vezes nas mesmas condies, produz cara ou coroa como resultado, que s pode ser conhecido aps o lanamento.

1.8 EXPERIMENTO DETERMINSTICO


Quando o resultado do experimento j est determinado antes de sua realizao, portanto no interessa ao estudo da Estatstica.

DISTRIBUIO DE FREQNCIA
2.1 DADOS ESTATSTICOS
Dados estatsticos so todas as informaes levantadas (coletadas) que serviro como base para o estudo e an-lise estatstica e que chamaremos de Dados.

2.2 DADOS BRUTOS


Dados Brutos so dados inicialmente coletados que ainda no foram organizados sistematicamente.

2.3 ROL

Rol qualquer arranjo de dados brutos em ordem crescente ou decrescente.

2.4 DISTRIBUIO DE FREQNCIA


A Distribuio de Freqncia uma disposio de dados numricos, de acordo com o tamanho ou magnitude dos mesmos. Neste tipo de srie no variam local, tempo e o fato. A distribuio de freqncia pode ser apresentada por va-lor (nico) ou por grupo de escalares (classes), discriminando a freqncia dos mesmos.

Exemplo:
a) Distribuio de freqncia por valor:

b) Distribuio de freqncia por classe:

Obs.:

E | I I | E I | | I E E

E= Excl uindo I= Inclu indo

2.5 ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA


A Tabela abaixo representa as notas de100 alunos aprovados no concurso de AFTN/94 em So Paulo.

NOTAS DOS ALUNOS APROVADOS NO CONCURSO AFTN/94-SP


Descrevemos a seguir cada coluna:

a) Classe de Freqncia
As classes de freqncia so os intervalos em que a varivel nota foi agrupada. Exemplo: 0 |--- 20 - representa as notas desde 0 at quase 20

b) Limites de uma Classe ( li, ls )


Os limites de classe so os valores nfimo e supremo da classe, sendo que o limite inferior ( l i ) o nfimo da classe e limite superior ( ls ) o supremo da classe. Assim teremos:

O limite inferior da 2 classe 20 O limite superior da 3 classe 60

c) Intervalo de classe (amplitude de classe) - h


a diferena entre o limite superior real da classe e o limite inferior real da classe.

h = ls li Obs: Quando o limite inferior da classe coincide com o limite superior da classe anterior, ele chamado de limite real. Caso contrrio ser chamado de limite aparente, e o limite real ser a mdia aritmtica entre eles.
d) Amplitude Total ( AT )
a diferena entre o maior valor e o menor valor da amostra. No exemplo acima: AT = 100 - 0 = 100.

e) Ponto mdio da classe


a mdia aritmtica entre o limite inferior real e o limite superior real

f) Freqncia absoluta simples ( fi )


Freqncia absoluta o nmero de observaes que ocorreram em determinada classe. No exemplo acima a Freqncia absoluta ou simples-mente Freqncia da 3 classe 50.

g) Freqncia Total ( N )
A Freqncia total a soma de todas as freqncias absolutas.

h) Freqncia Acumulada (Fac)


Freqncia Acumulada Crescente (ou Freqncia acumulada abaixo de, ou Freqncia acumulada at) que representaremos por Fac a soma das freqncias absolutas anteriores de uma determinada classe. Por exemplo, na tabela acima, a Freqncia acumulada crescente da 3 classe a Freqncia acumulada abaixo de 60 que 10 + 15 + 50 = 75. Como a classe do tipo (40 |--- 60) poderamos falar em Freqncia acumulada crescente como sendo a Freqncia acumulada at 60, que : 10 + 15 + 50 = 75.

i) Freqncia Relativa ( fr )
a razo entre a Freqncia absoluta e a Freqncia total

Portanto, a Freqncia relativa da 4 classe , podemos representar a Freqncia relativa em porcentagem que seria 20% e a somatria da freqncia absoluta igual a 1 ou 100% < Anterior Prximo >

07A Exerccios sobre Distribuio de Frequncias


1) Em que consiste a estatstica descritiva? 2) Qual a diferena entre censo e amostragem? 3) O que voc entende por o termo rol? 4) A tabela abaixo indica o nmero de um grupo de 1550 funcionrios de determinadas faixas salariais de uma empresa. Complete as colunas em branco.

Faixa salarial

Nmero de Freq. relativa( fr)

Freq. acumulada

pessoas (fi) At 3 salrios mnimos 776 De 3 a 6 salrios mnimos 387 De 6 a 9 salrios mnimos 232 Acima de 9 salrios 155 mnimos ? 1550
5) Para o Curso de Administrao uma classe 36 40 54 50 56 40 56 59 65 61 44 39 a) maior nota; b) menor nota; c) amplitude total; de uma escola 31 32 42 44 67 50 66 60

(Fac)

possui as seguintes notas: 34 43 49 33 54 55 68 51 54 36 44 49

d) tabela contendo: as notas, freqncia relativa, freqncia percentual e freqncia acumulada; e) as cincos melhores notas; f) as cinco piores notas; g) classificao das dez primeiras notas; h) quantas notas esto acima de 75? i) quantas notas esto abaixo de 45? j) informe o percentual de notas entre 50 e 68 inclusive. 6) Os dados da amostra abaixo representam as vendas dirias de um determinado aparelho eltrico, durante um ms, por uma firma comercial:

14 19 12 21

12 14 14 13

11 20 10 16

13 14 13 17

14 11 15 14

13 12 18 14

a) Elabore uma distribuio de freqncia comeando a primeira classe com o intervalo: b) Faa a anlise da penltima classe da distribuio 7) O corpo administrativo de um consultrio mdico estudou o tempo de espera dos pacientes que chegavam ao consultrio com uma solicitao de servio de emergncia. Os seguintes dados foram coletados no perodo de um ms (os tempos de espera esto em minutos): 2 5 10 12 4 4 5 17 11 8 9 8 12 21 6 8 7 13 18 3 a) Construa a distribuio de freqncia; b) Que proporo de pacientes necessitam de servio de emergncia enfrentam um tempo de espera de nove minutos ou menos? 8) A MKT Image uma empresa de consultoria em marketing e iniciou um trabalho de pesquisa para a TDI, que pretende lanar um novo produto no mercado brasileiro. Foram aplicadas algumas pesquisas de mercado para verificar o potencial de compra por parte da populao. A tabela abaixo mostra os dados sobre uma amostra da populao pesquisada, referente renda familiar mensal (em salrio mnimo):

Salrio Mnimo 0|------5 5|-----10

Nmero de pesquisados 734 526

10|-------15 15|-------20 20|-------25 TOTAL

205 140 60

5
Prximo >

Considerando os dados acima, podemos afirmar que: a) 30% da amostra ganham 10 salrios mnimos ou mais; b) Somente 44,08% da amostra ganham abaixo de 10 salrios mnimos; c) Menos de 10% da amostra ganham 15 salrios mnimos ou mais; d) Mais de 75% da amostra ganham abaixo de 10 salrios mnimos; e) Mais de 5% da amostra ganham 20 salrios mnimos ou mais. < Anterior

08 Medidas de Tendncia Central


MEDIDAS DE POSIO
As medidas de posio so valores que nos auxiliam na anlise da posio da distribuio em relao aos valores observados da varivel em estudo.

Estas medidas dividem-se em medidas de tendncia central, que se caracterizam pelo fato dos dados tenderem a se concentrar em valores centrais, e as medidas conhecidas como separatrizes.

Medidas de Tendncia Central


Mdia
A mdia representa o ponto de concentrao dos valores de um conjunto de dados ou uma seqncia numrica.

1 caso: Dados no agrupados (dados brutos ou rol)


Utilizamos a mdia aritmtica simples:

(onde n o n de elementos do conjunto)

Exemplo: Determinar a mdia aritmtica simples dos valores: 3, 7, 8, 10 e 11

2 caso: Dados agrupados sem intervalos (varivel discreta)


Utilizamos a mdia aritmtica ponderada:

Exemplo: Dada a amostra: 2, 5, 5, 5, 5, 6, 6, 6, 8, 8

6
xi 2 5 6 8 fi xifi 1 2 4 20 3 18 2 16

Total 10 56

Ento a mdia ser :

3 caso: Dados agrupados com intervalos (varivel contnua) Classe Intervalos fi Pmi

Pmifi 3,5 65 76 12,5 157

1 2 3 4 Total

2 |--- 5 5 |--- 8 8 |--- 11 11 |--- 14

1 10 8 1 20

3,5 6,5 9,5 12,5

Foi introduzida a coluna do ponto mdio da classe (Pm), obtido assim:

Portanto:

Interpretao: O valor mdio desta srie 7,85, isto , o valor em torno do qual os elementos desta srie se

concentram.

Exerccios:
1) Calcule a mdia aritmtica das sries abaixo:

a) 1, 2, 8, 10, 12, 16, 21, 30

b) 5, 6, 6, 10, 11, 11, 20

2) Calcule a mdia para as tabelas abaixo:

xi xi 2 3 4 5 Total Total fi 17 1 18 4 19 3 20 2 21

fi 3 18 17 8 4

3) O salrio de 39 funcionrios de um escritrio est distribudo segundo o quadro abaixo. Calcule o salrio mdio destes funcionrios.

classe 1 2 3 4 5

Salrios (R$) 400 |--- 500 500 |--- 600 600 |--- 700 700 |--- 800 800 |--- 900

n func. 12 15 8 3 1

4) Uma imobiliria gerencia o aluguel de residncias particulares, segundo o quadro abaixo. Calcule a mdia:

classe 1 2 3 4 5 Total

Aluguel (R$) 0 |--- 200 200 |--- 400 400 |--- 600 600 |--- 800 800 |--- 1000

n casa 30 52 28 7 3

5) Em uma empresa temos 4 operrios com salrio de R$850,00, 2 supervisores com salrio de R$1.200,00, 1 gerente com salrio de R$2.000,00 e 6 vendedores com salrio de R$1.100,00. Qual a mdia salarial dessa empresa?

Respostas: 1) a) 12,5

b) 9,86 b) 8,84 4) 335 5) R$1.107,69

2) a) 3,6 3) 562,82

Moda
1 Caso: Dados no agrupados:
o valor de maior frequncia em um conjunto de dados ou que aparece mais vezes. Ex: 7, 8, 8, 9, 10, 10, 10, 12, 15. O elemento de maior frequncia o 10, portanto Mo=10 (unimodal) Ex: 3, 5, 8, 10, 12 e 13 Todos os elementos da srie apresentam a mesma frequncia, logo a srie amodal. Ex: 2, 2, 5, 5, 8, 9 Temos Mo=2 e Mo=5 (bimodal)

2 Caso: Dados agrupados sem intervalo


Basta identificar o elemento de maior freqncia.

xi 0 2 3 4 6
Portanto Mo=3

fi 2 4 5 3 1

3 Caso: Dados agrupados com intervalos


Dada a tabela:

classe 1 2 3 4

amostra 0 I----- 10 10 I----- 20 20 I----- 30 30 I----- 40

fi 1 3 6 2

1 Passo: Identifica-se a classe modal (aquela que possui maior freqncia)

2 Passo: Aplica-se a frmula:

Onde

lMo= limite inferior da classe modal

= diferena entre a freqncia (fi) da classe modal e a imediatamente anterior

= diferena entre a freqncia (fi) da classe modal e a imediatamente posterior.

10

h = amplitude da classe No exemplo da tabela anterior:

1 Passo: Indica-se a classe modal. No caso, trata-se da 3 classe (maior fi=6)

2 Passo: Aplica-se a frmula acima:

Exerccios:
1) Calcule a moda para as sries abaixo: a) 2, 2, 3, 4, 5, 5, 5, 7 b) 3, 4, 4, 5, 9, 12, 12

) Calcule a moda das distribuies abaixo:

xi xi 2 3 4 5 Total Total fi 17 1 18 7 19 2 20 2 21

fi 3 18 17 8 4

3) A distribuio abaixo representa o consumo em Kg de um produto colocado em oferta em um supermercado. Calcule a moda:

classe 1

consumo 0 |--- 1

n de clientes 12

2 3 4 5

1 |--- 2 2 |--- 3 3 |--- 4 4 |--- 5

15 21 32 20

11

4) A distribuio abaixo representa o nmero de acidentes de trabalho por dia em uma indstria Petroqumica, verificados durante um ms. Calcule a moda:

classe 1 2 3 4

n de acidentes 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8

n de dias 20 6 3 1

Respostas:
1) a) 5 b) 4 e 12 2) a) 3 b) 18 3) 3,48 4) 1,18

Exerccios extras:
1) Calcule a mdia aritmtica das distribuies abaixo:

notas 2 3 5 8 10 Total tabela a

fi 5 8 14 10 7

salrios 520 780 940 1.240 1.590 Total tabela b

fi 18 31 15 3 1

vendas 145 158 163 175 187 Total tabela c

fi 10 9 8 4 2

2) Calcule a moda para as tabelas acima.

3) Calcule a mediana para as tabelas acima. 4) Calcule a mdia aritmtica para as tabelas abaixo:

12
Estaturas(cm) 150 |--- 158 158 |--- 166 fi 5 12 18 27 8 166 |--- 174 174 |--- 182 182 |--- 190 total tabela b

Salrios(R$) 200 |--- 400 400 |--- 600 600 |--- 800 800 |--- 1.000 1.000 |--- 1.200 total tabela a Notas 0 |--- 2 2 |--- 4 4 |--- 6 6 |--- 8 8 |--- 10 Total tabela c

n funcionrios 15

8 2 1

n alunos 5 8 14 10 7

pesos (Kg) 145 |--- 151 151 |--- 157 157 |--- 163 163 |--- 169 169 |--- 175 Total tabela d

Fi 10 9 8 5 3

5) Calcule a mediana para as tabelas acima. 6) Calcule a moda para as tabelas acima.

Respostas: 1- a) 5,77

b) 778,68 b) 780 b) 780 b) 172,40 b) 174

c) 159,09 c) 145 c) 158 c) 5,27 c) 5,29 d)156,91 d)156

2 a) 5 3 a) 5 4 a) 500 5 a) 466,67

6 - a) 366,67

b) 176,57

c) 5,20

d)150,45

Mediana (Md)

A mediana corresponde ao valor que ocupa a posio central numa seqncia de nmeros e representada por Md.

13

Na seqncia numrica x1,x2,...xk,...xn, o elemento xk a Md se o nmero de elementos que o antecedem for igual ao nmero de elementos que o sucedem.

1 caso: Dados no agrupados (dados brutos ou rol)


Para obter a mediana, primeiro colocamos a seqncia numrica em ordem crescente ou decrescente. Depois, verificamos se a amostra par ou mpar e adotamos um dos procedimentos a seguir.

Se n mpar, o rol admite apenas um termo central que ocupa a posio ocupa esta posio a mediana.

. O valor do elemento que

Se n par: o rol admite dois termos centrais: termos centrai.

. O valor da mediana ser a mdia deste dois

Exemplo 1 (n mpar): 5, 13, 10, 2, 18, 15, 6, 16 e 9

Colocar os valores em ordem crescente: 2, 5, 6, 9, 10, 13, 15, 16, 18

Se n=9 logo

que representa o 5 elemento, logo Md= 10

Exemplo 2 (n par): 2, 6, 7, 10, 12, 13, 18 e 21 ( j est em ordem)

Se n=8 logo:

a mediana est entre o 4 e o 5 elementos, ou seja, 10 e 12.

Obtemos

2 caso: Dados agrupados sem intervalos (varivel discreta)


Dada a amostra: 12, 14, 14, 15, 16, 16, 17, 20 e 20

xi

fi Fi

12 14 15 16 17 20

1 1 2 3 1 4 2 6 1 7 2 9

14

Total 9

Construindo a coluna da frequncia acumulada podemos localizar com facilidade o valor mediano.

, ou seja o 5 elemento, portanto a mediana ser o 16.

3 Caso: Dados agrupados com intervalos (varivel contnua)


Dada a tabela:

Classe 1 2 3 4 5 Total

Amostra 3 |--- 6 6 |--- 9 9 |--- 12 12 |--- 15 15 |--- 18

fi 2 5 8 3 1 19

Fi 2 7 15 18 19

1 Passo: Calcula-se a ordem

2 Passo: Pela freqncia acumulada (F) identificamos a classe que contm a mediana (classe da Md).

3 Passo: Utiliza-se a frmula:

15
Onde: lMd= limite inferior da classe da mediana n = tamanho da amostra Fant= freqncia acumulada anterior classe da mediana (ou soma dos valores de f i anteriores classe da mediana)

h = amplitude da classe da mediana

fMd = freqncia da classe da mediana

No exemplo da tabela anterior:

1 Passo: Calcula-se

. Com n=19, temos 19/2=9,5 (10 elemento)

2 Passo: Identifica-se a classe da mediana pela F. Neste caso, a classe da mediana a 3.

3 Passo: Aplica-se a frmula:

obtendo-se:

Interpretao: 50% dos valores da srie so valores menores ou iguais a 9,93 e 50% dos valores da srie so valores maiores ou iguais a 9,93.

Exerccios:
1) Calcule a mediana das seqncias abaixo:

16
xi 17 18 19 20 21 Total fi 3 18 4 3 1

a) 2, 5, 8, 10, 12, 15, 18, 20

b) 3, 4, 5, 7, 7, 8, 10, 15

2 Calcule a mediana das distribuies abaixo:

xi 2 4 5 6 8 Total

fi 5 20 10 10 2

3-Determine o valor mediano da distribuio a seguir que representa os salrios de 23 funcionrios selecionados em uma empresa:

classe 1 2 3 4

salrios (R$) 200 |--- 400 400 |--- 600 600 |--- 800 800 |--- 1000

n funcionrios 2 6 10 5

4-Uma loja de departamentos selecionou um grupo de 53 notas fiscais, durante um dia e obteve o seguinte quadro:

classe 1 2

consumo 0 |--- 50 50 |--- 100

n notas 10 28

3 4 5 total

100 |--- 150 150 |--- 200 200 |--- 250

12 2 1

17

Respostas:
1) a)11 b)7

2) a)4 b)18

3) 670

4) 79,46 < Anterior

1.6.5 Distribuio de Freqncia


1.6.5.1 Tabela Primitiva Vamos considerar, neste captulo, a forma pela qual podemos descrever os dados estatsticos resultantes de variveis quantitativas, como o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salrios recebidos pelos operrios de uma fbrica etc. Suponhamos termos feito uma coleta de dados relativos s estaturas de quarenta alunos, que compem uma amostra dos alunos de um colgio A, resultando a seguinte tabela de valores: TABELA 1 ESTATURAS DE 40 ALUNOS DA FACULDADE A 166 162 155 154 160 168 152 161 161 161 163 156 150 163 160 172 162 156 155 153 160 173 155 157 165 160 169 156 167 155 151 158 164 164 170 158 160 168 164 161

A esse tipo de tabela, cujos elementos no foram numericamente organizados, denominamos tabela primitiva.

1.6.5.2 Rol

Partindo dos dados acima tabela primitiva difcil averiguar em torno de que valor tende a se concentrar as estaturas, qual a menor ou qual a maior estatura ou, ainda, quantos alunos se acham abaixo ou acima de uma dada estatura.

18

Assim, conhecidos os valores de uma varivel, difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir dos dados no ordenados. A maneira mais simples de organizar os dados atravs de uma certa ordenao (crescente ou decrescente). A tabela obtida atravs da ordenao dos dados recebe o nome de rol. TABELA 2 ESTATURAS DE 40 ALUNOS DA FACULDADE A 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173

Agora, podemos saber, com relativa facilidade, qual a menor estatura (173 cm); que a amplitude de variao foi de 173 150 = 23 cm; e, ainda, a ordem que um valor particular da varivel ocupa no conjunto. Com um exame mais acurado, vemos que h uma concentrao das estaturas em algum valor entre 160 cm e 165 cm e, mais ainda, que h poucos valores abaixo de 155 cm e acima de 170 cm. 1.6.5.3 Distribuio de Freqncia No exemplo que trabalhamos, a varivel em questo, estatura, ser observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o nmero de vezes que aparece repetido. Denominamos freqncia o nmero de alunos que fica relacionado a um determinado valor da varivel. Obtemos, assim, uma tabela que recebe o nome de distribuio de freqncia: TABELA 3 ESTATURAS (cm) 150 151 152 153 154 155 156 157 158 160 161 162 163 164 165 166 FREQ 1 1 1 1 1 4 3 1 2 5 4 2 2 3 1 1

167 168 169 170 172 173 Total

1 2 1 1 1 1 40

19

Mas o processo dado ainda inconveniente, j que exige muito mais espao, mesmo quando o nmero de valores da varivel (n) de tamanho razovel. Sendo possvel, a soluo mais aceitvel, pela prpria natureza da varivel contnua, o agrupamento dos valores em vrios intervalos. Assim, se um dos intervalos for, por exemplo, 154 ( 851 um intervalo fechado esquerda e aberto direita, tal que: 154 x < 158), em vez de dizermos que a estatura de 1 aluno de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157 cm, dizemos que 9 alunos tm estaturas entre 154, inclusive, e 158 cm. Deste modo, estaremos agrupando os valores da varivel em intervalos, sendo que, em Estatstica, preferimos chamar os intervalos de classes. Chamando de freqncia de uma classe o nmero de valores da varivel pertencente classe, os dados da Tabela 3 podem ser dispostos como na Tabela 4, denominada distribuio de freqncia com intervalos de classe: Exemplo: TABELA 4 ESTATURAS DE 40 ALUNOS DA FACULDADE A - 2007 ESTATURAS (cm) 150 154 158 162 166 170 154 158 162 166 170 174 FREQUNCIA 4 9 11 8 5 3 40

Total
Dados fictcios.

Ao agruparmos os valores da varivel em classes, ganhamos em simplicidade para perdermos em pormenores. Assim, na Tabela 3 podemos verificar, facilmente, que quatro alunos tm 161 cm de altura e que no existe nenhum aluno com 1,71 cm de altura. J na Tabela 4 no podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurana, que onze alunos tm estatura compreendida entre 158 e 162 cm. O que pretendemos com a construo dessa nova tabela realar o que h de essencial nos dados e, tambm, tornar possvel o uso de tcnicas analticas para sua total descrio, at porque a estatstica tem por finalidade especfica analisar o conjunto de valores, desinteressando-se por casos isolados. Notas:

Se nosso intuito , desde o incio, a obteno de uma distribuio de freqncia com intervalos de classe, basta, a partir da Tabela 1, fazemos uma tabulao.

Quando os dados esto organizados em uma distribuio de freqncia, so comumente denominados dados agrupados. 1.6.5.4 Elementos de uma Distribuio de Freqncia

20

1) Classes de freqncia ou, simplesmente, classes so intervalos de variao da varivel. As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k (onde k o nmero total de classes da distribuio). Assim, em nosso exemplo, o intervalo 154 158 define a segunda classe (i = 2). Como a distribuio formada de seis classes, podemos afirmar que k = 6. 2) Denominamos limites de classe os extremos de cada classe. O menor nmero o limite inferior da classe (li) e o maior nmero, o limite superior da classe (Li). Na segunda classe, por exemplo, temos: l2 = 154 Nota: Os intervalos de classe devem ser escritos, de acordo com a Resoluo 886/66 do IBGE, em termos desta quantidade at menos aquela, empregando, para isso, o smbolo ( incluso de li e excluso de Li). Assim, o indivduo com uma estatura de 158 cm est includo na terceira classe (i = 3) e no na segunda. 3) Amplitude de um intervalo de classe, ou, simplesmente, intervalo de classe a medida do intervalo que define a classe. Ela obtida pela diferena entre os limites superior e inferior dessa classe e indicada por hi. Assim: hi = Li - li Na distribuio da Tabela 1.6.5.4, temos: h2 = L2 l2 h2 = 158 154 = 4 cm 4) Amplitude total da distribuio (AT) a diferena entre o limite superior da ltima classe (limite superior mximo) e o limite inferior da primeira classe (limite inferior mnimo): AT = L(mx) l(mn) Em nosso exemplo, temos: AT = 174 14501 = 24 AT = 24 cm Nota: evidente que, se as classes possuem o mesmo intervalo, verificamos a relao: AT hi = k e L2 = 158

5) Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra: AA = x(mx) x(mn) Em nosso exemplo, temos: AA = 173 - 150 = 23 AA = 23 cm Observe que a amplitude total da distribuio jamais coincide com a amplitude amostral. 6) Ponto mdio de uma classe (xi) , como o prprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais.

21

Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos limites de da classe (mdia aritmtica): xi = (li + Li) 2 Assim, o ponto mdio da segunda classe, em nosso exemplo, : xi = (li + Li) 2 x2 = (154 + 158) 2 = 156 cm Nota: O ponto mdio de uma classe o valor que a representa. 7) Freqncia simples ou freqncia absoluta ou, simplesmente, freqncia de uma classe ou de um valor individual o nmero de observaes correspondentes a essa classe ou a esse valor.

A freqncia simples simbolizada por fi (lemos: f ndice i ou freqncia da classe i). Assim, em nosso exemplo, temos: f1 = 4, f2 = 9, f3 = 11, f4 = 8, f5 = 5 e f6 = 3 A soma de todas as freqncias representada pelo smbolo de somatrio (): (i=1 k)fi = n Para a distribuio em estudo, temos: (i=1 6)fi = 40 ou fi = 40 Podemos, agora, dar distribuio de freqncia das estaturas dos quarenta alunos da faculdade A, a seguinte representao tabular tcnica: TABELA 5 ESTATURAS DE 40 ALUNOS DA FACULDADE A i 1 2 3 4 5 6 ESTATURAS (cm) 150 154 158 162 166 170 154 158 162 166 170 174 fi 4 9 11 8 5 3 fi = 40

1.6.5.5 Nmero de Classes Intervalos de Classe

A primeira preocupao que temos, na construo de uma distribuio de freqncia, a determinao do nmero de classes e, consequentemente, da amplitude e dos limites dos intervalos de classe. Para a determinao do nmero de classes de uma distribuio podemos lanar mo da regra de Sturges, que nos d o nmero de classes em funo do nmero de valores da varivel: i 1 + 3,3 . log n onde: i o nmero de classe; n o nmero total de dados. Essa regra nos permite obter a seguinte tabela: TABELA 6 ESTATURAS (cm) 3 6 12 23 47 91 182 5 11 22 64 09 181 263 ... fi 3 4 5 6 7 8 9 ...

22

Alm da regra de Sturges, existem outras frmulas empricas que pretendem resolver o problema da determinao do nmero de classes que deve ter a distribuio (h quem prefira: i = h). Entretanto, a verdade que essas frmulas no nos levam a uma deciso final; esta vai depender, na realidade, de um julgamento pessoal, que deve estar ligado natureza dos dados, da unidade usada para expressa-los e, ainda, do objetivo que se tem em vista, procurando, sempre que possvel, evitar classe com freqncia nula ou com freqncia relativa muito exagerada etc. Decidido o nmero de classes que deve ter a distribuio, resta-nos resolver o problema da determinao da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo nmero de classes: h AT / i Quando o resultado no exato, devemos arredond-lo para mais. Outro problema que surge a escolha dos limites dos intervalos, os quais devero ser tais que forneam, na medida do possvel, para pontos mdios, nmeros que facilitem os clculos nmeros naturais. Em nosso exemplo, temos: Para n = 40, pela Tabela 6, i = 6 Logo: h = (173 -150) / 6 = 23/6 = 3,8 4 Isto , seis classes de intervalos iguais a 4. Resolva: 1) As notas obtidas por 50 alunos de uma classe foram:

1 2 2 2 2

2 3 3 3 3

3 3 4 4 4

4 4 4 5 5

5 4 5 5 5

6 6 6 6 6

6 6 6 6 7

7 7 7 7 7

7 8 8 8 8

8 8 9 9 9

23

a. Complete a distribuio de freqncia abaixo: i 1 2 3 4 5 6 NOTAS 0 2 4 6 8 2 4 6 8 10 xi 1 .... .... .... .... fi 1 .... .... .... .... fi = 50 b. Agora responda: 1. Qual a amplitude amostral? 2. Qual a amplitude da distribuio? 3. Qual o nmero de classes da distribuio? 4. Qual o limite inferior da quarta classe? 5. Qual o limite superior da classe de ordem 2? 6. Qual a amplitude do segundo intervalo da classe? c. Complete: 1. h3 = .... 2. n = .... 3. l1 = .... 4. L3 = .... 5. x2 = .... 6. f5 = ....

1.6.5.6 Tipos de Freqncias 1) Freqncias simples ou absolutas (fi) so os valores que realmente representam o nmero de dados de cada classe. Como vimos, a soma das freqncias simples igual ao nmero total dos dados: fi = n 2) Freqncias relativas (fri) so os valores das razes entre as freqncias simples e a freqncia total: Como vimos, a soma das freqncias simples igual ao nmero total dos dados: fri = fi / fi Logo, a freqncia relativa da terceira classe, em nosso exemplo (Tabela 5), : fr3 = f3 / f3 fr3 = 11 / 40 = 0,275 Evidentemente: fri = 1 ou 100%

Nota:

O propsito das freqncias relativas o de permitir a anlise ou facilitar as comparaes.

24

3) Freqncia acumulada (Fi) o total das freqncias de todos os valores inferiores ao limite superior do intervalo de uma dada classe: Fk = f1 + f2 + ... + fk ou Fk = fi (i = 1, 2, ..., k)

Assim, no exemplo apresentado no incio deste captulo, a freqncia acumulada correspondente terceira classe : F3 = (i=1 3) fi = f1 + f2 + f3 F3 = 4 + 9 + 11 = 24, O que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe). 4) Freqncia acumulada relativa (Fri) de uma classe a freqncia acumulada da classe, dividida pela freqncia total da distribuio: Fri = Fi / fi Assim, para a terceira classe, temos: Fri = Fi / fi Fri = 24/40 = 0,6 Considerando a Tabela 3, podemos montar a seguinte tabela com as freqncias estudadas: TABELA 7 i 1 2 3 4 5 6 ESTATURAS (cm) 150 154 158 162 166 170 154 158 162 166 170 174 fi 4 9 11 8 5 3 = 40 xi 152 156 160 164 168 172 fri 0,100 0,225 0,275 0,200 0,125 0,075 = 1,000 Fi 4 913 24 32 37 40 Fri 0,100 0,325 0,600 0,800 0,925 1,000

O conhecimento dos vrios tipos de freqncia ajuda-nos a responder a muitas questes com relativa facilidade, como as seguintes: a. Quantos alunos tm estatura entre 154 cm, inclusive, e 158 cm? Esses so os valores da varivel que formam a segunda classe. Como f 2 = 9, a resposta : 9 alunos. b. Qual a percentagem de alunos cujas estaturas so inferiores a 154 cm? Esses valores so os que formam a primeira classe. Como fr1 = 0,100, obtemos a resposta multiplicando a freqncia relativa por 100: 0,100 x 100 = 10 Logo, a percentagem de alunos 10%. c. Quantos alunos tm estatura abaixo de 162?

evidente que as estaturas consideradas so aquelas que formam as classes de ordem 1, 2 e 3. Assim, o nmero de alunos dado por: F3 = (i=1 3) fi = f1 + f2 + f3 F3 = 24 Portanto, 24 alunos tm estatura abaixo de 162 cm.

25

d. Quantos alunos tm estatura no-inferior a 158 cm? O nmero de alunos dado por: (i=1 6) fi = f3 + f4 + f5 + f6 = 11 + 8 + 5 + 3 = 27 Ou, ento: (i=1 6) fi F2 = n - F2 = 40 13 = 27 1.6.5.7 Distribuio de Freqncia sem Intervalos de Classe Quando se trata de varivel discreta de variao relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuio chamada distribuio sem intervalos de classe, tomando a seguinte forma: TABELA 8 xi x1 x2 . . . xn fri f1 f2 . . . fn fi = n Exemplo: Seja x a varivel nmero de cmodos das casas ocupadas por vinte famlias entrevistadas: TABELA 9 i 1 2 3 4 5 6 xi 2 3 4 5 6 7 fi 4 7 5 2 1 1 = 40 Completada com vrios tipos de freqncia, temos: TABELA 10 i xi fi fri Fi Fri

1 2 3 4 5 6

2 3 4 5 6 7 = 20

4 7 5 2 1 1

0,20 0,35 0,25 0,10 0,05 0,05 = 1,00

4 11 16 18 19 20

0,20 0,55 0,80 0,90 0,95 1,00

26

Nota: Se a varivel toma numerosos valores distintos, comum trata-la como uma varivel contnua, formando intervalos de classe de amplitude diferente de um. Este tratamento (arbitrrio) abrevia o trabalho, mas acarreta alguma perda de preciso. Resolva: 1) Complete a distribuio abaixo, determinando as freqncias simples:

i 1 2 3 4 5

xi 2 3 4 5 6

fi .... .... .... .... .... = 20

Fi 2 9 21 29 34