You are on page 1of 14

FACULDADE ASSIS GURGACZ - FAG

PROBABILIDADE E ESTATSTICA AULA 02


PROF. KARINA SANDERSON

ANLISE EXPLORATRIA DOS DADOS OU ESTATSTICA DESCRITIVA

1. Introduo

A Estatstica Descritiva a fase na qual os dados de um experimento ou pesquisa so


organizados, resumidos, descritos, apresentados e interpretados. Esta fase de grande importncia
para uma pesquisa, pois nela, podemos perceber as tendncias do nosso conjunto de dados.
Aps a coleta dos dados experimentais devemos organiz-los e apresent-los, esta
apresentao pode ser feita atravs de tabelas e grficos.

2. Tabelas de distribuio de freqncias

A apresentao atravs de tabelas dever ser realizada em uma pesquisa, mediante alguma
conveno ou norma, dependendo de qual instituio, congresso ou rgo, esta tabela ser
apresentada. Mas podemos utilizar alguns princpios bsicos segundo as normas do IBGE
(Instituto Brasileiro de Geografia e Estatstica):
- Ttulo: aonde dada uma noo inicial ao leitor sobre o que a tabela;
- Cabealho: para que sejam identificados os contedos referentes a cada coluna da tabela. O
cabealho deve conter o suficiente para responder as questes: o que est sendo representado?
Onde ocorreu? Quando ocorreu?
- Coluna Indicadora: que especifica as diferentes categorias da varivel;
- Corpo: representado por colunas e subcolunas dos quais so registrados os dados numricos e
informaes.
- Rodap ou p: onde identificada a fonte original dos dados, ou alguma nota referente tabela.

Exemplo:
INAMPS Empresas fiscalizadas em 1973
Regies Empresas fiscalizadas
Norte 7495
Nordeste 107783
Sudeste 281207
Sul 53661
Centro oeste 15776
Fonte: Mensrio Estatstico 259/260

8
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
Observao: No h linhas laterais, ponto final em cada linha e linhas horizontais no corpo da
tabela separando as linhas.

Uma tabela de distribuio de freqncias composta, alm dos itens citados acima:

- Dados brutos: O conjunto dos dados numricos obtidos aps a crtica dos valores coletados. Os
seguintes valores poderiam ser os dados brutos: 24, 23, 22, 28, 35, 21, 23, 33.

- Rol: o arranjo dos dados brutos em ordem de freqncia crescente ou decrescente. Os dados
brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33, 35.

- Amplitude Total ou "range" (R): a diferena entre o maior e o menor valor observado. No
exemplo, R = 35 - 21 = 14.

- Freqncia Absoluta (fi): o nmero de vezes que o elemento aparece na amostra, ou o nmero
de elementos pertencentes a uma classe.

- Freqncia Absoluta Acumulada (fac): a soma da freqncia absoluta da classe com a


freqncia absoluta das classes anteriores.

- Freqncia Relativa (fr): A freqncia relativa o valor da freqncia absoluta dividido pelo
f
nmero total de observaes: fr = i .
n
- Freqncia Acumulada Relativa (far): A freqncia acumulada relativa o valor da freqncia
f
acumulada dividido pelo nmero total de observaes: far = ac .
n

2.1. Como organizar dados em tabela de distribuio de frequncia

- Dados Brutos: 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51.

- Rol: 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60.

- Distribuio de freqncia sem intervalos de classe: a simples condensao dos dados


conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de
freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo:

Dados Freqncia
41 3
42 2
43 1
44 1
45 1
46 2
50 2
51 1

9
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
52 1
54 1
57 1
58 2
60 2
Total 20

- Distribuio de freqncia com intervalos de classe: Quando o tamanho da amostra elevado


mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

Classes Freqncias
41 |------- 45 7
45 |------- 49 3
49 |------- 53 4
53 |------- 57 1
57 |------- 61 5
Total 20

- Elementos de uma distribuio de freqncia (com intervalos de classe):

- Classe: so os intervalos de variao da varivel e simbolizada por i e o nmero total de classes


simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 a 3 classe, onde i = 3. Calcular o
nmero de classes atravs da "Regra de Sturges": Frmula de Sturges: k 1 + 3,22 log n.

- Limites de classe: so os extremos de cada classe. O menor nmero o limite inferior de classe
(li) e o maior nmero, limite superior de classe (Li). Ex: em 49 |------- 53... l3= 49 e L3= 53. O
smbolo |------- representa um intervalo fechado esquerda e aberto direita. O dado 53 do Rol
no pertence classe 3 e sim a classe 4 representada por 53 |------- 57.

- Amplitude do intervalo de classe: obtida atravs da diferena entre o limite superior e inferior
da classe e simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na
distribuio de freqncia com classe o hi ser igual em todas as classes.

- Amplitude total da distribuio: a diferena entre o limite superior da ltima classe e o limite
inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20.

- Amplitude total da amostra (Rol): a diferena entre o valor mximo e o valor mnimo da
amostra (ROL). Onde R = Xmax - Xmin. Em nosso exemplo R = 60 - 41 = 19.
Obs: AT sempre ser maior que R.

- Ponto mdio de classe: o ponto que divide o intervalo de classe em duas partes iguais. Ex: em
49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2.

10
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
2.1.1. Mtodo prtico para construo de tabelas de distribuio de freqncia com classe

1 - Organize os dados brutos em um Rol.

2 - Calcule a amplitude amostral R.


No nosso exemplo: R =60 - 41 =19

3 - Calcule o nmero de classes atravs da "Regra de Sturges": k 1 + 3,22 log n.

n I = n de classes
3 |-----| 5 3
6 |-----| 11 4
12 |-----| 22 5
23 |-----| 46 6
47 |-----| 90 7
91 |-----| 181 8
182 |-----| 362 9

Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma deciso
final; esta vai depender na realidade de um julgamento pessoal, que deve estar ligado natureza
dos dados.
No nosso exemplo: n = 20 dados, ento, a princpio, a regra sugere a adoo de 5 classes.

4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe hi > R / k.


No nosso exemplo: R / k = 19/5 = 3,8 . Obs: Como hi > R / k, um valor ligeiramente superior para
haver folga na ltima classe. Utilizaremos ento hi = 4

5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos


montar a tabela, com o cuidado para no aparecer classes com freqncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 41 + hi = 45, logo a primeira classe ser representada
por: 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento.
O primeiro elemento das classes seguintes sempre ser formado pelo ltimo elemento da classe
anterior.

2.1.2. Distribuio de Freqncias e Histograma para Dados sem Intervalo de Classe

Utilizamos esse tipo de distribuio quando o nmero de elementos distintos da amostra for
pequeno.
Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25,
26, 26, 26, 28, 30. Construa uma distribuio com todas as freqncias.

X fi fac fr far
21 3 3 3/17 3/17
22 2 5 2/17 5/17
23 2 7 2/17 7/17

11
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
24 1 8 1/17 8/17
25 4 12 4/17 12/17
26 3 15 3/17 15/17
28 1 16 1/17 16/17
30 1 17 1/17 17/17
17 1

2.2. Tabela de distribuio de freqncias bidimensional

Muitas vezes, estamos interessados em analisar o comportamento conjunto de duas ou mais


variveis. Assim, vamos estudar como organizamos e resumimos os dados para uma distribuio
conjunta de duas variveis em forma de tabelas.
O exemplo mostrado abaixo apresenta o nmero de nascidos vivos registrados,
classificados segundo dois fatores: o ano de registro e o sexo.

Tabela 3: Nascidos vivos registrados segundo o ano de registro e o sexo.


Ano de registro Sexo Total
Masculino Feminino
1984 1.307.758 1.251.280 2.559.038
1985 1.339.059 1.280.545 2.619.604
1986 1.418.050 1.361.203 2.779.253
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro.

2.3. Representao Grfica para Variveis Qualitativas e Quantitativas

A apresentao dos dados atravs de grficos nos fornece uma excelente idia dos
resultados obtidos e de como se relacionam os dados. Todo grfico ou diagrama deve ser auto-
explicativo e de fcil compreenso, devem ter trs requisitos bsicos: simplicidade, clareza e
veracidade. Mas algumas sugestes devem ser seguidas na sua construo:
- O tamanho do grfico deve ser adequado sua publicao;
- Todo grfico dever ter sempre um ttulo e uma escala, sendo que, esta escala deve ser adequada
para que no desfigure os fatos.

2.3.1. Representao grfica de variveis qualitativas

Para a representao grfica de variveis qualitativas, os tipos de grficos mais usados so:
grficos de ordenadas, grfico em barras, grfico em colunas, pictograma, dot plot, grfico de
setores.

12
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON

Grfico de Ordenadas

Para a sua construo traada uma reta horizontal (ou vertical) que servir de base; a
partir de pontos com a mesma distncia nesta reta, constroem-se traos perpendiculares, cujo
comprimento seja proporcional a freqncia.

2,2
Preo da gasolina (R$)

1,8

1,6

1,4
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Ms em 2002

Figura 1: Variao do preo da gasolina em 2002.

Grfico em Barras

O grfico em barras a representao em que sobre o eixo vertical constroem-se retngulos


para as diferentes categorias da nossa varivel, com largura apropriada e altura proporcional as
respectivas freqncias de cada categoria. As barras no so justapostas ou ligadas, pois na maioria
das vezes as categorias das variveis qualitativas no apresentam relao de continuidade.

Nmero de Comrcios Informais em Bairros de


Cascavel
Faculdade

Colmia

Guaruj
Bairro
Caravelli

So Cristvo

Consolata

5 20 35 50
Nm ero de Com rcios

Figura 2: Nmero de Comrcios Informais em diversos bairros de Cascavel.

Grfico em Colunas

A construo do grfico em colunas semelhante ao em barras, com uma nica diferena,


os retngulos sero sustentados no eixo horizontal.

13
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON

56

52

%
48

44

40
Masculino Feminino
Gnero

Figura 3: Porcentagem dos alunos do curso de Publicidade segundo o gnero.


Grfico de Setores Circulares

Geralmente este grfico usado para evidenciar a distribuio percentual de uma


populao ou amostra. Para a construo deste tipo de grfico, divide-se a rea total de um crculo
em subreas (setores) proporcionais s respectivas freqncias absoluta ou relativa.
Lembrando que um crculo tem 360, ento usaremos a seguinte regra de trs para
calcularmos o ngulo de cada setor:
n 360
360 fi
fi x x =
n

Onde n o total de elementos no conjunto de dados e fi a respectiva freqncia absoluta da


categoria da varivel. Para calcularmos o ngulo para a freqncia relativa basta substituirmos o
total de elementos pelo nmero 1.
Sabendo-se o ngulo de cada setor, traa-se uma circunferncia e assim, basta marcarmos
os valores da cada ngulo na circunferncia e traar os raios, separando os setores.

Nmero de Comrcios Informais em Cascavel

Consolata
So Cristvo
Caravelli
Guaruj
Colmia
Faculdade

Figura 4: Nmero de Comrcios Informais em diversos bairros de Cascavel.

Pictograma

O grfico pictograma semelhante ao grfico em colunas, com a diferena que no lugar de


retngulos sero figuras que representaram as distribuies de freqncia.

14
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON

Figura 5: Nmero de Visitantes na MOVELSUL.

2.3.2. Representao grfica de variveis quantitativas

Alguns tipos de grficos que construmos anteriormente: grfico em colunas, em barras, de


setores circulares tambm so usados para representar a distribuio de variveis quantitativas.

Histograma

Este um grfico usado para apresentar dados organizados em intervalos, utilizado


principalmente para representar a distribuio de variveis contnuas.

- Histograma para classes com amplitudes iguais

Para a sua construo, trace o sistema de eixo cartesiano; marque os extremos das classes
no eixo horizontal (das abscissas); no eixo vertical (das ordenadas) marque as freqncias
absolutas ou freqncias relativas; e para cada classe, trace um retngulo com base igual ao
intervalo de classe e altura igual a freqncia.
Os histogramas podem ser simtricos ou assimtricos:

Figura 5: Histogramas simtricos

Figura 6: Histogramas Assimtricos

- Histograma para classes com amplitude diferentes

Para a sua construo, calcule a densidade de freqncia absoluta ou relativa.


f h
di = i ou di = i
h h

15
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
Trace um sistema de eixos cartesianos; marque os extremos de classes no eixo horizontal;
no eixo vertical marque a densidade e para cada classe, trace um retngulo com base igual ao
intervalo da classe e altura igual densidade de freqncia.

14
12
10
Freqncia
8
6
4
2
0
1,75 2,25 2,75 3,25 3,75 4,25 4,75 Mais
Peso ao nascer

Figura 7: Peso ao nascer dos nascidos vivos, em quilogramas.

Polgono de freqncias

a representao grfica de uma distribuio de freqncias por meio de um polgono.


um grfico de linha cuja construo feita unindo-se os pontos de coordenadas de
abscissas correspondentes aos pontos mdios de cada classe e as ordenadas, s freqncias
absolutas ou relativas dessas mesmas classes.
O polgono de freqncia um grfico que deve ser fechado no eixo das abscissas. Ento,
para finalizar sua elaborao, deve-se acrescentar distribuio, uma classe esquerda e outra
direita, ambas com freqncias zero. Tal procedimento permite que a rea sob a linha de
freqncias seja igual rea do histograma.
Uma das vantagens da aplicao de polgonos de freqncias que, por serem grficos de
linhas, permitem a comparao entre dois ou mais conjuntos de dados por meio da superposio
dos mesmos.

16
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
Ogiva

o grfico que representa a distribuio da freqncia absoluta acumulada. Sua construo


semelhante ao do polgono de freqncias, com a diferena que consideraremos a freqncia
absoluta acumulada.
um grfico que permite descrever dados quantitativos por meio da freqncia acumulada.
A ogiva um grfico de linha que une os pontos cujas abscissas so os limites superiores das
classes, e, ordenadas suas respectivas freqncias acumuladas. Convm observa-se que o ponto
inicial desse grfico o limite inferior do primeiro intervalo, com freqncia acumulada zero, pois
no existe qualquer valor inferior a ele.
Quando os dados contidos em cada classe so distribudos uniformemente, pode-se estimar,
a partir da ogiva, o nmero de elementos pertencentes a qualquer uma das classes que compe a
distribuio de freqncia dos dados e a quantidade ou porcentagem de elementos que esto abaixo
de certo valor pertencente ao conjunto de dados. Pela Figura 11, nota-se que no existem alunos
com idade inferior a 18 anos enquanto que abaixo de 34 anos existem vinte alunos.

50

47

40

31

18

10

30 40 50 60 70 80 90 classes
100
17
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON

LISTA 01 - AULA 01 E AULA 02

1) Qual a diferena entre Populao e Amostra?


2) Cite algumas vantagens na utilizao de uma amostra em pesquisas estatsticas.
3) Qual a diferena entre varivel qualitativa e quantitativa?
4) Qual a diferena entre varivel discreta e contnua?

5) Considerando a populao das crianas em creches municipais de Cascavel, no ano de 2001,


verificar quais das variveis pesquisadas abaixo so qualitativas e quais so quantitativas.
a) local de nascimento b) peso c) idade d) sexo

e) cor f) nacionalidade do pai g) altura

6) Uma auditoria feita em 20 faturas de venda revelou os seguintes nmeros de erros na fixao
de preos: 0 0 2 1 4 1 0 1 3 2 2 0 1 1 1 4 0 3 1 5. Construa um tabela de
distribuio de freqncias que mostre quantas faturas continham 0, 1, 2, 3, 4 ou 5 erros. Pode
ser feito a mo ou no excel.

7) Do-se, a seguir, os nmeros de doentes que foram atendidos durante 120 dias. Agrupe estes
valores em uma distribuio de freqncia (utilizando porcentagem) com os intervalos: 40
44, 45 49, 50 54, 55 59, 60 64, 65 69, 70 74, 75 79. Pode ser feito a mo ou no
excel.
50 45 46 48 52 56 65 32 56 70 60 56 59 57 42 45 43 44 46 47 58 59 52 53 39 40
60 58 55 50 53 69 58 40 39 38 36 53 58 59 65 56 45 47 41 42 40 45 54 58 56 65
69 68 60 60 50 45 48 42 45 54 70 36 38 52 45 68 47 52 39 58 68 62 52 71 45 63
52 41 45 31 63 58 47 69 69 68 52 30 28 74 46 53 51 42 46 49 47 52 51 53 59 57
56 54 64 67 63 69 61 62 68 52 58 86 63 64 45 47

8) Indique se as situaes abaixo possuem variveis com dados qualitativos nominais ou ordinais:
a) Os mecnicos devem dizer se a troca de velas em um novo modelo de carro muito difcil,
difcil, fcil ou muito fcil.

18
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
b) A religio de pessoas que tentam o suicdio codificada como 1, 2, 3, 4 ou 5 representando
respectivamente Protestante, Catlico, Judeu, outras ou nenhuma.
c) Os consumidores devem dizer se preferem a marca A marca B, se no tm preferncia, ou se
preferem a marca B marca A.

9) Represente a srie abaixo usando o grfico em linha (Anos x Exportao) e (Anos x


Importao). Pode ser feito a mo ou no excel.

Tabela 1: Distribuio da Importao e Exportao no


Comrcio Exterior do Brasil 1984-92.
Anos Quantidade (em toneladas)
Exportao Importao
1984 141.737.000 53.988.000
1985 146.351.000 58.695.000
1986 133.832.000 61.589.000
1987 142.369.000 58.412.000
1988 169.666.000 57.897.000
1989 177.033.000 58.789.200
1990 168.652.000 63.985.000
1991 165.236.000 69.652.325
1992 167.562.000 77.813.000
Total 1.412.439.000 560.820.525
Fonte: Min. Indstria, Comrcio e Turismo.

19
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON

TRABALHO 01

1) A tabela abaixo mostra a quantidade de atendimentos durante um determinado perodo em um


grande hospital. Construa, utilizando as freqncias relativas os seguintes grficos: Colunas,
Barras, Linhas e Setores.
Espcie de Clnica Freqncia Freqncia
relativa (%)
Mdica 6.457.923,00 32,51
Ginecologia e 3.918.308,00 19,73
Obstetrcia
Cirurgia 3.031.075,00 15,26
Pediatria 2.943.939,00 14,82
Outros 3.513.186,00 17,69

2) A tabela seguinte mostra como os empregados de Medianeira, Paran, se deslocam para o


trabalho:
Tabela 2: Porcentagem dos meios de transporte que os
funcionrios de Medianeira utilizam para se deslocarem.
Meio de Transporte Porcentagem
Viaja sozinho 82
Divide carro 13
Viaja de nibus 2
Varia ou trabalha em casa 3
100
Total

a) Construa um grfico de setores para esta distribuio percentual.


b) Construa um grfico em barras para esta distribuio percentual.

3) Os valores abaixo, representam as vendas dirias de um determinado aparelho eltrico, durante


um ms, por uma firma comercial: 14, 12, 11, 13, 14, 13, 12 , 14, 15, 12, 11, 16, 14, 14, 15, 16, 18,
10, 14, 13, 12, 15, 16, 14, 15, 16, 17, 18, 18, 18. Construa uma tabela de distribuio de
freqncias e os seguintes grficos: colunas e barras.

4) Os dados abaixo representam a porcentagem (em relao a receita total mensal) de investimento
feito num determinado ms por 37 pequenas indstrias. Construa uma tabela de distribuio de
freqncias e os seguintes grficos: setores circulares e linhas.
3,9 7,1 10,0 11,8 2,3 4,5 10,5 3,9 15,6 7,1 18,8 3,9 3,9 12,4 5,6 9,0 5,6 9,5 12,4

18,8 4,5 4,5 10,6 5,6 8,5 12,4 17,8 11,6 18,8 4,5 7,1 3,2 2,7 12,4 7,1 9,5 12,4

20
FACULDADE ASSIS GURGACZ - FAG
PROBABILIDADE E ESTATSTICA AULA 02
PROF. KARINA SANDERSON
5) A tabela abaixo apresenta o nmero de pacientes com hipertenso segundo a idade. Atravs do
Excel construa uma tabela de distribuio de freqncia destes dados e faa um histograma.

Tabela 02 Pacientes com hipertenso, segundo a idade.


Idade em anos Nmero de
completos pacientes
22 1
27 1
30 1
31 1
34 1
35 3
36 5
40 1
42 1
43 1
44 2
45 1
46 2
47 1
48 1
50 2
53 3
56 1
58 1
59 2
60 1
61 1
63 1
65 3
67 2
total 40

6) Em uma escola tomou-se a medida da altura de cada um de 40 estudantes, obtendo-se os


seguintes dados (em centmetros). Faa a distribuio de freqncia e faa um histograma.
160 152 155 154 161 162 162 161

163 156 162 161 161 171 160 170

155 151 158 166 169 170 158 160

163 167 157 152 178 165 156 155

160 164 164 155 150 156 168 153

Enviar por email : ksanderson@fag.edu.br


O arquivo deve estar no Excel.

21