You are on page 1of 20

Sumário dos exemplos:

I – Representação gráfica para Variáveis Quantitativas


II – Histograma para variáveis contínuas no soft MINITAB
III – Tabela de freqüências e histograma para v. contínuas, no Excel
IV – Exemplo Estatísticas Descritivas de dados contínuos
V – Estatísticas Descritivas no soft MINITAB
VI – Estatísticas Descritivas no EXCEL
VII – Exemplos de Dados Agrupados
VIII – Representação gráfica para Variáveis Qualitativas
IX – Histogramas pelo número de observações
I - Representação gráfica para Variáveis Quantitativas:

Gráfico de pontos no MINITAB

Gráfico de pontos para horas de TV

0 10 20 30
horas

Estatísticas descritivas no MINITAB


Descriptive Statistics: horasTV

Variable N Mean Median TrMean StDev SE Mean


horasTV 50 10.780 10.000 10.273 6.891 0.974

Variable Minimum Maximum Q1 Q3


horasTV 0.000 30.000 5.000 14.000
II - Histograma para variáveis contínuas no MINITAB

Histograma de horas de TV

20
Freqüência

10

0
0 6 12 18 24 30

horas

Outros limites

Histograma de horas de TV

15
Freqüência

10

0
0.0 5.5 11.0 16.5 22.0 27.5 33.0
horas
III - Tabela de freqüências e histograma para v. contínuas, no Excel.

Bloco Freqüência
0 1
4.3 6
8.6 13
12.9 15
17.1 7
21.4 4
25.7 2
Mais 2

Histograma

16

12
Freqüência

8 Freqüência

0
0 4.3 8.6 12.9 17.1 21.4 25.7 Mais
Bloco
IV - Exemplo Estatísticas Descritivas de dados contínuos:
Variável: Renda PC por grupo (exposto e não exposto)

Grupo
EXP 68 96 100 100 112 112 117 120 120 135
150 160 160 200 260

- Mediana: x~ = x ( 8 ) = 120 reais

- 1o Quartil: Q1 = x(4) = 100 reais

- 3o Quartil: Q3 = x(12) = 160 reais

∑x 2010
- Média: x = = = 134 reais
n 15
2
- Variância: ∑ x = 300942

2 2
2 ∑ x − nx 300942 − 15( 134 )2 300942 − 269340
s = = =
( n − 1) ( 15 − 1) 14

31602
s2 = = 2257,286
14

- desvio-padrão: s = s 2 = 2257,286 = 47,51 reais


Box-plot renda per capita

50 150 250
Grupo Exposto

8
7
6
Freqüência

5
4
3
2
1
0
35 85 135 185 235 285
Grupo Exposto
Grupo
NEXP 36 50 70 84 108 109 120 120 150 150
180 220 250 260 300

- Mediana: x~ = x ( 8 ) = 120 reais

- 1o Quartil: Q1 = x(4) = 184 reais

- 3o Quartil: Q3 = x(12) = 220 reais

∑x 2207
- Média: x = = = 147,13 reais
n 15
2
- Variância: ∑ x = 413997

2 2
2 ∑ x − nx 413997 − 15( 147,13 )2 413997 − 324723,27
s = = =
( n − 1) ( 15 − 1) 14

89273,73
s2 = = 6376,695
14

- desvio-padrão: s = s 2 = 6376,695 = 79,85 reais


Box-plot renda per capita

0 100 200 300


Grupo Não Exposto

5
Freqüência

0
0 66 132 198 264 330

Grupo não Exposto


V - Estatísticas Descritivas no soft MINITAB

Descriptive Statistics: EXP; NEXP

Variable N Mean Median TrMean StDev SE_Mean


EXP 15 134,0 120,0 129,4 47,5 12,3
NEXP 15 147,1 120,0 143,9 79,9 20,6

Variable Minimum Maximum Q1 Q3


EXP 68,0 260,0 100,0 160,0
NEXP 36,0 300,0 84,0 220,0

VI - Estatísticas Descritivas no EXCEL

Exp Nexp
Média 134 147,13
Erro padrão 12,3 20,6
Mediana 120 120
Modo 160 150
Desvio padrão 47,5 79,9
Variância da amostra 2257,286 6376,695
Curtose 2,62 -0,67
Assimetria 1,44 0,54
Intervalo 192 264
Mínimo 68 36
Máximo 260 300
Soma 2010 2207
Contagem 15 15
VII – Exemplos de Dados Agrupados
Exemplo 1: dados coletados em entrevistas com 500 pessoas
(a) – variável número de divórcios por indivíduo
(b) – variável tempo (em anos) até o primeiro divórcio
a) Variável discreta: tabela do número de divórcios por indivíduo.
Divórcios = xi ni fi xi fi Fac ni xi2
1 240 0,480 0,480 0,480 240
2 125 0,250 0,500 0,730 500
3 81 0,162 0,486 0,892 729
4 48 0,096 0,384 0,988 768
5 6 0,012 0,060 1,000 150
Total 500 1,000 1,910 - 2387

Média amostral: x = ∑ xi f i = 1,910 divórcios


Variância amostral:
2 2
2 ∑ xi − nx 2387 − 500 (1,910) 2 562,95
s = = = = 1,128
(n − 1) (500 − 1) 499
s = 1,06 divórcios

Outra representação:
Divórcios = xi ni fi xi fi Fac (xi – x ) ni (xi – x )2
1 240 0,480 0,480 0,480 -0,910 198,744
2 125 0,250 0,500 0,730 0,090 1,013
3 81 0,162 0,486 0,892 1,090 96,236
4 48 0,096 0,384 0,988 2,090 209,669
5 6 0,012 0,060 1,000 3,090 57,2886
Total 500 1,000 1,910 – – 562,950

Média amostral: x = ∑ xi f i = 1,910 divórcios


2
∑ ( x − x ) 562,95
Variância amostral: s2 = i
= = 1,128
(n − 1) 499
b) Variável contínua: tabela do tempo até o primeiro divórcio.

Anos ponto
ni fi xi fi Fac ni xi2
Casados médio = xi
0 |----- 6 3 280 0,56 1,68 0,56 2520
6 |----- 12 9 140 0,28 2,52 0,84 11340
12 |----- 18 15 60 0,12 1,80 0,96 13500
18 |----- 24 21 15 0,03 0,63 0,99 6615
24 |----- 30 27 5 0,01 0,27 1,00 3645
Total 500 1,00 6,90 – 37620

Média amostral: x = ∑ xi f i = 6,90 anos

Variância amostral:
2 2
2 ∑ x i − nx 37620 − 500 (6,90) 2 13815
s = = = = 27,685
(n − 1) (500 − 1) 499

s = 5,26 anos

Anos = xi
ptos. médios
ni fi xi fi Fac (xi – x) ni (xi – x )2
3 280 0,56 1,68 0,56 -3,9 4258,8
9 140 0,28 2,52 0,84 2,1 617,4
15 60 0,12 1,80 0,96 8,1 3936,6
21 15 0,03 0,63 0,99 14,1 2982,15
27 5 0,01 0,27 1,00 20,1 2020,05
Total 500 1,00 6,90 - - 13815

Média amostral: x = ∑ xi f i = 6,90 anos

2
2 ∑ ( xi − x ) 13815
Variância amostral: s = = = 27,685
(n − 1) 499
Exemplo 2: Escores GMAT (Graduate Management Apititude Test)
aplicado num processo seletivo para a escolha de alunos num
programa de graduação.

Pto. Médio
Escores ni fi xi fi ni xi2
xi
300 |-- 350 325 3 0.035 11.5 316875
350 |-- 400 375 7 0.082 30.9 984375
400 |-- 450 425 18 0.212 90.0 3251250
450 |-- 500 475 24 0.282 134.1 5415000
500 |-- 550 525 15 0.176 92.6 4134375
550 |-- 600 575 10 0.118 67.6 3306250
600 |-- 650 625 4 0.047 29.4 1562500
650 |-- 700 675 4 0.047 31.8 1822500
Totais 85 1.000 488 20793125

Histograma:
Escores do teste de aptidão GMAT

0.32

0.24

0.16

0.08

0
250 300 350 400 450 500 550 600 650 700 750
Q1 x~ Q3
VIII - Representação gráfica para Variáveis Qualitativas:

Exemplo1: Pesquisa PNAD 2004 – Moradores por domicílio Brasil.

a) Tabela de uma entrada:

Região domicílios %
SE 23157114 44.8
NE 13090124 25.3
SE 8198266 15.8
CO 3745500 7.2
NE 3561524 6.9
51752528 100.0

b) Tabela de dupla entrada: (dados brutos)


MOR. Brasil N NE SE S CO
1 5 411 443 292 910 1 190 705 2 612 431 890 834 424 563
2 10 062 238 506 597 2 141 312 4 816 793 1 857 904 739 632
3 12 118 894 747 866 2 793 052 5 630 782 2 103 424 843 770
4 12 098 742 791 985 2 936 946 5 532 907 1 888 026 948 878
5 6 449 038 532 447 1 858 876 2 682 387 917 583 457 745
6 2 906 091 308 311 991 114 1 094 518 322 794 189 354
7 1 311 592 161 696 532 787 410 151 131 936 75 022
8 OU + 1 394 490 219 712 645 332 377 145 85 765 66 536
Total 51 752 528 3 561 524 13 090 124 23 157 114 8 198 266 3 745 500

(porcentagens)
MOR. Brasil N NE SE S CO
1 10.5 8.2 9.1 11.3 10.9 11.3
2 19.4 14.2 16.4 20.8 22.7 19.7
3 23.4 21.0 21.3 24.3 25.7 22.5
4 23.4 22.2 22.4 23.9 23.0 25.3
5 12.5 14.9 14.2 11.6 11.2 12.2
6 5.6 8.7 7.6 4.7 3.9 5.1
7 2.5 4.5 4.1 1.8 1.6 2.0
8 OU + 2.7 6.2 4.9 1.6 1.0 1.8
Total 100.0 100.0 100.0 100.0 100.0 100.0
Gráfico de setores (pizza):
Região Domic. (freq) proporção ângulo
SE 23157114 0.447 161
NE 13090124 0.253 91
SE 8198266 0.158 57
CO 3745500 0.072 26
NE 3561524 0.069 25
51752528 1 360

- Para achar o ângulo, deve-se usar a relação: 100% = 360o.


- Portanto, se uma categoria tem proporção de 0.447, então, basta
multiplicar 0.447 por 360o para encontrar o ângulo correspondente
(regra de três).

Logo: 0.447 • 360o = 161o 0.072 • 360o = 26o


0.253 • 360o = 91o 0.069 • 360o = 25o
0.158 • 360o = 57o

Domicílios por região

7%
7%
SE
NE
16% 45%
S
CO
N

25%
Domicílios por região

45%

7% SE
NE
S
CO
7%
N

16% 25%

Gráfico de colunas:
Moradores por domicílio - regiões SE e N

25

20

15
N
SE
10

0
1 2 3 4 5 6 7 8+
Exemplo2: Notas de Português por grupo de estudantes (expostos e
não expostos).
Expostos Não Expostos
Nota P
Freq. % ângulo Freq. % ângulo
I 5 33% 119o 3 20% 74o
S 8 54% 194o 6 40% 144o
PS 5 13% 47o 6 40% 144o
a) Gráfico de colunas:
Notas de Português

0.6

0.5
I
0.3 S
PS

0.2

0.0
Exposto Não Exposto

Notas de Português

0.6

0.5

Exposto
0.3
Não Exposto

0.2

0.0
I S PS
b) Gráfico de setores (pizza):

Notas de Português - Grupo Exposto

I
33%

S
54%

PS
13%

Notas de Português - Grupo Não Exposto

I
PS 20%
40%

S
40%
IX - Histogramas pelo número de observações