Professional Documents
Culture Documents
Estatística
Descritiva
2006/2007
Estatística descritiva
1. Introdução
20 19 21 25 20 24 21 23 20 18
20 18 25 23 20 18 19 18 19 22
Tabela de frequências
ln n
k =1+
ln 2
onde [ ] representa a parte inteira e ln o logaritmo de base e.
Nota: O número de classes não deve ser inferior a 4 nem superior a 14.
4 ≤ k ≤ 14
Depois de se determinar quantas classes se usarão segue-se a construção
das classes2, que consiste na determinação da amplitude de cada classe e dos seus
limites. Para tal deve-se obedecer a algumas regras básicas:
• os pontos médios das classes deverão ser valores de fácil cálculo (ponto
médio da classe ou centro da classe é a semi-soma do limite superior e
inferior da classe)
1
Também no caso de variáveis aleatórias discretas que apresentem uma grande diversidade
de valores é aconselhável a “criação” de classes.
2
Para simplificar a construção das classes poderemos começar pelo centro da classe central,
no caso de k ser impar, ou no extremo superior da (k+1)/2 ésima classe, se k for par.
• os limites das classes devem ser definidos de modo a que cada valor da
variável pertença a uma e uma só classe. Consideraremos classes
fechadas à esquerda e abertas à direita, isto é, o limite inferior do
intervalo pertence à classe mas o limite superior não.
R
ai =
k
151 157 158 156 160 176 150 149 162 153
163 170 172 171 164 173 166 165 160 158
n=20
k = 1 +[ log 20/log2] = 5
ai = 5,4 ≈ 6 .
11,5 6,8 7,5 12,6 9,6 10,1 13,5 7,9 10,3 8,6
14,7 13,1 10,5 10,7 8,8 10,0 10,9 13,2 9,7 11,8
15,2 8,0 9,8 11,1 9,1 9,9 12,1 13,9 10,8 10,2
7,3 14,2 10,6 13,3 12,0 8,2 11,2 10,4 12,8 12,3
Gráfico de barras:
F HISTOGRAMA
R
E
Q 7
A 6
B 5
S
O 4
L 3
U
T 2
A 1
S
0
148 154 160 166 172 178
IDADES
∑x i =1
i
x =
n
k
∑n x
i =1
i i
x=
n
onde: k é o número de valores que a variável pode tomar
ni é a frequência absoluta do valor xi da variável.
∑n c
i =1
i i
x=
n
onde: ci é o centro (ou ponto médio) da classe i.
n +1
• o valor que se encontra na posição (se n é impar)
2
n n
• a semi-soma dos valores nas posições e + 1 ( se n é par).
2 2
Fi +1
Mo = li + ⋅ ai
Fi −1 + Fi +1
Xi ni nai fi fai
[1 , 4[ 2 2 0,167 0,167
[4 , 7[ 3 5 0,250 0,417
[7 , 10[ 5 10 0,417 0,834
[10 , 12[ 2 12 0,167 1,001
R = xmax - xmin
IQ = Q3 - Q1,
3
Vulgarmente chamado caixa-de-bigodes.
4
Quando os dados estão agrupados em classes, R é a diferença entre o limite superior da última classe e o
limite inferior da primeira classe.
Dados agrupados
Dados não agrupados
Discretos Contínuos
n k k
∑ x −x
i =1
i ∑n
i =1
i xi − x ∑ n c −x
i =1
i i
DM = DM = DM =
n n n
∑ ni (x i − x ) ∑ n (x
2 2
i i − x)
discretos
Dados s2 = i =1
s= i =1
agrupados n n
k k
∑ ni (ci − x ) ∑ n (c
2 2
i i − x)
contínuos
s2 = i =1
s= i =1
n n
5
Só é possível usar estas medidas se as variáveis em estudo tomarem valores de um único
sinal (ou todos positivos ou todos negativos).
O coeficiente de dispersão
s
CD =
x
e o coeficiente de variação
s
CV = ⋅ 100 % ,
x
permitem a compreensão, em termos relativos, do grau de concentração em torno
da média .
x
Me x Me Mo Mo Me x
Mo
x − Mo
g1 =
s
g2 =
(Q3 − Q2 ) − (Q2 − Q1 ) = Q3 − 2Q2 + Q1 =
Q3 − 2 M e + Q1
(Q3 − Q2 ) + (Q2 − Q1 ) Q3 − Q1 Q3 − Q1
m3 ∑ n (x
i =1
i i
k
− x)
q3 = onde mk = .
m2 n
por comparação com a distribuição Normal cujo grau de curtose é 0,263. Assim se
K=0,263 a distribuição é mesocúrtica, se K<0,263 a distribuição é leptocúrtica e se
K>0,263 a distribuição é platicúrtica.
9 14 12 8 14 12 16 16 8 14
11 12 14 11 11 18 14 18 15 15
Classes [ 5 ; 15 [ [ 15 ; 25 [ [ 25 ; 35 [ [ 35 ; 45 [ [ 45 ; 55 [ [ 55 ; 65 [
Frequências
4 8 14 20 11 3
absolutas