Professional Documents
Culture Documents
Beraldo
Estatstica
III
Teoria da Amostragem,
Inferncia Estatstica e
Testes de Hiptese
Teoria da Amostragem,
Inferncia Estatstica
e Testes de Hiptese
Antonio Fernando Beraldo
Departamento de Estatstica
ICE - UFJF
Reviso e digitao
Ana Darc da Silva
Elisa Lancini Nogueira
Lucas Silva Novais
Marcelle Souza Pinto
Mirela Rigolon Valinote
Raphael de Freitas Saldanha
Rosiany Grosman
Stfani Ferreira
Vanessa Castro Abreu
Victor Lopes Costa Serra
Apostila Contedo
I Estatstica Descritiva
II Clculo de Probabilidades
III Amostragem, Inferncia e Testes Estatsticos
IVa Metodologia do Trabalho Cientfico
IVb Elaborao e Apresentao de Trabalhos Cientficos
V Anlise Estatstica de Dados
VI Tpicos Especiais de Estatstica Aplicada
http://www.ufjf.br/antonio_beraldo
A. F. Beraldo iii
Agradecimentos
Este um trabalho que reflete a experincia - e aprendizagem - do ensino de Estatstica
e a valiosssima contribuio dos alunos nestes 21 anos de atividades na Universidade
Federal de Juiz de Fora, como tambm a prtica da aplicao da Estatstica em dezenas
de dissertaes e teses de mestrandos e doutorandos de diversas IES do Pas. Sem esta
contribuio, este trabalho no existiria.
A todos os alunos que, com suas crticas e sugestes, me ensinaram o como, o quando
e o qu.
Gabi
(1994 - 2006)
A. F. Beraldo v
Sumrio
Sumrio vi
I Teoria da Amostragem e
Inferncia Estatstica 1
1 Teoria da Amostragem 3
1.1 O Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Distribuio Amostral de Mdias . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 Distribuio Amostral das Propores . . . . . . . . . . . . . . . . . . . . . 19
1.5 Distribuio Amostral das Varincias . . . . . . . . . . . . . . . . . . . . . 20
1.6 Distribuio Amostral das Diferenas e Somas de Mdias e Propores . . 23
1.7 A Desigualdade de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.8 Glossrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.9 Erros Padres de algumas estatsticas . . . . . . . . . . . . . . . . . . . . . 26
1.9.1 Dimensionamento da amostra para a inferncia da mdia populacional 28
1.9.2 Dimensionamento da amostra para estimar a proporo populacional 28
2 Inferncia estatstica 29
2.1 Inferncia da Mdia Populacional . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.1 Grandes amostras (n > 30) . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.2 Pequenas amostras (n < 30) . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Inferncia das Propores Populacionais . . . . . . . . . . . . . . . . . . . 40
2.3 Inferncia da Varincia Populacional . . . . . . . . . . . . . . . . . . . . . 44
2.4 Inferncia da Diferena entre duas Mdias . . . . . . . . . . . . . . . . . . 46
2.5 Inferncia do Desvio Padro e de outras estatsticas. . . . . . . . . . . . . . 46
2.6 Clculo do tamanho timo das amostras . . . . . . . . . . . . . . . . . . . 48
vi A. F. Beraldo
SUMRIO
IIITabelas 105
A. F. Beraldo vii
Parte I
Teoria da Amostragem e
Inferncia Estatstica
A. F. Beraldo 1
1 Teoria da Amostragem
Seja um experimento, ou fenmeno aleatrio, por exemplo, a inteno de voto nos
candidatos a prefeito, declarada em uma pesquisa realizada entre os moradores do Bairro
B. Cada morador, nesta pesquisa de inteno de voto, poder dizer se pretende votar
no candidato X, Y ou Z, ou se votar em branco, ou no votar... Esta declarao
de voto chamada de observao. Assim, dizemos que um experimento ou fenmeno
aleatrio produz uma srie de observaes, que so agrupadas em um conjunto chamado
Universo, ou Populao, identificado pela letra grega mega maiscula ().
O conjunto Universo tambm pode ser definido como o conjunto formado por N
elementos que tem pelo menos um atributo em comum.
Pertencem ao conjunto Universo todas as pessoas que possuem este atributo. Esto
fora do Universo todas as pessoas que no possuem este atributo. Os demais atributos
dos moradores podem ser descritos por conjuntos de valores denominados variveis.
Assim, temos as variveis sexo, idade, estado civil, renda, etc. Assume-se, para efeito de
estudo, que estas variveis so aleatrias (veja Apostila de Estatstica II - Captulo 2, e,
A. F. Beraldo 3
1. Teoria da Amostragem
4 A. F. Beraldo
Figura 1.4: O conjunto Universo e o Parmetro
1
O Censo 2010 compreendeu um levantamento minucioso de todos os domiclios do pas. Nos meses
de coleta de dados e superviso, 191 mil recenseadores visitaram 67,6 milhes de domiclios nos 5.565
municpios brasileiros para colher informaes sobre quem somos, quanto somos, onde estamos e como
vivemos. Os primeiros resultados definitivos, divulgados em novembro de 2010, apontaram uma populao
A. F. Beraldo 5
1. Teoria da Amostragem
1. O conjunto Universo tratado de forma que cada um, e todos os seus elementos,
tenha a mesma probabilidade de ser sorteado. Este processo chamado de
homogeneizao do Universo. Homogeneizar o Universo consiste em fazer com
que cada um de seus elementos tenha probabilidade de ser sorteado igual de
qualquer outro. Em outras palavras, tornar equiprovvel este Universo.
formada por 190.732.694 pessoas. A previso de custo do Censo era de R$ 1,4 bilho. Mais informaes
em http://www.ibge.gov.br/home/estatistica/populacao/censo2010/.
2
As tcnicas de amostragem so discutidas na Apostila IV - Metodologia de Pesquisa Quantitativa
6 A. F. Beraldo
1.1 O Mtodo Estatstico
Com mais rigor, dizemos que um parmetro igual seu estimador mais ou menos
a margem de erro do estimador:
A. F. Beraldo 7
1. Teoria da Amostragem
= X X
ou
h i
X X , X + X
Em que:
P , + = NC (1.2)
8 A. F. Beraldo
1.1 O Mtodo Estatstico
Classes de idades f
0 pa 10 2
10 a 20 6
20 a 30 9
30 a 40 13
40 a 50 24
50 a 60 38
60 a 70 15
70 a 80 12
80 a 90 8
90 a 100 3
n= 130
A. F. Beraldo 9
1. Teoria da Amostragem
E escrevemos
inf sup
Note que utilizamos como margem de erro apenas a estatstica desvio padro.
Neste exemplo, o Nvel de Confiana NC igual a 63, 2%. Assim, dizemos, grosso
modo, que:
Comentrios:
xi
X=
n
(Como foi visto na apostila de Estatstica Descritiva.)
3
Este clculo foi feito utilizando a interpolao de valores, conforme visto na Apostila I - Estatstica
Descritiva.
10 A. F. Beraldo
1.1 O Mtodo Estatstico
Assim, podemos dizer que a mdia amostral , por exemplo, igual a 3,70. No
entanto, nunca poderemos afirmar que a mdia populacional igual a 3,70, mas que
h uma probabilidade de, por exemplo, 95% da mdia populacional estar entre 3,05
e 4,28. O NC, Nvel de Confiana, , neste exemplo, 95%.
Mdia X
Varincia s2 2
Desvio Padro s
Proporo p
A. F. Beraldo 11
1. Teoria da Amostragem
Como vimos, o Mtodo Estatstico utiliza estatsticas para calcular parmetros. Nas
prximas sees, e no Captulo 2, iremos estudar como realizado este processo. Antes,
porm, introduzimos um outro conceito: estimadores.
12 A. F. Beraldo
1.2 Distribuies Amostrais
uma das amostras, podemos montar uma tabela com a distribuio das mdias
amostrais, ou distribuio amostral das mdias.
Comentrios:
Resumindo:
4
A esta altura, voc j deve estar suficientemente familiarizado com o termo inferncia, do verbo
inferir, que significa, em estatstica, conhecer o todo (populao) a partir do estudo de suas partes
(amostras).
A. F. Beraldo 13
1. Teoria da Amostragem
= X (1.3)
14 A. F. Beraldo
1.3 Distribuio Amostral de Mdias
Exemplo 1.1. Seja o conjunto universo formado pelos valores {1, 3, 3, 2, 6}. A mdia
deste conjunto dada por:
1+3+3+2+6 15
= = =3
5 5
1 1 3 1 3 1 2 1 6 1
1 3 3 3 3 3 2 3 6 3
1 3 3 3 3 3 2 3 6 3
1 2 3 2 3 2 2 2 6 2
1 6 3 6 3 6 2 6 6 6
1 2 2 1,5 3,5
2 3 3 2,5 4,5
2 3 3 2,5 4,5
1,5 2,5 2,5 2 4
3,5 4,5 4,5 4 6
Xi f f Xi
1 1 1
1,5 2 3
2 5 10
2,5 4 10
3 4 12
3,5 2 7
4 2 8
4,5 4 18
6 1 6
25 75
A. F. Beraldo 15
1. Teoria da Amostragem
Voc deve estar lembrado, da Estatstica Descritiva, que a letra f significa freqncia
simples, ou seja, quantas vezes determinado valor da mdia ocorreu no conjunto de
amostras. No conjunto acima, o valor 1,5 ocorre 2 vezes, ou seja possui frequncia f = 2.
2
1
0
Mdias
P
f 75
E(X) = X = P X = = 3, 0
f 25
Ento, vemos que a mdia da distribuio amostral das mdias, X , igual mdia
do universo.
16 A. F. Beraldo
1.3 Distribuio Amostral de Mdias
Comentrios:
30
20
10
0
2 4 6 8 10 12 14
Mdias
A. F. Beraldo 17
1. Teoria da Amostragem
Voc pode notar que o histograma toma a forma aproximada de uma curva normal.
Isto sempre acontece, e a distribuio amostral das mdias tem distribuio normal, tanto
mais aderente quanto maior for o tamanho da amostra.
Observando o grfico, voc pode ver a zona central, de maior densidade de frequncia,
em torno da mdia populacional, , sabendo que = 8.
1. Quanto maior for o tamanho das amostras (e mais amostras voc ter), maior a
concentrao das mdias amostrais X i em torno da mdia populacional .
X =
Teorema II
Se a populao da qual se extraem as amostras tem distribuio normal com mdia
e varincia 2 ,ento a distribuio das mdias amostrais tambm normalmente
2
distribuda, com mdia e varincia X = 2 /n. (Veja Distribuio Amostral das
Varincias)
Teorema III
Se a populao da qual se extraem as amostras no tem, necessariamente, uma
distribuio normal, mas possui mdia e varincia 2 , ento a varivel padronizada
Z ligada a X, sendo
X
Z=
n
RZ
5
Em outras palavras, Z assintticamente normal, ou seja: lim P (Z z) = 1
2
eu2/2 du
18 A. F. Beraldo
1.4 Distribuio Amostral das Propores
Quando trabalhamos com propores, melhor que o Universo seja tratado de forma
dicotmica, tal como nas provas de Bernoulli. No exemplo acima, teramos a proporo
p = 0, 4. A proporo complementar, q, dada por q = 1 p = 0, 6 (no exemplo).
= p (1.4)
3
A = = 0, 6
5
A. F. Beraldo 19
1. Teoria da Amostragem
1 1 3 1 3 1 2 1 6 1
1 3 3 3 3 3 2 3 6 3
1 3 3 3 3 3 2 3 6 3
1 2 3 2 3 2 2 2 6 2
1 6 3 6 3 6 2 6 6 6
p(A) f f.p(A)
0 4 0
0,5 12 6
1 9 9
25 15
Mdia 0,6
f pA 15
p= P = = 0, 6
f 25
= Xp (1.5)
P
xi
=
n
20 A. F. Beraldo
1.5 Distribuio Amostral das Varincias
(xi )2
P
2
=
n
ou
O conjunto de varincias s2i tem sua distribuio amostral, mas, devido a caracters-
ticas desta distribuio, mais conveniente utilizar a varivel Y , dada por
(n 1)s2i
Y =
2
A estatstica Y tem uma distribuio qui-quadrada (v. Apostila II), com n 1 graus
de liberdade.
2 2
2
X = E(x ) = (1.6)
n
2 = n X
2
(1.7)
A. F. Beraldo 21
1. Teoria da Amostragem
X f fx d d2 f d2
1 1 1 -2 4 4
1,5 2 3 -1,5 2,25 4,5
2 5 10 -1 1 5
2,5 4 10 -0,5 0,25 1
3 4 12 0 0 0
3,5 2 7 0,5 0,25 0,5
4 2 8 1 1 2
4,5 4 18 1,5 2,25 9
6 1 6 3 9 9
25 75 35
2
Calculando X , temos:
2
h f d2
2
i 35
X = E (x ) = = = 1, 4
f 25
ento, 2 = n X
2
2 = nX
2
= (2)(1, 4) = 2, 8
2 2 (N n)
X = (1.8)
n(N 1)
22 A. F. Beraldo
1.6 Distribuio Amostral das Diferenas e Somas de Mdias e Propores
Esta adaptao bastante conveniente, para o caso de estarmos lidando com N grande,
o que ocorre com mais freqncia.
X 1 X 2 = X 1 X 2 = 1 2 (1.9)
s
12 22
X 1 X 2 = + (1.10)
n1 n2
Para populaes finitas, mas com amostragem com reposio, temos que a varivel
padronizada Z, dada por
(X1 X2 ) (1 2 )
Z= v (1.11)
u 2 22
u
u 1
t +
n1 n2
A. F. Beraldo 23
1. Teoria da Amostragem
p1 p2 = p1 p2 = p1 p2 (1.12)
v
u (1 1 ) 2 (1 2 )
u
p1 p2 = t
+ (1.13)
n1 n2
1
P X kX 1 (1.14)
k2
24 A. F. Beraldo
1.8 Glossrio
1.8 Glossrio
Antes de passarmos ao prximo captulo, necessrio que voc tenha entendido
perfeitamente os termos que utilizamos at agora. Os principais conceitos esto definidos
a seguir, e no prossiga em seus estudos sem que estejam perfeitamente compreendidos:
A. F. Beraldo 25
1. Teoria da Amostragem
inf sup
inf = e
sup = +
= KEp
onde
26 A. F. Beraldo
1.9 Erros Padres de algumas estatsticas
Varincias
s
2
2 (1.19)
n
s
4 4
(1.20)
n
A. F. Beraldo 27
1. Teoria da Amostragem
(zcrit )2 N
n=
d (N 1) + (zcrit )2
2
z 2
crit
n= pb qb
2
zcrit pb qb N
n= 2
2 (N 1) + zcrit pb qb
28 A. F. Beraldo
2 Inferncia estatstica
Inferir, segundo o dicionrio1 , vem do latim inferere, significando Tirar por concluso; deduzir pelo
raciocnio.
A. F. Beraldo 29
2. Inferncia estatstica
E(i ) =
30 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
E(X i ) = , E(pi ) =
E(s2i ) = 2
E(s) 6=
Estimadores tambm podem ser eficientes, ou no. Se temos dois ou mais estimadores para um
parmetro, o estimador eficiente ser aquele com a menor varincia. Por exemplo, a mdia populacional
pode ser estimada tanto pela mdia amostral X quanto pela mediana amostral X No entanto, a
varincia, ou mdia quadrtica utilizando a mdia menor do que aquela utilizando a mediana:
Ao final deste captulo, mostraremos o uso de alguns estimadores tendenciosos (enviesados), que,
mesmo assim, podem ser - com reservas - utilizados pela facilidade em que so calculados, junto com
outros estimadores.
Neste captulo, iremos estudar a Inferncia Estatstica como sendo o clculo e a anlise dos intervalos
de confiana dos parmetros, ou seja, a estimao intervalar dos parmetros. Para a estimao pontual de
parmetros, que utiliza as tcnicas de mxima verossimilhana, consulte a Apostila V - Tpicos Especiais
em Estatstica.
A. F. Beraldo 31
2. Inferncia estatstica
X zcrit X + zcrit (2.1)
n n
NC zcrit
90% 1,645
95% 1,96
99% 2,58
32 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
Na quase totalidade das vezes, o desvio padro populacional desconhecido. No entanto, para
amostras bem maiores, em que se tem normalidade das variveis, podemos substituir por s, e a expresso
de clculo torna-se
s s
X zcrit X + zcrit (2.2)
n n
v v
uN n uN n
u u
X zcrit t X + zcrit t (2.3)
n N 1 n N 1
Da mesma forma, para grandes amostras, podemos substituir por s, e a expresso torna-se a
seguinte:
v v
s uN n s uN n
u u
X zcrit t X + zcrit t (2.4)
n N 1 n N 1
onde zcrit tabelado segundo o nvel de significncia (vide quadro da pgina anterior).
s s
X tcrit X + tcrit (2.5)
n n
onde tcrit tabelado em funo do nvel de significncia e do nmero de graus de liberdade , dado
por = n 1 (vide Tabelas no Anexo I desta Apostila).
A. F. Beraldo 33
2. Inferncia estatstica
v v
s uN n s uN n
u u
X tcrit t X + tcrit t (2.6)
n N 1 n N 1
Exemplo 2.1. Uma amostra de 400 habitantes de uma cidade de porte mdio foi extrada aleatoriamente
e, em relao varivel peso, foram calculadas a mdia X = 67, 5 kg e o desvio padro s = 12, 5 kg.
Estime o valor da mdia populacional, para os nveis de confiana de 90%, 95% e 99%.
Pelos dados acima, a populao pode ser considerada infinita (cidade de porte mdio). No foi
informada a varincia da populao - o que situao mais comum. No entanto, considerando o tamanho
da amostra, e admitindo que a distribuio da varivel peso normalmente distribuda, podemos utilizar
s no lugar de , e adotar a seguinte expresso de clculo:
s s
X zcrit X + zcrit
n n
s 12, 5
zcrit = 1, 645 = 1, 03 kg
n 400
67, 5 1, 03 67, 5 + 1, 03
66, 47 68, 53
s 12, 5
zcrit = 1, 96 = 1, 23 kg
n 400
e a expresso do IC a seguinte:
67, 5 1, 23 67, 5 + 1, 23
66, 27 68, 73
34 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
H uma probabilidade de 95% de que a mdia populacional pertena ao intervalo [66, 27 68, 73].
s 12, 5
zcrit = 2, 58 = 1, 61 kg
n 400
O IC o seguinte
67, 5 1, 61 67, 5 + 1, 61
65, 89 69, 11
H uma probabilidade de 99% de que a mdia populacional pertena ao intervalo [65, 89 69, 11].
A. F. Beraldo 35
2. Inferncia estatstica
Exemplo 2.2. Seja a mesma situao do Exemplo 1.1, com uma amostra de n = 400, mdia X = 67, 5
kg e s = 12, 5 kg. No entanto, imagine que esta amostra seja extrada de um Universo finito, com
N = 2.000. Assim, a expresso de clculo da margem de erro, para um NC de 95%, seria:
r
s N n
X =zc
n N 1
r
12, 5 2000 400
X =1, 96
400 2000 1
X =(1, 96) (0, 625) (0, 895) = 1, 096
36 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
A. F. Beraldo 37
2. Inferncia estatstica
Exemplo 2.3. Seja a mesma situao do Exemplo 1.1, porm com uma amostra menor, n = 20 elementos.
Neste caso, utilizamos a distribuio de Student t
X = 67, 5 s = 12, 5 n = 20
Populao infinita
tcalc = 2, 093
12, 5
X = 2, 093 = 5, 85 kg
20
67, 5 5, 85 67, 5 + 5, 85
61, 650 73, 350
38 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
Comentrios:
1. Voc j deve ter reparado que costumamos falar em grandes e pequenas amostras, distribuio
normal e aproximadamente normal, grandes valores de n (tamanho da amostra), etc. Muito ainda
se dir e se ver sobre isto, mas, por enquanto, vamos estabelecer o seguinte:
Em termos tericos, conforme se encontra nos livros sobre o assunto, as amostras dividem-se
em grandes amostras e pequenas amostras. Isto depende do tamanho n da amostra. Se
n < 30, a amostra pequena; se n > 30, a amostra grande. Isto implica, basicamente,
numa diferena de tratamento estatstico e matemtico, uma vez que pequenas amostras
seguem a distribuio binomial (por exemplo), e grandes amostras seguem a distribuio
normal. Existe uma distribuio terica, da qual estudaremos daqui a pouco, chamada t de
Student, e que se aplica a qualquer tipo de amostra.
Ainda em termos tericos, assume-se que pequenas amostras implicam em grandes margens de
erro. Note que o desvio padro das medidas (que uma espcie de medida da margem de
erro), vem sempre no numerador das frmulas, dividido pela raiz quadrada do tamanho da
amostra. Isto quer dizer que a margem de erro das medidas inversamente proporcional
raiz quadrada do tamanho da amostra, ou seja, quanto menor a amostra, maior a
margem de erro, e vice-versa.
Em termos prticos, o mtodo de pesquisa no bem assim. Depende muito do objeto em
estudo. Universos que possuem grande regularidade, so bem homogneos, no necessitam
de grandes amostras, uma vez que o desvio padro (que uma medida de disperso, lembra-
se?) ser, correspondentemente, tambm pequeno. De outra forma, Universos altamente
irregulares produzem grandes margens de erro, mesmo se extramos amostras de quinhentos,
ou mil, ou mais elementos...
2. Existe uma lei em matemtica, a chamada Lei dos Grandes Nmeros, que diz mais ou menos
o seguinte: Quanto mais observaes tivermos sobre um fenmeno quantificvel, mais nos
aproximaremos dos parmetros verdadeiros que medem estes fenmenos. Isto quer dizer que, por
exemplo, quanto mais lanamentos de uma moeda fizermos, mais os resultados iro se aproximar
dos previstos 50% de caras e 50% de coroas. Quanto mais nascimentos de crianas acontecerem,
mais nos aproximaremos da proporo metade meninos, metade meninas. Uma das maneiras de
enunciarmos a Lei dos Grandes Nmeros a seguinte:
Se Y /n a proporo amostral de uma categoria Y em uma amostra de tamanho n, e a proporo
dessa mesma categoria, no Universo, e um nmero pequeno, porm maior que zero, temos que
Y
lim P r = 0
n n
lim P r X = 0
n
A. F. Beraldo 39
2. Inferncia estatstica
Dizendo de outra maneira, a diferena entre a mdia populacional e a mdia amostral pode se tornar
to pequena quanto quisermos (se pudermos aumentar o tamanho da amostra ilimitadamente, a
mdia populacional tende a se tornar igual mdia amostral).
3. Voc deve ter notado que, extraindo a amostra de uma populao, o fazemos sem reposio, ou seja,
no consideramos que um elemento amostrado possa ser amostrado mais de uma vez. Neste caso,
para
p manter um rigor terico, teramos que utilizar um desvio padro corrigido pela expresso
N n/N 1. Mas ocorre o seguinte: se a populao muito grande (infinita), a expresso
tende a se igualar a 1. O mesmo pode-se dizer no caso em que a populao finita, mas N >> n.
Por exemplo, se temos uma populao de 10.000 alunos em uma universidade, e extramos uma
amostra de tamanho n = 300, a expresso calculada como
r r r
N n 10.000 300 9.700 p
= = = 0, 9700 = 0, 985
N 1 10.000 1 9.999
Este valor muito prximo a 1,00. Da, que no faz sentido adotar a correo para universos finitos,
nestes casos. Em outras situaes, principalmente no caso de pequenas amostras e Universos
menores, estes fatores de correo devem ser utilizados.
Caso a populao seja infinita e a amostra tenha um tamanho n 30, tal que np 5, podemos
utilizar a distribuio normal de probabilidades, e estimar pela expresso:
v v
u p(1 p) u p(1 p)
u u
p zcrit t
p + zcrit t (2.7)
n n
v v v v
u p(1 p) u
tN n
u p(1 p) u N n
u u u u
pzcrit t
p+zcrit t t
(2.8)
n N 1 n N 1
40 A. F. Beraldo
2.2 Inferncia das Propores Populacionais
Exemplo 2.4. Seja uma populao de uma cidade, com cerca de 50 mil habitantes. Queremos saber a
proporo de pessoas com ensino superior completo. Extramos uma amostra aleatria de 400 elementos,
e verificamos que a proporo de pessoas com ensino superior completo na amostra 15% (p = 0, 15).
Qual ser o valor de ?
A. F. Beraldo 41
2. Inferncia estatstica
p p p + p
onde:
r
P (1 p)
p =zc
n
r
(0, 15) (0, 85)
p =1, 96
400
p =0, 035
0, 15 0, 035 0, 15 + 0, 035
0, 115 0, 185
42 A. F. Beraldo
2.2 Inferncia das Propores Populacionais
Exemplo 2.5. Seja a mesma situao do exemplo anterior, porm com a amostra extrada de uma
populao finita, com N = 1.000.
A expresso de clculo da margem de erro dever se multiplicada pelo fator de correo de populaes
finitas, dado por:
r
1000 400
= 0, 775
1000 1
E o valor de :
0, 123 0, 177
A. F. Beraldo 43
2. Inferncia estatstica
(n 1)s2 2 (n 1)s2
(2.9)
2sup 2inf
onde:
n: tamanho da amostra
s2 : varincia amostral
2 : varincia populacional
Exemplo 2.6. Desejamos estimar a varincia populacional dos salrios dos empregados do comrcio
na cidade. Extramos uma amostra aleatria de 25 salrios, na qual foi calculada uma varincia de R$
12.000,00 (doze mil reais ao quadrado). Qual a varincia populacional?
s2 = 12.000, 00
n = 25
N C = 95%
(graus de liberdade) = n 1 = 25 1 = 24
44 A. F. Beraldo
2.3 Inferncia da Varincia Populacional
85, 54 2 152, 39
A. F. Beraldo 45
2. Inferncia estatstica
s s
s21 s2 s21 s2
(X 1 X 2 ) zcrit + 2 (1 2 ) (X 1 X 2 ) + zcrit + 2 (2.10)
n1 n2 n1 n2
s
(n1 1)s21 + (n2 1)s22
1 1
1 2 = (X 1 X 2 ) tcrit + (2.11)
n1 + n2 2 n1 n2
A seguir, voc encontra as margens de erro para as estatsticas mais utilizadas (sempre que se admitir
que as distribuies amostrais das estatsticas for normal, o tamanho das amostras grande, a populao
finita e a amostragem feita com reposio, se a populao for finita):
46 A. F. Beraldo
2.5 Inferncia do Desvio Padro e de outras estatsticas.
Mdias
s
zc
n
Propores r
p(1 p)
zc
n
Desvios Padres
s
zcalc
2n
Mediana
1, 2533 s
zcalc
n
A. F. Beraldo 47
2. Inferncia estatstica
n Tamanho da amostra
Desvio padro da populao
zcrit z-crtico, retirado da curva normal. Os valores so os seguintes:
zcrit = 1,645 para um nvel de confiana NC = 90%
zcrit = 1,96 para um nvel de confiana NC = 95% (mais comum)
zcrit = 2,58 para um nvel de confiana NC = 99%
d Erro amostral, margem de erro da mdia amostral. Diferena mxima entre o
parmetro e a estatstica X
N Tamanho da populao.
pb Proporo do evento (sucesso) na amostra, estimada ou calculada. Caso no
se tenha informao a priori, utilizar pb = 0, 5
qb Proporo do evento (no-sucesso) na amostra, estimada ou calculada. Caso
no se tenha informao a priori, utilizar qb = 0, 5
Margem de erro da proporo amostral
48 A. F. Beraldo
Parte II
A. F. Beraldo 49
3 Introduo
A Teoria da Deciso Estatstica uma das aplicaes prticas da Estatstica mais utilizadas, em
campos to diversos quanto Marketing (avaliao da eficcia de uma campanha publicitria) quanto
Medicina (eficincia de cura de uma doena a partir da aplicao de dosagens diferentes de um
medicamento), passando pela Educao Fsica e pelas Cincias Sociais. Sempre que houver necessidade de
avaliao, conjugada com comparao, este recurso, a Teoria da Deciso Estatstica, estar presente.
Uma Hiptese estatstica uma afirmativa que se faz sobre um parmetro, a partir de estatsticas
de amostras coletadas.
Por exemplo, pode-se fazer a hiptese de que a renda familiar mdia de um bairro da cidade seja
igual a R$ 560,00. Escreve-se:
H0 : = R$ 560, 00
H0 (a letra H, maiscula, com a letra o subscrita1 ) o smbolo da hiptese nula, que a hiptese
bsica sobre a renda familiar mdia do bairro2 . Alm da hiptese nula H0 , podemos formular hipteses
alternativas, como, por exemplo:
1
Por analogia com a palavra nulo, muitos chamam de h-zero, o que incorreto. A letra o vem
do ingls original, como adotado por Fisher (1935).
2
Hiptese nula no quer dizer que a hiptese no tem valor.
A. F. Beraldo 51
3. Introduo
Por exemplo: suponha que extramos uma amostra de 400 domiclios deste bairro, e calculamos sua
mdia X = R$ 550, 00 e desvio padro s = R$ 180, 00.
s s
X zcrit X + zcrit (3.1)
n n
180, 00 180, 00
550, 00 1, 96 550, 00 + 1, 96
400 400
180, 00
1, 96 = R$ 17, 60
400
52 A. F. Beraldo
3.1 O que so Testes de Hipteses
R$ 560
95%
Na figura 3.1, acima, voc pode notar que o valor de R$ 560,00 cai dentro da faixa R$ 532,40 a R$
567,60, que o intervalo de confiana para a mdia populacional. Como foi visto no Captulo 2, h uma
probabilidade de 95% de que a mdia populacional esteja contida neste intervalo e uma probabilidade
de 5% de que esteja fora deste intervalo.
Antes de continuarmos com este captulo, necessrio elucidar este conceito: diferena estatstica
significativa. Em Matemtica, as igualdades so exatas, isto , podemos sempre dizer que 5 = 5, e
nunca que 5 = 6. Em Estatstica, como j foi visto na parte de inferncia estatstica, a mdia de uma
populao pode ser qualquer nmero pertencente ao intervalo de confiana deste parmetro. Da que, por
A. F. Beraldo 53
3. Introduo
exemplo, se o intervalo de confiana da mdia de um conjunto de medidas for de 20, 5 2, 3, os valores 20,
21 e 22 pertencem ao intervalo de confiana qualquer um deles poderia ser a mdia real do conjunto.
25
Pertencendo ao mesmo intervalo de confiana, eles so estatisticamente iguais, ou, melhor, dizendo,
no existe diferena estatstica significativa entre eles. Por outro lado, neste mesmo conjunto, o
valor 25 estatisticamente diferente, ou, melhor dizendo, existe uma diferena estatstica significativa
entre o valor 25 e o intervalo de confiana da mdia o valor 25 no pertence ao intervalo de confiana.
54 A. F. Beraldo
3.1 O que so Testes de Hipteses
No existe diferena estatstica significativa entre dois valores de uma varivel se estes pertencem ao
mesmo intervalo de confiana.
Se uma varivel aleatria pode evoluir ao longo do tempo; podemos estar interessados se houve
diferena significativa entre os estados inicial e final da varivel (ou seja, medidas desta varivel
tomadas no instante inicial e no instante final do perodo de medio):
Exemplo 3.1. Uma droga, a repaglinida, foi testada no tratamento da diabetes. O nvel glicmico
ps-prandial de um indivduo saudvel de cerca de 120 dg/ml. Supondo que 48 voluntrios com esta
doena foram submetidos ao tratamento de diabetes utilizando a dosagem de 1 mg, dirio, durante um
ms. Antes do tratamento, o nvel glicmico do grupo era de 163 28 dg/ml. Aps o tratamento, a
mdia baixou para 144 dg/ml. O tratamento foi eficaz?
Em outros casos, podemos estar interessados nas medidas desta varivel, tomadas no mesmo instante
porm em locais diferentes:
Exemplo 3.2. A prefeitura est pesquisando as condies de moradia em dois bairros da cidade, bairro
A e bairro B. No bairro A, 74% dos domiclios tem saneamento bsico, com gua e esgoto. No bairro B,
so 85% dos domiclios. Existe diferena estatstica nesta condio, para os domiclios dos dois bairros?
Em situaes mais complexas, podemos estar interessados nas medidas da varivel, tomadas em locais
e tempos diferentes:
Exemplo 3.3. Uma indstria metalrgica tem duas plantas, em cidades distintas, A e B. Determinado
processo de fabricao foi desenvolvido em dois mtodos diferentes, M1 e M2 , e aplicado nas plantas A
e B. A unidade de medida tempo (em minutos) e os resultados foram:
M1 M2
Planta A 12, 3 4, 7 12, 8 5, 4
Planta B 14, 2 2, 5 9, 2 3, 4
Supondo que os dois mtodos foram eficazes, qual combinao Planta-Mtodo a mais eficiente?
Ainda em outro caso, podemos verificar se os valores de uma varivel so iguais para amostras de
categorias diferentes:
Exemplo 3.4. O gerente de uma pizzaria deseja saber se h preferncia pelo sabor de pizza, de acordo
com o sexo e a faixa etria dos clientes de seu estabelecimento. Fez um levantamento dos pedidos dos
ltimos seis meses e verificou que:
A. F. Beraldo 55
3. Introduo
Homens Mulheres
Pizza
Jovem Adulto Jovem Adulto
Presunto / Queijo 28 22 12 23
Quatro queijos 34 30 24 10
Portuguesa 22 17 29 31
Ser que existe esta vinculao entre o sabor da pizza e o atributo sexo/faixa etria dos clientes?
Em qualquer dos casos, existe uma srie de rotinas estatsticas adequadas para estabelecer:
Exemplo 3.5. Foi feita uma pesquisa de inteno de voto para o candidato A, no ms de maio. Naquele
ms, a amostra foi de 400 eleitores e, para um nvel de confiana de 95%, inferiu-se que a inteno de
voto no candidato A era de 38%. A margem de erro da pesquisa foi, portanto,
r r
p(1 p) (0, 38)(0, 62)
zc = 1, 96 = (1, 96)(0, 024) = 0, 048 ou 4, 8%
n 400
Da que a inteno de voto do candidato A deve estar, com uma probabilidade de 95%, entre 33,2% e
42,8%. Continuando este exemplo, imagine agora que, na mesma pesquisa, um outro candidato, B, obteve
34% das intenes de voto. Existe diferena entre estes dois candidatos? A resposta que no existe
diferena, estatisticamente falando, uma vez que a votao do candidato B est dentro do intervalo de
confiana da inteno de voto do candidato A. A diferena matemtica entre as intenes de A, 38%, e
do candidato B, 34%, no estatisticamente significativa, sendo esta variao devida ao acaso3 . Veja a
ilustrao a seguir:
Comentrios:
1. Voc deve estar pensando em termos de certeza: no existe diferena entre os candidatos, e
pronto. No bem assim. Lembre-se que adotamos o nvel de confiana de 95%, e isto quer
3
Este um outro conceito frequentemente adotado para o intervalo de confiana: uma regio
(um intervalo) em que as diferenas das medidas em relao mdia populacional (ou qualquer outro
parmetro) so aleatrias, isto , devidas unicamente ao acaso.
56 A. F. Beraldo
3.2 Teoria da Deciso Estatstica
B
29,2% 34,0% 38,8%
Empate Tcnico
dizer que estamos 95% confiantes da inexistncia de diferena entre os candidatos. E que existe
uma probabilidade de 5% de que nossas concluses estejam erradas. Isto ser discutido em breve,
nesta parte da Apostila.
2. A situao descrita acima (dois candidatos sem diferena estatstica na inteno de voto) dita de
empate tcnico. No se pode afirmar, neste momento, qual candidato est na frente da corrida
eleitoral.
A. F. Beraldo 57
3. Introduo
1. Formula-se a Hiptese Nula H0 , que sempre uma afirmativa de igualdade. Se as medidas dos
conjuntos 1 e 2 so 1 e 2 (veja a figura a seguir), formulamos a hiptese nula H0 : 1 = 2 .
H1 : 1 > 2
H2 : 1 < 2
3. Estabelecemos o Nvel de Confiana (NC) e o Nvel de Significncia () com que ser realizado
o teste de hipteses.
Aluno i1 i2 i3 i4
1 11 12 13 14
2 21 22 23 24
3 31 32 33 34
... ... ... ...
58 A. F. Beraldo
3.2 Teoria da Deciso Estatstica
A. F. Beraldo 59
3. Introduo
No exemplo em que H0 : = R$ 560, 00, tomaramos a deciso de rejeitar a hipteses nula se o valor
da mdia populacional fosse maior do que R$ 567,6 ou menor que R$ 532,40.
Ento, caso isto ocorresse, rejeitaramos a hiptese nula de igualdade e teramos, forosamente, que
adotar a hiptese alternativa, H1 : 6= R$ 560, 00. Em outras palavras, pelos dados que dispomos, a
mdia populacional cai fora do intervalo de confiana.
Ento, a Teoria da Deciso Estatstica consiste no estabelecimento das hipteses nulas e alternativas,
e no teste destas hipteses, em determinado nvel de confiana, com as seguintes consideraes:
Se uma hiptese for rejeitada quando deveria ter sido aceita, cometemos um erro chamado
Erro Tipo I.
Se, ao contrrio, no rejeitarmos uma hiptese que deveria ter sido rejeitada, cometemos
um Erro Tipo II.
60 A. F. Beraldo
3.3 Erros Tipo I e Tipo II
Zona de Aceitao
95%
Zona de Zona de
Rejeio Rejeio
Esquematicamente, temos:
H0 Deciso Erro
H0 verdadeira H0 rejeitada Tipo I
H0 falsa H0 aceita Tipo II
O tratamento dos erros Tipo II bem mais complexo. Formulamos vrias hipteses alternativas
para aquilo que supomos que seja o valor real da medida. A cada uma destas hipteses calculamos
uma probabilidade, e, dado um conjunto de valores supostos, e suas probabilidades, traamos uma
Curva Caracterstica de Operao (CCO). Este procedimento, no entanto, escapa do contedo que foi
determinado para esta Apostila. Caso voc queira saber mais sobre Erros Tipo I e II, consulte a Apostila
V Tpicos Especiais em Estatstica.
A. F. Beraldo 61
3. Introduo
3.4 O p-value
Nos ltimos anos, disseminou-se na literatura cientfica, principalmente nas reas da Psicologia e
das Cincias da Sade, e nos pacotes estatsticos como o SPSS e o SAS, a utilizao de uma estatstica
chamada p, ou p-value. O p-value uma probabilidade, ou uma rea sob a curva da distribuio de
probabilidades que est sendo usada no teste de hipteses. Por exemplo, seja a hiptese H0 : = 108
, que estamos testando, com uma amostra de n = 144 elementos, com mdia X = 113 e desvio padro
s = 22. Adotamos o nvel de significncia de 0,05, e a distribuio t de Student para o teste. Calculamos
o intervalo de confiana pela expresso
s s
X tcrit X + tcrit
n n
22 22
113 1, 98 113 + 1, 98
144 144
Uma outra maneira de testar essa hiptese seria a de calcular uma estatstica
X
tcalc =
s
n
e comparar o valor do tcalc com o valor do tcrit (tabelado). O novo critrio de deciso ser:
X 113 108
tcalc = = = 2, 73
s 22
n 144
Na tabela 3.3, para o NC de 95%, o p-value para = 144 1 graus de liberdade, 0,007. Assim,
rejeitamos H0 pois o p-value menor do que (igual a 5%). Veja a figura 3.6 a seguir:
62 A. F. Beraldo
3.4 O p-value
max
/2 /2
p-value
IC
A. F. Beraldo 63
4 Testes de Hipteses Paramtricos
4.1 Testes da Mdia
4.1.1 Mdia Amostral Mdia Populacional
Objetivo
Verificar se uma mdia X calculada sobre uma amostra de tamanho n pertence a uma populao de
mdia :
H0 : X =
Condies
Estatstica de Teste
X
tcalc = (4.1)
s
n
Onde:
Ateno: A Tabela 2 est em funo de graus de liberdade (). Para este processo, = n 1.
Critrio
A. F. Beraldo 65
4. Testes de Hipteses Paramtricos
Exemplo 4.1. A mdia de locaes de DVDs em uma loja de 6,7 locaes/ms. Sorteamos uma
amostra de 15 clientes, e os valores obtidos foram: 7, 4 2, 1 locaes. Pode-se considerar esta amostra
como tpica? (NC = 95%)
H0 : X = ou H0 : 7, 4 = 6, 7
= 6, 7, X = 7, 4, s = 2, 1 locaes.
X
Calculamos tcalc =
s/ n
7, 4 6, 7 0, 7
tcalc = = = 1, 29
2, 1 2, 1
15 3, 87
95%
2,5% 2,5%
-2,145 0 +2,145
tcalc = 1,29
66 A. F. Beraldo
4.1 Testes da Mdia
Verificar se existe diferena entre as mdias populacionais 1 e 2 a partir das mdias amostrais X 1
e X 2.
H0 : 1 = 2
ou
H0 : 1 = 2
Condies
Estatstica de Teste
X1 X2
zcalc = q (4.2)
12 /n1 + 22 /n2
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de zcrit dado pelo
nvel de confiana adotado.
A. F. Beraldo 67
4. Testes de Hipteses Paramtricos
Exemplo 4.2. Duas amostras aleatrias de meninos e meninas de 14 anos foram processadas em relao
varivel peso, cujas medidas foram: Meninos (H): 64, 3 4, 7 kg (60); Meninas (M): 56, 8 3, 4 kg (40).
Testar a hiptese de que no h diferena entre os pesos das meninas (M) e dos meninos (H).
XH XM 64, 3 56, 8
zcalc = s =s
H0 : X H = X M . H M 4, 72 3, 42
X H = 64, 3 kg, H = 4, 7 kg, nH = 60 + +
nH nM 60 40
X M = 56, 8 kg, M = 3, 4 kg, nM = 40
ztab (NC = 95%) = 1,96
7, 5 7, 5
= = = 9, 25
0, 368 + 0, 289 0, 811
Como zcalc > ztab , rejeitamos a hiptese nula de igualdade, e conclumos que o peso dos meninos so
superiores aos das meninas (em mdia), com a probabilidade de 5% de cometermos um Erro Tipo I. Ver
figura 4.2.
95%
+9,25
-1,96 0 +1,96
68 A. F. Beraldo
4.1 Testes da Mdia
Verificar se existe diferena entre as mdias populacionais 1 e 2 a partir das mdias amostrais X 1
e X 2.
H0 : 1 = 2
Condies
Estatstica de Teste
X1 X2
tcalc = s (4.3)
s2com n11 + 1
n2
onde
A. F. Beraldo 69
4. Testes de Hipteses Paramtricos
Critrio
O teste bilateral; e aceita-se H0 quando ttab tcalc +ttab , onde o valor de ttab dado pelo
nvel de confiana adotado e o nmero de graus de liberdade , calculado por = n1 + n2 2. Ver a
Tabela 2.
Exemplo 4.3. Dois grupos de meninas e meninos foram pesados, e os resultados foram os seguintes:
Testar a hiptese de que no h diferena entre os pesos das meninas (M) e dos meninos (H).
H0 : X M = X H
XH XM
tcalc = v !
u
u
ts2 1 1
com +
nH nM
1 1 2
Isto pode ser verificado a partir da expresso 1 = 2 zc ou 1 2 = zc e = zc
70 A. F. Beraldo
4.1 Testes da Mdia
62, 7 59, 2 3, 5 3, 5
tcalc = q
1 1
= 4, 292 = 2, 072 = 1, 689
30, 9 12 + 18
Portanto, como tcalc < ttab , no rejeitamos a hiptese de igualdade e conclumos no existir diferena
estatstica significativa entre as mdias dos pesos das meninas e dos meninos. Ver figura 4.3, a seguir:
95%
-2,048 0 +2,048
1,689
A. F. Beraldo 71
4. Testes de Hipteses Paramtricos
H0 : incio = final
Por exemplo, seja um grupo de pessoas que fazem uma dieta para emagrecer. Antes de comear a
dieta, cada elemento da amostra tem medido seu IMC (IMC, ndice de massa corporal, a razo entre
o peso, em quilos, e o quadrado de sua estatura, em metros). Esta a situao inicial que pode, por
exemplo, ter calculada sua mdia e desvio padro dos IMCs (X e s1 ). Todo o grupo passa por um
perodo de, por exemplo, trs meses de dieta. Ao final destes meses, novamente medido o IMC de seus
elementos, que, espera-se, tenha diminudo (caso a dieta seja eficaz): mdia X 2 e desvio padro s2 . No
entanto, a H0 formulada que no houve diferena estatstica entre as mdias nos dois instantes:
H0 : X 1 = X 2
H1 : X 1 < X 2
No exemplo 4.4, a seguir, descrito o processo deste teste. Neste caso, h apenas uma amostra, que
acompanhada ao longo do tempo, mas convencionou-se que so amostras pareadas, ou emparelhadas
(em ingls, paired samples). E, como so os mesmos elementos, diz-se que as amostras no so
independentes.
72 A. F. Beraldo
4.1 Testes da Mdia
Exemplo 4.4. Um grupo de 12 alunos do ensino mdio, com problemas de aprendizagem em Matemtica,
teve aulas de reforo nesta disciplina, ao longo de um ms. As notas individuais, antes e depois das aulas
de reforo esto na tabela seguinte:
Na primeira coluna, o nmero do aluno; na segunda e na terceira colunas, a pontuao antes (inicial)
e depois (final) das aulas de reforo. Na coluna seguinte as diferenas entre a pontuao final e a inicial.
A quinta e ltima coluna contm os quadrados das diferenas. Na linha inferior da tabela, os somatrios
dos valores das quatro colunas.
Notar que h diferenas positivas (alunos que melhoraram suas notas), diferenas negativas (alunos
que pioraram) e uma diferena nula (um aluno que ficou com a mesma nota).
A hiptese nula que no houve melhora estatstica nas notas dos alunos:
H0 : X antes = X depois
A. F. Beraldo 73
4. Testes de Hipteses Paramtricos
Supondo que as notas dos alunos so normalmente distribudas, o processo do teste o seguinte
(adotamos o NC de 95%):
notas/antes 64, 1
X antes = = = 5, 34
12 12
notas/depois 76, 8
X depois = = = 6, 40
12 12
2. Calculamos a mdia das diferenas
d 12, 7
d= = = 1, 058
12 12
3. Calculamos o desvio padro das diferenas
s
2 r
d2 nd 42, 59 12(1, 058)2
sd = =
n1 12 1
r
29, 16
= = 1, 628
11
4. Calculamos tcalc
d 1, 058 1, 058
tcalc = sd = =
1, 628 0, 47
n 12
=2, 251
74 A. F. Beraldo
4.1 Testes da Mdia
95%
2,5% 2,5%
-2,201 2,201 t
tcalc = 2,155
A. F. Beraldo 75
4. Testes de Hipteses Paramtricos
1. Sejam k amostras distintas, com tamanhos n1 , n2 , n3 , ..., nk . As amostras devem ser aleatrias
e independentes, extradas de populaes normais3 , e devem ter varincias iguais (homocedastici-
dade). Formula-se a hiptese:
H0 : X 1 = X 2 = X 3 = ... = X k
2. Calculamos a mdia das mdias amostrais (X ), e o desvio padro destas mdias (sX ). Sabemos
que sX = s/ n, ento s = sX n, e s2 = ns2X . A varincia s2 um estimador da varincia da
populao de onde foram extradas as amostras. A s2 chamada QME quadrado mdio entre
grupos.
3. Em seguida, calculamos, para cada amostra, sua varincia. Obtemos as varincias s21 , s22 , s23 , ...,
s2k . Depois, calculamos a varincia QMD, que a mdia ponderada das varincias amostrais.
A razo QME/QMD uma razo entre duas varincias. Varincias seguem a distribuio do
qui-quadrado, e Fisher estudou esta razo, descrita por uma distribuio de probabilidades que
tomou o nome de F, em sua homenagem.
QM E
Ento, sendo F = QM D , e F tabelado em funo dos graus de liberdade do numerador (k 1) e
dos graus de liberdade do denominador (ni 1), para determinado nvel de confiana, podemos
delimitar as zonas de aceitao e de rejeio da H0 .
Nota: Nesta apostila, estudamos apenas a ANOVA One-Way, Anlise da Varincia com um fator.
Aplicaes mais extensas e aprofundadas sero vistas na Apostila Estatstica V.
76 A. F. Beraldo
4.1 Testes da Mdia
M1 M2 M3
8,0 9,0 8,5
7,5 7,5 6,0
8,0 8,5 6,0
7,0 9,5 6,5
8,5 9,5 7,0
39,0 44,0 34,0
X 7,8 8,8 6,8
primeira vista, o mtodo M3 parece ser o que produz os melhores resultados (montagem dos blocos
num tempo menor). Formulamos a H0 : X 1 = X 2 = X 3 , e adotamos o NC de 95%. Passemos aos
clculos:
X i 7, 8 + 8, 8 + 6, 8
X= = = 7, 8 minutos
3 3
s r
(X i X)2 (7, 8 7, 8)2 + (8, 8 7, 8)2 + (6, 8 7, 8)2
sX = =
k1 31
r
02 + 1 + 1
sX = =1
2
QME = ns2X = 5 12 = 5, 0
A. F. Beraldo 77
4. Testes de Hipteses Paramtricos
M1 d d2 M2 d d2 M3 d d2
8,0 0,2 0,04 9,0 0,2 0,04 8,5 1,7 2,89
7,5 -0,3 0,09 7,5 -1,3 1,69 6,0 -0,8 0,64
8,0 0,2 0,04 8,5 -0,3 0,09 6,0 -0,8 0,64
7,0 -0,8 0,64 9,5 0,7 0,49 6,5 -0,3 0,09
8,5 0,7 0,49 9,5 0,7 0,49 7,0 0,2 0,04
X = 7, 8 1,30 X = 8, 8 2,80 X = 6, 8 4,3
s21 = 0, 325 s22 = 0, 70 s23 = 1, 075
QM E 5, 0
Fcalc = = = 7, 14
QM D 0, 7
Consultando a Tabela 5, temos que
Como Fcalc > Fcrit , rejeita-se a hiptese nula de igualdade, concluindo que as diferenas entre as
mdias so estatisticamente significantes.
78 A. F. Beraldo
4.2 Proporo
4.2 Proporo
4.2.1 Proporo Amostral Proporo Populacional
Objetivo
Verificar se a proporo amostral p de um evento E, dada por f E/n estatisticamente igual a uma
proporo populacional
H0 : p =
Condies
Estatstica de Teste
p
zcalc = v (4.5)
u (1 )
u
t
n
onde:
p - Proporo amostral;
- Proporo populacional;
n - Tamanho da amostra.
Critrio
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de ztab dado pelo
nvel de confiana adotado.
A. F. Beraldo 79
4. Testes de Hipteses Paramtricos
Exemplo 4.6. Em determinado bairro da cidade, sabe-se que a populao de pessoas com ensino
fundamental completo era de 36%, h 10 anos atrs. Extraiu-se uma amostra de 250 pessoas, em que se
verificou que havia 44% com este atributo. Testar a hiptese de que no houve variao neste percentual.
H0 : p = , NC = 95%
p 0, 44 0, 36 0, 08
zcalc = s =s = = 2, 6
0, 03
(1 ) 0, 36(1 0, 36)
n 250
Como zcalc > ztab , rejeitamos a hiptese nula de igualdade e conclumos que houve um aumento no
percentual de pessoas com nvel fundamental completo no bairro, com a probabilidade de 5% de que
possamos ter incorrido no Erro Tipo I. Veja a figura 4.5, a seguir:
95%
+2,6
-1,96 0 +1,96
80 A. F. Beraldo
4.2 Proporo
Condies
Da mesma forma que o teste de diferena entre mdias, h que se calcular um desvio padro comum
s duas populaes (ou, melhor dizendo, s duas amostras). A diferena entre p1 e p2 , equilibrada por
este desvio padro comum, dever ser menor ou igual ao o z-crtico correspondente ao nvel de confiana
adotado, para que a hiptese nula de igualdade entre as propores no seja rejeitada. A expresso a
seguinte:
p1 p2 p1 p2
zcalc = v =s zc
u comum
1 1
u
u
up(1 p)
+
t n1 n2
s
1 1
scomum = p(1 p) +
n1 n2
onde a proporo comum estimada p (uma espcie de mdia ponderada entre as propores) dada
por
p1 n1 + p2 n2
p =
n1 + n2
A. F. Beraldo 81
4. Testes de Hipteses Paramtricos
Estatstica de Teste
p 1 p2 p1 p 2
zcalc = v = (4.6)
scomum
u
u
1 1
p)
u
up(1 +
n1 n2
t
onde
n1 p1 + n2 p2
p = (4.7)
n1 + n2
onde
n1 - tamanho da amostra 1
p1 - proporo na amostra 1
n2 - tamanho da amostra 2
p2 - proporo na amostra 2
p - proporo mdia
Critrio
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de zcrit dado pelo
nvel de confiana adotado.
82 A. F. Beraldo
4.2 Proporo
Exemplo 4.7. O prefeito da cidade fez uma pesquisa para saber como anda o conceito de sua
administrao, em dois bairros distintos. No bairro A, foram entrevistadas 120 pessoas, das quais 32%
atriburam ao prefeito o conceito de muito bom. J no bairro B, foram entrevistadas 85 pessoas, com
38% atribuindo o conceito de muito bom. Testar a hiptese de que no existe diferena entre as duas
propores (entre os dois percentuais de muito bom), ao nvel de confiana de 95%.
Estimativa de p:
p1 n1 + p2 n2
p =
n1 + n2
0, 32(120) + 0, 38(85)
=
120 + 85
= 0, 345
s
1 1
scomum = p(1 p) +
n1 n2
s
1 1
= (0, 345)(0, 655) +
120 85
= 0, 067
p1 p2
zcalc =
scomum
0, 32 0, 38
=
0, 067
= 0, 89
Foi obtido o valor de zcalc = 0, 89, que est dentro do intervalo de confiana 1, 96 e +1, 96.
Portanto, a hiptese nula de igualdade entre as propores no pode ser rejeitada, ao nvel de confiana
de 95%. Veja a ilustrao abaixo:
Por esta ilustrao, pode-se ver que o valor de z = 0, 89 pertence ao intervalo de confiana da
diferena entre propores.
A. F. Beraldo 83
4. Testes de Hipteses Paramtricos
95%
-0,89
-1,96 0 +1,96
84 A. F. Beraldo
4.3 Varincia
4.3 Varincia
4.3.1 Varincia Amostral Varincia Populacional
Objetivo
Condies
Estatstica de Teste
(n 1)s2
2calc = (4.8)
2
onde:
s2 - Varincia amostral;
n - Tamanho da amostra
2 - Varincia populacional;
Critrio
O teste bilateral; e aceita-se H0 quando 2inf 2calc 2sup , onde 2inf e 2sup so valores
tabelados da estatstica qui-quadrado, para um nvel de significncia e o nmero de graus de liberdade
, dado por = n 1. Caso contrrio, rejeita-se H0 e aceita H1 : s2 6= 2 , ao nvel de significncia .
Veja o exemplo a seguir.
A. F. Beraldo 85
4. Testes de Hipteses Paramtricos
Exemplo 4.8. Em uma pesquisa de clima organizacional, para determinada pergunta do questionrio
encontrou-se a varincia de 4,6 pontos2 , no geral da instituio, e 6,7 pontos2 , para o setor de compras
com 28 funcionrios. Ao nvel de confiana de 95%, testar a hiptese que no h diferena entre as duas
varincias.
2 = 4, 6 pontos2
s2 = 6, 7 pontos2
n = 28
Na Tabela 3, temos:
= n 1 = 28 1 = 27
x2inf = 14, 6
x2sup = 43, 2
Ento, x2inf < x2calc < x2sup e no rejeitamos a H0 de igualdade entre as varincias amostral e
populacional.
86 A. F. Beraldo
4.3 Varincia
Verificar se existe diferena estatstica entre as varincias populacionais 12 e 22 , a partir das varincias
amostrais s21 e s22 .
H0 : s21 = s22
Condies
Estatstica de Teste
s22
Fcalc = 2 (4.9)
s1
Critrio
O teste bilateral; e aceita-se H0 quando Fcalc < Ftab , onde o valor de Ftab dado pelo nvel de
confiana adotado.
A. F. Beraldo 87
4. Testes de Hipteses Paramtricos
Exemplo 4.9. Sejam duas amostras A e B, respectivamente, de machos e fmeas de lagartos Eunyalius
Terrificus. As varincias dos comprimentos do corpo e os tamanhos das amostras so, respectivamente,
s2M = 46 cm2 , nM = 20, s2F = 38 cm2 , nF = 15. Teste a H0 de que as varincias so iguais:
A estatstica de clculo :
s22 46
Fcalc = = = 1, 21
s21 38
1 = n1 1 = 20 1 = 19
2 = n2 1 = 15 1 = 14
Na Tabela 5, temos:
Assim, uma vez que Fcalc < Ftab , no rejeitamos a hiptese nula de igualdade entre as duas varincias.
88 A. F. Beraldo
4.4 Testes Unilaterais
Zona de Aceitao
NC
Zona de Rejeio
Zcrit
Entretanto, muitas vezes mais interessante direcionar o teste para verificar se, em caso de rejeitarmos
H0 , esta rejeio se d na zona de rejeio acima ou abaixo da zona de aceitao. Veja a figura seguinte:
Zona de Aceitao
NC
Zona de Rejeio
/2
-Zcrit
Este o teste unicaudal, em que, rejeitada a H0 de igualdade, verifica-se uma das hipteses
alternativas:
A. F. Beraldo 89
4. Testes de Hipteses Paramtricos
H1 : 1 > 2
H2 : 1 < 2
Exemplo 4.10. Dois grupos de alunos de Estatstica, curso diurno (D) e noturno (N), fizeram uma
prova, e as notas foram as seguintes:
D: 7, 8 2, 3 (45)
N: 6, 4 1, 2 (38)
O coordenador do curso pensa que a turma N pior, em termos de nota, do que a turma D.
H0 : X D = X N
H1 : X D > X N
e adotamos o NC de 95%.
XD XN 7, 8 6, 4
zcalc = s =s
s2D s2N 2, 32 1, 22
+ +
nD nN 45 38
1, 4 1, 4
= = = 3, 55
0, 118 + 0, 0379 0, 394
Neste ponto, h a diferena entre os testes bicaudal e unicaudal: ao fixar-se o NC de 95%, e, por
consequncia, um NS de 5%, o ztab +1, 645 ( e no 1, 96). Veja a figura a seguir:
90 A. F. Beraldo
4.4 Testes Unilaterais
95%
5%
Zcrit = 1,645
Zcalc = 3,55
Assim, no s rejeita-se a H0 de igualdade como no se rejeita a H1 de que X D > X N , uma vez que
zcalc > ztab .
O teste unicaudal s deve ser utilizado quando h constatao (ou informaes anteriores) de que as
diferenas entre amostras seriam estatisticamente significativas. O teste unicaudal menos rigoroso,
como se pode ver na tabela seguinte:
Podemos, tambm, realizar um teste unilateral, em que a zona de rejeio situa-se esquerda (abaixo)
da zona de aceitao. Veja o exemplo seguinte:
A. F. Beraldo 91
4. Testes de Hipteses Paramtricos
Exemplo 4.11. Uma grande siderrgica tinha problemas com horas paradas (perdidas) devido a
acidentes de trabalho. Uma amostra (1) de 50 funcionrios, extrados aleatoriamente, mostrou uma mdia
de 1200 horas, com um desvio padro de 240 horas, no ms de julho. Aps dois meses de treinamento,
e a implantao de normas de segurana mais rgidas, sorteou-se outra amostra (2), desta vez com 40
funcionrios, que teve a mdia de 1000 horas, e desvio padro de 190 horas. Pode-se dizer que a mdia
de horas perdidas realmente ficou menor? (NC = 95%)
Calculamos o zcalc :
X2 X1 1000 1200
zcalc = s =s
s21 s22 2402 1902
+ +
n1 n2 50 40
200 200
= = = 4, 41
1152 + 902, 5 45, 3
Como zcalc menor do que ztab (4, 41 < 1, 645), rejeitamos a hiptese nula de igualdade e
conclumos que as medidas tomadas foram eficazes em reduzir a mdia de horas paradas. Observe a
figura a seguir:
95%
5%
-1,645 0
-4,4
92 A. F. Beraldo
5 Testes de Hipteses No Paramtricos
Introduo
Os testes no paramtricos so utilizados na impossibilidade de se calcular alguns parmetros das
populaes, ou quando estes parmetros no so caractersticos das populaes a que se referem. Nos
testes no paramtricos, so analisadas outras estatsticas amostrais, tais como as frequncias ou a
colocao em postos. Nos tpicos a seguir, estudaremos alguns destes testes.
2 X (f e f o)2
= (5.1)
fe
Seja este experimento o lanamento de uma moeda, com 100 repeties. Teoricamente, esperamos
que ocorram 50 caras e 50 coroas. As frequncias esperadas se dispem como na tabela abaixo:
Categoria fe
Caras 50
Coroas 50
Total 100
A coluna f e das frequncias esperadas. Isto no quer dizer que o resultado do experimento seja
exatamente este, 50 a 50. Na realidade, pode acontecer qualquer nmero de caras ou de coroas, mas
esperamos, se a moeda for honesta, que os resultados reais se aproximem do previsto. Seria algo como
este:
Categoria fe fo
Caras 50 54
Coroas 50 46
Total 100 100
A. F. Beraldo 93
5. Testes de Hipteses No Paramtricos
A coluna f o a das frequncias observadas. Na tabela anterior, os resultados obtidos divergem muito
pouco do esperado, o que no nos leva a duvidar da moeda.
Categoria fe fo
Caras 50 23
Coroas 50 77
Total 100 100
claro que, com estes resultados, a moeda no pode ser honesta. As frequncias obtidas diferem
muito do que era esperado. O problema, ento, pode ser formulado da seguinte maneira: at que ponto
podemos considerar que as diferenas, obtidas entre o previsto e o ocorrido em um experimento, ainda
podem ser devidas ao acaso?
O teste do qui-quadrado fornece este nmero, este limite a partir do qual no se pode mais dizer que
as discrepncias entre o previsto e o observado foram devidas ao acaso, e sim que existe uma diferena
estatisticamente significativa entre os dados.
=k1 (5.2)
Exemplo 5.1. Foi extrada uma amostra aleatria de 200 alunos de uma universidade, onde foi
pesquisado o atributo sexo dos alunos. Estavam previstos 100 alunos do sexo masculino e 100 alunos do
sexo feminino (pelo clculo das probabilidades). Formulou-se esta hiptese:
94 A. F. Beraldo
5.2 Teste do Qui-Quadrado de Associao
Vamos testar esta hiptese ao nvel de confiana de 95%. Os resultados da pesquisa foram os seguintes:
Sexo fe fo
Masculino 100 72
Feminino 100 128
Total 200 200
Sexo fe fo d d2
Masculino 100 72 28 784
Feminino 100 128 -28 784
Total 200 200
Obtemos as parcelas do qui-quadrado dividindo o quadrado das diferenas pela frequncia esperada:
Sexo fe fo d d2 d2 /f e
Masculino 100 72 28 784 7,84
Feminino 100 128 -28 784 7,84
Total 200 200 15,68
O qui-quadrado tabelado, 2tab , para 1 grau de liberdade e nvel de confiana de 95% 3,84. Temos,
portanto que 2calc = 15, 68 > 2tab = 3, 84, o que nos faz rejeitar a hiptese nula e dizer que as diferenas
encontradas so significativas - o nmero de alunos do sexo masculino inferior ao de alunos do sexo
feminino.
A. F. Beraldo 95
5. Testes de Hipteses No Paramtricos
Foram entrevistados 160 homens e 150 mulheres. A categoria preferida, em geral, foi a de fitas
de Aventuras Policiais, com 100 citaes; em segundo lugar ficou a categoria Romance, preferida das
mulheres. Em terceiro, ficaram as Comdias, preferidas igualmente por homens e mulheres.
Note que a preferncia masculina difere da feminina em alguns casos; existem empates e inverses.
A pergunta que se faz : as diferenas entre homens e mulheres, na preferncia de tipos de filmes,
so estatisticamente significativas? Em outras palavras, o fato de um cliente ser de determinado sexo
direciona sua preferncia, ou as categorias de filmes so escolhidas independentemente do atributo
sexo? Ou, ainda, se uma categoria de filme escolhida, pode-se prever qual o sexo de quem escolheu?
Voltando tabela acima, aprenda alguns novos conceitos, necessrios para prosseguirmos neste
estudo:
A tabela contm clulas preenchidas com as frequncias observadas. A soma das frequncias de cada
uma das linhas chamada frequncia marginal da linha. A soma das frequncias de cada coluna
chamada de frequncia marginal da coluna. A soma das frequncias marginais de linha (ou das
somas marginais de coluna) chamada de frequncia total, ou tamanho da amostra. Veja abaixo:
As clulas mais escuras, com os valores em negrito, so as frequncias marginais. O valor 310 o
tamanho da amostra, ou frequncia total.
A tabela acima a das frequncias observadas (f o). Para aplicar o teste do qui-quadrado,
necessitamos das frequncias esperadas (f e). As frequncias esperadas so calculadas da seguinte maneira:
96 A. F. Beraldo
5.2 Teste do Qui-Quadrado de Associao
150 41
fe = = 20
310
Categorias de filme Homens Mulheres Totais
Romance 42 81
Aventuras Policiais 100
Terror 20 41
Comdias 60
Ertico 28
Totais 160 150 310
Procedendo de maneira anloga para as demais clulas, obtemos os valores restantes das frequncias
esperadas:
A. F. Beraldo 97
5. Testes de Hipteses No Paramtricos
Atributo Categoria fo fe
Romance 32 42
Aventuras Policiais 64 52
Homens Terror 18 21
Comdias 30 31
Ertico 16 14
Romance 49 39
Aventuras Policiais 36 48
Mulheres Terror 23 20
Comdias 30 29
Ertico 12 14
Atributo Categoria fo fe d d2 d2 /f e
Romance 32 42 10 100 2,381
Aventuras Policiais 64 52 -12 144 2,769
Homens Terror 18 21 3 9 0,429
Comdias 30 31 1 1 0,032
Ertico 16 14 -2 4 0,286
Romance 49 39 -10 100 2,564
Aventuras Policias 36 48 12 144 3,000
Mulheres Terror 23 20 -3 9 0,450
Comdias 30 29 -1 1 0,034
Ertico 12 14 2 1 0,286
2calc =
P
0 12,231
Para obter o valor do qui-quadrado tabelado, precisamos saber o nmero de graus de liberdade ().
Para este tipo de teste, o nmero de graus de liberdade dado por
98 A. F. Beraldo
5.3 Teste dos sinais
Ento, j que 2calc > 2tab , rejeitamos a hiptese de independncia, e admitimos, com 95%
de confiana, que as preferncias por tipo de filmes tm relao com o atributo sexo dos
clientes da locadora.
Comentrios:
A varivel de estudo poder ser intervalar ou ordinal. O nome teste dos sinais se deve ao fato de se
utilizar em sinais mais e menos em lugar dos dados numricos. Assim, se houve alterao para maior,
usa-se (+), se para menor, (). No havendo alterao, atribui-se (0). Para o teste desconsideram-se os
casos de empate, ou seja, os pares em que foram atribudos zeros.
A lgica do teste que as condies podem ser consideradas iguais quando as quantidades de (+)
e () forem aproximadamente iguais. Isto , a proporo de sinais (+) equivale a 50%, ou seja: p = 0, 5.
Procedimento:
y np
zcalc = (5.4)
npq
Onde:
y = nmero de sinais (+)
n = tamanho da amostra descontados os empates
p = 0, 5
q = 1 p = 0, 5
5. Concluses:
Se
ztab zcalc ztab
A. F. Beraldo 99
5. Testes de Hipteses No Paramtricos
, no se pode rejeitar H0 .
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo-se, com risco , que h diferena entre
os dois grupos, ou duas condies.
Exemplo 5.2. Seja um grupo de 40 pessoas que esto tendo aulas de direo com a finalidade de serem
aprovados no exame para habilitao de motorista. O curso realizou 2 avaliaes, ao final dos meses de
abril e njunho. Os resultados foram os seguintes:
Alunos que... f
Melhoraram a pontuao 28
Tiveram a mesma pontuao 4
Pioraram a pontuao 8
P
40
Testamos, ao nvel de confiana de 95%, se houve melhoria no aprendizado dos alunos. Os passos so
os seguintes:
H0 : p = 0, 5
2. Calculamos zcalc , pela expresso:
y np
zcalc =
npq
3. Onde:
y = nmero de sinais (+), ou seja, nmero de pessoas que melhoraram a nota, y = 28.
n = 36 nmero de pessoas, no considerando os empates, ou seja, a mesma pontuao, n = 404 =
36.
p = q = 0, 5 pela hiptese de igualdade
28 36 0, 5 28 18
zcalc = = = 3, 3
36 0, 5 0, 5 9
4. ztab = 1, 96 (teste bilateral)
ztab = 1, 645 (teste unilateral)
Como zcalc > ztab , em qualquer caso, rejeitamos a hiptese nula de igualdade, e conclumos
que as pessoas realmente melhoraram o aprendizado.
Procedimento:
100 A. F. Beraldo
5.5 Teste de Mann-Whitney
a) Determinar, para cada par de observaes, a diferena (di) entre as duas medidas;
b) Atribuir postos (colocar em ordem crescente) a todos os dis, desconsiderando-se os sinais. No caso
de empate, atribuir a mdia dos postos empatados;
Eis o teste:
T T
zcalc = (5.5)
T
Onde:
T = menor das somas de postos dos desvios de mesmo sinal;
n(n + 1)
T =
4
r
n(n + 1)(2n + 1)
T =
24
4. Concluso:
Se ztab zcalc ztab , a H0 no rejeitada;
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo-se, que h diferena entre os dois grupos.
Procedimento:
a) Considerar n1 = nmero de casos do grupo com menor quantidade de observaes e n2 = nmero de
casos do maior grupo.
A. F. Beraldo 101
5. Testes de Hipteses No Paramtricos
b) Considere todos os dados dos dois grupos e coloque-os em ordem crescente. Atribua primeiro ao
escore que algebricamente for menor e prossiga at N = n1 + n2 . s informaes empatadas,
atribuir a mdia dos postos correspondentes.
c) Calcular:
R1 = soma dos postos do grupo n1
R2 = soma dos postos do grupo n2
d) Escolher a menor soma entre R1 e R2 .
e) Calcular as estatsticas:
n1 (n1 + 1) n2 (n2 + 1)
1 = n1 n2 + R1 2 = n1 n2 + R2 (5.6)
2 2
Teste:
(u)
zcalc = (5.7)
(u)
Onde: r
n1 n2 n1 n2 (n1 + n2 + 1)
(u) = (u) =
2 12
5. Concluso:
Se ztab zcalc ztab , no se pode rejeitar H0 .
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo, com risco , que h diferena entre os
grupos.
Procedimento
102 A. F. Beraldo
5.6 Teste Kruskal-Wallis
1. H0 : As mdias so iguais.
H1 : H pelo menos um par diferente.
2. Fixar . Escolher uma varivel qui-quadrado com = K 1.
3. Com auxlio da tabela qui-quadrado, determinan-se RA e RC.
4. Calcula-se a estatstica:
K
X (Ri )2
12
H= 3(n + 1) (5.8)
n(n + 1) i=1 ni
5. Concluso:
Se H < 2sup , no se pode rejeitar H0 .
Se H > 2sup , rejeita-se H0 concluindo-se com risco que h diferena entre as mdias dos
K grupos.
A. F. Beraldo 103
Parte III
Tabelas
A. F. Beraldo 105
Tabela 1 - reas sob a Curva Normal Padronizada,
entre 0 e z
z 1 2
e 2 z
Z
P (0 < x < z) =
0 2
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
A. F. Beraldo 107
Tabela 2 -Valores dos percentis da Distribuio t de
Student
108 A. F. Beraldo
Tabela 3 -Distribuio do Qui-Quadrado para Testes
de Hiptese (Teste de Unilaterais)
1h p i2
2x = z + 2 1
2
A. F. Beraldo 109
Tabela 4 - Valores do Qui-Quadrado para os NCs
mais comuns
110 A. F. Beraldo
GD\GN 1 2 3 4 5 6 7 8 9 10 15 20 25 30 35
1 161,448 18,513 10,128 7,709 6,608 5,987 5,591 5,318 5,117 4,965 4,543 4,351 4,242 4,171 4,121
A. F. Beraldo
2 199,500 19,000 9,552 6,944 5,786 5,143 4,737 4,459 4,256 4,103 3,682 3,493 3,385 3,316 3,267
3 215,707 19,164 9,277 6,591 5,409 4,757 4,347 4,066 3,863 3,708 3,287 3,098 2,991 2,922 2,874
4 224,583 19,247 9,117 6,388 5,192 4,534 4,120 3,838 3,633 3,478 3,056 2,866 2,759 2,690 2,641
5 230,162 19,296 9,013 6,256 5,050 4,387 3,972 3,687 3,482 3,326 2,901 2,711 2,603 2,534 2,485
6 233,986 19,330 8,941 6,163 4,950 4,284 3,866 3,581 3,374 3,217 2,790 2,599 2,490 2,421 2,372
7 236,768 19,353 8,887 6,094 4,876 4,207 3,787 3,500 3,293 3,135 2,707 2,514 2,405 2,334 2,285
8 238,883 19,371 8,845 6,041 4,818 4,147 3,726 3,438 3,230 3,072 2,641 2,447 2,337 2,266 2,217
9 240,543 19,385 8,812 5,999 4,772 4,099 3,677 3,388 3,179 3,020 2,588 2,393 2,282 2,211 2,161
10 241,882 19,396 8,786 5,964 4,735 4,060 3,637 3,347 3,137 2,978 2,544 2,348 2,236 2,165 2,114
11 242,983 19,405 8,763 5,936 4,704 4,027 3,603 3,313 3,102 2,943 2,507 2,310 2,198 2,126 2,075
5% na cauda superior
12 243,906 19,413 8,745 5,912 4,678 4,000 3,575 3,284 3,073 2,913 2,475 2,278 2,165 2,092 2,041
13 244,690 19,419 8,729 5,891 4,655 3,976 3,550 3,259 3,048 2,887 2,448 2,250 2,136 2,063 2,012
14 245,364 19,424 8,715 5,873 4,636 3,956 3,529 3,237 3,025 2,865 2,424 2,225 2,111 2,037 1,986
15 245,950 19,429 8,703 5,858 4,619 3,938 3,511 3,218 3,006 2,845 2,403 2,203 2,089 2,015 1,963
16 246,464 19,433 8,692 5,844 4,604 3,922 3,494 3,202 2,989 2,828 2,385 2,184 2,069 1,995 1,942
17 246,918 19,437 8,683 5,832 4,590 3,908 3,480 3,187 2,974 2,812 2,368 2,167 2,051 1,976 1,924
18 247,323 19,440 8,675 5,821 4,579 3,896 3,467 3,173 2,960 2,798 2,353 2,151 2,035 1,960 1,907
19 247,686 19,443 8,667 5,811 4,568 3,884 3,455 3,161 2,948 2,785 2,340 2,137 2,021 1,945 1,892
20 248,013 19,446 8,660 5,803 4,558 3,874 3,445 3,150 2,936 2,774 2,328 2,124 2,007 1,932 1,878
30 250,095 19,462 8,617 5,746 4,496 3,808 3,376 3,079 2,864 2,700 2,247 2,039 1,919 1,841 1,786
40 251,143 19,471 8,594 5,717 4,464 3,774 3,340 3,043 2,826 2,661 2,204 1,994 1,872 1,792 1,735
50 251,774 19,476 8,581 5,699 4,444 3,754 3,319 3,020 2,803 2,637 2,178 1,966 1,842 1,761 1,703
60 252,196 19,479 8,572 5,688 4,431 3,740 3,304 3,005 2,787 2,621 2,160 1,946 1,822 1,740 1,681
70 252,497 19,481 8,566 5,679 4,422 3,730 3,294 2,994 2,776 2,610 2,147 1,932 1,807 1,724 1,665
100 253,041 19,486 8,554 5,664 4,405 3,712 3,275 2,975 2,756 2,588 2,123 1,907 1,779 1,695 1,635
150 253,465 19,489 8,545 5,652 4,392 3,698 3,260 2,959 2,739 2,572 2,105 1,886 1,757 1,672 1,610
GD - Graus do denominador, na coluna
GN - Graus do numerador, na linha
Tabela 5: Distribuiao F de Snedecor para rea de
111
5.6 Teste Kruskal-Wallis
Diagramao em LATEX, composta em Latin Modern.
Verso 3 2014
Gerado em 11 de fevereiro de 2014.