Apostila de Amostragem, Inferencia e Testes

Antonio F.
Beraldo
Estatstica
III
Teoria da Amostragem,
Inferncia Estatstica e
Testes de Hiptese
Teoria da Amostragem,
Inferncia Estatstica
e Testes de Hiptese
Antonio Fernando Beraldo
Departamento de Estatstica
ICE - UFJF
Reviso e digitao
Ana Darc da Silva
Elisa Lancini Nogueira
Lucas Silva Novais
Marcelle Souza Pinto
Mirela Rigolon Valinote
Raphael de Freitas Saldanha
Rosiany Grosman
Stfani Ferreira
Vanessa Castro Abreu
Victor Lopes Costa Serra
Verso provisria 3 2014

Apresentao
Esta Apostila o segundo volume de um conjunto de textos preparados para os alunos
dos cursos de Graduao e Ps-Graduao que possuem disciplinas de Estatstica em sua
grade curricular. Os textos abordam os seguintes temas:
Apostila Contedo
I Estatstica Descritiva
II Clculo de Probabilidades
III Amostragem, Inferncia e Testes Estatsticos
IVa Metodologia do Trabalho Cientfico
IVb Elaborao e Apresentao de Trabalhos Cientficos
V Anlise Estatstica de Dados
VI Tpicos Especiais de Estatstica Aplicada
Em cada captulo das Apostilas procuramos sintetizar os contedos, em textos breves

de exposio dos conceitos, seguidos de exemplos de aplicaes das frmulas.
Outros materiais didticos, referenciados no corpo das Apostilas, esto disponveis

no site do Professor:
http://www.ufjf.br/antonio_beraldo
A. F. Beraldo iii
Agradecimentos
Este um trabalho que reflete a experincia - e aprendizagem - do ensino de Estatstica
e a valiosssima contribuio dos alunos nestes 21 anos de atividades na Universidade
Federal de Juiz de Fora, como tambm a prtica da aplicao da Estatstica em dezenas
de dissertaes e teses de mestrandos e doutorandos de diversas IES do Pas. Sem esta
contribuio, este trabalho no existiria.
Em destaque, agradeo ao estmulo do Prof. Lourival Batista de Olivrira Jr., da

Faculdade de Economia, amigo e companheiro de todos os momentos.
A todos os alunos que, com suas crticas e sugestes, me ensinaram o como, o quando
e o qu.
Este trabalho dedicado, in memoriam, a
Gabi
(1994 - 2006)
Et, des pieds jusques la tte,

Un air subtil, un dangereux parfum
Nagent autour de son corps brun.
Charles Baudelaire, Les Fleurs du Mal.
A. F. Beraldo v
Sumrio
Sumrio vi
I Teoria da Amostragem e
Inferncia Estatstica 1
1 Teoria da Amostragem 3
1.1 O Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Distribuies Amostrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Distribuio Amostral de Mdias . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 Distribuio Amostral das Propores . . . . . . . . . . . . . . . . . . . . . 19
1.5 Distribuio Amostral das Varincias . . . . . . . . . . . . . . . . . . . . . 20
1.6 Distribuio Amostral das Diferenas e Somas de Mdias e Propores . . 23
1.7 A Desigualdade de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.8 Glossrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.9 Erros Padres de algumas estatsticas . . . . . . . . . . . . . . . . . . . . . 26
1.9.1 Dimensionamento da amostra para a inferncia da mdia populacional 28
1.9.2 Dimensionamento da amostra para estimar a proporo populacional 28
2 Inferncia estatstica 29
2.1 Inferncia da Mdia Populacional . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.1 Grandes amostras (n > 30) . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.2 Pequenas amostras (n < 30) . . . . . . . . . . . . . . . . . . . . . . 33
2.2 Inferncia das Propores Populacionais . . . . . . . . . . . . . . . . . . . 40
2.3 Inferncia da Varincia Populacional . . . . . . . . . . . . . . . . . . . . . 44
2.4 Inferncia da Diferena entre duas Mdias . . . . . . . . . . . . . . . . . . 46
2.5 Inferncia do Desvio Padro e de outras estatsticas. . . . . . . . . . . . . . 46
2.6 Clculo do tamanho timo das amostras . . . . . . . . . . . . . . . . . . . 48
II Teoria da Deciso Estatstica 49

3 Introduo 51
3.1 O que so Testes de Hipteses . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.2 Teoria da Deciso Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . 56
vi A. F. Beraldo
SUMRIO
3.3 Erros Tipo I e Tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.4 O p-value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4 Testes de Hipteses Paramtricos 65

4.1 Testes da Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.1.1 Mdia Amostral Mdia Populacional . . . . . . . . . . . . . . . . 65
4.1.2 Duas mdias, amostras independentes . . . . . . . . . . . . . . . . . 67
4.1.3 Amostras emparelhadas . . . . . . . . . . . . . . . . . . . . . . . . 72
4.1.4 Anlise da Varincia ANOVA . . . . . . . . . . . . . . . . . . . 76
4.2 Proporo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.2.1 Proporo Amostral Proporo Populacional . . . . . . . . . . . 79
4.2.2 Duas propores amostrais . . . . . . . . . . . . . . . . . . . . . . . 81
4.3 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.3.1 Varincia Amostral Varincia Populacional . . . . . . . . . . . . 85
4.3.2 Duas varincias amostrais . . . . . . . . . . . . . . . . . . . . . . . 87
4.4 Testes Unilaterais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5 Testes de Hipteses No Paramtricos 93

5.1 Teste do Qui-Quadrado de Aderncia . . . . . . . . . . . . . . . . . . . . . 93
5.2 Teste do Qui-Quadrado de Associao . . . . . . . . . . . . . . . . . . . . 95
5.3 Teste dos sinais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.4 Teste de Wilcoxon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.5 Teste de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.6 Teste Kruskal-Wallis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
IIITabelas 105
A. F. Beraldo vii
Parte I
Teoria da Amostragem e
Inferncia Estatstica
A. F. Beraldo 1
1 Teoria da Amostragem
Seja um experimento, ou fenmeno aleatrio, por exemplo, a inteno de voto nos
candidatos a prefeito, declarada em uma pesquisa realizada entre os moradores do Bairro
B. Cada morador, nesta pesquisa de inteno de voto, poder dizer se pretende votar
no candidato X, Y ou Z, ou se votar em branco, ou no votar... Esta declarao
de voto chamada de observao. Assim, dizemos que um experimento ou fenmeno
aleatrio produz uma srie de observaes, que so agrupadas em um conjunto chamado
Universo, ou Populao, identificado pela letra grega mega maiscula ().
Figura 1.1: O conjunto Universo
O conjunto Universo tambm pode ser definido como o conjunto formado por N
elementos que tem pelo menos um atributo em comum.
Explicando: imagine o conjunto de moradores do Bairro B: so muitas famlias, muitas

pessoas que tem os mais diversos atributos idade, estado civil, naturalidade, renda,
etc., que desejamos conhecer. No entanto, todos estes moradores possuem pelo menos
um atributo em comum: so pessoas residentes no Bairro B.
Pertencem ao conjunto Universo todas as pessoas que possuem este atributo. Esto
fora do Universo todas as pessoas que no possuem este atributo. Os demais atributos
dos moradores podem ser descritos por conjuntos de valores denominados variveis.
Assim, temos as variveis sexo, idade, estado civil, renda, etc. Assume-se, para efeito de
estudo, que estas variveis so aleatrias (veja Apostila de Estatstica II - Captulo 2, e,
A. F. Beraldo 3
1. Teoria da Amostragem
Figura 1.2: O conjunto Universo
para uma discusso mais pormenorizada, veja a Apostila IV - Metodologia de Pesquisa

Quantitativa).
A varivel que estudamos a inteno de voto, Xi , ou seja, cada morador i do

Bairro B declara a sua inteno de voto xi . Ento, podemos agora considerar o conjunto
Universo formado por todas as "intenes de voto xi ", dos moradores do Bairro B.
Figura 1.3: Elementos do conjunto Universo e Varivel
As variveis de um conjunto Universo (e o prprio conjunto Universo) so descritas por

medidas chamadas parmetros. Por exemplo, as variveis quantitativas idade, renda,
escolaridade (medida em anos de estudo) tem, cada uma, os parmetros mdia ( - mi),
varincia ( 2 - sigma quadrado), desvio-padro ( - sigma); as variveis qualitativas sexo,
escolaridade (medida em nvel de ensino) e naturalidade, tem, cada uma, o parmetro
proporo ( - pi). Para generalizar, chamaremos os parmetros pela letra grega (teta).
4 A. F. Beraldo
Figura 1.4: O conjunto Universo e o Parmetro
Os parmetros so, no incio de nossa pesquisa, desconhecidos. Assim, no conhe-

cemos a mdia populacional das idades dos eleitores, nem a varincia populacional 2
de suas rendas. E tambm no conhecemos a proporo populacional de sua inteno
de voto.
Um conjunto Universo suposto de tamanho infinito, ou finito inumervel, ou

seja, mesmo sendo de tamanho finito, sempre partimos do princpio que estes conjuntos
tm um tamanho muito grande um nmero muito grande de elementos. Este
tamanho muito grande torna extremamente difcil, seno impossvel, a obteno ou
clculo destes parmetros. Para estudarmos o Universo, dispomos de dois mtodos
principais: o Censo e o Mtodo Estatstico.
Censo, ou recenseamento o processo de coleta de dados em que, teoricamente, todo

o conjunto Universo pesquisado. Todos os elementos do conjunto so estudados, um a
um, e o censo s termina quando todo o conjunto Universo for abrangido. Censos so
trabalhosos, demorados, custam muito dinheiro e, por isso, so realizados apenas por
instituies oficiais e por rgos do governo. Censos demogrficos, por exemplo, so
realizados de dez em dez anos, pelo IBGE (Instituto Brasileiro de Geografia e Estatstica)
quando uma grande quantidade de recenseadores recrutada para coletar dados sobre a
populao, atravs de questionrios. Desta forma, podemos medir a evoluo de variveis
como a populao das cidades e do meio rural, as taxas de natalidade e mortalidade,
as condies de moradia, o percentual de seguidores das crenas religiosas, as migraes
internas, etc1 .
1
O Censo 2010 compreendeu um levantamento minucioso de todos os domiclios do pas. Nos meses
de coleta de dados e superviso, 191 mil recenseadores visitaram 67,6 milhes de domiclios nos 5.565
municpios brasileiros para colher informaes sobre quem somos, quanto somos, onde estamos e como
vivemos. Os primeiros resultados definitivos, divulgados em novembro de 2010, apontaram uma populao
A. F. Beraldo 5
Alm do Censo Demogrfico, citamos o Censo Escolar, o Censo Industrial, o Censo

Agropecurio e o Censo da Educao Superior, entre outros. Cada um destes censos
realiza levantamentos nestes setores especficos da vida nacional.
1.1 O Mtodo Estatstico

Tendo o Censo tanta dificuldade em ser realizado, nas pesquisas chamadas quantita-
tivas utilizado o Mtodo Estatstico. O Mtodo Estatstico foi desenvolvido, a partir
do Clculo de Probabilidades, para que possamos calcular o valor dos parmetros as
medidas que descrevem o Universo , a partir das medidas obtidas de um subconjunto
do Universo chamado Amostra. Este mtodo consiste nos seguintes passos:
1. O conjunto Universo tratado de forma que cada um, e todos os seus elementos,
tenha a mesma probabilidade de ser sorteado. Este processo chamado de
homogeneizao do Universo. Homogeneizar o Universo consiste em fazer com
que cada um de seus elementos tenha probabilidade de ser sorteado igual de
qualquer outro. Em outras palavras, tornar equiprovvel este Universo.
2. Em seguida, alguns elementos do Universo so sorteados para compor um subcon-

junto chamado amostra (). Este sorteio feito de acordo com o tipo e a tcnica
de amostragem adotada2 .
Figura 1.5: Amostragem
formada por 190.732.694 pessoas. A previso de custo do Censo era de R$ 1,4 bilho. Mais informaes
em http://www.ibge.gov.br/home/estatistica/populacao/censo2010/.
2
As tcnicas de amostragem so discutidas na Apostila IV - Metodologia de Pesquisa Quantitativa
6 A. F. Beraldo
3. A amostra, assim constituda, processada estatisticamente, ou seja, so calculadas

as suas medidas descritivas, ou estatsticas: mdia X , varincia s2 , desvio
padro s , proporo (ou freqncia relativa), p. Estas estatsticas so chamadas
estimadores, e notadas pela letra (teta chapu). Veja a Figura 1.6 a seguir:
Figura 1.6: Clculo de Estatsticas
Calculando as estatsticas, temos todas as informaes sobre a Amostra. J uma

boa parte do caminho at chegarmos aos parmetros, que, como vimos, so as medidas
do Universo objetivo final deste mtodo. Para calcularmos os parmetros, utilizamos um
conjunto de processos chamados Inferncia Estatstica. Partimos da seguinte relao:
Parmetro = Estatstica margem de erro (1.1)
Esta relao decorre de duas postulaes fundamentais do Clculo de Probabilidades:

a Lei dos Grandes Nmeros, e o Teorema do Limite Central (a apresentao e o estudo
da LGN e do TLC no fazem parte do contedo desta Apostila). Em linhas gerais, esta
relao pode ser dita como:
Um parmetro (medida do Universo) pertence ao intervalo dado pela estatstica

(medida da Amostra), mais ou menos a margem de erro desta estatstica.
Com mais rigor, dizemos que um parmetro igual seu estimador mais ou menos
a margem de erro do estimador:
A. F. Beraldo 7
Desta forma, por exemplo, temos:
= X X
ou
h i
X X , X + X
Em que:
= Mdia do Universo (mdia populacional)
X = Mdia da Amostra (mdia amostral)
X = Margem de Erro da Mdia amostral

h i
O intervalo X X , X + X chamado intervalo de confiana do parmetro
(neste exemplo, intervalo de confiana da mdia populacional). A margem de erro
um valor que calculamos, utilizando a medida de disperso e o tamanho da amostra, e
informaes oriundas da distribuio de probabilidades da estatstica.
De maneira mais adequada e completa, dizemos que h uma probabilidade NC de que

o parmetro pertena ao intervalo de confiana IC:

P , + = NC (1.2)
NC chamado Nvel de Confiana.
Exemplificando: seja a tabela 1.1 a seguir, referente a distribuio de frequncias das

idades de moradores de uma rua, extrados aleatoriamente.
8 A. F. Beraldo
Classes de idades f
0 pa 10 2
10 a 20 6
20 a 30 9
30 a 40 13
40 a 50 24
50 a 60 38
60 a 70 15
70 a 80 12
80 a 90 8
90 a 100 3
n= 130
O histograma desta distribuio o seguinte:
Figura 1.7: Histograma para a distribuio de idades
Calculamos a mdia X = 52, 2 anos e o desvio-padro s = 19, 1 anos. Ento, se esta

amostra de 130 pessoas for representativa de todas as pessoas desta rua, podemos dizer
que a mdia (das idades de todas as pessoas da rua) pertence a um intervalo formado
por:
A. F. Beraldo 9
inf = S = 52, 2 19, 1 = 33, 1
sup = + S = 52, 2 + 19, 1 = 71, 3
E escrevemos
inf sup
33, 1 anos 71, 3 anos
Note que utilizamos como margem de erro apenas a estatstica desvio padro.
Voltando ao Intervalo de Confiana e ao Nvel de Confiana, utilizando as frequncias

relativas das classes, podemos dizer que h uma probabilidade de 63, 2% de que a mdia
esteja contida no intervalo [33, 1 71, 3].3
Neste exemplo, o Nvel de Confiana NC igual a 63, 2%. Assim, dizemos, grosso
modo, que:
P ( [33, 1 71, 3]) = 63, 2%
Comentrios:
Sobre o Mtodo Estatstico, voc deve ter em mente que:
Um parmetro no um nmero definido nico, e sim um valor dentro de um

intervalo. Dizemos que o parmetro pertence ao intervalo de confiana, ou, melhor
ainda, que h uma probabilidade de que o parmetro pertena ao intervalo de
confiana. Ao contrrio, uma estatstica (medida amostral) um valor definido
nico, calculado segundo uma expresso matemtica. Por exemplo, a mdia de um
conjunto dada por:
xi
X=
n
(Como foi visto na apostila de Estatstica Descritiva.)
3
Este clculo foi feito utilizando a interpolao de valores, conforme visto na Apostila I - Estatstica
Descritiva.
10 A. F. Beraldo
Assim, podemos dizer que a mdia amostral , por exemplo, igual a 3,70. No
entanto, nunca poderemos afirmar que a mdia populacional igual a 3,70, mas que
h uma probabilidade de, por exemplo, 95% da mdia populacional estar entre 3,05
e 4,28. O NC, Nvel de Confiana, , neste exemplo, 95%.
Parmetros (que descrevem o Universo) e estatsticas (que descrevem a Amostra)

tem o mesmo nome. Assim para diferenciar estas medidas, utilizamos letras do
alfabeto grego para parmetros e letras do alfabeto latino para as estatsticas:
Medidas Estatsticas Parmetros

(na Amostra) (no Universo)
Mdia X
Varincia s2 2
Desvio Padro s
Proporo p
Portanto, h uma correspondncia entre as medidas amostrais (estatsticas) e

as medidas populacionais (parmetros). Esta correspondncia formulada na
expresso:
Parmetro = Estatstica margem de erro
A margem de erro pode ser interpretada como a diferena existente entre as

medidas de uma Amostra e as do Universo de onde foi extrada. Cada estatstica,
ou estimador, possui a sua margem de erro. A margem de erro funo:

do Nvel de Confiana com que se est trabalhando;

do tamanho da amostra, n;

das condies do Universo (infinito ou finito);

do tipo de amostragem que foi realizado (com reposio ou sem reposio).

da distribuio de probabilidades da varivel;
Estas caractersticas da margem de erro sero detalhadas nos tpicos seguintes.
A. F. Beraldo 11
Como vimos, o Mtodo Estatstico utiliza estatsticas para calcular parmetros. Nas
prximas sees, e no Captulo 2, iremos estudar como realizado este processo. Antes,
porm, introduzimos um outro conceito: estimadores.
Em linhas gerais, uma amostra extrada aleatoriamente de uma populao. Cal-

culamos as estatsticas desta amostra, e se estas estatsticas so utilizadas para inferir
os parmetros populacionais, estas estatsticas so chamadas de estimadores. Assim,
dizemos, tecnicamente, que a mdia amostral X um estimador da mdia populacional
; que a proporo amostral p um estimador da proporo populacional , e assim por
diante.
Nas sees seguintes estudaremos os estimadores, em detalhe.
1.2 Distribuies Amostrais

Antes de comear o estudo desta seo, certifique-se que esto bem claros os conceitos
do que seja populao, amostra, amostragem, estatsticas, estimador, inferncia,
parmetros, e margem de erro.
1. Suponha que estejamos analisando o comportamento da varivel aleatria X. O

universo desta varivel (conjunto de todas observaes possveis, ou valores, da
varivel), dado por = {x1 , x2 , x3 , ...xn }. A maneira pela qual os diversos
valores xi ocorrem no universo chamada de distribuio de probabilidades de
X, formada pelos pares X, P (X = xi ). Esta distribuio de probabilidades possui
os parmetros E(X), Var(X), etc., como foi estudado na Apostila II.
2. Imagine que retiremos deste conjunto um bom nmero de amostras, ou mesmo,

uma amostra de tamanho razoavelmente grande, atravs do mtodo de amostragem
aleatria simples. Se as amostras foram convenientemente extradas do universo,
isto , se seguimos com rigor o critrio da aleatoriedade, a distribuio dos valores
de X, nas amostras, ter uma distribuio de probabilidades bem parecida com a
distribuio de probabilidades de X dentro do Universo, e to mais parecida quanto
maior(es) for(em) a(s) amostra(s).
3. Para cada amostra retirada, podemos calcular um conjunto de estatsticas (mdia,

moda, desvio-padro, etc.) dos valores amostrais de X. Como as amostras
foram retiradas aleatoriamente, estas estatsticas tero tambm valores
aleatrios.
4. Ao analisarmos os valores destas estatsticas, podemos montar distribuies amos-

trais destas estatsticas. Por exemplo, se calculamos a estatstica mdia X de cada
12 A. F. Beraldo
1.2 Distribuies Amostrais
uma das amostras, podemos montar uma tabela com a distribuio das mdias
amostrais, ou distribuio amostral das mdias.
5. Para estas distribuies amostrais de estatsticas, podemos calcular seus parmetros

E(X), Var(X), etc., que sero de grande interesse daqui por diante, como se ver.
Comentrios:
No cabe aqui teorizar se o conjunto universo finito ou infinito. Na realidade,

conjuntos infinitos so hipotticos, e o Clculo de Probabilidades possui recursos para
efetuar sua contagem. Mas poderemos encontrar conjuntos universo com tamanhos
muito grandes (N ), que faz com que a retirada de elementos deste conjunto, mesmo
sem reposio, no altere a distribuio de freqncias (e de probabilidades) dentro do
conjunto. Por outro lado, se o conjunto for finito, e no to grande, se retirarmos amostras
com reposio, o nmero de amostras ser bastante grande. Por exemplo, o nmero de
amostras de tamanho n = 3, retiradas com reposio, de um universo de tamanho N = 10,
de N n , ou 103 = 1.000 amostras.
Novamente chamamos a sua ateno para os smbolos empregados para estatsticas e

parmetros. As estatsticas, medidas amostrais, so simbolizadas por letras do alfabeto
latino; os parmetros, medidas populacionais, so simbolizados por letras do alfabeto
grego. Assim, teremos (mi), mdia populacional e X , mdia amostral. Teremos
(sigma), desvio-padro populacional e s, desvio-padro amostral.
Resumindo:
Na seo anterior, vimos algumas das caractersticas do processo de amostragem.

Estudamos que, de uma populao, podem ser retiradas amostras, sendo que cada
amostra contm uma informao sobre a populao. O conjunto de amostras, se for
suficientemente grande, ir fornecer subsdios para o conhecimento da populao. Em
outras palavras, as estatsticas calculadas sobre as amostras iro nos permitir
inferir os parmetros da populao4 .
4
A esta altura, voc j deve estar suficientemente familiarizado com o termo inferncia, do verbo
inferir, que significa, em estatstica, conhecer o todo (populao) a partir do estudo de suas partes
(amostras).
A. F. Beraldo 13
Veja a ilustrao a seguir:
Da populao , que possui um parmetro cujo valor desconhecido, extramos 3

amostras (w1 , w2 e w3 ). Em cada amostra calculamos uma estatstica "": 1 , 2 e 3 . O
processamento destas estatsticas ir nos permitir inferir o valor de .
O que chamamos processamento, no pargrafo anterior, comea pela montagem

de uma tabela, que toma o nome de distribuio amostral das estatsticas. Nas sees
seguintes iremos analisar a distribuio das mdias amostrais, das varincias e das
propores amostrais, entre outras estatsticas.
1.3 Distribuio Amostral de Mdias

Teorema I
Seja um conjunto universo dos valores da varivel X, = {x1 , x2 , x3 , ..., xn }. Seja
a mdia desta populao parmetro desconhecido. Considere todas as amostras
wi , de tamanho ni retiradas aleatoriamente deste conjunto. Se, para cada amostra wi
calcularmos sua mdia X i , podemos montar a distribuio amostral das mdias das
amostras. Calculando X i (mdia da distribuio de mdias amostrais), temos que
= X (1.3)
Em outras palavras: a mdia da distribuio amostral das mdias igual

mdia do conjunto universo.
14 A. F. Beraldo
Exemplo 1.1. Seja o conjunto universo formado pelos valores {1, 3, 3, 2, 6}. A mdia
deste conjunto dada por:
1+3+3+2+6 15
= = =3
5 5
Retiramos todas as amostras possveis, com reposio, de tamanho n = 2, deste

conjunto:
1 1 3 1 3 1 2 1 6 1
1 3 3 3 3 3 2 3 6 3
1 3 3 3 3 3 2 3 6 3
1 2 3 2 3 2 2 2 6 2
1 6 3 6 3 6 2 6 6 6
Calculamos a mdia X i de cada amostra:
1 2 2 1,5 3,5
2 3 3 2,5 4,5
2 3 3 2,5 4,5
1,5 2,5 2,5 2 4
3,5 4,5 4,5 4 6
Montamos a distribuio de frequncia das mdias X i :
Xi f f Xi
1 1 1
1,5 2 3
2 5 10
2,5 4 10
3 4 12
3,5 2 7
4 2 8
4,5 4 18
6 1 6
25 75
A. F. Beraldo 15
A terceira coluna, f X i , utilizada para calcular a mdia da distribuio das mdias

X i.
Voc deve estar lembrado, da Estatstica Descritiva, que a letra f significa freqncia
simples, ou seja, quantas vezes determinado valor da mdia ocorreu no conjunto de
amostras. No conjunto acima, o valor 1,5 ocorre 2 vezes, ou seja possui frequncia f = 2.
O valor 2 ocorreu 5 vezes, ou seja, possui frequncia f = 5.
No grfico a seguir, voc pode visualizar a distribuio amostral das mdias:
Distribuio das mdias amostrais

5
4
3
f
2
1
0
1 1.5 2 2.5 3 3.5 4 4.5 6
Mdias
Figura 1.9: Distribuio das mdias amostrais
A mdia, ou esperana, desta distribuio, dada por
P
f 75
E(X) = X = P X = = 3, 0
f 25
Ento, vemos que a mdia da distribuio amostral das mdias, X , igual mdia
do universo.
16 A. F. Beraldo
Comentrios:
1. Voc deve estar se perguntando: se a amostragem feita para se obter o valor da

mdia da populao, a partir da mdia das amostras, o que deve acontecer se no
conseguirmos retirar todas as amostras possveis de uma populao (que deve
ser a situao que encontramos, na prtica) ? No exemplo que dado, poderamos
ter extrado uma amostra, ou duas, ou trs, que indicassem que o valor da mdia
1,5 ou 6,0, ao invs do valor correto, que 3 ...
2. Realmente, isto o que acontece se o tamanho de suas amostras to pequeno.

No exemplo dado, as amostras possuem tamanho 2, muito pouco para se estimar a
mdia populacional. Mas lembre-se que as amostras coletadas, na prtica, tero um
tamanho bem maior, e que a mdia populacional pertence a um intervalo: mdia
populacional igual mdia amostral mais ou menos a margem de erro da mdia
amostral. Aguarde mais um pouco ...Enquanto isso, veja a seguir um outro exemplo,
com amostras de tamanho n = 3, retiradas de um conjunto de 7 elementos:
Distribuio das mdias amostrais

70
60
50
40
f
30
20
10
0
2 4 6 8 10 12 14
Mdias
Figura 1.10: Distribuio das mdias amostrais
A. F. Beraldo 17
Voc pode notar que o histograma toma a forma aproximada de uma curva normal.
Isto sempre acontece, e a distribuio amostral das mdias tem distribuio normal, tanto
mais aderente quanto maior for o tamanho da amostra.
Observando o grfico, voc pode ver a zona central, de maior densidade de frequncia,
em torno da mdia populacional, , sabendo que = 8.
1. Quanto maior for o tamanho das amostras (e mais amostras voc ter), maior a
concentrao das mdias amostrais X i em torno da mdia populacional .
2. No limite, voc pode afirmar que
X =
A seguir, apresentamos dois teoremas (sem demonstrao):
Teorema II
Se a populao da qual se extraem as amostras tem distribuio normal com mdia
e varincia 2 ,ento a distribuio das mdias amostrais tambm normalmente
2
distribuda, com mdia e varincia X = 2 /n. (Veja Distribuio Amostral das
Varincias)
Teorema III
Se a populao da qual se extraem as amostras no tem, necessariamente, uma
distribuio normal, mas possui mdia e varincia 2 , ento a varivel padronizada
Z ligada a X, sendo
X
Z=

n
Z possui uma distribuio assintoticamente normal, ou seja, muito aproximadamente

normal5 , e adere mais a esta distribuio quanto maior for n.
Estes dois teoremas II e III so importantssimos para a Estatstica Inferencial, e logo

voc ver porque. No cabe aqui, nesta Apostila, comentar toda a teoria matemtica que
envolve estas leis, mas tenha em mente que so a base do ciclo Amostragem-Inferncia.
RZ
5
Em outras palavras, Z assintticamente normal, ou seja: lim P (Z z) = 1
2
eu2/2 du
18 A. F. Beraldo
1.4 Distribuio Amostral das Propores
1.4 Distribuio Amostral das Propores

Outra estatstica que iremos utilizar bastante (alm da mdia e do desvio-padro),
a chamada proporo, ou frequncia relativa. Por exemplo, se uma caixa contm
4 bolas brancas e 6 bolas azuis, a proporo de bolas brancas 4/10, ou 0,4 ou 40%.
Normalmente, trabalha-se com propores escritas em nmeros decimais.
Quando trabalhamos com propores, melhor que o Universo seja tratado de forma
dicotmica, tal como nas provas de Bernoulli. No exemplo acima, teramos a proporo
p = 0, 4. A proporo complementar, q, dada por q = 1 p = 0, 6 (no exemplo).
Seja um Universo , constitudo de N elementos. Ao retiramos aleatoriamente, com

reposio, k amostras de tamanho n, e calcularmos a proporo p de determinada categoria
(ou atributo), teremos uma distribuio amostral das propores. A proporo da
populao dada por
= p (1.4)
Da mesma forma que fizemos a inferncia da mdia populacional, estimamos a

proporo populacional a partir da proporo amostral. Supomos que a populao de
onde extramos as amostras tem um modelo normal. Aqui tambm se aplica a expresso
Parmetro = Estatstica Margem de Erro
O parmetro a ser calculado , a proporo populacional. A estatstica que estima

este parmetro a mdia das propores amostrais, que notaremos por p (proporo
mdia). O desvio padro da distribuio de propores sp .
Exemplo 1.2. Seja o conjunto universo = {1, 3, 3, 2, 6} e seja A o evento xi 3.
Observamos que o nmero de elementos de que cumpre a condio A so 3 : {3, 3, 6}.

Ento, a proporo A dada por
3
A = = 0, 6
5
A. F. Beraldo 19
Retiramos todas as amostras possveis de tamanho n = 2:
1 1 3 1 3 1 2 1 6 1
1 3 3 3 3 3 2 3 6 3
1 3 3 3 3 3 2 3 6 3
1 2 3 2 3 2 2 2 6 2
1 6 3 6 3 6 2 6 6 6
Montamos a seguinte distribuio de frequncias:
p(A) f f.p(A)
0 4 0
0,5 12 6
1 9 9
25 15
Mdia 0,6
A mdia de pA dada por
f pA 15
p= P = = 0, 6
f 25
Assim, verifica-se a condio
= Xp (1.5)
1.5 Distribuio Amostral das Varincias

Seja um conjunto universo = {x1 ; x2 ; x3 ; ; xn }. A mdia do conjunto calculada
pela expresso
P
xi
=
n
E a varincia calculada pela expresso
20 A. F. Beraldo
1.5 Distribuio Amostral das Varincias
(xi )2
P
2
=
n
ou
2 (x1 )2 + (x2 )2 + (x3 )2 + + (xn )2

=
n
Considere, agora, todas as amostras de tamanho n, retiradas desta populao. Cada

amostra ter a sua mdia X i e varincia s2i .
O conjunto de varincias s2i tem sua distribuio amostral, mas, devido a caracters-
ticas desta distribuio, mais conveniente utilizar a varivel Y , dada por
(n 1)s2i
Y =
2
A estatstica Y tem uma distribuio qui-quadrada (v. Apostila II), com n 1 graus
de liberdade.
Se a populao infinita, ou se a amostragem feita com reposio, ento a varincia

2
da distribuio amostral das mdias (X ) igual a
2 2
2
X = E(x ) = (1.6)
n
onde n o tamanho da amostra. Escrevendo de outra forma:
2 = n X
2
(1.7)
Portanto, a varincia do universo igual ao produto do tamanho das amostras pela

varincia da distribuio amostral das mdias.
Exemplo 1.3. Seja o mesmo conjunto dos exemplos 1.1 e 1.2:
A. F. Beraldo 21
(x )2 (1 3)2 + (3 3)2 + ... + (6 3)2

P
2
= = = 2, 8
n 5
Calculamos a varincia da distribuio amostral das mdias:
X f fx d d2 f d2
1 1 1 -2 4 4
1,5 2 3 -1,5 2,25 4,5
2 5 10 -1 1 5
2,5 4 10 -0,5 0,25 1
3 4 12 0 0 0
3,5 2 7 0,5 0,25 0,5
4 2 8 1 1 2
4,5 4 18 1,5 2,25 9
6 1 6 3 9 9
25 75 35
2
Calculando X , temos:
2
h f d2
2
i 35
X = E (x ) = = = 1, 4
f 25
ento, 2 = n X
2
2 = nX
2
= (2)(1, 4) = 2, 8
que confirma o Teorema II.
Se a populao tem tamanho N , finito, e a amostragem feita sem reposio, e se o

tamanho da amostra n N , ento a frmula anterior (Teorema II) substituda por:
2 2 (N n)
X = (1.8)
n(N 1)
22 A. F. Beraldo
1.6 Distribuio Amostral das Diferenas e Somas de Mdias e Propores
Veja que esta frmula se reduz 1.8, para o caso de N .
Esta adaptao bastante conveniente, para o caso de estarmos lidando com N grande,
o que ocorre com mais freqncia.
1.6 Distribuio Amostral das Diferenas e Somas

de Mdias e Propores
Sejam duas populaes, 1 e 2 , da qual retiramos com reposio todas as amostras
possveis, de tamanhos n1 e n2 , calculando as mdias 1 e 2 , e os desvios padres 1 e
2 .
Construmos a distribuio amostral da varivel X 1 X 2 (diferena das mdias das

amostras retiradas das populaes 1 e 2 ). Demonstra-se que, para populaes infinitas,
X 1 X 2 = X 1 X 2 = 1 2 (1.9)
s
12 22
X 1 X 2 = + (1.10)
n1 n2
Para populaes finitas, mas com amostragem com reposio, temos que a varivel
padronizada Z, dada por
(X1 X2 ) (1 2 )
Z= v (1.11)
u 2 22
u
u 1
t +
n1 n2
tem distribuio muito aproximadamente normal para n1 , n2 30.
No caso de propores, sendo as populaes binomialmente distribudas, com

parmetros de sucesso 1 e 2 , respectivamente, e as correspondentes estatsticas
amostrais p1 e p2 , temos as seguintes expresses:
A. F. Beraldo 23
p1 p2 = p1 p2 = p1 p2 (1.12)
v
u (1 1 ) 2 (1 2 )
u
p1 p2 = t
+ (1.13)
n1 n2
1.7 A Desigualdade de Chebyshev

At agora, estudamos as distribuies amostrais de estatsticas, em amostras extradas
de populaes supostamente normais. Quando a amostra pequena (n < 30), e no h a
condio de normalidade da populao, podemos utilizar a Desigualdade, ou Teorema,
de Chebishev, que o seguinte:
1
P X kX 1 (1.14)
k2
ou seja, a probabilidade da mdia amostral diferir da mdia populacional, de k desvios

padres no menor do que 1 k12 (sendo k > 1).
24 A. F. Beraldo
1.8 Glossrio
1.8 Glossrio
Antes de passarmos ao prximo captulo, necessrio que voc tenha entendido
perfeitamente os termos que utilizamos at agora. Os principais conceitos esto definidos
a seguir, e no prossiga em seus estudos sem que estejam perfeitamente compreendidos:
Universo Conjunto de elementos (ou observaes sobre este con-

junto) que possuem pelo menos um atributo em comum.
O mesmo que Populao.
Amostra Conjunto cujos elementos foram extrados do Universo.
Amostragem Processo em que a extrao de elementos que iro compor

probabilstica a amostra feito segundo as regras do Clculo de
Probabilidades (sorteio).
Amostragem Processo de extrao da amostra em que no h o rigor

no-probabilstica probabilstico.
Parmetro Medida descritiva de variveis do Universo.
Estatstica Medida descritiva de variveis da Amostra.
Margem de erro Diferena entre as medidas da Populao e da Amostra.

Geralmente uma expresso matemtica que engloba
medidas de disperso e tamanho da amostra (erro padro),
junto com valores retirados de distribuies de probabili-
dades.
Inferncia estatstica Processo de clculo dos parmetros a partir de estatsticas

conhecidas e da margem de erro destas estatsticas.
Intervalo de confiana Intervalo formado pela expresso estatstica margem de

erro, em que se calcula a probabilidade de pertinncia de
um parmetro.
Nvel de confiana Probabilidade de que o parmetro pertena ao Intervalo de

Confiana.
Distribuio amostral Conjunto de valores das estatsticas e da frequncia com

que ocorrem.
Estimador uma estatstica utilizada para calcular os valores dos

parmetros.
A. F. Beraldo 25
1.9 Erros Padres de algumas estatsticas

Vimos que um Intervalo de Confiana, em que calculamos a probabilidade NC de que o
parmetro (medida populacional) a ele pertena, possui os limites inf e sup , de maneira
que
inf sup
Os limites inferior e superior do IC so dados por
inf = e
sup = +
onde o estimador e a margem de erro do estimador.
A margem de erro do estimador calculada da seguinte forma:
= KEp
onde
: margem de erro do estimador
K: um coeficiente que depende da distribuio de probabilidades do estimador .
Ep : erro padro do estimador, geralmente a razo entre sua medida de disperso

(varincia ou desvio-padro) e a raiz quadrada do tamanho da amostra. A seguir, o
quadro com os erros-padres de algumas estatsticas.
26 A. F. Beraldo
1.9 Erros Padres de algumas estatsticas
Estatstica Erro Padro Observaes

Amostral
Mdia Vlido para grandes ou pequenas amos-

(1.15) tras quando a populao infinita ou a
n
amostragem feita com reposio. A
distribuio amostral das mdias normal
ou assintoticamente normal quando n > 30
mesmo quando a populao no normal.
Propores Idem s observaes feitas para a mdia.

s
(1 )
n
(1.16)
Medianas Para n > 30, a distribuio amostral

1, 2533
das medianas aproximadamente normal.
n
Este Ep vlido apenas para populaes
normais.
Desvios Padro Para n > 100 a distribuio amostral

(1.17) dos desvios padro aproximadamente
n
s normal. Se a populao normal, emprega-
4 4 se (1.17); se no normal, emprega-se
(1.18)
4n 4 (1.18).
Varincias
s
2
2 (1.19)
n
s
4 4
(1.20)
n
Retirado de SPIEGEL, M. S., Probabilidade e Estatstica, McGraw-Hill, Rio de Janeiro, 1978.
A. F. Beraldo 27
1.9.1 Dimensionamento da amostra para a inferncia da mdia

populacional
2
zcrit
n=
d
(zcrit )2 N
n=
d (N 1) + (zcrit )2
2
1.9.2 Dimensionamento da amostra para estimar a proporo

populacional
z 2
crit
n= pb qb

2
zcrit pb qb N
n= 2
2 (N 1) + zcrit pb qb
28 A. F. Beraldo
2 Inferncia estatstica
Inferir, segundo o dicionrio1 , vem do latim inferere, significando Tirar por concluso; deduzir pelo
raciocnio.
Em Estatstica, a inferncia o processo indutivo2 de estimarmos os parmetros (medidas da

populao) a partir das estatsticas (medidas da amostra).
Lembrando as fases do mtodo estatstico:
1. Um conjunto , chamado amostra, com n elementos, extrado aleatoriamente de uma populao

, de tamanho N , (infinito ou finito).
Figura 2.1: Amostragem
2. Como o tamanho da amostra muito menor do que o tamanho da populao

(n << N ), podemos calcular facilmente as estatsticas, que so as medidas das variveis de uma
amostra. Comumente, calculamos as estatsticas mdia X, varincia s2 e desvio padro s, e as
propores p (ou freqncias relativas f r). No caso de estudarmos mais de uma varivel na amostra,
calculamos tambm os coeficientes de correlao r e a covarincia COVxy , entre outras estatsticas3 .
Estas medidas, estatsticas amostrais, vo permitir o clculo de seus correspondentes parmetros
1
Dicionrio Aurlio Sculo XXI.
2
No processo indutivo conhece-se o todo a partir do que conhecemos sobre suas partes.
3
O coeficiente de correlao e a covarincia so estudados na apostila Estatstica V Tpicos Especiais
de Estatstica.
A. F. Beraldo 29
2. Inferncia estatstica
populacionais: mdia , varincia 2 e desvio padro , propores , coeficientes de correlao

e covarincia xy .
3. Os parmetros so calculados pela expresso
Parmetro = Estatstica Margem de erro da estatstica
Ou seja, um parmetro pertence a um intervalo numrico cujos limites inferior e superior so

obtidos pela estatstica correspondente, subtrada e somada margem de erro calculada. Este
intervalo de confiana, IC, calculado para cada estatstica.
Isto nos faz pensar que o clculo dos parmetros pode ser resumido em calcular a margem de
erro das estatsticas. De uma certa forma assim, embora aps o clculo dos parmetros, uma
boa dose de bom senso e de anlise tenha que ser exercida, para evitarmos erros (grosseiros ou
no) nas afirmaes que fazemos sobre o universo.
Todo parmetro, portanto, est ligado sua estatstica correspondente, e a um intervalo de
confiana. Nos tpicos a seguir, estudaremos o clculo dos intervalos de confiana para alguns
dos parmetros mais utilizados. Antes, no entanto, algumas consideraes sobre estimadores.
Como explicado anteriormente, iremos inferir os parmetros de uma populao a partir de

estatsticas (ou estimadores) i , calculados sobre amostras retiradas aleatoriamente do conjunto Universo.
Em outras palavras, iremos estimar parmetros a partir de estimadores calculados sobre a amostra.
A relao a seguinte:
onde o parmetro (que descreve a populao), o estimador e a margem de erro do estimador.
Estimadores podem ser enviesados ou no-enviesados. Um estimador no-enviesado quando
E(i ) =
30 A. F. Beraldo
2.1 Inferncia da Mdia Populacional
ou seja, quando a mdia, ou esperana do estimador, igual ao parmetro correspondente. Na

inferncia dos parmetros que estudaremos a seguir, os estimadores no-enviesados (ou no-tendenciosos)
so X, p e s2 , pois:
E(X i ) = , E(pi ) =
E(s2i ) = 2
O desvio-padro amostral no um estimador no-enviesado do desvio-padro populacional, uma

vez que, em geral,
E(s) 6=
Estimadores tambm podem ser eficientes, ou no. Se temos dois ou mais estimadores para um
parmetro, o estimador eficiente ser aquele com a menor varincia. Por exemplo, a mdia populacional
pode ser estimada tanto pela mdia amostral X quanto pela mediana amostral X No entanto, a
varincia, ou mdia quadrtica utilizando a mdia menor do que aquela utilizando a mediana:
(xi X)2 (xi X)2

n n
Portanto, a X (mdia amostral) o estimador no-enviesado e eficiente de (mdia populacional).
Ao final deste captulo, mostraremos o uso de alguns estimadores tendenciosos (enviesados), que,
mesmo assim, podem ser - com reservas - utilizados pela facilidade em que so calculados, junto com
outros estimadores.
Neste captulo, iremos estudar a Inferncia Estatstica como sendo o clculo e a anlise dos intervalos
de confiana dos parmetros, ou seja, a estimao intervalar dos parmetros. Para a estimao pontual de
parmetros, que utiliza as tcnicas de mxima verossimilhana, consulte a Apostila V - Tpicos Especiais
em Estatstica.

Seja um Universo , que pode ser infinito ou finito, constitudo de N elementos, com mdia e desvio
padro . Retiramos aleatoriamente, com ou sem reposio, uma amostra de tamanho n, e calculamos
a sua mdia X e o desvio padro s. O intervalo de confiana IC para a mdia populacional calculado
conforme as seguintes condies:
2.1.1 Grandes amostras (n > 30)

Populao infinita, amostragem com reposio e varincia populacional conhecida, distribuio
normal.
A. F. Beraldo 31

X zcrit X + zcrit (2.1)
n n
onde zcrit tabelado segundo o nvel de significncia (vide quadro abaixo):
NC zcrit
90% 1,645
95% 1,96
99% 2,58
32 A. F. Beraldo
Na quase totalidade das vezes, o desvio padro populacional desconhecido. No entanto, para
amostras bem maiores, em que se tem normalidade das variveis, podemos substituir por s, e a expresso
de clculo torna-se
s s
n n
Populao finita, amostragem sem reposio, e varincia conhecida, distribuio normal.
v v
uN n uN n
u u
X zcrit t X + zcrit t (2.3)
n N 1 n N 1
Da mesma forma, para grandes amostras, podemos substituir por s, e a expresso torna-se a
seguinte:
v v
s uN n s uN n
u u
X zcrit t X + zcrit t (2.4)
n N 1 n N 1
onde zcrit tabelado segundo o nvel de significncia (vide quadro da pgina anterior).
2.1.2 Pequenas amostras (n < 30)

Populao infinita, amostragem com reposio, com a varivel normalmente distribuda, e
varincia populacional desconhecida, distribuio t de Student.
s s
X tcrit X + tcrit (2.5)
n n
onde tcrit tabelado em funo do nvel de significncia e do nmero de graus de liberdade , dado
por = n 1 (vide Tabelas no Anexo I desta Apostila).
Populao finita, amostragem sem reposio, com a varivel normalmente distribuda, e

varincia populacional desconhecida:
A. F. Beraldo 33
v v
s uN n s uN n
u u
X tcrit t X + tcrit t (2.6)
n N 1 n N 1
onde tcrit tabelado em funo do nvel de significncia e do nmero

p de graus de liberdade , dado
por = n 1 (vide Tabelas no Anexo I desta Apostila). A expresso N n/N 1 chamada fator
de correo para populaes finitas.
Exemplo 2.1. Uma amostra de 400 habitantes de uma cidade de porte mdio foi extrada aleatoriamente
e, em relao varivel peso, foram calculadas a mdia X = 67, 5 kg e o desvio padro s = 12, 5 kg.
Estime o valor da mdia populacional, para os nveis de confiana de 90%, 95% e 99%.
Pelos dados acima, a populao pode ser considerada infinita (cidade de porte mdio). No foi
informada a varincia da populao - o que situao mais comum. No entanto, considerando o tamanho
da amostra, e admitindo que a distribuio da varivel peso normalmente distribuda, podemos utilizar
s no lugar de , e adotar a seguinte expresso de clculo:
s s
X zcrit X + zcrit
n n
Para o NC = 90%, zcrit = 1, 645 e a margem de erro
s 12, 5
zcrit = 1, 645 = 1, 03 kg
n 400
E a expresso para o IC a seguinte
67, 5 1, 03 67, 5 + 1, 03
66, 47 68, 53
H uma probabilidade de 90% de que a mdia populacional pertena ao IC

[66, 47 68, 53].
Para o NC = 95%, zcrit = 1, 96, e a margem de erro
s 12, 5
zcrit = 1, 96 = 1, 23 kg
n 400
e a expresso do IC a seguinte:
67, 5 1, 23 67, 5 + 1, 23
66, 27 68, 73
34 A. F. Beraldo
H uma probabilidade de 95% de que a mdia populacional pertena ao intervalo [66, 27 68, 73].
Para o NC = 99%, zcrit = 2, 58. A margem de erro a seguinte
s 12, 5
zcrit = 2, 58 = 1, 61 kg
n 400
O IC o seguinte
67, 5 1, 61 67, 5 + 1, 61
65, 89 69, 11
H uma probabilidade de 99% de que a mdia populacional pertena ao intervalo [65, 89 69, 11].
Veja a figura seguinte:
A. F. Beraldo 35
Figura 2.3: Intervalos de confiana
Exemplo 2.2. Seja a mesma situao do Exemplo 1.1, com uma amostra de n = 400, mdia X = 67, 5
kg e s = 12, 5 kg. No entanto, imagine que esta amostra seja extrada de um Universo finito, com
N = 2.000. Assim, a expresso de clculo da margem de erro, para um NC de 95%, seria:
r
s N n
X =zc
n N 1
r
12, 5 2000 400
X =1, 96
400 2000 1
X =(1, 96) (0, 625) (0, 895) = 1, 096
67, 5 1, 096 67, 5 + 1, 096

66, 404 68, 596
36 A. F. Beraldo
Figura 2.4: Intervalo de confiana
A. F. Beraldo 37
Exemplo 2.3. Seja a mesma situao do Exemplo 1.1, porm com uma amostra menor, n = 20 elementos.
Neste caso, utilizamos a distribuio de Student t
X = 67, 5 s = 12, 5 n = 20
Populao infinita
tcalc =?, = n 1, = 20 1 = 19, N C = 95%
tcalc = 2, 093
12, 5
X = 2, 093 = 5, 85 kg
20
67, 5 5, 85 67, 5 + 5, 85
61, 650 73, 350
38 A. F. Beraldo
Comentrios:
1. Voc j deve ter reparado que costumamos falar em grandes e pequenas amostras, distribuio
normal e aproximadamente normal, grandes valores de n (tamanho da amostra), etc. Muito ainda
se dir e se ver sobre isto, mas, por enquanto, vamos estabelecer o seguinte:
Em termos tericos, conforme se encontra nos livros sobre o assunto, as amostras dividem-se
em grandes amostras e pequenas amostras. Isto depende do tamanho n da amostra. Se
n < 30, a amostra pequena; se n > 30, a amostra grande. Isto implica, basicamente,
numa diferena de tratamento estatstico e matemtico, uma vez que pequenas amostras
seguem a distribuio binomial (por exemplo), e grandes amostras seguem a distribuio
normal. Existe uma distribuio terica, da qual estudaremos daqui a pouco, chamada t de
Student, e que se aplica a qualquer tipo de amostra.
Ainda em termos tericos, assume-se que pequenas amostras implicam em grandes margens de
erro. Note que o desvio padro das medidas (que uma espcie de medida da margem de
erro), vem sempre no numerador das frmulas, dividido pela raiz quadrada do tamanho da
amostra. Isto quer dizer que a margem de erro das medidas inversamente proporcional
raiz quadrada do tamanho da amostra, ou seja, quanto menor a amostra, maior a
margem de erro, e vice-versa.
Em termos prticos, o mtodo de pesquisa no bem assim. Depende muito do objeto em
estudo. Universos que possuem grande regularidade, so bem homogneos, no necessitam
de grandes amostras, uma vez que o desvio padro (que uma medida de disperso, lembra-
se?) ser, correspondentemente, tambm pequeno. De outra forma, Universos altamente
irregulares produzem grandes margens de erro, mesmo se extramos amostras de quinhentos,
ou mil, ou mais elementos...
2. Existe uma lei em matemtica, a chamada Lei dos Grandes Nmeros, que diz mais ou menos
o seguinte: Quanto mais observaes tivermos sobre um fenmeno quantificvel, mais nos
aproximaremos dos parmetros verdadeiros que medem estes fenmenos. Isto quer dizer que, por
exemplo, quanto mais lanamentos de uma moeda fizermos, mais os resultados iro se aproximar
dos previstos 50% de caras e 50% de coroas. Quanto mais nascimentos de crianas acontecerem,
mais nos aproximaremos da proporo metade meninos, metade meninas. Uma das maneiras de
enunciarmos a Lei dos Grandes Nmeros a seguinte:
Se Y /n a proporo amostral de uma categoria Y em uma amostra de tamanho n, e a proporo
dessa mesma categoria, no Universo, e um nmero pequeno, porm maior que zero, temos que

Y
lim P r = 0
n n
Ou seja, medida que aumentamos a amostra (n ), a probabilidade de que a diferena entre

a estatstica amostral Y /n e o parmetro populacional seja maior que dado nmero (muito
pequeno), tende a zero.
O mesmo pode ser aplicado a qualquer outra estatstica e seu parmetro correspondente. Por
exemplo, este que acabamos de estudar, a mdia populacional. Se a mdia populacional, e X
a mdia amostral, temos, segundo a Lei dos Grandes Nmeros,

lim P r X = 0
n
A. F. Beraldo 39
Dizendo de outra maneira, a diferena entre a mdia populacional e a mdia amostral pode se tornar
to pequena quanto quisermos (se pudermos aumentar o tamanho da amostra ilimitadamente, a
mdia populacional tende a se tornar igual mdia amostral).
3. Voc deve ter notado que, extraindo a amostra de uma populao, o fazemos sem reposio, ou seja,
no consideramos que um elemento amostrado possa ser amostrado mais de uma vez. Neste caso,
para
p manter um rigor terico, teramos que utilizar um desvio padro corrigido pela expresso
N n/N 1. Mas ocorre o seguinte: se a populao muito grande (infinita), a expresso
tende a se igualar a 1. O mesmo pode-se dizer no caso em que a populao finita, mas N >> n.
Por exemplo, se temos uma populao de 10.000 alunos em uma universidade, e extramos uma
amostra de tamanho n = 300, a expresso calculada como
r r r
N n 10.000 300 9.700 p
= = = 0, 9700 = 0, 985
N 1 10.000 1 9.999
Este valor muito prximo a 1,00. Da, que no faz sentido adotar a correo para universos finitos,
nestes casos. Em outras situaes, principalmente no caso de pequenas amostras e Universos
menores, estes fatores de correo devem ser utilizados.
2.2 Inferncia das Propores Populacionais

Seja uma populao , de tamanho N , em que a varivel em que estamos trabalhando qualitativa
(nominal) dicotmica, ou seja, podem ocorrer os eventos E e E (sucesso e no-sucesso, respectivamente).
Seja f r(E) = a frequncia relativa, ou proporo de ocorrncia do evento E nesta populao, dada
por = f (E)/N .
Desta populao, retirada aleatoriamente uma amostra de tamanho n, e calculada a proporo p,

dada por p = f (E)/n. A proporo populacional dever ser estimada a partir da proporo amostral
p.
Caso a populao seja infinita e a amostra tenha um tamanho n 30, tal que np 5, podemos
utilizar a distribuio normal de probabilidades, e estimar pela expresso:
v v
u p(1 p) u p(1 p)
u u
p zcrit t
p + zcrit t (2.7)
n n
onde os valores dos zcrit so os mesmos dados pela Tabela 2.1.

Caso a populao seja finita e a amostra tenha um tamanho n 30, tal que np 5, podemos
tambm utilizar a distribuio normal de probabilidades, e estimar pela expresso:
v v v v
u p(1 p) u
tN n
u p(1 p) u N n
u u u u
pzcrit t
p+zcrit t t
(2.8)
n N 1 n N 1
40 A. F. Beraldo
Exemplo 2.4. Seja uma populao de uma cidade, com cerca de 50 mil habitantes. Queremos saber a
proporo de pessoas com ensino superior completo. Extramos uma amostra aleatria de 400 elementos,
e verificamos que a proporo de pessoas com ensino superior completo na amostra 15% (p = 0, 15).
Qual ser o valor de ?
A. F. Beraldo 41
Supondo um NC de 95%, dado por
p p p + p
onde:
r
P (1 p)
p =zc
n
r
(0, 15) (0, 85)
p =1, 96
400
p =0, 035
0, 15 0, 035 0, 15 + 0, 035
0, 115 0, 185
42 A. F. Beraldo
Exemplo 2.5. Seja a mesma situao do exemplo anterior, porm com a amostra extrada de uma
populao finita, com N = 1.000.
A expresso de clculo da margem de erro dever se multiplicada pelo fator de correo de populaes
finitas, dado por:
r
1000 400
= 0, 775
1000 1
A nova margem de erro
p =(0, 035)(0, 775)

p =0, 0271
E o valor de :
0, 123 0, 177
A. F. Beraldo 43
2.3 Inferncia da Varincia Populacional

A varincia populacional 2 estimada utilizando-se a distribuio do qui-quadrado4 . A expresso
da inferncia da varincia dada por
(n 1)s2 2 (n 1)s2
(2.9)
2sup 2inf
onde:
n: tamanho da amostra
s2 : varincia amostral
2 : varincia populacional
2sup , 2inf : valores da distribuio do qui-quadrado, para n 1 graus de liberdade e um nvel de

confiana NC.
Exemplo 2.6. Desejamos estimar a varincia populacional dos salrios dos empregados do comrcio
na cidade. Extramos uma amostra aleatria de 25 salrios, na qual foi calculada uma varincia de R$
12.000,00 (doze mil reais ao quadrado). Qual a varincia populacional?
s2 = 12.000, 00
n = 25
N C = 95%
(graus de liberdade) = n 1 = 25 1 = 24
Consultando a tabela, temos:
2inf = 12, 401
2sup = 39, 364
Aplicando na expresso de clculo, temos
(25 1)12000 (25 1)12000

2
39, 364 12, 401
7.316, 33 2 23.223, 93
O desvio-padro obtido extraindo-se a raiz quadrada dos limites do IC:

4
Mais detalhes, ver apostila Estatstica II - Clculo de Probabilidades
44 A. F. Beraldo
2.3 Inferncia da Varincia Populacional
85, 54 2 152, 39
A. F. Beraldo 45
2.4 Inferncia da Diferena entre duas Mdias

Sejam duas populaes 1 e 2 , independentes, com mdias 1 e 2 , das quais foram extradas duas
amostras 1 e 2 , de tamanhos n1 e n2 respectivamente. As amostras possuem mdias X 1 e X 2 , e
varincias s21 e s22 se a distribuio da varivel nas populaes for normal, ou aproximadamente normal,
temos:
Para grandes amostras:
s s
s21 s2 s21 s2
(X 1 X 2 ) zcrit + 2 (1 2 ) (X 1 X 2 ) + zcrit + 2 (2.10)
n1 n2 n1 n2
Para pequenas amostras:
s
(n1 1)s21 + (n2 1)s22

1 1
1 2 = (X 1 X 2 ) tcrit + (2.11)
n1 + n2 2 n1 n2
2.5 Inferncia do Desvio Padro e de outras

estatsticas.
De forma anloga mdia e proporo populacionais, outras estatsticas possuem suas margens de
erro. A expresso da inferncia estatstica sempre a mesma:
Parmetro = Estatstica Margem de erro da estatstica
A seguir, voc encontra as margens de erro para as estatsticas mais utilizadas (sempre que se admitir
que as distribuies amostrais das estatsticas for normal, o tamanho das amostras grande, a populao
finita e a amostragem feita com reposio, se a populao for finita):
46 A. F. Beraldo
2.5 Inferncia do Desvio Padro e de outras estatsticas.
Mdias
s
zc
n
Propores r
p(1 p)
zc
n
Desvios Padres
s
zcalc
2n
Mediana
1, 2533 s
zcalc
n
Primeiro e Terceiro Quartis

1, 3626 s
zcalc
n
A. F. Beraldo 47
2.6 Clculo do tamanho timo das amostras

Legenda:
n Tamanho da amostra
Desvio padro da populao
zcrit z-crtico, retirado da curva normal. Os valores so os seguintes:
zcrit = 1,645 para um nvel de confiana NC = 90%
zcrit = 1,96 para um nvel de confiana NC = 95% (mais comum)
zcrit = 2,58 para um nvel de confiana NC = 99%
d Erro amostral, margem de erro da mdia amostral. Diferena mxima entre o
parmetro e a estatstica X
N Tamanho da populao.
pb Proporo do evento (sucesso) na amostra, estimada ou calculada. Caso no
se tenha informao a priori, utilizar pb = 0, 5
qb Proporo do evento (no-sucesso) na amostra, estimada ou calculada. Caso
no se tenha informao a priori, utilizar qb = 0, 5
Margem de erro da proporo amostral
48 A. F. Beraldo
Parte II
Teoria da Deciso Estatstica
A. F. Beraldo 49
3 Introduo
A Teoria da Deciso Estatstica uma das aplicaes prticas da Estatstica mais utilizadas, em
campos to diversos quanto Marketing (avaliao da eficcia de uma campanha publicitria) quanto
Medicina (eficincia de cura de uma doena a partir da aplicao de dosagens diferentes de um
medicamento), passando pela Educao Fsica e pelas Cincias Sociais. Sempre que houver necessidade de
avaliao, conjugada com comparao, este recurso, a Teoria da Deciso Estatstica, estar presente.
3.1 O que so Testes de Hipteses
Uma Hiptese estatstica uma afirmativa que se faz sobre um parmetro, a partir de estatsticas
de amostras coletadas.
Por exemplo, pode-se fazer a hiptese de que a renda familiar mdia de um bairro da cidade seja
igual a R$ 560,00. Escreve-se:
H0 : = R$ 560, 00
H0 (a letra H, maiscula, com a letra o subscrita1 ) o smbolo da hiptese nula, que a hiptese
bsica sobre a renda familiar mdia do bairro2 . Alm da hiptese nula H0 , podemos formular hipteses
alternativas, como, por exemplo:
H1 : 6= R$560, 00, que a hiptese oposta H0

H2 : > R$560, 00
H3 : < R$560, 00
1
Por analogia com a palavra nulo, muitos chamam de h-zero, o que incorreto. A letra o vem
do ingls original, como adotado por Fisher (1935).
2
Hiptese nula no quer dizer que a hiptese no tem valor.
A. F. Beraldo 51
3. Introduo
Hipteses nulas ou alternativas so rejeitadas ou aceitas (melhor dizendo, no rejeitadas). Para

testar esta hiptese, coletamos uma amostra de tamanho n, de famlias deste bairro, e determinamos o in-
tervalo de confiana da mdia da varivel renda familiar: No exemplo acima, quando formulamos a
hiptese nula dada por
H0 : = R$ 560, 00, estamos afirmando que o valor de R$ 560,00 pertence ao intervalo de confiana IC
da mdia populacional , estimada a partir da mdia amostral X, para determinado nvel de significncia
(ou nvel de confiana N C = 1 ).
Por exemplo: suponha que extramos uma amostra de 400 domiclios deste bairro, e calculamos sua
mdia X = R$ 550, 00 e desvio padro s = R$ 180, 00.
O IC da mdia populacional dado por:
s s
n n
Aplicando os valores, o IC da mdia , para um nvel de significncia = 0, 05

(ou 5%), ser:
180, 00 180, 00
550, 00 1, 96 550, 00 + 1, 96
400 400
A margem de erro dada por
180, 00
1, 96 = R$ 17, 60
400
Veja a figura a seguir.
52 A. F. Beraldo
R$ 560
95%
532,4 550 567,6
Figura 3.1: IC da mdia
Na figura 3.1, acima, voc pode notar que o valor de R$ 560,00 cai dentro da faixa R$ 532,40 a R$
567,60, que o intervalo de confiana para a mdia populacional. Como foi visto no Captulo 2, h uma
probabilidade de 95% de que a mdia populacional esteja contida neste intervalo e uma probabilidade
de 5% de que esteja fora deste intervalo.
Assim, no rejeitamos a H0 , ao nvel de confiana de 95%. O que acabamos de fazer foi um

teste de hiptese, ou teste estatstico.
Testes Estatsticos so procedimentos que tem por objetivos:
a) Verificar se uma amostra foi retirada de determinada populao;

b) Verificar se existe diferena significativa entre dois ou mais estados de uma varivel, ou entre
estados de duas ou mais variveis.
Antes de continuarmos com este captulo, necessrio elucidar este conceito: diferena estatstica
significativa. Em Matemtica, as igualdades so exatas, isto , podemos sempre dizer que 5 = 5, e
nunca que 5 = 6. Em Estatstica, como j foi visto na parte de inferncia estatstica, a mdia de uma
populao pode ser qualquer nmero pertencente ao intervalo de confiana deste parmetro. Da que, por
A. F. Beraldo 53
3. Introduo
exemplo, se o intervalo de confiana da mdia de um conjunto de medidas for de 20, 5 2, 3, os valores 20,
21 e 22 pertencem ao intervalo de confiana qualquer um deles poderia ser a mdia real do conjunto.
Veja a figura 3.2.
25
18,2 20,5 22,8
Figura 3.2: Intervalo de Confiana e Diferena Estatstica Significativa
Pertencendo ao mesmo intervalo de confiana, eles so estatisticamente iguais, ou, melhor, dizendo,
no existe diferena estatstica significativa entre eles. Por outro lado, neste mesmo conjunto, o
valor 25 estatisticamente diferente, ou, melhor dizendo, existe uma diferena estatstica significativa
entre o valor 25 e o intervalo de confiana da mdia o valor 25 no pertence ao intervalo de confiana.
54 A. F. Beraldo
Podemos, ento, fixar este conceito:
No existe diferena estatstica significativa entre dois valores de uma varivel se estes pertencem ao
mesmo intervalo de confiana.
Veja os exemplos a seguir:
Se uma varivel aleatria pode evoluir ao longo do tempo; podemos estar interessados se houve
diferena significativa entre os estados inicial e final da varivel (ou seja, medidas desta varivel
tomadas no instante inicial e no instante final do perodo de medio):
Exemplo 3.1. Uma droga, a repaglinida, foi testada no tratamento da diabetes. O nvel glicmico
ps-prandial de um indivduo saudvel de cerca de 120 dg/ml. Supondo que 48 voluntrios com esta
doena foram submetidos ao tratamento de diabetes utilizando a dosagem de 1 mg, dirio, durante um
ms. Antes do tratamento, o nvel glicmico do grupo era de 163 28 dg/ml. Aps o tratamento, a
mdia baixou para 144 dg/ml. O tratamento foi eficaz?
Em outros casos, podemos estar interessados nas medidas desta varivel, tomadas no mesmo instante
porm em locais diferentes:
Exemplo 3.2. A prefeitura est pesquisando as condies de moradia em dois bairros da cidade, bairro
A e bairro B. No bairro A, 74% dos domiclios tem saneamento bsico, com gua e esgoto. No bairro B,
so 85% dos domiclios. Existe diferena estatstica nesta condio, para os domiclios dos dois bairros?
Em situaes mais complexas, podemos estar interessados nas medidas da varivel, tomadas em locais
e tempos diferentes:
Exemplo 3.3. Uma indstria metalrgica tem duas plantas, em cidades distintas, A e B. Determinado
processo de fabricao foi desenvolvido em dois mtodos diferentes, M1 e M2 , e aplicado nas plantas A
e B. A unidade de medida tempo (em minutos) e os resultados foram:
M1 M2
Planta A 12, 3 4, 7 12, 8 5, 4
Planta B 14, 2 2, 5 9, 2 3, 4
Supondo que os dois mtodos foram eficazes, qual combinao Planta-Mtodo a mais eficiente?
Ainda em outro caso, podemos verificar se os valores de uma varivel so iguais para amostras de
categorias diferentes:
Exemplo 3.4. O gerente de uma pizzaria deseja saber se h preferncia pelo sabor de pizza, de acordo
com o sexo e a faixa etria dos clientes de seu estabelecimento. Fez um levantamento dos pedidos dos
ltimos seis meses e verificou que:
A. F. Beraldo 55
3. Introduo
Homens Mulheres
Pizza
Jovem Adulto Jovem Adulto
Presunto / Queijo 28 22 12 23
Quatro queijos 34 30 24 10
Portuguesa 22 17 29 31
Ser que existe esta vinculao entre o sabor da pizza e o atributo sexo/faixa etria dos clientes?
Em qualquer dos casos, existe uma srie de rotinas estatsticas adequadas para estabelecer:
1o Se h diferena estatstica significativa entre os estados.

2o Em caso de haver esta diferena, estabelecer a comparao entre os estados (em
termos de maior ou menor).
3.2 Teoria da Deciso Estatstica

A Deciso Estatstica decorre do que foi visto na seo anterior. Quando foi dito que duas estatsticas
de uma varivel no so diferentes estatisticamente quando pertencerem ao mesmo intervalo de confiana,
temos que dizer que h uma probabilidade dos dois valores no serem diferentes. Esta
probabilidade o nvel de confiana (lembre-se que o nvel de confiana que determina o intervalo
de confiana). Vamos dar um exemplo de como isso, na prtica:
Exemplo 3.5. Foi feita uma pesquisa de inteno de voto para o candidato A, no ms de maio. Naquele
ms, a amostra foi de 400 eleitores e, para um nvel de confiana de 95%, inferiu-se que a inteno de
voto no candidato A era de 38%. A margem de erro da pesquisa foi, portanto,
r r
p(1 p) (0, 38)(0, 62)
zc = 1, 96 = (1, 96)(0, 024) = 0, 048 ou 4, 8%
n 400
Da que a inteno de voto do candidato A deve estar, com uma probabilidade de 95%, entre 33,2% e
42,8%. Continuando este exemplo, imagine agora que, na mesma pesquisa, um outro candidato, B, obteve
34% das intenes de voto. Existe diferena entre estes dois candidatos? A resposta que no existe
diferena, estatisticamente falando, uma vez que a votao do candidato B est dentro do intervalo de
confiana da inteno de voto do candidato A. A diferena matemtica entre as intenes de A, 38%, e
do candidato B, 34%, no estatisticamente significativa, sendo esta variao devida ao acaso3 . Veja a
ilustrao a seguir:
Comentrios:
1. Voc deve estar pensando em termos de certeza: no existe diferena entre os candidatos, e
pronto. No bem assim. Lembre-se que adotamos o nvel de confiana de 95%, e isto quer
3
Este um outro conceito frequentemente adotado para o intervalo de confiana: uma regio
(um intervalo) em que as diferenas das medidas em relao mdia populacional (ou qualquer outro
parmetro) so aleatrias, isto , devidas unicamente ao acaso.
56 A. F. Beraldo
33,2% 38% 42,8%

A
B
29,2% 34,0% 38,8%
Empate Tcnico
Figura 3.3: Empate tcnico de intenes de voto
dizer que estamos 95% confiantes da inexistncia de diferena entre os candidatos. E que existe
uma probabilidade de 5% de que nossas concluses estejam erradas. Isto ser discutido em breve,
nesta parte da Apostila.
2. A situao descrita acima (dois candidatos sem diferena estatstica na inteno de voto) dita de
empate tcnico. No se pode afirmar, neste momento, qual candidato est na frente da corrida
eleitoral.
A. F. Beraldo 57
3. Introduo
A Deciso Estatstica , basicamente, a deciso de rejeitar ou de no rejeitar as hipteses formuladas

sobre medidas de dois ou mais conjuntos. Os procedimentos so:
1. Formula-se a Hiptese Nula H0 , que sempre uma afirmativa de igualdade. Se as medidas dos
conjuntos 1 e 2 so 1 e 2 (veja a figura a seguir), formulamos a hiptese nula H0 : 1 = 2 .
Figura 3.4: Medidas dos conjuntos
2. Podemos formular, em seguida, hipteses alternativas, como, por exemplo:
H1 : 1 > 2
H2 : 1 < 2
3. Estabelecemos o Nvel de Confiana (NC) e o Nvel de Significncia () com que ser realizado
o teste de hipteses.
4. Verificamos se as variveis dos conjuntos so ou no normalmente distribudas. Caso sejam

normalmente distribudas, utilizamos os testes paramtricos. Caso no sejam, utilizamos os
testes no-paramtricos.
Para saber se uma varivel ou no normalmente distribuda, utilizamos o teste de Kolmogorov-

Smirnov. Veja no Captulo de Testes No Paramtricos.
5. Verificamos se h independncia ou no dos conjuntos. Por exemplo, se analisamos a evoluo

das notas de uma turma ao longo do tempo (longitudinal), e so feitas 4 observaes (4 provas), te-
mos que cada aluno i ter uma nota it , em que
t = 1, 2, 3 e 4. Temos a seguinte matriz:
Aluno i1 i2 i3 i4
1 11 12 13 14
2 21 22 23 24
3 31 32 33 34
... ... ... ...
58 A. F. Beraldo
Neste caso, a hiptese formulada ser H0 : 1 = 2 = 3 = 4 , ou seja, as notas dos alunos so

iguais nos tempos 1, 2, 3 e 4. o que se chama de amostras emparelhadas, ou pareadas, ou
dependentes.
No caso de avaliarmos 2 ou mais turmas de alunos, em que as observaes so feitas em apenas
um instante (medida transversal), consideramos as amostras (ou grupo) independentes.
6. Calculamos a estatstica de teste, calc . Cada medida (ou grupo de medidas) a ser testado tem
a sua estatstica de teste, em geral, calculada por uma expresso matemtica que considera a
tendncia central e disperso desta medida, e a distribuio de probabilidades mais adequada para
calcular o seu intervalo de confiana. Vejam o quadro seguinte:
Testes que envolvem... Utilizamos a distribuio...

mdias Normal ou t de Student
propores Normal
varincias Qui-quadrado ou F de Snedecor
frequncias Qui-quadrado
7. Comparamos a estatstica de clculo calc com um valor tabelado da distribuio de probabi-

lidades adotada. Este valor tab , tabelado em funo do nvel de confiana (ou do nvel de
significncia) adotado, e do tamanho da amostra.
8. Neste momento, tomamos a deciso estatstica. Caso acontea que:
tab calc tab
a deciso estatstica de no rejeitar a hiptese de igualdade.
A. F. Beraldo 59
3. Introduo
Caso ocorra o contrrio
calc < tab ou calc > tab
rejeitamos a hiptese de igualdade.

No caso de estarmos realizando um teste unilateral, a H1 rejeitada se
calc > tab ou calc < tab
3.3 Erros Tipo I e Tipo II

Na seo anterior vimos que, estabelecendo o intervalo de confiana de um parmetro, podemos
testar hipteses formuladas sobre este parmetro. Um teste de hiptese sempre leva a uma tomada
de deciso: rejeitar ou no rejeitar as hiptese formuladas, com uma probabilidade associada a esta
deciso.
No exemplo em que H0 : = R$ 560, 00, tomaramos a deciso de rejeitar a hipteses nula se o valor
da mdia populacional fosse maior do que R$ 567,6 ou menor que R$ 532,40.
Ento, caso isto ocorresse, rejeitaramos a hiptese nula de igualdade e teramos, forosamente, que
adotar a hiptese alternativa, H1 : 6= R$ 560, 00. Em outras palavras, pelos dados que dispomos, a
mdia populacional cai fora do intervalo de confiana.
Ento, a Teoria da Deciso Estatstica consiste no estabelecimento das hipteses nulas e alternativas,
e no teste destas hipteses, em determinado nvel de confiana, com as seguintes consideraes:
1o Se a estatstica de teste calc pertence ao IC (zona de aceitao) no rejeitamos a H0 de igualdade.

2o Se a estatstica de teste calc no pertencer ao IC, e sim s zonas de rejeio, rejeitamos a H0 de
igualdade.
E se a deciso que tomamos estiver errada? Por exemplo, se rejeitamos a H0 , e a mdia

populacional verdadeira (real) pertencer ao intervalo de confiana, a probabilidade de que esta
deciso esteja errada dada pelo nvel de significncia .
E se no rejeitarmos a H0 , e a mdia populacional verdadeira (real) no pertencer ao intervalo
de confiana? Estaremos incorrendo num erro oposto, cuja probabilidade dada por . Assim,
podemos incorrer em dois tipos de erro, os Erros Tipo I e Tipo II.
Se uma hiptese for rejeitada quando deveria ter sido aceita, cometemos um erro chamado
Erro Tipo I.
Se, ao contrrio, no rejeitarmos uma hiptese que deveria ter sido rejeitada, cometemos
um Erro Tipo II.
60 A. F. Beraldo
3.3 Erros Tipo I e Tipo II
Zona de Aceitao
95%
Zona de Zona de
Rejeio Rejeio
532,4 550 567,6
Figura 3.5: Critrios de deciso estatstica
Para cada um destes erros calculada uma probabilidade de ocorrncia.
Esquematicamente, temos:
H0 Deciso Erro
H0 verdadeira H0 rejeitada Tipo I
H0 falsa H0 aceita Tipo II
A probabilidade de ocorrncia do erro Tipo I, como vimos, o nvel de significncia , e a

probabilidade do erro Tipo II chamada de , e, de uma forma grosseira, dizemos que pode ser, no
mximo, igual ao nvel de confiana.
O tratamento dos erros Tipo II bem mais complexo. Formulamos vrias hipteses alternativas
para aquilo que supomos que seja o valor real da medida. A cada uma destas hipteses calculamos
uma probabilidade, e, dado um conjunto de valores supostos, e suas probabilidades, traamos uma
Curva Caracterstica de Operao (CCO). Este procedimento, no entanto, escapa do contedo que foi
determinado para esta Apostila. Caso voc queira saber mais sobre Erros Tipo I e II, consulte a Apostila
V Tpicos Especiais em Estatstica.
A. F. Beraldo 61
3. Introduo
3.4 O p-value
Nos ltimos anos, disseminou-se na literatura cientfica, principalmente nas reas da Psicologia e
das Cincias da Sade, e nos pacotes estatsticos como o SPSS e o SAS, a utilizao de uma estatstica
chamada p, ou p-value. O p-value uma probabilidade, ou uma rea sob a curva da distribuio de
probabilidades que est sendo usada no teste de hipteses. Por exemplo, seja a hiptese H0 : = 108
, que estamos testando, com uma amostra de n = 144 elementos, com mdia X = 113 e desvio padro
s = 22. Adotamos o nvel de significncia de 0,05, e a distribuio t de Student para o teste. Calculamos
o intervalo de confiana pela expresso
s s
X tcrit X + tcrit
n n
22 22
113 1, 98 113 + 1, 98
144 144
Portanto, o IC [109,4 116,6], e a H0 : = 108 rejeitada.
Uma outra maneira de testar essa hiptese seria a de calcular uma estatstica
X
tcalc =
s

n
e comparar o valor do tcalc com o valor do tcrit (tabelado). O novo critrio de deciso ser:
Rejeitar a H0 de igualdade se o p-value < .

No rejeitar a H0 de igualdade se o p-value > .
Efetuando os clculos temos:
X 113 108
tcalc = = = 2, 73
s 22

n 144
Na tabela 3.3, para o NC de 95%, o p-value para = 144 1 graus de liberdade, 0,007. Assim,
rejeitamos H0 pois o p-value menor do que (igual a 5%). Veja a figura 3.6 a seguir:
62 A. F. Beraldo
3.4 O p-value
max
/2 /2
p-value
IC
Figura 3.6: Critrios da deciso estatstica (testes bilaterais)
A. F. Beraldo 63
4 Testes de Hipteses Paramtricos
4.1 Testes da Mdia
4.1.1 Mdia Amostral Mdia Populacional
Objetivo
Verificar se uma mdia X calculada sobre uma amostra de tamanho n pertence a uma populao de
mdia :
H0 : X =
Condies
A Populao normalmente, ou aproximadamente normalmente distribuda, com mdia e

varincia desconhecida;
A Amostra foi extrada de forma aleatria, e possui mdia X e o desvio padro s.
Estatstica de Teste
Amostra de qualquer tamanho, e a varincia populacional desconhecida:
X
tcalc = (4.1)
s

n
Onde:
X - mdia amostral s - desvio padro amostral

- mdia populacional n - tamanho da amostra
Os valores de ttab so tabelados, em funo do NC e do tamanho da amostra.
Ateno: A Tabela 2 est em funo de graus de liberdade (). Para este processo, = n 1.
Critrio
A. F. Beraldo 65
4. Testes de Hipteses Paramtricos
O teste bilateral, e aceita-se H0 quando ttab < tcalc < ttab
Exemplo 4.1. A mdia de locaes de DVDs em uma loja de 6,7 locaes/ms. Sorteamos uma
amostra de 15 clientes, e os valores obtidos foram: 7, 4 2, 1 locaes. Pode-se considerar esta amostra
como tpica? (NC = 95%)
H0 : X = ou H0 : 7, 4 = 6, 7
= 6, 7, X = 7, 4, s = 2, 1 locaes.
X
Calculamos tcalc =
s/ n
7, 4 6, 7 0, 7
tcalc = = = 1, 29
2, 1 2, 1

15 3, 87
NC = 95%, e o nmero de graus de liberdade, = n 1 = 15 1 = 14. Consultando a Tabela 3.2,

temos que ttab = 2, 145. Como tcalc < ttab , conclumos que no h diferena estatstica significativa
entre X e , e que no houve diferena estatstica entre os valores da loja e da amostra de clientes. Veja
a figura 4.1.
95%
2,5% 2,5%
-2,145 0 +2,145
tcalc = 1,29
Figura 4.1: Resultados do exemplo 1.1
66 A. F. Beraldo
4.1 Testes da Mdia
4.1.2 Duas mdias, amostras independentes

Varincia populacional conhecida
Objetivo
Verificar se existe diferena entre as mdias populacionais 1 e 2 a partir das mdias amostrais X 1
e X 2.
H0 : 1 = 2
ou
H0 : 1 = 2
Condies
As Populaes so independentes, e normalmente, ou aproximadamente normalmente distribu-

das; e possuem varincias 12 e 22 conhecidas, e estatisticamente iguais (homocedasticidade);
A Amostra foi extrada de forma aleatria, e tem tamanho n > 30.
Estatstica de Teste
X1 X2
zcalc = q (4.2)
12 /n1 + 22 /n2
X 1 - mdia da amostra 1 12 - varincia da amostra 1 n1 - tamanho da amostra 1

X 2 - mdia da amostra 2 2 - varincia da amostra 2 n2 - tamanho da amostra 2
Critrio
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de zcrit dado pelo
nvel de confiana adotado.
A. F. Beraldo 67
Exemplo 4.2. Duas amostras aleatrias de meninos e meninas de 14 anos foram processadas em relao
varivel peso, cujas medidas foram: Meninos (H): 64, 3 4, 7 kg (60); Meninas (M): 56, 8 3, 4 kg (40).
Nota: os desvios padres so populacionais.
Testar a hiptese de que no h diferena entre os pesos das meninas (M) e dos meninos (H).
XH XM 64, 3 56, 8
zcalc = s =s
H0 : X H = X M . H M 4, 72 3, 42
X H = 64, 3 kg, H = 4, 7 kg, nH = 60 + +
nH nM 60 40
X M = 56, 8 kg, M = 3, 4 kg, nM = 40
ztab (NC = 95%) = 1,96
7, 5 7, 5
= = = 9, 25
0, 368 + 0, 289 0, 811
Como zcalc > ztab , rejeitamos a hiptese nula de igualdade, e conclumos que o peso dos meninos so
superiores aos das meninas (em mdia), com a probabilidade de 5% de cometermos um Erro Tipo I. Ver
figura 4.2.
95%
+9,25
-1,96 0 +1,96
Figura 4.2: Resultado do exemplo 1.2
68 A. F. Beraldo
4.1 Testes da Mdia
Varincia populacional desconhecida

Objetivo
Verificar se existe diferena entre as mdias populacionais 1 e 2 a partir das mdias amostrais X 1
e X 2.
H0 : 1 = 2
Condies

das; e possuem varincias 12 e 22 desconhecidas;
A Amostra foi extrada de forma aleatria, e tem tamanho n > 30;
As amostras possuem mdias X 1 e X 2 , varincias s21 e s22 , e tamanhos n1 e n2 , respectivamente.
Estatstica de Teste
X1 X2
tcalc = s (4.3)
s2com n11 + 1
n2
onde
(n1 1)s21 + (n2 1)s22

s2com = (4.4)
n1 + n2 2
X 1 - mdia da amostra 1 scom - desvio padro comum

X 2 - mdia da amostra 2 s2com - varincia comum
n1 - tamanho da amostra 1 s21 - varincia da amostra 1
n2 - tamanho da amostra 2 s22 - varincia da amostra 2
A. F. Beraldo 69
Critrio
O teste bilateral; e aceita-se H0 quando ttab tcalc +ttab , onde o valor de ttab dado pelo
nvel de confiana adotado e o nmero de graus de liberdade , calculado por = n1 + n2 2. Ver a
Tabela 2.
Ao formularmos uma hiptese nula do tipo H0 : 1 = 2 , quando conhecemos as duas mdias (e os

desvios padro respectivos), podemos formular esta hiptese na forma 1 2 = 0. Isto quer dizer que,
estatisticamente, o valor da diferena entre as mdias est contido num intervalo de confiana de 0 (zero)
margem de erro da diferena das mdias1 . Veja o exemplo a seguir:
Exemplo 4.3. Dois grupos de meninas e meninos foram pesados, e os resultados foram os seguintes:
Meninos (H): 62, 7 4, 8 kg (12).
Meninas (M): 59, 2 6, 0 kg (18).
Testar a hiptese de que no h diferena entre os pesos das meninas (M) e dos meninos (H).
H0 : X M = X H
X H = 62, 7 kg, sH = 4, 8 kg, nH = 12
X M = 59, 2 kg, sM = 6, 0 kg, nM = 18
XH XM
tcalc = v !
u
u
ts2 1 1
com +
nH nM
1 1 2
Isto pode ser verificado a partir da expresso 1 = 2 zc ou 1 2 = zc e = zc
70 A. F. Beraldo
4.1 Testes da Mdia
(nH 1)s2H + (nM 1)s2M

s2c =
nH + nM 2
(12 1)4, 82 + (18 1)6, 02

=
12 + 18 2
253, 44 + 612 865, 44

= = = 30, 9
28 28
62, 7 59, 2 3, 5 3, 5
tcalc = q
1 1
= 4, 292 = 2, 072 = 1, 689
30, 9 12 + 18
Na Tabela 2, procuramos o valor de ttab para um NC = 95% e graus de liberdade, em que

= nH + nM 2 = 28: ttab = 2, 048
Portanto, como tcalc < ttab , no rejeitamos a hiptese de igualdade e conclumos no existir diferena
estatstica significativa entre as mdias dos pesos das meninas e dos meninos. Ver figura 4.3, a seguir:
95%
-2,048 0 +2,048
1,689
A. F. Beraldo 71
4.1.3 Amostras emparelhadas

A situao em geral a seguinte: uma amostra aleatria extrada de uma populao. Esta amostra
submetida a aes que tem por objetivo causar modificaes nos elementos amostrais; sobre esta amostra
so feitas ao longo do tempo, observaes para medir estas alteraes. Ao final de um perodo, as
observaes iniciais (antes) so comparadas com as observaes finais (depois). A hiptese nula que
formulada
H0 : incio = final
Por exemplo, seja um grupo de pessoas que fazem uma dieta para emagrecer. Antes de comear a
dieta, cada elemento da amostra tem medido seu IMC (IMC, ndice de massa corporal, a razo entre
o peso, em quilos, e o quadrado de sua estatura, em metros). Esta a situao inicial que pode, por
exemplo, ter calculada sua mdia e desvio padro dos IMCs (X e s1 ). Todo o grupo passa por um
perodo de, por exemplo, trs meses de dieta. Ao final destes meses, novamente medido o IMC de seus
elementos, que, espera-se, tenha diminudo (caso a dieta seja eficaz): mdia X 2 e desvio padro s2 . No
entanto, a H0 formulada que no houve diferena estatstica entre as mdias nos dois instantes:
H0 : X 1 = X 2
E, em seguida, desejvel formular a H1 (hiptese alternativa):
H1 : X 1 < X 2
Ou seja, houve diminuio do IMC do grupo, em mdia.
No exemplo 4.4, a seguir, descrito o processo deste teste. Neste caso, h apenas uma amostra, que
acompanhada ao longo do tempo, mas convencionou-se que so amostras pareadas, ou emparelhadas
(em ingls, paired samples). E, como so os mesmos elementos, diz-se que as amostras no so
independentes.
72 A. F. Beraldo
4.1 Testes da Mdia
Exemplo 4.4. Um grupo de 12 alunos do ensino mdio, com problemas de aprendizagem em Matemtica,
teve aulas de reforo nesta disciplina, ao longo de um ms. As notas individuais, antes e depois das aulas
de reforo esto na tabela seguinte:
Aluno Antes Depois d d2

1 6,2 7,8 1,6 2,56
2 7,3 9,0 1,7 2,89
3 6,4 6,0 -0,4 0,16
4 6,0 6,0 0,0 0,0
5 5,4 7,2 1,8 3,24
6 5,3 7,4 2,1 4,41
7 4,8 8,2 3,4 11,56
8 6,2 5,4 -0,8 0,64
9 5,4 3,0 -2,4 5,76
10 4,3 5,6 1,3 1,69
11 4,0 6,2 2,2 4,84
12 2,8 5,0 2,2 4,84
64,1 76,8 12,7 42,59
Na primeira coluna, o nmero do aluno; na segunda e na terceira colunas, a pontuao antes (inicial)
e depois (final) das aulas de reforo. Na coluna seguinte as diferenas entre a pontuao final e a inicial.
A quinta e ltima coluna contm os quadrados das diferenas. Na linha inferior da tabela, os somatrios
dos valores das quatro colunas.
Notar que h diferenas positivas (alunos que melhoraram suas notas), diferenas negativas (alunos
que pioraram) e uma diferena nula (um aluno que ficou com a mesma nota).
A hiptese nula que no houve melhora estatstica nas notas dos alunos:
H0 : X antes = X depois
A. F. Beraldo 73
Supondo que as notas dos alunos so normalmente distribudas, o processo do teste o seguinte
(adotamos o NC de 95%):
1. Calculamos as estatsticas X antes e X depois
notas/antes 64, 1
X antes = = = 5, 34
12 12
notas/depois 76, 8
X depois = = = 6, 40
12 12
2. Calculamos a mdia das diferenas
d 12, 7
d= = = 1, 058
12 12
3. Calculamos o desvio padro das diferenas
s
2 r
d2 nd 42, 59 12(1, 058)2
sd = =
n1 12 1
r
29, 16
= = 1, 628
11
4. Calculamos tcalc
d 1, 058 1, 058
tcalc = sd = =
1, 628 0, 47

n 12
=2, 251
5. Comparamos tcalc com ttab .

(graus de liberdade) = n 1 = 12 1 = 11
ttab (NC = 95%, = 11) = 2, 201
Como o valor do tcalc maior do que o ttab , rejeitamos a hiptese nula de igualdade, e conclumos
que as aulas de reforo foram eficazes.
74 A. F. Beraldo
4.1 Testes da Mdia
95%
2,5% 2,5%
-2,201 2,201 t
tcalc = 2,155
Figura 4.4: Teste do exemplo 1.4
A. F. Beraldo 75
4.1.4 Anlise da Varincia ANOVA

Nas sees anteriores, estudamos os testes paramtricos de hipteses em que foi verificada a
pertinncia de elementos amostrais em relao populao (amostra populao), e comparadas duas
amostras entre si (amostra1 amostra2 ), em termos de mdia e proporo. A Anlise da Varincia
compara mais de 2 amostras entre si, utilizando os seguintes procedimentos2 :
1. Sejam k amostras distintas, com tamanhos n1 , n2 , n3 , ..., nk . As amostras devem ser aleatrias
e independentes, extradas de populaes normais3 , e devem ter varincias iguais (homocedastici-
dade). Formula-se a hiptese:
H0 : X 1 = X 2 = X 3 = ... = X k
2. Calculamos a mdia das mdias amostrais (X ), e o desvio padro destas mdias (sX ). Sabemos

que sX = s/ n, ento s = sX n, e s2 = ns2X . A varincia s2 um estimador da varincia da
populao de onde foram extradas as amostras. A s2 chamada QME quadrado mdio entre
grupos.
3. Em seguida, calculamos, para cada amostra, sua varincia. Obtemos as varincias s21 , s22 , s23 , ...,
s2k . Depois, calculamos a varincia QMD, que a mdia ponderada das varincias amostrais.
(n1 1)s21 + (n2 1)s22 + (n3 1)s23 + ... + (nk 1)s2k

QM D =
n1 + n2 + n3 + ... + nk k
4. Se a H0 for verdadeira, QME e QMD sero estimadores independentes e no tendenciosos de
2 (varincia populacional). No entanto, se H0 for falsa, QME dever ser maior do que QMD4 .
Ento, se QME = QMD, e tanto QME quanto QMD so positivos, a Anlise da Varincia consiste,
finalmente, em analisar a razo QME/QMD. Quanto mais esta razo se afastar de 1, maior a
probabilidade de rejeitarmos H0 .
A razo QME/QMD uma razo entre duas varincias. Varincias seguem a distribuio do
qui-quadrado, e Fisher estudou esta razo, descrita por uma distribuio de probabilidades que
tomou o nome de F, em sua homenagem.
QM E
Ento, sendo F = QM D , e F tabelado em funo dos graus de liberdade do numerador (k 1) e
dos graus de liberdade do denominador (ni 1), para determinado nvel de confiana, podemos
delimitar as zonas de aceitao e de rejeio da H0 .
Nota: Nesta apostila, estudamos apenas a ANOVA One-Way, Anlise da Varincia com um fator.
Aplicaes mais extensas e aprofundadas sero vistas na Apostila Estatstica V.
Exemplo 4.5. O desenvolvimento de habilidade de montagem de blocos de madeira foi trabalhada em

15 crianas, utilizando trs mtodos diferentes: M1 , M2 e M3 .
2
Os conceitos bsicos da Analysis of Variance (ANOVA) foram formulados por R. A. Fisher (1890 -
1962)
3
Embora o pressuposto de que as amostras tenham a varivel de estudo normalmente distribuda,
verificou-se que mesmo que isto no ocorra, a ANOVA pode ser aplicada, se os conjuntos forem unimodais.
4
As razes tcnicas para isto fogem ao nvel de simplicidade que se prope para esta Apostila. A
ANOVA estudada com maior profundidade na Apostila Estatstica V Tpicos Especiais em Estatstica,
Captulo 3.
76 A. F. Beraldo
4.1 Testes da Mdia
Os resultados esto na tabela a seguir (valores em minutos):
M1 M2 M3
8,0 9,0 8,5
7,5 7,5 6,0
8,0 8,5 6,0
7,0 9,5 6,5
8,5 9,5 7,0
39,0 44,0 34,0
X 7,8 8,8 6,8
primeira vista, o mtodo M3 parece ser o que produz os melhores resultados (montagem dos blocos
num tempo menor). Formulamos a H0 : X 1 = X 2 = X 3 , e adotamos o NC de 95%. Passemos aos
clculos:
1. A mdia global (dos 15 elementos) dada por
X i 7, 8 + 8, 8 + 6, 8
X= = = 7, 8 minutos
3 3
2. O erro padro da mdia X, a partir das 3 mdias amostrais, dado por
s r
(X i X)2 (7, 8 7, 8)2 + (8, 8 7, 8)2 + (6, 8 7, 8)2
sX = =
k1 31
r
02 + 1 + 1
sX = =1
2
QME = ns2X = 5 12 = 5, 0
A. F. Beraldo 77
3. Calculamos a varincia das medidas dos elementos de cada mtodo:
M1 d d2 M2 d d2 M3 d d2
8,0 0,2 0,04 9,0 0,2 0,04 8,5 1,7 2,89
7,5 -0,3 0,09 7,5 -1,3 1,69 6,0 -0,8 0,64
8,0 0,2 0,04 8,5 -0,3 0,09 6,0 -0,8 0,64
7,0 -0,8 0,64 9,5 0,7 0,49 6,5 -0,3 0,09
8,5 0,7 0,49 9,5 0,7 0,49 7,0 0,2 0,04
X = 7, 8 1,30 X = 8, 8 2,80 X = 6, 8 4,3
s21 = 0, 325 s22 = 0, 70 s23 = 1, 075
(n1 1)s21 + (n2 1)s22 + (n3 1)s23

QM D =
n1 + n2 + n3 3
(5 1)0, 325 + (5 1)0, 70 + (5 1)1, 075
QM D =
5+5+53
8, 4
QM D = = 0, 70
12
Ento, com QM E > QM D, testamos a hiptese nula de igualdade, fazendo
QM E 5, 0
Fcalc = = = 7, 14
QM D 0, 7
Consultando a Tabela 5, temos que
Fcrit = Ftab (2, 4, 95%) = 6, 39
Como Fcalc > Fcrit , rejeita-se a hiptese nula de igualdade, concluindo que as diferenas entre as
mdias so estatisticamente significantes.
78 A. F. Beraldo
4.2 Proporo
4.2 Proporo
4.2.1 Proporo Amostral Proporo Populacional
Objetivo
Verificar se a proporo amostral p de um evento E, dada por f E/n estatisticamente igual a uma
proporo populacional
H0 : p =
Condies
A Populao normalmente, ou aproximadamente normalmente distribuda;

A Amostra foi extrada de forma aleatria, e tem tamanho n > 30.
Estatstica de Teste
p
zcalc = v (4.5)
u (1 )
u
t
n
onde:
p - Proporo amostral;
- Proporo populacional;
n - Tamanho da amostra.
Critrio
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de ztab dado pelo
A. F. Beraldo 79
Exemplo 4.6. Em determinado bairro da cidade, sabe-se que a populao de pessoas com ensino
fundamental completo era de 36%, h 10 anos atrs. Extraiu-se uma amostra de 250 pessoas, em que se
verificou que havia 44% com este atributo. Testar a hiptese de que no houve variao neste percentual.
H0 : p = , NC = 95%
= 0, 36, p = 0, 44, n = 250
p 0, 44 0, 36 0, 08
zcalc = s =s = = 2, 6
0, 03
(1 ) 0, 36(1 0, 36)
n 250
Como zcalc > ztab , rejeitamos a hiptese nula de igualdade e conclumos que houve um aumento no
percentual de pessoas com nvel fundamental completo no bairro, com a probabilidade de 5% de que
possamos ter incorrido no Erro Tipo I. Veja a figura 4.5, a seguir:
95%
+2,6
-1,96 0 +1,96
Figura 4.5: Resultados do exemplo
80 A. F. Beraldo
4.2 Proporo
4.2.2 Duas propores amostrais

Objetivo
Verificar se existe diferena estatstica entre as propores populacionais 1 e 2 , a partir das

propores amostrais p1 e p2 .
Condies

das;
As Amostras foram extradas de forma aleatria, e tem tamanho n > 30.
Da mesma forma que o teste de diferena entre mdias, h que se calcular um desvio padro comum
s duas populaes (ou, melhor dizendo, s duas amostras). A diferena entre p1 e p2 , equilibrada por
este desvio padro comum, dever ser menor ou igual ao o z-crtico correspondente ao nvel de confiana
adotado, para que a hiptese nula de igualdade entre as propores no seja rejeitada. A expresso a
seguinte:
p1 p2 p1 p2
zcalc = v =s zc
u comum
1 1
u
u
up(1 p)
+
t n1 n2
onde p1 e p2 so as propores encontradas, e o desvio padro comum dado pela expresso
s
1 1
scomum = p(1 p) +
n1 n2
onde a proporo comum estimada p (uma espcie de mdia ponderada entre as propores) dada
por
p1 n1 + p2 n2
p =
n1 + n2
A. F. Beraldo 81
Estatstica de Teste
p 1 p2 p1 p 2
zcalc = v = (4.6)
scomum
u
u
1 1
p)
u
up(1 +
n1 n2
t
onde
n1 p1 + n2 p2
p = (4.7)
n1 + n2
onde
n1 - tamanho da amostra 1
p1 - proporo na amostra 1
n2 - tamanho da amostra 2
p2 - proporo na amostra 2
p - proporo mdia
Critrio
O teste bilateral; e aceita-se H0 quando ztab zcalc +ztab , onde o valor de zcrit dado pelo
82 A. F. Beraldo
4.2 Proporo
Exemplo 4.7. O prefeito da cidade fez uma pesquisa para saber como anda o conceito de sua
administrao, em dois bairros distintos. No bairro A, foram entrevistadas 120 pessoas, das quais 32%
atriburam ao prefeito o conceito de muito bom. J no bairro B, foram entrevistadas 85 pessoas, com
38% atribuindo o conceito de muito bom. Testar a hiptese de que no existe diferena entre as duas
propores (entre os dois percentuais de muito bom), ao nvel de confiana de 95%.
Aplicando os valores do exemplo, temos:
Estimativa de p:
p1 n1 + p2 n2
p =
n1 + n2
0, 32(120) + 0, 38(85)
=
120 + 85
= 0, 345
Desvio padro comum:
s
1 1
scomum = p(1 p) +
n1 n2
s
1 1
= (0, 345)(0, 655) +
120 85
= 0, 067
Diferena entre propores:
p1 p2
zcalc =
scomum
0, 32 0, 38
=
0, 067
= 0, 89
Foi obtido o valor de zcalc = 0, 89, que est dentro do intervalo de confiana 1, 96 e +1, 96.
Portanto, a hiptese nula de igualdade entre as propores no pode ser rejeitada, ao nvel de confiana
de 95%. Veja a ilustrao abaixo:
Por esta ilustrao, pode-se ver que o valor de z = 0, 89 pertence ao intervalo de confiana da
diferena entre propores.
A. F. Beraldo 83
95%
-0,89
-1,96 0 +1,96
84 A. F. Beraldo
4.3 Varincia
4.3 Varincia
4.3.1 Varincia Amostral Varincia Populacional
Objetivo
Verificar se a varincia amostral s2 calculada sobre uma amostra de tamanho n estatisticamente

igual varincia populacional 2
H0 = s2 = 2
Condies
A Populao normalmente, ou aproximadamente normalmente distribuda;

A Amostra foi extrada de forma aleatria, e possui mdia X e desvio padro s.
Estatstica de Teste
(n 1)s2
2calc = (4.8)
2
onde:
s2 - Varincia amostral;
n - Tamanho da amostra
2 - Varincia populacional;
Critrio
O teste bilateral; e aceita-se H0 quando 2inf 2calc 2sup , onde 2inf e 2sup so valores
tabelados da estatstica qui-quadrado, para um nvel de significncia e o nmero de graus de liberdade
, dado por = n 1. Caso contrrio, rejeita-se H0 e aceita H1 : s2 6= 2 , ao nvel de significncia .
Veja o exemplo a seguir.
A. F. Beraldo 85
Exemplo 4.8. Em uma pesquisa de clima organizacional, para determinada pergunta do questionrio
encontrou-se a varincia de 4,6 pontos2 , no geral da instituio, e 6,7 pontos2 , para o setor de compras
com 28 funcionrios. Ao nvel de confiana de 95%, testar a hiptese que no h diferena entre as duas
varincias.
2 = 4, 6 pontos2
s2 = 6, 7 pontos2
n = 28
(n 1)s2 (28 1)6, 7

2calc = 2
= = 39, 3
4, 6
Na Tabela 3, temos:
= n 1 = 28 1 = 27
x2inf = 14, 6
x2sup = 43, 2
Ento, x2inf < x2calc < x2sup e no rejeitamos a H0 de igualdade entre as varincias amostral e
populacional.
86 A. F. Beraldo
4.3 Varincia
4.3.2 Duas varincias amostrais

Objetivo
Verificar se existe diferena estatstica entre as varincias populacionais 12 e 22 , a partir das varincias
amostrais s21 e s22 .
H0 : s21 = s22
Condies

das;
As Amostras foram extradas de forma aleatria, e tem tamanho n qualquer;
As amostras possuem tamanhos n1 e n2 , respectivamente.
Estatstica de Teste
s22
Fcalc = 2 (4.9)
s1
Critrio
O teste bilateral; e aceita-se H0 quando Fcalc < Ftab , onde o valor de Ftab dado pelo nvel de
confiana adotado.
A. F. Beraldo 87
Exemplo 4.9. Sejam duas amostras A e B, respectivamente, de machos e fmeas de lagartos Eunyalius
Terrificus. As varincias dos comprimentos do corpo e os tamanhos das amostras so, respectivamente,
s2M = 46 cm2 , nM = 20, s2F = 38 cm2 , nF = 15. Teste a H0 de que as varincias so iguais:
A estatstica de clculo :
s22 46
Fcalc = = = 1, 21
s21 38
1 = n1 1 = 20 1 = 19
2 = n2 1 = 15 1 = 14
Na Tabela 5, temos:
Ftab = (19; 14; 0, 05) = 2, 39
Assim, uma vez que Fcalc < Ftab , no rejeitamos a hiptese nula de igualdade entre as duas varincias.
88 A. F. Beraldo
4.4 Testes Unilaterais

At aqui, nos testes estatsticos que utilizamos, procuramos verificar se as medidas das amostras (ou
entre amostras e populao) situavam-se dentro ou fora de um intervalo de confiana. Caso as medidas
pertencessem ao IC, no se rejeitava a H0 , com o risco de cometer-se o Erro Tipo I. A figura seguinte
mostra o teste bilateral:
Zona de Aceitao
NC
Zona de Rejeio

Zcrit
Figura 4.7: Teste unilateral
Entretanto, muitas vezes mais interessante direcionar o teste para verificar se, em caso de rejeitarmos
H0 , esta rejeio se d na zona de rejeio acima ou abaixo da zona de aceitao. Veja a figura seguinte:
Zona de Aceitao
NC
Zona de Rejeio
/2
-Zcrit
Este o teste unicaudal, em que, rejeitada a H0 de igualdade, verifica-se uma das hipteses
alternativas:
A. F. Beraldo 89
H1 : 1 > 2
H2 : 1 < 2
O exemplo seguinte mostra os passos de um teste unicaudal.
Exemplo 4.10. Dois grupos de alunos de Estatstica, curso diurno (D) e noturno (N), fizeram uma
prova, e as notas foram as seguintes:
D: 7, 8 2, 3 (45)
N: 6, 4 1, 2 (38)
O coordenador do curso pensa que a turma N pior, em termos de nota, do que a turma D.
Assim, formulamos duas hipteses:
H0 : X D = X N
H1 : X D > X N
e adotamos o NC de 95%.
O passo seguinte calcular o zcalc :
XD XN 7, 8 6, 4
zcalc = s =s
s2D s2N 2, 32 1, 22
+ +
nD nN 45 38
1, 4 1, 4
= = = 3, 55
0, 118 + 0, 0379 0, 394
Neste ponto, h a diferena entre os testes bicaudal e unicaudal: ao fixar-se o NC de 95%, e, por
consequncia, um NS de 5%, o ztab +1, 645 ( e no 1, 96). Veja a figura a seguir:
90 A. F. Beraldo
95%
5%
Zcrit = 1,645
Zcalc = 3,55
Figura 4.9: Teste unilateral, exemplo 1.10
Assim, no s rejeita-se a H0 de igualdade como no se rejeita a H1 de que X D > X N , uma vez que
zcalc > ztab .
O teste unicaudal s deve ser utilizado quando h constatao (ou informaes anteriores) de que as
diferenas entre amostras seriam estatisticamente significativas. O teste unicaudal menos rigoroso,
como se pode ver na tabela seguinte:
NC NS ztab bicaudal ztab unicaudal

90% 10% 1, 645 1, 28
95% 5% 1, 96 1, 645
99% 1% 2, 58 2, 33
Podemos, tambm, realizar um teste unilateral, em que a zona de rejeio situa-se esquerda (abaixo)
da zona de aceitao. Veja o exemplo seguinte:
A. F. Beraldo 91
Exemplo 4.11. Uma grande siderrgica tinha problemas com horas paradas (perdidas) devido a
acidentes de trabalho. Uma amostra (1) de 50 funcionrios, extrados aleatoriamente, mostrou uma mdia
de 1200 horas, com um desvio padro de 240 horas, no ms de julho. Aps dois meses de treinamento,
e a implantao de normas de segurana mais rgidas, sorteou-se outra amostra (2), desta vez com 40
funcionrios, que teve a mdia de 1000 horas, e desvio padro de 190 horas. Pode-se dizer que a mdia
de horas perdidas realmente ficou menor? (NC = 95%)
Formulamos a H0 : X 1 = X 2 e a H1 : X 1 > X 2 . Como tanto n1 quanto n2 so maiores do que 30,

utilizamos a distribuio normal, e o ztab = 1, 645.
Calculamos o zcalc :
X2 X1 1000 1200
zcalc = s =s
s21 s22 2402 1902
+ +
n1 n2 50 40
200 200
= = = 4, 41
1152 + 902, 5 45, 3
Como zcalc menor do que ztab (4, 41 < 1, 645), rejeitamos a hiptese nula de igualdade e
conclumos que as medidas tomadas foram eficazes em reduzir a mdia de horas paradas. Observe a
figura a seguir:
95%
5%
-1,645 0
-4,4
92 A. F. Beraldo
5 Testes de Hipteses No Paramtricos
Introduo
Os testes no paramtricos so utilizados na impossibilidade de se calcular alguns parmetros das
populaes, ou quando estes parmetros no so caractersticos das populaes a que se referem. Nos
testes no paramtricos, so analisadas outras estatsticas amostrais, tais como as frequncias ou a
colocao em postos. Nos tpicos a seguir, estudaremos alguns destes testes.
5.1 Teste do Qui-Quadrado de Aderncia

O teste do qui-quadrado o principal teste no paramtrico, com larga utilizao nas reas das
Cincias Humanas, Sociais Aplicadas e Biolgicas. Baseia-se no modelo de probabilidades da distribuio
de uma estatstica chamada qui-quadrado, dada pela expresso
2 X (f e f o)2
= (5.1)
fe
onde f e a frequncia esperada para um experimento e f o a frequncia observada na realizao do

experimento.
Seja este experimento o lanamento de uma moeda, com 100 repeties. Teoricamente, esperamos
que ocorram 50 caras e 50 coroas. As frequncias esperadas se dispem como na tabela abaixo:
Categoria fe
Caras 50
Coroas 50
Total 100
A coluna f e das frequncias esperadas. Isto no quer dizer que o resultado do experimento seja
exatamente este, 50 a 50. Na realidade, pode acontecer qualquer nmero de caras ou de coroas, mas
esperamos, se a moeda for honesta, que os resultados reais se aproximem do previsto. Seria algo como
este:
Categoria fe fo
Caras 50 54
Coroas 50 46
Total 100 100
A. F. Beraldo 93
5. Testes de Hipteses No Paramtricos
A coluna f o a das frequncias observadas. Na tabela anterior, os resultados obtidos divergem muito
pouco do esperado, o que no nos leva a duvidar da moeda.
Mas imagine, por exemplo, se os resultados obtidos fossem estes:
Categoria fe fo
Caras 50 23
Coroas 50 77
Total 100 100
claro que, com estes resultados, a moeda no pode ser honesta. As frequncias obtidas diferem
muito do que era esperado. O problema, ento, pode ser formulado da seguinte maneira: at que ponto
podemos considerar que as diferenas, obtidas entre o previsto e o ocorrido em um experimento, ainda
podem ser devidas ao acaso?
O teste do qui-quadrado fornece este nmero, este limite a partir do qual no se pode mais dizer que
as discrepncias entre o previsto e o observado foram devidas ao acaso, e sim que existe uma diferena
estatisticamente significativa entre os dados.
O teste feito da seguinte maneira:
1. Calculamos as diferenas entre as frequncias esperadas e as frequncias observadas;

2. Elevamos ao quadrado estas diferenas;
3. Dividimos o quadrado das diferenas pelas frequncias esperados - estas so as parcelas que iro
formar o qui-quadrado calculado;
4. Somamos estas parcelas, obtendo o qui-quadrado calculado: 2calc ;
5. Calculamos o nmero de graus de liberdade dos dados, pela frmula
=k1 (5.2)
onde k o nmero de categorias e o nmero de graus de liberdade;

6. Comparamos o qui-quadrado calculado com o qui-quadrado tabelado para o nvel de confiana
adotado e o grau de liberdade;
7. Se o qui-quadrado calculado for maior do que o qui-quadrado tabelado, diz-se que existe diferena
estatisticamente significativa entre os dados. Caso contrrio, diz-se que estas diferenas so devidas
apenas ao acaso.
Exemplo 5.1. Foi extrada uma amostra aleatria de 200 alunos de uma universidade, onde foi
pesquisado o atributo sexo dos alunos. Estavam previstos 100 alunos do sexo masculino e 100 alunos do
sexo feminino (pelo clculo das probabilidades). Formulou-se esta hiptese:
H0 : nmero de alunos do sexo masculino = nmero de alunos do sexo feminino.
94 A. F. Beraldo
5.2 Teste do Qui-Quadrado de Associao
Vamos testar esta hiptese ao nvel de confiana de 95%. Os resultados da pesquisa foram os seguintes:
Sexo fe fo
Masculino 100 72
Feminino 100 128
Total 200 200
Calculando as diferenas entre as fe e as fo, e elevando estas diferenas ao quadrado, temos:
Sexo fe fo d d2
Masculino 100 72 28 784
Feminino 100 128 -28 784
Total 200 200
Obtemos as parcelas do qui-quadrado dividindo o quadrado das diferenas pela frequncia esperada:
Sexo fe fo d d2 d2 /f e
Masculino 100 72 28 784 7,84
Feminino 100 128 -28 784 7,84
Total 200 200 15,68
A soma das parcelas, 15,68 o qui-quadrado calculado (2calc = 15, 68)
O nmero de graus de liberdade dado pela relao = k 1, onde k o nmero de categorias.

Neste exemplo, so duas categorias (masculino e feminino), portanto, = 2 1, e = 1.
O qui-quadrado tabelado, 2tab , para 1 grau de liberdade e nvel de confiana de 95% 3,84. Temos,
portanto que 2calc = 15, 68 > 2tab = 3, 84, o que nos faz rejeitar a hiptese nula e dizer que as diferenas
encontradas so significativas - o nmero de alunos do sexo masculino inferior ao de alunos do sexo
feminino.

Outra aplicao da distribuio do qui-quadrado so os chamados testes de correlao (ou indepen-
dncia). Seja a seguinte tabela, resultado de uma pesquisa feita com 310 clientes de uma locadora de
fitas de vdeo, para verificar qual categoria de filmes so os preferidos:
Categorias de filme Homens Mulheres Totais

Romance 32 49 81
Aventuras Policiais 64 36 100
Terror 18 23 41
Comdias 30 30 60
Ertico 16 12 28
Totais 160 150 310
A. F. Beraldo 95
Esta tabela lida da seguinte maneira:
Foram entrevistados 160 homens e 150 mulheres. A categoria preferida, em geral, foi a de fitas
de Aventuras Policiais, com 100 citaes; em segundo lugar ficou a categoria Romance, preferida das
mulheres. Em terceiro, ficaram as Comdias, preferidas igualmente por homens e mulheres.
Note que a preferncia masculina difere da feminina em alguns casos; existem empates e inverses.
A pergunta que se faz : as diferenas entre homens e mulheres, na preferncia de tipos de filmes,
so estatisticamente significativas? Em outras palavras, o fato de um cliente ser de determinado sexo
direciona sua preferncia, ou as categorias de filmes so escolhidas independentemente do atributo
sexo? Ou, ainda, se uma categoria de filme escolhida, pode-se prever qual o sexo de quem escolheu?
O teste de independncia, utilizando a distribuio do qui-quadrado, responde a estas (e outras)

perguntas. Parte-se, sempre, da hiptese nula de que no existe correlao (dependncia) entre
atributos (sexo dos clientes, no exemplo acima) e categorias (tipos de filmes), a determinado nvel de
confiana, por exemplo, 95%...
Voltando tabela acima, aprenda alguns novos conceitos, necessrios para prosseguirmos neste
estudo:
A tabela contm clulas preenchidas com as frequncias observadas. A soma das frequncias de cada
uma das linhas chamada frequncia marginal da linha. A soma das frequncias de cada coluna
chamada de frequncia marginal da coluna. A soma das frequncias marginais de linha (ou das
somas marginais de coluna) chamada de frequncia total, ou tamanho da amostra. Veja abaixo:

Romance 32 49 81
Terror 18 23 41
Comdias 30 30 60
Ertico 16 12 28
Totais 160 150 310
As clulas mais escuras, com os valores em negrito, so as frequncias marginais. O valor 310 o
tamanho da amostra, ou frequncia total.
A tabela acima a das frequncias observadas (f o). Para aplicar o teste do qui-quadrado,
necessitamos das frequncias esperadas (f e). As frequncias esperadas so calculadas da seguinte maneira:
96 A. F. Beraldo
1. Repetimos a estrutura da tabela das frequncias observadas, com as frequncias marginais e a

frequncia total, mas sem os valores das frequncias:

Romance 81
Aventuras Policiais 100
Terror 41
Comdias 60
Ertico 28
Totais 160 150 310
2. As clulas sero preenchidas utilizando a expresso:
frequncia da linha da clula frequncia marginal da coluna da clula

fe =
frequncia total
16081
Por exemplo, a frequncia esperada da clula Homens|Romance o resultado de f e = 310 = 42
(note que arredondamos os valores para a casa dos inteiros1 ).

Romance 42 81
Terror 41
Comdias 60
Ertico 28
Totais 160 150 310
Calculando o valor da frequncia esperada para a combinao Mulheres/Terror, teremos:
150 41
fe = = 20
310
Romance 42 81
Terror 20 41
Comdias 60
Ertico 28
Totais 160 150 310
Procedendo de maneira anloga para as demais clulas, obtemos os valores restantes das frequncias
esperadas:

Romance 42 39 81
Terror 21 20 41
Comdias 31 29 60
Ertico 14 14 28
Totais 160 150 310
1
Se voc desejar mais preciso nos clculos, pode utilizar quantas casas quiser. Procuramos facilitar
os clculos, nos exemplos.
A. F. Beraldo 97
Agora j podemos montar a planilha de clculo do qui-quadrado (2calc ):
Atributo Categoria fo fe
Romance 32 42
Aventuras Policiais 64 52
Homens Terror 18 21
Comdias 30 31
Ertico 16 14
Romance 49 39
Aventuras Policiais 36 48
Mulheres Terror 23 20
Comdias 30 29
Ertico 12 14
Na planilha, efetuamos os clculos restantes:
Atributo Categoria fo fe d d2 d2 /f e
Romance 32 42 10 100 2,381
Aventuras Policiais 64 52 -12 144 2,769
Homens Terror 18 21 3 9 0,429
Comdias 30 31 1 1 0,032
Ertico 16 14 -2 4 0,286
Romance 49 39 -10 100 2,564
Aventuras Policias 36 48 12 144 3,000
Mulheres Terror 23 20 -3 9 0,450
Comdias 30 29 -1 1 0,034
Ertico 12 14 2 1 0,286
2calc =
P
0 12,231
Obtemos o 2calc = 12, 23 (soma das parcelas d2 /f e)
Para obter o valor do qui-quadrado tabelado, precisamos saber o nmero de graus de liberdade ().
Para este tipo de teste, o nmero de graus de liberdade dado por
= (colunas 1)(linhas 1) (5.3)
Portanto, temos = (2 1)(5 1) = 4 graus de liberdade. Da tabela do qui-quadrado, vem:
2tab (0, 95; = 4) = 9, 49
98 A. F. Beraldo
5.3 Teste dos sinais
Ento, j que 2calc > 2tab , rejeitamos a hiptese de independncia, e admitimos, com 95%
de confiana, que as preferncias por tipo de filmes tm relao com o atributo sexo dos
clientes da locadora.
Comentrios:
No clculo das frequncias esperadas, no necessrio calcular as frequncias de todas as clulas.

Basta calcular para um nmero de clulas igual ao grau de liberdade do teste, e calcular as clulas
restantes por subtrao das frequncias marginais de linhas e colunas.
5.3 Teste dos sinais

utilizado para anlise de dados emparelhados (o mesmo indivduo submetido a duas medidas).
aplicado em situaes em que o pesquisador deseja determinar se duas condies so diferentes.
A varivel de estudo poder ser intervalar ou ordinal. O nome teste dos sinais se deve ao fato de se
utilizar em sinais mais e menos em lugar dos dados numricos. Assim, se houve alterao para maior,
usa-se (+), se para menor, (). No havendo alterao, atribui-se (0). Para o teste desconsideram-se os
casos de empate, ou seja, os pares em que foram atribudos zeros.
A lgica do teste que as condies podem ser consideradas iguais quando as quantidades de (+)
e () forem aproximadamente iguais. Isto , a proporo de sinais (+) equivale a 50%, ou seja: p = 0, 5.
Procedimento:
1. H0 : no h diferena entre os grupos, ou seja: p=0,5.

H1 : h diferena entre os grupos:
2. Utilizar o N C = 95%. Escolher a distribuio normal se n > 25;

3. Com auxlio da tabela, determinam-se RA e RC (para n > 25), caso n < 25 utiliza-se a distribuio
Binomial.
4. Clculo da estatstica de teste:
y np
zcalc = (5.4)
npq
Onde:
y = nmero de sinais (+)
n = tamanho da amostra descontados os empates
p = 0, 5
q = 1 p = 0, 5
5. Concluses:
Se
ztab zcalc ztab
A. F. Beraldo 99
, no se pode rejeitar H0 .
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo-se, com risco , que h diferena entre
os dois grupos, ou duas condies.
Exemplo 5.2. Seja um grupo de 40 pessoas que esto tendo aulas de direo com a finalidade de serem
aprovados no exame para habilitao de motorista. O curso realizou 2 avaliaes, ao final dos meses de
abril e njunho. Os resultados foram os seguintes:
Alunos que... f
Melhoraram a pontuao 28
Tiveram a mesma pontuao 4
Pioraram a pontuao 8
P
40
Testamos, ao nvel de confiana de 95%, se houve melhoria no aprendizado dos alunos. Os passos so
os seguintes:
1. Formulamos a H0 de que no houve alterao:
H0 : p = 0, 5
2. Calculamos zcalc , pela expresso:
y np
zcalc =
npq
3. Onde:
y = nmero de sinais (+), ou seja, nmero de pessoas que melhoraram a nota, y = 28.
n = 36 nmero de pessoas, no considerando os empates, ou seja, a mesma pontuao, n = 404 =
36.
p = q = 0, 5 pela hiptese de igualdade
28 36 0, 5 28 18
zcalc = = = 3, 3
36 0, 5 0, 5 9
4. ztab = 1, 96 (teste bilateral)
ztab = 1, 645 (teste unilateral)
Como zcalc > ztab , em qualquer caso, rejeitamos a hiptese nula de igualdade, e conclumos
que as pessoas realmente melhoraram o aprendizado.
5.4 Teste de Wilcoxon

Este teste, alm de verificar o sinal das diferenas, tambm considera seus valores. equivalente ao
teste paramtrico de amostras emparelhadas.
Procedimento:
100 A. F. Beraldo
5.5 Teste de Mann-Whitney
Antes de enunciar as hipteses, preciso:
a) Determinar, para cada par de observaes, a diferena (di) entre as duas medidas;
b) Atribuir postos (colocar em ordem crescente) a todos os dis, desconsiderando-se os sinais. No caso
de empate, atribuir a mdia dos postos empatados;
c) Identificar cada posto pelo sinal (+) ou () do di que ele representa;
d) Determinar a menor das somas de postos de mesmo sinal, representada por T ;
e) Abater no n o nmero de zeros, isto , di = 0.
Eis o teste:
1. H0 : No h diferena estatstica entre os grupos;
2. A estatstica de comparao ztab . Se n 25 h uma tabela especfica, binomial;
3. Clculo do valor da estatstica de teste zcalc :
T T
zcalc = (5.5)
T
Onde:
T = menor das somas de postos dos desvios de mesmo sinal;
n(n + 1)
T =
4
r
n(n + 1)(2n + 1)
T =
24
4. Concluso:
Se ztab zcalc ztab , a H0 no rejeitada;
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo-se, que h diferena entre os dois grupos.
5.5 Teste de Mann-Whitney

usado para testar se duas amostras independentes foram retiradas de populaes com mdias iguais.
Trata-se de uma interessante alternativa ao teste paramtrico, para igualdade de mdias, pois o teste
Mann-Witney no exige nenhuma considerao sobre as distribuies populacionais e suas varincias.
Como foi visto, o teste paramtrico para igualdade de mdias exige populaes com distribuies normais
de mesma varincia. Este teste poder ser aplicado para variveis intervalares ou ordinais.
Procedimento:
a) Considerar n1 = nmero de casos do grupo com menor quantidade de observaes e n2 = nmero de
casos do maior grupo.
A. F. Beraldo 101
b) Considere todos os dados dos dois grupos e coloque-os em ordem crescente. Atribua primeiro ao
escore que algebricamente for menor e prossiga at N = n1 + n2 . s informaes empatadas,
atribuir a mdia dos postos correspondentes.
c) Calcular:
R1 = soma dos postos do grupo n1
R2 = soma dos postos do grupo n2
d) Escolher a menor soma entre R1 e R2 .
e) Calcular as estatsticas:
n1 (n1 + 1) n2 (n2 + 1)
1 = n1 n2 + R1 2 = n1 n2 + R2 (5.6)
2 2
Teste:
1. H0 : no h diferena entre os grupos

H1 : H diferena
Para n1 , n2 < 10 h tabela prpia;
2. Fixar . Escolher a varivel N(0,1);
3. Com auxlio da tabela N(0,1) determinam-se RA e RC;
4. Clculo do valor da varivel.
(u)
zcalc = (5.7)
(u)
Onde: r
n1 n2 n1 n2 (n1 + n2 + 1)
(u) = (u) =
2 12
5. Concluso:
Se ztab zcalc ztab , no se pode rejeitar H0 .
Se ztab > zcalc ou ztab < zcalc , rejeita-se H0 , concluindo, com risco , que h diferena entre os
grupos.
5.6 Teste Kruskal-Wallis

Trata-se de teste extremamente til para decidir se K amostras (K > 2) independentes provm de
populaes com mdias iguais. Poder ser aplicado para variveis intervalares ou ordinais.
Procedimento
a) Dispor, em ordem crescente, as observaes de todos os K grupos, atribuindo-lhes postos de 1 a n.

Caso haja empates, atribuir o posto mdio.
102 A. F. Beraldo
b) Determinar o valor da soma dos postos para cada um dos K grupos: Ri ,

i = 1, 2, . . . , K.
c) Realizar o teste:
1. H0 : As mdias so iguais.
H1 : H pelo menos um par diferente.
2. Fixar . Escolher uma varivel qui-quadrado com = K 1.
3. Com auxlio da tabela qui-quadrado, determinan-se RA e RC.
4. Calcula-se a estatstica:
K
X (Ri )2
12
H= 3(n + 1) (5.8)
n(n + 1) i=1 ni
5. Concluso:
Se H < 2sup , no se pode rejeitar H0 .
Se H > 2sup , rejeita-se H0 concluindo-se com risco que h diferena entre as mdias dos
K grupos.
A. F. Beraldo 103
Parte III
Tabelas
A. F. Beraldo 105
Tabela 1 - reas sob a Curva Normal Padronizada,
entre 0 e z
z 1 2
e 2 z
Z
P (0 < x < z) =
0 2
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
A. F. Beraldo 107
Tabela 2 -Valores dos percentis da Distribuio t de
Student
0,1 0,05 0,01 0,1 0,05 0,01 0,1 0,05 0,01

1 6,3140 12,7060 63,6570 41 1,6830 2,0200 2,7010 81 1,6640 1,9900 2,6380
2 2,9200 4,3030 9,9250 42 1,6820 2,0180 2,6980 82 1,6640 1,9890 2,6370
3 2,3530 3,1820 5,8410 43 1,6810 2,0170 2,6950 83 1,6630 1,9890 2,6360
4 2,1320 2,7760 4,6040 44 1,6800 2,0150 2,6920 84 1,6630 1,9890 2,6360
5 2,0150 2,5710 4,0320 45 1,6790 2,0140 2,6900 85 1,6630 1,9880 2,6350
6 1,9430 2,4470 3,7070 46 1,6790 2,0130 2,6870 86 1,6630 1,9880 2,6340
7 1,8950 2,3650 3,4990 47 1,6780 2,0120 2,6850 87 1,6630 1,9880 2,6340
8 1,8600 2,3060 3,3550 48 1,6770 2,0110 2,6820 88 1,6620 1,9870 2,6330
9 1,8330 2,2620 3,2500 49 1,6770 2,0100 2,6800 89 1,6620 1,9870 2,6320
10 1,8120 2,2280 3,1690 50 1,6760 2,0090 2,6780 90 1,6620 1,9870 2,6320
11 1,7960 2,2010 3,1060 51 1,6750 2,0080 2,6760 91 1,6620 1,9860 2,6310
12 1,7820 2,1790 3,0550 52 1,6750 2,0070 2,6740 92 1,6620 1,9860 2,6300
13 1,7710 2,1600 3,0120 53 1,6740 2,0060 2,6720 93 1,6610 1,9860 2,6300
14 1,7610 2,1450 2,9770 54 1,6740 2,0050 2,6700 94 1,6610 1,9860 2,6290
15 1,7530 2,1310 2,9470 55 1,6730 2,0040 2,6680 95 1,6610 1,9850 2,6290
16 1,7460 2,1200 2,9210 56 1,6730 2,0030 2,6670 96 1,6610 1,9850 2,6280
17 1,7400 2,1100 2,8980 57 1,6720 2,0020 2,6650 97 1,6610 1,9850 2,6270
18 1,7340 2,1010 2,8780 58 1,6720 2,0020 2,6630 98 1,6610 1,9840 2,6270
19 1,7290 2,0930 2,8610 59 1,6710 2,0010 2,6620 99 1,6600 1,9840 2,6260
20 1,7250 2,0860 2,8450 60 1,6710 2,0000 2,6600 100 1,6600 1,9840 2,6260
21 1,7210 2,0800 2,8310 61 1,6700 2,0000 2,6590 100 1,6590 1,9820 2,6210
22 1,7170 2,0740 2,8190 62 1,6700 1,9990 2,6570 120 1,6580 1,9800 2,6170
23 1,7140 2,0690 2,8070 63 1,6690 1,9980 2,6560 130 1,6570 1,9780 2,6140
24 1,7110 2,0640 2,7970 64 1,6690 1,9980 2,6550 140 1,6560 1,9770 2,6110
25 1,7080 2,0600 2,7870 65 1,6690 1,9970 2,6540 150 1,6550 1,9760 2,6090
26 1,7060 2,0560 2,7790 66 1,6680 1,9970 2,6520 160 1,6540 1,9750 2,6070
27 1,7030 2,0520 2,7710 67 1,6680 1,9960 2,6510 180 1,6530 1,9730 2,6030
28 1,7010 2,0480 2,7630 68 1,6680 1,9950 2,6500 200 1,6530 1,9720 2,6010
29 1,6990 2,0450 2,7560 69 1,6670 1,9950 2,6490 240 1,6510 1,9700 2,5960
30 1,6970 2,0420 2,7500 70 1,6670 1,9940 2,6480 260 1,6510 1,9690 2,5950
31 1,6960 2,0400 2,7440 71 1,6670 1,9940 2,6470 280 1,6500 1,9680 2,5940
32 1,6940 2,0370 2,7380 72 1,6660 1,9930 2,6460 300 1,6500 1,9680 2,5920
33 1,6920 2,0350 2,7330 73 1,6660 1,9930 2,6450 350 1,6490 1,9670 2,5900
34 1,6910 2,0320 2,7280 74 1,6660 1,9930 2,6440 400 1,6490 1,9660 2,5880
35 1,6900 2,0300 2,7240 75 1,6650 1,9920 2,6430 450 1,6480 1,9650 2,5870
36 1,6880 2,0280 2,7190 76 1,6650 1,9920 2,6420 500 1,6480 1,9650 2,5860
37 1,6870 2,0260 2,7150 77 1,6650 1,9910 2,6410 600 1,6470 1,9640 2,5840
38 1,6860 2,0240 2,7120 78 1,6650 1,9910 2,6400 700 1,6470 1,9630 2,5830
39 1,6850 2,0230 2,7080 79 1,6640 1,9900 2,6400 800 1,6470 1,9630 2,5820
40 1,6840 2,0210 2,7040 80 1,6640 1,9900 2,6390 1000 1,6460 1,9620 2,5810
108 A. F. Beraldo
Tabela 3 -Distribuio do Qui-Quadrado para Testes
de Hiptese (Teste de Unilaterais)
1 0,01 0,025 0,05 0,1 0,9 0,95 0,975 0,99

/ 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01
1 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635
2 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210
3 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345
4 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277
5 0,554 0,831 1,145 1,610 9,236 11,070 12,833 15,086
6 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812
7 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475
8 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090
9 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666
10 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209
11 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725
12 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217
13 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688
14 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141
15 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578
16 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000
17 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409
18 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805
19 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191
20 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566
21 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932
22 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289
23 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638
24 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980
25 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314
26 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642
27 12,879 14,573 16,151 18,114 36,741 40,113 43,195 46,963
28 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278
29 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588
30 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892
Para < 30, use:
1h p i2
2x = z + 2 1
2
A. F. Beraldo 109
Tabela 4 - Valores do Qui-Quadrado para os NCs
mais comuns
90% 95% 99%

gl 2inf 2sup 2inf 2inf 2inf 2sup
1 0,0039 3,8415 0,0010 5,0239 0,0000 7,8794
2 0,1026 5,9915 0,0506 7,3778 0,0100 10,5966
3 0,3518 7,8147 0,2158 9,3484 0,0717 12,8382
4 0,7107 9,4877 0,4844 11,1433 0,2070 14,8603
5 1,1455 11,0705 0,8312 12,8325 0,4117 16,7496
6 1,6354 12,5916 1,2373 14,4494 0,6757 18,5476
7 2,1673 14,0671 1,6899 16,0128 0,9893 20,2777
8 2,7326 15,5073 2,1797 17,5345 1,3444 21,9550
9 3,3251 16,9190 2,7004 19,0228 1,7349 23,5894
10 3,9403 18,3070 3,2470 20,4832 2,1559 25,1882
11 4,5748 19,6751 3,8157 21,9200 2,6032 26,7568
12 5,2260 21,0261 4,4038 23,3367 3,0738 28,2995
13 5,8919 22,3620 5,0088 24,7356 3,5650 29,8195
14 6,5706 23,6848 5,6287 26,1189 4,0747 31,3193
15 7,2609 24,9958 6,2621 27,4884 4,6009 32,8013
16 7,9616 26,2962 6,9077 28,8454 5,1422 34,2672
17 8,6718 27,5871 7,5642 30,1910 5,6972 35,7185
18 9,3905 28,8693 8,2307 31,5264 6,2648 37,1565
19 10,1170 30,1435 8,9065 32,8523 6,8440 38,5823
20 10,8508 31,4104 9,5908 34,1696 7,4338 39,9968
21 11,5913 32,6706 10,2829 35,4789 8,0337 41,4011
22 12,3380 33,9244 10,9823 36,7807 8,6427 42,7957
23 13,0905 35,1725 11,6886 38,0756 9,2604 44,1813
24 13,8484 36,4150 12,4012 39,3641 9,8862 45,5585
25 14,6114 37,6525 13,1197 40,6465 10,5197 46,9279
26 15,3792 38,8851 13,8439 41,9232 11,1602 48,2899
27 16,1514 40,1133 14,5734 43,1945 11,8076 49,6449
28 16,9279 41,3371 15,3079 44,4608 12,4613 50,9934
29 17,7084 42,5570 16,0471 45,7223 13,1211 52,3356
30 18,4927 43,7730 16,7908 46,9792 13,7867 53,6720
110 A. F. Beraldo
GD\GN 1 2 3 4 5 6 7 8 9 10 15 20 25 30 35
1 161,448 18,513 10,128 7,709 6,608 5,987 5,591 5,318 5,117 4,965 4,543 4,351 4,242 4,171 4,121
A. F. Beraldo
2 199,500 19,000 9,552 6,944 5,786 5,143 4,737 4,459 4,256 4,103 3,682 3,493 3,385 3,316 3,267
3 215,707 19,164 9,277 6,591 5,409 4,757 4,347 4,066 3,863 3,708 3,287 3,098 2,991 2,922 2,874
4 224,583 19,247 9,117 6,388 5,192 4,534 4,120 3,838 3,633 3,478 3,056 2,866 2,759 2,690 2,641
5 230,162 19,296 9,013 6,256 5,050 4,387 3,972 3,687 3,482 3,326 2,901 2,711 2,603 2,534 2,485
6 233,986 19,330 8,941 6,163 4,950 4,284 3,866 3,581 3,374 3,217 2,790 2,599 2,490 2,421 2,372
7 236,768 19,353 8,887 6,094 4,876 4,207 3,787 3,500 3,293 3,135 2,707 2,514 2,405 2,334 2,285
8 238,883 19,371 8,845 6,041 4,818 4,147 3,726 3,438 3,230 3,072 2,641 2,447 2,337 2,266 2,217
9 240,543 19,385 8,812 5,999 4,772 4,099 3,677 3,388 3,179 3,020 2,588 2,393 2,282 2,211 2,161
10 241,882 19,396 8,786 5,964 4,735 4,060 3,637 3,347 3,137 2,978 2,544 2,348 2,236 2,165 2,114
11 242,983 19,405 8,763 5,936 4,704 4,027 3,603 3,313 3,102 2,943 2,507 2,310 2,198 2,126 2,075
5% na cauda superior
12 243,906 19,413 8,745 5,912 4,678 4,000 3,575 3,284 3,073 2,913 2,475 2,278 2,165 2,092 2,041
13 244,690 19,419 8,729 5,891 4,655 3,976 3,550 3,259 3,048 2,887 2,448 2,250 2,136 2,063 2,012
14 245,364 19,424 8,715 5,873 4,636 3,956 3,529 3,237 3,025 2,865 2,424 2,225 2,111 2,037 1,986
15 245,950 19,429 8,703 5,858 4,619 3,938 3,511 3,218 3,006 2,845 2,403 2,203 2,089 2,015 1,963
16 246,464 19,433 8,692 5,844 4,604 3,922 3,494 3,202 2,989 2,828 2,385 2,184 2,069 1,995 1,942
17 246,918 19,437 8,683 5,832 4,590 3,908 3,480 3,187 2,974 2,812 2,368 2,167 2,051 1,976 1,924
18 247,323 19,440 8,675 5,821 4,579 3,896 3,467 3,173 2,960 2,798 2,353 2,151 2,035 1,960 1,907
19 247,686 19,443 8,667 5,811 4,568 3,884 3,455 3,161 2,948 2,785 2,340 2,137 2,021 1,945 1,892
20 248,013 19,446 8,660 5,803 4,558 3,874 3,445 3,150 2,936 2,774 2,328 2,124 2,007 1,932 1,878
30 250,095 19,462 8,617 5,746 4,496 3,808 3,376 3,079 2,864 2,700 2,247 2,039 1,919 1,841 1,786
40 251,143 19,471 8,594 5,717 4,464 3,774 3,340 3,043 2,826 2,661 2,204 1,994 1,872 1,792 1,735
50 251,774 19,476 8,581 5,699 4,444 3,754 3,319 3,020 2,803 2,637 2,178 1,966 1,842 1,761 1,703
60 252,196 19,479 8,572 5,688 4,431 3,740 3,304 3,005 2,787 2,621 2,160 1,946 1,822 1,740 1,681
70 252,497 19,481 8,566 5,679 4,422 3,730 3,294 2,994 2,776 2,610 2,147 1,932 1,807 1,724 1,665
100 253,041 19,486 8,554 5,664 4,405 3,712 3,275 2,975 2,756 2,588 2,123 1,907 1,779 1,695 1,635
150 253,465 19,489 8,545 5,652 4,392 3,698 3,260 2,959 2,739 2,572 2,105 1,886 1,757 1,672 1,610
GD - Graus do denominador, na coluna
GN - Graus do numerador, na linha
Tabela 5: Distribuiao F de Snedecor para rea de
111
Diagramao em LATEX, composta em Latin Modern.
Verso 3 2014
Gerado em 11 de fevereiro de 2014.

Apostila de Amostragem, Inferencia e Testes

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apostila de Amostragem, Inferencia e Testes

Uploaded by

Copyright:

Available Formats

Antonio F.

Verso provisria 3 2014

Em cada captulo das Apostilas procuramos sintetizar os contedos, em textos breves

Outros materiais didticos, referenciados no corpo das Apostilas, esto disponveis

Em destaque, agradeo ao estmulo do Prof. Lourival Batista de Olivrira Jr., da

Este trabalho dedicado, in memoriam, a

Et, des pieds jusques la tte,

Charles Baudelaire, Les Fleurs du Mal.

II Teoria da Deciso Estatstica 49

3.3 Erros Tipo I e Tipo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4 Testes de Hipteses Paramtricos 65

5 Testes de Hipteses No Paramtricos 93

Figura 1.1: O conjunto Universo

Explicando: imagine o conjunto de moradores do Bairro B: so muitas famlias, muitas

Figura 1.2: O conjunto Universo

para uma discusso mais pormenorizada, veja a Apostila IV - Metodologia de Pesquisa

A varivel que estudamos a inteno de voto, Xi , ou seja, cada morador i do

Figura 1.3: Elementos do conjunto Universo e Varivel

As variveis de um conjunto Universo (e o prprio conjunto Universo) so descritas por

Os parmetros so, no incio de nossa pesquisa, desconhecidos. Assim, no conhe-

Um conjunto Universo suposto de tamanho infinito, ou finito inumervel, ou

Censo, ou recenseamento o processo de coleta de dados em que, teoricamente, todo

Alm do Censo Demogrfico, citamos o Censo Escolar, o Censo Industrial, o Censo

1.1 O Mtodo Estatstico

2. Em seguida, alguns elementos do Universo so sorteados para compor um subcon-

Figura 1.5: Amostragem

3. A amostra, assim constituda, processada estatisticamente, ou seja, so calculadas

Figura 1.6: Clculo de Estatsticas

Calculando as estatsticas, temos todas as informaes sobre a Amostra. J uma

Parmetro = Estatstica margem de erro (1.1)

Esta relao decorre de duas postulaes fundamentais do Clculo de Probabilidades:

Um parmetro (medida do Universo) pertence ao intervalo dado pela estatstica

Desta forma, por exemplo, temos:

= Mdia do Universo (mdia populacional)

X = Mdia da Amostra (mdia amostral)

X = Margem de Erro da Mdia amostral

De maneira mais adequada e completa, dizemos que h uma probabilidade NC de que

NC chamado Nvel de Confiana.

Exemplificando: seja a tabela 1.1 a seguir, referente a distribuio de frequncias das

O histograma desta distribuio o seguinte:

Figura 1.7: Histograma para a distribuio de idades

Calculamos a mdia X = 52, 2 anos e o desvio-padro s = 19, 1 anos. Ento, se esta

inf = S = 52, 2 19, 1 = 33, 1

sup = + S = 52, 2 + 19, 1 = 71, 3

33, 1 anos 71, 3 anos

Voltando ao Intervalo de Confiana e ao Nvel de Confiana, utilizando as frequncias

P ( [33, 1 71, 3]) = 63, 2%

Sobre o Mtodo Estatstico, voc deve ter em mente que:

Um parmetro no um nmero definido nico, e sim um valor dentro de um

Parmetros (que descrevem o Universo) e estatsticas (que descrevem a Amostra)

Medidas Estatsticas Parmetros

Portanto, h uma correspondncia entre as medidas amostrais (estatsticas) e

Parmetro = Estatstica margem de erro

A margem de erro pode ser interpretada como a diferena existente entre as

Estas caractersticas da margem de erro sero detalhadas nos tpicos seguintes.

Em linhas gerais, uma amostra extrada aleatoriamente de uma populao. Cal-

Nas sees seguintes estudaremos os estimadores, em detalhe.

1.2 Distribuies Amostrais

1. Suponha que estejamos analisando o comportamento da varivel aleatria X. O

2. Imagine que retiremos deste conjunto um bom nmero de amostras, ou mesmo,

3. Para cada amostra retirada, podemos calcular um conjunto de estatsticas (mdia,

4. Ao analisarmos os valores destas estatsticas, podemos montar distribuies amos-

5. Para estas distribuies amostrais de estatsticas, podemos calcular seus parmetros

No cabe aqui teorizar se o conjunto universo finito ou infinito. Na realidade,