You are on page 1of 24

Universidade de Caxias do Sul

Centro de Cincias Exatas e Tecnologia

Probabilidade e EstatsticA
EST0227
Material organizado pelas professoras:
Ivanete Rocha de Miranda.

Amostragem Distribuies
Amostrais Mtodos Inferenciais

Prof Ivanete Rocha de Miranda


2016

NDICE
1. AMOSTRAGEM .................................................................... 3
1.1 Processos de Amostragem .............................................................................................. 4
1.1.1 Amostragem aleatria ................................................................................................4
1.1.2 Amostragem sistemtica ..........................................................................................6
1.1.3 Amostragem estratificada proporcional ...............................................................7
2. DISTRIBUIES AMOSTRAIS ................................................. 9
2.1 Distribuio Amostral da Mdia ................................................................................... 9
3 MTODOS INFERENCIAIS ..................................................... 12
3.1 Estimao ......................................................................................................................... 12
3.1.3 Intervalo de confiana para a Mdia Populacional ...........................................13
3.1.4 Intervalo de confiana para a Proporo Populacional ....................................17
3.2 Testes Estatsticos ....................................................................................................... 19
3.2.1 Etapas bsicas em um teste de hiptese ...........................................................19

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

1. AMOSTRAGEM
Como j vimos, a amostragem naturalmente usada no contexto dirio das pessoas. Por
exemplo, para verificar o tempero de um alimento em preparao, podemos provar uma pequena
poro deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo
(populao) uma parte (amostra), com o propsito de avaliarmos (inferirmos) a qualidade de
tempero de todo o alimento.
Como j estudado, populao um conjunto de elementos passveis de serem
mensurados, com respeito s variveis que se pretende levantar. A populao pode ser formada
por pessoas, famlias, pacotes de biscoito, estabelecimentos industriais, ou qualquer outro tipo de
elementos, dependendo basicamente dos objetivos da pesquisa (Todos os elementos do grupo a
ser estudado constituem a populao. A parte da populao efetivamente examinada a
amostra).
comum termos interesse em descrever certas caractersticas especficas dos elementos
da populao, que denominaremos parmetros. Exemplos:
1) Numa pesquisa eleitoral a uma semana de uma eleio estadual, a populao pode ser definida
como todos os eleitores com domiclio eleitoral no estado. Os parmetros devem ser as
porcentagens de votos de cada candidato o governo do estado, no momento da pesquisa.
2) Para planejar projetos de recursos humanos numa empresa, com centenas de funcionrios,
podemos realizar uma pesquisa para avaliar alguns parmetros da populao de funcionrios
desta empresa como: porcentagem de funcionrios que concluram o ensino fundamental, tempo
mdio de servio dos funcionrios na empresa.
Estes dois exemplos ilustram a dificuldade que se pode ter em pesquisar toda a
populao. So situaes onde se recorre amostragem.
O termo inferncia estatstica refere-se ao uso apropriado dos dados da amostra para se
ter conhecimento sobre os parmetros da populao. As medidas calculadas a partir dos dados
obtidos pela amostra so chamadas estimativas desse parmetro.
Citaremos, agora, quatro razes para o uso de amostragem em levantamentos de grandes
populaes.
1) ECONOMIA: Em geral, torna-se bem mais econmico o levantamento de somente uma
parte da populao.
2) TEMPO: Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no haveria
tempo suficiente para pesquisar toda a populao de eleitores do pas, mesmo que houvesse
recursos financeiros disponveis.
3) CONFIABILIDADE DOS DADOS: Quando se pesquisa um nmero reduzido de
elementos, pode-se dar mais ateno a casos individuais, evitando erros nas respostas.
4) OPERACIONALIDADE: mais fcil realizar operaes de pequena escala. Um dos
problemas dos grandes censos o controle dos entrevistadores.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

4
Mas h situaes em que no vale a pena realizar amostragem:
1) POPULAO PEQUENA: Se a populao for pequena, por exemplo, 50 elementos, para
termos uma amostra capaz de gerar resultados precisos para os parmetros da populao,
necessitamos de uma amostra relativamente grande, em torno de 80% da populao.
2) CARACTERSTICA DE FCIL MENSURAO: Talvez a populao no seja to
pequena, mas a varivel que se quer observar de to fcil mensurao que no compensa
investir num plano de amostragem.
3) NECESSIDADE DE ALTA PRECISO: Algumas caractersticas de alunos da rede
municipal de ensino so importantes para o planejamento do municpio, por exemplo, o que
leva a prefeitura a coletar informaes a respeito de toda a populao.
Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e
executados, dando resultados confiveis, aos que so concebidos deficientemente e mal
executados, levando a concluses enganosas e sem qualquer valor real. Eis alguns pontos
importantes para o planejamento de um estudo eficaz de produzir resultados vlidos:

Identificar com preciso a questo a ser respondida e definir com clareza a populao de
interesse.

Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a
realizao de um estudo observacional ou de um experimento, e deve ser elaborado
cuidadosamente, de modo que os dados coletados representem efetivamente a populao em
questo.

Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem
resultar de uma coleta tendenciosa de dados.

Analisar os dados e tirar concluses. Identificar tambm possveis fontes de erros.

1.1 Processos de Amostragem


1.1.1 Amostragem aleatria (ou amostragem aleatria simples)
Em uma amostra aleatria, os elementos da populao so escolhidos de tal forma que
cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatria
simples de n elementos, de maneira que toda amostra de tamanho n possvel tenha a mesma
chance de ser escolhida).
As amostras aleatrias podem ser escolhidas por diversos mtodos, inclusive a utilizao
de tabelas de nmeros aleatrios e de computadores para gerar nmeros aleatrios.
Este tipo de amostragem equivalente a um sorteio lotrico.
Na prtica, a amostragem aleatria simples pode ser realizada numerando-se a populao
de 1 a n e sorteando-se, a seguir por meio de um dispositivo aleatrio qualquer, k nmeros dessa
sequncia, os quais correspondero aos elementos pertencentes amostra.
Observao:
A amostra aleatria simples pode ser realizada pelo software Excel na funo
ALEATRIOENTRE, onde entramos com o intervalo da amostra determinado e o software
nos retorna com o valor k correspondente da amostra.
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

5
1 passo Selecionar o item Ferramentas
2 passo Em Ferramentas aciona o item Suplementos...
3 passo Acionar conforme a janela a seguir - OK

4 passo Inserir funo Categoria Todas funo ALEATRIOENTRE OK

Exemplo:
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

6
Obter uma amostra de 5% para a pesquisa da estatura de 90 alunos de uma escola:

Os nmeros obtidos foram:


24

11

49

68

52

Medindo as alturas dos alunos correspondentes aos nmeros sorteados, obteremos uma
amostra das estaturas dos noventa alunos.
1.1.2 Amostragem sistemtica
Quando os elementos da populao j se acham ordenados, no h necessidade de
construir um sistema de referncia. So exemplos os pronturios mdicos de um hospital, dos
prdios de uma rua, as linhas de produo e etc. Nestes casos, a seleo dos elementos que
constituiro a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de
amostragem denominamos sistemtica.
Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar
um para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho
da amostra em 10% da populao.
Exemplo 1:
Se a Motorola quisesse fazer uma pesquisa sobre seus 107 000 empregados, poderia partir
de uma relao completa dos mesmos e selecionar cada 100 empregado, obtendo uma amostra
de 1.070 elementos. Esse mtodo simples e utilizado com frequncia.
Exemplo 2:
Deseja-se retirar uma amostra de n = 10 unidades de observao de uma populao de
tamanho N = 874. O intervalo de seleo , ento, 874/10 = 87,4 87(aproxima-se para menos,
seno se ultrapassar a ordem da ltima unidade). Desse modo, vo-se contando as unidades de
observao e escolhem-se aquelas que estiverem nas seguintes posies: 87, 174, 261, 348, 435,
522, 609, 696, 783 e 870.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

7
1.1.3 Amostragem estratificada proporcional
A amostragem estratificada proporcional recomendada quando existe uma diviso
natural da populao em grupos com nmeros de elementos diversos.
Com a amostragem estratificada, subdividimos a populao em, no mnimo, duas
subpopulaes (ou estratos) que compartilham das mesmas caractersticas (como sexo) e, em
seguida, extramos uma amostra de cada estrato.
Exemplo 1:
Suponhamos que numa escola h 120 crianas na faixa de 7 anos de idade estejam
distribudas em 5 turmas, com quantidades diferentes de alunos. Vamos supor que nossa amostra
deva ter, no mnimo, 12 elementos.
OBS: Os dados devero ser arredondados para o inteiro mais prximo, j que esses nmeros
indicam a quantidade de crianas.

Turma
A
B
C
D
E
Total

Populao
20
15
35
30
20
120

Amostra

Na ltima coluna est representada a quantidade de elementos de cada estrato e o total da


amostra.
Atividades:
1. Pretende-se obter uma amostra dos alunos de uma universidade para estimar a proporo
que tem trabalho remunerado.
a) Qual a populao em estudo?
b) Qual o parmetro que se quer estimar?
c) Voc acha que se obteria uma boa amostra dos alunos no restaurante universitrio? No
ponto de nibus mais prximo? Nas portas das salas de aula? ... Ou voc tem outra
alternativa para obter a amostra?

2. Numa escola da regio, para estudar a preferncia em relao a refrigerantes, sortearamse 150 estudantes entre os 1000 matriculados. Responda:
a) Qual a populao matriculada na pesquisa?
b) Que tipo de amostragem foi utilizado e qual a amostra considerada?
(15%, ou 150 alunos)

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

8
3. Em uma cidade, quer-se estudar o interesse despertado por um programa de TV entre os
alunos de 7 anos de idade das escolas de ensino fundamental. Para isso, pretende-se
levantar uma amostra de 300 crianas. A partir dos dados abaixo, estratifique a amostra.
Escola
Populao
Amostra
A
400
B
300
C
350
D
450
E
520
Total
Ver primeiro a porcentagem correspondente ao tamanho da amostra.

(14,8515%)

4. Em uma cidade com 30 000 habitantes deseja fazer uma pesquisa sobre a preferncia por
tipo de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertence.
a) Qual a populao envolvida na pesquisa?
b) Supondo que na cidade haja 5 500 mulheres e 6000 homens, com 20 anos, determine
uma amostra com 1200 pessoas.
(p=10,4348%)

5. Uma populao encontra-se dividida em trs estratos, com tamanhos diferentes,


respectivamente a: n1= 40, n2= 100, n3= 60. Sabendo que, ao ser realizada uma
amostragem estratificada proporcional, 9 elementos da amostra foram retirados do 3
estrato, determine o nmero total de elementos da amostra.
(30)
6. Em uma empresa existem 250 funcionrios, sendo 35 na linha de produo A, 32 na linha
de produo B, 30 na linha de produo C, 28 na linha D, 35 na linha E, 32 na linha F, 31
na rea administrativa e 27 na engenharia. Obtenha uma amostra de 40 funcionrios.
R: Porcentagem 16%, A= 6, B= 5, C= 5, D=4, E= 6, F= 5 Adm= 5, Eng=4

7. Uma empresa apresenta o seguinte quadro de funcionrios:


N de funcionrios
Setor
Masculino
Feminino
Produo
80
60
Engenharia
11
4
Administrao
13
17
Qualidade
4
5
Total
Obtenha uma amostra estratificada correspondente a 35 funcionrios.
(N masculino e feminino em cada extrato)

( p= 18,04%)

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

2. DISTRIBUIES AMOSTRAIS
A finalidade da amostragem obter uma indicao do valor de um ou mais parmetros
de uma populao, tais como a mdia, o desvio-padro populacional, ou a proporo de itens que
possuem determinadas caractersticas. As estatsticas amostrais que correspondem a esses
parmetros populacionais so usadas para aproximar os valores conhecidos daqueles parmetros.
Assim que a mdia amostral usada para estimar a mdia da populao, o desvio padro
amostral usado para estimar o desvio padro populacional, e a proporo amostral serve para
estimar a proporo da populao.
Uma das realidades da amostragem aleatria que, quando se extraem repetidas amostras
da mesma populao, h uma tendncia de a estatstica amostral variar de uma amostra para
outra, e tambm em relao ao verdadeiro valor do parmetro, simplesmente em razo de fatores
casuais relacionados com a amostragem. Essa tendncia conhecida como variabilidade
amostral. (Por esta razo, quase sempre podemos estar certos de que determinada estatstica
amostral no igual ao correspondente parmetro populacional). Obviamente, ento, qualquer
tentativa para fazer inferncias sobre uma populao deve levar em conta a variabilidade
amostral.
De modo geral, pode parecer difcil lidar, de maneira racional, com a variabilidade
amostral. No caso de amostragem aleatria, entretanto, demonstra-se matematicamente que a
variabilidade amostral pode ser descrita por distribuies de probabilidades tais como a normal e
a binomial. Quando as distribuies de probabilidade so usadas desta maneira, so conhecidas
como distribuies amostrais. E como essas distribuies s podem ser utilizadas quando se trata
de amostras aleatrias, essencial usar somente amostras aleatrias para fazer inferncia
estatstica.

2.1 Distribuio Amostral da Mdia


Uma distribuio da populao representa a distribuio de uma populao de valores, e
uma distribuio da amostra representa a distribuio de uma amostra de valores coletados de
uma populao. A distribuio amostral da mdia a distribuio de probabilidade para os
possveis valores da mdia da amostra x baseados em um particular tamanho da amostra.
Para qualquer tamanho dado n de amostra tomada de uma populao com mdia , o
valor da mdia da amostra x ir variar de amostra para amostra. Esta variabilidade serve como
base da distribuio amostral. A distribuio amostral da mdia descrita pela determinao do
valor esperado E( x ) , ou mdia, da distribuio e do desvio padro da distribuio das mdias

X . Uma vez que este desvio padro indica o quanto a mdia da amostra acurada (acurada),
X

usualmente chamado de erro padro da mdia. Em geral o valor esperado e o erro padro
da mdia so definidos como:
E (X )

Exemplo 1: Uma populao constituda pelos valores 2, 3, 4. Considere todas as


amostras possveis, de tamanho 2, que podem ser extradas dessa populao com reposio.
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

10
a) determinar a mdia da populao;
b) o desvio padro da populao;
c) a mdia da distribuio amostral das mdias;
d) o desvio padro da distribuio amostral das mdias.
23 4
Respostas:
3
3

= 0,8165

Amostras: (2, 2); (2, 3); (2, 4); (3, 2); (3, 3); (3, 4); (4, 2); (4, 3); (4, 4)
Mdia de cada amostra: 2; 2,5; 3; 2,5; 3; 3,5; 3; 3,5; 4
Mdias
amostrais xi
2
2,5
3
3,5
4
Total

fi

fri

fixi

fi(xi-x)2

1
2
3
2
1
9

1/9
2/9
3/9
2/9
1/9
1

2
5
9
7
4
27

1
0,5
0
0,5
1
3

c) Mdia da distribuio 27/9 = 3

d) Desvio padro s = 0,612

Pode se perceber que a mdia da distribuio das mdias igual a mdia da populao.

Ao fazer amostras de uma populao finita, deve-se incluir o fator de correo finita (ou
fator de correo para populao finita) na frmula do erro padro da mdia.
Obs.: Uma regra de bolso que a correo insignificante e pode ser omitida sempre que o
tamanho da amostra for menor que 5% do tamanho da populao.
A frmula para o erro padro da mdia quando se inclui o fator de correo finita :

N n
N 1

Se o desvio padro da populao for desconhecido, o erro padro da mdia pode ser
estimado, usando-se o desvio padro da amostra como um estimador do desvio padro da
populao. Para diferenciar este erro padro daquele baseado em um conhecido, denota-se o
mesmo por s X . A frmula para o erro padro estimado da mdia :

sX

s
n

A frmula para o erro padro estimado, da mdia quando se inclui o fator de correo
finita :

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

11

sX

s
n

N n
N 1

Exemplo1: Um auditor toma uma amostra aleatria de tamanho n=16 de um conjunto de N=100
contas a receber. No se conhece o desvio padro dos valores das 100 contas a receber. Contudo,
o desvio padro da amostra s = 57 reais. Determinamos o valor do erro padro da distribuio
amostral da mdia da seguinte forma:
sX

s
n

N n
57,00 100 16
57 84

14,25 0,8484 13,13 reais


N 1
100 1
4 99
16

O erro padro da mdia fornece a base principal para a inferncia estatstica no que diz
respeito a uma populao com mdia desconhecida, como ser visto posteriormente.
Um teorema em Estatstica que conduz ao uso do erro padro da mdia o TEOREMA
DO LIMITE CENTRAL que diz: medida que se aumenta o tamanho da amostra, a
distribuio amostral da mdia se aproxima da forma da distribuio normal, qualquer que seja a
forma da distribuio da populao. Na prtica, a distribuio amostral da mdia pode ser
considerada como aproximadamente normal sempre que o tamanho da amostra for n > 30.
(Alguns autores consideram mais adequado trabalhar com a idia de n > 40).
Em se tratando de varivel z, a distribuio tem mdia zero e varincia um. Por
conseguinte, poder ser usada a tabela de reas da normal padro para calcular probabilidades
relacionadas com a mdia da amostra, aps a sua padronizao.
Para distribuies padronizadas, temos:

Exemplo 2: Sabendo-se que a mdia de determinada populao 50 kg e o desvio padro 10 kg,


qual a probabilidade de que a mdia de uma amostra de 36 observaes dessa populao desvie
da mdia em mais de 5 kg?
Neste caso a mdia da amostra pode ser maior que 55 ou menor que 45. Calculamos um valor
55 10
45 10
para x z =
z=
10
10
36
36
z = 3 o valor tabelado corresponde a 0,4987

z = -3 o valor tabelado corresponde a 0,4987

Fazer grfico

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

12
A probabilidade de estar entre 45 e 55 99,74%, portanto, a probabilidade de que desvie mais
do que 5 kg 1 0,9974 = 0,0026 ou 0,26%.

2.2 Distribuio Amostral da Proporo


Que percentagem de peas numa grande remessa apresenta defeito? Qual a
probabilidade de um aluno do curso fundamental no ser vacinado? Essas perguntas e outras
anlogas podem ser respondidas utilizando-se dados amostrais para estimar o parmetro
populacional.
A estimativa de propores populacionais muito semelhante de mdias populacionais.
Por exemplo, intervalos de confiana para grandes amostras se baseiam numa distribuio
amostral que aproximadamente normal, usando-se a estatstica amostral (neste caso a
proporo amostral) como estimativa pontual do verdadeiro parmetro (proporo populacional).
O valor esperado de uma proporo amostral sempre igual verdadeira proporo da
populao. Usa-se, portanto, a proporo amostral como estimativa pontual da verdadeira
proporo:

x
n

3 MTODOS INFERENCIAIS
O objetivo da Estatstica o de conhecer populaes por meio das informaes amostrais.
Como as populaes so caracterizadas por medidas numricas descritivas, denominados
parmetros, a estatstica diz respeito realizao de inferncias sobre esses parmetros
populacionais desconhecidos. Parmetros populacionais tpicos so a mdia e o desvio padro
.
Os mtodos para realizar inferncias a respeito dos parmetros referentes a uma populao
pertencem a duas categorias:
Estimao: determinao de estimativas dos parmetros populacionais.
Teses de hipteses: tomada de deciso relativa ao valor de um parmetro populacional.

3.1 Estimao
3.1.1 Estimativa por ponto: Emprega-se quando o interesse estimar o parmetro por meio
de um nico valor amostral. Assim, o valor da mdia amostral x uma estimativa por ponto da
mdia populacional . De maneira anloga, para o desvio padro.
Exemplo: Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes
revelou nota mdia amostral de 5,2. Logo: x = 5,2 uma estimativa pontual da verdadeira nota
mdia dos 20.000 alunos.
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

13
3.1.2 Estimativa por intervalo: Emprega-se quando temos um intervalo, representado por
dois limites, mximo e mnimo, dentro do qual est contido o parmetro desconhecido com uma
segurana (ou confiana) especificada. Geralmente usa-se (1 - ) %, que pode corresponder a
90%, ou 95%, ou 97,5%, ou 99%, etc.

(nmero de unidades de

desvios padres a partir da


mdia) tabelado.
1,65
1,96
2,24
2,57

rea do intervalo de confiana


(1 - )
0,90
0,95
0,975
0,99

(90%)
(95%)
(97,5)
(99%)

0,10
0,05
0,025
0,01

(10%)
(5%)
(2,5%)
(1%)

Se o comprimento do intervalo pequeno, temos um elevado grau de preciso da


inferncia realizada. As estimativas dessa natureza so denominadas de intervalo de confiana.
Exemplo: O intervalo [1,60 m; 1,64 m] contm a altura mdia dos moradores do municpio X,
com nvel de confiana de 95%.
3.1.3 Intervalo de confiana para a Mdia Populacional

Quando o desvio padro conhecido

Admitindo-se x como sendo uma varivel normalmente distribuda com mdia e desvio
padro , pode-se estabelecer um limite inferior e um limite superior, definindo-se um intervalo
que contm certo percentual dos valores de x. Geralmente usam-se os percentuais 90%, 95% e
99% que so denominados nveis de confiana para a mdia da populao. Na distribuio normal
padro, os valores de z que limitam os intervalos esto assim representados:

A varivel x reduzida varivel z atravs da frmula:

Para fixarmos um intervalo de confiana para a mdia, o valor de z correspondente a x


obtida da amostra, dever estar compreendido entre os valores limites de z, conforme o nvel de
confiana estabelecido.
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

14
Sejam z e + z os valores limites do intervalo de confiana e z o valor correspondente a
x , ento:

Isolando , para amostragem de uma populao infinita ou amostragem com reposio


de uma populao finita, vem:

e no caso de amostragem sem reposio de uma populao finita de tamanho N, vem:

OBS: Podemos substituir por s para amostras consideradas grandes (n 30).


Os limites do intervalo podem ser calculados separadamente:
Limite Inferior =

X Z . X

Limite Superior =

X Z . X

sendo X
sendo

Intervalo de confiana =

Se a populao for
finita utiliza-se o
fator de correo

LI ; LS

Exemplo: Estabelecer o intervalo de confiana de 95% para , sabendo que uma amostra de
tamanho 36 dessa populao forneceu x = 30 e = 4.
4
Limite inferior = 30 1,96
30 1,96 x 2/3 = 28,693
36
4
Limite superior = 30 1,96
30 + 1,96 x 2/3 = 31,307
36
Portanto, podemos presumir que a mdia dessa populao esteja entre 28,693 e 31, 307,
com 95% de confiana. Neste intervalo a mdia amostral igual a 30 est includa.
P (28,693 31,307) = 95%
Exerccios:
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

15
1. Estabelecer o intervalo de confiana de 99% para , sabendo que uma amostra de
tamanho 50 dessa populao forneceu x = 75 e = 7.

R: (72,466

77,544)

2. A durao da vida de uma pea de equipamento tal que = 5 horas. Foram amostradas
aleatoriamente 100 dessas peas, obtendo-se mdia de 500 horas. Construir um intervalo
de confiana para a verdadeira durao mdia da pea com um nvel de 95% de confiana.
R: (499,02 500,98)

3. Uma amostra de 64 elementos de uma varivel normalmente distribuda forneceu x =25,4


e = 5,2. Determinar os limites de confiana de 90% para a mdia.
(24,33 26,47)

Quando o desvio padro desconhecido

Quando temos pequenas amostras e no conhecemos o valor do desvio padro


populacional, podemos construir intervalos de confiana apara a mdia. Para tanto, necessrio
que a populao de onde foi extrada a amostra aleatria tenha distribuio normal. Neste caso,
devemos empregar uma nova varivel. Esta varivel denominada t de Student.

O processo para se obter o intervalo de confiana semelhante ao mostrado no item


anterior. Como no se conhece , preciso substitu-lo por s (desvio padro amostral) que,
contrariamente a , uma varivel aleatria.
A forma da distribuio t bastante parecida com a normal. A principal diferena entre as
duas distribuies que a distribuio t tem maior rea nas caudas. A tabela t fornece os valores
limites para os intervalos de confiana. A varivel t possui n 1 graus de liberdade.
Quando desconhecido e n < 30, obtm-se o intervalo de confiana para a mdia
substituindo-se z por t. Assim:

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

16
Exemplo: Qual o intervalo de confiana para a mdia, no nvel de 95%, sabendo que uma
amostra de tamanho 10 forneceu x = 8,7 e s = 2 ?
2
Limite inferior = 8,7 2,2622
7,27
10
2
Limite superior = 8,7 2,2622
10,13
10
P ( 7,27 10,13) = 95%, ou seja o intervalo [7,27, 10,13] contm a verdadeira mdia
com 95% de confiana.

Erro mximo de estimativa

Na frmula:

a expresso constitui

o erro (e) mximo da estimativa.

O erro igual diferena entre a mdia amostral e a verdadeira mdia da populao.


Como o intervalo de confiana tem centro na mdia amostral, o erro mximo provvel igual
metade da amplitude do intervalo. Assim, para diminuir o erro mximo de estimativa, dando a
esta maior preciso, a nica alternativa de que dispomos o aumento do tamanho da amostra.
Dessa forma, se fixarmos previamente o erro mximo de estimativa e o nvel de
confiana, podemos determinar o tamanho da amostra a ser tomada:

Exemplo 1: Desejando estimar, ao nvel de confiana de 95%, a mdia de uma populao de


modo que ela no exceda a 2 unidades, sendo = 8, qual o tamanho da amostra a ser tomada?
2

Se e = 2 (no mximo), temos que:

1,96 * 8
n
n 61,4656 n 61
2

Portanto aproximadamente 61 elementos a serem investigados

Exemplo 2: Repita o processo do exemplo anterior, considerando o erro mximo de 1,5.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

17
Exemplo 3: Um analista de departamento de recursos humanos deseja estimar o nmero mdio
de horas de treinamento anual para os operrios de uma diviso da companhia, com um fator de
erro de 3,0 horas (para mais ou para menos) e com 90% de confiana. Baseado em dados de
outras divises, ele estima o desvio padro das horas de treinamento em =20,0horas. O
tamanho mnimo necessrio da amostra :

n=

z
e

3.1.4 Intervalo de confiana para a Proporo Populacional


Que proporo de bolas numa urna so vermelhas? Que proporo de eleitores aprova
determinado projeto. Essas perguntas e outras anlogas podem ser respondidas utilizando-se
dados amostrais para estimar o parmetro populacional. Tal como antes, as estimativas sero
pontuais e intervalares.
Como vimos, o valor esperado de uma proporo amostral sempre igual verdadeira
proporo da populao. Usa-se, portanto, a proporo amostral como estimativa pontual da
verdadeira proporo:

x
n

A estimativa intervalar do parmetro populacional (para grandes amostras) simtrica em


relao proporo amostral, tal como ocorre com o intervalo para a mdia populacional em
relao mdia amostral. A principal diferena entre a estimativa de mdias e a de propores
est nos desvio padres das distribuies amostrais. O desvio padro de uma proporo se baseia
na distribuio binomial. A estimativa de p dada abaixo:

pop

p . (1 p)
n

Intervalo de confiana para p:

p z.

p . (1 p)
n

Exemplo 1: Determinar um intervalo de 98% de confiana para a verdadeira proporo


populacional, se x = 50 e n = 200.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

18
Exemplo 2: Uma amostra de 200 observaes acusou 20 baterias defeituosas numa remessa.
Usando uma confiana de 99%, determinar o erro de estimao.

Exerccios:
1. Uma amostra de 36 crianas de uma escola de ensino fundamental/sries iniciais forneceu
peso mdio 28,5 kg e desvio padro de 5,2 kg. Determinar no nvel de 99%:
a) O intervalo de confiana para a mdia ;
b) O tamanho da amostra para que o erro mximo seja igual a 1,2 kg;

2. Sendo x normalmente distribuda, uma amostra de 50 elementos forneceu uma mdia de 78,4
e desvio padro de 6,2.
a) Estimar, ao nvel de 99%, a mdia da populao;
b) Qual deveria ser o tamanho da amostra para o erro de estimativa ser 2?

3. Em 4 leituras experimentais de um comercial de 30 segundos, um locutor levou em mdia


29,2 segundos com uma varincia de 5,76 segundos ao quadrado (s2). Construa os limites de
confiana para a mdia, com 90% de confiana.

4. De um total de 200 notas em matemtica, uma amostra aleatria de 50 notas acusa mdia de
75 e desvio padro 10. Quais os limites de confiana de 95% para estimar a mdia das 200
notas?

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

19

5. A variabilidade do tempo de atendimento em um caixa bancrio conhecida 0,10 min.


Uma amostragem com 20 pessoas indicou tempo mdio de atendimento de x = 1,5 min.
Construa um intervalo de confiana de 95% para o tempo mdio de atendimento.

6. Qual o tamanho da amostra necessrio para estimar a mdia populacional de uma


caracterstica dimensional de um processo cujo desvio padro 3 cm, com 95% de
confiana e preciso de 0,5 cm?

7. Um empresrio deseja conhecer a satisfao de seus clientes em relao aos servios


prestados por sua empresa. Em uma amostra aleatria de 100 clientes entrevistados, 4
pessoas demonstraram insatisfao com os servios prestados. Construa um intervalo de 99%
de confiana para a proporo de clientes insatisfeitos.

3.2 Testes Estatsticos


Na avaliao de um parmetro populacional, sobre o qual no se possui nenhuma
informao com respeito a seu valor, no resta outra alternativa a no ser estim-lo atravs do
intervalo de confiana. No entanto, se tiver alguma informao com respeito ao valor do
parmetro que se deseja avaliar, pode-se testar esta informao no sentido de aceit-la como
verdadeira ou rejeit-la.
Denomina-se de hiptese nula (H0), a informao a respeito do valor do parmetro que se
quer avaliar. Chama-se de hiptese alternativa (H1), a afirmao a respeito do valor do parmetro
que se aceita como verdadeiro caso a hiptese nula seja rejeitada.
Ao aplicar um teste, aplicamos uma regra de deciso que permite aceitar ou rejeitar como
verdadeira uma hiptese nula, com base na evidncia amostral. Isto significa que se utiliza uma
amostra desta populao para verificar se a amostra confirma ou no o valor do parmetro
informado pela hiptese nula.
3.2.1 Etapas bsicas em um teste de hiptese
Em um teste de hiptese, comeamos com um valor suposto (hipottico) de um parmetro
populacional. Depois de coletar uma amostra aleatria, comparamos a estatstica da amostra, tal
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

20
como a mdia amostral x , com o parmetro suposto, tal como a mdia populacional hipottica .
Ento, ou aceitamos ou rejeitamos o valor hipottico como sendo correto. O valor hipottico
rejeitado somente se o resultado da amostra for claramente improvvel de ocorrer quando a
hiptese for verdadeira.
Etapa 1: Formular a hiptese nula e a hiptese alternativa.
A hiptese nula uma afirmao sobre o valor de um parmetro populacional (como a mdia),
deve conter a condio de igualdade e deve escrever-se como =, ou . (Ao fazermos
efetivamente o teste, trabalhamos com a hiptese de que o parmetro igual a um valor
especfico.) Para a mdia temos as trs formas possveis para a hiptese nula:
H0 : = algum valor
H0 : algum valor
H0 : algum valor
Por exemplo, a hiptese nula correspondente suposio geral de que a temperatura mdia do
corpo 98,6F se expressa como H0: = 98,6F. Testamos a hiptese nula diretamente no
sentido de que, supondo-a verdadeira, procuramos chegar a uma concluso que nos leve a rejeitar
H0 ou no rejeitar H0.
A hiptese alternativa a afirmao que deve ser verdadeira se a hiptese nula falsa. Note que
H1 o oposto de H0. Por exemplo, se H0 dada como = 98,6F, ento a hiptese alternativa
H1: 98,6F. Para a mdia, a hiptese alternativa comporta apenas uma das trs formas:
H1 : algum valor
H1 : > algum valor
H1 : < algum valor

Decidimos rejeitar a
hiptese nula
Deciso
No rejeitamos a
hiptese nula

A hiptese nula verdadeira

A hiptese nula falsa

Erro Tipo I
(rejeio de uma hiptese nula
verdadeira)
= nvel de significncia

Deciso correta

Deciso correta

Erro Tipo II
(no rejeio de uma
hiptese nula falsa)

Exemplo 1: Um auditor deseja testar a hiptese de que o valor mdio de todas as contas a
receber em uma dada empresa R$ 2.600,00, tomando para tanto uma amostra de n = 36 e
calculando a mdia amostral. Ele deseja rejeitar o valor hipottico de R$ 2.600,00 somente se tal
valor for claramente contraditrio ao da mdia da amostra, sendo que, desta maneira, dado ao
valor suposto o benefcio da dvida. As hipteses nula e alternativa para este teste so
H0: 2600 e H1 : 2600
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

21
Etapa 2: Especificar o nvel de significncia a ser utilizado
O nvel de significncia o padro estabelecido especificado para rejeitar a hiptese nula. Se
especificado um nvel de significncia de 5%, a hiptese nula rejeitada somente se o resultado
da amostra to diferente do valor suposto que uma diferena igual ou maior ocorreria por acaso
com uma probabilidade mxima de 0,05.
Observamos que, se for utilizado um nvel de significncia de 5%, existe uma probabilidade de
0,05 de rejeitar a hiptese nula sendo a mesma verdadeira. Este o chamado Erro Tipo I. A
probabilidade de Erro Tipo I sempre igual ao nvel de significncia utilizado como padro para
rejeitar a hiptese nula; ele representado pela letra grega maiscula , sendo que , deste
modo, representa o nvel de significncia. Os nveis de significncia mais freqentemente
utilizados em testes de hiptese so os de 5% e 1%.
Etapa 3: Selecionar a estatstica de teste.
uma estatstica amostral, ou um valor baseado nos dados amostrais. Utiliza-se uma
estatstica de teste para tomar uma deciso sobre a rejeio da hiptese nula.
Teste de significncia para a mdia com 2 conhecida.
Neste teste H0 : = c e o melhor estimador para x . A distribuio amostral das
mdias normal, com :

Teste de significncia para a proporo

O melhor estimador de p p . A distribuio amostral das propores normal, com

p p
p1 p
n

Observao: Quando no se conhece o desvio padro populacional, deve-se estim-lo a partir


dos dados amostrais usando o desvio padro amostral. Quando isto ocorrer (na maioria das
situaes reais X desconhecido), a distribuio t a distribuio amostral mais adequada. Na
prtica, entretanto, s se exige o uso da distribuio t quando o tamanho da amostra igual ou
inferior a 30, pois, para maiores valores do tamanho da amostra, os valores de t e z so
aproximadamente os mesmos.
Etapa 4: Estabelecer o valor crtico ou valores crticos da estatstica do teste.
Regio crtica o conjunto de todos os valores da estatstica de teste que levam rejeio
da hiptese nula.
O valor crtico o valor (ou valores) que separa(m) a regio crtica dos valores da
estatstica de teste que no levam rejeio da hiptese nula. Os valores crticos dependem da
natureza da hiptese nula, da distribuio amostral principal, e do nvel de significncia .
Etapa 5: Tomar a deciso.
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

22

O valor esperado da estatstica comparado com o valor crtico (ou valores) da estatstica
de teste. A hiptese nula , ento, ou aceita ou rejeitada. Se a hiptese nula rejeitada, a hiptese
alternativa aceita.
Exemplo 2: Suponhamos que, sob determinada hiptese, a distribuio amostral de uma
estatstica S acuse distribuio normal com mdia s e desvio padro s. Ento a distribuio da
varivel padronizada Z = (S - s)/ s a distribuio da varivel padronizada (mdia 0,
varincia 1) , conforme mostra a figura.

Tal como indicado na figura, podemos ter 95% de confiana em que o escore z de uma
estatstica amostral S esteja entre 1,96 e + 1,96. Todavia, se, na escolha de uma nica amostra
aleatria, verificamos que o escore z est fora do intervalo de 1,96 e +1,96, poderemos concluir
que o evento ocorreria com probabilidade de apenas 0,05 (rea total sombreada na figura) no
caso de a hiptese formulada ser verdadeira.
Diramos ento que o escore z difere significativamente do que seria de esperar sob a hiptese
formulada e, assim, estaramos inclinados a rejeitar a hiptese.
A rea sombreada, 0, 05, o nvel de significncia do teste. Representa a probabilidade
de erro na rejeio de uma hiptese, isto , a probabilidade de um erro tipo I. Dizemos ento que
a hiptese rejeitada ao nvel de significncia de 0,05, ou que o escore z da estatstica amostral
significativo ao nvel de 0,05.
O conjunto de valores dos escores z exteriores ao intervalo de 1,96 a 1,96 constitui o que
se chama regio crtica, regio de rejeio da hiptese ou regio de significncia. O conjunto
dos escores z interior ao intervalo de 1,96 a 1,96 poderia ento ser chamado de regio de
aceitao da hiptese ou regio de no significncia.
Exemplo 3: A vida mdia de uma amostra de 100 lmpadas fluorescentes fabricadas por
determinada companhia de 1570 horas, com desvio padro de 120 horas. Se a vida mdia
de todas as lmpadas fabricadas pela companhia, teste a hiptese = 1600 horas contra a
hiptese alternativa 1600 horas, utilizando um nvel de significncia de (a) 0,05 e (b) 0,01.
Soluo:
H0: = 1600 horas
H1: 1600 horas
Aplicando a frmula ao lado, calculamos o z.
Z = (1570 1600)
120/100
Obtemos z calculado = -2,5
Material organizado pelas professoras - CCET
Ivanete Rocha de Miranda.

23

(a) Ao nvel de 0, 05, o z tabelado compreende o intervalo de 1,96 a +1,96. Como o valor
calculado est fora desse intervalo, rejeitamos H0 ao nvel de significncia de 0,05.
Fazer o grfico:

(b) Ao nvel de 0, 01, o z tabelado compreende o intervalo de 2,58 a +2,58. Como o valor
calculado est dentro desse intervalo, aceitamos H0 ao nvel de significncia de 0,01.
Fazer o grfico:

Exemplo 4: Um auditor deseja testar a hiptese de que o valor mdio de todas as contas
receber em uma dada empresa R$ 2.600,00, tomando para tanto uma amostra de n = 36
calculando a mdia amostral. Determinar os valores crticos da mdia da amostra para testar
hiptese a um nvel de significncia de 5%, dado que se conhece o desvio padro das contas
receber: = 430,00 reais.

a
e
a
a

Portanto, para rejeitar a hiptese nula, a mdia da amostra deve ter um valor menor do
que R$ 2.459,53 ou maior do que R$ 2.740,47. Ento, existem duas regies de rejeio no caso
de um teste bilateral.
Em lugar de estabelecer os valores crticos em termos de mdia da amostra como tal, os
valores crticos nos testes de hipteses so tipicamente especificados em termos de valores z.
Quando o valor da mdia da amostra estiver determinado, ele ser transformado para um valor z,
de modo a poder ser comparado com os valores crticos de z.

Exerccios:
1. Um processo deveria produzir mesas com 0,85 m de altura. Um engenheiro desconfia que as
mesas que esto sendo produzidas so diferentes do especificado. Uma amostra de 8 mesas foi
coletada e indicou x = 0,87 m. Sabendo que o desvio padro 0,010 m, teste a hiptese do
engenheiro usando um nvel de significncia 0,05.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.

24
2. Um engenheiro deseja testar a hiptese de que seu fornecedor entrega lotes com 10% de no
conformes. Um lote de 180 unidades revelou 14 no conformes. Use 5% e conclua a
respeito.

3. Uma amostra de vinte observaes de um produto indicou um tempo de vida mdia de 217
ciclos. Sabendo que o desvio padro de 20 ciclos, teste a hiptese de que o tempo de vida
inferior a 250 ciclos, conforme atestam alguns engenheiros. Use 5%.

Material organizado pelas professoras - CCET


Ivanete Rocha de Miranda.