You are on page 1of 28

SRIE: Estatstica Bsica

Texto 3: AMOSTRAGEM & ESTIMAO

SUMRIO

1. AMOSTRAGEM 4

1.1. Conceitos bsicos 4

1.2. Distribuio amostral dos estimadores 8


1.2.1. Distribuio amostral da mdia 8
1.2.2. Distribuio amostral da varincia 11
1.2.3. Distribuio amostral da proporo 13

2. ESTIMAO 16

2.1. Propriedades dos estimadores 16

2.2. Estimao por ponto 16

2.3. Estimao por intervalo 16


2.3.1. Da mdia populacional 17
2.3.2. Da proporo populacional 19
2.3.3. Da varincia populacional (2) 21
2.3.4. Do desvio padro populacional () 22

3. EXERCCIOS 24

4. RESPOSTAS DOS EXERCCIOS 27

5. REFERNCIAS 29

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


3
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

1. AMOSTRAGEM
1.1. C ONCEITOS BSICOS
Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no
possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto.
O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo.
O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-se
que o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas.
Pode-se definir uma populao como sendo:
Uma coleo de todos os possveis elementos, objetos ou medidas de interes-
se.
Assim, so exemplos de populaes:
O conjunto das rendas de todos os habitantes de Porto Alegre;
O conjunto de todas as notas dos alunos de Estatstica;
O conjunto das alturas de todos os alunos da Universidade; etc.
Um levantamento efetuado sobre toda uma populao denominado de levantamento censit-
rio ou Censo.
Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muito
difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda um
tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao de-
nominadas de amostras. Uma amostra pode ser caracterizada como:
Uma poro ou parte de uma populao de interesse.
Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na
Agricultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos:
Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado de
eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies.
Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de
tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defei-
tuosos.
O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc.
Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programas
para fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfat-
ria.
Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos.
O processo de escolha de uma amostra da populao denominado de amostragem.
Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises so-
bre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utiliza-
da para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao in-

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


4
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

vs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsti-
cos, isto , ao acaso.
Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como
sendo:
A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amos-
tras probabilsticas desta mesma populao.
Uma amostra dita probabilstica se todos os elementos da populao tive-
rem probabilidade conhecida e no zero de pertencer a amostra.
Dentre as vrias maneiras de se selecionar uma amostra probabilstica ou aleatria de uma po-
pulao a mais simples atribuir a todos os elementos da populao a mesma probabilidade de perten-
cer a amostra.
Uma amostra que satisfaa tal critrio denominada de amostra aleatria simples (aas).
Uma aas pode ser extrada de uma populao de acordo com os critrios:
(a) com reposio e (b) sem reposio.
Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto ,
se a populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta
na populao. no vai afetar em nada a probabilidade de extrao do elemento seguinte.
Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre os
dois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no
processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o ele-
mento retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio
mais eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel re-
tirar elementos extremos mais do que uma vez.
Assim se N representa o tamanho da populao e n < N o tamanho da amostra, ento o nme-
ro de amostras possveis de acordo com os critrios com e sem reposio ser:
(a) Com reposio
k = nmero de amostras = Nn
(b) Sem reposio
N N!
k = nmero de amostras = =
n n!(N n)!

Exemplo:
Considere a populao P = { 1, 3, 5, 6 }. Ento o nmero de amostras possveis de tamanhos
n = 2 e n = 3, de acordo com os critrios com e sem reposio ser:
(a) Sem reposio
(1) n = 2
N 4 4!
Como N = 4 e n = 2, ento o nmero de amostras possveis ser: = = =6
n 2 2!( 4 2)!

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


5
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Estas amostras sero: (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)


(2) n = 3
N 4 4!
Como N = 4 e n = 3, ento o nmero de amostras possveis ser: = = =4
n 3 3 !( 4 3 )!

Estas amostras sero: (1, 3, 5) (1, 3, 6) (1, 5, 6) (3, 5, 6).


(b) Com reposio
(1) n = 2
Como N = 4 e n = 2, ento o nmero de amostras possveis ser Nn = 42 = 16.
Estas amostras sero: (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)
(5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)
Como pode ser observado neste caso as amostras (a, b) e (b, a) so consideradas diferentes,
isto , na amostragem com reposio as amostras so ordenadas.
(2) n = 3
Como N = 4 e n = 3, ento o nmero de amostras possveis ser Nn = 43 = 64
Algumas destas amostras so:
(1, 1, 1) (1, 1, 3), (1, 3, 1), (3, 1, 1) (1, 3, 5) (1, 5, 3) ( 5, 3, 1) (5, 1, 3)
(1, 3, 6) (3, 3, 3), (5, 5, 5) (5, 5, 6) (1, 5, 6) (3, 5, 6) , etc.
Estimador, estimativas e parmetros
Uma caracterstica da populao denominada parmetro.
Um parmetro uma constante, isto , um nmero que representa uma caracterstica nica
da populao.
Assim se P uma populao, os principais parmetros seriam:
(i) A mdia de P, anotada por P
(ii) A varincia de P, anotada por P2
(iii) O desvio padro de P, anotado por P
(iv) A proporo de elementos de P que apresentam determinada caracterstica, anotada por:
, entre outros.
Exemplo:
Para a populao P = { 1, 3, 5, 6 } os parmetros acima seriam:
(i) P = (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75
(ii) P2 = (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.
(iv) P = 1,9203 = 1,92
(v) = 1 / 4 = 25%, onde o numerador representa o nmero de elementos pares na populao

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


6
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Estimador
Um estimador uma caracterstica da amostra.
Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto
em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de probabilidade
de um estimador denominada de distribuio amostral.
Os principais estimadores so:
(I) A mdia da amostra, X que um estimador da mdia da populao:
(ii) A varincia amostral, S2 que um estimador da varincia populacional: 2
(iii) A proporo amostral, P, que um estimador amostral da proporo populacional .
Estimativa
Uma estimativa um valor particular de um estimador
Assim x = 2 uma estimativa. O estimador a expresso (frmula) enquanto que a estimati-
va o valor particular que ele assume (nmero).
Clculo dos principais estimadores.
Se (X1, X2, ..., Xn) uma amostra aleatria de tamanho n extrada de uma populao, ento:
(a) X = Xi / n uma estimativa da mdia populacional quando a amostra no est agrupada
e X = f i Xi / n uma estimativa da mdia da amostra quando a amostra est agrupada em uma distri-
buio de freqncias (por ponto ou por valores).
( Xi X) 2 Xi2 n X2
(b) S = 2
n1
=
n1
uma estimativa da varincia populacional quando a
amostra no est agrupada e

f i( Xi X )
2 2
f i Xi n X2
2
S = n1
= n1
uma estimativa da varincia populacional quando a
amostra est agrupada em uma distribuio de freqncias. Note-se que agora a varincia calculada
com
n - 1 no denominador. Isto se deve ao fato de que a varincia for calculada com n no denomina-
dor, a mdia de sua distribuio amostral no ser igual a varincia populacional o que caracterizaria
um estimador tendencioso.
Embora a varincia seja calculada com n - 1 no denominador com o objetivo de que as es-
timativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem reposio de po-
pulao finita. Neste caso necessrio utilizar, ainda, uma correo para a varincia que consiste em
multiplic-la pelo valor (N - 1) / N. Evidentemente esta correo s ser necessria se a populao for
pequena, caso contrrio o quociente acima ser aproximadamente igual a um e a correo no precisar
ser feita.
Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a va-
rincia dever ser calculada por:
 2 = N 1 S2
S
N

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


7
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(c) P = f / n, onde f = freqncia de elementos na amostra com determinada caracterstica


uma estimativa da proporo populacional .

1.2. D ISTRIBUIO AMOSTRAL DOS ESTIMADORES


1.2.1. Distribuio amostral da mdia
(1) Amostragem com reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
extradas com reposio. Para cada amostra vai-se calcular a mdia. Ter-se- assim um conjunto de 16
valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento a
distribuio amostral da mdia da amostra.
As possveis amostras com as respectivas mdias so:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)


1 2 3 3,5 3 4 4,5 5
Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)
x 5,5 6 2 3 3,5 4 4,5 5,5
Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:

x f( x ) = P( X = x ) x f( x ) x2 f( x )
1,0 1/16 1/16 1,0/16
2,0 2/16 4/16 8,0/16
3,0 3/16 9/16 27,0/16
3,5 2/16 7/16 24,5/16
4,0 2/16 8/16 32,0/16
4,5 2/16 9/16 40,5/16
5,0 1/16 5/16 25,0/16
5,5 2/16 11/16 60,5/16
6,0 1/16 6/16 36,0/16
1 60/16 254,5/16

Pela tabela pode-se verificar que:


E( X ) = x f( x ) = 60/16 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais,
extradas com reposio da populao P, igual a mdia populacional (parmetro populacional mdia).
V( X ) = x2 f( x ) - X = 254,5/16 - 3,752 = 1,84375 = 2/ 2 = 3,6875/2, isto , a varincia en-
2

tre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional.
O valor X = 1,36 denominado erro padro da mdia. Ele mede a variabilidade entre as
mdias amostrais e d uma idia do erro que se comete ao se substituir a mdia da populao pela m-
dia da amostra.
De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada a
amostra (1, 1) seramos levados a crer que a mdia da populao seria um, quando de fato ela vale
3,75, cometendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possvel neste caso) s
vai ocorrer com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra (1,

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


8
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

6) a mdia amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bem me-
nor que o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padro da distribui-
o amostral da mdia faz determinar o erro mdio, sendo por isso denominado, ento, de erro pa-
dro da amostragem.
(2) Amostragem sem reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
extradas sem reposio.
As possveis amostras com as respectivas mdias so:

Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)


x 2 3 3,5 4 4,5 5,5
Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:
2
x f( x ) = P( X = x ) x f( x ) x f( x )
2,0 1/6 2,0 / 6 04,00 / 6
3,0 1/6 3,0 / 6 09,00 / 6
3,5 1/6 3,5 / 6 12,25 / 6
4,0 1/6 4,0 / 6 16,00 / 6
4,5 1/6 4,5 / 6 20,25 / 6
5,5 1/6 5,5 / 6 30,25 / 6
1 22,5 / 6 91,75 / 6

Da tabela segue:
E( X ) = x f( x ) = 22,5/6 = 3,75 = , isto a expectncia (mdia) de todas as mdias amos-
trais, extradas sem reposio da populao P, tambm igual a mdia populacional (parmetro popu-
lacional mdia).

V( X ) = x2 f( x ) - X = 91,75/6 - 3,752 = 1,2292 = 2 . N 1 = 1,84375. (2/3), isto , a varin-


2
2
N n

cia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional
multiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator
de eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste caso (N = 4
e n =2) vale 2/3. Como na amostragem sem reposio no possvel retirar o mesmo elemento duas
vezes, as mdias no podem assumir valores to extremos, como por exemplo, o valor um ou seis
que assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem sem re-
posio seja menor do que na amostragem com reposio.
O fator de reduo da varincia na amostragem sem reposio : (N - n) / (N -1)
Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e
o tamanho da amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admi-
tir como necessria a correo para a varincia das mdias amostrais sempre que o tamanho da amostra
exceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio fazer-se a distino en-
tre os dois procedimentos (com e sem reposio).
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distri-

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


9
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

buio das mdias amostrais. Neste caso necessrio procurar por modelos probabilsticos que descre-
vam a distribuio da mdia amostral. Neste caso, tambm, como declarado acima a distino entre
amostragem com e sem reposio no ser necessrio, pois o fator de correo ser aproximadamente
um e no necessitar ser utilizado.
Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados:
(a) Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal de
mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio tambm normal com a
mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desvio
padro da populao, isto :
Se X N(, ) ento X ser N(, )
n
(b) Teorema Central do Limite
Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer distri-
buio de mdia e desvio padro , ento a mdia da amostra ( X ) ter uma distribuio aproxima-
damente normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n ve-
zes menor que o desvio padro da populao medida que o tamanho da amostra aumenta.
OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa,
para se poder utilizar este resultado.
Assim:
Se X tem qualquer distribuio ento X ter uma distribuio aproximadamente N(, )
n
para n grande (n 30).
Exemplos:
(1) Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10.
(a) Qual P(95 < X < 105)?
(b) Se X a mdia de 16 elementos extrada desta populao, qual a P(95 < X < 105) ?
Soluo:
(a) Como X uma N(100, 10) vem:
P(95 < X < 105) = P(-0,5 < Z < 0,5) = (0,5) - (-0,5) = 0,6915 - 0,3185 = 38,30%.
Neste caso X uma N(100; 2,5), ento:
(b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = (2,0) - (-2,0) = 0,9772 - 0,0228 = 95,44%.
(2) A renda de um conjunto de pessoas de uma certa regio tem mdia 6 s.m. e desvio padro
de 2 s.m. Se desta populao for extrada uma amostra de n = 100 pessoas, qual a probabilidade de a
mdia desta amostra acuse um valor superior a 6,3 s.m?
Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema
central do limite, uma vez que n = 100 > 30, isto possvel. A mdia da amostra ter uma distribuio
aproximadamente normal com mdia 6 s.m. e desvio padro de: 2 / 10 = 0,20, uma vez que o erro pa-

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


10
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

dro da mdia raiz de n vezes menor do que o desvio padro populacional. Ento, a probabilidade
pedida ser:
P( X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = (-1,5) = 6,68%, isto , apenas 6,68%
das mdias de amostras de tamanho n = 100 apresentaro um valor superior a 6,30 s.m.

1.2.2. Distribuio amostral da varincia


(1) Amostragem COM reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
extradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se- assim um conjunto de
16 valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir en-
to a distribuio amostral da varincia.
As possveis amostras com as respectivas varincias so:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)


x 1 2 3 3,5 3 4 4,5 5
s2 0 2 8 12,5 0 2 4,5 0
Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)
x 5,5 6 2 3 3,5 4 4,5 5,5
s2 0,5 0 2 8 12,5 2 4,5 0,5

Colocando estes resultados em uma tabela(distribuio amostral da varincia) vem:

s2 f(s2) = P(S2 = s2f(s2)


s2 )
0,0 4/16 0/16
0,5 2/16 1/16
2,0 4/16 8/16
4,5 2/16 9/16
8,0 2/16 16/16
12,5 2/16 25/16
1 59/16

Pela tabela segue que:


E(S2) = s2f(s2) = 59/16 = 3,6875 = 2, isto a expectncia (mdia) de todas as varincias das
amostras de tamanho n = 2, extradas com reposio da populao P, igual a varincia populacional
(parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a amostragem
com reposio a varincia amostral S2 um estimador no tendencioso da varincia populacional 2.
Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras
foram retiradas com reposio, pode-se usar a varincia amostral como estimador.
(2) Amostragem SEM reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
obtidas sem reposio.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


11
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

As possveis amostras com as respectivas varincias so:

Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)


x 2 3 3,5 4 4,5 5,5
s2 2 8 12,5 2 4,5 0,5
Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:

s2 f(s2) = P(S2 = s2f(s2)


s2 )
0,5 1/6 0,5/6
2,0 2/6 4,0/6
4,5 1/6 4,5/6
8,0 1/6 8,0/6
12,5 1/6 12,5/6
1 29,5/6

Pela tabela pode-se ver que:


E(S2) = s2f(s2) = 29,5/6 3,6875 = 2, isto a expectncia (mdia) de todas as varincias
das amostras de tamanho n = 2, extradas sem reposio da populao finita P, no igual a varincia
populacional (parmetro populacional varincia). Neste caso, para que se obtenha um estimador no
tendencioso da varincia populacional necessrio corrigir a varincia amostral atravs do fator (N - 1)
/ N. Assim se cada varincia acima for multiplicada por este fator, que neste caso ser, (N - 1) / N = 3 /
4 = 0,75, ento, se ter:

s 2 f( s2 ) = P(S 2 = s2 ) s2 f( s2 )


0,375 1/6 0,375/6
1,500 2/6 3,000/6
3,375 1/6 3,375/6
6,000 1/6 6,000/6
9,375 1/6 9,375/6
1 22,125/6

 2 ) = s 2 f( s 2 ) = 22,125 / 6 = 3,6875 = 2, isto a expectncia (mdia) de todas as varin-


E( S
cias corrigidas igual ao parmetro populacional 2. Assim quando a populao pequena e amostra-
gem for sem reposio necessrio corrigir a varincia da amostra pelo fator (N - 1) / N, para que ela
seja um bom estimador da varincia populacional. claro que esta correo s ser importante para
populaes pequenas. Se a populao for grande, por exemplo, N = 1000, ento o fator (N - 1) / N =
999 / 1000 = 0,999 o que aproximadamente 1. Neste caso, no necessrio usar esta correo e a
amostragem sem reposio pode ser considerada equivalente a com reposio para efeitos de estimao
da varincia populacional.
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distri-
buio das varincias amostrais. Neste caso necessrio procurar por modelos probabilsticos (fun-
es) que descrevam a distribuio da varincia amostral. Para a varincia este modelo existe e de-
nominado de distribuio Qui-quadrado (2).

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


12
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

1.2.3. Distribuio amostral da proporo


(1) Amostragem COM reposio
Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
obtidas com reposio. Para cada amostra vai-se calcular a proporo P de elementos pares na popula-
o. Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas
probabilidades, e que formaro ento a distribuio amostral da proporo.
As possveis amostras com as respectivas propores so:

Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)


p 0 0 0 1/2 0 0 1/2 0
Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)
p 1/2 1 0 0 1/2 0 1/2 1/2
Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:

p f(p) = P(P = p) pf(p) p2f(p)


0,0 9/16 0/16 0,0/16
0,5 6/16 3/16 1,5/16
1,0 1/16 1/16 1,0/16
1 4/16 2,5/16

Pode-se ento calcular a expectncia e a varincia:


E(P) = pf(p) = 4/16 = 0,25 = , isto o valor esperado (mdia) de todas as propores
amostrais, extradas com reposio da populao P, e igual a proporo populacional (parmetro po-
pulacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da
proporo populacional , quando as amostras so extradas com reposio da populao.
V(P) = p2f(p) - P2 = 2,5/16 - 0,252 = 0,09375 = (1 - ) / n, isto , a varincia entre as pro-
pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional. Isto porque
quando se est trabalhando com propores, pode-se mostrar que a varincia populacional igual a
(1 - ).
(1 )
O valor P = = 0,09375 denominado erro padro da proporo. Ele mede a va-
n
riabilidade entre as propores amostrais e d uma idia do erro que se comete ao se substituir a pro-
poro da populao pela proporo da amostra.

(2) Amostragem SEM reposio


Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2
extradas sem reposio.
As possveis amostras com as respectivas propores so:

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


13
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)


p 0 0 1/2 0 1/2 1/2

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:

p f(p) = P(P = p) pf(p) p2f(p)


0,0 1/2 0,0/2 0,00/2
0,5 1/2 0,5/2 0,25/2
1 0,5/2 0,25/2

Portanto:
E(P) = pf(p) = 0,5/2 = 0,25 = , isto a expectncia (mdia) de todas as propores amos-
trais, extradas sem reposio da populao P, e igual a proporo populacional (parmetro populaci-
onal ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da propor-
o populacional , quando as amostras so retiradas sem reposio.
(1 ) N n
V(P) = p2f(p) - P2 = 0,25/2 - 0,252 = 0,0625 = 2
.
N1
, isto , a varincia entre as pro-
pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada
pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia
da amostragem sem reposio sobre a amostragem com reposio que, neste exemplo, (N = 4 e n = 2)
vale 2/3.
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distri-
buio das propores amostrais. Nesta situao necessrio procurar por modelos probabilsticos que
descrevam a distribuio da proporo amostral. Neste caso, tambm, como declarado acima a distin-
o entre amostragem com e sem reposio no ser necessria, pois o fator de correo ser aproxi-
madamente um e no precisar ser utilizado.
O modelo probabilstico para a proporo amostral dada pelo seguinte resultado:
(a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo ,
ento a distribuio da proporo amostral ser aproximadamente normal com mdia P = e desvio
(1 )
padro P = n
.

OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa,
para se poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral
Binomial.
Exemplo:
(1) A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%. Ex-
trada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente um nmero de
eleitores do candidato
(a) Abaixo de 15% (b) Superior a 30%

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


14
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Soluo:
Como n > 30 pode-se usar a distribuio normal com mdia = = 20% e desvio padro
(1 ) 0,2(1 0,2)
= = = 0,04 = 4%, Ento:
n 100

(a) P(P < 15%) = P(Z < -1,25) = (-1,25) = 10,56%.


(b) P(P > 30) = P(Z > 2,5) = (-2,5) = 0,62%.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


15
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

2. ESTIMAO
A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base
em valores amostrais. A inferncia pode ser feita estimando os parmetros:
(a) Por ponto e
(b) Por intervalo.
A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por inter-
valo fornece um intervalo de valores em torno do valor da estimativa pontual.
Exemplo:
Uma amostra aleatria simples de 400 pessoas de uma cidade extrada e 300 respondem que
acham a administrao municipal boa ou tima. Ento o valor p = 300/400 = 75% uma estimativa por
ponto do percentual de pessoas da cidade que acham a administrao boa ou tima. Esta mesma esti-
mativa poderia ser enunciado como de: 70% a 80% das pessoas da cidade acham a administrao boa
ou tima. Neste caso, teramos uma estimativa por intervalo da proporo. Note-se que o centro do in-
tervalo o valor 75% da estimativa pontual.
2.1. P ROPRIEDADES DOS ESTIMADORES
Seja X uma populao com um parmetro de interesse e seja (X1, X2, ..., Xn) uma amostra
aleatria simples extrada desta populao. Seja  um estimador do parmetro . Ento:
(i) Se E( ) = se dir que  um estimador no-tendencioso ou no viciado do parmetro
populacional . Neste caso, a mdia do estimador  o parmetro populacional , ou ainda, pode-se
dizer que o estimador varia em torno do parmetro populacional.
(ii) Se  um estimador no tendencioso de um parmetro , se dir que  consistente se
medida que o tamanho da amostra aumenta a variabilidade do estimador diminui, isto , as observa-
es vo ficando cada vez mais concentradas em torno do parmetro na medida em que a amostra vai
ficando cada vez maior. Em smbolos:
lim V( ) = 0
n

2.2. E STIMAO POR PONTO


Seja X uma populao com mdia , desvio padro e com uma proporo e seja
(X1, X2, ..., Xn) uma amostra aleatria simples extrada desta populao. Ento:
(a) X um estimador no-tendencioso e consistente da mdia da populao .
(b) P um estimador no-tendencioso e consistente da proporo populacional .
(c) S2 estimador no-tendencioso e consistente da varincia da populao 2, a menos que a
N1 2
extrao seja sem reposio de populao finita. Neste caso, o estimador S 2 = S.
N

2.3. E STIMAO POR INTERVALO


O estimador por ponto no permite ter uma idia do erro cometido ao se fazer a estimativa do
parmetro. Para que se possa associar uma confiana (probabilidade) a uma estimativa necessrio

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


16
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

construir um intervalo em torno da estimativa por ponto. Este intervalo construdo baseado na distri-
buio amostral do estimador.

2.3.1. Da mdia populacional


) conhecido
(a) Desvio padro populacional (
O intervalo de confiana para a mdia () de uma populao construdo em torno da estima-
tiva pontual X . Para construir este intervalo fixa-se uma probabilidade 1 - de que o intervalo
construdo contenha o parmetro populacional. Desta forma, ser a probabilidade de que o inter-
valo obtido no contenha o valor do parmetro, isto , ser a probabilidade de erro. Sabe-se que a
mdia da amostra tem distribuio normal de mdia e desvio padro se a populao de onde
n
for extrada a amostra for normal (ou se a amostra for superior a 30 e retirada de qualquer populao )
de mdia e de desvio padro , pode-se ento utilizar a curva normal para estabelecer os limites para
o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional com
probabilidade 1 - tem-se ento:
P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a
/2.
Mas Z = ( X - ) / substituindo na expresso acima vem:
n
P(-z/2 < ( X - ) / < z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:
n
P( X - z/2 < < X + z/2 ) = 1 - . Que o intervalo procurado. Assim o intervalo
n n
de confiana (probabilidade) de 1 - para a mdia de uma populao dado por:
[ X - z/2 ; X + z/2 ] onde:
n n
X a estimativa por ponto da mdia da populao.
o desvio padro da populao e
z/2 o valor da distribuio normal padro cuja rea direita igual a /2, isto , o valor de
Z tal que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.
Exemplo:
Uma populao tem um desvio padro igual a 10 e mdia desconhecida. Uma amostra de ta-
manho n = 100 retirada e fornece uma mdia x = 50. Qual o intervalo de 95% de confiana para a
mdia desta populao?
Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


17
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Este valor vale 1,96. Ento o intervalo de confiana de 95% para a mdia desta populao
ser:
[ X - z/2 ; X + z/2 ] = [50 - 1,96.10/10; 50 + 1,96.10/10] = [50 - 1,96; 50 + 1,96] =
n n
[48,04; 51,96], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter
a mdia desta populao.
Obs.: O valor = z/2 denominado de erro padro da estimao. No confundir com o
n
valor que o erro padro da amostragem. O erro padro da estimao a semi-amplitude do in-
n
tervalo de confiana. A amplitude do intervalo de confiana (IC) ser; 2.
) desconhecido
(b) Desvio padro populacional (
Quando o desvio padro da populao () desconhecido necessrio utilizar sua estimativa
s. S que ao substituir-se o desvio padro populacional pelo sua estimativa no quociente:
( X - ) / no se ter mais uma normal padro. De fato, conforme demonstrado pelo es-
n
tatstico ingls W. S. Gosset, conhecido por Student o comportamento do quociente:
( X - ) / S segue uma distribuio simtrica em torno de zero, porm com uma variabili-
n
dade maior do que a da normal padro. A distribuio do quociente acima conhecida como distribui-
o t de Student.
Na realidade existem infinitas distribuies t, uma para cada tamanho de amostra. Estas
distribuies a exemplo da normal padro encontram-se tabeladas.
A tabela para a distribuio t segue uma metodologia um pouco diferente daquela da normal
padro. De fato, como existem muitas distribuies de Student no seria possvel tabel-las da mesma
forma que a da normal padro. Assim cada linha de uma tabela representa uma distribuio diferente e
cada coluna representa um valor de confiana que poder ser ou /2, isto , a tabela poder ser
unilateral ou bilateral. A linha de cada tabela fornece a distribuio t com parmetro n - 1 denomi-
nado de graus de liberdade, isto , o grau de liberdade = = n - 1 = linha da tabela.
Neste caso, o intervalo de confiana com probabilidade 1 - para a mdia ser:
[ X - t/2 S ; X + t/2 S ] onde:
n n

X a estimativa por ponto da mdia da populao;


S o desvio padro da amostra e uma estimativa do desvio padro da populao e
t/2 o valor da distribuio t cuja rea direita igual a /2, isto , o valor de t tal que:
P(t > t/2) = /2, ou ento: P(- t/2 < t < t/2) = 1 - .

Exemplo:
Uma amostra de tamanho 25 foi retirada de uma populao com o objetivo de estimar a sua
mdia e forneceu os valores x = 50 e s = 10. Qual o intervalo de 95% de confiana para a mdia desta
populao?

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


18
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na distribuio t com = n - 1 = 25 - 1 = 24. Esta a linha da tabela. A coluna poder ser o
valor = 5% ou ento o valor / 2 = 2,5%, dependendo do tipo de tabela. Em qualquer caso o que se
procura o valor t com grau de liberdade igual a 24, isto , o valor t24 tal que:
P(- t/2 < t24 < t/2) = 95%
Este valor vale 2,064. (Note-se que na a normal este mesmo valor valia 1,96). Ento o inter-
valo de confiana de 95% para a mdia desta populao ser:
[ X - t/2 S ; X + t/2 S ] = [50 - 2,064.10/5; 50 + 2,064.10/5] = [50 - 4,13; 50 + 4,13] =
n n
[45,87; 54,13], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conter a mdia
desta populao.
Convm notar que a ltima linha da tabela da distribuio t apresenta valores coincidentes
com aqueles que seriam obtidos se fosse utilizado a distribuio normal padro. Isto ocorre porque a
distribuio t tende a distribuio normal medida que o tamanho da amostra aumenta, isto , a dis-
tribuio normal o limite da distribuio t quando o tamanho da amostra tende ao infinito.
Esta aproximao j ser bastante boa para amostras de tamanho n > 30. Assim se a amostra
for superior a 30 pode-se utilizar a distribuio normal ao invs da distribuio t, isto , pode-se ler
os valores na normal padro, ou ento na ltima linha da tabela t.

2.3.2. Da proporo populacional


Seja P = proporo amostral. Sabe-se que para n > 30 a distribuio amostral de P aproxi-
(1 )
madamente normal com mdia P = e desvio padro (erro padro) P = n
. Pode-se ento utili-
zar a curva normal para estabelecer os limites para o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional com
probabilidade 1 - ento tem-se:
P(-z/2 < Z < z/2) = 1 - , onde z/2 o valor da normal padro com rea direita igual a
/2.
Mas Z = (P- P) / P ento substituindo na expresso acima vem:
P(-z/2 < (P - P) / P < z/2 ) = 1 - . Trabalhando esta desigualdade, segue que:
P(P - z/2P < P <P + z/2P) = P(P - z/2P < <P + z/2P) = 1 - . Que o intervalo procu-
rado. Assim o intervalo de confiana (probabilidade) de 1 - para a proporo P de uma popula-
o dado por:
(1 ) (1 )
[P- z/2 ; P + z/2 ].
n n
Observando-se a expresso acima pode-se perceber que o intervalo de confiana para a pro-
poro populacional , depende dele mesmo, isto , necessrio calcular o erro amostral que est ex-
presso em funo de . Como o objetivo estimar este valor, evidentemente ele no conhecido. As-

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


19
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

sim necessrio utilizar, sua estimativa P , isto , necessrio substituir por P na expresso P =
(1 )
. Desta forma o intervalo acima ficar:
n

P(1 P) P(1 P)
[P- z/2 ; P + z/2 ], onde:
n n

P a estimativa por ponto da proporo populacional .


P(1 P)
P = n
uma estimativa do erro padro, isto , do desvio padro amostral e

z/2 o valor da distribuio normal padro cuja rea direita igual a /2. o valor de Z tal
que: P(Z > z/2) = /2, ou ento: (-z/2) = /2.
Exemplo 1:
Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferncia por deter-
minado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de con-
fiana de 95% de probabilidade para o percentual de preferncia dos consumidores em geral para este
produto.

Soluo:
Tem-se 1 - = 95%, ento = 5% e / 2 = 2,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 2,5%, ou ento: (-z/2) = 2,5%.
Este valor vale 1,96. A estimativa por ponto para a proporo populacional ser: p = f/n =
240/400 = 0,60 = 60%.
Ento o intervalo de confiana de 95% para a proporo populacional ser:
P(1 P) P(1 P) 0,60(1 0,60 ) 0,60(1 0,60 )
[P- z/2 ; P + z/2 ] = [0,60 - 1,96 .; 0,60 + 1,96 ]
n n 400 400
= [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de
95% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos con-
sumidores que preferem o produto pesquisado.
Exemplo 2:
Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em relao
ao consumo de um determinado produto, colheu-se uma amostra aleatria de 300 consumidores da ci-
dade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporo popu-
lacional de consumidores do produto.

Soluo:
Tem-se 1 - = 99%, ento = 1% e / 2 = 0,5%. O coeficiente de confiana que deve ser
buscado na normal padro valor z/2 de Z tal que:
P(Z > z/2) = 0,5%, ou ento: (-z/2) = 0,5%.
Este valor vale 2,575. A estimativa por ponto para a proporo populacional ser: p = f/n =
180/300 = 0,60 = 60%.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


20
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

Ento o intervalo de confiana de 99% para a proporo populacional ser:


P(1 P) P(1 P) 0,60(1 0,60 ) 0,60(1 0,60 )
[P- z/2 ; P + z/2 ] = [0,60 - 2,58 .; 0,60 + 2,58 ]
n n 300 300
= [60% - 7,28% ; 60% + 7,28%] = [52,72%; 67,28%], ou seja, pode-se afirmar com uma certeza de
99% de que este intervalo conter a proporo populacional, isto , a verdadeira percentagem dos con-
sumidores que preferem o produto pesquisado.

2)
2.3.3. Da varincia populacional (
Sabe-se que o estimador no-tendencioso de 2 S2 e que E(S2) = 2, enquanto
V (S2) = 22/(n -1). No entanto, para se construir um intervalo de confiana para 2 necessrio, ainda
conhecer qual o comportamento de S2 , isto , qual o modelo terico (probabilstico) seguido pelo
estimador. Assim antes de se construir um intervalo de confiana para a varincia populacional ne-
cessrio se conhecer um novo modelo probabilstico denominado de qui-quadrado e representado por
2 (c grego).
A distribuio qui-quadrado
A distribuio ou modelo qui-quadrado pode ser obtida de uma soma de variveis normais
n
padronizadas, isto , 2n = Zi2 .
i =1

A distribuio assimtrica positiva (possu uma cauda direita) e de depende do parme-


2

tro . Sabe-se tambm que:


E(2) = e que V(2) = 2.
A figura 2.1 mostra alguns exemplos de modelos qui-quadrado.

0,8

0,6

0,4

0,2

0
0,0

0,7
1,4

2,1

2,8
3,5

4,2

4,9

5,6
6,3

7,0

7,7

8,4
9,1

9,8

Figura 2.1 - Algumas distribuies qui-quadrado

A comportamento, distribuio de probabilidade, apresentado pela varincia amostral (S2) est


relacionado com a distribuio (modelo) 2 atravs do seguinte resultado:

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


21
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(n 1) S2
2n 1 = , isto , a varincia segue uma distribuio 2 com "n - 1" graus de liberdade a
2

menos de uma constante. Neste caso = n -1.


Tabelas
A distribuio 2 est tabelada em funo do grau de liberdade n - 1 = (linha da tabela) e
rea sua direita, isto , P(2 > c) = . Na realidade o que est tabelado a funo inversa da 2, isto ,
entrando com o valor do parmetro (graus de liberdade) e uma determinada probabilidade (rea), a ta-
bela fornece um valor da varivel (abscissa) tal que a probabilidade direita (rea) deste valor seja
igual a rea especificada.

O intervalo
Suponha que seja fixado um nvel de confiana de 1 - e que 12 e 22 sejam dois valores
da distribuio 2 tais que P( 12 < 2 < 22 ) = 1 - .

P( 12 < 2 < 22 ) = 1 -

(n 1) S2
P( 12 < < 22 ) = 1 -

2

P(
1
< 2 1
< 2)=1-
22 (n 1) S2
1

(n 1) S2 (n 1) S2
P( < 2 < )=1-
22 12
Assim o intervalo de confiana (probabilidade) de 1 - para a varincia da populao
dado por:
(n 1) S2 (n 1) S2
;
2 12
2

)
2.3.4. Do desvio padro populacional (
Para determinar um intervalo de confiana de "1 - " de probabilidade para o desvio padro
populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para a varincia po-
pulacional. Assim o intervalo ser:
(n 1) S2 (n 1) S2
;
22 12

O significado deste intervalo :

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


22
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(n 1) S2 (n 1) S2
P << = 1 .
22 12

Exemplo:
Uma amostra extrada de uma populao normal forneceu uma varincia de s2 = 8,38. Deter-
minar um intervalo de confiana de 90% para a varincia da populao e um intervalo de mesma con-
fiabilidade para o desvio padro da populao.

Soluo.
Neste caso necessrio inicialmente determinar os valores da distribuio 2, de modo, que
12 tenha uma rea (probabilidade) direita igual a 95% e 22 tenha uma rea (probabilidade) direita
igual a 5%. Estes valores so: 12 = 3,940 e 22 = 18,307.

O intervalo de confiana, para a varincia, ser:


(n 1) S2 (n 1) S2
;
2 12
2

(11 1).8,38 (11 1).8,38


18,307 ; 3,940

[4,58; 21,27]
O intervalo de confiana, para o desvio padro, ser:
(n 1) S2 (n 1) S2
;
22 12

(11 1).8,38 (11 1).8,38


;
18,307 3,940

4,58; 21,27; ]
[2,14; 4,61].

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


23
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

3. EXERCCIOS
(01) De uma populao com N = 12 elementos retirada uma amostra aleatria simples, sem re-
posio, de n = 5.
(01.1) Quantas so as possveis amostras?
(01.2) Qual a probabilidade de cada uma destas amostras ser selecionada?
(02) Uma populao composta dos elementos: A, B, C, D e F.
(02.1) Liste todas as possveis amostras aleatrias simples, sem reposio, com n = 2.
(02.2) Liste todas as aas, sem reposio, de tamanho n = 3.
(02.3) Determine a probabilidade de ser sorteada a amostra BC.
(02.4) Determine a probabilidade de ser sorteada a amostra ACD.
(03) A tabela, ao lado, a distribuio de freqncias de uma amostra
proveniente de determinada populao. X f
1 40
(03.1) Determine o tamanho da amostra.
2 45
(03.2) Determine uma estimativa da mdia da populao.
3 8
(03.3) Determine uma estimativa da varincia da populao.
4 7
(03.4) Determine uma estimativa da proporo de valores pares na
populao.

(04) A tabela ao lado apresenta valores amostrais. Elementos X


(04.1) Qual o tamanho da amostra? A 5
(04.2) Determine uma estimativa para a mdia da populao. B 7
(04.3) Determine uma estimativa do desvio padro populaci- C 12
onal. D 15
(04.4) Determine uma estimativa dos valores mpares de X. E 10

(05) Uma populao formada pelos elementos: A = 3, B = 6, C = 9 e D = 12.


(05.1) Determine os seguintes parmetros:
(a) mdia,
(b) varincia e
(c) proporo de elementos menores que 8.
(05.2) (a) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de
tamanho n = 2.
(b) Determine a expectncia e a varincia da distribuio amostral em (a)
(c) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, de
tamanho n = 3.
(d) Determine a expectncia e a varincia da distribuio amostral em (c)
(5.3) (a) Construa a distribuio amostral da varincia amostral utilizando aas, sem reposio, de
tamanho n = 2 e determine a sua expectncia.
(b) Utilize a correo de populao finita para as varincias obtidas em (a) obtendo a distri-
buio amostral da varincia corrigida e determine sua expectncia.
(c) Construa a distribuio amostral da varincia corrigida utilizando aas, sem reposio, de
tamanho n = 3 e determine sua expectncia.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


24
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(d) Utilize a correo de populao finita para as varincias obtidas em (c) obtendo a distri-
buio amostral da varincia corrigida e determine sua expectncia.
(5.4) (a) Construa a distribuio amostral para o estimador da proporo de elementos menores
que 8 utilizando aas, sem reposio, de tamanho n = 2.
(b) Determine a expectncia e a varincia da distribuio em (a).
(c) Construa a distribuio amostral para o estimador da proporo de elementos menores
que 8 utilizando aas, sem reposio, de tamanho n = 3.
(d) Determine a expectncia e a varincia da distribuio em (c).
(06) Utilize os valores da amostra tabelada ao lado, extrada aleatoriamente e
X f
sem reposio, de uma populao com N = 2000 elementos, para estimar:
0 |-- 2 27
(06.1) A mdia da populao. 2 |-- 4 51
(06.2) A varincia da populao. 4 |-- 6 49
(06.3) O percentual de elementos menores que 6. 6 |-- 8 48
(06.4) O erro amostral da mdia. 8 |-- 10 25
(07) De uma populao com N = 4000 pessoas de uma regio foi obtida uma
amostra aleatria, sem reposio, de 400 pessoas que revelou 60 analfabetos. Estime:
(07.1) A proporo de analfabetos da regio.
(07.2) O erro amostral do estimador proporo.
(08) Uma aas de tamanho 900 extrada de uma populao bastante grande apresentou 40% de pessoas
do sexo masculino. Estime o erro amostral do estimador proporo de pessoas do sexo masculino.
(09) Uma populao tem mdia 500 e desvio padro 30.
(09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor mdio supe-
rior a 504,50.
(09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar mdia entre 492,5 e
507,5.
(09.3) Se uma aas de n = 144 for extrada desta populao, qual o percentual de mdias amostrais
que estaro entre 495,5 e 504,5?
(10) Uma populao normalmente distribuda com mdia 800 e desvio padro 60.
(10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar mdia menor que 780.
(10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha mdia entre os valores
781,4 e 818,6.
(10.3) Que percentual de mdias amostrais de uma amostra de tamanho n = 25 estaro no intervalo
[776; 824]?
(11) A proporo de eleitores de um candidato 20%.
(11.1) Qual a probabilidade de uma amostra aleatria simples de 100 eleitores apresentar uma pro-
poro amostral superior a 26%?
(11.2) Qual a probabilidade de uma amostra aleatria simples de 400 eleitores apresentar uma pro-
poro de eleitores do candidato entre 17% e 23%?
(11.3) Se a amostra aleatria for de 625 eleitores, qual a percentual de valores do estimador pro-
poro amostral que estaro no intervalo [0,16864; 0,23136]?
(12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a proba-
bilidade de que das prximas 400 crianas a nascerem:

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


25
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(12.1) Menos de 45% sejam meninas.


(12.2) Mais de 54% sejam meninos.
(13) De uma distribuio normal com varincia 2,25, obteve-se a seguinte amostra:
27,5; 25,6; 28,2; 26,1 e 25,0
Determinar um intervalo de confiana para a mdia desta populao com confianas de:
(13.1) 95% (13.2) 99%
(14) Atravs de uma aas de 145 profissionais de certa regio, verificou-se que o salrio mdio de 8
salrios mnimos (s.m.) com um desvio padro de 1,8 s.m. A amostra tambm forneceu a informa-
o de que 70% dos profissionais eram casados.
(14.1) Determine e interprete o intervalo de confiana de 95% para o salrio mdio de todos os
profissionais desta regio.
(14.2) Determine e interprete o intervalo de confiana de 99% para a proporo de profissionais
casados desta regio?
(14.3) Determine e interprete um Intervalo de Confiana de 90% para 2.
(15) A amostra apresenta os valores da varivel tamanho da famlia coleta- X f
dos atravs de uma aas em uma vila popular. 3 10
(15.1) Determine e interprete o intervalo de confiana de 95% para o pa- 4 14
rmetro tamanho familiar mdio por domiclio da vila. 5 19
(15.2) Determine e interprete o intervalo de confiana de 90% para o pa- 6 15
rmetro proporo de domiclios da vila com tamanho igual ou su- 7 07
perior a cinco.
(16) A varincia de uma populao 150. Deseja-se obter um intervalo de confiana para a mdia da
populao com uma confiabilidade de 95% e um erro mximo de 2. Quantos valores desta popula-
o devem ser retirados aleatoriamente?
(17) Quer-se estimar a mdia de uma populao de varincia desconhecida atravs de um intervalo de
confiana de 95% e com erro de estimao mximo de 5 unidades. Atravs de uma amostra piloto
de 100 valores a varincia foi estimada em 400 unidades. Que tamanho deve ter a amostra final?
(18) Uma amostra preliminar de pessoas de uma determinada comunidade apresentou 18% de analfa-
betos. Com este resultado quer-se estimar a proporo de analfabetos da populao com uma con-
fiabilidade de 95% e com um erro de estimao mximo de 2,5%. Qual o tamanho da amostra a
ser utilizada?
(19) De uma populao normalmente distribuda foi extrada uma aas de n = 10 que apresentou os va-
lores abaixo:
4 8 12 5 7 9 10 11 6 8
(19.1) Determine uma estimativa da varincia populacional.
(19.2) Determine uma estimativa da mdia populacional e do correspondente erro amostral?
(19.3) Determine um intervalo de confiana de 95% para a mdia desta populao.
(20) A tabela apresenta os valores de uma amostra retirada de uma populao
normal. Determine: X f
04 |-- 08 8
(20.1) Um intervalo de confiana de 95% para a mdia desta populao.
08 |-- 12 8
(20.2) Um intervalo de confiana de 99% para a mdia desta populao. 12 |-- 16 6
16 |-- 20 4

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


26
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

4. RESPOSTAS DOS EXERCCIOS


(01) (1.1) 792 (1.2) 1/792
(02) (2.1) AB AC AD AE BC BD BE CD CE DE
(2.2) ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE
(2.3) 1/10 (2.4) 1/10
(03) (3.1) 100 (3.2) 1,82 (3.3) 0,73 (3.4) 0,52 = 52%
(04) (4.1) 5 (4.2) 9,80 (4.3) 3,96 (4.4) 0,60 = 60%
(05) (5.1) (a) = 7,50 (b) 2 = 11,25 (c) = 0,50
(5.2)
(a) x 6 7 8 9
f( x ) 1/4 1/4 1/4 1/4
(b) E( X ) = 7,50 V( X ) = 3,75
(c) x 4,5 6,0 7,5 9,0 10,5
f( x ) 1/6 1/6 2/6 1/6 1/6
(d) E( X ) = 7,50 V( X ) = 1,25
(5.3)
(a) s2 4,5 18,0 40,5
f(s2) 3/6 2/6 1/6
E(S2) = 15 2
(b) s 2 3,375 13,500 30,375
f( s 2) 3/6 2/6 1/6
 2 ) = 11,25 = 2
E( S
(c) s2 9 21
f(s2) 1/2 1/2
E(S2) = 15 2
(d) s 2 9 17
f( s 2) 1/2 1/2
E( S 2 ) = 11,25 = 2
(5.4)
(a) p 0 0,5 1
f(p) 1/ 4/ 1/
6 6 6
(b) E(P) = 0,50 V(P) = 1/12

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


27
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

(c) p 1/3 2/3


f(p) 1/2 1/2
(d) E(P) = 0,50 V(P) = 1/36
(06) (6.1) x = 4,93 (6.2) s2 = 6,1628 (6.3) p = 63,50% (6.4) 0,1666
(07) (7.1) 60/400 = 15% (7.2) 1,69%
(08) 1,63%
(09) (9.1) 6,68% (9.2) 95,44 (9.3) 92,82%
(10) (10.1) 15,87% (10.2) 78,50% (10.3) 95,44%
(11) (11.1) 6,68% (11.2) 86,64% (11.3) 95%
(12) (12.1) 2,28% (12.2) 5,48%
(13) (13.1) [25,17; 27,79] (13,2) [24,75; 28,21]
(14) (14.1) [7,71; 8,29] Tem-se 95% de certeza de que o salrio mdio de todos os profissionais da
rea est entre 7,71 s.m. e 8,29 s.m.
(14.2) [60,20%; 79,80%] Tem-se 99% de confiana de que a percentagem de profissionais da rea
que so casados esteja entre 60,20% e 79,80%.
(14.3) [2,70; 3,98]. Tem-se 90% de confiana de que o valor da varincia populacional pertena a
este intervalo.
(15) (15.1) [4,62; 5,22] Tem-se 95% de confiana de que o valor mdio do tamanho familiar da vila
esteja entre 4,62 e 5,22 membros.
(15.2) [53,23%; 72,93%] H 90 de certeza de que o percentual de famlias com 5 ou mais mem-
bros esteja entre 53,23% e 72,93%.
(16) n = 145
(17) n = 62, como a amostra piloto utilizada foi de n = 100 mais confivel ficar com a amostra piloto.
(18) n = 908
(19) (19.1) 6,67 (19.2) 8 e 0,82 (19.3) [6,15; 9,85]
(20) (20.1) [9,19; 12,65] (20.2) [8,58; 13,26]

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


28
SRIE: Estatstica Bsica
Texto 3: AMOSTRAGEM & ESTIMAO

5. REFERNCIAS
[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual,
1986.
[HOF80] HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora,
1980.
[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977.
[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos te-
ricos, exerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher, 1974.
[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Econo-
mics. IRWIN, Boston, 1990.
[MEY78] MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B.
Loureno Filho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978
[STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra,
1981.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de
Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.

Prof. Lor Viali - viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/


29