Professional Documents
Culture Documents
Introdução ................................................................................................................................................ 2
Aplicações ............................................................................................................................................... 6
Aplicação ................................................................................................................................................. 8
Estimação................................................................................................................................................. 9
Intervalos de confiança para a média de uma população normal com variância conhecida ................. 11
Conclusão .............................................................................................................................................. 14
1
Introdução
A amostragem e a estimação são dois conceitos fundamentais em estatística que estão intimamente
relacionados. A aceitação envolve a selecção de uma parte da população para ser tratada, enquanto
a interrupção é o processo de usar as informações transitórias na amostra para fazer inferências
sobre a população como um todo.
Após seleccionar uma amostra, os dados são colectados e, em seguida, as estimativas são feitas
usando esses dados. A restrição pode ser feita para um único parâmetro, como a média ou
proporção da população, ou para vários parâmetros simultaneamente.
Objectivo geral:
Objectivos específicos:
Metodologia
Quanto a metodologia usada para elaboração deste trabalho foi necessária a consulta de obras
bibliográficas e pesquisas feita na internet, que consistiu na recolha, critica e interpretação dos dados
cujas referências estão citadas dentro do trabalho e na referência bibliográfica.
2
Teoria da amostragem – distribuição amostral dos estimadores
A teoria da amostragem é um estudo das relações existentes entre uma população e as amostras dela
extraída. É útil em:
Estimação de parâmetros populacionais;
Determinação das causas de diferenças observadas entre amostras.
Constitui o que chamamos de estatística indutiva ou inferência estatística que consiste em
inferir conclusões importantes sobre uma população a partir da análise de resultados observados em
amostras aleatórias. Como toda conclusão deduzida a partir da amostragem é acompanhada de um
grau de incerteza ou risco, o problema fundamental da inferência estatística é medir este grau de
incerteza ou risco das generalizações.
Parâmetro: medida numérica que descreve uma população. Genericamente representado por θ.
Exemplos: média ( ), variância ( 2 ).
Estatística ou estimador: medida numérica que descreve uma amostra. Genericamente
representado por ˆ. Exemplos: média ( x ), variância ( S 2 ).
Estimativa: valor numérico de um estimador.
Erro amostral: erro que ocorre pelo uso da amostra. Denotado por e definido por: ˆ .
n x1
n x2 Distribuição
amostral de
n x3 x
n x4
⁝
Repetir esse processo
População para todas as amostras
de tamanho n
3
Distribuição amostral das médias
As médias x das amostras de tamanho n retiradas de uma população com média e desvio
padrão formam a distribuição amostral com os seguintes parâmetros:
O valor esperado ou média é igual à média populacional: E x x .
2 à variância populacional dividida pelo tamanho da amostra:
A variância2 é igual
Var(x) x .
n
OBS: Se a população é finita e de tamanho N conhecido, e se a amostragem é feita sem
Observemos pelas fórmulas apresentadas que quanto maior o tamanho da amostra, menor será a
variância de x , ou seja, o estimador x será mais preciso à medida que o tamanho da amostra
aumentar.
4
Teorema do limite central
xi
Zi ou Zi xi
N n
n n N 1
5
Aplicações
1. Voltando ao problema inicial, onde uma máquina enchia pacotes cujos pesos seguiam uma
distribuição normal N(500,100). Colhendo-se uma amostra de n = 100 pacotes e pesando-os, x
terá uma distribuição normal com média 500 e variância 100/100 = 1. Logo, se a máquina
estiver regulada, a probabilidade de encontrarmos a média de 100 pacotes diferindo de 500 g de
menos de 2 gramas será
P x 500 2 P 498 x 502 P(2 z 2) 95%
Ou seja, dificilmente 100 pacotes terão uma média fora do intervalo (498,502). Caso isto ocorra,
podemos considerar como um evento raro, e será razoável supor que a máquina esteja
desregulada.
2. Admite-se que as alturas de 3000 estudantes do sexo masculino de uma universidade são
normalmente distribuídas, com a média 172,72 cm e o desvio padrão 7,62 cm. Se forem obtidas
80 amostras de 25 estudantes cada uma, quais serão a média e o desvio padrão esperados da
distribuição amostral das médias resultantes se amostragem for feita: (a) com reposição; (b)
sem reposição?
Solução:
6
Dimensionamento de uma amostra
Muitas vezes é importante sabermos qual deverá ser o tamanho de uma amostra de modo a
obter um erro de estimação previamente estipulado com determinado grau de confiança dos
resultados obtidos.
Exemplo: Seja X : N 1200,840 . Qual deverá ser o tamanho de uma amostra de tal forma que
P 1196 x 1204 0, 90 ?
x 1200
Solução: Se 1200 e 840
2
840 28, 98
x
n n
Para o intervalo dado temos que x 4
x 4
Como z e z z 0,45 1, 64 , segue-se que 1, 64 n 141,13 .
x
28, 98
n
Concluímos que, se retirarmos uma amostra de 141 elementos da população X, teremos 90% de
confiança que x estará no intervalo (1196,1216) e P x 1196 0, 05 ou P x 1216 0, 05 ;
isto significa que o risco que corremos de que o valor da média caia fora do intervalo anterior é de
10%.
Sejam duas populações independentes com distribuição amostral das médias dadas por
1 2 2 2
x1 N 1, e x2 N 2 , .
n 1 n 2
x1 x 2 N 1 2 , 1 2
n1 n2
x x
será z
1 2 1 2
A distribuição normal padrão para x1 x 2 i
1 2
2 2
n1 n2
Aplicação: Numa escola A, os alunos submetidos a um teste obtiveram média 70 com desvio
padrão 10. Em outra escola B, os alunos submetidos ao mesmo teste obtiveram média 65 com
desvio padrão 15. Se colhermos na escola A uma amostra de 36 alunos e na B, uma de 49 alunos,
qual é a probabilidade de que a diferença entre as médias seja superior a 6 unidades? Resp. 0,3557
7
Distribuição amostral das proporções
Verificou-se que 2% das ferramentas produzidas por certa máquina são defeituosas. Qual é a
probabilidade de, em uma remessa de 400 dessas ferramentas, revelarem-se defeituosas:
(a) 3% ou mais;
(b) 1,5 % ou menos?
Solução:
pq 0, 02 0, 98
Temos: p̂ p 0, 02 e p̂ 0, 007 .
n 400
0, 03 0, 02
(a) Calculando a variável padronizada z para p̂ 1 = 0,03: z1 1, 43
0, 007
P( p̂ 0, 03) P z 1, 43 0, 5 0, 4236 0, 0764 ou 7,64%
0, 015 0, 02
(b) Calculando a variável padronizada z para p̂ 1 = 0,015: z1 0, 71
0, 007
P( p̂ 0, 015) P z 0, 71 0, 5 0, 2611 0, 2389 ou 23,89 %
8
Distribuição amostral da soma, ou diferença, entre duas proporções
Sabemos da distribuição amostral das proporções que para amostras suficientemente grandes,
p̂ p1q1 p2q2
ˆ
1 N p1, e p2 N p2 , .
n1 n2
Considerando amostras independentes das duas populações, temos:
p̂ p̂
N p p ,
p1q1 p2 q2
1 2 1 2
n 1 n2
p̂1 p̂2 p1 p2 .
A distribuição normal padrão para p̂1 p̂2 será zi
p1q1 p2q2
n1 n2
Estimação
Um dos métodos para realizar inferências a respeito dos parâmetros é a estimação, que
determina estimativas dos parâmetros populacionais.
Existem dois tipos de estimação de um parâmetro populacional: estimação por ponto e a
estimação por intervalo.
A partir das observações, usando o estimador, procura-se encontrar um valor numérico único
(estimativa) que esteja bastante próximo do verdadeiro valor do parâmetro.
Este procedimento não permite julgar a magnitude do erro que podemos estar cometendo, mas
a distribuição por amostragem dos estimadores torna possível o estudo das qualidades do estimador.
n 1 i1 i
Desvio padrão () S
1 n i
x x 2
n 1 i1
Proporção (p) x
p̂ , onde
n
x = número de elementos da amostra que possuem a
característica
n = tamanho da amostra
9
Exemplo: Para avaliar a taxa de desemprego em determinado estado, escolhe-se uma amostra
aleatória de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a
proporção de desempregados em todo o estado.
87
p̂ 0, 087
1000
Procura determinar um intervalo que contenha o valor do parâmetro populacional, com certa
margem de segurança. Este procedimento permite julgar a magnitude do erro que podemos estar
cometendo.
Com base na amostra, uma maneira de expressar a precisão da estimação é calcular os limites
de um intervalo, o Intervalo de Confiança (IC), tais que (1 ) seja a probabilidade de que o
verdadeiro valor do parâmetro esteja contido nele.
Portanto,
: grau de desconfiança, nível de incerteza ou nível de significância.
1 : coeficiente de confiança ou nível de confiabilidade;
Os limites deste intervalo são variáveis aleatórias, pois dependem da amostra selecionada. Um
intervalo deste tipo é denominado intervalo de 1 - α (100)% confiança para o parâmetro .
Valores de mais comumente usados são
= 0,10 1 – = 0,90 ou 90%
= 0,05 1 – = 0,95 ou 95%
= 0,01 1 – = 0,99 ou 99%
A precisão com que se conhece depende da amplitude deste intervalo dada por S – I. Quanto
menor esta amplitude melhor determinado estará o parâmetro.
INTERVALOS DE CONFIANÇA
AMOSTRA
1 ( )
2 ( )
3 ( )
4 ( )
5 ( )
6 ( )
7 ( )
...
10
Intervalos de confiança para a média de uma população normal com variância conhecida
Consideremos uma população normal com média desconhecida que desejamos estimar e com
variância conhecida, X N ?, 2 .
Procedimento para a construção do IC:
1. Retiramos uma amostra casual simples de n elementos.
2. Calculamos a média da amostra x .
3. Calculamos o desvio padrão da média amostral: .
n
4. Fixamos o nível de significância , e com ele determinamos z , tal que
P z z , ou seja, P z z e P z z .
2 2
Logo, devemos ter P z z 1
2
1 2
z z
de 1 (100)%
Neste caso o Intervalo de Confiança para é dado por:
xz , xz
n n
Usando uma notação mais simples, teremos IC , 1 % 1 , 2 .
Exemplos:
1. A duração de vida de uma peça de equipamento é tal que 5 horas. Foram amostradas
aleatoriamente 100 dessas peças, obtendo-se média de 500 horas. Desejamos construir um intervalo
de confiança para a verdadeira duração média da peça com um nível de 95% de confiança.
11
O gráfico da distribuição normal padrão será:
D istribuição N orm al (0 ,1 )
0 ,95
z = 1,96 corresponde à área 0,475
0 ,025
-1 ,96 0 1 ,96
Para os casos de populações finitas, multiplica-se o desvio padrão pelo fator de correção,
gerando o IC:
x z N n x z
N 1 ,
N n
n n N 1
2. Admitindo os mesmos dados do exemplo anterior, consideremos como população a produção
de 1000 peças. Nesse caso o intervalo para a média será (499,07;500,93), conforme os cálculos
abaixo.
500 1, 96 5 . 1000 100 e 500 1, 96 5 . 1000 100
1000 1 1000 1
1 2
100 100
Logo, o intervalo (499,07;500,93) contém a duração média das 1.000 peças com 95% de
confiança.
Se n é suficientemente grande (em geral, n > 30), mesmo sem conhecermos a distribuição da
população, os limites do Intervalo de Confiança para a média ( ) poderão ser calculados com base
na distribuição Normal padrão. Da mesma forma podemos utilizar o desvio padrão amostral S no
lugar de (desvio-padrão populacional), caso este não seja conhecido.
12
Intervalo de confiança para a proporção
x
p̂ tem distribuição aproximadamente
Lembremos quepqquando
p populacional é conhecida, n
normal, p̂ . Para construirmos o IC para p desconhecida, determinamos p̂ na amostra
N p,
n
e consideramos pˆ
p̂q̂
.
n
p̂ p
Logo, ao nível de significância, P z z 1 , onde z .
p̂
Desenvolvendo os cálculos, como foi feito para a média, chegamos à formula do IC para a
proporção p populacional.
IC p, 1 % p , p = p̂ z
p̂q̂
; p̂ z p̂q̂
1 2
n
n
Exemplo:
Para se estimar a porcentagem de alunos de um curso favoráveis à modificação do currículo
escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis.
a. Faça um IC para a proporção de todos os alunos do curso favoráveis à modificação ao
nível de 4% de significância.
b. Qual o valor do erro de estimação ocorrido no intervalo acima?
p̂ p̂
p̂
2, 05 0, 04 0, 082 8, 2%
O erro de estimação cometido em (a) é de 8,2% para 96% de confiança e uma amostra de
100 alunos.
13
Conclusão
A amostragem e a estimação são dois conceitos fundamentais em estatística que estão intimamente
relacionados. A aceitação envolve a selecção de uma parte da população para ser tratada, enquanto
a interrupção é o processo de usar as informações transitórias na amostra para fazer inferências
sobre a população como um todo.
Após seleccionar uma amostra, os dados são colectados e, em seguida, as estimativas são feitas
usando esses dados. A restrição pode ser feita para um único parâmetro, como a média ou
proporção da população, ou para vários parâmetros simultaneamente.
14
Referências bibliográficas
BUSSAB, Wilton de O. (2006). Estatística Básica. (5ª ed). São Paulo: Saraiva
MARTINS, Gilberto de A. (2005). Estatística Geral e Aplicada. (3ª ed). São Paulo: Atlas
MORETTIN, L. (2000). Estatística Básica – Volume 2 – Inferência. São Paulo: Pearson Makron
Books
SPEIGEL, Murray R. (1993). Estatística. (3ª ed). São Paulo: Pearson Makron Books, 1993.
15