You are on page 1of 8

NOÇÕES DE AMOSTRAGEM

APRESENTAÇÃO
1. Motivação
2. Alguns conceitos
3. Planejamento de pesquisa
4. Principais casos da amostragem não-probabilística
5. Principais casos da amostragem probabilística
6. Ilustrações
1. MOTIVAÇÃO
Muitas vezes estamos interessados em algumas características de uma população, por
exemplo, qual a característica de uma região em Belo Horizonte? Qual o perfil dos moradores dessa
região? Etc.
A consulta a todos os moradores dessa região tornaria o levantamento muito inviável por
diversas razões (limitações):
• Custo
• Tempo
• Pessoal
• Comodidade
• Impossibilidade de observar todas as unidades amostrais.
Dessa forma, consultar uma parte dos moradores (uma amostra) é uma alternativa bem
razoável.
2. ALGUNS CONCEITOS
Características populacionais:
São aspectos (variáveis) da população que nós estamos interessados em analisar. Ex.: o grau de
satisfação com o serviço 190 da polícia.
Elemento:
É um objeto no qual as características de interesse podem ser medidas. Ex.: cada residente que
acionou a polícia através do 190.
Professor Ricardo Tavares
População alvo (ou objetiva):
É a coleção finita de elementos sobre a qual desejamos fazer inferência, ou seja, coletar
informações. Ex.: todas as pessoas que acionaram a polícia pelo 190.
População de estudo (ou referenciada):
É o grupo de elementos do qual a amostra é selecionada, ou seja, é a população que deveria ser
representada pela amostra. Ex.: todas as pessoas que ligaram para o 190 consideradas no cadastro
que auxiliou à amostragem.
Unidades amostrais:
São partes disjuntas da população. A união dessas unidades deve constituir toda a população
referenciada e cada elemento da população só pode pertencer a uma única unidade amostral. Ex.:
cada residente que acionou a polícia através do 190.
Sistema de referência (ou frame):
É uma lista de todas as unidades amostrais. Ex.: cadastro de todas as pessoas que acionaram a
polícia pelo 190.
Amostra:
É uma coleção de unidades amostrais selecionadas do sistema de referência da pesquisa.
Amostra representativa:
É uma amostra na qual qualquer elemento da população pode fazer parte dela.
População amostrada:
É a população que dá origem à amostra final da pesquisa, conhecida somente após o trabalho de
campo. Ex.: suponha que indo a campo não se consiga informações sobre algumas pessoas que
usaram o 190 selecionadas para entrevista, por recusa, ausência, morte, etc ou ainda que não
estavam no frame, nesse caso, a amostra final refletirá informações sobre uma nova população, que
é a população amostrada.
Parâmetros populacionais:
São medidas que sintetizam a informação dos elementos populacionais em relação às características
populacionais de interesse. Ex.: grau de satisfação das pessoas que usaram o 190.
Estimador:
É qualquer função das observações amostrais e que é utilizada para inferir sobre o parâmetro
populacional de interesse. Ex.: proporção das pessoas que estão satisfeitas com o 190.
Estimativa:
É o valor numérico observado do estimador. Ex.: 68% das pessoas que acionaram o 190 estão
satisfeitas.
Variação amostral:
É a variação que acontece quando amostras com unidades amostrais diferentes produz estimativas
diferentes.
Professor Ricardo Tavares
ALGUNS CONCEITOS
Erro de estimação, erro padrão ou erro de amostragem:
É a quantidade:
é o parâmetro populacional de interesse e
um estimador de .
ˆ ˆ
( )
n n
Erro θ θ θ · −
ˆ
n
θ
θ
θ
ALGUNS CONCEITOS
Erro de estimação, erro padrão ou erro de amostragem:
É a quantidade:
é o parâmetro populacional de interesse e
um estimador de .
ˆ ˆ
( )
n n
Erro θ θ θ · −
ˆ
n
θ
θ
θ
Observação: Esse erro acontece devido ao fato de que a amostra não pode fornecer uma
informação completa sobre a característica populacional medida. Tal erro pode ser controlado
através da escolha adequada do procedimento de amostragem a ser utilizada na coleta de dados e do
tamanho da amostra.
Erros não devidos à amostragem:
São erros que podem aparecer nas pesquisas e são mais difíceis de serem controlados.
a) Erros de campo: Não respostas, informações imprecisas, efeitos dos entrevistadores, etc.
b) Erros de planejamento: Sistemas de referências não adequados, escolha incorreta do
método de seleção de unidades amostrais, vício na seleção das unidades amostrais, deficiência dos
questionários, etc.
Observação: A invalidação ou não da extensão dos resultados da pesquisa devido a “não resposta”
dependerá:
a) do volume de não respondentes;
b) de uma análise criteriosa sobre a diferença de perfil dos respondentes em relação aos não
respondentes.
Amostragem:
É o processo de seleção de uma amostra.
Plano amostral:
É o protocolo que descreve todos os métodos e medidas envolvidos na execução da amostragem. O
plano amostral contém todas as informações, como o método usado para seleção da amostra, erro de
estimação e tamanho de amostra, estimadores usados na pesquisa, etc.
Seleção probabilística:
São procedimentos de seleção de amostras nas quais cada unidade amostral tem associada uma
probabilidade de seleção diferente de zero.
Seleção não-probabilística:
São procedimentos de seleção nos quais as unidades amostrais são escolhidas intencionalmente, ou
até atingir-se uma cota, ou de algum outro modo, com isso algumas unidades amostrais tem
probabilidade zero de seleção.
Censo:
É um levantamento estatístico no qual todas as unidades amostrais da população referenciada são
observadas.
Professor Ricardo Tavares
3. PLANEJAMENTO DE PESQUISA
Para que se possa fazer uma pesquisa por amostragem com qualidade é necessário definir-se
claramente:
• Os objetivos gerais da pesquisa;
• As populações alvo e de estudo, além de subpopulações de interesse;
• As características populacionais e os parâmetros de interesse;
• A unidade amostral e o sistema de referência de cada estágio de seleção da amostra;
• O método de amostragem a ser empregado na seleção da amostra; os estimadores e seus
erros de estimação; tamanho de amostras;
• O método de coleta de informações a ser empregado em campo, ou seja, entrevistas
pessoais, por telefone, pelo correio, internet, etc.
• O instrumento de medida a ser utilizado na coleta de informações, ou seja, um medidor
físico. Exemplo: questionário;
Observação: Se o instrumento for um questionário, as questões precisam ser cuidadosamente
formuladas e testadas de modo a evitar-se dupla interpretação, constrangimentos, respostas
incorretas, etc.
• Procedimentos a serem adotados pelos responsáveis pela coleta de informações em campo
para diminuir a taxa de não resposta, ou os erros não amostrais;
• A população amostrada;
 Além disso é necessário ter uma equipe de trabalho muito bem escolhida, treinada e
organizada;
 É essencial que se tenha manuais de instrução para o pessoal encarregado da coleta de dados
e supervisores preparados para resolver situações inesperadas;
 Processamento de dados: escolher bem a forma de entrar com os dados no sistema para não
dificultar a análise estatística posterior dos dados;
 Deve-se ter bons digitadores bem treinados, manual de digitação com dicionários de
variáveis e códigos de digitação;
 Os erros de digitação e a consistência dos dados precisam ser verificados;
4. PRINCIPAIS CASOS DE AMOSTRAGEM NÃO-PROBABILÍSTICA
⇒ Inacessibilidade a toda população: quando o pesquisador não tem acesso a toda população
de estudo, somente uma parte dela está disponível. Exemplo: população de usuários de
drogas de Belo Horizonte (não existe cadastro).
⇒ Material contínuo: devido a característica da continuidade é impossível realizar sorteio.
Exemplo: Retirar amostras de água em diferentes pontos de um rio para avaliar a poluição.
⇒ Amostragem por quotas: Inclui unidades amostrais na amostra segundo diversas
características da população e nas mesmas proporções que figuram na população. Exemplo:
idade, sexo, nível sócio-econômico, etc.
⇒ Amostragem por julgamento (ou conveniência): Inclui na amostra as unidades estatísticas
que poderão proporcionar uma representatividade da população, de acordo com a lógica,
senso comum ou um julgamento equilibrado.
Professor Ricardo Tavares
⇒ Amostragem por voluntário: Quando o indivíduo se apresenta para fazer parte da amostra. É
um método muito aplicado em pesquisas médicas.
⇒ A esmo (ou sem norma): O pesquisador procura ser aleatório sem, no entanto, realizar
propriamente o sorteio. Exemplo: Misturar 10000 parafusos e retirar 100.
5. PRINCIPAIS CASOS DE AMOSTRAGEM PROBABILÍSTICA
⇒ Amostragem Aleatória Simples (AAS):
É indicada quando uma amostra de tamanho n é selecionada de uma população de tamanho N no
qual todas as amostras possíveis de tamanho n tem a mesma probabilidade de ser selecionada.
Como selecionar uma AAS?
Suponha que uma população de tamanho N tem valores
{u
1
, u
2
, u
3
, ..., u
N
}. Se selecionarmos n elementos distintos e sem reposição da população,
existem M maneiras diferentes de pegarmos uma amostra de tamanho n.
Assim, se associarmos a prob. 1/M para cada uma das amostras diferentes, então cada
amostra obtida é uma AAS.
Como selecionar uma AAS?
Denotaremos essa AAS por {y
1
, y
2
, ..., y
n
}.
A probabilidade de selecionar essa AAS é dada por:
( ) ( ) ( )
1 2
1 2
1 1 1 1
( , , ..., ) . . . ... .
1 2 1
n
i i n i
P y u y u y u
N N N N n
· · · ·
− − − +
A) Estimação da média populacional:
• Média populacional:
• Variância populacional:
1 2
...
N
u u u
N
µ
+ + +
·
( ) ( ) ( )
2 2 2
1 2 2
...
N
u u u
N
µ µ µ
σ
− + − + + −
·
Como selecionar uma AAS?
Denotaremos essa AAS por {y
1
, y
2
, ..., y
n
}.
A probabilidade de selecionar essa AAS é dada por:
( ) ( ) ( )
1 2
1 2
1 1 1 1
( , , ..., ) . . . ... .
1 2 1
n
i i n i
P y u y u y u
N N N N n
· · · ·
− − − +
Como selecionar uma AAS?
Denotaremos essa AAS por {y
1
, y
2
, ..., y
n
}.
A probabilidade de selecionar essa AAS é dada por:
( ) ( ) ( )
1 2
1 2
1 1 1 1
( , , ..., ) . . . ... .
1 2 1
n
i i n i
P y u y u y u
N N N N n
· · · ·
− − − +
A) Estimação da média populacional:
• Média populacional:
• Variância populacional:
1 2
...
N
u u u
N
µ
+ + +
·
( ) ( ) ( )
2 2 2
1 2 2
...
N
u u u
N
µ µ µ
σ
− + − + + −
·
A) Estimação da média populacional:
• Média populacional:
• Variância populacional:
1 2
...
N
u u u
N
µ
+ + +
·
( ) ( ) ( )
2 2 2
1 2 2
...
N
u u u
N
µ µ µ
σ
− + − + + −
·
• Média populacional:
• Variância populacional:
• Fração amostral:
1 2
...
ˆ
n
y y y
y
n
µ
+ + +
· ·
( ) ( ) ( )
2 2 2
1 2 2
...
1
n
y y y y y y
s
n
− + − + + −
·

n
f
N
·
• Média populacional:
• Variância populacional:
• Fração amostral:
1 2
...
ˆ
n
y y y
y
n
µ
+ + +
· ·
( ) ( ) ( )
2 2 2
1 2 2
...
1
n
y y y y y y
s
n
− + − + + −
·

n
f
N
·
1 2
...
ˆ
n
y y y
y
n
µ
+ + +
· ·
( ) ( ) ( )
2 2 2
1 2 2
...
1
n
y y y y y y
s
n
− + − + + −
·

n
f
N
·
Professor Ricardo Tavares
B) Estimação do total populacional:
• Total populacional:
• Total amostral:
. N τ µ ·
ˆ . N y τ ·
C) Estimação da proporção populacional:
Interesse: proporção da população com uma característica A.
• Proporção populacional:
• Proporção amostral:
1
N
i
i
Y
p
N
·
·

1
ˆ
n
i
i
y
p
n
·
·

1,
0,
i
i
i
Y A
Y
Y A
∈ ¹
·
'

¹
B) Estimação do total populacional:
• Total populacional:
• Total amostral:
. N τ µ ·
ˆ . N y τ ·
B) Estimação do total populacional:
• Total populacional:
• Total amostral:
. N τ µ ·
ˆ . N y τ ·
C) Estimação da proporção populacional:
Interesse: proporção da população com uma característica A.
• Proporção populacional:
• Proporção amostral:
1
N
i
i
Y
p
N
·
·

1
ˆ
n
i
i
y
p
n
·
·

1,
0,
i
i
i
Y A
Y
Y A
∈ ¹
·
'

¹
C) Estimação da proporção populacional:
Interesse: proporção da população com uma característica A.
• Proporção populacional:
• Proporção amostral:
1
N
i
i
Y
p
N
·
·

1
ˆ
n
i
i
y
p
n
·
·

1,
0,
i
i
i
Y A
Y
Y A
∈ ¹
·
'

¹
Estimativa da variância de p^:
Intervalo de confiança aproximado para p^:
Tamanho amostral mínimo para estimar p:
ˆ ˆ (1 )
ˆ var( )^ . 1
1
p p n
p
n N
− ¸ _
· −


¸ ,
/ 2
ˆ ˆ var( ) ^ p z p
α
t
( )
2
/ 2
ˆ ˆ . .(1 )
ˆ ˆ 1 . .(1 )
N p p B
n onde D
N D p p z
α
¸ _ −
≈ ·

− + −
¸ ,
Estimativa da variância de p^:
Intervalo de confiança aproximado para p^:
Tamanho amostral mínimo para estimar p:
ˆ ˆ (1 )
ˆ var( )^ . 1
1
p p n
p
n N
− ¸ _
· −


¸ ,
/ 2
ˆ ˆ var( ) ^ p z p
α
t
( )
2
/ 2
ˆ ˆ . .(1 )
ˆ ˆ 1 . .(1 )
N p p B
n onde D
N D p p z
α
¸ _ −
≈ ·

− + −
¸ ,
⇒ Amostragem Aleatória Estratificada (AAE):
É obtida por separar os elementos da população em grupos não sobrepostos, chamados de estratos, e
então seleciona-se uma amostra aleatória simples de cada estrato.
Vantagens da AAE sobre a AAS:
 Pode fornecer estimativas mais precisas para a mesma amostra de tamanho n, em particular,
as observações em cada estrato são quase homogêneas;
 Pode reduzir o custo tal como requisitar tamanhos amostrais pequenos;
 Podemos estar interessados em subgrupos (estratos) tal como a população completa;
Como selecionar uma AAE?
 Primeiro divide a população alvo em L estratos (ou grupos);
Seja: Ni= número de unidades amostrais no estrato i;
N=N
1
+N
2
+...+N
L
N é o nº de unidades amostrais na população;
 Selecionamos uma AAS dentro de cada estrato;
Professor Ricardo Tavares
Estimação da média população:
∑ ∑
· ·
· ·
L
i
i i
L
i
i
N
1 1
µ τ τ e
N
τ
µ ·
Como distribuir o n entre os L estratos?
Existe várias maneiras para dividir n, o esquema de alocação depende dos três seguintes fatores:
 O número total de elementos em cada estrato;
 A variabilidade das observações dentro de cada estrato;
 O custo de obter uma observação de cada estrato;
Alocação ótima da amostra:

,
_

¸
¸
·

·
i
L
i
i i
i i i
i
c N
c N
n n
/ .
/ .
.
1
σ
σ
⇒ Amostragem por Conglomerado (ou Clusters) (AC):
É uma amostra probabilística em que cada unidade amostral é uma coleção, ou grupo de
elementos. Ex.: Um quarteirão de uma cidade, que consiste de uma coleção (ou conglomerado) de
domicílios;
A amostra por conglomerado é muito útil quando:
 Não se dispõe de um bom frame, ou sua obtenção é muito complicada;
 Quando as distâncias geográficas entre os elementos eleva demais o custo de obter uma
observação.
Detalhe:
Na AAE seleciona-se uma AAS (de indivíduos) dentro de cada estrato;
Na AC selecionam-se AAS de grupos, e todos os indivíduos dentro dos grupos selecionados farão
parte da amostra. AC2?
6. ILUSTRAÇÕES
I) ALOCANDO A AMOSTRA CORRETAMENTE:
Suponha que o objetivo é estudar a renda familiar em certa cidade. O conhecimento da geografia
dessa cidade possibilita agrupar, aproximadamente os bairros mais ricos (A), médios (B) e pobres
(C).
Uma consulta aos registros da prefeitura permite afirmar que 10% dos domicílios pertencem
à classe A, 30% à classe B e os restantes 60% à classe C.
Se o orçamento garante entrevistar 1000 domicílios, qual a melhor alocação desses 1000
domicílios?
Professor Ricardo Tavares
1ª Situação
Estrato A  100 domicílios
Estrato B  300 domicílios
Estrato C  600 domicílios
2ª Situação
Estrato A  600 domicílios
Estrato B  300 domicílios
Estrato C  100 domicílios
II) UMA AMOSTRA MUITO GRANDE PODE IMPLICAR EM CUSTOS
DESNECESSÁRIOS, ENQUANTO QUE UMA AMOSTRA PEQUENA PODE TORNAR A
PESQUISA INCONCLUSIVA:
Suponha um levantamento amostral cujo objetivo é prever qual dentre os dois únicos possíveis
partidos terá maior porcentagem de votos válidos. Seja p^ a proporção estimada de votos do partido
A.
Caso tivesse sido usada uma amostra de:
100 eleitores  IC[p^; 95%] = [46% ; 66%] (resultado inconclusivo)
400 eleitores  IC[p^; 95%] = [51% ; 61%] (o partido A vence)
1600 eleitores  IC[p^; 95%] = [53.5% ; 59.5%] (1200 entrevistas a mais)
REFERÊNCIAS PARA CONSULTA/LEITURA
BOLFARINE, Heleno, BUSSAB, Wilton O. (2000). “Elementos de Amostragem”. USP.
SHEAFER, R. L., MENDEKALL, W., OTT, L. “Elementary survey sampling”. 3 ed. Boston: PWS
Publishing Company, 1986.
THOMPSON, S.K. “Sampling”. John Wiley & Sons Inc., New York, 1992.
KISH, L. “Survey sampling”. New York: John Wiley, 1965.
Professor Ricardo Tavares