You are on page 1of 30

www.conclusao.

pt

Intervalos de Confiana

Duas Fases da Estatstica

Estatstica Descritiva: descrever e estudar uma amostra Estatstica Indutiva (inferencial): a partir de uma amostra inferir sobre as caractersticas de uma populao

20-07-2012

Fonte Diagrama: Projecto ALEA Nooes de Estatstica Formadora : Ana Colao 2 http://alea-estp.ine.pt/Html/nocoes/html/exemplo2_4_1_11.html

www.conclusao.pt

Populao vs. Amostra


Podemos inferir (deduzir) determinadas caractersticas de uma populao se extramos uma amostra representativa desta
Populao: coleco de unidades individuais (pessoas ou resultados experimentais) com uma ou mais caractersticas comuns, que se pretendem estudar. Amostra: Conjunto de dados ou observaes, recolhidos a partir de um subconjunto da populao, que se estuda com o objectivo de tirar concluses para a populao de onde foi recolhida

amostragem

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

3 2 Imagens extradas da referncia

Amostragem

Processo pelo qual se extraem dados de uma populao


Existem vrios tipos de amostragem:
Vamos usar apenas este tipo

Amostragem Aleatria Simples: cada elemento da amostra retirado aleatoriamente de toda a populao (com ou sem reposio) cada possvel amostra tem a mesma probabilidade de ser recolhida Amostragem Estratificada: subdividir a populao em, pelo menos, dois subgrupos distintos que partilham alguma caracterstica e, em seguida, recolher uma amostra de cada um dos subgrupos (estratos) Amostragem por clusters: dividir a populao em seces (clusters); seleccionar aleatoriamente alguns desses clusters; escolher todos os membros dos clusters seleccionados.
20-07-2012 Formadora : Ana Colao

www.conclusao.pt

Inferncia Estatstica
inferir certas caractersticas n indivduos (ou objetos) da populao da populao ex: sortear n pixels de uma imagem (com ou sem reposio) amostra n realizaes de uma v.a. X ex: medir a reflectncia de um objeto n vezes

distribuio conhecida/desconhecida e/ou parmetros desconhecidos a amostra constitui um conjunto de n v.a. X1, X2, ..., Xn independentes e identicamente distribudas com distribuio FX

Amostra Aleatria
acetato adaptado de referencia 3

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

Amostra Aleatria
Note que usamos letras minsculas pois estamos a definir concretizaes (observaes) de variveis aleatrias

acetato adaptado de referencia 1 20-07-2012

Note que usamos letras maisculas, pois estamos a definir variveis aleatrias e medidas em funo dessas variveis Formadora : Ana Colao 6

www.conclusao.pt

Parmetro vs. Estatstica Parmetro Medida usada para descrever a distribuio da populao
a mdia e o desvio padro 2 so parmetros de uma distribuio Normal - N(,2) a probabilidade de sucesso p um parmetro da distribuio Binomial - B(n,p)

Estatstica Funo de uma amostra aleatria que no depende de parmetros desconhecidos


Mdia amostral: Varincia amostral: Amplitude da amostra:
X=1
S2 = 1

n i =1
n i =1

Xi
2

(Xi X )

R = X n:n X 1:n www.conclusao.pt

Parmetro vs. Estatstica

Proporo dos inquiridos de raa branca numa populao e numa amostra

exemplo extrado da referncia 2 20-07-2012

Formadora : Ana Colao

www.conclusao.pt

Estimao de Parmetros
Populao
Distribuio da Populao Parmetros (valor fixo) estimar

Amostra
Distribuio Amostral Estatsticas (funo da amostra)

pontual (estatsticas) Estimao por intervalo (intervalos de confiana)

OBS: estatstica: a v.a. que estima (pontualmente) um parmetro (populacional) as vezes chamada simplesmente de estimador estimativa: o valor do estimador obtido para uma amostra especfica
acetato adaptado de referencia 3

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

Estimao do n de Votos

Fonte: Projecto ALEA Nooes de Estatstica http://alea-estp.ine.pt/Html/nocoes/html/exemplo2_4_1_11.html

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

10

Construindo a Amostra

Fonte: Projecto ALEA Nooes de Estatstica http://alea-estp.ine.pt/Html/nocoes/html/exemplo2_4_1_11.html

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

11

Concluses

20-07-2012

Resultado: (60,5%, 66,5%) de lisboetas vo votar no presidente com um grau de confiana de 95%
Formadora : Ana Colao

www.conclusao.pt

12

Intervalo de Confiana

Um intervalo de confiana para um parmetro , a um grau de confiana 1-, um intervalo aleatrio (Linf, Lsup) tal que: P(Linf < < Lsup) = 1- , (0,1) onde deve ser um valor muito reduzido por forma a temos confianas elevadas

Valores usuais para o grau de confiana: 95%, 99% e 90%


20-07-2012 Formadora : Ana Colao

www.conclusao.pt

13

Intervalo de Confiana (IC) I. IC para a mdia com varincia conhecida


Caso 1: populao Normal Caso 2: populao qualquer (n>>30) aproximada pela Normal

II. IC para a mdia com varincia desconhecida


Caso 1: populao Normal Caso 2: populao qualquer (n>>30) aproximada pela Normal

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

14

IC para com varincia conhecida


Caso 1: Populao Normal
X ~ N ( , 2 )
desconhecido, mas 2 conhecido

N (0,1)

X X~ ~N ? (,

2
n

)
1

centrando e reduzindo:

N (0,1) (Normal Padro) ~?

n
P( z < Z < z ) = 1

, X + z1 2 IC(1 ) ( ) = X z1 2 n n

-z

P( z <

< z) = 1

quantil de ordem /2

z /2

+
z1 - /2

quantil de ordem 1-/2

n P( z < X < z ) = 1 n n

IC para a grau de confiana 1-

P( X z

<< X +z

) = 1
Formadora : Ana Colao

Linf 20-07-2012

Lsup

www.conclusao.pt

acetato adaptado de referencia 3

15

Determinando o Quantil de Ordem 1-/2


Distribuio Normal Padronizada
Tabela 3.a. Normal Distribution

Para nvel de significncia =0.05 grau de confiana 95% (z) = P(Z < z) = 1 - /2 z = z 1 - /2
quantil de ordem 1-/2

(z) = P(Z < z) = 1- (0.05/ 2) = 0.975


buscar valor de z na tabela: (z) = 0.9750 z = 1.96 Grau de Confiana 90% 95% 99% Valor z 1.65 1.96 2.58

90% grau de confiana existem 10 possibilidades de 100 que o IC no contenha a mdia populacional 95% grau de confiana existem 5 possibilidades de 100 que o IC no contenha a mdia populacional 99% grau de confiana existe 1 possibilidade de 100 que o IC no contenha a mdia populacional

www.conclusao.pt

Interpretao do IC para

Para uma amostra aleatria de tamanho 50 seguindo uma distribuio Normal com mdia = 10 e varincia 2 = 4 X ~ N (10, 4) , determinamos o IC para com 95% de grau confiana:
P( X 1,96
2 2 < < X + 1, 96 ) = 95% 50 50

P ( X 0,5544 < < X + 0,5544) = 95%

IC95% ( ) = ( X 0.5544, X + 0.5544)


=10

Interpretao: 95% dos possveis ICs obtidos a partir de uma amostra de tamanho 50, contero de facto o verdadeiro valor da mdia =10

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

17

IC para com varincia conhecida


Caso 1: Populao Normal
Exemplo: Uma v.a. qualquer tem uma distribuio Normal com mdia desconhecida
e varincia 2 = 16. Retira-se uma amostra de 25 valores e calcula-se a mdia amostral. Construa um IC de 95% para supondo que X = 12,7.

IC(1 ) ( ) = X z1 2 , X + z1 2 n n IC95% ( ) = X z0.9750 , X + z0.9750 n n


4 4 = 12,7 1,96 ,12,7 + 1.96 25 25

z0,9750=1,96

95%
2,5% 2,5%

= (12,7 1,568, 12,7 + 1,568)

IC95% ( ) = (11.132, 14.268)


P(11,132 < < 14, 268) = 0,95

0 12.7 Java Applet em:

www.conclusao.pt

18 http://psych.colorado.edu/~mcclella/java/normal/normz.html

IC & Grau de Confiana

Como poderia obter intervalos de confiana mais estreitos, ou seja, com limites mais prximos a mdia verdadeira? Diminuindo o grau de confiana
figura extrada da referncia 2

20-07-2012

Diminuindo o grau de confiana de 99% a 95%, aumentamos o risco de estar errados: de 1% de risco passamos a 5% de risco, ou seja temos mais possibilidades (5/100 em vez de 1/100) de que o IC no contenha a mdia populacional. Ao aumentar o risco, o intervalo deve ser mais preciso
Formadora : Ana Colao

www.conclusao.pt

19

IC & Dimenso da Amostra


Como poderia obter intervalos de confiana mais estreitos, ou seja, com limites mais prximos a mdia verdadeira? Aumentando a dimenso da amostra

Tabela extrada da referncia 2

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

20

IC para com varincia conhecida


Caso 2: Populao Genrica aproximada pela Normal
Se uma distribuio qualquer tiver mdia (desconhecida) e varincia 2 (conhecida) e se forem validas as condies do TLC (n>>30) podemos obter um IC aproximado para a mdia IC para a grau de confiana 1-
N (0,1)

IC1 ( ) X z1 2 , X + z1 2 n n
-

-z

+
z1 - /2

quantil de ordem 1-/2

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

21

IC para com varincia conhecida


Resumo
desconhecido, mas 2 conhecido
IC para a grau de confiana 1-

IC ( ) = X z1 2 IC ( ) X z1 2
quanto maior n menor o erro padro IC mais preciso

quanto maior z IC menos preciso

X z

Se aumentarmos o grau de confiana a preciso diminui porque aumenta o valor z se 90% z = 1.65 se 95% z = 1.96 se 99% z = 2.58
20-07-2012

A expresso

chamada

erro padro (standard error)


22

Formadora : Ana Colao

www.conclusao.pt

IC para com varincia desconhecida


Se o valor de 2 desconhecido substituir por uma estimativa
Estimadores pontuais para o desvio padro : desvio padro amostral no-corrigido desvio padro amostral corrigido
1 n ( X i X )2 n i =1

=S=
)

1 n = Sc = ( X i X )2 n 1 i =1 )

Se 2 desconhecida podemos distinguir dois casos: Caso1. populao Normal usar distr.t de Student
X ~ N ( , 2 ) T = X ~ t n 1 Sc n
S S IC1 ( ) = X t1 2 , n 1 c , X + t1 2 , n 1 c n n

Caso2. q.q. distribuio aproximada pela Normal, amostras grandes usar distribuio Normal padronizada
Sc Sc X IC ( ) X z , X + z X q.q. com n >> 30 Z = N (0,1) 1 1 2 1 2 ~ n n Sc n a www.conclusao.pt

IC para com varincia desconhecida


Caso 1: Populao Normal
Exemplo:
Uma v.a. qualquer tem uma distribuio Normal com mdia e varincia 2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a mdia amostral e varincia amostral . Construa um IC de 95% para supondo que X = 12,7 e S2 = 16

S S IC(1 ) ( ) = X t1 2 , n 1 , X + t1 2,n 1 n n S S IC95% ( ) = X t0.9750, 24 , X + t0.9750, 24 n n


4 4 = 12,7 2,06 , 12,7 + 2,06 25 25

Distribuio t de Student com 24 graus de liberdade

t24

95% 2,5% 2,5%

= (12,7 1,648, 12,7 + 1,648)

-t

t
t0,9750, ? 24 = 2,06

IC95% ( ) = (11.052, 13.648)


20-07-2012 Formadora : Ana Colao

www.conclusao.pt

24

Determinando t1-/2, n-1 - quantil de ordem 1-/2 de uma distribuio t-Student com n-1 graus de liberdade
Tabela 8. Student s t-Distribution

Por definio de quantil de ordem 1-/2: z = z 1 - /2 F(z) = P(Z < z) =1 - /2 Para grau de confiana 95% nvel de significncia =0.05 F(z) = P(Z < z) = 1- (0.05/ 2) = 0.975 F(z) = 0.9750 Para n=25 24 graus de liberdade Determinar t0.9750, 24 usando Tabela 8:

t0.9750, 24 = 2.06

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

25

IC para com varincia desconhecida


Caso 1: Populao Normal
exerccio 5, captulo 4

Uma amostra aleatria de 20 cigarros foi analisada para estimar a quantidade de nicotina por cigarro, observando-se a mdia de 1,2 mg e varincia amostral corrigida de 0.4. Pressupondo que as observaes tm distribuio Normal, determine um IC para o valor mdio da quantidade de nicotina por cigarro, grau de confiana de 99% Usando esta amostra determinamos um IC aproximado para a 99%:
S S IC(1 ) ( ) = X t1 2,n 1 c , X + t1 2,n 1 c n n
Para grau de confiana 99%: (1-) x 100% = 99% (1-) =0.99 =0.01 Por definio de quantil de ordem 1-/2: F(z) = P(Z < z) = 1- (0.01/ 2) = 0,995 F(z) = 0.995 Para n=20 19 graus de liberdade

S S IC99% ( ) = X t0,995,19 C , X + t0,995,19 C n n


Determinar t0.995, 19 usando Tabela 8 t0.995, 19 = 2.86

0,04 0,04 IC99% ( ) = 1 , 2 2 , 86 , 1 , 2 + 2 , 86 20 20


= (1,2 2,86 0,044721, 1,2 + 2,86 0,044721)

www.conclusao.pt

IC99% ( ) = (1.0721, 1.3279)26

IC para com varincia desconhecida


Exemplo: Populao qualquer, amostra grande
Ingressos dos emigrantes hispnicos em EU segundo censo de 1980
Origem N pessoas amostra 3895 5729 5908 Rendimento Mdio $16 368 $13 342 $12 587 Desvio Padro Amostral $3 069 $9 414 $8 647

IC para a grau de confiana 95%


S S IC95% ( ) X 1.96 , X + 1.96 n n

cubanos mexicanos portoriquenhos

cubanos:

erro padro =

3069 = 49.17 3985


9414 = 124.41 5729

IC95% ( ) 16368 1.96 49.17


IC ( 16272, 16464 )

mexicanos: erro padro = porto-riq.:


erro padro =

IC95% ( ) 13342 1.96 124.41


IC ( 13098, 13586 )

8647 = 112.5 IC95% ( ) 12587 1.96 112.5 5908 IC ( 12367, 12807 ) www.conclusao.pt

IC para com varincia desconhecida


Exemplo: Populao qualquer, amostra grande

20-07-2012 Exemplo adaptado de referncia 2

Formadora : Ana Colao

www.conclusao.pt

28

Formulrio

F O R M U L R I O

20-07-2012

Formadora : Ana Colao

www.conclusao.pt

29

Referncias
Livro: Grande Maratona de Estatstica no SPSS Andreia Hall, Cludia Neves e Antnio Pereira Captulo 4.1 Intervalos de Confiana
Acetatos disponveis on-line usados na elaborao destes acetatos: Estatstica Inferencial e Intervalos de Confiana, Amostragem Andreia Hall URL: http://www2.mat.ua.pt/pessoais/AHall/me/files/acetatos.htm http://www2.mat.ua.pt/pessoais/AHall/Bioestat%EDstica/Bioestat%EDstica.htm

Chapter 11: Sampling and Sampling Distribution, Chapter 12: Estimation Prof. J. Schwab , University of Texas at Austin disciplina: Data Analysis I (spring 2004) URL: www.utexas.edu/courses/schwab/sw318_spring_2004/TextbookLectureNotes Estimao Camilo Daleles Renn, Instituto Nacional de Pesquisas Espaciais, Brasil disciplina:Estatstica: Aplicao ao Sensoriamento Remoto (2008) URL: http://www.dpi.inpe.br/~camilo/estatistica/notas.html Estimao por Intervalos Ana Pires, IST Lisboa disciplina: Probabilidades e Estatstica URL: : http://www.math.ist.utl.pt/~apires/materialpe.html 20-07-2012 Formadora : Ana Colao

www.conclusao.pt

30