You are on page 1of 8

UNIDADE 2 – TESTES BASEADOS NA DISTRIBUIÇÃO BINOMIAL TESTE BILATERAL

INTRODUÇÃO H0: p = p0 × H1: p ≠ p0


Existem muitos resultados de experimentos que são concebidos como consistindo Para o teste bilateral, os valores de Y muito altos ou muito baixos levariam à rejeição
apenas de duas classes. Podemos chamar a classe de interesse de “sucesso” e a outra de de H0. Assim, rejeitamos H0 se y ≤ t1 ou y ≥ t2, onde, sob H0, P{Y ≤ t1} = α1 e P{Y ≥ t2} = α2,
“fracasso”. Todos os resultados possíveis cairão em uma destas duas categorias. Então cada α1 + α2 ≈ α.
observação amostrada pode ser denotada por 1, se sucesso, e por 0, se fracasso. Suponha Por ser uma distribuição discreta, em geral não se consegue usar exatamente os
também que as realizações dos experimentos são independentes e em cada realização a valores de α comumente utilizados. O ideal é que os valores de α1 e α2 sejam
probabilidade de ocorrer sucesso é fixa p e a probabilidade de ocorrer fracasso é fixa q=1- aproximadamente iguais, e sua soma seja próxima ao α desejado.
p. Se quiséssemos fazer este teste bilateral usando o p-valor, devemos calcular esta
A distribuição Binomial é usada para descrever a probabilidade de se obter probabilidade da seguinta maneira:
exatamente k sucessos em n realizações deste experimento. y n
 
Se y < np0: p-valor = 2 × PH0{Y ≤ y} = 2 ∑  p0i (1 − p0 )n −i
Muitas situações de Ciências Aplicadas recaem nesta situação, onde se está
i = 0 i 
interessado em investigar se indivíduos de uma amostra têm ou não determinada y −1 n
n n     
característica “A”. Se y > np0: p-valor = 2 × PH0{Y ≥ y} = 2 ∑  p0i (1 − p0 )n −i = 21 − ∑  p0i (1 − p0 )n −i 
i = y i 
 i = 0 i 

Nesta unidade serão vistos alguns métodos simples que podem ser usados para  
analisar dados deste tipo. Rejeitamos H0 se α > p-valor.

2.1 – TESTE BINOMIAL TESTE UNILATERAL SUPERIOR


O teste binomial é aplicado a amostras cujos elementos possuem dois atributos de H0: p = p0 (ou p ≤ p0) × H 1 : p > p0
interesse (dados dicotômicos). A amostra consiste de n realizações independentes do Para o teste unilateral superior, os valores de Y muito altos levariam à rejeição de
experimento e, em cada realização, a probabilidade de ocorrer sucesso é fixa p. Cada H0. Assim, rejeitamos H0 se y ≥ t, onde, sob H0, P{Y ≥ t} = α*.
resultado do experimento só pode ter ou não a característica, não pode estar nas duas Por ser uma distribuição discreta, em geral não se consegue usar exatamente os
categorias simultaneamente. valores de α comumente utilizados. O valor de α* usado será um valor de probabilidade de
Binomial(n,p0), onde t é o menor número inteiro tal que α* ≤ α.
REQUISITOS NECESSÁRIOS Se quiséssemos fazer este teste usando o p-valor, devemos calcular esta
1) As n tentativas são mutuamente independentes. probabilidade da seguinta maneira:
2) Cada tentativa tem probabilidade p de ter como resultado “sucesso”, onde p é a n n  y −1 n
 
mesma para as n tentativas.
p-valor = PH0{Y ≥ y} = ∑  i p0i (1 − p0 )n −i =1− ( )
∑  i p0i 1 − p0 n −i
i = y  i= 0  
Rejeitamos H0 se α > p-valor.
1 se sucesso
A amostra é, então, representada por X1, X2, ..., Xn, onde Xi =  . Além
0 se fracasso TESTE UNILATERAL INFERIOR
disso, P{Xi = 1} = p e P{Xi = 0} = 1 − p = q . H0: p = p0 (ou p ≥ p0) × H 1 : p < p0
n
Para o teste unilateral inferior, os valores de Y muito baixos levariam à rejeição de
O número de sucessos na amostra é dado pela estatística Y = ∑ Xi e o de fracassos
H0. Assim, rejeitamos H0 se y ≤ t, onde, sob H0, P{Y ≤ t} = α*.
i =1
n – Y. Os testes binomiais são feitos usando-se esta estatística como estatística de teste. Por ser uma distribuição discreta, em geral não se consegue usar exatamente os
valores de α comumente utilizados. O valor de α* usado será um valor de probabilidade de
2.1.1 – TESTE BINOMIAL PARA PEQUENAS AMOSTRAS (n ≤ 25) Binomial(n,p0), onde t é o maior número inteiro tal que α* ≤ α.
HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR Se quiséssemos fazer este teste bilateral usando o p-valor, devemos calcular esta
Como o interesse é testar a probabilidade de sucesso, a estatística de teste Y tem probabilidade da seguinta maneira:
y n
distribuição Binomial(n,p). Sob H0, Y~Binomial(n,p0). Suponha um nível de significância α  
p-valor = PH0{Y ≤ y} = ∑  p0i (1 − p0 )n −i
fixado. i = 0 i 
Rejeitamos H0 se α > p-valor.
1 2
EXEMPLOS > 1-pbinom(12,15,0.7) P{Y ≥ 13} = 1 - P{Y ≤ 12}
EXEMPLO 1: [1] 0.1268277
Um empreiteiro afirma que bombas de aquecimento estão instaladas em 70% das
casas em construção em uma determinada cidade americana. Você concordaria com essa Assim, t1 = 6 e t2 = 14.
afirmação se uma amostra aleatória de 15 casas têm 8 com bombas de aquecimento Então, o teste de nível α* = α1 + α2 = 0.01524253 + 0,0352676 = 0,05051013 é o que
instaladas, ou acha que p ≠ 0,7? Use um nível de significância de, aproximadamente, 10%. rejeita H0 se, e somente se, y ≤ 6 ou y ≥ 14.
Como y = 8, não se rejeita H0.
H0: p = 0,7 × H1: p ≠ 0,7 Se quiséssemos fazer este teste bilateral usando o p-valor, como y = 8 < np0 = 10,5,
8  15 
Nível de significância fixado: α ≈ 0,10. Sob H0, Y ~ Binomial (15,0,7), com média de p-valor = 2 × PH0{Y ≤ 8} = 2 ∑  0,7 i (1 − 0,7 )15 −i
15×0,7=10,5. O valor observado da estatística de teste é y = 8. i = 0 i 
Neste teste bilateral, rejeita-se H0 se y ≤ t1 ou y ≥ t2, tal que, sob H0, P{Y ≤ t1} = α1 e Usando o R, temos:
P{Y ≥ t2} = α2, α1 + α2 ≈ 0,10. Iremos procurar um valor para t1 tal que a probabilidade de 0 > 2*pbinom(8,15,0.7)
a t1 seja ligeiramente menor a 0,05. [1] 0.2622851
Logo, como p-valor=0,2622851 é alto, bem maior do que α = 0,10, não se rejeita H0.
No R, a função que usamos para obtermos a probabilidade binomial é
pbinom(x, n, p0, lower.tail = TRUE, log.p = FALSE) 2.1.2 – TESTE BINOMIAL PARA GRANDES AMOSTRAS

Usando esta função neste caso, com valores de x, vamos achar o t1 tal que é o maior Quando n for grande (aproximadamente n ≥ 25), pode-se usar uma aproximação pela
valor inteiro tal que P{Y ≤ t1} ≤ 0,05: normal.
> pbinom(0,15,0.7)
[1] 1.434891e-08 HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR
> pbinom(1,15,0.7) Como o interesse é testar a probabilidade de sucesso, a estatística de teste Y tem
[1] 5.165607e-07 distribuição Binomial(n,p). Sob H0, Y~Binomial(n,p0). Suponha um nível de significância α
> pbinom(2,15,0.7) fixado. Para grandes amostras, usa-se a aproximação normal. Assim, o quantil aproximado
[1] 8.719352e-06 da Binomial é dado por xq = np + z np(1 − p ) , onde z é o quantil correspondente na normal
> pbinom(3,15,0.7) padrão.
[1] 9.165869e-05 TESTE BILATERAL
> pbinom(4,15,0.7) H0: p = p0 × H1: p ≠ p0
[1] 0.0006722341 Para o teste bilateral, os valores de Y muito altos ou muito baixos levariam à rejeição
> pbinom(5,15,0.7) de H0. Assim, rejeitamos H0 se y ≤ t1 ou y ≥ t2, onde, sob H0, P{Y ≤ t1} ≈ α/2 e
[1] 0.003652521 P{Y ≥ t2} ≈ α/2. Usando-se a aproximação normal, t1 será dado por
t1 = np0 + z1 np0 (1 − p0 ) , onde z1 é o (α/2)quantil da normal padrão e t2 será dado por
> pbinom(6,15,0.7)
[1] 0.01524253
t2 = np0 + z2 np0 (1 − p0 ) onde z2 é o (1-(α/2))quantil da normal padrão.
> pbinom(7,15,0.7)
[1] 0.05001254 O p-valor deste teste é dado por:
 y + 0,5 − np0 
Se y < np0: p-valor = 2 × PH0{Y ≤ y} ≈ 2P Z ≤ 
Usando, agora, a função do R esta função neste caso, com valores de x, vamos achar  np0 (1 − p0 ) 
o t2 tal que é o menor valor inteiro tal que P{Y ≥ t2} ≤ 0,05:  y − 0,5 − np0 
> 1-pbinom(14,15,0.7) P{Y ≥ 15} = 1 - P{Y ≤ 14} Se y > np0: p-valor = 2 × PH0{Y ≥ y} ≈ 2P Z ≥ 
 np0 (1 − p0 ) 
[1] 0.004747562
> 1-pbinom(13,15,0.7) P{Y ≥ 14} = 1 - P{Y ≤ 13} Rejeitamos H0 se α > p-valor.
[1] 0.0352676

3 4
TESTE UNILATERAL SUPERIOR  70 − 0,5 − 100 × 0,6 
O p-valor deste teste é dado por p-valor = PH0{Y ≥ y} ≈ P Z ≥ .
H0: p = p0 (ou p ≤ p0) × H 1 : p > p0  100 × 0,6 × 0,4 
Para o teste unilateral superior, os valores de Y muito altos levariam à rejeição de
Usando-se o R, temos:
H0. Assim, rejeitamos H0 se y ≥ t, onde, sob H0, P{Y ≥ t} ≈ α.. Usando-se a aproximação
1-pnorm((70-0.5-100*0.6)/sqrt(100*0.6*0.4))
normal, t será dado por t = np0 + z np0 (1 − p0 ) , onde z é o (1-α)quantil da normal padrão.
0.02623975
 y − 0,5 − np0  Assim, p-valor = 0,02623975. Como o p-valor é pequeno (menor do que α = 0,05),
O p-valor deste teste é dado por p-valor = PH0{Y ≥ y} ≈ P Z ≥ .
 np0 (1 − p0 )  rejeita-se H0.
Rejeitamos H0 se α > p-valor.
2.1.3 – TESTE BINOMIAL PARA DUAS PROPORÇÕES:
TESTE UNILATERAL INFERIOR
H0: p = p0 (ou p ≥ p0) × H 1 : p < p0 Podem surgir situações nas quais deseja-se testar igualdade das probabilidades de
Para o teste unilateral inferior, os valores de Y muito baixos levariam à rejeição de sucesso de duas amostras. Por exemplo, pode-se querer testar se a proporção de médicos
H0. Assim, rejeitamos H0 se y ≤ t, onde, sob H0, P{Y ≤ t} ≈ α. Usando-se a aproximação em uma cidade é igual à proporção de médicos de outra cidade.
normal, t será dado por t = np0 + z np0 (1 − p0 ) , onde z é o α-quantil da normal padrão. Em geral, deseja-se testar a hipótese nula de que as duas proporções, ou parâmetros
binomiais, são iguais. Ou seja, dado um nível α, suponha uma amostra aleatória de uma
 y + 0,5 − np0 
O p-valor deste teste é dado por p-valor = PH0{Y ≤ y} ≈ P Z ≤ . população Bernoulli(p1) X11,...,X1n1 e outra amostra aleatória de uma população Bernoulli(p2)
 np0 (1 − p0 )  X21,...,X2n12. Iremos denotar Y1 = nº de sucessos da amostra 1 e Y2 = nº de sucessos da
Rejeitamos H0 se α > p-valor. amostra 2. Assim, Y1 ~ Binomial(n1,p1) e Y2 ~ Binomial(n2,p2).

HIPÓTESES POSSÍVEIS, ESTATÍSTICA DE TESTE, FORMA DO TESTE E P-VALOR


EXEMPLOS TESTE BILATERAL
EXEMPLO 1: H0: p1 = p2 × H 1 : p 1 ≠ p2
Acredita-se que uma droga comumente prescrita para aliviar a tensão nervosa tem Testar estas duas hipóteses é equivalente a testar a hipótese nula p1 – p2 = 0 contra
apenas 60% de eficácia. Resultados experimentais com uma nova droga administrada em Y Y
p1 – p2 ≠ 0. A estatística na qual baseamos a decisão é a variável aleatória 1 − 2 . Para
uma amostra aleatória de 100 adultos que sofrem de tensão nervosa mostram que 70 deles n1 n2
sentiram alívio. Isto é evidência suficiente para concluir que a nova droga é superior à Y Y
amostras 1 e 2 suficientemente grandes, o estimador 1 − 2 tem distribuição aproximada
comumente prescrita? Use o nível de significância de 0,05. n1 n2
p1 (1 − p1 ) p2 (1 − p2 )
normal, com média p1 – p2 e variância + .
Queremos saber se a eficácia da nova droga é superior à comumente usada, isto é, n1 n2
para uma amostra aleatória X1,...,X100 da Bernoulli(p), Y Y
H0: p = 0,60 (ou p ≤ 0,60) × H1: p > 0,60 Quando H0 for verdadeira, p1 = p2 = p. Então, sob H0, 1 − 2 tem distribuição
n1 n2
Como n = 100 (grande), com y = 70, neste teste unilateral superior, rejeita-se H0 se
1 1 
y ≥ t, onde t é dado por 0,05 ≈ P{Y ≥ t}, onde, usando-se a aproximação normal, t será dado aproximada normal, com média 0 e variância p(1 − p) +  . Se H0 for verdadeiro, um

n n
por t = np0 + z np0 (1 − p0 ) , z sendo o (0,95)quantil da normal padrão.  1 2

Para α = 0,05, podemos usar o R para encontrarmos o quantil da normal: ( ) 1


estimador para esta variância seria P̂ 1 − P̂  +
1 
 , onde P̂ = 1

Y + Y2
.
n
 1 n2 n1 + n2
> qnorm(0.95)
y1 y2
[1] 1.644854 O teste bilateral de nível α rejeita H0 se, e somente se, − ≤ t1 ou
n1 n2
Assim, z = 1,644854 e t = 100 × 0,6 + 1.644854 100 × 0,6 × 0,4 = 68,0581 .
y1 y2 Y Y  α Y Y  α
Logo, o teste de nível de significância aproximado de 5% rejeita H0 se, e somente se, − ≥ t2, de tal modo que PH  1 − 2 ≤ t1  ≈ e PH  1 − 2 ≥ t2  ≈ . Para n1 e n2
0 n
 1 n2  2
0 n
y ≥ 68,0581. Como y = 70 > 68,0581, rejeita-se H0 e conclui-se que há evidências de que a
n1 n2  1 n2  2
nova droga é superior.

5 6
  y1 y2
O teste unilateral superior de nível α rejeita H0 se, e somente se, − ≥ t, de tal
  n1 n2
α Y Y2   t1 
suficientemente grandes, t1 será tal que = PH  1 − ≤ t1  ≈ PZ ≤ . Y Y 
2 0 n
 1 n2   1 1  modo que PH  1 − 2 ≥ t  ≈ α . Para n1 e n2 suficientemente grandes, t será tal que
 p(1 − p ) + 

0 n
 1 n2 
  n1 n2    
 
1
Então, sendo z1 o (α/2)quantil da normal padrão, t1 será dado por t1 ≈ z1 p̂ 1 − p̂  + (
1 
.
 ) Y Y  
α = PH  1 − 2 ≥ t ≈ P Z ≥
t 
 . Então, sendo z o(1-α)quantil da normal
 n1 n2  0 n n
 1 2   1 1 
Da mesma maneira, t2 será tal que  p(1 − p ) + 

  n1 n2  
 
 
α Y Y  
= PH  1 − 2 ≥ t2  ≈ PZ ≥
t2 
 . Então, sendo z2 o (1-(α/2))quantil da
( 1
padrão, t será dado por t ≈ z p̂ 1 − p̂  +) 1 
.

2 0 n  n1 n2 
 1 n2    1 
1 
 p(1 − p ) + 
 Então, o teste unilateral superior rejeita H0 se, e somente se,
  n1 n2  
y1 y2
− ( )1
≥ z p̂ 1 − p̂  +
1 
 , onde p̂ = 1
y + y2
.
( 1
)
normal padrão, t2 será dado por t2 ≈ z2 p̂ 1 − p̂  +
n n
1 
.

n1 n2  n1 n2

 n1 + n2
 1 2 O p-valor para este teste é calculado por
y y 1
Então, o teste bilateral rejeita H0 se, e somente se, 1 − 2 ≤ z1 p̂ 1 − p̂  +
n1 n2
1 

 ( ) 
 y1 y2



 n1 n2   Y1 Y2 y1 y2   n1 n2  y1 + y2
p − valor = PH  − ≥ −  ≈ P Z ≥  , onde p̂ = .
n1 + n2
( )1 1  y + y2 0 n n n n
y1 y2
ou −
n1 n2
≥ z2 p̂ 1 − p̂  +
n
 1 n2
 , onde p̂ = 1
 n1 + n2
.  1 2 1 2 
 ( ) 
p̂ 1 − p̂  +
1 
1 


  n1 n2  
O p-valor para este teste bilateral é calculado por:
 y1 y2  TESTE UNILATERAL INFERIOR
 − 
Y1 Y2 Y Y2 y1 y2   n1 n2  H0: p1 = p2 × H1: p1 < p2
Se − < 0, p − valor = 2PH  1 − ≤ −  ≈ 2PZ ≤ , onde y1 y2
n1 n2 0 n n2 n1 n2  O teste unilateral inferior de nível α rejeita H0 se, e somente se, − ≤ t, de tal
 1 
 ( 1
)
p̂ 1 − p̂  +
1 

 n1 n2
  n1 n2   Y Y 
y + y2 modo que PH  1 − 2 ≤ t  ≈ α . Para n1 e n2 suficientemente grandes, t será tal que
p̂ = 1 . 0 n
 1 n2 
n1 + n2
 
 y1 y2   
 −   Y1 Y2   t 
Y Y Y Y2 y1 y2   n1 n2  α = PH  − ≤ t ≈ P Z ≤  . Então, sendo z o α-quantil da normal
Se 1 − 2 > 0 , p − valor = 2PH  1 − ≥ −  ≈ 2P Z ≥ , onde 0 n
 1 n2   1 1 
n1 n2 0 n n2 n1 n2  p(1 − p ) + 
 1 
 ( )
1

p̂ 1 − p̂  +
1 





 n1 n2  
  n1 n2  
y + y2
p̂ = 1 . ( 1
padrão, t será dado por t ≈ z p̂ 1 − p̂  +
n
)n
1 
.

n1 + n2  1 2
Então, o teste unilateral inferior rejeita H0 se, e somente se,

TESTE UNILATERAL SUPERIOR


y1 y2

n1 n2
( 1
)
≤ z p̂ 1 − p̂  +
1 

y + y2
 , onde p̂ = 1
n1 + n2
.
 n1 n2 
H0: p1 = p2 × H1: p1 > p2

7 8
O p-valor para este teste é calculado por Se queremos achar o p-valor, temos:
   y1 y2 
 y1 y2   
− −
Y Y2 y1 y2   n1 n2  y1 + y2 Y Y y y   n1 n2   0,12 
p − valor = PH  1 − ≤ −  ≈ P Z ≤  , onde p̂ = . p − valor = PH  1 − 2 ≥ 1 − 2  ≈ PZ ≥  = P Z ≥ =
0 n n2 n1 n2  n1 + n2 0 n n n n  0,041816 
 1 
 p̂ 1 −(p̂ )
1
n +
1 


 1 2 1 2 
 ( ) 1
p̂ 1 − p̂  +
n n
1 


  1 n2     1 2 
= P{Z ≥ 2,869723} = 1 − P{Z < 2,869723} = 1 − 0,9979458 = 0,00205416

EXEMPLOS Como o p-valor é pequeno, temos evidências contra H0, levando à rejeição de H0.
EXEMPLO 1:
Uma votação será realizada entre os residentes de uma cidade e seus arredores para
EXERCÍCIO DE TESTES DA DISTRIBUIÇÃO BINOMIAL
determinar se uma indústria química deveria ser construída. A construção da fábrica é
1) Sabe-se que 20% de uma certa espécie de insetos possui uma particular
dentro dos limites da cidade e, por esta razão, muitos eleitores dos arredores sentem que
característica A. 18 insetos desta espécie são obtidos em um determinado ambiente
a proposta será aprovada por causa da grande proporção de eleitores da cidade a favor de
incomum. Destes, nenhum possui a característica A. É razoável assumir que os
sua construção.
insetos desta espécie neste ambiente incomum têm a mesma probabilidade de 0,20
Para determinar se há uma diferença significativa na proporção de eleitores da
que a espécie em geral? Use um teste bicaudal.
cidade e dos arredores favorecendo a proposta, uma pesquisa foi realizada. Se 120 de 200
2) Um grupo da sociedade civil relatou ao Conselho Municipal que ao menos 60% dos
eleitores da cidade são a favor da proposta, e 240 dos 500 eleitores que moram nas
residentes da cidade são a favor de uma determinada questão. O Conselho Municipal
redondezas são a favor da proposta, você concordaria que a proporção de eleitores da
perguntou, então, sobre esta questão a uma amostra aleatória de 100 pessoas
cidade a favor da proposta é maior do que a proporção de eleitores das redondezas? Use
residentes na cidade e 48 pessoas responderam positivamente. A afirmação feita no
α = 0,05.
relatório do grupo da sociedade civil parece razoável?
Temos, então a amostra aleatória X1 1,..., X1 200 de tamanho n1 = 200 de eleitores da
3) Vinte alunos de uma faculdade de Direito fizeram um determinado exame e 18 deles
cidade, onde X1 i tem distribuição Bernoulli(p1) e a amostra aleatória X2 1,..., X2 500 de
passaram. Se estes alunos representam uma amostra aleatória dos estudantes de
tamanho n2 = 500 de eleitores das redondezas, onde X2 i tem distribuição Bernoulli(p2).
Direito desta faculdade, isto prova que a probabilidade de um aluno de Direito desta
O número de sucessos observado em cada amostra foi y1 = 120 e y2 = 240.
faculdade passar neste exame é maior do que a média do Estado, que é de 70%?
Desta maneira, temos:
4) Assuma que de 50 aparelhos de televisão de uma determinada marca R que foram
y1 y2 120 240
− = − = 0,12 vendidas por uma dada loja, 20 precisaram de manutenção no período de garantia de
n1 n2 200 500
1 ano. De 40 aparelhos vendidos da marca Z, 12 precisaram de manutenção no
120 + 240 360
p̂ = = ≈ 0,5143 período de garantia. Assuma que os 50 aparelhos da marca R são ensaios de
200 + 500 700
Bernoulli independentes, com p1 = probabilidade do aparelho da marca R precisar de
Hipóteses: Teste Unilateral Superior para diferença de duas proporções:
manutenção no período de garantia, e os 40 aparelhos da marca Z são também
H0: p1 = p2 × H1: p1 > p2
ensaios de Bernoulli independentes, com p2 = probabilidade do aparelho da marca Z
Então, o teste unilateral superior rejeita H0 se, e somente se,
precisar de manutenção no período de garantia. Teste se as duas marcas têm a
y1 y2

n1 n2
( )
1
≥ z p̂ 1 − p̂  +
n n
1 

y + y2
 , onde p̂ = 1
n1 + n2
e z é o (1-α)quantil da normal padrão. Para mesma probabilidade de precisar de manutenção no período de garantia
 1 2 5) (Larson - 8.3.9) - De 200 famílias que assistiam televisão, durante um intervalo de
 1 1  tempo, em New York, verificou-se que 45 sintonizavam a emissora A. De 110 famílias
α = 0,05, z0,95 = 1.644854 e 1,644854 0,5143(1 − 0,5143) +  = 0,06878 . Como
 200 500  em New Jersey, 32 sintonizavam a mesma estação, no mesmo período observado.
Teste a hipótese que a emissora A é igualmente popular em ambos os estados, a um
y1 y2 120 240 nível de significância de 5%.
este valor é menor do que − = − = 0,12 , rejeita-se H0, ou seja, conclui-se
n1 n2 200 500
que a proporção de eleitores da cidade a favor da proposta é maior que a proporção de
eleitores das redondezas.

9 10
α
2.1.4 – INTERVALOS DE CONFIANÇA PARA A PROBABILIDADE OU PROPORÇÃO Para Y = y, como P{Y ≥ h2 (p)} ≤ , iremos, para a Binomial com n igual ao tamanho da
POPULACIONAL 2
n n 
Quando se tem observações de n realizações de um experimento, onde em cada amostra e o valor de y observado, procurar o valor de pI tal que ∑  pI (1 − pI )n − j seja o
j
realização só são possíveis dois únicos resultados, sucesso ou fracasso, define-se como Y a j
j= y  
variável aleatória que representa o número de sucessos nas n observações. São feitas, α
mais próximo possível de , sem ultrapassar.
neste experimento, as seguintes hipóteses: 2
• as n realizações do experimento são independentes; Existem várias tabelas que dão a solução destas duas equações, para diversos valores
• a probabilidade p de ocorrer sucesso é constante em todas as realizações do de n e y, como a tabela A4 do Conover.
experimento.
Neste caso, Y ~ Binomial(n,p). EXEMPLOS
Suponha que se queira obter um intervalo de confiança de coeficiente de confiança EXEMPLO 1:
γ = 1 – α para a probabilidade de sucesso p. Em certo estado, 20 escolas foram selecionadas aleatoriamente para ver se elas
apresentam os padrões de excelência propostos por um comitê nacional de educação.
MÉTODO A: PARA AMOSTRAS PEQUENAS (n ≤ 25) Destas escolas, 7 apresentaram o nível de qualidade “excelente”. Qual o intervalo de
Para se obter um intervalo de confiança de coeficiente de confiança γ = 1 – α para a confiança de 95% para p, a proporção das escolas deste estado que apresentam o nível
probabilidade de sucesso p quando n é pequeno (n ≤ 30), para qualquer valor 0 < p < 1, iremos “excelente”?
encontrar o maior valor inteiro h1(p) tal que Em primeiro lugar, vamos assumir que a seleção das escolas foi feita de modo
α
P{Y ≤ h1 (p )} ≤ independente, e o nível de uma escola seja independente das outras.
2 Temos que y = 7, n = 20, 1 – α = 0,95, e queremos achar o intervalo de confiança
e o menor valor inteiro h2(p) tal que (pI,pS) tal que:
α
P{Y ≥ h2 (p)} ≤ .  7  20  j
 ∑  pS (1 − pS )
20 − j
2 ≈ 0,025
Como a distribuição Binomial é discreta, não se consegue fazer, em geral, com que j = 0  j 
α  20
  20  j
 ∑  j pI (1 − pI )
estas probabilidades sejam exatamente iguais a . 20 − j
2   ≈ 0,025
Já que os eventos Y ≤ h1 (p ) e Y ≥ h2 (p ) são mutuamente exclusivos, j = 7  
α α Pode-se fazer as contas no Excel, com valores de p indo de 0 a 1, com pulos de 0,005.
P{Y ≤ h1 (p) ou Y ≥ h2 (p )} ≤ + = α Para pS, usa-se a função DISTRBINOM(7;20;p;VERDADEIRO), onde p são os diversos
2 2
Daí segue que a probabilidade do complemento deste evento tem, no mínimo, valores para p. Esta função dá a distribuição acumulada da Binomial até y = 7. Para pI, usa-
probabilidade 1 – α = γ, ou seja, qualquer que seja o valor de p, se a função 1-DISTRBINOM(6;20;p;VERDADEIRO), onde p são os diversos valores para p.
P{h1 (p) < Y < h2 (p )} = 1 − P{Y ≤ h1 (p ) ou Y ≥ h2 (p)} ≥ 1 − α = γ Desta maneira será calculada a distribuição Binomial de y = 7 até 20.
Assim, o evento {h1 (p ) < Y < h2 (p )} é equivalente, ou seja, tem a mesma probabilidade Para pS Para pI

{ } {
que o evento h2−1 (Y ) < p < h1−1 (Y ) = pI < p < pS }e ( pI,pS ) é um intervalo de confiança de
0,550
0,555
0,0580
0,0529
0,150
0,153
0,0219
0,0243
100(1-α)% para a probabilidade de sucesso p. 0,560 0,0482 0,154 0,0251
0,565 0,0438 0,155 0,0259
Como encontrar pI e pS?
0,570 0,0397 0,160 0,0304
α
Para Y = y, como P{Y ≤ h1 (p)} ≤ , iremos, para a Binomial com n igual ao tamanho da 0,575 0,0359 0,165 0,0354
2 0,580 0,0324 0,170 0,0409
y n
  j 0,585 0,0292 0,175 0,0470
amostra e o valor de y observado, procurar o valor de pS tal que ∑  pS (1 − pS )n − j seja o 0,590 0,0262 0,180 0,0537
j
j= 0   0,592 0,0251 0,185 0,0610
α 0,593 0,0246 0,190 0,0689
mais próximo possível de , sem ultrapassar.
2 0,594 0,0240 0,195 0,0775
0,595 0,0235 0,200 0,0867
0,600 0,0210 0,205 0,0966

11 12
O intervalo de confiança de 95% para p é dado, então, por (0,153;0,593). 2 2 2 2  Y z2  2 2 2
 Y z2  2 4
 ± z  Y + z −  Y  
Usando a tabela A4 do Conover, para n = 20, y = 7 e γ = 0,95, o intervalo de confiança  +  ±  Y  + Y z + z −  Y  −  Y  z  +
 n 2n   n 2n  n  n 4n  n  
encontrado é (0,154;0,592).   n n n 4n2  n  n n  
 2  2
1 + z  1 + z 
MÉTODO B: PARA AMOSTRAS SUFICIENTEMENTE GRANDES (n ≥ 25)  n   n 
 
 Y z2  2 2  Y z2  z  Y  2
Sabemos que, para n suficientemente grande, pelo Teorema Central do Limite,  +  ± z  Y  1 − Y  + z   + ±   1 − Y  + z 
 n 2n  n n  n  4n   n 2n  
n  n n  4n 
Y      
n  − p
n  tem distribuição aproximadamente N(0,1). Vamos, então, usar isso no método  2  2
1 + z  1 + z 
p(1 − p )  n   n 
 
α
do pivot. Seja z tal que γ = P{-z < Z < z}, para Z~N(0,1), ou seja, o 1 - quantil da normal z2 z2 z2
2 Para n suficientemente grande, vamos considerar as quantidades , e
n 4n 2n
padrão. Então,
aproximadamente iguais a zero. Assim, tem-se que as raízes da equação serão
 Y    Y    Y 
2 
 n  − p    − p   − p 2 Y z Y Y 
n  ≤ z  = P  n  ≤ z  = P  n  ≤ z .  ±  1 −   . Com isso, temos,
1 − α ≈ P − z ≤      n
  n n
  n 
 p(1 − p )   p(1 − p) n  p(1 − p) n 
       Y    Y 
2   Y Y Y Y
  n  − p   − p  2  1 −  1 −  
2   n 

 ≤z =P   n  ≤ z   Y n  n Y
 ≤ p≤ +z n  n 
Y  γ ≈ P− z ≤    ≈ P − z .
 − p 2  p(1 − p )   p(1 − p ) n   n n n n 
Para encontrar os limites, preciso re-escrever o evento  n  ≤ z , de tal modo a      
p(1 − p) n  
achar um evento equivalente, com relação aos valores de p. Assim,  y y y y 
 1 −  1 −  
2  y n n Y n n
Y  Assim, quando n>25,  − z ; +z  é o IC de aproximadamente
 − p 2 2 2 n n n n
n  ≤z Y  z2 z2 2  Y  Y 2 z2 z2 2  
 − p ≤ p− p   − 2 p + p ≤ p− p  
p(1 − p) n n  n n n n  n n  
2  α
 2  2 100γ% para a probabilidade de sucesso p, onde z é o  1 −  quantil da normal padrão.
 1 + z p2 − 2 Y + z p +  Y  ≤ 0  2
 n   n 2n  n
  
A concavidade desta parábola é para cima, o que significa que os valores de p para os EXEMPLOS
quais esta parábola é negativa são os valores entre as raízes da equação EXEMPLO 1:
 2  2 2
 1 + z p2 − 2 Y + z p +  Y  = 0 . Em uma amostra aleatória de n = 500 famílias que possuem aparelhos de televisão na
 n    cidade de Hamilton, Canadá, descobriu-se que y = 340 assinavam a HBO. Determine um
  n 2n  n
Raízes: intervalo de confiança de aproximadamente 95% para a proporção de famílias desta cidade
que assinavam a HBO.
 Y z2   2 2 2 2  Y z2   Y z2 
2 2 2
 ± 4 Y + z  − 4 Y  1 + z   −  Y   1 + z  Nesta amostra aleatória, y = 340 e n = 500. Para α = 0,05, z0,975 = 1,96. Assim, o
2 +  + ±  +
 n 2n   n 2n   n   n   n 2n   n 2n   n   n  intervalo de confiança de aproximadamente 95% de confiança para p é dado por (lI;lS), onde
       
 z2   2 y y 340  340 
2 1 + 1 + z  y
1 −  1 − 
 n   n  n n  340 500  500 
  lI = − z = − 1,96 ≈ 0,6391
n n 500 500
y y 340  340 
1 −  1 − 
y n n  340 500  500 
lS = + z = + 1,96 ≈ 0,7209
n n 500 500

13 14
Assim, o intervalo de confiança de aproximadamente 95% para a proporção de EXEMPLOS
famílias desta cidade que assinavam a HBO é dado por (0,6391;0,7209). EXEMPLO 1:
Uma mudança no processo de fabricação de um componente está sendo considerada.
2.1.5 – INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE AS PROPORÇÕES Amostras são retiradas usando tanto o procedimento já existente como o novo, de modo a
DE DUAS POPULAÇÕES. determinar se os resultados do último mostram uma melhora. Se 75 de 1500 itens do
Considere, agora, o problema no qual deseja-se estimar a diferença entre as procedimento existente são considerados defeituosos e se 80 de 2000 itens do
probabilidades de sucesso de duas população p1 e p2. procedimento novo são considerados defeituosos, determine o intervalo de confiança de
Seleciona-se duas amostra aleatórias independentes de tamanhos n1 e n2, 90% para a real diferença da proporção de defeituosos entre o processo existente e o
respectivamente, uma de cada população. Seja n1p1 e n1p1(1-p1) a média e a variância de novo.
sucesso na população 1 e n2p2 e n2p2(1-p2) a média e a variância de sucesso na população 2.
Suponha também que n1 e n2 são suficientemente grandes. Após o experimento observou-se α = 0,10; n1 = 1500; n2 = 2000; y1 = 75 e y2 = 80. Para este nível de significância, o
y1 sucessos na amostra 1 e y2 sucessos na amostra 2. 1 − α  quantil da normal padrão é dado por:
 
Uma estimativa pontual da diferença entre as duas proporções p1 – p2 é dada por  2
Y1 Y2 > qnorm(0.95)
− .
n1 n2 [1] 1.644854
Um intervalo de confiança aproximado para p1 – p2 pode ser estabelecido usando o software R. Assim os limites inferior (lI) e superior (lS) são dados por:
Y Y y1  y  y2  y 
considerando-se a distribuição amostral aproximada de 1 − 2 . Sabe-se que, pelo TCL, 1 − 1  1 − 2 
n1 n2 y y n1   
n1  n2  n2 
lI = 1 − 2 − z  + =
Y1 D  pq  Y D  p q  n1 n2 n1 n2
→ N p1 , 1 1  e 2 → N p2 , 2 2  .
n1  n1  n2  n2 
75  75  80  80 
Ao escolher amostras independentes das duas populações, então, 1 −  1 − 
75 80 1500  1500  2000  2000 
 = − − 1,644854 + =
Y1 Y2 D pq p q  1500 2000 1500 2000
− → N p1 − p2 , 1 1 + 2 2 
n1 n2  n1 n2  = 0,01 − 1,644854 0,00005086667 = −0,001731239
α
Assim, determinando-se z como o 1 −  quantil da normal padrão, y1  y1  y2  y2 
 2 1 −  1 − 
y1 y2 n1  n1  n2  n2 
 Y1 Y2  lS = − +z + =
 − − (p1 − p2 )  n1 n2 n1 n2
 n1 n2 
1 − α ≈ P − z ≤ ≤ z =
p q p q 75  75  80  80 
 1 1 + 2 2  1 −  1 − 
 n1 n2  75 80 1500  1500  2000  2000 
  = − + 1,644854 + =
1500 2000 1500 2000
 Y Y pq p q Y Y pq p q 
= P  1 − 2 − z 1 1 + 2 2 ≤ p1 − p2 ≤ 1 − 2 + z 1 1 + 2 2  = 0,01 + 1,644854 0,00005086667 = 0,02173124
n1 n2 n1 n2 n1 n2 n1 n2 
Então, o intervalo de confiança de 90% para a real diferença das proporções de
Como não se conhece p1 nem p2, usa-se um estimador pontual, e o intervalo de defeituosos entre o processo existente e o novo é dado por (-0,001731239;0,02173124).
α
confiança aproximado para p1 – p2, onde z é o  1 −  quantil da normal padrão, fica
 2 EXERCÍCIO DE TESTES DA DISTRIBUIÇÃO BINOMIAL
 y1  y  y2  y  y1  y  y2  y  ENCONTRE OS INTERVALOS DE CONFIANÇA PARA OS PARÂMETROS DA BERNOULLI
 1 − 1  1 − 2  1 − 1  1 − 2  
y y n   
n1  n2  
n2  y1 y2 n   
n1  n2  n2   NOS 5 EXERCÍCIOS DADOS ANTERIORMENTE.
 1 − 2 −z 1  + ; − +z 1  + 
 n1 n2 n1 n2 n1 n2 n1 n2 
 
 

15 16

You might also like