Professional Documents
Culture Documents
CE227 - Prioris-Conjugadas
CE227 - Prioris-Conjugadas
2 / 21
Distribuições posteriores
Famílias conjugadas Definição: família conjugada
As famílias conjugadas podem ser utilizadas quando Seja F uma família de distribuições para a
o produto π(θ) ⋅ f (x|θ) possui forma fechada, ou seja, verossimilhança f (x|θ), e P uma família de distribuição
resulta em uma distribuição conhecida para a priori π(θ). Dizemos que F e P são famílias
conjugadas de distribuições se a distribuição posterior
Portanto, a posterior é obtida diretamente pelo π(θ|x) também for um membro de P .
teorema de Bayes
de verossimilhança
3 / 21
Distribuições posteriores
Famílias conjugadas
Exemplo: Beta-binomial com π(θ) ∼ Beta(α, β) e f(x|θ) ∼ Bin(n, θ)
π(θ|x) ∝ π(θ) ⋅ f (x|θ)
Γ(α + β) n
α−1 β−1 x n−x
∝ θ (1 − θ) ⋅ ( )θ (1 − θ)
Γ(α)Γ(β) x
α+x−1 β+n−x−1
∝ θ (1 − θ)
4 / 21
Distribuições posteriores
Simulação estocástica
A simulação estocástica é necessária quando o produto π(θ) ⋅ f (x|θ) não possui forma fechada, e resulta em uma
distribuição desconhecida
5 / 21
Distribuições posteriores
Independente de como a posterior foi obtida:
É um compromisso entre a priori (que carrega o conhecimento prévio), e a verossimilhança (que expressa o
conhecimento atual adquirido com o experimento realizado)
Representa todo o conhecimento existente sobre o problema, portanto a inferência Bayesiana é baseada nesta
distribuição
6 / 21
Inferência
Abordagem clássica Abordagem Bayesiana
θ é uma quantidade desconhecida, mas fixa θ é uma quantidade desconhecida, e aleatória
Com base nos valores observados na amostra, o a partir de uma população indexada por θ
conhecimento sobre θ é obtido
A distribuição a priori é atualizada com essa
informação da amostra, representada pela
verossimilhança f (x|θ)
7 / 21
Estimação por intervalo
Abordagem clássica
Dizemos que o intervalo aleatório (T 1, ,
T 2 ) T 1 (X) ≤ T 2 (X) , é um intervalo de confiança para θ, com coeficiente de
confiança γ = 1 − α , (0 < α < 1), se
P [T 1 < θ < T 2 ] = γ
Notação:
IC(θ, γ%) = (T 1 , T 2 )
θ ∈ (T 1 , T 2 ) com probabilidade 0 ou 1
8 / 21
Estimação por intervalo
Abordagem clássica
Visualização de 100 intervalos de confiança
TeachingDemos::ci.examp(reps = 100)
9 / 21
Estimação por intervalo
Abordagem Bayesiana
Chamamos de intervalo de credibilidade de γ = 1 − α, (0 < α < 1), o intervalo delimitado pelos percentis [α/2] e
[1 − (α/2)]
(θ[α/2] , θ[1−(α/2)] )
∫ π(θ|x)dθ = γ
T1
Notação:
Um intervalo de credibilidade é então o intervalo de valores mais prováveis de θ, que soma probabilidade γ
10 / 21
Estimação por intervalo
Interpretação
11 / 21
Estimação por intervalo
Exemplo (Kinas e Andrade, 2010)
Interesse: média de baleias avistadas em 10 milhas náuticas (MN)
Caracterização do problema:
ú
x ≡ n mero de avistagens = 10
## Número de avistagens
x <- 10
## Unidades amostradas
n <- 15
## Possiveis valores para theta (numero médio de avistagens)
theta <- seq(0, 2, length = 200)
12 / 21
Estimação por intervalo
Exemplo (Kinas e Andrade, 2010)
Suposições do problema:
f (x|θ) ∼ P oisson(nθ)
π(θ) ∼ Gama(α, β)
π(θ|x) ∼ ?
α+x−1 −θ(β+n)
∝ θ e
Portanto
∗ ∗
π(θ|x) ∼ Gama(α = α + x, β = β + n)
13 / 21
Estimação por intervalo
Considerando que não existe nenhuma informação prévia sobre θ, vamos assumir que π(θ) é uma priori não informativa,
por exemplo θ ∼ Gama(α = 1, β = 0.1)
alfa <- 1
beta <- 0.1
## Calcula a densidade da priori
priori.ni <- dgamma(theta, alfa, beta)
# [1] 11
# [1] 15.1
14 / 21
Estimação por intervalo
Cálculo da densidade da posterior com os novos parâmetros
post.ni <- dgamma(theta, alfa.star, beta.star)
plot(theta, post.ni, type = "l", xlab = expression(theta),
ylab = "Densidade de probabilidade")
lines(theta, priori.ni, lty = 2)
lines(theta, dgamma(theta, 1 + x, n), col = 2, lty = 2)
legend("topright", lty = c(1, 2, 2), col = c(1, 1, 2),
legend = c("Posterior", "Priori", "Verossimilhança"))
15 / 21
Estimação por intervalo
A partir da posterior Gama(α ∗
, podemos encontrar um intervalo de credibilidade de
∗
,β )
(θ[0.025] , θ[0.975] )
da posterior π(θ|x)
16 / 21
Estimação por intervalo
## Gráfico da posterior com intervalo de credibilidade
plot(theta, post.ni, type = "l", xlab = expression(theta),
ylab = expression(pi(paste(theta, "|", bold(x)))))
abline(v = qgamma(c(0.025, 0.975), alfa.star, beta.star),
lty = 2, col = 2)
17 / 21
Estimação por intervalo
Considere que artigos científicos indicam que na região de estudo deve-se esperar uma média de 0.45 avistagens/10 MN.
Podemos utilizar essa informação como uma priori informativa.
Como a priori deve ser informativa, podemos assumir um valor relativamente alto para α, p.ex. α = 4.5
α 4.5
β = = = 10
0.45 0.45
Portanto ficamos com uma priori informativa π(θ) ∼ Gama(α = 4.5, β = 10)
alfa.i <- 4.5
beta.i <- 10
## Calcula a densidade da priori
priori.i <- dgamma(theta, alfa.i, beta.i)
18 / 21
Estimação por intervalo
## Visualização
A posterior π(θ|x) ∼ Gama(α ∗
= α + x, β
∗
= β + n)
plot(theta, post.i, type = "l", xlab = expression(theta),
ylab = "Densidade de probabilidade")
alfa.star.i <- alfa.i + x lines(theta, priori.i, lty = 2)
beta.star.i <- beta.i + n lines(theta, dgamma(theta, 1 + x, n), col = 2, lty = 2)
## Cálculo da densidade da posterior com a priori informativa legend("topright", lty = c(1, 2, 2), col = c(1, 1, 2),
post.i <- dgamma(theta, alfa.star.i, beta.star.i) legend = c("Posterior", "Priori", "Verossimilhança"))
19 / 21
Estimação por intervalo
## Gráfico da posterior com intervalo de credibilidade
Podemos encontrar o intervalo de credibilidade plot(theta, post.i, type = "l", xlab = expression(theta),
ylab = expression(pi(paste(theta, "|", bold(x)))))
qgamma(c(0.025, 0.975), alfa.star.i, beta.star.i) abline(v = qgamma(c(0.025, 0.975), alfa.star.i, beta.star.i),
lty = 2, col = 2)
# [1] 0.3209414 0.9144457
20 / 21
Estimação por intervalo
Um resumo simples das duas posteriores obtidas
## Inferência com a priori não informativa plot(theta, post.i, type = "l", xlab = expression(theta),
qgamma(c(.025, .5, .975), alfa.star, beta.star) ylab = expression(pi(paste(theta, "|", bold(x)))))
lines(theta, post.ni, lty = 2)
legend("topright",
# [1] 0.3636530 0.7065247 1.2179044
legend = c("Posterior (informativa)",
"Posterior (não informativa)"), lty = c(1,2))
## Inferência com a priori informativa
qgamma(c(.025, .5, .975), alfa.star.i, beta.star.i)
21 / 21