Professional Documents
Culture Documents
IPEB - Efolioa - 21-22 - Soluções
IPEB - Efolioa - 21-22 - Soluções
bayesianas
Ano lectivo 2021/22
Docente: António Araújo
e-fólio A
• B.I:
• No de Estudante
• Curso:
a)
p(A|C) = 2p(B|C)
p(A|BC) = 0.9
p(A + B|C) = 0.5
b)
Solução:
a) Temos
pelo que
1 − p(A + B) 1 − 0.5
p(B|C) = = = 0.55
p(A|BC) 0.9
Mas então p(A|C) = 2p(B|C) = 1.1 > 1, o que é impossı́vel, pelo que as
atribuições resultam numa contradição.
1
b) Notamos que A ⇔ B ≡ AB + A B. Então
Então 0.5 = 1 + 0.1 − 0.4 = 0.7, pelo que a atribuição proposta é incon-
sistente.
Solução:
Vamos começar por enunciar duas possı́veis soluções ”intuitivas”.
Primeira: Tem que ser vantajoso mudar a escolha. Consideremos desta
forma: qual é a probabilidade de eu ter acertado na minha escolha? é 1/3.
Dito de outra forma, qual é a probabilidade de eu ter falhado? É 2/3. Por-
tanto há uma probabilidade de 2/3 do prémio estar no conjunto das portas
1 e 2. Quando o apresentador abre a porta 2 e permite-me mudar a minha
escolha para a porta 1 ele está a dar-me a oportunidade de escolher o con-
junto de portas 1 e 2, cuja probabilidade de conter o carro é 2/3. Portanto é
vantajoso mudar. (nota: esta solução parece visualizar a probabilidade como
algo que está ”contido”no ”conjunto”das duas portas, e que ”colapsa”sobre
a porta que resta, como numa ”lei de conservação”)
O problema das soluções intuitivas é que um dia provam uma coisa e
outro dia provam outra:
Contra-Solução intuitiva: Se ele abre uma porta restam duas. Eu não sei
nada acerca de uma ou outra. Então a probabilidade passa a ser 1/2 para
cada porta. Não vale a pena mudar de porta.
Vamos então abandonar a intuição e recorrer ao formalismo das probabi-
lidades:
2
Ei =”o concorrente escolheu a porta i”(para i ∈ {1, 2, 3})
Yi =”o apresentador abriu a porta i”(para i ∈ {1, 2, 3})
Sabemos do enunciado que os Xi são mutuamente exclusivos e a sua
disjunção é verdadeira (o prémio tem que estar atrás de uma e uma só porta).
Então p(X1 ) + p(X2 ) + p(X3 ) = 1, e p(Xi Xj ) = δij . É-nos também dito que
p(E3 ) = 1 e que p(Yi ) = 1 (sendo os outros p(Ej ) = 0).
Então
Mas vamos ver agora algo mais chocante: às vezes as soluções formais
também parecem provar uma vez uma coisa e outra vez a oposta:
Seja Ci a proposição ”o prémio está atrás da porta i.
Então quando o apresentador abre a porta 1 eu fico a saber que o prémio
não está lá. Ou seja fico a saber que C1 é falsa, portanto C1 é verdadeira.
Pergunto agora qual é o valor de p(C2 ) sabendo que C1 é verdadeira.
Será que isto é uma prova bayesiana do argumento inverso? Ou será que
nos enganámos? Não nos enganámos nem é uma inconsistência do forma-
lismo. A resposta está correcta, ”as far as it goes”... mas não responde à
pergunta certa! De facto p(C2 |C1 ) = 1/2, ou seja, não vale a pena mudar
de porta se tudo o que sabemos é que o prémio não está em C1 . Mas isso
3
não é toda a informação que nos foi dada! A informação é que sabemos que
p(C1 ) = 0, mas sabemos isso porque sabemos que p(E3 ) = 1 (ou seja, que
escolhemos a porta 3) e que p(Y1 ) = 1, ou seja, que o apresentador escolheu
abrir de seguida a porta 1. Estes dois factos expressam mais informação do
que apenas p(C1 ) = 0. É interessante notar que em termos lógicos de facto
E3 Y1 ⇒ C1 , mas a informação suplementar contida em E3 e Y1 não pode
ser expressa na forma de uma implicação do mesmo género; mas pode ser
expressa em probabilidades. Foi precisamente para lidar com este género de
informação, que permite silogismos fracos (por oposição ao silogismo forte
permitido por E3 Y1 ⇒ C1 ≡ 1) que generalizámos a lógica ao domı́nio das
probabilidades. A prova de que existe mais informação no enunciado é pre-
cisamente que p(C2 |Y1 E3 ) > (C2 |C1 ).
4
do R, ou uma tabela de Betas).
c) Na continuação da alı́nea a), calcule a aproximação Normal da distribuição
posterior de θ (quando todas as medições foram realizadas). Use ainda essa
aproximação para obter um intervalo de credibilidade a 95 por cento para
o valor de θ (recorde que um intervalo do tipo [µ ± 1.96σ] contém 95 por
cento da probabilidade de uma distribuição Normal). Faça um gráfico desta
normal e acrescente-o aos gráficos da alı́nea a).
Nota: usando o R pode sobrepor dois gráficos (digamos de funções f e g)
fazendo curve(f(x), col=”blue”’) para o primeiro (por exemplo) e curve(g(x),
col=”red”, add=TRUE) para o segundo (e seguintes). A instrução “add=TRUE”
para os gráficos a seguir ao primeiro assegura a sobreposição.
d) Um intervalo de densidade máxima (“Highest density interval”, ou HDI )
a x% para uma densidade de probabilidade f (x) define-se como um intervalo
Rb
I = [a, b] da variável x tal que a f (x)dx = x/100 e tal que o mı́nimo de f
em I é maior ou igual que o máximo de f fora de I. Diga justificando se os
intervalos de credibilidade que obteve acima para as Betas são HDIs.
Solução:
p(θ|x1 +x2 , n1 +n2 , I) = Beta(1+x1 +x2 , 1+n1 +n2 −x1 −x2 ) = Beta(39, 13) ∝ θ38 (1−θ)12 .
> qbeta(0.025,9,3)
[1] 0.4822441
5
> qbeta(0.975,9,3)
[1] 0.9397823
> qbeta(0.025,39,13)
[1] 0.6250695
> qbeta(0.975,39,13)
[1] 0.8567374
6
Densidade de probabilidade de theta
7
6
prior
posterior
normal
5
4
p(θ)
3
2
1
0
Figura 1: Distribuições de θ.
install.packages("latex2exp")
library("latex2exp")
e de seguida só terı́amos que modificar a linha que imprime o prior, para
o seguinte:
> dbeta(qbeta(0.025,39,13),39,13)
[1] 0.8403737
> dbeta(qbeta(0.975,39,13),39,13)
[1] 1.298957
7
Como a distribuição é continua e unimodal, seria possivel mover o inter-
valo um pouco para a direita para descer um pouco o valor da distribuição
no extremo desse lado, e manter os 95% de probabilidade compensando isto
com um movimento para a direita do extremo esquerdo, até encontrar um
par de extremos em que os valores de dbeta fossem iguais. Este par define
necessariamente o HDI para o caso da beta (para distribuições multimodais
ou com descontinuidades este processo complica-se). Seria um exercı́cio in-
teressante programar este algoritmo em R. Mas o estudante que pretenda
simplesmente calcular HDIs poderá encontrar packages de R que o fazem de
forma muito geral. Por exemplo o package HDInterval:
https://cran.r-project.org/web/packages/HDInterval/HDInterval.
pdf
Vemos abaixo como se instala o package em R como se faz o cálculo do
HDI para a nossa Beta(39,13)
>install.packages("HDInterval")
>library("HDInterval")
> hdi(qbeta, 0.95, shape1=39, shape2=13)
lower upper
0.6321762 0.8624441
attr(,"credMass")
[1] 0.95
Note-se que nos extremos temos valores idênticos da distribuição, tal como
esperávamos,
> dbeta(0.6321762,39,13)
[1] 1.026396
> dbeta(0.8624441,39,13)
[1] 1.026396
FIM