Professional Documents
Culture Documents
Tema 1 Introducció Als MLG
Tema 1 Introducció Als MLG
Plantejament i Validació
GENERALITZATS
Curs 2020-2021
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
l'homoscedasticitat
Transformacions I
pot linealitzar.
No compleix ni la tendència central ni l'homoscedasticitat
Exemple 2 transformat
Models normals
Y |X = f (X ) + e
l'homoscedasticitat
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
nls(y3∼exp(a+b*x),start=list(a=2,b=0.5))
Compleix les condicions, tendència central i homoscedasticitat
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Y Bernoulli
o similars.
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
valor de σ .
factors.
covariables i factors.
L'esperança ha de ser X β ,
d'aquesta forma.
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
y −µi
2
1
Agafant: Φ= a (φ) = φ = σ2 i θi = µi
θi2
− 2ay(φ) − 12 log (2πφ) ⇒
θi y − 2 2
queda `i = a(φ)
θi2 2
b (θi ) = 2 ,Φ= a (φ) = φ i c (y , φ) = − y
2 φ − 1
2
log (2 πφ)
θi y − b (θi )
`i = + c (y , φ)
a (φ)
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Poisson:
λyi
fYi (y ; λi ) = e −λi y!
b (θi ) = e θi i c (y , φ) = − log y ! ⇒
θi y − b (θi )
`i = + c (y , φ)
a (φ)
Exercici: Altres famílies en que es pot escriure
θi y −b (θi )
`i = a(φ)
+ c (y , φ). Comproveu la taula següent:
Família f Yi ( y ) θi φ Φ b (θi )
y −µ 2
1 i θi2
Normal √ 1
2πσ 2e
−2 σ µi σ2 φ 2
y
Poisson e −λi yi! θi
λ
log λi 1 1 e
Binomial
!
N y pi
pi 1 − piN −y
log 1− pi log 1 + e θi
1 1 N
N x y
Gamma βα
Γ(α)
y α− e −βi y
1
θi = − βφi α φ −1 − log (−θi )
λ(y −νi )
2
−
−1
√
φ−1
q
λ y νi2
Inv.Gaussiana 2π y 3 e
2
2νi2
λ − −2θi
Propietats de les famílies dels GLM
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Funció link g (µ ) = η
i i
`i = yq(µi )−Φb(q(µi )) + c (y , φ)
Necessitem parametritzar pel predictor lineal ηi = Xi β
en lloc de lesµi , això ho fem a partir la funció d'enllaç
g (µi ) = ηi ↔ g
−1 (η ) = µ −→
i i
−1 (η −1 (η
y ·q g i ) −b q g i )
`i = + c (y , φ)
Φ
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Link canònic I
Anomenarem canònic als link's que, amb s = ctnt però podeu pensar
s = 1, compleixen:
−1 (η ) = θi = s ηi ↔ g −1 (ηi ) = µi = b0 (s ηi ) →
q g i
Link canònic II
funció dels valors esperats del model, però en el cas que el puguem
utilitzar:
Link
Família b (θi ) µi = b 0 (θi ) θi = q (µi )
can ònic
θi2
Normal
2 θi µi µi
Poisson e i
θ e i
θ log µi log µi
Binomial
log N µ−µi log N −µµi
θi
N log 1 + e θi Ne i i
1+e θi p
N x pi i
log 1−pi log 1−p
i
1
Gamma − log (−θi ) − θ1i 1
µi µ−
i
Inversa √
√1 − 21 µ1 µ− 2
Gaussiana
− −2θi −2θi 2
i
i
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
És on intervenen:
θi y −b (θi )
3) c (y , φ) Constant normalitzadora de e Φ
No depèn de les θ→ ni de µ ni de η = xβ
No afecta a la inferència. Només es útil per poder calcular el
V (µ ) dµi
1
per tant θi = q (µi ) = 0
(µi ) dµ =
R R
q
i
0 µi
b (q (µi )) = B (µi ) ⇒ b (q (µ
i )) q 0 (µ
)=
i
0
i ) = V (µ ) ⇒
B (µ
i
per tant b (θi ) = B (µi ) = B (µi ) dµi =
V (µ ) dµi
0 µ
R R i
i
Exemples: Obtenir θi i b (θi ) a partir de V (µi )
Comproveu la taula:
θi (µi ) = B (µi ) =
V (µi ) R dµi µi (θi ) R µi dµi b (θi ) Família
V (µi ) V (µi )
R µi dµi
R dµi = θi2
= 1
1 1
θi µ2i 2 Normal
µi
R µi dµi 2
R dµi = =
µi θi µi θi
µi e e Poisson
= log µi µi
R dµi R µi dµi
µ2
= = µ2
µ2i i
−1
− θ1i i − log (−θi ) Gamma
µi log µi
R d µi
=
R µi dµi
= √
3
µi
µ3
i √ 1 µ3 i − −2θi Inversa
− 2µ1 2 −2θi −1 Gaussiana
dµi
i µi
µ2 Ne θi
µi dµµi Binomial
Ni
R
=
Ni
R
i =
µ
i 1− + e θi
i 1− N log
µi − µ
N 1+e θi
µ 1
µi N x
log N −µi −N log (N − x )
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
PN
∂` i =1
(yi − b0 (θ(xi β))) · θ0 (xi β) xi ,j
= =0⇔
∂βj Φ
N
X
0
0
yi −b (θ(xi β)) · θ (xi β) xi ,j = 0 ⇒
i =1
1 2 r −1 r r →∞
β̂ (0) = (X t · X ) (X t · g (y ))
−1
Inici: Comencem amb
Resultat de l'estimació de β I
β̂ = β̂ (r )
on r indica l'ultim pas del mètode iteratiu.
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Resultat de l'estimació de β II
Asimptòticament és:
Normal,
No esbiaixat: E β̂ = β
h i
i
són: ν= 0
nombre d observacions − nombre de par àmetres .
Matriu de covariàncies de β̂
Σβ̂ = Φ (x t · ŵ · x )
−1
o la seva estimació
Σ̂β̂ = Φ̂ (x t · ŵ · x )
−1
s'anomena escalada (cov.scaled)
(x t · ŵ · x )
−1
s'anomena no escalada (cov.unscaled)
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
paràmetres ηx = x β i µx = E [yx ] = g
−1 (η ) que els podem
x
estimar puntualment:
µ̂x = g −1 (η̂x ) = g −1
x β̂ normalment s'indica amb ŷx .
\
V (µx ) = V (µ̂x ) = V (ŷx )
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Variància de yx
variància
= N η, ση̂2
t
η̂x = x β̂ ∼ N x β, x Σ x
β̂ per tant:
si coneixem Φ: IC1−α (ηx ) = η̂x + zα/ ση̂ , η̂x + z1−α/ ση̂
2 2
si no coneixem Φ:
IC1−α (ηx ) = η̂x + tν,α/ σ̂η̂ , η̂x + tθ,1−α/ σ̂η̂
2 2
on ν són els
graus de llibertat de Φ̂
Interval de conança de µx
Com que g (µx ) = ηx i g (µ̂x ) = η̂x (per màx.versemblança)
aleshores si IC1−α (ηx ) = (a, b ) tindrem que
−1 (a ) , g −1 (b ) .
IC1−α (µx ) = g
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Interval de predicció de yx
p
1 El que seria un pseudo IP95% (µx ) = µ̂x ± 2 ΦV (µ̂x ) o
q
µ̂x ± 2 Φ̂V (µ̂x ) . És intuïtiu, fàcil de calcular i bon
Quasiversemblança
màxim-versemblants.
Plantejament del model i validació
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Residus:
El teòrics són yi − µi , sabem que tenen esperança = 0 i
vari ància ∝V (µi ). Substituint µi per la predicció queden:
ri= yi − ŷi , que són el residus bruts, sabem que tenen
esperan ça = 0 i asimptòticament vari ància ∝ V (µi ).
√yi −µi , sabem que tenen esperan ça =0 i vari ància = ctnt .
V (µi )
Substituint el valor esperat per la predicció queda:
1 Predictor lineal: η = α + βx
2 Funció link: sembla que les
que pot ser tipus resposta µ̂x o tipus link η̂x (aquest últim
a veure l'efecte del link i/o la família que hem escollit, la gràca de
Exemple 3 de la 1a secció I
1 Predictor lineal: η = α + βx
2 Funció link: sembla que les
constant ⇒ Normal
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Exemple 3 de la 1a secció II
Exemple 4 de la 1a secció I
1 Predictor lineal: η = α + βx
2 Funció link: sembla que les
Exemple 4 de la 1a secció II
1 Predictor lineal: η = α + βx
2 Funció link: sembla que les
Es veu interacció
F2
F1 1 2
A N 20.00 20.00
B N 20.00 20.00
log(Y)
F2
F1 1 2
A N 20.000 20.000
B N 20.000 20.000
F1 F2 emmean SE F1 F2 response SE
1 A 1 12.0400 0.886096 1 A 1 12.0400 0.8860898
2 B 1 36.9695 0.886096 2 B 1 36.9695 0.8860973
3 A 2 23.8300 0.886096 3 A 2 23.8300 0.8860971
4 B 2 72.3185 0.886096 4 B 2 72.3185 0.8860973
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Exemple quasiversemblança I
1 Predictor lineal: η = α + βx
2 Funció link: sembla que les
quasiversemblança amb
V (µ) = µ.
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Exemple quasiversemblança II
glm(formula=yq∼x,family=quasi(link=identity,variance="mu"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2437 -0.5135 0.0132 0.4549 1.8768
Coefficients: Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.25941 0.85830 6.128 1.6e-07 ***
x 0.73786 0.03819 19.323 < 2e-16 ***
(Dispersion parameter for quasi family taken to be 0.7799602)
Null deviance: 284.295 on 49 degrees of freedom
Residual deviance: 38.335 on 48 degrees of freedom
AIC: NA
Number of Fisher Scoring iterations: 5
Ampliar ML GLM Propietats Ajust pred. Plantejament i Validació
Exemple quasiversemblança IV
V (µ) = 1 ⇔ Normal : gràca rpearson vs predicció (link) i
Exemple quasiversemblança V