Estimating Parameters of Logit Model Using MLE and GEE

Jurnal ILMU DASAR Vol. 10 No. 1.
2009 : 85 92 85
Estimasi Parameter Model Logit pada Respons Biner Multivariat

Menggunakan Metode Mle dan Gee
Estimating Parameters of Logit Model on Multivariate Binary Response

Using Mle and Gee
Jaka Nugraha1), Suryo Guritno2), Sri Haryatmi2)

1
Jurusan Statistika UII, 2Jurusan Matematika UGM
ABSTRACT
In this paper, we discuss binary multivariate response modeling based on extreme value
distribution. Independent variables used in these models are some attributes of the alternative
(labeled Zijt) and some attributes of the decision maker (labeled Xi). We assumed that n the
decision maker observed with T response. Yit is tnd response variables from decision maker i and
value Yit is binary. Response of decision maker i can be expressed as Yi = (Yi1,...,YiT). In each of
the decision maker, we have data (Yi, Xi, Zi). Models are derived by the assumption that maximum
random utility which the decision maker i choose one of the alternatives having greatest utility.
Methods of parameter estimation are Maximum Likelihood Estimator (MLE) method and
Generalized Estimating Equation (GEE). First discussion in this study is the estimation by MLE
with independent assumption among response and then the MLE estimation using joint
distribution by Bahadurs representation. By MLE and GEE, estimating equations are obtained and
solved by numerical (likes Newthon-Rahpson method) in the condition that not all of the
parameters of individual attributes can be estimated (identified). Based on testing simulation data
with R.2.5.0, we recommend (a) in low correlation, GEE is better than MLE (b) in moderate
correlation, MLE is most efficient but not stable (c) in high or moderate correlation, MLE and
GEE should be used (d) correlation estimators cannot explain the real correlation because of its
bias.
Keywords : Random utility models, logit models, discrete choice models
PENDAHULUAN strategi pemodelan menggunakan pendekatan

GEE untuk mendapatkan estimator koefisien
regresi yang konsisten dan asimtotis normal.
Model pemilihan diskrit menggambarkan
Pendekatan GEE tidak menggunakan
pembuat keputusan memilih diantara alternatif
perhitungan integral rangkap.
yang tersedia. Model pemilihan diskrit
Contoyanis et al. (2002) menyatakan bahwa
diturunkan dengan asumsi bahwa pembuat
pada model efccek tetap jika terdapat korelasi
keputusan memilih alternatif yang mempunyai
antara efcccek individu terhadap variabel
utiliti terbesar (Train 2003). Model regresi
independen maka estimator yang diperoleh
yang diturunkan dari distribusi nilai ektreme
menjadi tidak efisien. Dengan mengasumsikan
merupakan bagian dari pemodelan Pilihan
model efek random, estimator yang didapatkan
Diskret (DCM, Discrete Choice Model). Model
menjadi lebih efisien. Harris et al. (2000) telah
rccccegresi pada respon nominal yang
melakukan pengujian sifat-sifat estimator
diperoleh dcengan menggunakan distribusi
model probit pada data panel. Disimpulkan
nilai ektreme cadalah sama dengan model
bahwa meskipun jumlah sampel terbatas,
logistik (Nugraha et al. 2006).
estimasi menggunakan MLE masih
Liang & Zeger (1986) menyampaikan
menghasilkan estimator yang baik. MLE
bahwa analisis logistik maupun probit pada
mempunyai sifat-sifat yang baik untuk sampel
data panel dengan menggunakan pendekatan
besar, khususnya asymptotically efficient
univariat, yakni mengabaikan adanya korelasi
(Horrowitz et al. 2001).
akan menghasilkan estimator parameter yang
Dalam makalah ini akan dibahas estimasi
masih konsinten tetapi jika terdapat korelasi
parameter model logit pada respon biner
yang besar maka penaksir tersebut menjadi
multivariat. Variabel independen yang
tidak efisien. Prentice (1988) menyampaikan
86 Estimasi ......................... (Jaka Nugraha et al.)
dipertimbangkan dalam model adalah variabel P(yi1 = 1,...., yiT = 1) = P(0 < Ui1,..., 0 < UiT) =
karakteristik individu dan variabel karakteristik P(-Vi1 < i1,..., -ViT < iT) =
pilihan. Metode estimasi parameter
menggunakan MLE dan metode GEE. I (V
i
it < it ). f ( i' )d i' t (3)
Pembahasan estimasi MLE diawali dengan
asumsi independen antar respon dan kemudian dengan i = (i1,..., iT). Nilai probabilitas ini
dilanjutkan pembahasan estimasi MLE merupakan hitungan integral rangkap T dan
menggunakan distribusi gabungan dari tergantung pada parameter , dan maupun
Bahadurs representation. distribusi .
Beberapa metode estimasi tersebut
diimplentasikan pada data simulasi. Data MLE pada model logit
dibangkitkan pada nilai parameter yang sudah Model Logit dapat diturunkan dari asumsi
ditentukan. Hasil estimasi dibandingkan bahwa ijt berdistribusi nilai ekstrim (extreme
dengan nilai parameter sesungguhnya. value) yang saling independen untuk semua i,j
dan t. Fungsi densitas nilai ekstrem (Gumbel)
Model utilitas adalah
Diasumsikan bahwa n individu masing-masing ijt ijt
diobservasi sebanyak T respon. Yit adalah f ( ijt ) = (4)

respon ke-t pada individu/subjek ke-i dan
setiap responnya adalah biner. Sehingga respon Teorema 1
pada individu ke-i, dapat disajikan dalam Jika ijt adalah variabel random yang
bentuk Yi = (Yi1,....,YiT) sebagai vektor 1xT, mempunyai densitas extreme value maka
Setiap individu mempunyai kovariate Xi berdasarkan asumsi bahwa pembuat keputusan
sebagai karakteristik individu i dan kovariate (subjek) menentukan pilihan berdasarkan nilai
Zijt sebagai karakteristik alternatif/pilihan j utilitas yang maksimum, probabilitas subjek i
pada individu i. Untuk menyederhanakan memilih j=1 untuk respon ke-t (probabilitas
penulisan, diambil satu variabel karakteristik marginal) adalah
individu dan satu variabel karakteristik pilihan.
exp(Vi1t )
Utilitas subjek i memilih alternatif j pada P( y it = 1) = it =
periode t adalah [exp(Vi 0t ) + exp(Vi1t )]
Uijt = Vijt + ijt
dengan Vijt = jt +jtXi + tZijt untuk t=1,2,...,T ;
untuk t=1,2,...,T ; i=1,2,...,n ; j=0,1 (1)
i=1,2,...,n ; j=0,1.
Vijt = jt +jtXi + tZijt
Jika variabel random ijt saling independen
untuk semua i,j dan t maka fungsi log-
Uijt adalah utilitas yang merupakan variabel
likelihoonya adalah
laten dan Vijt dinamakan representatif utilitas.
n T
Dengan mengasumsikan bahwa pembuat LL = {yit (Vi1t Vi0t ) +Vi0t ln([exp(Vi0t ) + exp(Vi1t )])}
keputusan (subjek) menentukan pilihan i=1 t
berdasarkan nilai utilitas yang maksimum,
(5)
maka model dapat disajikan dalam bentuk
selisih utilitas,
Proposisi 1.
Derivarif pertama fungsi loglikelihood (5)
Uit = Ui1t - Ui0t = (Vi1t Vi0t)+ (i1t - i0t) = Vit +it (2) adalah
LLt n
Selanjutnya dapat disusun hubungan antara Yit = ( it y it ) ;

0t i =1
dan variabel laten Uit, yaitu
LLt n
yit = 1 <=> Ui1t > Ui0t <=> Uit > 0 <=> -Vit < it = ( y it it ) ;
1t i =1
LLt n
Probabilitas subjek i memilih (yi1 = 1,...., yiT = = X i ( it y it )

1) adalah 1t i =1
Jurnal ILMU DASAR Vol. 10 No. 1. 2009 : 85 92 87
LLt n dan penaksir MLE parameter mempunyai

= X i ( y it it ) dan sifat
1t i =1
t

a
N [ t ,{H t }1 ]
LLt n
= ( Z i1t Z i 0t )( y it it )
t i =1 1

( )
n
untuk t=1,2,..,T. dengan g (k )
t = Xi y it it
(k )
i =1
Pada kondisi derivatif pertama sama dengan ( Z i1t Z i 0t )
nul maka agar MLE untuk parameter dan dan
teridentifikasi/terestimasi maka perlu
disyaratkan 0t =1 dan 0t=1. Sehingga n
1 Xi ( Z i1t Z i 0t )

parameter yang harus diestimasi adalah t = H t( k ) = Xi X i2 X i ( Z i1t Z i 0t ) it (1 it )
i =1 2
(t, t, t) dengan t=1t dan t=1t. Fungsi ( Z i1t Z i 0t ) X i ( Z i1t Z i 0t ) ( Z i1t Z i 0t )
log-likehood (5) menjadi
1 MLE menggunakan Bahadurs

LL n Represetation
= Xi ( y it it ) (6) Penyajian distribusi bersama untuk T respon
t i =1 biner, Yi1,....,YiT dapat dituliskan sebagai
( Z i1t Z i 0t ) P(Yi1=yi1 ,...,YiT= yiT)=
Proposisi 2. T

yit
(1it )1yit 1+ tkeiteik + tkleiteikeil +...+12...T ei1t ei2...eiT
Derivarif ke-dua fungsi loglikelihood (5) pada t =1
it
t<k t <k<l
0t =1 dan 0t=1 adalah
(7)
n
1 Xi (Zi1t Zi0t )
(Yit it )
LL
= Xi Xi2 Xi (Zi1t Zi0t ) it (1it ) dengan eit = dan tk =
t t [ it (1 it )]1 / 2
'
i =1 2
(Zi1t Zi0t ) Xi (Zi1t Zi0t ) (Zi1t Zi0t )
E(eiteik),...., 12...T = E(ei1ei2...eiT).
dengan t = (t, t , t)dan merupakan matrik
definet negatif. Penulisan distribusi pada persamaan (7)
disebut Bahadurs representation (Fitzmaurice
Teorema 2. et al. 1993) yang memuat parameter korelasi
MLE untuk parameter t = (t, t , t) dengan = (12, 13,..., 123...T).
asumsi independen antar respon Yit adalah Jika diasumsikan bahwa korelasi tiga
penyelesaian dari persamaan respon atau lebih bernilai nul, maka persamaan
1 (7) dapat disederhanakan menjadi
n
Xi ( yit it ) = 0 P(Yi1=yi1 ,...,YiT= yiT)=
i =1
( Z i1t Z i 0t ) T
(Yit it )(Yik ik)
yit
(1it )1yit 1+tk
1/ 2
t<k [it (1it )ik(1ik)]
it
t=1
yang berlaku untuk setiap t=1,..,T dengan 0t=1
dan 0t =1 (8)
dengan parameter korelasi = (12, 13,..., (T-
Lemma 1. 1)T).
Penyelesaian persamaan penaksir pada Parameter merepresentasikan ukuran
Teorema 2 untuk parameter t = (t, t , t) assosiasi antar respon. Asosiasi (hubungan)
dan t tertentu dengan menggunakan metode antara Yit dan Yik dapat berupa ukuran koefisien
Newton-Raphson pada iterasi ke-(k+1) adalah korelasi, rasio odd (odds ratio) ataupun risiko
t( k +1) = t( k ) ( H t( k ) ) 1 gt( k ) relatif (relative risk). Koefisien korelasi itk
adalah
Cov(Yit ,Yik ) maka fungsi log-likelihood untuk parameter t

itk = = (t;t) adalah
var(Yit ) var(Yik ) n T
itk it ik LL() = (
ln y it
it (1 it ) 1 y it )+
= (8) i =1 t =1
[ it (1 - it ) ik (1 - ik )]1/2 n T

i =1 t =1
ln 1 +

t<k
tk
dengan itk = P(Yit=1 ,Yik= 1). (Y it it ) (Y ik ik )

1/2
[ i t (1 i t ) i k (1 ik )]
Selanjutnya parameter itk akan diestimasi dari
distribusi bersama (Yit=yit;Yik=yik). Dari 1 Xi (Zi1t Zi 0t )
2 LLt n

persamaan (9) diperoleh = Xi X i2 X i (Zi1t Zi 0t )
't t i =1 2
P(Yit=1 ,Yik= 1)= (Zi1t Zi 0t ) X i (Zi1t Zi 0t ) (Zi1t Zi 0t )
itk = it ik + tk [ it (1 - it ) ik (1 - ik )]1/2 ( it (1 it ) + (1 C)C )
P(Yit=1 ,Yik= 0) (Yit it )(Yik ik )

Bitk =
= it (1 ik ) tk [ it (1 - it ) ik (1 - ik )] 1/2 [ it (1 it ) ik (1 ik )]1 / 2
P(Yit=0 ,Yik= 1)

1
LLt n
Xi
= ik (1 it ) tk [ it (1 - it ) ik (1 - ik )] 1/2 = y
it + tk itk
1 + B
t
it
i =1 ( Zi1t Zi 0t ) t <k
P(Yit=0 ,Yik= 0)
Yik
= (1 it )(1 ik ) tk [ it (1 - it ) ik (1 - ik )]1/2 2 it (1 it ) (Yik ik )
2
Dari (a), (b), (c) dan (d), fungsi probabilitas tk
[ it (1 it )]1/ 2 [ ik (1 ik )]1/ 2
bivariat P(Yit,Yik) dapat dituliskan sebagai t <k

P(Yit = yit , Yik = yik ) = dengan
ity (1 it )1 y iky (1 ik )1 y + (1) y + y ik
tk [ it (1 - it ) ik (1 - ik )]1/2 1

it it ik ik it
C = 1 + tk Bitk tk (1 2 it )(Yik ik )2
(9) t <k t <k
Yik 1
Estimator tak bias dari tk adalah 1 + [ it (1 it )]
4
(Yit - it )(Yik - ik )
tk = (10)
[it (1 - it )ik (1 - ik )]1/2
Proposisi 5.
Persamaan penaksir untuk parameter t adalah
Proposisi 3. 1
n

( yit it + it ) = 0
Parameter tk yang merupakan korelasi antara Xi untuk

Yt dan Yk mempunyai nilai i =1
( Z i1t Z i 0 t )
t=1,...,T
it ik (1 - it )(1 ik )
1/ 2 1/ 2
min ; tk GEE untuk model logit

(1 - it )(1 ik ) it ik Liang & Zeger (1986) dan Prentice (1988)
telah mengembangkan GEE. Pendekatan GEE
(1 - ) 1 / 2 ( (1 ) 1 / 2 menghasilkan estimator konsisten untuk
min it ik
, it ik
parameter regresi, di bawah spesifikasi yang

it (1 )
ik (1 - it ) ik benar untuk fungsi mean, i yang merupakan
vektor respons untuk masing-masing individu.
Proposisi 4. GEE menggunakan pendekatan distribusi
Berdasarkan Bahadurs representation dan marginal. GEE untuk dapat dituliskan dalam
mengabaikan korelasi tiga respon atau lebih, bentuk
n Liang & Zeger (1986) merekomendasikan

G() = Wi i Si1 (Y'i 'i ) = 0 (11) estimator yang konsisten untuk Var(),
Var () = M 01M 1M 01
i =1
= diag ( ))
(15)
i i1 (1 i1 ) ... iT (1 iT 1

n
M 0 = i Si1 i dan
i =1
1 1

Wi = diag Xi ,..., Xi n

1
(Z Z ) (Z Z ) M 1 = i Si1 ( y 'i 'i )( y 'i 'i )' Si1 i

i11 i 01 i1T i 0T i =1
dan
Teorema 3.
Yi = (Yi1,...,YiT); i = (i1,..., iT); Si = G merupakan estimator GEE, maka
1/2 1/2
A RiA
i i ; lim n (G ) berdistribusi normal
A 1/ 2
i (
= diag Var (Yi1 ) ... Var (YiT ) ) n
multivariat,
Ri adalah matrik working korelasi Yi dan Wi lim n (G ) ~ NM (0; n.Var (G ))
disebut matrik observasi. n
Untuk mengestimasi Ri, didefinisikan vektor dengan
korelasi empirik ri yang berukuran T(T-1)/2 1
n '
dengan elemen-elemen Var (G ) = W -1
i i Si i Wi
i =1
(Yis is )(Yit it )
rist = (12) n

[ is (1 is ) it (1 it )]1 / 2 W
1 1
i i Si (Y'i 'i )(Y'i 'i ) 'Si i Wi
(k) (k)
i =1
1
n '
W
-1
Korelasi empirik rist merupakan estimator tak i i Si i Wi
i =1
bias parameter ist untuk i = 1,2,..n dan
s,r=1,2,T. Jika diasumsikan ist= st untuk Pengujian data simulasi
semua i maka penaksirnya adalah Selanjutnya akan dilakukan pengujian pada
1 n sampel terbatas berdasarkan data simulasi
st = rist
n i =1
(13) untuk mengamati sifat estimator yang diperoleh
dari metode MLE dan metode GEE, serta
pengaruh besarnya sampel dan besarnya
Persamaan (12) dan (14) diselesaikan secara korelasi. Penelitian dilakukan untuk sampel
bersamaan untuk mendapatkan penaksir berukuran n=50, n=100, n=500, n=1000 dan
parameter dan . Prosedur mendapatkan n=5000. Diambil kasus T=3. Model utilitas
penaksir dan adalah memberikan nilai subjek i memilih alternatif j pada periode t
penduga awal untuk Ri untuk menghitung adalah
parameter secara iterasi Newton-Raphson.
Nilai yang diperoleh pada langkah (1) Uijt = Vijt + ijt . untuk t=1,2,3 ; i=1,2,...,n ;
digunakan untuk menghitung (rumus pada j=0,1; Vijt = jtXi + tZijt , 0t=1 (16)
persamaan (13) dan (14)), nilai dari langkah
(2) untuk menghitung paramater
menggunakan iterasi Newton-Raphson. Data dibangkitkan pada 11=1= 0.3; 12=2
Langkah (2) dan (3) diulang sampai mencapai =0.6; 13=3=0.9, 3=1 ; 3=1.5 ; 3 = 2. Nilai
titik konvergen. variabel observasi Xi dan Zijt diambil dari
Persamaan iterasi Newton-Raphson ke distribusi normal, yaitu
(k+1) untuk parameter adalah (k+1) = (k) -
Xi ~ N(0,1) ; Zi0t ~N(0,1) ; Zi1t ~N(2,1)
1
n n
Wi i Si-1 i Wi' Wi i Si1 (Y' i 'i(k) ) Persamaan (14) ditranformasi ke dalam selisih
i =1 i =1
(14) utilitas
Uit = Ui0t Ui1t = (1t - 1)Xi + t(Zi1t- Zi0t) = tXi Metode estimasi yang digunakan adalah
+ t(Zi1t- Zi0t) (17) metode MLE dan metode GEE.
dengan 1 = -0.7; 2 = -0.4 ;3 = -0.1; 3 = 1 ; Pada metode MLE digunakan dua jenis asumsi
3 = 1.5 ; 3 = 2. yaitu asumsi korelasi nul/independen (MLE.1)
Tiga struktur korelasi, yaitu independen (0), dan asumsi korelasi tidak diketahui (MLE.2).
korelasi sedang (1), korelasi kuat (2) Pada metode GEE menggunakan dua asumsi,
yaitu asumsi independen (GEE.1), dan asumsi
1 0 0
1 0.5 0.5 korelasi tidak diketahui (GEE.2). Estimator
0 = 0 1 0 , 1 = ,
0.5 1 0.5 parameter korelasi dapat dilihat pada MLE.2 dan
0 0 1 0.5 0.5 1 GEE.2.

1 0.9 0.9
2 = . Korelasi rendah (independen).
0.9 1 0.9 Dari Tabel 2, estimator MLE.2 menghasilkan
0.9 0.9 1
bias yang lebih besar dibanding dengan MLE.1.
Analisis menggunakan software R.2.5.0. Walaupun estimator MLE.2 tidak stabil, tetapi
khususnya library (mnormt), library(systemfit), lebih efisien dibandingkan estimator yang lain.
library(micEcon), library(geepack) yang dapat Estimator GEE.1 dan GEE.2 pada umumnya
diakses pada situs www.R-project.org. berbeda, tetapi perbedaanya tidak signifikan,
demikian juga nilai efisiensi relatifnya relatif
HASIL DAN PEMBAHASAN sama. Jadi dapat disimpulkan bahwa pada
struktur korelasi rendah, estimator MLE.1,GEE.1
Hasil estimasi dari perulangan sebanyak 50 kali dan GEE.2 adalah sama. Estimasi parameter
disajikan dalam Tabel 1. Setiap sel pada tabel 1 pada struktur korelasi independen (korelasi
memuat rata-rata dan deviasi standar untuk rendah), disarankan tidak menggunakan
masing-masing parameter. Pada ukuran sampel estimator MLE.2.
lebih dari 500, estimator yang dihasilkan sudah
cukup baik (variansi dan bias kecil). Semakin
Korelasi sedang (1)
besar sampelnya, estimator yang diperoleh
Dari Tabel 3, estimator MLE.2 berbeda secara
semakin mendekati nilai parameter yang
signifikan terhadap estimator yang lain.
sesungguhnya. Pada n=5000, besarnya faktor
pengali dari distribusi normal ke distribusi nilai Variansi estimator MLE.2 dari 50 perulangan
adalah cukup besar, yang menggindikasikan
ekstrim adalah 1,83. Nugraha (2008) telah
estimator ini tidak stabil. Namun demikian
menyampaikan bahwa estimator model logit
besarnya sekitar 1,6 kali estimator pada model estimator MLE.2 adalah yang paling efisien.
probit. Estimator GEE.2 lebih efisien dibandingkan
Pada simulasi berikutnya akan dilakukan estimator MLE.1 dan GEE.1. Pada tingkat
pada n=500. Simulasi dilakukan untuk melihat korelasi menengah disarankan untuk
pengaruh tingkat korelasi terhadap estimator. menggunakan estimator MLE.2 dan GEE.2.
Tabel 1. Estimator pada struktur independen dengan n=50, 100, 500, 1000, 5000.
n=50 n=100 n=500 n=1000 n=5000

1 =-0.7 -16.72676 -1.382420 -1.3156010 -1.2987803 -1.2882580
83.72857 0.4595683 0.2147049 0.1409521 0.06273694
2 =-0.4 10.57378 -1.029993 -0.6762419 -0.7385833 -0.7466852
44.74932 0.8257090 0.1809128 0.1716151 0.07369822
3 =-0.1 -14.83119 2.453454 -0.1980757 -0.1907568 -0.1831842
80.43420 18.1880681 0.3155704 0.1536290 0.08231370
1 =1 24.42945 1.940491 1.8597843 1.8322580 1.8198639
109.50122 0.4588031 0.2052540 0.1038094 0.05386884
2 =1.5 21.31712 3.492314 2.7917158 2.7710875 2.7407762
127.45044 1.7159711 0.2052540 0.2092163 0.09529880
3 =2 128.62211 29.736070 3.8259477 3.7736695 3.6976281
259.98991 181.0836355 0.4906767 0.3448178 0.14541870
Tabel 2. Rata-rata selisih estimator dari 50 ulangan korelasi nul menggunakan metode MLE dan
GEE.
Parameter MLE.1 MLE.2-MLE.1 + GEE.1 GEE.2 -GEE.1 +

mean sd mean sd mean sd mean sd
1 =-1.281 -1.2541 0.2262 -1.2542 0.2262 -1.2787 0.00843 -1.2542 0.2262
2 =-0.732 -0.7559 0.2993 -0.7559 0.2993 -0.7339 0.00820 -0.7559 0.2993
3 =-0.183 -0.1890 0.2470 -0.1890 0.2470 -0.1841 0.00978 -0.1890 0.2469
1 =1.83 1.7981 0.1520 1.7982 0.1520 1.8282 0.00746 1.7982 0.1519
2 =2.745 2.7770 0.2874 2.7770 0.2874 2.7486 0.01213 2.7771 0.2874
3 =3.66 3.7758 0.4710 3.7758 0.4711 3.6590 0.02514 3.7758 0.4711
Tabel 3. Rata-rata dan standard deviasi estimator pada struktur korelasi 1 metode MLE dan GEE
dari 50 kali perulangan
Parameter MLE.1 MLE.2 GEE.1 GEE.2

1 =-1.281 -1.2656 0.2395 -1.2912 0.2015 -1.2869 0.2000 -1.2892 0.3942
2 =-0.732 -0.7696 0.2429 -0.7372 0.1794 -0.7399 0.1779 -0.5957 0.3168
3 =-0.183 -0.2271 0.2858 -0.2212 0.3140 -0.2211 0.3115 -0.3607 0.2019
1 =1.83 1.7941 0.1947 1.8478 0.1744 1.8430 0.1750 1.9828 0.5958
2 =2.745 2.7811 0.3038 2.8335 0.3032 2.8229 0.2933 2.5538 0.4891
3 =3.66 3.6794 0.4788 3.7155 0.4998 3.7206 0.4956 2.5486 0.7956
12 - - 0 0 0.1205 0.1205 0.0648 0.0774
13 - - 0 0 0.0710 0.0698 0.1987 0.2471
23 - - 0 0 0.0593 0.0533 0.0792 0.0603
Tabel 4. Rata-rata dan standart deviasi estimator pada struktur korelasi 2 metode MLE dari
replikasi sebanyak 50 kali
Parameter MLE.1 MLE.2 GEE.1 GEE.2

1 =-1.281 -1.2655 0.2394 -1.3315 0.2406 -1.3323 0.2385 -1.3377 0.3845
2 =-0.732 -0.7683 0.2571 -0.7165 0.2030 -0.7134 0.2059 -0.6351 0.3104
3 =-0.183 -0.2744 0.3125 -0.1659 0.2617 -0.1588 0.2443 -0.3906 0.2002
1 =1.83 1.7940 0.1947 1.8441 0.1807 1.8417 0.17885 2.0613 0.5326
2 =2.745 2.8571 0.2950 2.8441 0.4008 2.8419 0.4072 2.7965 0.5091
3 =3.66 3.6788 0.4293 3.7843 0.5273 3.7795 0.5038 2.6578 0.6712
12 - - 0 0 0.2288 0.1298 0.0476 0.0544
13 - - 0 0 0.1636 0.1186 0.1928 0.2099
23 - - 0 0 0.1234 0.0967 0.0747 0.0497
Korelasi kuat (2) Sehingga dapat disimpulkan, jika terdapat

Dari Tabel 4, pada struktur korelasi 2 korelasi kuat antar respon sebaiknya digunakan
estimator MLE.2 berbeda secara signifikan estimator GEE.2 dan MLE.2. Diantara estimator
terhadap estimator lain. Estimator GEE.2 lebih GEE.2 dan MLE.2, keunggulan masing-masing
efisien dibandingkan dengan estimator GEE.1, estimator sangat tergantung pada data yang
MLE. dianalisis, sehingga tidak dapat digeneralkan.
KESIMPULAN Fitzmaurice GM, Laird NM, Ratnitzky AG. 1993.

Regression Models for DiscreteLongitudinal
Pemodelan pada respon biner multivariat Responses. Statistical Science Vol. 8 No. 3 : 284
dengan variabel independen berupa 309
Harris MN, Macquarie LR, Siouclis AJ. 2000,
karakteristik individu dan karakteristik pilihan Comparison of alternative Estimators for Binary
dapat dilakukan menggunakan model distribusi Panel Probit Models, Melbourne Institute
nilai ekstrim. Metode MLE dan metode GEE Working Paper no 3/00
dapat digunakan untuk mengestimasi Horowitz JL & Savin NE. 2001. Binary Response
parameter. Kedua metode menghasilkan Models : Logits, Probits and Semiparametrics,
persamaan penaksir yang harus diselesaikan Journal of Economic Perspectives, Volume
secara iterasi. Pengujian estimator dapat 15(4): 43-56
dilakukan menggunakan pendekatan teori Nugraha J, Haryatmi S, Guritno S. 2006. Model
sampel besar. Discrete Choice dan Regresi Logistik, Proseding
Seminar Nasional MIPA, UNY.
Pada tingkat korelasi rendah, disarankan Nugraha J.2008. Model Probit dan Model Logit pada
tidak menggunakan estimator MLE.2. Pada Respon Biner. Eksakta, Jurnal Ilmu-ilmu MIPA
tingkat korelasi sedang maupun korelasi tinggi, Vol 10(1): 9-17
sebaiknya digunakan estimator MLE.2 dan Liang KY & Zeger SL. 1986. Longitudinal Data
GEE.2. Estimator parameter korelasi pada Analysis Using Generalised Linear Models,
metode MLE.2 dan GEE.3 tidak dapat digunakan Biometrika 73: 13-22.
Prentice.1988. Correlated Binary Regression with
untuk menggambarkan tingkat korelasi yang
Covariates Specific to Each Binary Observation.
sesungguhnya. Biometrics 44 : 1043-1048.
R Development Core Team (2008). R: A language
DAFTAR PUSTAKA and Environment for Statistical Computing. R
Foundation for Statistical Computing, Vienna,
Austria. ISBN 3-900051-07-0, URL
Contoyannis P, Andrew MJ, Gonzales RL. 2002.
http://www.R-project.org, [24-5-2008, 2:13]
Using Simulation-Based Inference With Panel
Train K .2003. Discrete Choice Methods with
Data In Health Economics. Working Paper
Simulation, UK Press, Cambridge.
Department of Economics and Related Studies,
University of York.

Estimating Parameters of Logit Model Using MLE and GEE

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estimating Parameters of Logit Model Using MLE and GEE

Uploaded by

Copyright:

Available Formats

Jurnal ILMU DASAR Vol. 10 No. 1.

Estimasi Parameter Model Logit pada Respons Biner Multivariat

Estimating Parameters of Logit Model on Multivariate Binary Response

Jaka Nugraha1), Suryo Guritno2), Sri Haryatmi2)

Keywords : Random utility models, logit models, discrete choice models

PENDAHULUAN strategi pemodelan menggunakan pendekatan

diobservasi sebanyak T respon. Yit adalah f ( ijt ) = (4)

Selanjutnya dapat disusun hubungan antara Yit = ( it y it ) ;

Probabilitas subjek i memilih (yi1 = 1,...., yiT = = X i ( it y it )

LLt n dan penaksir MLE parameter mempunyai

log-likehood (5) menjadi

1 MLE menggunakan Bahadurs

Cov(Yit ,Yik ) maka fungsi log-likelihood untuk parameter t

dengan itk = P(Yit=1 ,Yik= 1). (Y it it ) (Y ik ik )

P(Yit=1 ,Yik= 0) (Yit it )(Yik ik )

min ; tk GEE untuk model logit

n Liang & Zeger (1986) merekomendasikan

(Z Z ) (Z Z ) M 1 = i Si1 ( y 'i 'i )( y 'i 'i )' Si1 i

n=50 n=100 n=500 n=1000 n=5000

Parameter MLE.1 MLE.2-MLE.1 + GEE.1 GEE.2 -GEE.1 +

Parameter MLE.1 MLE.2 GEE.1 GEE.2

Parameter MLE.1 MLE.2 GEE.1 GEE.2

Korelasi kuat (2) Sehingga dapat disimpulkan, jika terdapat

KESIMPULAN Fitzmaurice GM, Laird NM, Ratnitzky AG. 1993.

You might also like