Professional Documents
Culture Documents
2009 : 85 92 85
ABSTRACT
In this paper, we discuss binary multivariate response modeling based on extreme value
distribution. Independent variables used in these models are some attributes of the alternative
(labeled Zijt) and some attributes of the decision maker (labeled Xi). We assumed that n the
decision maker observed with T response. Yit is tnd response variables from decision maker i and
value Yit is binary. Response of decision maker i can be expressed as Yi = (Yi1,...,YiT). In each of
the decision maker, we have data (Yi, Xi, Zi). Models are derived by the assumption that maximum
random utility which the decision maker i choose one of the alternatives having greatest utility.
Methods of parameter estimation are Maximum Likelihood Estimator (MLE) method and
Generalized Estimating Equation (GEE). First discussion in this study is the estimation by MLE
with independent assumption among response and then the MLE estimation using joint
distribution by Bahadurs representation. By MLE and GEE, estimating equations are obtained and
solved by numerical (likes Newthon-Rahpson method) in the condition that not all of the
parameters of individual attributes can be estimated (identified). Based on testing simulation data
with R.2.5.0, we recommend (a) in low correlation, GEE is better than MLE (b) in moderate
correlation, MLE is most efficient but not stable (c) in high or moderate correlation, MLE and
GEE should be used (d) correlation estimators cannot explain the real correlation because of its
bias.
dipertimbangkan dalam model adalah variabel P(yi1 = 1,...., yiT = 1) = P(0 < Ui1,..., 0 < UiT) =
karakteristik individu dan variabel karakteristik P(-Vi1 < i1,..., -ViT < iT) =
pilihan. Metode estimasi parameter
menggunakan MLE dan metode GEE. I (V
i
it < it ). f ( i' )d i' t (3)
Pembahasan estimasi MLE diawali dengan
asumsi independen antar respon dan kemudian dengan i = (i1,..., iT). Nilai probabilitas ini
dilanjutkan pembahasan estimasi MLE merupakan hitungan integral rangkap T dan
menggunakan distribusi gabungan dari tergantung pada parameter , dan maupun
Bahadurs representation. distribusi .
Beberapa metode estimasi tersebut
diimplentasikan pada data simulasi. Data MLE pada model logit
dibangkitkan pada nilai parameter yang sudah Model Logit dapat diturunkan dari asumsi
ditentukan. Hasil estimasi dibandingkan bahwa ijt berdistribusi nilai ekstrim (extreme
dengan nilai parameter sesungguhnya. value) yang saling independen untuk semua i,j
dan t. Fungsi densitas nilai ekstrem (Gumbel)
Model utilitas adalah
Diasumsikan bahwa n individu masing-masing ijt ijt
yit = 1 <=> Ui1t > Ui0t <=> Uit > 0 <=> -Vit < it = ( y it it ) ;
1t i =1
LLt n
i =1
Pada kondisi derivatif pertama sama dengan ( Z i1t Z i 0t )
nul maka agar MLE untuk parameter dan dan
teridentifikasi/terestimasi maka perlu
disyaratkan 0t =1 dan 0t=1. Sehingga n
1 Xi ( Z i1t Z i 0t )
parameter yang harus diestimasi adalah t = H t( k ) = Xi X i2 X i ( Z i1t Z i 0t ) it (1 it )
i =1 2
(t, t, t) dengan t=1t dan t=1t. Fungsi ( Z i1t Z i 0t ) X i ( Z i1t Z i 0t ) ( Z i1t Z i 0t )
Proposisi 2. T
yit
(1it )1yit 1+ tkeiteik + tkleiteikeil +...+12...T ei1t ei2...eiT
Derivarif ke-dua fungsi loglikelihood (5) pada t =1
it
t<k t <k<l
0t =1 dan 0t=1 adalah
(7)
n
1 Xi (Zi1t Zi0t )
(Yit it )
LL
= Xi Xi2 Xi (Zi1t Zi0t ) it (1it ) dengan eit = dan tk =
t t [ it (1 it )]1 / 2
'
i =1 2
(Zi1t Zi0t ) Xi (Zi1t Zi0t ) (Zi1t Zi0t )
E(eiteik),...., 12...T = E(ei1ei2...eiT).
dengan t = (t, t , t)dan merupakan matrik
definet negatif. Penulisan distribusi pada persamaan (7)
disebut Bahadurs representation (Fitzmaurice
Teorema 2. et al. 1993) yang memuat parameter korelasi
MLE untuk parameter t = (t, t , t) dengan = (12, 13,..., 123...T).
asumsi independen antar respon Yit adalah Jika diasumsikan bahwa korelasi tiga
penyelesaian dari persamaan respon atau lebih bernilai nul, maka persamaan
1 (7) dapat disederhanakan menjadi
n
Xi ( yit it ) = 0 P(Yi1=yi1 ,...,YiT= yiT)=
i =1
( Z i1t Z i 0t ) T
(Yit it )(Yik ik)
yit
(1it )1yit 1+tk
1/ 2
t<k [it (1it )ik(1ik)]
it
t=1
yang berlaku untuk setiap t=1,..,T dengan 0t=1
dan 0t =1 (8)
dengan parameter korelasi = (12, 13,..., (T-
Lemma 1. 1)T).
Penyelesaian persamaan penaksir pada Parameter merepresentasikan ukuran
Teorema 2 untuk parameter t = (t, t , t) assosiasi antar respon. Asosiasi (hubungan)
dan t tertentu dengan menggunakan metode antara Yit dan Yik dapat berupa ukuran koefisien
Newton-Raphson pada iterasi ke-(k+1) adalah korelasi, rasio odd (odds ratio) ataupun risiko
t( k +1) = t( k ) ( H t( k ) ) 1 gt( k ) relatif (relative risk). Koefisien korelasi itk
adalah
88 Estimasi ......................... (Jaka Nugraha et al.)
itk it ik LL() = (
ln y it
it (1 it ) 1 y it )+
= (8) i =1 t =1
[ it (1 - it ) ik (1 - ik )]1/2 n T
i =1 t =1
ln 1 +
t<k
tk
C = 1 + tk Bitk tk (1 2 it )(Yik ik )2
(9) t <k t <k
Yik 1
Estimator tak bias dari tk adalah 1 + [ it (1 it )]
4
(Yit - it )(Yik - ik )
tk = (10)
[it (1 - it )ik (1 - ik )]1/2
Proposisi 5.
Persamaan penaksir untuk parameter t adalah
Proposisi 3. 1
n
( yit it + it ) = 0
Parameter tk yang merupakan korelasi antara Xi untuk
Yt dan Yk mempunyai nilai i =1
( Z i1t Z i 0 t )
t=1,...,T
it ik (1 - it )(1 ik )
1/ 2 1/ 2
= diag ( ))
(15)
i i1 (1 i1 ) ... iT (1 iT 1
n
M 0 = i Si1 i dan
i =1
1 1
Wi = diag Xi ,..., Xi n
1
i =1
1
n '
W
-1
Korelasi empirik rist merupakan estimator tak i i Si i Wi
i =1
bias parameter ist untuk i = 1,2,..n dan
s,r=1,2,T. Jika diasumsikan ist= st untuk Pengujian data simulasi
semua i maka penaksirnya adalah Selanjutnya akan dilakukan pengujian pada
1 n sampel terbatas berdasarkan data simulasi
st = rist
n i =1
(13) untuk mengamati sifat estimator yang diperoleh
dari metode MLE dan metode GEE, serta
pengaruh besarnya sampel dan besarnya
Persamaan (12) dan (14) diselesaikan secara korelasi. Penelitian dilakukan untuk sampel
bersamaan untuk mendapatkan penaksir berukuran n=50, n=100, n=500, n=1000 dan
parameter dan . Prosedur mendapatkan n=5000. Diambil kasus T=3. Model utilitas
penaksir dan adalah memberikan nilai subjek i memilih alternatif j pada periode t
penduga awal untuk Ri untuk menghitung adalah
parameter secara iterasi Newton-Raphson.
Nilai yang diperoleh pada langkah (1) Uijt = Vijt + ijt . untuk t=1,2,3 ; i=1,2,...,n ;
digunakan untuk menghitung (rumus pada j=0,1; Vijt = jtXi + tZijt , 0t=1 (16)
persamaan (13) dan (14)), nilai dari langkah
(2) untuk menghitung paramater
menggunakan iterasi Newton-Raphson. Data dibangkitkan pada 11=1= 0.3; 12=2
Langkah (2) dan (3) diulang sampai mencapai =0.6; 13=3=0.9, 3=1 ; 3=1.5 ; 3 = 2. Nilai
titik konvergen. variabel observasi Xi dan Zijt diambil dari
Persamaan iterasi Newton-Raphson ke distribusi normal, yaitu
(k+1) untuk parameter adalah (k+1) = (k) -
Xi ~ N(0,1) ; Zi0t ~N(0,1) ; Zi1t ~N(2,1)
1
n n
Wi i Si-1 i Wi' Wi i Si1 (Y' i 'i(k) ) Persamaan (14) ditranformasi ke dalam selisih
i =1 i =1
(14) utilitas
90 Estimasi ......................... (Jaka Nugraha et al.)
Uit = Ui0t Ui1t = (1t - 1)Xi + t(Zi1t- Zi0t) = tXi Metode estimasi yang digunakan adalah
+ t(Zi1t- Zi0t) (17) metode MLE dan metode GEE.
dengan 1 = -0.7; 2 = -0.4 ;3 = -0.1; 3 = 1 ; Pada metode MLE digunakan dua jenis asumsi
3 = 1.5 ; 3 = 2. yaitu asumsi korelasi nul/independen (MLE.1)
Tiga struktur korelasi, yaitu independen (0), dan asumsi korelasi tidak diketahui (MLE.2).
korelasi sedang (1), korelasi kuat (2) Pada metode GEE menggunakan dua asumsi,
yaitu asumsi independen (GEE.1), dan asumsi
1 0 0
1 0.5 0.5 korelasi tidak diketahui (GEE.2). Estimator
0 = 0 1 0 , 1 = ,
0.5 1 0.5 parameter korelasi dapat dilihat pada MLE.2 dan
0 0 1 0.5 0.5 1 GEE.2.
1 0.9 0.9
2 = . Korelasi rendah (independen).
0.9 1 0.9 Dari Tabel 2, estimator MLE.2 menghasilkan
0.9 0.9 1
bias yang lebih besar dibanding dengan MLE.1.
Analisis menggunakan software R.2.5.0. Walaupun estimator MLE.2 tidak stabil, tetapi
khususnya library (mnormt), library(systemfit), lebih efisien dibandingkan estimator yang lain.
library(micEcon), library(geepack) yang dapat Estimator GEE.1 dan GEE.2 pada umumnya
diakses pada situs www.R-project.org. berbeda, tetapi perbedaanya tidak signifikan,
demikian juga nilai efisiensi relatifnya relatif
HASIL DAN PEMBAHASAN sama. Jadi dapat disimpulkan bahwa pada
struktur korelasi rendah, estimator MLE.1,GEE.1
Hasil estimasi dari perulangan sebanyak 50 kali dan GEE.2 adalah sama. Estimasi parameter
disajikan dalam Tabel 1. Setiap sel pada tabel 1 pada struktur korelasi independen (korelasi
memuat rata-rata dan deviasi standar untuk rendah), disarankan tidak menggunakan
masing-masing parameter. Pada ukuran sampel estimator MLE.2.
lebih dari 500, estimator yang dihasilkan sudah
cukup baik (variansi dan bias kecil). Semakin
Korelasi sedang (1)
besar sampelnya, estimator yang diperoleh
Dari Tabel 3, estimator MLE.2 berbeda secara
semakin mendekati nilai parameter yang
signifikan terhadap estimator yang lain.
sesungguhnya. Pada n=5000, besarnya faktor
pengali dari distribusi normal ke distribusi nilai Variansi estimator MLE.2 dari 50 perulangan
adalah cukup besar, yang menggindikasikan
ekstrim adalah 1,83. Nugraha (2008) telah
estimator ini tidak stabil. Namun demikian
menyampaikan bahwa estimator model logit
besarnya sekitar 1,6 kali estimator pada model estimator MLE.2 adalah yang paling efisien.
probit. Estimator GEE.2 lebih efisien dibandingkan
Pada simulasi berikutnya akan dilakukan estimator MLE.1 dan GEE.1. Pada tingkat
pada n=500. Simulasi dilakukan untuk melihat korelasi menengah disarankan untuk
pengaruh tingkat korelasi terhadap estimator. menggunakan estimator MLE.2 dan GEE.2.
Tabel 1. Estimator pada struktur independen dengan n=50, 100, 500, 1000, 5000.
Tabel 2. Rata-rata selisih estimator dari 50 ulangan korelasi nul menggunakan metode MLE dan
GEE.
Tabel 3. Rata-rata dan standard deviasi estimator pada struktur korelasi 1 metode MLE dan GEE
dari 50 kali perulangan
Tabel 4. Rata-rata dan standart deviasi estimator pada struktur korelasi 2 metode MLE dari
replikasi sebanyak 50 kali