You are on page 1of 9

MULTINOMIAL LOGISTIC REGRESSION

Multinomial logistic regressiom adalah perluasan dari regresi logistik biner ketika variabel responya memiliki lebih dari dua kategori. Misal, selain hanya meramalkan tentang mati atau hidup, kita dapat membuatnya menjadi tiga kelompok yaitu mati, hilang, dan hidup. Untuk menganalisanya, harus dipilih kategori rujukan yang akan digunakan untun perbandingan, misal kategori hidup. Sehingga, hilang akan dibandingkan dengan hidup dan mati juga akan dibandingkan dengan hidup. Prediktor yang digunakan ada dua kategori (jenis kelamin dan ras) dan empat variabel kuantitatif (x1-x4). Pada SPSS, klik Analyse, Regression Multinomial Logistic untuk mendapat Template I.

Untuk inisial analisisnya, gunakan kategori jenis kelamin dan ras sebagai variabel bebas, lalu masukan pada option Factor(s). Masukkan variabel responnya dengan Group(1 = hidup, 2 = hilang, 3 = mati) ke option Dependent. Kemudian, klik Reference Category untuk mendapat Template II.

Pilih Reference Category dengan First category. Option Ascending pada Category Order berarti bahwa nilai terkecil adalah kategori pertama dan option Descending berarti nilai tertinggi adalah kategori pertama. Klik option Model pada Template I untuk mendefinisikan variabel yang termasuk dalam model. Pada Template III, option Main effects akan memasukkan semua variabel dengan tanpa interaksi. Option Full factorial akan menampilkan main effects dengan semua interaksi yang memungkinkan. Untuk option Custom/Stepwise bearti kita tidak memiliki pilihan untuk mengatur main effects yang relevan dan interaksinya menggunakan option Forced Entry atau untuk menampilkan Stepwise analisis.

Klik folder Statistics pada Template I.

Pada Template IV, tandai option Classification table dan Goodness-of-fit. Klik option Saved pada Template I.

Pada penelitian ini, kita memiliki enam subpopulasi (2[gender] x 3[race]). Lihat table Ia. Jika tidak ada frekuensi yang bernilai nol pada setiap subpopulasi, maka tidak akan ada warning-message. Table Ia. Case processing summary: Gender + Race Case Processing summary N Marginal percentage

Group

Alive Lost to follow-up Dead

99 108 102 151 158 155 90 64 309 0 309 6

32,0 % 35,0 % 33,0 % 48,9 % 51,1 % 50,2 % 29,1 % 20,7 % 100,0 %

Gender

Male Female

Race

Chinese Malay Indian

Valid Missing Total Subpopulation

Table Ib. Model fitting information: Gender + Race Model fitting information Model Intercept only Final -2 log likelihood 63.979 50.505 13.473 6 .036 Chi-square df Sig

Table Ib menunjukkan apakah model Gender + Race (Final) memberikan prediksi yang sesuai bila dibandingkan dengan Intercept only (Null model). Dan hasil yang diberikan bahwa model tersebut cukup signifikan dengan p_value (sig) < 0,05. Table 1c menunjukkan bahwa dibanding dengan Null model, model Gender + Race memberikan akuransi yang lebih baik untuk kategori alive dan lost to follow-up, tapi tidak untuk kategori dead. Table Ic. Predictions of the Gender + Race model Classification Predicted Observed Alive Lost to follow- Dead up Alive Lost to follow49 37 13 49.5% Percent correct

up Dead Overall percentage

33 33

54 51

21 18

50.0% 17.6%

37.2%

46.0%

16.8%

39.2%

Table Id menunjukkan apakah model sesuai dengan data. Jika tidak ada warning message atau subpopulasi dengan frekuensi nol kecil, dengan p_value (sig) > 0,05, maka dapat disimpulkan bahwa model sesuai. Tabel Ie mengindikasikan proporsi variasi yang dijelaskan oleh model. Terlihat bahwa hanya sekitar 5% (maksimum 100%) yang dijelaskan oleh model Gender + Race. Likelihood ratio test (tabel If) menunjukkan kontribusi setiap variabel terhadap model. Kategori Gender memberikan kontribusi yang signifikan (p_value (sig) < 0,05) tapi tidak untuk Race. Pada Gender, dinotasikan Male = 1 dan Female = 2, diman Male akan dibandingkan dengan Female. Table Ig membandingkan antara lost to follow-up dengan alive. Pada lost to follow-up, Odds Ratio (OR) = 0,468 (95% CI 0,267 sampai 0,821), p_value = 0,008. Sehingga, dapat disimpulkan bahwa perempuan (female) lebih mudah untuk hilang (lost to follow up). Perempuan juga lebih mudah untuk mati (dead), OR = 2,24 (95% CI 1,27 sampai 3,97), p_value = 0,005. Pada Race, kategori rujukan adalah Indian (dari tabel Ia, Indian = 3); Race = 1 membandingkan antara Chinese dengan Indians, dan Race = 2 membandingkan Malays dengan Indians. Model Gender + Race sangat tidak sesuai, nilai Pseudo R-square-nya sangat rendah. Pada model yang selanjutnya, kita memasukkan empat variabel kuantitatif (masukkan x1 x4 ke option Covariate pada Template I). Saat me-run ternyata muncul warning message, hal ini dikarenakan terdapat frekuensi nol pada beberapa data. Dari 927 data terdapat 618 data yang kosong dan hanya 309 data yang terisi (lihat tabel IIb). Karena banyak sel yang nol, maka goodness-of-fit test tidak signifikan (Tabel IIe).

Nilai pseudo R-square juga meningkat dengan tajam, sekitar 75% dari varian (Tabel IIf). Kontributor yang signifikan bagi model adalah x1 dan x2 (Tabel IIg). ORDINAL REGRESSION Ketika data kategorik berukuran ordinal (contoh: alive, half-dead, dead jika diasumsikan half-dead lebih baik daripada dead), prosedur regresi ordinal dapat digunakan. Hal yang menarik yaitu menentukan hubungan langsung diantara setiap prediktor dan skala ordinal pada data kategorik. Pada SPSS, klik Analiyze, Regression, Ordinal untuk mendapat Template VI.

Pengaturan variabel sam seperti pada Multinomial kecuali kita tidak ingin mendefinisikan kategori rujukan sebagai ordinal. Klik folder Output pada Template VI untuk mendapat Template VII.

Selain menandai seperti pada multinomial, tandai juga option Test of parallel lines. Pada Saved variables, tandai option Predicted category (dengan ini akan terbentuk variabel baru Pre_1 Regresi ordinal tidak memiliki option Classification table, jadi kita harus meng-cross tabulate Pre_1 dengan Group untuk mendapat akurasi model). Klik folder Location pada Template VI untuk mendefinisikan model. Pada Template VIII, klik Cancel jika hanya menginginkan model Main effect saja, atau atur model Custom.

Klik folder Option pada Template VI untuk mendapat Template IX.

Link function adalah transformasi dari probabilita kumulatif dari kategori ordinal yang akan digunakan untuk mengestimasi model. Pilih Output SPSS untuk regresi ordinal sama dengan fungsi logit. Multinomial. Pada tabel IVa,

bagian Threshold menunjukkan konstanta/intercept model. Prediktor yang signifikan (untuk Location) adalah x1, x2, dan gender. Terdapat hubungan yang positif antara x2 dan kategori ordinal. Artinya, dengan meningkatnya x2 akan kemungkinan data berada pada salah satu kategori yang lebih tinggi. Di sisi lain, x1 memiliki hubungan yang negatif. Untuk Gender, ketika laki-laki dibandingkan dengan perempuan probabilitasnya rendah pada kategori yang lebih tinggi. Untuk Logit link, estimasi eksponensialnya menghasilkan Odds ratio. Contoh, jika x2 meningkat satu unit akan menghasilkan OR dari exp(0,296) = 1,34. Peningkatan odds menyebabkan data ordinal berada pada kategori yang lebih tinggi. Test of Parallel lines digunakan untuk menguji apakah asumsi dari semua kategori yang memiliki parameter yang sama, sesuai atau tidak, apakah sekumpulan koefisien untuk semua kategori sesuai. Diharapkan p_value (sig) untuk General pada tabel IVb > 0,05. Hasilnya p_value < 0,05 berarti parameter yang terpisah dari setiap kategori lebih sesuai dan model yang ada belum sesuai. Ketidaksesuaian ini mungkin disebabkan oleh kesalahan dalam menggunakan link function atas salah dalam memberi kategori (mungkin dead lebih baik daripada half-dead). Kita harus membuat model baru dengan menggunkan ink function yang berbeda, misal Cauchit. Ketiga link function lainnya dirasa kurang sesuai karena distribusi

kategori dan beberapa variabel tidak berdistribusi normal. Jika fungsi Cauchit link masih tidak sesuai, coba lagi dengan memberi kategori alive, dead, half-dead. Jika semuanya gagal maka kita harus menggunakan regresi multinomial dengan mengabaikan kategori ordinal. P-value dari parallel line test sensitif terhadap ukuran sampel dan banyaknya variabel bebas pada model. Kebanyakan nilai p_value < 0,05, dilihat dari Pseudo R-square dan tabel Classification. Pada Template VI, terdapat folder Scale untuk menambahkan komponen skala. Hal tersebut merupakan modifikasi optional pada model dasar untuk menghitung perbedaan variabilitas untuk nilai yang berbeda pada variabel prediktor. Misal, jika laki-laki memiliki variabilitas yang lebih besar daripada perempuan maka gunakan komponen skala. CONDITIONAL LOGISTIC REGRESSION FOR MATCHED CASE-CONTROL STUDY Regresi logistik multinomial dapat digunakan untuk menganalisa kesesuaian (misal umur dan gender) dimana satu kasus hanya memiliki datu kontrol kesuaian.

You might also like