You are on page 1of 10
MODUL3 GENERALIZED LINEAR MODELS Dalam Agresti (2007) Bab II Bab 2 dijelaskan metode untuk menganalisis tabel kontingensi. Metode-metode tersebut membantu kita menjelaskan pengaruh variabel penjelas terhadap variabel respon Kategori. Bagian lain dari Agresti (2007) ini membahas model-model sebagai dassar analisis. Pada kenyataannya metode-metode pada Bab II juga menghasilkan simpulan dari analisis dari data kategori, tetapi model dapat menangani situasi yang lebih rumit seperti analisis dari beberapa variabel penjelas secara simultan. Model yang fit memiliki beberapa keuntungan. Struktur persamaan dari model menjelaskan pola dan interaksi diantara variabel. Besaran nilai parameter menjelaskan Kekuatan atau kepentingan pengaruh suatu variabel. Inferensi parameter variabel mengevaluasi variabel penjelas mana yang memiliki pengaruh techadap respon. Model juga digunakan untuk memprediksi data dan menyempurnakan taksiran rata-rata respon pada suatu nilai variabel penjelas. Model-model dalam agresti (2007) menampilkan generalized linear model. Secara garis besar model-model meliputi regresi biasa dan Analisis Varians (ANOVA) dengan respon kontinu sebaik model-model dengan respon diskrit. Bab IIT dalam Agresti (2007) membahas generalized linear models untuk data dengan respon kategori dan respon diskrit yang lain. 3.1 Komponen dalam Generalized Linear Models Seluruh model dalam Generalized Linear Models (GLM) memiliki tiga komponen yaitu: Komponen Acak: Diidentifikasi oleh variabel respon (Y) dan diasumsikan memiliki distribusi. 2.Komponen sistematik: Meliputi variabel-variabel penjelas dari model. 3.Fungsi penghubung (link function): yaitu suatu fungsi yang menghubungkan ekspektasi respon (Y) dengan variabel-variabel penjelas melalui persamaan linier 2H) = Bot BX +... + PX Fungsi penghubung akan menentukan model yang akan digunakan dalam GLM. Fungsi penghubung paling sederhana adalah g(u) = py disebut sebagai penghubung identitas (identity link) merupakan model regresi linier dengan respon kontinu. Fungsi penghubung yang lain akan menghubungkan pi secara nonlinier terhadap prediktor. 3.1 Generalized Linear Models dalam R Dalam software R GLM terdapat dalam fingsi glm yang terdapat dalam paket “stats”. Paket “stat sudah disertakan secara default didalam software R sehingga kita dapat langsung menggunakannya saja. Secara umum metode penaksiran yang digunakan dalam fungsi glm adalah iteratively reweighted least squares (WLS) yang menggunakan metode Fisher scoring untuk optimasinya. Untuk metode lain seperti kemungkinan maksimum dan metode optimasi Newton-Rhapson untuk optimasinya tidak diimplementasiakn dalam fingsi ini. Dengan demikian kita haras menggunakan fingsi lain seperti fungsi optim atau kita dapat membuat fungsi sendiri atau menggunakan fungsi yang telah dibuat oleh orang lain seperti fungsi berikut ini (Venables & Ripley, 2002) logit.reg <- function(x, y, wt = rep(1, length(y)), intercept = T, start = rep(@, p), ...) { if(!exists("optim")) Library (MASS) ## Aval bagian yang dapat di ubah fmin <- function(beta, X, y, w) { p <- plogis(X %*% beta)-sum(2*w*ifelse(y,log(p), log(1-p))) 3: gmin <- function(beta, X, y, w) { eta <- X %*% beta; p <- plogis(eta) t(-2 * (w *dlogis(eta) * ifelse(y, 1/p, -1/(1-p))))%*% X + ## akhir bagian yang dapat diubah if(is.null(dim(x))) dim(x) <- c(length(x), 1) dn <- dimnames(x)[[211] if(!length(dn)) dn <- paste("Var", 1:ncol(x), sep="") p <- ncol(x) + intercept if(intercept) {x <- cbind(1, x); dn <- c("(Intercept)", dn)} if(is.factor(y)) y <- (unclass(y) fit <- optim(start, fmin, gmin, X names (fit$par) <- dn cat("\nCoefficients:\n"); print(fit$par) cat("\nResidual Deviance:", format(fit$value), "\n") cat("\nConvergence message:", fit$convergence, “\n") invisible(fit) t Untuk model linier probability ubah bagian yang diberi tanda “bagian yang dapat diubah” dengan fungsi berikut ini fmin <- function(beta, X, y, w) { p <- X %*% beta-sum(2 * w * ifelse(y, log(p), log(1-p))) + gmin <- function(beta, X, y, w) { p <- X %*% beta; t(-2 * (w * ifelse(y, 1/p, -1/(1-p))))%*% X + Untuk model probit ubah bagian yang diberi tanda “bagian yang dapat diubah dengan fingsi berikut ini fmin <- function(beta, X, y, w) { p <- X %*% beta -sum(2 * w * ifelse(y, log(p), log(1-p))) + gmin <- function(beta, X, y, w) { p <- X %*% beta; t(-2 * (w * ifelse(y, 1/p, -1/(1-p))))%*% X + 3.2 Generalized Linear Models untuk Respon Biner Variabel respon banyak yang hanya memiliki dua kategori misalnya kelulusan dalam tes (lulus atau tidak), pengobatan penyakit (sembuh atau tidak) dan lain-lain. Secara umum dapat dikatakan bahwa variabel respon Y hanya memiliki dua hasil yang mungkin yaitu “sukses” yang dilambangkan dengan angka satu (1) dan “gagal” yang dilambangkan dengan angka nol (0). Variabel seperti ini disebut sebagai variabel biner. Distribusi dari Y memiliki peluang sukses P(Y'= 1) =z dan peluang gagal P(Y= 0) = (1 — x) dengan ekspektasi. E(Y) = x Untuk sebuah pengamatan Y akan mengikuti distribusi Bernoulli. Dengan demikian untuk 1 pengamatan yang saling bebas, banyak “sukses” akan memiliki distribusi Binomial dengan parameter x . Dalam bagian ini kita akan membahas GLM dengan respon biner dengan sebuah variabel penjelas (X) saja meskipun sebenamya GLM dapat digunakan untuk variabel penjelas lebih dari satu. Perubahan nilai x dipengaruhi oleh perubahan X. Contoh: Dengkuran dan Penyakit Jantung Contoh berikut diambil dari Agresti (2007) bagian 3.2.2. Data yang di didasarkan pada survei epidemiologi dari 2484 orang responden (subjek) yang diduga mendengkur pada saat tidur dan mempunyai resiko terkena serangan jantung. Subjek dikelompokkan berdasarkan tingkat dengkurannya yang di jelaskan oleh pasangan mereka. Data disajiken dalam tabel berikut ini Table 3.1. Hubungan Penyakit Jantung dengan Kebiasaan Mendengkur Dengkuran Fe a8 —__proporsi Ya Tidak Pernah 24 1355 10,017 [Kadang-kadang 35 603 0.06 Sering [21 192 0, 10 Selalu 30 224 0,12 Sumber: P. G. Norton and E. V. Dunn, Br. Med. J, 291: 630-632, 1985, published by BMJ Publishing Group.

You might also like