R E G R E S I L O G I S T I K

Dalam statistika
Logistic regression:
a model used
for prediction of
the probability of
occurrence of an
event by fitting
data to a logistic
curve
(Logistic regression/logistic model/logit model)
Logistic curve
(“S”/”Sigmoid”)
t
(waktu)
P
(Prob.)
Linear regression
Logistic regression
Logistic regression

Log.reg.
Probabilitas (P) seseorang memp.
gejala artritis, sebagai fungsi umur (t)
Logit Transformation
(transformasi var. dependen menjadi var.
logit)
Logit: log p/(1-p) (disebut juga log odds)
Odds: p/(1-p)
Logistic regression: maps probabilities onto the
scale of the linear predictor in logistic regression
Log odds: logarithm of the odds of probabilities
Fungsi LOG. REG.: to assess the likelihood of a
disease or health condition as a
function of a risk factor (and covariates)
P
logRF
ODDS ?
ODDS RATIO ?
ODDS suatu outcome (merupakan ukuran asosiasi) :
perkiraan berapa besar kemungkinan (likely) terjadinya (p)
atau tidak terjadinya (unlikely: 1-p) suatu outcome (event,
kejadian, peristiwa) dibawah beberapa kondisi.
ODDS RATIO (OR):
(1). Ratio of the probality of occurrence over the probability of
nonoccurrence (p/(1-p) satu kelompok (mis. diberi terapi)
dengan kelompok lain (tidak diberi terapi).
kanker paru pada perokok dan nonperokok: OR=2
OR = 2, artinya perokok kemungkinan menderita kanker paru
2x dibanding nonperokok.
(2). Merupakan perkiraan indikator lain, yaitu risiko relatif (RR)

ODDS suatu event:

Odds = p/(1-p) p: probabilitas event terjadi
1-p: prob. event tidak terjadi
(mis. event: sembuh; jika tidak diberi obat:
probabilitas sembuh 0,66
Odds: 0,6667/0,3333 = 2
Jika diberi obat baru: prob. sembuh 80% atau 0,8
Seberapa lebih baik obat baru tsb. jika
dibandingkan dengan obat lama?
ODDS dan ODDS RATIO
Prob. event terjadi
Prob. event tidak terjadi
Dengan obat baru:
Odds sembuh: 0,080/0,20 = 4
Odds ratio: 4/2 = 2
Odds obat baru: 2x lebih tinggi
Odds in the no treatment group
ODDS RATIO =
Odds in the treatment group
probability of the event p
Odds = =
1 – probability of event 1 – p
Atau Odds
Probability: p =
1 + Odds
* ODDS RATIO (OR) vs RELATIVE RISK (RR)
Probability of occurrence p
OR: =
probability of nonoccurrence 1-p
OR dipakai untuk mengestimasi risiko relatif (relative risk): RR
RR: risiko suatu kondisi tertentu vs kondisi lain.
(mis. RR 3: 3 x lebih tinggi pada wanita tanpa prenatal
care (PNC) (dibandingkan dengan wanita dengan PNC)
Low Birth Weight (LBW)
Yes (LBW) No (normal) Row totals
Prenatal Care
No 75 175 250
Yes 20 180 200
95 355 450

Tab. of Probabilities
LBW 75
Prob. of LBW with no PNC: = = 0.3
No PNC 250
Normal Weight 175
Prob. of Normal BW with N PNC: = = 0.7
No PNC 250
(Tab. of Prob. Cont.)
LBW 20
Prob. of LBW with PNC: = = 0.1
PNC 200
Normal Weight 180
Prob. of Normal BW with PNC: = = 0.9
PNC 200
Tab. of ODDS
Prob. of occur. 03
Odds of LBW infant, when no PNC: = = 0.43
Prob. of non-occur. 07
Prob. of occur. 0.3
Odds of LBW infant, when PNC: = = 0.11
Prob. of non-occur. 0.9
ODDS RATIO (OR)
Rasio satu probabilitas (odds) terhadap
probabilitas (odds) lain:
0,43/0,11 = 3,91
Risiko LBW:
- Tanpa PNC: 75/250 = 0,3
- Dengan PNC: 20/200 = 0,1
RISIKO RELATIF (RR): 0,3/0,1 = 3,0
Regresi logistik banyak dipakai untuk memprediksi
event di bidang kedokteran & sosial
-KEDOKTERAN: prediksi probabilitas mengalami
serangan jantung (penyakit/kondisi)
berdasarkan pengetahuan tentang faktor
risiko (umur, seks, body mass index/BMI)
Var. bebas (FAKTOR RISIKO): umur, seks, BMI
Var.terikat (OUTCOME): prob. serangan jantung

- SOSIAL, mis. marketing/pemasaran:
prediksi kecenderungan pembeli
membeli/tidak produk atau
menghentikan/tidak berlangganan
KEGUNAAN REGRESI LOGISTIK
1. Memprediksi var. terikat (dependen);
skala: dikotomik (binomial) berdasarkan var.
bebas (independen; skala: kontinu dan/atau
kategorik/ordinal
2. Menentukan % varian var. terikat yang
diterangkan oleh var. bebas
3. Me-ranking relative importance of independents
4. Menilai efek interaksi (antarvar. bebas/kovariat)
5. Memahami dampak variabel
prediktor/kovariat/faktor
(Dampak var. kovariat biasanya dijelaskan oleh
OR (odds ratio)


REGRESI LOGISTIK
• Mencapai aplikasi maksimumnya untuk
mengestimasi suatu kemungkinan (likelihood)*
setelah mentransformasi var. terikat menjadi var.
logit (the natural log of the odds of the dependent
occurring or not)
• Dengan cara ini: regresi logistik bisa mengestimasi
terjadinya odds event tertentu
* Maximum Likelihood Estimation (MLE):
metode dipakai untuk menghitung coefficient logit
(Berbeda dengan penggunaan Ordinary Least
Square (OLS): estimasi coefficient in regression line)

REGRESI LOGISTIK (RL)
(LOGISTIC REGRESSION/LR)

RL dipakai untuk memprediksi/
menilai kemungkinan/probabilitas
(likelihood) suatu outcome
(penyakit, kondisi kes.) (Y) sebagai
fungsi faktor risiko (FR) dan
kovariat (X)
REGRESI LOGISTIK (RL)
(LOGISTIC REGRESSION/LR)
 Dipakai untuk memprediksi atau menilai
kemungkinan (likelihood) suatu outcome –
penyakit atau kondisi kes. (Y) – sebagai
fungsi faktor risiko (dan kovariat) (X)
1. Simple LR:
menilai asosiasi antara 1 var. bebas (X:
exposure atau predictor var., faktor
risiko (skala: nominal – kontinu) dan 1
var. terikat (Y): outcome, response var.;
skala: nominal dikotomik)


2. Multiple LR: menilai asosiasi antara
> 1 var. bebas (X
i
) (nominal, kontinu) dan
1 var. terikat (Y) (nominal dikotomik)

Analisis RL: seberapa besar peningkatan
(increment) var. paparan (eksposure)
mempengaruhi odds of the outcome

(Odds: p/1-p: probabilitas suatu event terjadi
dibagi probabilitas suatu event tidak terjadi)
FAKTOR (“Design Variable”): prediktor (nominal
atau ordinal, yang level-nya dimasukkan
sebagai dummy variable
(Satu faktor bisa mempunyai beberapa level)
KOVARIAT: Var. Bebas (independen)(skala: interval)
INTERAKSI: bisa ditambahkan dalam model (mis.
interaksi umur-pendapatan: age income
Untuk kovariat kontinu: membuat satu var.
yang merupakan produk dua var. yang ada
Untuk var. kategorik: multiplikasi dua kode
kategorik.
Mis. Ras (1)* agama (2)

Definition Example: getting heads Example: getting a 1
in a 1 flip of a coin in a single roll of a dice

# of times something happens
Odds = 1/1 = 1 (or 1:1) 1/5 = 0,2
(or 1:5)
# of times it does NOT happen

# of times something happens
Prob. = 1/2 = 0,5 (or 50%) 1/6 = 0.16
(or 16%)
# of times it could happen
VARIABEL2 DALAM REGRESI LOGISTIK
VARIABEL BEBAS (X) VARIABEL TERIKAT (Y)
(independent/input/ ISTILAH (dependent/output/
predictor/exposure/ LAIN event/outcome)
risk factor)
numerik atau kategorik SKALA nominal dikotomik
Contoh:
X Y
umur, seks, BMI serangan jantung
(body mass index) (ya/tidak)
faktor risiko event/outcome
LOGISTIC REGRESSION (LR)
SIMPLE LR MULTIPLE LR
Mengeksplorasi asosiasi
antara satu (skala:
dikotomik) outcome variable
dan satu exposure variable
(skala: kontinu/ordinal/
kategorik)
Mengeksplorasi asosiasi antara satu
(dikotomik) outcome variable dan dua/>
exposure variable (kontinu/ordinal/kategorik)
Bagaimana mengisolasi hubungan antara
exposure variable dan outcome variable dari
efek satu atau lebih var. lain (disebut
kovariat atau confounders) setelah
adjustment (mengontrol/memperhitungkan/
mengeluarkan) pengaruh var. independen
(umur, penghasilan dll.).?
Bagaimana seks mempengaruhi prob.
menderita hipertensi setelah mengontrol FR
lainnya (covariats/confounders: umur,
kolesterol dll.)

Bagaimana seks (jenis kelamin)
mempengaruhi probabilitas
menderita hipertensi?
FUNGSI LOGISTIK
(logistic function):
1
f(z) =
1 + e
-z

z: input ( - infinity + infinity ) e: exponent=2,7
(besarnya paparan (exposure) berupa beberapa
faktor risiko/FR)
(besarnya kontribusi total semua FR dipakai
dalam model ini: dikenal sebagai logit)
f(z): output atau outcome (0 or 1)/binomial (dikotomik)
(probabilitas outcome tertentu untuk sejumlah FR)
Fungsi logistik (logistic function): f(z)
0,5
1
f(z) =
1 + e
-z

f(z)
z
- tak terhingga
+ tak terhingga
Regresi logistik membentuk
var. prediktor yang merupakan
kombinasi linier var.
eksplanatoris. Nilai2 var.
prediktor kemudian di-
transformasi menjadi prob.
oleh fungsi logistik (bentuk S)
Aksis horisontal: nilai2
prediktor
Aksis vertikal: probabilitas.
Nilai -2 pada var. prediktor
sesuai dengan prob. 0,12
(nilai -1 0,27)
Prediktor
Prob.
MODEL REGRESI
LOGISTIK
z = β
0
+ β
1
x
1
+ β
2
x
2
+ β
3
x
3
………. β
k
x
k

β
0
= intercept, jika nilai2 semua FR = 0
(artinya: nilai z seseorang jika tidak memp. FR)
β
1
……... β
k
: koefisien regresi
(menunjukkan besar kontribusi FR:
- Pos.(+): FR meningkatkan probabilitas outcome;
- Neg. (-): FR menurunkan probabilitas outcome
- Mendekati 0: FR berpengaruh kecil terhadap prob. outcome
LOGISTIC FUNCTION
Input Output
(z) f(z)
Age, sex, BMI Prob. heart attack
(FR) (Event)
Contoh fiktif reg. log.
Tiga FR (umur, seks, kadar kolesterol darah)
dipakai untuk memprediksi dalam 10 tahun risiko
kematian karena serangan jantung
β
0
= -5,0 (intercept); β
1
= +2,0; ß
2
=-1,0; β
3
= +1,2
X
1
= umur (dekade); X
2
= seks (0: laki2; 1: peremp.);
X
3
= kadar kolest. (mmol/L: <5)
1
Risiko kematian = dimana z = -5,0 + 2,0 X
1
– 1,0 X
2

1 + e
-z
+ 1,2 X
3

Dalam model ini:
- Peningkatan umur berasosiasi dengan
peningkatan risiko kematian karena serangan
jantung (z naik sampai 2,0 setiap 10 th.
di atas umur 50)
- Jenis kelamin peremp. berasosiasi dengan
penurunan risiko kematian karena serangan
jantung ( z turun 1,0 jika pasien peremp.)
- Peningkatan kolest. berasosiasi dengan
penigkatan risiko kematian (z naik 1,2
untuk setiap peningkatan 1 mmol/L kolest.
di atas 5mmol/L)
LOGIT FUNCTION
(FUNGSI LOGIT)
Mencoba mengetahui asosiasi antara faktor2
risiko dan satu kondisi.
Diperlukan rumus yang memungkinkan
menghubungkan var.2 tsb. : logit function
(dikenal juga sebagai link function:
menghubungkan beberapa nilai var. bebas
terhadap prob. kejadian (event; var. terikat)
LOGIT MODEL
Logit {E(Y
i
)} = Log (p
i
/1-p
i
) = Intercept + β
1
X
1
+ β
2
X
2
+ ….. + β
i
X
i

(log : natural log)
Logit: log p/(1-p)
E: exponential= 2,7
Model logistik memberikan probabilitas bahwa
outcome (enuresis) terjadi sebagai fungsi var.2
independen (3 var.: stres psikol., jenis kel., umur)
1
p
x
=
1 + exp[-(b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
)]
b
0
: intercept; b
1
, b
2
, b
3
: koef. regresi;
exp: the base of the natural logarithm (2.718) is
taken the power shown in parentheses.
1
p
x
=
1 + e
-z

Prob. enuresis terjadi sebagai
fungsi eksponensial var. bebas
Contoh (Presenting Problem 4):
3 VAR. BEBAS 1 VAR. TERIKAT
1. stres psikologis enuresis (wet/ngompol)
2. seks (L/P) (ya/tidak)
3. umur
Dalam Pres. Probl. 4 ini var. bebas (stres, seks,
umur) dipakai untuk memprediksi kejadian
(event: enuresis)
Contoh Aplikasi Reg. Log.
Kematian karena penyakit jantung
Tiga FR (umur, jenis kel., kadar kolesterol darah) dipakai
untuk memprediksi risiko kematian dalam 10 tahun)
Β
0
= -5,0 (intersep); β
1
= +2,0; β
2
= -1,0; β
3
= +1.2
X
1
= umur (dalam dekade) : <5,0
X
2
= seks (0: laki2; 1: peremp.)
X
3
= kadar kolesterol (nmol/L): <5,0
1
RISIKO KEMATIAN:
1 + e
-z
z = - 0,5 + 2,0 x
1
– 1,0 x
2
- 1,2 x
3

z = - 0,5 + 2,0 x
1
– 1,0 x
2
+ 1,2 x
3

Menurut model ini:
Meningkatnya umur berasosiasi dengan
meningkatnya risiko kematian (z naik dengan 2,0
setiap 10 tahun di atas umur 50 tahun)(+2,0 X
1)

Perempuan berasosiasi dengan penurunan risiko
kematian karena penyakit jantung (z menurun
dengan 1,0 jika pasien tsb. perempuan)(-1,0 X
2
)
Peningkatan kolesterol berasosiasi dengan
meningkatnya risiko kematian (z naik 1,2 setiap
kenaikan kolesterol 1 mmol/L diatas 5 mmol/L)
Model tsb. bisa dipakai memprediksi risiko kematian
pasien karena penyakit jantung:
Mis. Pasien berumur 50 tahun dan kadar kolesterolnya
7,0 mmol/L RISIKO KEMATIAN-nya:
1
1 + e
-z

z = -5,0 + (+2,0)(5,0 – 5,0) + (-1,0) + (1,2)(7,0-5,0)
Ini berarti dengan model ini risiko kematian pasien
tsb. karena penyakit jantung 10 tahun yang akan
datang adalah 0,07 atau 7%
Contoh Reg.Log.
Prosedur reg.log. memerlukan tiga tabel:
(1). Tabel rangkuman analisis
(2). Tabel koefisien
(3). Deviance table
Radioterapi pada 24 pasien
Var.I: lamanya (hari) radioterapi (var. eksplanatoris);
Var. II: absence (0) dan presence (1) penyakit
setelah 3 th terapi (var. respon)
Reg.log. menunjukkan: intercept = 3,81944; koef. untuk
radioterapi = -0,08648*; setiap tambahan hari radioterapi
menurunkan odds absence of disease = 8%.
* Menunjukkan terapi bermanfaat menurunkan prob. penyakit
Summary of Statistical Analysis:
Number of observations 24
Observations with Missing values 0
Response variable desease

Tables
1. Table labeled parameters give parameter estimates with
asymptotic standard errors
2. Wald tests
3. p-values
Coefficient Stand. Error Wald test Chi sq.>p
Intercept 3.81944 1.83516 4.33163 0.03741
Therapy -0.08648 0.04322 4.00424 0.04539

The deviance table decomposes the deviance into
two components: 1. a residual and 2. a model
component
Because only one var. is used in the model, the
hypotesis tested by the deviance statistic is the
same as for the Wald test. The p-values of the
two test statistics are very similar:
Deviance df p-value
Model 4.81306 1 0.02824
Residual 27.78822 22 0.18281
OUTPUT LOGISTIC REGRESSION
Statistik yang penting dalam log. reg.: koef. regresi
(koef. β: β
1
, β
2
, β
3
….), SE (standard error), nilai-p.
Interpretasi koef. β untuk berbagai var. independen:
 Jika X
j
: var. dikotomik (nilai 1 atau 0)
Koef. β = log odds bahwa individu akan memp.
event untuk orang dengan X
j
=1 vs orang dengan X
j
=0
Dalam model multivariat: koef. β adalah efek
independen var. X
j
terhadap Y
i
setelah adjusting
semua kovariat lainnya di dalam model
 Jika X
j
: var. kontinu e
β
merupakan odds
bahwa individu akan memp. event untuk orang
dengan X
j
= m
Artinya: untuk setiap kenaikan 1 unit X
j
Odds seseorang memp. event dengan
X
j
=m+1 vs seseorang dengan X
j
=m
Dengan kata2 lain: untuk setiap kenaikan 1 unit
dalam X
j
Odds memp. event Y
i
berubah
dengan e
β
, dengan adjusting semua kovariat lain
dalam model multivariat
Apa arti koef. β?
Tipe var. bebas Contoh var. Koef.β dalam Koef. Β dalam
simple LR multiple LR
Kontinu TB, BB, LDL Perub. Log odds perub. log odds var.
var. terikat per 1 terikat per 1 unit perub.
unit perub. Var. var. bebas setelah
bebas mengontrol efek
perancu kovariat dalam model
Kategorik Seks (2 subgroup: Perbedaan dlm. Perbedaan dalam log
laki2 dan peremp. Log odds VT odds VT per 1 unit
perub.
Di sini: laki2 sebagai unt. 1 nilai var. var. kategorik vs kel. re-
kelomp. referensi kategorik vs kel. refensi (mis. antara pe-
referensi (mis. remp.dan laki2, setelah
antara peremp dan laki2 mengontr. efek konfound.
kovariat dalam model
• Banyak bidang kedokteran menggunakan parameter sasaran
utama/primernya:
WAKTU sampai terjadinya event.
• Mis.:
-waktu mulai dari diagnosis kanker paru sampai mati
(event/outcome)
- waktu mulai dari pemberian terapi sampai sembuh/berhasil
(event/outcome)
“EVENT” bisa berupa: sukses/sembuh atau gagal/mati
(Penting untuk mendefinisikan dengan baik:
1. awal periode waktu
2. waktu terjadinya event/outcome
Waktu antara 1 dan 2: SURVIVAL TIME;
meskipun event tsb. tidak harus berupa mati)
( Contoh: apakah terapi memperpanjang survival time?)
VARIABEL2
DALAM REGRESI COX
(VB) (VT)
(t)
EXPLANATORY VAR. EVENT/OUTCOME
(RISK FACTORS/
COVARIATES)
(Terapi sukses/sembuh

Diagnosis gagal/mati)
( t )
(survival time)
t
• CENSORING (berkaitan dengan SURVIVAL TIME)
1.
- Alasan etis (Clinical Trial:
t harus singkat)
- event yang diharapkan
(mati/sukses terapi) terjadi
tidak sampai akhir trial
2. Subjek meninggalkan trial:
- tidak berpartisipasi lebih lanjut
- meninggal (yang tidak ada kaitannya
dengan trial)
CENSORED: tidak diikutsertakan
REGRESI COX
(PROPORTIONAL HAZARDS REGRESSION)
• REGRESI COX: Metode untuk meneliti efek beberapa
variabel (risk factors) terhadap waktu yang
diperlukan untuk terjadinya event (mis. survival
time).
(Khusus: jika outcome berupa kematian dikenal
sebagai: Cox regression for survival
analysis)
• Metode ini tidak berasumsi mengenai “survival
model” tertentu, tetapi tidak sepenuhnya benar non-
parametrik (karena: tidak berasumsi bahwa efek
variabel2 prediktor terhadap survival konstan
menurut waktu dan additive in one scale).
(Saran: jangan menggunakan regresi Cox tanpa
bimbingan ahli statistik)
REGRESI COX
• Efek simultan beberapa variabel terhadap waktu
survival bisa diteliti.
A. Parameter2 yang diuji:
1.Terapi;
2. seks;
3. derajat reseksi;
4. status metastasis
B. Efek umur (var. kontinu) pada waktu operasi
terhadap waktu survival
Dalam kedua hal tsb. (A dan B) regresi Cox bisa
dipakai untuk memperolah estimator besarnya efek.
Estimasi ini berupa rasio hazard.

Hazard dan rasio hazard

1. HAZARD (risiko): probability of end point*
• Kumulatif hazard pada waktu t:
risiko meninggal antara waktu 0 - t.
• Fungsi survival pada waktu t atau H(t) disebut hazard
model:
probability of surviving sampai waktu t.
• Koefisien regresi Cox berhubungan dengan hazard:
- Koefisien positif: menunjukkan prognosis lebih
buruk
- Koefisien negatif: menunjukkan efek protektif
(lebih baik) variabel yang berkaitan

* End point (death, other event of interest e.g.
recurrence of disease)
2. HAZARD RATIO: H(t)/H
0
(t)
- berkaitan dengan variabel prediktor
ditunjukkan oleh eksponen
koefisiennya (exp): b
1
..... b
k

- dianggap sebagai angka kematian
relatif (relative death rate)
- interpretasi rasio hazard tergantung
pada skala pengukuran variabel
prediktor (x
1
..... x
k
) yang dikaji.
• Hazard model: H(t)

H(t) = H
0
(t) x exp(b
1
x
1
+ b
2
x
2
+
b
3
x
3
+ .... b
k
x
k
)

• Hazard ratio: H(t)/H
0
(t)
• exp: exponent: 2,7
Time-dependent & fixed covariates
• Dalam penelitian prospektif: jika individu2 diikuti
(follow up) menurut waktu, nilai2 kovariat
akan berubah menurut waktu.
Kovariat bisa dibagi menjadi:
- TIME-DEPENDENT COVARIATES
- FIXED COVARIATES
• Kovariat dikatakan time-dependent:
perbedaan antara nilai2 untuk dua subjek
berbeda berubah menurut waktu,
mis. kolesterol serum
• Kovariat dikatakan tetap (fixed) jika:
nilai2-nya tidak berubah menurut waktu,
mis. seks atau ras.
• Analisis Model dan Deviance
• Tes kemaknaan statistis suatu model termasuk
dalam topik “analisis model”:
• - the likelihood chi-square statistic dihitung
dengan membandingkan deviance (-2 log
likelihood) model yang dipilih dengan
semua kovariat model tsb. dengan kovariat2
yang di-drop.
• Kontribusi individual kovariat2 model yang
dipakai bisa dinilai dari tes signifikansi.
(perhitungan2 statistis bisa menggunakan
paket2 yang ada: SPSS, STATS. STATA dll.)
• Contoh Regresi Cox
Table 2. Results of Cox regression for overall survival in 280 children
with medulloblastoma (M)
n HR 95% CI p
Metastasis status on diagnosis
MO 114
M1 33 2.11 1.13-3.94 0.001
M2/3 40 3.06 1.76-5.33
Unknown 93 1.54 0.94-2.52
Treatment
Maintenance chemotherapy 127 0.006
Sandwich chemotherapy 153 1.76 1.17-2.67
Operation diagnosis 280 0.93 0.00-0.98 0.005
n: no. of cases; HR: hazard ratio; 95% CI (CI for hazard
ratio); p: p value of lielihood ratio test control group for
categorical varables

REGRESI COX (RC)
 Menerapkan proportional hazard model
(duration model)
(Disebut juga: Cox’s proportional
hazards model for survival-time
(time-to-event) outcomes on one or
more predictors
 Didesain untuk menganalisis waktu (time
analysis) sampai suatu event terjadi
atau waktu antara events (time-to-
event)
 Satu atau lebih var. (kovariat) dipakai
untuk memprediksi satu var. status
(event)
Contoh klasik univariat:
analisis waktu mulai dari diagnosis
penyakit terminal sampai kematian
(event) disebut:
SURVIVAL ANALYSIS

VARIABEL
1.VAR. STATUS (EVENT VAR. atau
CENSORING VAR.):
var. terikat (biner/binomial: terjadi/tidak);
dianalisis dalam kaitannya dengan var. waktu
Contoh var. status: kematian (dalam
kajian medis): mati=0, hidup=1
2. VAR. WAKTU (TIME VAR.):
Var. waktu merupakan durasi event, seperti
yang didefinisikan oleh var. status (awal studi
sampai akhir studi atau sampai terjadinya
event, mis. mati)
3. KOVARIAT (COVARIATES):
var.prediktor (var. bebas/independen)
dalam model Cox bisa bersifat:
(1). Kategoris atau Kontinu:
(a).Kategoris (mis. seks, ras)
atau
(b). Kontinu (mis. umur, penghasilan)


(2). Bisa bersifat fixed atau time-dependent:
(a). FIXED COVARIATE:
(nilainya tidak berubah menurut waktu)
Mis. jenis kelamin/seks, umur
(b). TIME-DEPENDENT COVARIATE;
nilainya berubah menurut waktu
(mis. gaya hidup, pengukuran fisiologis:
tekanan darah; cummulative exposure (mis.
merokok)
COX MODEL: a well recognized statistical
technique for exploring the
relationship between the survival
(death, recurrence of a disease) of
a patient and several explanatory
(IV) variables
- Provides an estimate of the
treatment effect on survival after
adjustment for other explanatory
variables.
- It allows us to estimate the hazard
(or risk) of death, or other event of
interest, for individuals, given their
prognosis variables
ANALYSIS TIME (WAKTU ANALISIS) ( t ): adalah var. waktu,
dimana t = 0 merupakan waktu awitan (onset) risiko.
ONSET OF RISK:
artinya ketika kegagalan (atau event) terjadi pertama kali
SURVIVAL ANALYSIS: mengkaji/menganalisis waktu antara ikut
dalam penelitian (entry the study) sampai terjadinya event
(mis. kematian).
CENSORED SURVIVAL TIME:
terjadi jika event yang dikaji tidak terjadi pada pasien
selama periode kajian/studi
Info. dari subjek2 yang tersensor, yaitu mereka yang tidak
mengalami event yang diteliti selama waktu observasi,
biasanya memberi kontribusi terhadap estimasi model tsb.
• Contoh kajian dimana beberapa subjek tidak
mengalami event selama kajian (tersensor):
- Apakah laki-laki dan perempuan memp. risiko
berbeda terhadap perkembangan kanker
paru akibat merokok?
• Dibuat model regresi Cox: mmerokok erokok
merokok (batang/hari) dan jenis kelamin
sebagai kovariat bisa diuji hipotesis
mengenai efek jenis kelamin terhadap time-
to-onset kanker paru
INTERPRETASI MODEL COX
Melibatkan pengujian koefisien setiap
var. eksplanatoris:
- Koef. regresi positif untuk var.
eksplanatoris: hazard tinggi ;
jika nilainya besar (tinggi):
prognosis lebih buruk
- Koef. regresi negatif:
prognosis lebih baik jika nilai
negatifnya lebih tinggi/besar
KEGUNAAN MODEL COX
Menganalisis survival data:
- Mengisolasi efek perlakuan (terapi) dari efek var. lain
- Menggunakan a priori jika diketahui bahwa ada var.2
lain disamping terapi yang mempengaruhi
survival pasien, dan var.2 ini tidak mudah
dikontrol dalam clinical trial): meningkatkan
efek perlakuan (terapi) dengan memperkecil
confidence interval)
- Secara simultan mengeksplorasi efek beberapa
variabel terhadap survival
SURVIVAL TIMES: perkembangan gejala tertentu atau
terjadinya relapse (kambuh) setelah penyakit tersebut remisi
(berkurang), dan juga sampai saat meninggal
MENGAPA SURVIVAL TIMES (ST) DISENSOR?
(Censored Survival Times)
Gambaran penting ST: event yang dikaji sangat jarang
teramati pada semua subjek.
Mis. suatu kajian yang membandingkan survival pasien
yang mengalami macam operasi yang berbeda untuk
kanker hati
Meskipun pasien2 di-follow up beberapa tahun, ada
beberapa pasien yang di-follow up selama beberapa
tahun, masih mungkin ada beberapa pasien yang tetap
masih hidup sampai akhir studi.
Survival times ini disebut: Censored Survival Times
(CST), untuk menunjukkan bahwa periode observasi di-
cut off sebelum event yang dipelajari terjadi (mis.
meninggal)
Metode Kaplan-Meier
Berdasarkan ST (termasuk yang CST)
dalam sampel individu2: bisa diestimasi proporsi pop.
seperti orang2 yang akan dapat survive jika periode
waktunya diperpanjang di bawah kondisi yang sama
Metode ini disebut: Kaplan-Meier Method (K-MM)
K-MM: memungkinkan dibuat tabel (Life Table)
atau gambar (Survival Curve)
K-MM: menggunakan logrank test, bisa dipakai untuk
mengeksplorasi (and adjust for) efek beberapa
variabel, seperti umur dan durasi penyakit,
yang diketahui mempengaruhi survival.
KAPLAN-MEIER
METHOD (K-MM)
• Metode untuk mengestimasi proporsi
pop. orang2 yang survived selama
waktu dibawah kondisi yang sama
• Metode ini disebut juga PRODUCT
LIMIT atau KAPLAN-MEIER METHOD
(K-MM):
Memungkinkan dihasilkannya tabel dan
grafik: life table dan survival curve
• Table 1. Calculation of K-M estimate of survivor function

A B C D E F
Survival Number at Number of Number Proportion Cummu-
time (yrs.) risk at start death censored surviving lative pro-
of study until end portion
of interval surviving
0.909 10 1 0 1-1/10=0.900 0.900
1.112 9 1 0 1-1/9=0.889 0.800
1.322* 8 0 1 1-0/8=1.000 0.800
1.328 7 1 0 1-1/7=0.857 0.686
1.536 6 1 0 1-1/6=0.8333 0.571
2.713 5 1 0 1-1/5=0.800 0.457
• Table 1 (cont.)

A B C D E F
2.741* 4 0 1 1-0/4=1.000 0.457
2.743 3 1 0 1-1/3=0.667 0.305
3.524* 2 0 1 1-0/2=1.000 0.305
4.079 1 0 1 1-0/1=1.000 0.305

* Indicates a censored survival time
Cumm.
proport.
surv.

1.0
0.8
0.6
0.4
0.2
0.0
0 1 2 3 4
5
Overall survival (yrs. from surgery)
Fig.1 Kaplan-Meier estimate of the survival function
Tetapi, adjustment (penyesuaian) var.2 yang
diketahui mempengaruhi survival bisa
memperbaiki presisi estimasi efek terapi.
Metode regresi yang diperkenalkan oleh Cox
dipakai untuk mempelajari beberapa variabel
bersamaan sekaligus:
Proportional Hazards Regression Analysis
(Cox’s Regression Analysis/Method)
( Metode untuk mempelajari efek beberapa var.
terhadap waktu terjadinya event spesifik;
event: mis. mati)
HAZARD ?
HAZARD RATIO ?
Hazard (or Risk): the probability of the end point
(death, or any other event of interest, eg.
recurrence of disease)
Hazard model:
H(t) = H
0
(t) x exp(b
1
X
1
+ b
2
X
2
+ b
3
X
3
+ … + b
k
X
k
X
1
… X
k
: var.2 prediktor; H
0
(t): baseline hazard pada
waktu t (merupakan hazard seseorang dengan 0 untuk
semua nilai var. prediktor) (exp: exponent)
Hazard model:
l
n
[H(t)/H
0
(t)] = b
1
X
1
+ b
2
X
2
+ b
3
X
3
+ … b
k
X
k
Hazard ratio: H(t)/H
0
(t)
Koef. b
1
… b
k
diestimasi oleh
regresi Cox
(diinterpretasi dengan cara yang sama
seperti multiple logistic regression)
Jika mis. kovariat (faktor risiko)
adalah dikotomik (kode 1: ada; 0:
tidak ada), maka kuantitas exp(b
1
)
diinterpretasi sebagai instantaneous
relative risk suatu event.
Mis. kovariat: kontinu exp(b
1
):
instantaneous* relative risk suatu
event, setiap saat peningkatan 1 nilai
kovariat dibandingkan dengan individu
lain, asal kedua individu tsb.
memp.kovariat yang sama.

(* saat itu juga)
Grafik menunjukkan kurva survival untuk semua semua var. kategorik
Mult (1: multiple previous gallstones, 0: single previous gallstone), dan
untuk semua nilai rerata semua kovariat dalam model.
KAPLAN-MEIER METHOD
Kaplan-Meier curve
Survival times of 5 children with brain tumors
Kaplan-Meier curve for 33 children and adolescents
with medulloblastoma and metastasis status M1