You are on page 1of 11

REGRESI LOGISTIK

Regresi logistik merupakan pengembangan lebih lanjut sebagai multivariat chi square
yaitu variabel dependentnya dalam skala data nominal (dikotomis ). Regresi logistik termasuk
dalam rumpun dari regresi sehingga kedudukannya sama dengan regresi linier, sebagai uji
prediksi atau estimasi, namun secara sederhana perbedaan antara regresi biasa dengan
pemodelan logit ialah hanya pada variabel dependen atau responnya. Dimana pada regresi
biasa dengan pemodelan logit ialah hanya pada variabel dependen dan responnya. Dimana
pada regresi biasa, data variabel berupa data kontinyu, namun pada regresi logistik, data
variabel dependennya berupa kategorik, baik Biner ( seperti Ya atau Tidak ) yang sering
disebut dikotomus, atau juga polycotomus ( seperti sangat setuju, setuju, biasa, tidak setuju,
dan sangat tidak setuju ), namun yang sering digunakan adalah untuk variabel dependen
dikotomus.
Model logit berdasarkan dari ide linier probability model (LPM ), yaitu Y = b₀ + b₁X
+ u misalnya variabel X adalah usia sedangkan variabel Y kejadian ca pulmo ( kanker
pulmo)dimana 0 = tidak terjadi ca pulmo, 1 = tidak terjadi ca pulmo. Regresi linier tidak
mampu menyelesaikan analisis ini, namun LPM dapat menyelesaikan analisis ini dengan cara
ekspektasi kondisional Y dari X, dapat diinterpretasikan sebagai probabilitas kondisional saat
suatu event Y akan muncul karena X, atau dituliskan dengan E(Yix), yang didefinisikan :
p=P(Y) P=(Y=1IX=x), maka E(YIx)=p.1 + ( 1-p )*0=p
untuk memenuhi konsep LPM , sangat sulit karena terkadang nilai dari P berada diluar range
0-1, sedangkan nilai R² umumnya kecil, sehingga perlu dibuat pemodelan logit untuk
menyelesaikan kelemahan-kelemahan yang ada dalam LPM.
Untuk membuat harga p selalu berada diantara 0 dan 1, maka perlu suatu fungsi
monoton positif, yang memtakan linier prediktor h= a+bX ke unit interval. Transformasi tipe
ini akan mempertahankan struktur linier dari model dan menghindari nilai peluang berada
diluar interval [0,1]. Fungsi distribusi kumulatif (CDF= cummulative distributions function)
akan memnuhi kriteria di atas.
p=P(Y) P=(Y=1IX=x), P(h)= P(a+bX)
dengan menggunakan fungsi logistik, diperoleh linier regresion atau linier logit model,
dengan rumus sebagai berikut :

p= = =

1
maka untuk rumus regresi logistik adalah

p= E (Y=1IX )=

untuk mencari odd ratio / OR ( sebagai faktor resiko ), maka dapat dicari dari harga b yang

telah diketahui , maka rumus mencari OR adalah

OR=

Dimana e adalah bilangan natural yang besarnya adalah 2,718


Contoh :
sebuah penelitian bertujuan ingin mencari faktor-faktor yang mempengaruhi kejadian kanker
pulmo ( ca pulmo ), dianalisis variabel independen adalan kebiasaan merokok, usia, riwayat
keluarga ca pulmo dan daerah asal tinggal. Adapun data yang dikumpulkan adalah sebagai
berikut:
CA PULMO PEROKOK USIA RIWAYAT KELUARGA DAERAH
tidak capulmo tak merokok 45 tdk ada riwayat ca desa
tidak capulmo tak merokok 43 tdk ada riwayat ca desa
tidak capulmo tak merokok 34 tdk ada riwayat ca desa
tidak capulmo tak merokok 34 tdk ada riwayat ca desa
tidak capulmo tak merokok 26 tdk ada riwayat ca kota
tidak capulmo tak merokok 27 tdk ada riwayat ca kota
tidak capulmo tak merokok 27 tdk ada riwayat ca kota
tidak capulmo merokok 28 tdk ada riwayat ca kota
tidak capulmo tak merokok 29 tdk ada riwayat ca kota
tidak capulmo tak merokok 29 tdk ada riwayat ca kota
tidak capulmo tak merokok 30 tdk ada riwayat ca desa
tidak capulmo tak merokok 31 tdk ada riwayat ca desa
tidak capulmo merokok 32 ada riwayat ca desa
tidak capulmo merokok 33 tdk ada riwayat ca desa
capulmo merokok 45 ada riwayat ca desa
capulmo merokok 45 ada riwayat ca desa
capulmo merokok 46 ada riwayat ca desa
capulmo merokok 47 ada riwayat ca desa
capulmo merokok 8 ada riwayat ca desa
capulmo merokok 57 ada riwayat ca kota

2
capulmo merokok 57 ada riwayat ca kota
capulmo merokok 54 tdk ada riwayat ca kota
capulmo tak merokok 55 tdk ada riwayat ca kota
capulmo tak merokok 48 tdk ada riwayat ca kota
capulmo tak merokok 49 tdk ada riwayat ca kota
capulmo tak merokok 59 tdk ada riwayat ca kota
capulmo merokok 37 tdk ada riwayat ca kota
capulmo merokok 57 tdk ada riwayat ca kota
capulmo merokok 58 tdk ada riwayat ca desa
capulmo merokok 59 ada riwayat ca desa

Keterangan data dari variabel dimana dari variabel ca pulmo , ca pulmo=1; tidak ca pulmo=0,
pada variabel umur berskala data interval, pada variabel perokok, tak merokok=0 ;
merokok=1,pada variabel daerah, desa=0 ; kota=1, pada variabel riwayat keluarga tidak ada
riwayat ca=0; ada riwayat ca=1. Untuk menyelesaikan masalah diatas hanya dapat dikerjakan
dengan regresi logistik karena variabelnya berupa variabel dikotomi untuk variabel ca pulmo,
perokok, daerah dan riwayat keluarga. Sedangkan variabel usia distribusi data tidak normal.
Soal ini dapat diselesaikan dengan menggunakan aplikasi SPSS (Statistical Package For
Social Science)

RIWAYAT
CA PULMO PEROKOK USIA KELUARGA DAERAH
0 0 45 0 0
0 0 43 0 0
0 0 34 0 0
0 0 34 0 0
0 0 26 0 1
0 0 27 0 1
0 0 27 0 1
0 1 28 0 1
0 0 29 0 1
0 0 29 0 1
0 0 30 0 0
0 0 31 0 0
0 1 32 1 0
0 1 33 0 0
1 1 45 1 0
1 1 45 1 0
1 1 46 1 0
1 1 47 1 0

3
1 1 8 1 0
1 1 57 1 1
1 1 57 1 1
1 1 54 0 1
1 0 55 0 1
1 0 48 0 1
1 0 49 0 1
1 0 59 0 1
1 1 37 0 1
1 1 57 0 1
1 1 58 0 0
1 1 59 1 0
• Masukkan data tersebut ke dalam aplikasi SPSS
• Analyze, pilih regression, binary logistik
• Isikan ca pulmo pada dependent
• Sedangkan rokok, usia, riwayat keluarga dan daerah pada covariates selanjutnya klik
ok
• Maka akan tampil output seperti dibawah ini

Logistic Regression

Case Processing Summary


a
Unweighted Cases N Percent
Selected Cases Included in Analysis 30 100,0
Missing Cases 0 ,0
Total 30 100,0
Unselected Cases 0 ,0
Total 30 100,0
a. If weight is in effect, see classification table for the total
number of cases.

Dependent Variable Encoding

Original Value Internal Value


tidak capulmo 0
capulmo 1

Block 0: Beginning Block

4
a,b
Classification Table

Predicted

kanker pulmo Percentage


Observed tidak capulmo capulmo Correct
Step 0 kanker pulmo tidak capulmo 0 14 ,0
capulmo 0 16 100,0
Overall Percentage 53,3
a. Constant is included in the model.
b. The cut value is ,500

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step 0 Constant ,134 ,366 ,133 1 ,715 1,143

Variables not in the Equation

Score df Sig.
Step Variables ROKOK 8,571 1 ,003
0 USIA 12,820 1 ,000
RWYKLG 6,531 1 ,011
DAERAH ,536 1 ,464
Overall Statistics 19,306 4 ,001

Block 1: Method = Enter

Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 27,960 4 ,000
Block 27,960 4 ,000
Model 27,960 4 ,000

Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 13,496 ,606 ,810

a
Classification Table

Predicted

kanker pulmo Percentage


Observed tidak capulmo capulmo Correct
Step 1 kanker pulmo tidak capulmo 13 1 92,9
capulmo 1 15 93,8
Overall Percentage 93,3
a. The cut value is ,500

5
Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
ROKOK 1,888 1,628 1,344 1 ,246 6,603
1 USIA ,169 ,063 7,111 1 ,008 1,184
RWYKLG 5,236 3,086 2,877 1 ,090 187,824
DAERAH 3,310 2,068 2,562 1 ,109 27,393
Constant -10,295 3,705 7,722 1 ,005 ,000
a. Variable(s) entered on step 1: ROKOK, USIA, RWYKLG, DAERAH.
d
ari hasil diketahui bahwa semua variabel dimasukkan dalam hasil analisis, karena metode
yang kita pakai adalah metode enter. Hasil menunjukkan bahwa variabel usia yang
signifikan ( sig.= 0,010 ) sedangkan variabel lainnya sebagai variabel moderator atas
terjadinya ca pulmo.
Untuk mengetahui variabel mana yang berpengaruh atas ca pulmo, maka kita perlu
melakukan analisis dengan metode forward, dimana dengan memasukkan variabel
yang signifikan saja dalam analisis. Langkah analisis metode forward adalah :
• Langkah awal sama dengan langkah sebelumnya
• Method diganti Forward Conditional
• Lalu klik ok
• Maka akan tampil output seperti dibawah ini
Logistic Regression

Case Processing Summary


a
Unweighted Cases N Percent
Selected Cases Included in Analysis 30 100,0
Missing Cases 0 ,0
Total 30 100,0
Unselected Cases 0 ,0
Total 30 100,0
a. If weight is in effect, see classification table for the total
number of cases.

Dependent Variable Encoding

Original Value Internal Value


tidak capulmo 0
capulmo 1

Block 0: Beginning Block

6
a,b
Classification Table

Predicted

kanker pulmo Percentage


Observed tidak capulmo capulmo Correct
Step 0 kanker pulmo tidak capulmo 0 14 ,0
capulmo 0 16 100,0
Overall Percentage 53,3
a. Constant is included in the model.
b. The cut value is ,500

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step 0 Constant ,134 ,366 ,133 1 ,715 1,143

Variables not in the Equation

Score df Sig.
Step Variables ROKOK 8,571 1 ,003
0 USIA 12,820 1 ,000
RWYKLG 6,531 1 ,011
DAERAH ,536 1 ,464
Overall Statistics 19,306 4 ,001

Block 1: Method = Forward Stepwise (Conditional)

Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 15,640 1 ,000
Block 15,640 1 ,000
Model 15,640 1 ,000
Step 2 Step 6,407 1 ,011
Block 22,047 2 ,000
Model 22,047 2 ,000

Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 25,815 ,406 ,543
2 19,409 ,520 ,695

7
a
Classification Table

Predicted

kanker pulmo Percentage


Observed tidak capulmo capulmo Correct
Step 1 kanker pulmo tidak capulmo 12 2 85,7
capulmo 2 14 87,5
Overall Percentage 86,7
Step 2 kanker pulmo tidak capulmo 12 2 85,7
capulmo 1 15 93,8
Overall Percentage 90,0
a. The cut value is ,500

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a USIA ,156 ,052 8,973 1 ,003 1,169
1 Constant -6,186 2,133 8,408 1 ,004 ,002
Step
b ROKOK 2,794 1,263 4,893 1 ,027 16,352
2 USIA ,163 ,064 6,519 1 ,011 1,177
Constant
-7,728 2,895 7,125 1 ,008 ,000

a. Variable(s) entered on step 1: USIA.


b. Variable(s) entered on step 2: ROKOK.

Model if Term Removeda

Change in
Model Log -2 Log Sig. of the
Variable Likelihood Likelihood df Change
Step 1 USIA -20,767 15,719 1 ,000
Step 2 ROKOK -13,403 7,398 1 ,007
USIA
-16,720 14,032 1 ,000

a. Based on conditional parameter estimates

Variables not in the Equation

Score df Sig.
Step Variables ROKOK 6,458 1 ,011
1 RWYKLG 5,713 1 ,017
DAERAH ,365 1 ,546
Overall Statistics 9,801 3 ,020
Step Variables RWYKLG 1,741 1 ,187
2 DAERAH 1,301 1 ,254
Overall Statistics 5,530 2 ,063

8
Dari hasil forward diketahui bahwa variabel independen yang berpengaruh terhadap ca
pulmo adalah rokok ( koefesiensi regresi= 2,794 , sig.=0,027) dan variabel usia ( koefisiensi
regresi= 0,163, sig.=0,011 ) dengan konstanta -7,728. Sehingga persamaan regresinya adalah
P = -7,728+ 2,794X₁+0,163X₂
Interpretasi hasil dari model logit tersebut bukanlah nilai kuantitatif dari response melainkan
sebagai probabilitas atau peluang terjadinya suatu kejadian atau event dalam hal ini adalah
kejadian kanker pulmo (ca pulmo ), dengan persamaan distribusi komulatifnya adalah :

p= E (Y=1IX )=

Perlu diketahui bahwa besarnya (a+b₁X₁+b₂X₂) = Z

Sehingga E (Y=1IX ) dibaca harga harapan / peluang terjadinya suatu kejadian atau event,

dengan nilai kuantitatif 1 dalam hal ini adalah terjadinya kanker paru ( ca pulmo )
dikarenakan suatu respon dengan input/ prediktor variabel X.
Dari haril koefisien regresi yang diperoleh, dapat dicari
• OR untuk variabel yang signifikan (yaitu rokok dan usia )

• OR untuk rokok adalah OR1= = = 16,34

• OR untuk usia adalah OR2= = = 1,17

Dari hasil tersebut diketahui bahwa riwayat perokok sebagai faktor resiko terhadap terjadinya
ca pulmo sebesar 16,34. Sedangkan usia sebagai faktor resiko terjadinya ca pulmo sebasar
1,17.
Contoh :
Jika terdapat seseorang dengan kriteria X₁= perokok ( nilai= 1 ), dan X₂=usia 30 tahun, maka
kemungkinan terjadinya kanker paru-paru adalah
Z= a+b₁X₁+b₂X₂
Z= -7,728+ 2,794X₁+0,163X₂
Z= -7,728+( 2,794*1)+(0,163*30)
Z= -7,728 + 2,794 + 4,89
Z= -7,728 + 7,684
Z= -0,044

9
Sehingga p= E (Y=1IX )=

Atau p= E (Y=1I X )=

Sehingga besar Z = -0,044 dengan e adalah bilangan natural dengan nilai 2,718, maka

p= E (Y=1I X )=

p= E (Y=1IX )=

p= E (Y=1IX )=

p= E (Y=1IX )=

jadi orang memiliki peluang sebesar 48,9% atau 49% untuk terjadi kanker paru-paru, dengan
kondisi ia perokok dan berumur 30 tahun.

Jika terdapat seseorang dengan kriteria X₁=tidak perokok ( nilai= 0 ), dan X₂=usia 30 tahun,
maka kemungkinan terjadinya kanker paru-paru adalah
Z= a+b₁X₁+b₂X₂
Z= -7,728+ 2,794X₁+0,163X₂
Z= -7,728+( 2,794*0)+(0,163*30)
Z= -7,728 + 0 + 4,89
Z= -7,728 + 4,89
Z= -2,838
Sehingga besar Z = -2,838 dengan e adalah bilangan natural dengan nilai 2,718, maka

p= E (Y=1I X )=

p= E (Y=1IX )=

10
p= E (Y=1IX )=

p= E (Y=1IX )=

dengan kata lain bahwa orang tersebut memiliki peluang sebesar 5,5% atau 6 % untuk terjadi
kanker paru-paru, dengan kondisi ia tidak perokok dan berumur 30 tahun.

11

You might also like