You are on page 1of 14

[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009

ANALISIS REGRESI LOGIT GANDA


Oleh :
Deri Akhmad (9738) Johan Arifin (9834)
!hammad A"a#ido ($%83%) De&i 'a(&ari ($%83))
*ind! +ramana +!,ra -ar!& ($%83.) T/a 'ermo0a ($%849)
Gem(!r Safar ($%877) 1e2ra Ar/ani ($%9%7)
A&ri *id/a&ari ($%978) N!r Ina/ah ($$%%4)
Adhiar&a Rakhman ($$%33) e4a#a,i S5+5 ($$%7))
Sa(,o -in,an4 +5 ($$%84) D#i N!r&an,i ($$$9.)
Dosen Pengampu:
Dr&5 6!"ae"a7 Di("5ed5S,a,5
+ROGRA ST8DI STATISTI9A
1A98LTAS ATEATI9A DAN IL8 +ENGETA'8AN ALA
8NI:ERSITAS GADJA' ADA
)%%9
ANALISIS REGRESI LOGISTI9 GANDA
AnalisisRegresi Logit ergan!a "
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
+endah!"!an
Sebagaimana dalam regresi linier, model umum dari regresi logistik ganda adalah
model regresi ganda yaitu model yang melibatkan lebih dari satu prediktor/variable
independen. Secara garis besar, langkah pemodelan regresi logistik tidaklah
berbeda dengan kasus regresi liner.
Ana"i&i& Re4re&i Lo4i&,ik Ganda
Jika diketahui ada p variable independen, maka bisa ditunjukkan dengan vektor:
! " #
$
,
%
,&&,
p
'
(al ini diasumsikan bah)a beberapa variable berskala interval, sehingga
probabilitasnya bisa dituliskan dengan:
P#*"$+' " ,#'
-odel regresi logistik ganda:
g#' " .
/
0 .
$

$
0 .
%

%
0&..0 .
p

p
dimana,
,#' "
Jika beberapa dari variabel independennya diskret, variabelnya skala nominal
misalnya ras, jenis kelamin, grup perlakuan, dan sebagainya, maka tidak tepat
untuk memasukkan mereka pada model seakan1akan mereka adalah skala interval.
2ni karena nomor1nomor biasa digunakan untuk merepresentasikan berbagai
macam level yang hanya diidenti3ikasikan, dan tidak mempunyai nomor yang
signi3ikan. Pada situasi ini metode yang dipilih adalah untuk digunakan sebuah
koleksi dari design variabel #atau dummy variabel'. -isalkan, contoh, variabel
independen yang dimaksud adalah 4ras5, yang diberi kode sebagai 4)hite5, 4black5,
atau 4other5. Pada kasus ini diperlukan % design variabel. Salah satu strategi
pengkodean yang mungkin adalah ketika respondennya adalah 4)hite5, % design
variabelnya, D$ dan D%, keduanya akan sama dengan /6 ketika respondennya
4black5, D$ akan sama dengan $ sedangkan D% masih sama dengan /6 ketika ras
dari responden adalah 4other5, kita akan menggunakan D$"/ dan D%"$. 7abel %.$
mengilustrasikan pengkodean ini dari design variabel.
AnalisisRegresi Logit ergan!a 2
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
7abel %.$
Sebuah contoh dari Pengkodean Design 8ariabel 9ntuk :as, Dikodekan pada ;
level
8ariabel Desain
:as D$ D%
<hite / /
=lack $ /
Other / $
Sebagian besar so3t)are regresi >ogistik akan menghasilkan design variabel, dan
beberapa program harus dipilih dari beberapa metode yang berbeda. Perbedaan
strategi untuk kreasi dan interpretasi dari design variabel akan didiskusikan secara
detail pada chapter ;.
Pada umumnya, jika sebuah variabel skala nominal mempunyai k nilai yang
mungkin, maka dibutuhkan k1$ variabel desain. (al ini benar selama semua model
mempunyai nilai konstan. -isalkan j
th
variabel independen, ?
j
mempunyai @
j
tingkatan. -aka ada @
j
A $ dummy variable yang mungkin akan dinotasikan dengan
D
ju
dan koe3isien untuk dummy variable ini akan dinotasikan dengan .
ju!
u " $,%, &. ,
k
j
1$.. =egitu juga logistik untuk suatu model dengan p variable dan variable ke1j
akan dijabarkan dengan rumus :
g #' " .
/
0 .
$

$
0
ju
D
ju
0 .
p

p
S,ra,e4i +emode"an
>angkah1langkah pemodelan dalam regresi logistik meliputi:
$. 8eri3ikasi setiap variable independen terhadap variable dependen untuk mencari
hubungan antara tiap1tiap variable independent terhadap variable dependent.
%. @onstruksi model regresi dengan menggunakan metode pemilihan variable
independen yang dikehendaki.
;. Bvaluasi prediktor pada model regresi yang terbentuk dengan menggunakan uji
signi3ikansi estimasi parameter.
C. Pemeriksaan model lanjutan meliputi :
a# Dda tidaknya 3aktor perancu
$# Pemeriksaan asumsi #diagnostic checking'
AnalisisRegresi Logit ergan!a %
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
1i,,in4 ode" Re4re&i Lo4i&,ik Ganda
Dsumsikan bah)a kita mempunyai sampel dan n observari independen dari
pasangan #i,yi', i"$,%,&.n. Seperti dalam kasus univariat, pencocokan model
memerlukan estimasi yang kita peroleh dari vector . " #.
/
, .
$ , &.
, .
p
'. -etode
estimasi yang digunakan dalam kasus multivariate akan sama seperti dalam kasus
univariat1likelihood maksimum. Eungsi likelihoodnya sebagai berikut:
>#.' " #
i
' dengan ,#' dide3inisikan pada persamaan %.%
>#.' " >n+# .'+ "
$
ln F,#
%
'G A #$1y
%
' lnF$1 ,#
%
'H
Dkan ada p0$ rumus likelihood yang diperoleh dengan mendi3erensialkan 3ungsi log
likelihood dengan memperhatikan koe3isien p0$. (asil dari perhitungan likelihood
dapat dituliskan sebagai berikut:
y
i
A ,#
i
'G " /
dan
ij
F y
i
1 ,#
i
'G " /
9ntuk j"$,%,&.p
Sama seperti model univariat, penyelesaian dari perhitungan likelihood
memerlukan so3t)are khusus yang dapat ditemukan di beberapa paket program.
@atakanlah merupakan penyelesaian perhitungan tersebut. Jadi, nilai untuk model
regresi logistic ganda adalah #
i
', nilai dari pernyataan pada perhitungan #%.%'
dihitung menggunakan dan
i
Pada bab sebelumnya hanya ringkasan materi yang dibuat dari metode
untuk mengestimasi standar eror dari koe3isien estimasi. Sekarang setelah model
regresi logistic terbentuk dalam konsep dan notasi untuk kasus multivariate, kiata
akan membahas estimasi standar eror tersebut dengan lebih dalam lagi.
-etode variansi dan kovariansi estimasi koe3isien mengikuti perkembangan
teori estimasi likelihood maksimum Fsebagai contoh,lihat :ao#$IJ;'G. 7eori tersebut
menyatakan bah)a estimator diperoleh dari matriks derivative bagian kedua dari
3ungsi log likelihood. Derivative bagian ini memiliki bentuk umum sebagai berikut:
" 1
ij
%
,
i
#$1 ,
i
' #%.;'
Dan
" 1
ij

ij
,
i
#$1 ,
i
' #%.C'
AnalisisRegresi Logit ergan!a &
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
9ntuk j,u" /,$,%,&&,p dimana ,
i
dinotasikan

,#
i
'. 9ntuk #p0$' pada akhirnya
bernilai negative yang diperoleh dari perhitungan#%.;' dan #%.C' dinotasikan sebagai
2#.'. -atrik ini dinamakan matrik in3ormasi. @oe3isien estimasi dari variansi dan
kovariansi diperoleh dari invers matrik tersebut yang dapat ditulis ;2#.'" 2
1$
#.'.
@ecuali dalam beberapa kasus khusus tidak mungkin untuk menuliskan ekspresi
yang jelas untuk elemen1elemen dalam matriks ini. Oleh karena itu kita akan
menggunakan notasi KL #.
j
' untuk menunjukkan elemen diagonal keAj dari matrik ini,
yang mana merupakan variansi dari
j
dan K#.
j,
.
u
' untuk menunjukkan semua
elemen diagonal, yang mana merupakan kovariansi dari
j
dan
u
. Bstimator dari
variansi dan kovariansi yang akan ditunjukkan oleh ', diperoleh dengan
menentukan nilai M#.' pada . @ita akan menggunakan
%
#
j
' dan
j
,
u
', j,u "
/,$,%,&.,p untuk menunjukkan nilai pada matrik ini. 9ntuk sebagian besar bagian
kita akan mempunyai kesempatan untuk menggunakan estimasi standar error dari
koe3isien estimasi, yang akan kita tunjukkan sebagai :
9ntuk j " /,$,%,&p.
@ita akan menggunakan notasi ini dalam pengembangan metode untuk uji koe3isien
dan estimasi interval kon3idensi.
Eormulasi dari matri in3ormasi akan sangat berguna ketika kita membicara
pencocokan model dan estimasi dari penaksir adalah dimana ? adalah
n dengan matri p0$ yang mengandung data untuk setiap subjek , dan 8 adalah n
matri diagonal dengan elemen umum , dimana matri ? adalah :
? "
Dan matri 8:
8 "
Nontoh :
9ntuk contoh kita akan menggunakan subset variable dari data untuk studi =erat
=adan >ahir :endah #==>:'. 7ujuan dari studi ini adalah untuk mengidenti3ikasi
3actor resiko yang dihubungkan dengan berat badan lahir bayi yang rendah #)eight
O %P//gram'. Dalam data studi dikumpulkan $QI )anita dan diperoleh n
$
"PI orang
yang mempunyai bayi berat lahir rendah, dan n
/
"$;/ orang yang mempunyai bayi
AnalisisRegresi Logit ergan!a '
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
dengan berat badan lahir normal. Bmpat variable penting adalah DRB#usia', ><7
#berat pada periode menstruasi terakhir ibu', :ace #ras' dan E78 #jumlah kunjungan
psikiater selama semester pertama kehamilan'. Dalam penelitian ini, variable ras di
kode ulang menggunakan variable boneka yang ditunjukkan di table %.$. (asil 3itting
model regresi ditunjukkan pada table berikut :
7able %.%
@oe3isien Bstimasi untuk :egresi >ogit ganda
8ariabel Bstimated Noe33icients Standard error Noe33/SB
DRB 1/./%C /./;C 1/.J$
><7 1/./$C /.SP%B1/% 1%.$C
:DNB#$' $.//C /.CIJ %./%
:DNB#%' /.C;; /.;S% $.%/
E78 1/./CI /.$SJ 1/.;/
Nonstant $.%IP $./SI $.%$
1%>og >ikelihood " 1$$$.%QS
Pada table di atas, dummy variable untuk ras diindenti3ikasi dengan indeks #$' dam
#%'. Sehingga estimasi dari logit :
Dimana D
;i
untuk i"$,% menunjukkan % variabel boneka untuk :DNB #:as'. Tilai
pasti diperoleh dengan mengestimasi logit
8<i &i4nifikan&i ode"
Sama dengan regresi univariat, langkah pertama dalam proses ini adalah menguji
signi3ikansi dari maisng1masing variabel dalam model. :asio 9ji >ikelihood untuk uji
signi3ikansi keseluruhan dari p koe3isien untuk variabel independen dalam model
dapat ditunjukan dengan cara yang sama seperti kasus univariat. 9ji ini
berdasarkan pada statistic R yang telah diberikan pada persamaan :
D " 1%
Dan persamaan R"1%lnF#likelihood model a)al'/#likelihood model akhir'G
R " %
AnalisisRegresi Logit ergan!a (
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
*ang berbeda hanyalah 3itted valuenya. Pada model, berdasarkan p0$. Pada
hipothesis nol #(
/
',koe3isien p 4slope5 atau kemiringan untuk covariate dalam model
" /, nilai R dibandingkan dengan nilai dengan derajat bebas p.
(ipothesis untuk uji rasio likelihood #uji Overall test':
(
/
: .
i
" / vs (
$
: ada mimal $ .
i
U /, untuk i"$,%,&.
Daerah @ritik : (
/
ditolak jika R V
#p6W'
Sebagai contoh, mempertimbangkan model 3it yang nilai estimasi koe3isiennya telah
tersaji pada table %.%, untuk model tersebut nilai dari >og >ikelihood " > " 1$$$.%QS.
-odel kedua, dengan hanya mengisi constan, hasilnya >"1$$J.;;S, maka R"$%.$.
Dlternati3nya kita menggunakan persamaan #$.$;' kita mempunyai nilai n
$
"PI dan
n
/
"$;/, sehingga :
R " %F#1$$$.%QS'1#PIln#PI''0#$;/ln#$;/''1#$QIln#$QI''G"$%./II
Tilai p1value " PF G " /.;;; dimana nilai tersebut signi3ikan terhadap
nilai al3a"/./P. Dalan hal ini,(
/
ditolak yang memiliki nilai interpretasi yang sama
dengan regresei linear berganda yang dapat disimpulkan bah)a sedikitnya satu
atau semua koe3isien p berbeda.
Sebelum menyimpulkan bah)a ada beberapa atau semua koe3isien p"/, sebaiknya
kita melihat 9nivariate <ald 7est Statistics, <
j
" yang terdapat pada kolom
terakhir table %.%.
(ipothesis 9ntuk 9ji <ald #uji parsial'
(
/
: untuk masing1masing koe3isien " /
Statistik tersebut mengikuti distribusi normal standard. Dengan demikian, nilai dari
statistic ini memberikan kita indikasi variabel mana yang signi3ikan atau tidak layak
ada dalam model. Jika kita menggunakan nilain kritik %, dimana akan mendekati
nilai signi3ikansi /./P, selanjutnya kita dapat menyimpulkan bah)a variabel ><7
dan mungkin :DNB signi3ikan, sedangkan DRB dan E78 tidak signi3ikan.
Oleh karena uji overall benar akan diperoleh nilai yang terbaik dengan
meminimalkan beberapa parameter, langkah logis selanjutnya adalah untuk
mencocokan model yang hanya berisi variabel yang signi3ikan, dan
membandingkannya dengan model yang berisi semua variabel. (asil model yang
telah dikeluarkan variabel yang tidak signi3ikan disampaikan pada table berikut :
AnalisisRegresi Logit ergan!a )
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
7abel %.;.
Bstimasi @oe3isien :egresi >ogistik Randa dengan 8ariabel ><7 dan :DNB
8ariable Bstimasi @oe3isien Standar error Noe33/SB
><7
:DNB#$'
:DNB#$'
Nonstant
1/./$P
$./Q$
/.CQ$
/.Q/S
/./SC%B1/%
/.CQJ
/.;PS
/.QC;
1%.;J
%.%%
$.;P
/.IS
Perbedaan antara kedua model dengan mengeluarkan variabel DRB dan E78 dari
model semula. 9ji rasio >ikelihood yang membendingkan dua model ini diperoleh
menggunakan de3inisi R, yang mengikuti distribusi Nhi1SXuare dengan derajat
kebebasan % dengan hipothesis bah)a koe3isien untuk variabel yang dikeluarkan"/.
Tilai dari uji
R" 1%F#1$$$.S;/'1#1$$$.%QS'G"/.SQQ
Dengan derajat bebas % mempunyai p1value dari PFY
%
#%'V/.SQQG"/.J$
P1value lebih besar dari /,/P maka dapat disimpulkan bah)a model yang telah
dikeluarkan variabel independen yang tidak signi3ikannya merupakan model yang
terbaik. 8ariabel DRB dan E78 tidak berpengaruh jika dimasukkan pada model.
=agaimanapun juga kita tidak hanya menyimpulkan model terbaik pada uji
signi3ikansi statistik saja. Dda beberapa pertimbangan lain yang mempengaruhi
keputusan untuk memasukkan atau mengeliminasi suatu variabel dalam model.
Saat variabel skala kategorik independen dimasukkan #atau dikeluarkan' dari
model, semua variabel itu harus dimasukkan #atau dikeluarkan', jika tidak,
variabelnya dikode ulang. -isal jika kita hanya memasukkan desain variabel D
$
seperti pada tabel %.$, maka :DNB dimasukkan ke model sebagai variabel
dikotomus yaitu hitam atau bukan hitam. Jika k adalah banyaknya level dari variabel
kategori, maka kontribusi untuk derajat bebas untuk uji rasio likelihood untuk
variabel yang dikeluarkan adalah k1$. Nontohnya bila kita mengeluarkan :DNB dari
model dan :DNB terkode pada ; level menggunakan desain variabel di tabel %.$,
maka derajat bebas untuk pengujiannya menjadi %, masing masing $ untuk desain
variabel.
@arena derajat bebas yang lebih dari satu, kita harus hati hati dalam penggunaan
statistik )ald#<' dalam menilai signi3ikansi dari koe3isien. -isal jika < statistik untuk
AnalisisRegresi Logit ergan!a *
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
kedua koe3isien melebihi %, maka bisa disimpulkan desain variabelnya signi3ikan.
tetapi jika salah satu koe3isien statistik < nya ; dan lainnya $, maka kita tidak bisa
yakin bah)a desain variabelnya signi3ikan. Bstimasi koe3isien untuk variabel :DNB
pada tabel %.; memberikan contoh yang bagus. Statistik < untuk koe3isien desain
variabel pertama adalah %.%% dan $.;P untuk yang kedua. 9ji rasio likelihood
membandingkan model yang isinya ><7 dan :DNB dengan yang isinya hanya ><7
yields R " 1%F1$$C.;CP A #1$$$.S;/'G " P.C; dimana dengan % derajat bebas,
menghasilkan p1value sebesar /./SS. dengan melihat W sebesar /,/P maka :DNB
signi3ikan untuk dikeluarkan dari model. Tamun, variabel :DNB dianggap memiliki
peran penting dalam biologi sehingga memasukkan atau mengeluarkan :DNB
harus diputuskan bersama ahlinya.
Pada bab sebelumnya diuraikan, untuk model univariat, % uji lain yang ekuivalen
dengan uji rasio likelihood untuk menilai signi3ikansi model, yaitu uji )ald dan score.
@ita akan diskusikan secara singkat versi multivariat dari uji tersebut.
Dnalog multivariat bagi uji <ald didapat dari perhitungan matriks vektor berikut:
<" "
*ang akan berdistribusi chi sXuare dengan derajat bebas p0$ di ba)ah hipotesis
bah)a masing masing dari p0$ koe3isien sama dengan /. 9ji untuk memastikan
koe3isien kemiringan p didapat dengan mengeliminasi
/
dari dan baris yang
relevan #pertama' dan kolom #pertama' dari #?!8?'. @arena perhitungan dari uji ini
memerlukan kemampuan untuk menunjukkan operasi operasi vektor matriks dan
untuk ,mendapatkan yang tidak didapat dari uji perbandingan likelihood #likelihood
ratio test'. Perluasan dari uji <ald yang mungkin digunakan untuk menguji 3ungsi
3ungsi dari koe3isien mungkin lebih berman3aat.
Dsumsi asumsi diperlukan untuk mempekerjakan 3ungsi diskriminan mendekati
estimasi koe3isien regresi logistik yang menyatakan distribusi dari ? dengan variabel
keluaran. *"y berdistribusi multivariat normal dengan mean vektor yang tergantung
pada y, tapi kovariannya tidak. -enggunaka notasi digambarkan dalam bagian $.C,
kita menyebut ?+y " jZT#[
j
,M' dimana [
j
mean dari

p variabel independen untuk
subpopulasi digambarkan dengan y " j dan M adalah matriks kovariansi pp dari
variabel tersebut. Diba)ah asumsi ini P#*"$+'" ,#', dimana koe3isiennya
diberikan dengan cara mengikuti persamaan di ba)ah ini:
AnalisisRegresi Logit ergan!a 9
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
Dan
Dimana \
$
"P#*"$' dan

\
/
" $ 1 \
$
, proporsi dari populasi dengan y sama dengan /
atau $ berturut turut.
Eungsi diskriminan estimator dari .
/
dan . ditemukan dengan cara substitusi
estimator untuk [
j
, j " /,$, M dan \
$
ke dalam persamaan

#%.S' dan #%.J'. estimator
yang paling sering digunakan adalah ->B untuk model normal multivariat. Didapat:
-ean dari dalam subgroup dari sampel dengan y " j, j " /,$.Bstimator dari matriks
kovarian, M merupakan perluasan multivariat dari penyatuan sampel variansi yang
diberikan di bagian $.C. ini mungkin bisa direpresentasikan sebagai:
S "
Dimana S
j
adalah matriks p p dari estimator tak bias umum dari variansi dan
kovariansi dihitung di dalam subgroup yang digambarkan dengan y " j, j " /,$.
@arena estimator 3ungsi diskriminan bias, ketika normalitas tidak terpenuhi,
estimator 3ungsi diskriminan hanya dapat digunakan ketika so3t)are regresi logistik
tidak tersedia dan hanya pada analisis a)al saja. Dnalisis akhir harus berdasarkan
pada estimator likelihood maksimum dari koe3isien.
Pada bagian $.C dibahas % metode alternati3 untuk menghitung parameter model
regresi logistik, yaitu metode non iteratively )eight least sXuares dan metode 3ungsi
diskriminan. -asing masing metode tersebut dapat dikerjakan dalam kasus
multivariat meskipun aplikasi dari estimator non iteratively )eight least sXuares
terbatas karena membutuhkan estimasi ,#?' U / untuk kebanyakan harga dalam
data set. Dengan besarnya jumlah variabel independen pada beberapa variabel
kontinu, keadaan ini kemungkinan tidak akan terjadi. Bstimator 3ungsi diskriminan
tidak mempunyai batas tersebut dan dengan mudah diperluas ke kasus multivariat.
AnalisisRegresi Logit ergan!a "0
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
Eungsi diskriminan mendekati perhitungan koe3isien logistik berdasarkan asumsi
bah)a distribusi dari variabel independen, memberikan nilai dari variabel hasil,
adalah distribusi normal multivariat. % hal yang harus diingat:
$. Dsumsi dari normal multivariat jarang terpenuhi karena 3rekuensi kemunculan
dari variabel independen dikotomus.
2# Bstimator 3ungsi diskriminan dari koe3isien untuk variabel independen
berdistribusi tidak normal, khususnya variabel dikotomus, akan menjauhi nol jika
koe3isien sebenarnya tidak. @arena alasan tersebut umumnya kami tidak
menyarankan untuk menggunakan metode tersebut. Tamun estimasi ini dulu
sering digunakan dalam literatur literatur penting seperti truett, Norn3ield, dan
@annel #$ISJ'. Bstimator ini mudah untuk dihitung dan jika tidak ada program
regresi logistik, harus dilakukan uji terlebih dahulu terhadap data. Jadi estimator
ini berguna untuk memasukkan 3ormula yang relevan untuk perhitungannya.
=on,oh 9a&!&
Suatu penilitian dilakukan untuk mengetahui pengaruh status merokok dan usia
seseorang pasien terhadap resiko terkena penyakit jantung. Diambil $// sampel
dan diperoleh data sebagai berikut 6
Jantun
g Merokok
Usi
a
Jantun
g Merokok
Usi
a
Jantun
g Merokok
Usi
a
Jantun
g Merokok
Usi
a
" 0 &' 0 0 29 " " &9 " " '"
0 0 "* " 0 '2 " " (2 " " '2
0 0 "* 0 0 29 " " &" " " '2
0 0 "* " 0 &* " " '* 0 " %(
0 0 "* " 0 &' " " '' " " '%
" 0 &) 0 0 %0 " " &% " " '&
0 0 "9 0 0 %" " " && " " '&
0 0 "9 0 0 %" " " '* " " ''
0 0 20 " 0 (0 " " '9 0 " %'
0 0 20 " 0 %9 0 " &' " " '(
" 0 %' " 0 '( " " (0 " " '(
0 0 2" " 0 &% " " &( " " '*
0 0 22 " 0 &* 0 " &( " " '*
" 0 %9 " 0 &( 0 " &( 0 " %9
0 0 2% " 0 '( " " '2 " " (0
" 0 '& " 0 &) " " &* 0 " 2'
0 0 2% 0 0 2" 0 " &* " " ("
AnalisisRegresi Logit ergan!a ""
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
0 0 2& 0 0 %( 0 " &* " " ("
" 0 %( " 0 %( " " &* " " ("
" 0 %9 " " (" 0 " &2 " " (2
0 0 2' 0 " %* 0 " &" " " (%
0 0 2) " " &9 " " '0 0 " %(
0 0 2* 0 " &0 " " '0 " " (&
0 0 2* 0 " &0 " " '" " " (&
0 0 2* 0 " &0 " " '" " " ('
Dimana nilai jantung sama dengan / jika tidak dan $ jika ya. Dan untuk merokok $
sedangkan tidak merokok /.
Ana"i&i& Re4re&i Lo4i, Ganda
:erifika&i >
@arena ada variabel kategorikal, yaitu :okok maka untuk mengetahui apakah 3aktor
rokok berpengaruh terhadap penyakit jantung dilakukan analisis Nrostab Jantung vs
:okok
(
/
: 7idak ada hubungan antara merokok dengan sakit jantung
(
$
: Dda hubungan antara merokok dengan sakit jantung
=hi?S@!are Te&,&
8alue d3
Dsymp. Sig. #%1
sided'
Bact Sig. #%1
sided'
Bact Sig. #$1
sided'
Pearson Nhi1SXuare Q.$%J
a
$ .//C
Nontinuity Norrection
b
J.//$ $ .//Q
>ikelihood :atio Q.$QI $ .//C
Eisher]s Bact 7est .//J .//C
>inear1by1>inear Dssociation Q./CS $ .//P
T o3 8alid Nases
b
$//
a. / cells #./^' have epected count less than P. 7he minimum epected count is $Q./C.
b. Nomputed only 3or a %% table
Oleh karena tidak ada epected value yang O P, maka digunakan nilai signi3ikansi
Nhi SXuare.
Dari table diperoleh nilai sig pearson chi sXuare " /.//C O alpha #/,%P' sehingga kita
menolak (
/
yang berarti bah)a ada hubungan antara merokok dengan penyakit
jantung. Dtau merokok berpengaruh secara signi3ikan terhadap penyakit jantung.
Sedangkan untuk variabel independen kontinu #usia', dilakukan pengecekan
dengan :eg logit sederhana Jantung vs 9sia
(
/
: 8ariabel independen tidak berpengaruh signi3ikan terhadap variable
dependen
AnalisisRegresi Logit ergan!a "2
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
(
$
: 8ariabel independen berpengaruh signi3ikan terhadap variable dependen
:aria2"e& in ,he E@!a,ion
= S.B. <ald d3 Sig. Bp#='
Step $
a
9sia .%PI ./P; %;.C/I $ ./// $.%IP
Nonstant 1$/.PCJ %.%QC %$.;%Q $ ./// .///
a. 8ariable#s' entered on step $: usia.
Dari table diperoleh nilai sig " /./// O alpha #/,%P' sehingga kita menolak (
/
yang
berarti bah)a variabel usia berpengaru secara signi3ikan terhadap penyakit jantung.
Oleh karena kedua variabel signi3ikan, selanjutnya dilihat pada model regresi ganda
dengan memasukkan kedua variabel.
9on&,r!k&i ode">
9ji Omnibus #overall test' :
Omni2!& Te&,& of ode" =oeffiAien,&
Nhi1sXuare d3 Sig.
Step $ Step Q$.C$/ $ .///
=lock Q$.C$/ $ .///
-odel Q$.C$/ $ .///
Dari table terlihat bah)a nilai signi3ikansi " /./// O alpha #/./P' yang berarti bah)a
(
/
ditolak, sehingga dapat disimpulkan bah)a model layak.
I,era,ion 'i&,or/
2
2teration 1% >og likelihood
Noe33icients
Nonstant
Step / $ $;P.;J% .;S/
% $;P.;J% .;SC
; $;P.;J% .;SC
b. 2nitial 1% >og >ikelihood: $;P.;J%
ode" S!mmar/
Step 1% >og likelihood
No _ Snell :
SXuare
Tagelkerke :
SXuare
$ P;.IS%
a
.PPJ .JP$
Dari table model summary terlihat penurunan 1%>> yang cukup signi3ikan dari
$;P.;J% #tabel iteration history' menjadi P;.IS% #tabel model summary', dan
berdasarkan koe3isien Tagelkerke : sXuare diperoleh bah)a kedua predictor
#Status -erokok dan 9sia' mampu menjelaskan J$.P^ keragaman total dari logit.
'o&mer and Leme&ho# Te&,
Step Nhi1sXuare d3 Sig.
$ P.SJ; Q .SQC
AnalisisRegresi Logit ergan!a "%
[PROGRAM STUDI STATISTIKA FMIPA--UGM] 2009
Pada tabel (osmer and >emesho) 7est terlihat bah)a nilai sig"/.SQC V alpha
#/./P' yang menunjukkan bah)a (
/
tidak ditolak yang berarti bah)a model 3it
dengan data.
="a&&ifiAa,ion Ta2"e
a
Observed
Predicted
jantung
Percentage Norrect tidak ya
Step $ jantung tidak ;S P QJ.Q
ya ; PS IC.I
Overall Percentage
I%./
a. 7he cut value is .P//
Dari classi3ication table terlihat nilai ketepatan klasi3ikasi model terakhir adalah
sebesar I%^.
:aria2"e& in ,he E@!a,ion
= S.B. <ald d3 Sig. Bp#='
Step $
a
usia .P;/ .$%Q $J.%;C $ ./// $.SIQ
rokok#$' 1P.J%J $.JJ$ $/.CP% $ .//$ .//;
Nonstant 1$Q.%;J C.C;I $S.QJI $ ./// .///
Dari tabel diperoleh model logit :
g#' " 1$Q.%;J A P.J%J:okok 0 /.P;/ 9sia
AnalisisRegresi Logit ergan!a "&

You might also like