REGRESI LINIER BERGANDA

REGRESI LINIER BERGANDA
• Persamaan
Y    1 x1   2 x2  ....   n xn
• Beberapa syarat yang perlu diperhatikan adalah:
 Satu variabel dependen yang bersifat numerik
 Satu atau lebih variabel independen bersifat numerik
dapat disertai dg variabel yang bersifat kategori
Asumsi Regresi Linier Berganda
• Variabel numerik harus
Univariate berdistribusi NORMAL

• Korelasi antara variabel dependen
dengan independent dapat
dideteksi dengan melakukan uji
korelasi Pearson atau regresi linier
sederhana, Variabel dengan nilai-p
< 0.15 (0.25 atau 0.10) merupakan
Bivariate kandidat model
• Korelasi antar variabel independent
perlu juga diketahui untuk
mewaspadai adanya gejala
kolinearitas (nilai r > 0.8)
Asumsi Regresi Linier Berganda
• Liniearity: Apakah variabel Y merupakan
fungsi linier dari gabungan x1, x2, …xn
• Multivariate Normality: Apakah variabel Y
berdistribusi normal untuk gabungan x1,
x2,…xn
• Colinearity: Apakah tidak terdapat korelasi
antar variabel independen
• Existency:Apakah variabel Y merupakan
variabel random (acak) yang punya mean dan
Multivariate SD tertentu
• Homocedasticity: Apakah varian nilai Y sama
(homogen) untuk setiap nilai x1, x2, …xn
• Independency: Apakah variabel Y mempunyai
nilai yang saling bebas (no autocorr.) satu
dengan lainnya
APLIKASI DENGAN SPSS
• Variabel apa saja yang dapat digunakan untuk memprediksi
tingkat/skor GLUKOSA DARAH PUASA seseorang?
 JENIS KEL : Status merokok (1=laki2, 2=perempuan)
 STATUS GIZI : Skor indikator gizi dewasa (%)

 TOTAL AKT : Skor total aktifitas fisik (wi+si+li)
 TOTAL PENG : Skor total pengetahuan (olahraga+obat)

 KARBOHIDR : Asupan karbohidrat (kkal)

 LEMAK : Asupan lemak (kkal)
 PROTEIN : Asupan protein (kkal)
Asumsi Univariate Normality
• Variabel numerik harus berdistribusi NORMAL
• Dengan Uji (KS) Kolmogorov Smirnov-1-sampel: SPSS Windows
Analyze ‣Nonparametric Test ‣ 1-sampel-KS..
One-Sample Kolmogorov-Smirnov Test

Kadar Nilai Total
Glukosa Aktifitas Nilai Total Nilai Asupan Nilai Asupan Nilai Asupan
Darah Puasa Status Gizi Responden Pengetahuan Karbohidrat Protein Lemak
Responden Responden (wi+si+li) Responden Responden Responden Responden
N 100 100 100 100 100 100 100
Normal Parametersa,b Mean 156,17 23,5823 8,0582 27,29 149,5172 29,7860 19,9892
Std. Deviation 62,234 3,67796 2,01390 6,248 38,04988 9,74844 9,26094
Most Extreme Absolute ,116 ,101 ,078 ,088 ,077 ,050 ,087
Differences Positive ,116 ,101 ,078 ,044 ,077 ,050 ,087
Negative -,090 -,044 -,063 -,088 -,076 -,043 -,066
Kolmogorov-Smirnov Z 1,163 1,006 ,781 ,878 ,771 ,496 ,872
Asymp. Sig. (2-tailed) ,134 ,264 ,575 ,423 ,592 ,967 ,433
a. Test distribution is Normal.
b. Calculated from data.
Asumsi Korelasi Bivariate
• Untuk menyeleksi variabel independen yang jadi
kandidat model [nilai-p < 0.15 (<0.25 atau <0.10)]
dilakukan KORELASI BIVARITE Analyze ‣Correlate ‣ Bivariate..

Correlations

Kadar Nilai Total
Glukosa Aktifitas Nilai Total Nilai Asupan Nilai Asupan Nilai Asupan
Darah Puasa Status Gizi Responden Pengetahuan Karbohidrat Protein Lemak
Responden Responden (wi+si+li) Responden Responden Responden Responden
Kadar Glukosa Darah Pearson Correlation 1 -,026 -,417** -,375** ,516** ,355** ,436**
Puasa Responden Sig. (2-tailed) ,795 ,000 ,000 ,000 ,000 ,000
N 100 100 100 100 100 100 100
Status Gizi Responden Pearson Correlation -,026 1 -,172 ,037 -,044 -,164 -,022
Sig. (2-tailed) ,795 ,087 ,717 ,665 ,104 ,824
N 100 100 100 100 100 100 100
Nilai Total Aktifitas Pearson Correlation -,417** -,172 1 ,512** -,134 -,151 -,259**
Responden (wi+si+li) Sig. (2-tailed) ,000 ,087 ,000 ,183 ,134 ,009
Variabel NStatus Gizi (p-value = 0,795) tidak diikutkan dalam analisis selanjutnya
100 100 100 100 100 100 100

Nilai Total Pengetahuan Pearson Correlation -,375** ,037 ,512** 1 -,133 -,131 -,204*
Asumsi Korelasi Bivariate
• Untuk mendeteksi adanya korelasi antar variabel
independen (kolinearitas) [r > 0.8] dilakukan KORELASI
BIVARITE Analyze ‣Correlate ‣ Bivariate..
Corre lations

Nilai Total
Ak tifitas Nilai Total Nilai A supan Nilai A supan Nilai A supan
Responden Pengetahuan Karbohidrat Protein Lemak
(wi+si+ li) Responden Responden Responden Responden
Nilai Total Akt ifitas Pearson Correlation 1 ,512** -,134 -,151 -,259**
Responden (wi+si+li) Sig. (2-tailed) ,000 ,183 ,134 ,009
N 100 100 100 100 100
Nilai Total Pengetahuan Pearson Correlation ,512** 1 -,133 -,131 -,204*
Responden Sig. (2-tailed) ,000 ,188 ,193 ,041
N 100 100 100 100 100
Nilai A supan Pearson Correlation -,134 -,133 1 ,334** ,257**
Karbohidrat Responden Sig. (2-tailed) ,183 ,188 ,001 ,010
N
100 100 100 100 100

Nilai A supan P rotein Pearson Correlation -,151 -,131 ,334** 1 ,462**
Responden Sig. (2-tailed) ,134 ,193 ,001 ,000
N 100 100 100 100 100
Nilai A supan Lemak Pearson Correlation -,259** -,204* ,257** ,462** 1
Responden Sig. (2-tailed) ,009 ,041 ,010 ,000
N 100 100 100 100 100
**. Correlation is s ignificant at the 0.01 level (2-tailed).
*. Correlation is s ignificant at the 0.05 level (2-tailed).

Tidak ada korelasi yang lebih dari 0.8, sehingga kolinearitas bukan masalah serius
Pemodelan Regresi Linier Ganda
• Untuk membuat model regresi linier ganda ada beberapa
metode yang tersedia a.l.:
- ENTER - STEPWISE - BACKWARD -FORWARD
• Contoh berikut adalah Metode ENTER:
Analyze ‣Regression ‣ Linier..
Pemodelan Regresi Linier Ganda
Model Summ ary

Adjust ed St d. E rror of
Model R R Square R Square the Es timate Nilai Koef. Korelasi r =686 (korelasi
1 ,686a ,471 ,437 46,716
a. Predic tors: (Constant), Nilai As upan Lemak
sedang)
Responden, jenis k elamin responden, Nilai Total
Pengetahuan Responden, Nilai Asupan Karbohidrat
Responden, Nilai Total Akt ifitas Responden (wi+ si+ li),
Nilai A supan P rotein Responden
2 2adj
Koef. Determinasi r =0.471 dan r =0.437 (variasi GDP yang
dapat dijelaskan oleh variabel independen = 47.1%)
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regres sion 180469,9 6 30078,323 13,782 ,000a
Residual 202964,2 93 2182,410
Total 383434,1 99
a. Predictors: (Constant), Nilai Asupan Lemak Responden, jenis kelamin res ponden,
Nilai Total Pengetahuan Responden, Nilai As upan Karbohidrat Responden, Nilai
Total Aktifitas Responden (wi+si+li), Nilai Asupan Protein Res ponden
b. Dependent Variable: Kadar Glukosa Darah Puasa Responden
Nilai-p ANOVA = 0.000 (Asumsi linier sudah terpenuhi)
Jika p>0.05 keluarkan variabel xi satu persatu sampai p<0.05
Pemodelan Regresi Linier Ganda
Coeffi cientsa

Unstandardized St andardiz ed
Coeffic ient s Coeffic ient s
Model B St d. Error Beta t Sig.
1 (Const ant) 106,755 40,772 2,618 ,010
jenis k elamin responden 4,754 10,315 ,036 ,461 ,646
Nilai Total Aktifitas
-6, 666 2,764 -,216 -2, 412 ,018
Responden (wi+si+ li)
Nilai Total Pengetahuan
-1, 576 ,880 -,158 -1, 792 ,076
Responden
Nilai Asupan Karbohidrat
,634 ,132 ,388 4,787 ,000
Responden
Nilai Asupan Protein
,521 ,572 ,082 ,910 ,365
Responden
Nilai Asupan Lemak
1,393 ,599 ,207 2,328 ,022
Responden
a. Dependent Variable: Kadar Glukos a Darah Puasa Responden

Meskipun, nilai-p variabel JENKEL = 0.646 dan PROTEIN = 0.365 (tidak
bermakna), namun karena nilai-p Anova < 0,05 sehingga tidak mengapa
Uji Asumsi Regresi Linier Ganda
1. Liniearity: Bila nilai-p ANOVA < 0.05 berarti asumsi linieritas sudah terpenuhi

2. Multivariate Normality: Diuji dengan melihat nilai RESIDUAL (PLOTS: histogram &
Normal Probability plot)
Uji Asumsi Regresi Linier Ganda

Multivariate Normality:
Histogram memperlihatkan distribusi normal & pada P-P plot nilai residual
berhimpit (mendekati) garis diagonal. Kedua grafik tersebut menggambarkan
asumsi Normalitas terpenuhi
Uji Asumsi Regresi Linier Ganda
3. Existency:
Bila residual menunjukkan adanya mean mendekati nilai 0 dan ada sebaran
(varian atas standard deviasi) maka asumsi eksistensi terpenuhi. Nilai mean
residual mendekati nol (0.000) berarti asumsi existensi terpenuhi.
Residuals Statistics(a)

Minimum Maximum Mean Std. Deviation N
Predicted Value 58,20 263,43 156,17 42,696 100
Std. Predicted Value -2,295 2,512 ,000 1,000 100
Standard Error of
Predicted Value 7,428 18,951 12,066 2,692 100
Adjusted Predicted Value 49,63 260,80 155,84 43,025 100
Residual -82,384 197,947 ,000 45,279 100
Std. Residual -1,764 4,237 ,000 ,969 100
Stud. Residual -1,803 4,419 ,003 1,009 100
Deleted Residual -86,141 215,297 ,326 49,051 100
Stud. Deleted Residual -1,826 4,945 ,012 1,044 100
Mahal. Distance 1,513 15,302 5,940 3,124 100
Cook's Distance ,000 ,245 ,012 ,031 100
Centered Leverage Value ,015 ,155 ,060 ,032 100
a Dependent Variable: Kadar Glukosa Darah Puasa Responden
Uji Asumsi Regresi Linier Ganda
4. Homocedasticity: Analisa scatter-plot antara Nilai prediksi standar (ZPRED) dengan
nilai residu standar (ZRESID) atau residu student (SRESID)

Scatter plot tidak membentuk pola tertentu  berarti asumsi homosiditas terpenuhi
Uji Asumsi Regresi Linier Ganda
5. Independency : Apabila nilai Durbin-Watson berkisar antara –2 s.d. +2 berarti asumsi
independensi terpenuhi

Model Summary(b)

Adjusted R Std. Error of
Model R R Square Square the Estimate Durbin-Watson
1 ,686(a) ,471 ,437 46,716 2,152
a Predictors: (Constant), Nilai Asupan Lemak Responden, jenis kelamin responden, Nilai Total Pengetahuan
Responden, Nilai Asupan Karbohidrat Responden, Nilai Total Aktifitas Responden (wi+si+li), Nilai Asupan Protein
Responden
b Dependent Variable: Kadar Glukosa Darah Puasa Responden

Nilai Durbin-Watson = 2.152  namun meskipun begitu asumsi independensi masih
bisa ditolerir
Uji Asumsi Regresi Linier Ganda
6. Collinearity: Apabila nilai VIF dari Collinearity diagnostic <10 dan pada korelasi
bivariate antar independent variabel r < 0.8 berarti tidak ada gejala collinearitas

Coeffi cientsa

Unstandardized St andardiz ed
Coeffic ient s Coeffic ient s Correlations Collinearity Statist ics
Model B St d. E rror Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Const ant) 106,755 40,772 2,618 ,010
Nilai Total Aktifitas
-6, 666 2,764 -,216 -2, 412 ,018 -,417 -,243 -,182 ,712 1,405
Responden (wi+si+ li)
Nilai Total Pengetahuan
-1, 576 ,880 -,158 -1, 792 ,076 -,375 -,183 -,135 ,730 1,370
Responden
Nilai A supan K arbohidrat
,634 ,132 ,388 4,787 ,000 ,516 ,445 ,361 ,868 1,152
Responden
Nilai A supan Lemak
1,393 ,599 ,207 2,328 ,022 ,436 ,235 ,176 ,717 1,394
Responden
Nilai A supan P rotein
,521 ,572 ,082 ,910 ,365 ,355 ,094 ,069 ,709 1,411
Responden
jenis k elamin responden 4,754 10,315 ,036 ,461 ,646 ,048 ,048 ,035 ,943 1,061
a. Dependent Variable: K adar Glukos a Darah Puasa Responden
Interpretasi Regresi Linier Ganda
PERSAMAAN GARIS LINIER adalah :
GDP = 122.773 - 6,733 (AKTFISIK) - 1.599 (TOTPENG) + 0.659 (KARBO) + 1.637 (LEMAK) + 0.521
(PROTEIN) + 4.754 (JENKEL)
Coeffi cientsa

Unstandardized St andardiz ed
Coeffic ient s Coeffic ient s Correlations Collinearity Statist ics
Model B St d. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Const ant) 106,755 40,772 2,618 ,010
Nilai Total Aktifitas
-6, 666 2,764 -,216 -2, 412 ,018 -,417 -,243 -,182 ,712 1,405
Responden (wi+si+ li)
Nilai Total Pengetahuan
-1, 576 ,880 -,158 -1, 792 ,076 -,375 -,183 -,135 ,730 1,370
Responden
Nilai Asupan Karbohidrat
,634 ,132 ,388 4,787 ,000 ,516 ,445 ,361 ,868 1,152
Responden
Nilai Asupan Lemak
1,393 ,599 ,207 2,328 ,022 ,436 ,235 ,176 ,717 1,394
Responden
Nilai Asupan Protein
,521 ,572 ,082 ,910 ,365 ,355 ,094 ,069 ,709 1,411
Responden
jenis k elamin responden 4,754 10,315 ,036 ,461 ,646 ,048 ,048 ,035 ,943 1,061
a. Dependent Variable: Kadar Glukos a Darah Puasa Responden

 AKT FISIK dapat menurunkan GDP sebesar 6.7 poin
 Setiap kenaikan 1 kkal karbohidrat dan 1 kkal lemak yang dikonsumsi akan
meningkatkan kadar GDP masing-masing sebesar 0.66 dan 1.64 poin
 Setiap kenaikan pengetahuan 1 angka tentang penting olahraga dan obat
yang tepat mengontrol gula darah akan menurunkan kadar GDP sebesar
1.599 poin
Interpretasi Regresi Linier Ganda
Variabel yang paling berperan dalam memprediksi GDP: Dilihat nilai Standardized
Coefficients-Beta yg paling tinggi atau nilai Partial correlation paling tinggi

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Correlations Collinearity Statistics
Model B Std. Error Beta t Sig. Zero-order Partial Part Tolerance VIF
1 (Constant) 106,755 40,772 2,618 ,010
Nilai Total Aktifitas
-6,666 2,764 -,216 -2,412 ,018 -,417 -,243 -,182 ,712 1,405
Responden (wi+si+li)
Nilai Total Pengetahuan
-1,576 ,880 -,158 -1,792 ,076 -,375 -,183 -,135 ,730 1,370
Responden
Nilai Asupan Karbohidrat
,634 ,132 ,388 4,787 ,000 ,516 ,445 ,361 ,868 1,152
Responden
Nilai Asupan Lemak
1,393 ,599 ,207 2,328 ,022 ,436 ,235 ,176 ,717 1,394
Responden
Nilai Asupan Protein
,521 ,572 ,082 ,910 ,365 ,355 ,094 ,069 ,709 1,411
Responden
jenis kelamin responden 4,754 10,315 ,036 ,461 ,646 ,048 ,048 ,035 ,943 1,061
a. Dependent Variable: Kadar Glukosa Darah Puasa Responden

ASUPAN KARBOHIDRAT adalah variabel yang paling berperan dalam
memprediksi GDP, kemudian diikuti oleh variabel lain
REFERENSI
 Hastono, Sutanto P. Basic Data Analysis for Health
Research. FKM UI, Depok. 2006.
 Kuzma, Jan W dan Bhnenblust, Stephen E. Basic
Statistic for the Health Science. McGraw-Hill Company,
New York. 2005.
 Moore, David S. The Best Practice of Statistics, Second
Edition. WH Freaman and Company, New York, -.
 Saunders, Beth Dawson dan Trapp, Robert G. Basic &
Clinical Biostatistics. Appleton & Lange, California.
1994.
terima kasih
mohon masukan dan saran