You are on page 1of 33

ANALISIS REGRESI

RIDGE REGRESION
1. FARA ARIESTIA 3125080165
2. PUTRI WULANTRI 3125081760
3. PUTRIRINDI M 3125081766
REGRESI RIDGE UNTUK MENGATASI
MASALAH MULTIKOLINEARITAS
JUDUL SKRIPSI
RUMUSAN MASALAH ???
Bagaimana mengatasi masalah
multikolinearitas dengan Regresi
Ridge??
PENDAHULUAN
Model statistika merupakan suatu model matematis
yang meliputi variabel bebas dan tidak bebas. Salah
satu dari model statistika yang sering digunakan
dalam pemecahan suatu permasalahan adalah
Model Regresi Linier. Model regresi linier adalah
suatu model yang digunakan untuk menganalisis
hubungan antar variabel.

Regresi Linier dibagi menjadi dua, yaitu
Regresi Linier Sederhana (satu variabel bebas)
dan Regresi Linier Berganda (dua atau lebih
variabel bebas).
Satu dari asumsi model regresi linier adalah
bahwa tidak terdapat multikolinearitas
diantara variabel regressor yang termasuk
dalam model. Multikolinearitas terjadi apabila
terdapat hubungan atau korelasi diantara
beberapa atau seluruh variabel regressor.
Salah satu cara untuk mendapatkan koefisien regresi
pada persamaan regresi linier berganda adalah

 Metode kuadrat terkecil : menghasilkan penaksir
terbaik (tak bias dan bervarians minimum) jika
saja tidak ada korelasi antar variabel regressor.

 Metode ridge regression : nilai variabel
regressornya ditransformasikan dahulu melalui
prosedur centering and rescaling. Kemudian pada
diagonal utama matriks korelasi variabel
regressor ditambahkan Ridge Parameter dimana
nilainya antara 0 dan 1
PEMBAHASAN
Regresi Linear Berganda
 Model regresi linear berganda yang melibatkan p
buah variable bebas adalah:


 Asumsi-asumsi dalam analisis regresi linear meliputi:
a. Galat saling bebas dengan
dan variansi konstanta dimana
b. Variabel bebas (X) diasumsikan bersifat tetap
c. untuk setiap


c | | | | + + + + + =
P P
X X X Y ...
2 2 1 1 0
n i E
i
,..., 2 , 1 , 0 ) ( = = c
( )
2
, 0
c
o c N
i
~
( ) 0 , cov =
j i
c c j i =
Model regresi berganda dalam notasi
matriks:


 Dengan :


c | + =X Y
1 n x berukuran galat acak vektor = c
bebas tak variabel dari
amatan nilai - nilai merupakan elemennya - elemen yang 1 n x berukuran vektor = Y
1) (p n x berukuran yang rancangan matriks + = X
regresi ) (koefisien parameter
berupa elemennya - elemen yang 1 x 1) (p berukuran yang vektor + = |
Multikolinearitas pada Regresi Berganda
Multikolinearitas merupakan hubungan linear
yang sempurna diantara beberapa atau semua
variable bebas dari model regresi.

Masalah multikolinearitas akan membuat ragam
dari penduga kofisien regresi menjadi besar,
akibatnya selang kepercayaan dari parameter
yang diduga menjadi lebar sehungga
mengakibatkan pengujian hipotesis memeuhi
signifikansi kofisien regresi cenderun menerima
H
0
yang berarti koefisin regresi tidak berbeda
nyata dengan nol.

Beberapa metode untuk mengidentifikasi
adanya maslah multikolinearitas,
diantaranya:

a. Menentukan matriks korelasi dari semua
variabel bebas.
b. VIF
c. Akar ciri dari X’X


Regresi Ridge
Pada dasarnya untuk mendapatkan estimasi
parameter regresi ridge adalah dengan memberikan
kendala linear yang tepat pada metode kuadrat
terkecil.

 Estimasi Parameter dengan Regresi Ridge

Pada regresi linear berganda diberkan model umum
:
c | + =X Y
 Nilai Harapan Estimator Ridge


Hal ini mengakibatkan bahwa adalah taksiran
bias dari .
 Variansi Estimaor Ridge


( )
| | Z =
R
E
ˆ
R
|
ˆ
( )
( ) ( ) | |
( ) ( )
( )
¿
¿
=
=
÷ ÷
+
=
+ +
=
+ + =
p
i
i
i
i
i
p
i
i
k
k k
tr
R
Var
1
2
2
1
2
1 1
2

1 1

' ' '
ˆ
ì
ì
o
ì
ì
ì
o
o | kI X X X X kI X X
|
 Rata-rata Kuadrat Galat (Mean Square Error) dari
Estimator Ridge

( ) ) ( ) (
ˆ
2 1
k k MSE
R
¸ ¸ | + =
( )
R
k | ¸ var ) (
1
=
0 k jika 0 dengan sama ke
ˆ
dar jarak kuadrat
atau dari bias ) (
R
R 2
=
=
| |
| ¸ k
Prosedur Penentuan Nilai k
 Ridge Trace
Ridge trace adalah plot antara koefisien regresi
Ridge dengan nilai-nilai k. Untuk nilai k yang
berbeda dimana k [0,1] akan dapat ditentukan nilai
. Ridge trace merupakan suatu metode untuk
menunjukkan pengaruh dua dimensi dari non
orthogonal
 Langkah Penentuan Nilai k Dengan Metode Iteratif
Penentuan nilai k yang tepat dengan menggunakan
iterasi yang diperoleh dengan meminimumkan rata-
rata kuadrat galat residual.


R
|
ˆ
STUDI KASUS
ANALISIS REGRESI RIDGE

Aplikasi Regresi Ridge

 Contoh Kasus : Data yang digunakan
adalah data sekunder mengenai
tingkat kepuasan supervisor sebuah
perusahaan yang dipengaruhi oleh
beberapa factor.

Akan dicari model regresi ganda untuk
memprediksi keterkaitan hubungan antar
variabelnya. Datanya sebagai berikut :

Dengan menggunakan software NCSS 2000
dapat dicari koefisien penduga Ridge, nilai k, dan
perbandingan nilai korelasi antara Metode Kuadart
Terkecil dan Regresi Ridge,
Bagaimana outputnya
???
menunjukkan bagaimana penyebaran dan
pemusatan variabel bebas dan tak bebas tersebut.

Tabel statistik
deskriptif

Standard
Variable Count Mean Deviation Min Max
X1 35 7.174286 1.781332 3.8 10
X2 35 10.00286 2.482229 5.3 14
X3 35 10.65429 2.532535 5.7 14
X4 35 7.125714 1.636234 4.6 9.9
X5 35 15.06 3.280351 10.2 20
Y 35 16.20572 1.122482 12.6 17.9

Tabel Matriks Korelasi

menunjukkan korelasi antar variabel satu
dengan yang lain. Korelasi yang tinggi diihat dari
nilai |r|semakin besar.

terdapat korelasi yang tinggi antara variabel X1
dan X2, X1 dan X3, X2 dan X3, serta X4 dan X5.



X1 X2 X3 X4 X5 Y
X1 1.000000 0.999306 0.995470 -0.080998 -0.048048 0.598604
X2 0.999306 1.000000 0.995646 -0.073159 -0.040838 0.599047
X3 0.995470 0.995646 1.000000 -0.085307 -0.052128 0.591077
X4 -0.080998 -0.073159 -0.085307 1.000000 0.995582 -0.043960
X5 -0.048048 -0.040838 -0.052128 0.995582 1.000000 -0.009761
Y 0.598604 0.599047 0.591077 -0.043960 -0.009761 1.000000

Tabel Multikolinearitas kuadrat Terkecil


Pada tabel diatas nilai VIF > 10, maka
dapat dikategorikan kelima variabel bebas
terkait multikolinearitas.

Indpnden Variance R-Squared
Variabel Inflation Vs Other X's Tolerance
X1 793.9328 0.9987 0.0013
X2 844.0058 0.9988 0.0012
X3 120.1540 0.9917 0.0083
X4 136.7096 0.9927 0.0073
X5 134.9242 0.9926 0.0074
Tabel Nilai Eigen dan Korelasi

Pada tabel diatas, nilai eigen merupakan variansi
sebenarnya dari variabel bebas.
Nilai eigen yang mendekati 0 menunjukkan adanya
masalah multikolinearitas.
Angka kondisi antara 100 dan 1000 juga menunjukkan
masalah serupa
Angka kondisi yang melebih 1000 menunjukkan masalah
mulikolinearitas yang serius.

Incremental Cumulative Condition
No. Eigen value Percent Percent Number
1 3.017755 60.36 60.36 1.00
2 1.972057 39.44 99.80 1.53
3 0.005714 0.11 99.91 528.15
4 0.003847 0.08 99.99 784.38
5 0.000627 0.01 100.00 4810.15
menunjukkan vector eigen yang bersesuaian dengan
nilai eigen dari korelasi antara variabel-variabel
bebasnya.



No. Eigenvalue X1 X2 X3 X4 X5
1 3.017755 -0.571046 -0.570547 -0.570649 0.115548 0.096901
2 1.972057 0.085984 0.091327 0.082834 0.696901 0.701238
3 0.005714 -0.412749 -0.391752 0.801633 -0.126410 0.132566
4 0.003847 -0.141833 0.009820 0.155088 0.692316 -0.690242
5 0.000627 -0.689953 0.715939 -0.028814 -0.075481 0.069776
Tabel diatas menampilkan nilai koefisien regresi
Ridge dalam k yang presisinya dibandingkan dengan
nilai k yang diiterasikan
sehingga diperoleh nilai k = 0.361093

dapat dilihat nilai VIF yang dihasilkan menjadi
lebih kecil atau VIF < 10
sehingga dengan menggunakan nilai k yang
sesuai dapat menghilangkan pengaruh
multikolinearitas yang ada.
menunjukkan perbandingan antara penyelesaian
regresi dengan regresi Ridge dan OLS ( Metode
Kuadrat Terkecil).

Regular Regular Stand'zed Stand'zed Ridge L.S.
Indep. Ridge L.S. Ridge L.S. Standard Standard
Var. Coeff's Coeff's Coeff's Coeff's Error Error
Intercept 13.72804 13.49537
X1 0.1156222 -0.4759508 0.1835 -0.7553 3.039132E-02 2.56655
X2 8.345649E-02 0.9542688 0.1846 2.1102 2 .170739E-02 1.899038
X3 7.304389E-02 -0.3669116 0.1648 -0.8278 2 .319735E-02 0.7022901
X4 -1.370527E-02 -1.428679 -0.0200 -2.0826 0.0463255 1.159463
X5 8.817396E-03 0.7084383 0.0258 2.0703 2 .317429E-02 0.5745493

R-Squared 0.31840.3940
Sigma 1.00340.9461
Hasil diatas adalah penyelesaian regresi Ridge
secara terperinci,

sehingga didapat persamaan regresi :

5 10 . 817386 . 8 4 370525 . 1
3 10 . 304388 . 7 2 10 . 345647 . 8 1 1156222 . 0 72804 . 13
ˆ
3
2 2
X X
X X X Y
÷
÷ ÷
+ ÷
+ + + =
Stand'zed
Independent Regression Standard Regression
Variable Coefficient Error Coefficient VIF
Intercept 13.72804
X1 0.1156222 3.039132E-02 0.1835 0.0990
X2 8.345649E-02 2.170739E-02 0.1846 0.0980
X3 7.304389E-02 2.319735E-02 0.1648 0.1166
X4 -1.370527E-02 0.0463255 -0.0200 0.1940
X5 8.817396E-03 2.317429E-02 0.0258 0.1952

Tabel ANOVA untuk menguji keberartian koefisien
regresi Ridge yang telah diperoleh. Pengujian akan
dilakukan dengan taraf kepercayaan 95%.

Tabel ANOVA untuk k = 0.361093
Sum of Mean Prob
Source DF Squares Square F-Ratio Level
Intercept 1 9191.881 9191.881
Model 5 13.64115 2.728231 2.7098 0.039709
Error 29 29.1977 1.006817
Total(Adjusted) 34 42.83886 1.259966


Mean of Dependent 16.20572
Root Mean Square Error 1.003403
R-Squared 0.3184
Coefficient of Variation 6.191661E-02
1. Perumusan Hipotesis
H
0
= koefisien regresi Ridge yang diperoleh
tidak berarti.
H
i
= koefisien regresi Ridge yang diperoleh
berarti.

3. Kriteria pengujian Tolak H
0
jika F hitung > F
tabel
Karena F hitung (2.7089) > F tabel (F
0.05(5,29)
=
2.55)
4.Kesimpulan yang didapat : dengan taraf
kepercayaan 95% maka tolak H
0
artinya
koefisien reresi
Ridge yang diperoleh berarti, sehingga
signifikan.

2. F hitung = 2.7089

KESIMPULAN
Langkah-langkah dalam menyelesaikan masalah
multikolinearitas dengan Regresi Ridge :
 Menentukan estimasi dari regresi ridge dengan
menambah kendala k untuk mengatasi besarnya
keragaman.
 Menentukan nilai k dengan dua prosedur yaitu Ridge
Trace dan iterasi.

Penduga regresi Ridge dipakai sebagai kriteria yang
lebih baik dari penduga kuadrat terkecil (OLS).


SELESAI
Terima Kasih