You are on page 1of 19

1

Peubah Boneka (Dummy variable) Dalam Analises Regresi Linier


(Dummy Variable To Linear Regression Analysis)

Indah, M
1
, IM Tirta
2
dan Rita Ratih, T.
2

1
Mahasiswa Jurusan Matematika FMIPA Universitas Jember
2
Staf Pengajar Jurusan Matematika FMIPA Universitas Jember

ABSTRACT
Dummy variable is a simple method to quantifiey qualitative variable in regression model.
A qualitative variable with k category will be representated by k-1 dummy variables.
Parameters estimation and inference test is similar to that of the simple linear regression.
When interaction factor is included to regression model, we can compare the regression
function for each category from qualitative variable.

Key words : Regression Model, Qualitative Variable, Dummy Variable, The Simple
Linear Regression, Interaction Factor.

ABSTRAK
Peubah boneka merupakan cara yang sederhana untuk menkuantifikasi variabel kualitatif
dalam model regresi. Untuk variabel kualitatif yang mempunyai k kategori bisa dibangun
k-1 peubah boneka. Pendugaan parameter dan uji inferensinya sama dengan analisis
regresi linier sederhana. Ketika faktor interaksi dimasukkan dalam model maka kita bisa
membandingkan fungsi regresi untuk masing-masing kategori.

Kata Kunci : Model Regresi, Variable Kualitatif, Peubah Boneka, Regresi Linier
Sederhana, Faktor Interaksi.

PENDAHULUAN
Dalam analisis regresi sering kali bukan hanya variabel-variabel penjelas
kuantitatif yang mempengaruhi variabel tak bebas (Y), tetapi ada juga variabel-
variabel kualitatif yang ikut juga mempengaruhi, seperti jenis kelamin, musim,

2
warna, pendidikan, dan lain sebagainya (Vincent Gaspersz, 1991). Untuk
mengakomodasi adanya variabel kualitatif ke dalam model regresi dapat
dilakukan dengan menggunakan peubah boneka (dummy variable). Peubah
boneka ini biasanya mengambil nilai 1 atau 0. Kedua nilai yang diberikan tidak
menunjukkan bilangan (numerik), tetapi hanya sebagai identifikasi kelas atau
kategorinya.
Adapun tujuan dari artikel ini adalah untuk membangun suatu model
regresi yang peubah bebasnya mengandung variabel kualitatif dan kuantitatif,
untuk mengetahui estimasi parameter dan uji inferensinya, untuk membandingkan
persamaan regresi apabila menggunakan peubah boneka dan tanpa menggunakan
peubah boneka.

TINJAUAN PUSTAKA
Analisis Regresi Linier Berganda
Misalkan hubungan antara variabel tak bebas (Y) dengan variabel bebas (X) untuk
subjek i = 1, 2, 3, , n ditentukan oleh:
. ...
. . . . . .
. . . . . .
...
...
n k 2 2 1 1 0
2 2 k 22 2 21 1 0 2
1 1 k 12 2 11 1 0 1



+ + + + +
+ + + + +
+ + + + +
nk n n n
k
k
X X X Y
X X X Y
X X X Y
(1)
dengan X
i
adalah variabel bebas tidak random;
i
N(0,
2
) dan
i
independen
dengan
j
untuk ij.
Sistim persamaan (1) dapat ditulis dalam bentuk matrik, dengan
mendefinisikan matrik-matrik berikut:
.
n
.
.
2
1
;
k
.
.
1
0
;
1
. . . .
. . . .
1
1
;
.
.
]
]
]
]
]
]
]
]
]

]
]
]
]
]
]
]
]
]

]
]
]
]
]
]
]
]
]

]
]
]
]
]
]
]
]
]


nk
... X
n2
X
n1
X
2k
... X
22
X
21
X
1k
... X
12
X
11
X
n
Y
2
Y
1
Y
X Y
(2)



3
Atau dapat ditulis dalam bentuk matrik sebagai berikut :
+ X Y . (3)
Tirta (2000).
Berdasarkan asumsi di atas yaitu
i
N(0,
2
), maka kita dapat menulis
persamaan (1) dalam bentuk nilai harapan :
( ) .
k
...
2 2 1 1 0 ik
X
i
X
i
X
i
Y E + + + +


Estimasi Parameter dengan Metode Kuadrat Terkecil
Persamaan (1) dapat ditulis sebagai berikut (Montgomery, 1991):
.
i
1
j 0 i

k
...
2 2 1 1 0
+

+ + + + + +
k
j
ij
X
ik
X
i
X
i
X
i
Y

Fungsi dari metode kuadrat terkecil yaitu dengan meminimumkan jumlah
kuadrat kesalahan dari yaitu:
.
2
1 1 j
j
-
0
-
1 i
2
i
)
k
..., ,
1
,
0
(

,
`

.
|

n
i
k
ij
X
i
Y
n
S
(4)
Agar S minimum maka persamaan (4) perlu diturunkan secara parsial
terhadap
0
,
1
, ,
k
untuk kemudian disamakan dengan nol.
0.
1
ij
1 j
j

-
0

- 2 -

k

..., ,
1

,
0

j
0
1 1 j
j

-
0

- 2 -

k

..., ,
1

,
0
0
S

,
`

.
|

,
`

.
|

n
i
X
k
ij
X
i
Y
S
n
i
k
ij
X
i
Y

(5)
Penyelesaian terhadap hasil turunan parsial di atas, menghasilkan gugus
persamaan normal sebagai berikut:

4
.
n
1 i

n
1 i

n
1 i
k

...
2


n
1 i
1 1


n
1 i
0

. . . . .
. . . . .
n
1 i

n
1 i

n
1 i
1 k

...
2


n
1 i
1


n
1 i
0

n
1 i

n
1 i

n
1 i
k

...
i2 2


n
1 i
1 1

+ + +

+ + +

+ + +

+
i
Y
ik
X
2
ik
X
i2
X
ik
X
i
X
ik
X
ik
X
i
Y
i1
X
ik
X
i
X
i2
X
i1
X
2
i1
X
i1
X
i
Y
ik
X X
i
X n



(6)
Persamaan (6) akan mudah bila diselesaikan dalam bentuk matrik yaitu:
]
]
]
]
]
]
]
]
]
]

nk k k k
n
n
X X X X
...X X X X
... X X X X
3 2 1
2 32 22 12
1 31 21 11
. . . .
. . . .
1 ... 1 1 1
]
]
]
]
]
]
]
]
]
]

... 1
. . . .
. . . .
... 1
... 1
... 1
2 1
3 32 31
2 22 21
1 12 11
nk n n
k
k
k
X X X
X X X
X X X
X X X
]
]
]
]
]
]
]
]
]
]

.
.

2
1
0
=
]
]
]
]
]
]
]
]
]
]

nk k k k
n
n
X X X X
. .
...X X X X
... X X X X
3 2 1
2 32 22 12
1 31 21 11
. . . .
. .
1 ... 1 1 1
.
.
.
3
2
1
]
]
]
]
]
]
]
]
]
]

n
Y
Y
Y
Y

(7) . ) (


: didapatkan
1 -
) (
dengan ruas kedua mengalikan dengan adalah (6) persamaan dari Solusi
.


1 -
Y X X X
X X
Y X X X



Pengujian Hipotesis untuk Parameter Koefesien Regresi Parsial secara
Keseluruhan
Pengujian hipotesisnya adalah (Montgomery, 1991):
0 satu ada minimal : H
0 ... : H
j 1
k 2 1 0



Jumlah kuadrat total (JKT) merupakan penjumlahan dari jumlah kuadrat
regresi (JKR) dan jumlah kuadrat kesalahan (JKE), atau dapat ditulis:
JKT = JKR + JKE. (8)
Prosedur pengujian untuk H
0
:
j
0.
KTE
KTR

n-k-1
JKE
k
JKR
F
0

.
H
0
ditolak jika F
0
> F
(; k; n-k-1)
.

5
Kita akan memulai menghitung jumlah kuadrat regresi dengan
meminimumkan jumlah kuadrat kesalahan yaitu:

( )



n
1
2
i
1
2
. e

i
n
i
i i
Y Y JKE

Substitusikan

X Y
dihasilkan:
(9) .

2 - )

- ( )

- ( X X Y X YY X Y X Y + JKE
.

bahwa diketahui (7) persamaan Dari Y X X X


Jadi persamaan (9) menjadi:

- Y X' Y Y' JKE (10)


( )


n
i
i
Y Y JKT
1
2
.
2
1
n
Y
n
i
i

,
`

.
|

Y Y
(11)
Kita bisa menulis kembali persamaan (10) menjadi:
(12) . -

itu karena Oleh


(8)) persamaan (dari
atau -

- -
2
n
1
i
2
n
1
i
2
n
1
n
Y
JKR
JKT - JKR JKE
n
Y
n
Y
JKE
i
i i
i

,
`

.
|

,
`

.
|

,
`

.
|

,
`

.
|


Y X
Y X Y Y'

Tabel 1. Analisis ragam dalam analisis regresi linier berganda.


Sumber
Keragaman
Jumlah Kuadrat
(Sum of Squares)
(JK)
Derajat
bebas
(Db)
Kuadrat Tengah
(Mean Square)
(KT)
F
0
Regresi JKR k KTR = JKR/k
Error JKE n-k-1 KTE = JKE/n-k-1
Total JKT n-1
KTE
KTR


Pengujian Hipotesis untuk Parameter Koefesien Regresi Secara Individual
Pengujian hipotesisnya adalah:
0 : H
0 : H
j 1
j 0

.

6
H
0
tidak ditolak artinya respon X
j
bisa dihilangkan dari model. Uji
statistiknya adalah :
) se(


j
j
2
j
0


jj
C
t

dengan C
jj
adalah elemen ke-j dari diagonal matrik (XX)
-1
yang
berkorespondensi dengan
j

dan
2
= KTE.
H
0
ditolak jika | t
0
| > t
(/2;n-k-1)
.

Uji-F Sekuensial
Bila variabel bebas dimasukkan satu persatu secara bertahap kedalam suatu
persamaan regresi, maka kita berbicara mengenai uji-F sekuensial (Norman
Draper dan Harry Smith, 1982). Pertimbangkan model regresi dengan k peubah
bebas di bawah ini:
. + X Y (13)
Untuk menguji apakah signifikan atau tidak dalam model, maka kita bisa
mempartisi koefisien regresi seperti di bawah ini (Montgomery, 1991):
]
]
]
]
]

2
1

......
.
Kita akan menguji:
0 : H
0 : H
2 1
2 0

.
Model (13) dapat ditulis menjadi:
+ X Y .
2 2 1 1
+ + X X (14)
Untuk model (13), kita tahu dari persamaan (7):
JKR = Y X

-
n
Y
n
i
i
2
1

,
`

.
|

dan KTE = .
1



k n
Y X Y Y

Untuk menguji bahwa H
0
:
2
= 0 adalah benar maka model (14) direduksi
menjadi:

7
Y .
1 1
+ X (15)
Penduga kuadrat terkecil dari
1
yang direduksi dalam model (15) tersebut
adalah:
Y X X X
1
-1
1 1 1
) (

dengan JKR(
1
) = Y X
1 1

-
n
Y
n
i
i
2
1

,
`

.
|

.
Jumlah kuadrat regresi untuk
2
apabila
1
dimasukkan ke dalam model:
JKR(
2
|
1
) = JKR() JKR(
1
)
Dengan statistik ujinya:
F
0
=
KTE
r JKR / ) / (
1 2

.
H
0
ditolak jika F
0
> F
(, r;, n-k-1).


Koefisien Determinasi
Koefisien determinasi berganda R
2
mengukur proporsi keragaman total dalam
variabel tak bebas Y yang dapat dijelaskan oleh model persamaan regresi secara
bersama.
Besaran koefisien regresi ditentukan oleh formula:
JKT
JKR
R
2



Analisis Regresi dengan Variabel Bebas Kualitatif
Ada banyak cara untuk membangun model regresi yang peubah bebasnya
mengandung variabel kualitatif, salah satunya adalah menggunakan peubah
boneka. Sebagai misal, jika kita ingin memperkirakan nilai variabel Y yang
dipengaruhi oleh satu variabel bebas kuantitatif (X
1
) dan satu variabel bebas
kualitatif yang mempunyai dua kategori, misalnya kategori 1 dan kategori 2.
Pertama kita bisa mendefinisikan dua buah peubah boneka untuk variabel
kualitatif yang mempunyai dua kategori yaitu D
2
dan D
3
.
.
lainya jika 0
2 kategori jika 1

lainya jika 0
1 kategori jika 1

3 2

'


'

D D

8
maka model regresi untuk masalah di atas:
i 3 2 1 0 i
+ + + +
i3 i2 i1
D D X Y . (16)
Di sini kita membangun peubah boneka untuk masing-masing kategori dan
mengalami kesulitan dalam perhitungan. Untuk melihatnya, tinjau jika kita
mempunyai n =4 pengamatan, untuk kategori 1 kita punyai D
2
=1 dan D
3
= 0,
dan untuk kategori 2 kita punyai D
2
=0 dan D
3
= 1, matriknya menjadi:
X
0
X
1
D
2
D
3


.
1 0 1
1 0 1
0 1 1
0 1 1

41
31
21
11
]
]
]
]
]
]

X
X
X
X
X

Catatan bahwa kolom X
0
merupakan jumlah dari kolom D
2
dan D
3
, jadi kolom
tersebut saling tergantung linier, sehingga kita tidak bisa menemukan koefisien
regresi.
Untuk mengatasi hal tersebut, kita bisa mengambil satu peubah boneka
untuk mendefinisikan dua kategori, yaitu untuk variabel bebas kualitatif yang
mempunyai k kategori maka kita bisa dibangun k-1 peubah boneka. Jadi
persamaan (16) menjadi:
i 2 2 1 1 0
+ + +
i i i
D X Y . (17)
dengan:

'

lainya jika 0
1 kategori jika 1

2
D
Dengan mengasumsikan bahwa E(
i
) =0, maka dapat ditunjukkan bahwa
model (17) memiliki nilai harapan:
.
2 2 1 1 0 i i
D X E(Y) + + (18)
Untuk memahami arti dari parameter dalam model tersebut, pertama
pertimbangkan kasus untuk kategori 1 dimana D
2
= 0, dan kita mempunyai:
. (0)
1 1 0 2 1 1 0 i i
X X E(Y) + + + (19)
Persamaan (19) adalah persamaan garis lurus dengan intersep
0
dan
kemiringan
1.


9
Sedangkan untuk kategori 2 kita punyai D
2
= 1, sehingga nilai harapannya:
. ) ( (1)
1 1 2 0 2 1 1 0 i i
X X E(Y) + + + + (20)
Persamaan (20) tersebut juga merupakan persamaan garis lurus dengan
kemiringan yang sama
1,
tetapi intersep Y, (
0
+
2
).
Dalam model (17) dianggap bahwa peubah boneka D
2
tidak berinteraksi
dengan peubah lainya. Ini berarti bahwa pengaruh peubah lain sama saja baik
terhadap kategori 1 maupun untuk kategori 2. Jika kita menganggap antara
variabel kualitatif dan kuantitatif ada faktor interaksi maka model (17) menjadi:
.
i 2 1 3 2 2 1 1 0
+ + + + D X D X Y
i i i i i
(21)
dengan:
.
2 1 3 2 2 1 1 0 i i i i i
D X D X ) E(Y + + +
Dengan mengasumsikan E(
i
) =0, maka kita punyai nilai harapan variabel
Y untuk kategori 1dengan D
2
= 0, dan kita dapatkan:
. (0) (0)
1 1 0 1 3 2 1 1 0 i i
X X X E(Y) + + + +
Secara geometris fungsi di atas mempunyai intersep
0
dan kemiringan
1.

sedangkan untuk kategori 2 D
2
=1, kita punyai:
.
1
)
3 1
( )
2 0
( (1)
1 3
(1)
2 1 1 0 i
X
i
X
i
X E(Y) + + + + + +
Nilai harapan di atas mempunyai intersep (
0
+
2
) dan kemiringan (
1
+

3
). Sehingga
2
diartikan sebagai perubahan intersep untuk kategori 1 dan
kategori 2, sedangkan
3
diartikan sebagai perubahan kemiringan untuk kategori 1
dan kategori 2.
Misalkan kita ingin menguji apakah penambahan faktor interaksi
berpengaruh terhadap model regresi maka kita bisa menguji hipotesis dengan uji
F-Sekuensial sebagai berikut:
0 satu ada minimal : H
0 : H
j 1
3 2 1 0


.
Hasil dari uji hipotesis ini memiliki beberapa kemungkinan seperti
ditunjukkan dalam Gambar 1

10






(i) (ii)





(iii) (iv)
Gambar 1 Ilustrasi arti dari koefisien regresi untuk model (21)
(i) intersep dan kemiringannya sama.
(ii) intersep berbeda tetapi kemiringannya sama.
(iii) intersep sama kemiringan berbeda.
(iv) intersep dan kemiringannya berbeda.
Pada Gambar 1 dapat dilihat dengan jelas bahwa variabel bebas kualitatif
mempunyai pengaruh terhadap variabel bebas kuantitatif X
1
. Sedemikian hingga,
ketika efek interaksi antara variabel kuantitatif dan kualitatif ditunjukkan maka
kita bisa membandingkan fungsi regresi untuk masing-masing kategori dari
variabel kualitatif. Namun kondisi (iii) dalam kenyataan jarang ditemui/terjadi.

METODOLOGI
Data yang digunakan dalam penelitian ini ada dua yaitu data simulasi dan data riil,
data simulasi dibangkitkan melalui komputer dengan Y ditetapkan berdistribusi
normal (Y N(,
2
). Data riil diambil dari skripsi Tinuk Fitrias. Variabel-
variabel yang digunakan dalam penelitian ini yaitu:
Y = pendapatan (Rp) X
1
= umur (th).
X
2
= jumlah anggota keluarga (jiwa) X
3
= luas lahan (m
2
).

11
X
4
= harga jual (Rp) D
5
=

'

lainya jika 1
SMP jika 0

D
6
=

'

lainya jika 1
SMA jika 0

Paket komputer yang dipergunakan untuk menganalisis data adalah S-plus.
Penelitian ini dilakukan dengan mengikuti prosedur dan langkah langkah
berikut. Pertama yang kita lakukan yaitu membuat model regresi tanpa
menggunakan peubah boneka (digabung), kedua mementukan variabel yang akan
dijadikan sebagai variabel boneka, memasukkan peubah boneka ke dalam model
regresi, memasukkan nilai peubah boneka ke dalam model regresi
membandingkan jika menggunakan peubah boneka dan tanpa menggunakan
peubah boneka


HASIL DAN PEMBAHASAN
Ilustrasi Data simulasi
Membangkitkan data
Untuk membangkitkan data yang mengandung variabel kualitatif dengan simulasi
kita harus membangkitkan sendiri-sendiri data untuk tiap-tiap kategori yang ada
dan banyaknya data untuk kategori 1 dan kategori 2 sebarang bisa sama yang
berbeda adalah (myu) dari Y.
Prosedur membangkitkan datanya adalah:
#untuk kategori 1
n_40
k_1
x1_matrix(1,n,k+1)
x1[,2]_c(abs(round(rnorm(n,10,3))))
beta1_matrix(0,k+1,1)
beta1[,1]_c(2,3)
mu1_x1%*%beta1
#untuk kategori 2
x2_matrix(1,n,k+1)
x2[,2]_c(abs(round(rnorm(n,11,4))))
beta2_matrix(0,k+1,1)
beta2[,1]_c(10,2)
mu2_x2%*%beta2
y1_matrix(0,n,1)
y1[,1]_c(round(rnorm(n,mu1,4)))

12
y2_matrix(0,n,1)
y2[,1]_c(round(rnorm(n,mu2,3)))
print(x1)
print(y1)
print(x2)
print(y2)

Analisis Data simulasi
Dianalisis Bersama
Pertama-tama kita akan menganalisis secara bersama-sama dengan mengabaikan
bahwa sampel mengandung sub kelompok. Dari hasil simulasi kita dapatkan
dugaan model regresinya:
i i i
X Y + +
1 1 0


. (22)
dengan:
0

= 6,588509
1

= 2,448746
R
2
= 0,8295438 dan Standar kesalahanya = 4,386296.
Tabel 2. Analisis ragam untuk model (22).
Sumber Keragaman Db JK KT F
0

Regresi 1 7303.2620 7303.2620 379.5955
Error 78 1500.68795 19.2396
Total 79 8803.95
F
(0.05;1;78)
= 4,00.
Tabel 3. Analisis regresi untuk model (22).
Komponen Estimator se t-val (t
0
)
Konstanta (
0
) 6.5885 1.3228 4.9806
*
Beta1 (
1
) 2.4487 0.12568 19.4832
*
Keterangan: * (signifikan), t
(0.25;78)
= 4,00.

Menggunakan Peubah Boneka
Cara yang kedua yaitu,menggunakan peubah boneka. kita dapatkan dugaan model
regresinya:
i 2 2

1 1

+ + +
i
D
i
X
i
Y . (23)

13
dengan:
D
2
=

'

laki) - (laki 2 kategori jika 1


) (perempuan 1 kategori jika 0

0

= 4,877568
1

= 2,445890
2

= 3,477705 R
2
= 0,8570177
dan Standar kesalahannya = 4,043287.
Untuk melihat apakah koefisien regresi signifikan atau tidak kita bisa
melihat dari tabel analisis ragam dan tabel analisis regresi di bawah ini:
Tabel 4 Analisis ragam untuk model (23).
Sumber Keragaman Db JK KT F
0

Regresi 2 7545.1408 3772.5704 30.7641
Error 77 1258.8092 16.3482
Total 79 8803.95
F
(0.05,;2,;77)
= 3,15.
Tabel 5 Analisis regresi untuk model (23).
Komponen Estimator se t
0

Konstanta (
0
) 4.8776 1.2979 3.7578
*

Beta1 (
1
) 2.44599 0.1158 21.1109
*

Beta2 (
2
) 3.4777 0.9041 3.8465
*

Keterangan: * (signifikan), t
(0.025;79)
= 1,96.
Dari Tabel 4 terlihat bahwa nilai F
0
lebih besar dari nilai F tab yang
berarti minimal ada satu
j
tidak sama dengan nol. Kemudian kita lanjutkan uji
secara individu. Dari Tabel 5 dapat dilihat bahwa semua parameter regresi

signifikan dalam model karena nilai t
0
lebih besar dari nilai t tab yang berarti
bahwa baik variabel bebas kuantitatif dan variabel kualitatif berpengaruh dalam
model regresi, yang berarti bahwa peubah boneka berpengaruh dalam model yang
berakibat nilai harapan untuk kategori dan kategori 2 berbeda.
Dengan mengasumsikan E(
i
) = 0, maka kita dapatkan nilai harapan
kategori 1 dengan memasukkan nilai D
2
= 0:
E(Y
i
) = 4,877568 + 2,445890 X
1

Sedangkan untuk kategori 2 kita masukkan D
2
= 1 kita dapatkan:
E(Y
i
) =

8,355273 + 2,445890 X
1
Untuk lebih jelasnya lihat Gambar 2.

14



Kategori 2
Digabung
Kategori 1




Gambar 2. Ilustrasi arti dari koefisien regresi pada model (24)
Pada Gambar 2 dapat dilihat dengan jelas bahwa plot data menyebar pada
kedua garis regresi tetapi arahnya berbeda, dan apabila dibandingkan dengan
dianalisis bersama akan dihasilkan satu garis regresi dan kemungkinan besar garis
tersebut tidak bisa mewakili kategori dari variabel kualitatif, karena seharusnya
antara kategiri 1 dan kategori 2 mempunyai garis regresi yang berbeda.

Dengan Menyertakan Faktor Interaksi
Apabila kita menganggap diantara variabel bebas kualitatif dan kuantitatif ada
faktor interaksi maka model (24) menjadi:
i i i i i i
D X D X Y + + + +
2 1 3 2 2 1 1 0


. (25)
dengan:
0

= 9,899591
1

= 1,930811
2

= 9,187886
3

= 1,295035
R
2
= 0,9125925 dan Standar kesalahanya = 3,82045.
Untuk melihat apakah penambahan faktor interaksi dalam model berarti
atau tidak maka kita gunakan uji F-Sekuensial di bawah ini:
H
0
:
3
= 0
H
1
:
3
0.
Statistik ujinya adalah:
P
P
P
P
P
P
P
P
P
P
PP
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
X
Y
0 5 10 15 20
0
1
0
2
0
3
0
4
0
5
0
6
0
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L

15
( )
( )
( )
9188 48,3218129
154 1254088200 , 10
6 2781114669 , 489

,
96
, ,
:
1
,
2 1 3 3 2 1 2 1 3
0


KTE
KTR JKE JKR
F

.
Karena nilai F
0
> F tab = F
(0.025,1,77)
= 3,92 maka H
0
ditolak yang berarti
penambahan faktor interaksi signifikan dalam model regresi yang artinya bahwa
kedua fungsi regresi mempunyai intersep dan kemiringan yang berbeda. Jadi
model (25) merupakan model dugaan regresi paling tepat.
Untuk lebih jelasnya lihat Gambar 3.




Kategori 2
Digabung
Kategori 1




Gambar 3 Ilustrasi arti dari koefisien regresi pada model (25)
Pada Gambar 3 terlihat bahwa ada interaksi diantara variabel bebas dalam
model regresi berarti antara kategori 1 (perempuan) dan kategori 2 (laki-laki)
berbeda (nilai harapan antara kategori 1 dan kategori 2 berbeda baik intersep
maupun kemiringannya). Bila dibandingkan dengan dianalisis bersama maka akan
dihasilkan satu garis regresi padahal seharusnya antara kategori 1 dan kategori 2
mempunyai satu garis regresi yang berbeda.

Analisis Data riil
Dari hasil mengolah program data riil diperoleh keluaran yang dapat dinyatakan
sebagai berikut:
P
P
P
P
P
P
P
P
P
P
PP
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
P
X
Y
0 5 10 15 20
0
1
0
2
0
3
0
4
0
5
0
6
0
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L
L

16
i i i i i i i i
D D X X X X Y + + + + + + +
6 6 5 5 4 4 3 3 2 2 1 1 0


. (26)
dengan:
D
5
=

'

lainya jika 0
SMP jika 1
D
6
=

'

lainya jika 0
SMA jika 1

0

= -3357,4631

1

= 7,1481
2

= 62,7049
3

= 0,2974
4

= 12,2655
5

= -133,2420
6

= 123,630 3
R
2
= 0,9655 dan Standar kesalahannya = 216,2.
Untuk melihat apakah parameter dalam model regresi signifikan atau tidak
kita gunakan tabel analisis ragam dan tabel analisis regresi di bawah ini:
Tabel 6. Analisis ragam untuk model (26).
Sumber Keragaman Db JK KT F
0
Regresi 6 30079084.4718 5013180.7452977 107.2207
Error 23 1075381.7032 46755.7262
Total 29 31154466.175
F
(0.05;6;23)
= 2,53.
Tabel 7. Analisis regresi untuk model (26).
Komponen Estimator se t-val
Konstanta(
0
) -3357.46307824016 507.159474362743 -6.6201
*
Beta1 (
1
) 7.1480880560202 6.32117772093458 1.13081

Beta2 (
2
) -62.7049066253112 45.7761669146861 -1.36981
Beta3 (
3
) 0.297403182249202 0.015415342084103 19.29267
*
Beta4 (
4
) 12.265539124538 1.72549949281713 7.1084
*
Beta5 (
5
) -133.24198999768 114.590343361384 -1.16276
Beta6 (
6
) -123.630296243489 103.685648910135 -1.19235
Keterangan: * (signifikan), t
(0.025;23)
= 2,069.
Pada Tabel 6 dapat dilihat bahwa nilai F
0
lebih besar dari nilai F tab yang
berarti minimal ada satu
j
tidak sama dengan nol. Kita lanjutkan uji secara
individu dapat dilihat bahwa koefisien dari jumlah anggota keluarga (
2
) dan luas
lahan (
3
) siknifikan dalam model, sedangkan koefisien dari umur petani (
1
),
harga jual (
4
) dan koefisien peubah boneka (
5
,
6
) tidak signifikan dakam model
yang berarti rata-rata pendapatan petani pisang antara tingkat pendidikan SD,
SMP, dan SMA tidak berbeda atau sama, yang membedakanya adalah luas lahan

17
yang dimiliki petani dan harga jualnya. Plot residu dari data riil seperti terlihat
pada Gambar 4.
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1 1
1
1
1
Pendapatan
R
e
s
i
d
u
a
l
0 1000 2000 3000 4000 5000
-
6
0
0
-
4
0
0
-
2
0
0
0
2
0
0
4
0
0
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2 2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3 3
3
3
3

Gambar 4. Plot residu dari model (26)
Pada Gambar 4 dapat dilihat bahwa plot residu antara kategori tingkat
pendidikan SD, SMP dan SMA menyebar (tidak terjadi perpisahan yang jelas
antara ketiga kategori tingkat pendidikan), hal ini disebabkan karena koefisien
dari peubah boneka tidak signifikan dalam model.
Sekarang apabila kita menganggap diantara variabel bebas kualitatif dan
kuantitaif terjadi interaksi maka model (26) menjadi:
i i i
i i i i i i i i i i i i
i i i i i i i i i
D X
D X D X D X D X D X D X
D X D D X X X X Y



+
+ + + + + +
+ + + + + + + +
6 4 14
5 4 13 6 3 12 5 3 11 6 2 10 5 2 9 6 1 8
5 1 7 6 6 5 5 4 4 3 3 2 2 1 1 0








(26)
dengan:
D
5
=

'

lainya jika 0
SMP jika 1
D
6
=

'

lainya jika 0
SMA jika 1

0

= -3946,12613
1

= 8,33602
2

= 125,66614
3

= 0,33563
4

= 14,26737
5

= 1340,54058
6

= 1657,9111
7

= -5,28832
8

= 51,65253
9

= 98,99463

18
10

= 99,71873
11

= -0,06059
12

= 0,10362
13

= -4,58193
14

= 1,20317 R
2
= 0,9739
dan Standar kesalahannya = 232,9.
Untuk melihat apakah parameter dalam model regresi siknifikan atau tidak
maka kita gunakan uji F-Sekuensial berikut ini.
Uji hipoteseisnya adalah:
H
0
:
7
=

8
=

9
=

10
=

11
=

12
=

13
=

14
= 0.
H
1
: Minimal ada satu

q
tidak sama dengan nol.
Statistik Ujinya adalah:
F
0
=
( ) ( )
15
,... ,
:
8
,... , ,..., ,
14 1 0 6 1 0 14 8 7
JKE JKR

=
( ) ( ) ( )
15
,..., ,
:
8
,..., , ,..., ,
14 1 0 6 1 0 14 1 0
JKE JKR JKR

=
15
430576339 , 813967
:
8
4717862 , 30079084 7444 , 30340498
= 0.6022.
Karena nilai F
0
lebih kecil dari nilai F tab = F
(0.05;8,15)
= 2,64 maka H
0

diterima yang berarti bahwa penambahan faktor interaksi tidak signifikan dalam
model, yang berarti antara tingkat pendidikan SD, SMP dan SMA tingkat
pendapatanya sama atau tidak berbeda.

KESIMPULAN
Dari hasil penelitian ini dapat disimpulkan bahwa peubah boneka
merupakan cara yang sederhana untuk mengkuantifikasi variabel kualitatif dalam
model regresi. Untuk variabel bebas kualitatif yang mempunyai k kategori, kita
bisa membangun k-1 peubah boneka.
Estimasi parameter uji dan inferensinya sama dengan analisis regresi linier
sederhana. Hasil analisis menunjukkan apabila dalam suatu model regresi diduga
ada variabel kualitatif yang ikut mempengaruhi variabel tak bebas Y, sebaiknya
variabel tersebut digunakan dalam model dengan menggunakan peubah boneka
(dummy variable). Ketika nilai dari peubah boneka dimasukkan ke dalam model
maka akan dihasilkan fungsi regresi untuk tiap-tiap kategori dari variabel
kualitatif. Bila dibandingkan dengan tanpa menggunakan peubah boneka

19
(dianalisis bersama) maka akan dihasilkan satu garis regresi, dan kemungkinan
besar garis regresi tersebut tidak bisa mewakili tiap-tiap kategori dari variabel
kualitatif.
DAFTAR PUSTAKA

Montgomery D.C. & Peck E.A, (1991), Introduction to Linear Regression
Analysis, New York: Jhon Willey & Sonc, 2
nd
edition.
Gaspert V, (1991), Ekonometrika Terapan I, Bandung, Penerbit Tarsito Bandung.
Neter J, Wasserman W. & Kutner M.H. (1985), Applied Linear Statistical Model,
Irwin 2
nd
Edition.
Tirta M. I, (2000), Diktat Kuliah Pemodelan Matematika, Jurusan Matematika
Fakultas MIPA Universitas Jember.
Soejoeti Zanzawi, (1986), Pengantar Statistika Matematika I , Penerbit Karunika
Jakarta, Universitas Terbuka.
Draper, N. dan Smith H, (1992), Analisis Regresi Terapan (Terjemahan), Edisi
ke-2,Penerbit PT Gramedia Pustaka utama Jakarta.
Fitrias Tinuk, (1998), Pengaruh Faktor-Faktor Sosial Ekonomi Terhadap
Pendapatan Petani Pisang KUBA, Skripsi, Fakultas Pertanian Universitas
Jember.

You might also like