You are on page 1of 76

BAB 7.

ANALISIS KORELASI DAN REGRESI

eneliti sering dihadapkan pada data yang memiliki banyak peubah (misalnya data Nilai ujian nasional, terdiri atas beberapa peubah seperti jenis kelamin, identitas institusi, nilai ujian beberapa mata pelajaran). Dalam hal data mengandung banyak peubah, seseorang peneliti mungkin

tertarik untuk mengetahui (menguji) apakah suatu peubah berhubungan dengan peubah lainnya, baik dengan menghitung sebatas pada derajat asosiasi melalui analisis korelasi, maupun dengan menentukan bentuk fungsi/model hubungannya melalui analisis regresi. Pada bab ini akan dibahas analisis korelasi dan regresi sederhana.

KOMPETENSI
Setelah menyelesaikan materi pada bab ini pembaca dapat menghitung korelasi produk momen, memahami maknanya, dapat melakukan analisi regresi baik dengan satu maupun banyak peubah, serta dapat menginterpretasikan hasilnya.

MATERI
Korelasi Produk Momen Analisis regresi sederhana
Kompetensi 181

Analisis regresi peubah ganda Pengantar analisi regresi modern

7.1 ANALISIS KORELASI


Dalam analisis korelasi, kita menghitung derajat asosiasi antara satu peubah dengan peubah lain (misalnya antara berat badan dan tinggi badan, antara berat badan dengan kolesterol, antara nilai IQ dengan perolehan nilai ujian mata pelajaran matematika dan sebagainya). Ada dua jenis ukuran korelasi yang banyak dipakai yaitu: 1. Korelasi produk momen Pearson untuk mengukur derajat asosiasi antara beberapa peubah dengan skala interval atau rasio. 2. Korelasi Spearman untuk mengukur derajat asosiasi antara beberapa peubah dengan skala ordinal (rank).

Koefisien korelasi atau derajat asosiasi

dua peubah

(dinotasikan dengan r)

dihitung dengan rumus pada Pers. 7.1 yang sesungguhnya identik dan merupakan modifikasi dari rumus pada Pers. 3.12.

Pers. 7.1

r=

xi yi 1
i =1

n i =1
n

xi yi
i =1

x 1 xi n i =1 i =1
n n 2 i

n y 1 yi n i =1 i =1
2 i

182

ANALISISKORELASIDANREGRESI

Besarnya r berkisar antara 1 r 1 . Ilustrasi grafik sebaran data dengan berbagai nilai korelasi dapat disajikan dalam bentuk diagram pencar. Bentuk pencaran data terkait dengan besarnya korelasi dapat diilustrasikan seperti pada Gambar 7.1. 1. Korelasi negatif

menunjukan bahwa kedua peubah (X dan Y) memiliki

kecenderungan yang berlawanan (yaitu kenaikan nilai X, diikuti dengan penurunan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan kenaikan nilai Y), seperti pada Gambar 7.1 (a) dan Gambar 7.1 (b). Nilai r = 1 menunjukkan kedua peubah berkorelasi negatif secara sempurna. Sebaran data tepat membentuk garis lurus (hal yang dalam kenyatan jarang terjadi). 2. Korelasi nol (r=0) menunjukan bahwa kedua peubah tidak berkorelasi, yaitu kenaikan atau penurunan nilai peubah X, tidak mempengaruhi nilai peubah Y, seperti pada Gambar 7.1 (c). 3. Korelasi positif menunjukan bahwa kedua peubah memiliki kecenderungan yang sama, yaitu kenaikan nilai X, diikuti dengan kenaikan nilai Y, demikian juga sebaliknya penurunan nilai X diikuti dengan penurunan nilai Y, sebagaimana diilustrasikan pada Gambar 7.1 (d), Gambar 7.1 (e) dan Gambar 7.1 (f). Nilai r = 1 menunjukkan kedua peubah berkorelasi positif secara sempurna.

AnalisisKorelasi

183

(a) r=-0.99
-80

(b) r=-0.75
3

(c) r=0

-80

-90

-90

-100

-100

Y 40 45 X 50 55 -2 40 -1 0

-110

40

45 X

50

55

-120

45 X

50

55

(d) r=0.60
120

(e) r=0.70
110

(f) r=0.99

120

100

110

90 100

90

Y 80 70 40 45 X 50 55 80 40 90

70

80

40

45 X

50

55

100

45 X

50

55

Gambar 7.1

Diagram pencar data ( X,Y ) dengan berbagai nilai korelasi

7.1.1

MENGHITUNG KORELASI SECARA MANUAL

Untuk ukuran sampel yang relatif kecil, perhitungan koefisien korelasi secara manual menggunakan persamaan (8.1) masih mungkin dilakukan. Adanya Sebelum komputer atau kalkulator, perhitungan secara manual banyak juga dilakukan dengan mengunakan teknik yang disebut peta korelasi (lihat misalnya Hadi [8]).

184

ANALISISKORELASIDANREGRESI

Contoh 7.1

Berikut adalah contoh pasangan data fiktif dengan jumlah pasangan 10 sehinga masih mungkin dihitung secara manual.
x 8 10 5 6 7 8 9 5 10 4 72 y 5.00 4.00 3.00 3.00 4.00 4.00 5.00 3.00 5.00 2.00 38 3.8 xy 40 40 15 18 28 32 45 15 50 8 291 x2 64 100 25 36 49 64 81 25 100 16 560
2

xy

x
2

y y
2

y2 25 16 9 9 16 16 25 9 25 4 154
2

x /n y /n xy /n x

7.2

29.1

56 /n

15.4 /n

Hasil perhitugan pada tabel di atas selanjutnya dimasukkan ke dalam rumus pada persamaan 8.1 sehingga diperoleh:
r= 291 1/10 72 38 560 72 /10 154 38 /10
2 2

17, 4 = 0,87 19,98

Hasil yang sama diperoleh dengan menghitung mengunakan R.

7.1.2

MENGHITUNG KORELASI DENGAN RCOMMANDER

Ada dua macam korelasi yang dapat dihitung melalui RCommander, yaitu 1. Matriks korelasi yang sekaligus menghitung korelasi beberapa (lebih dari dua) peubah (lihat Gambar 7.2).

AnalisisKorelasi

185

2. Uji korelasi untuk menghitung dan menguji korelasi antara dua peubah. Dengan uji ini kita dapat menguji apakah korelasi antara dua peubah signifikan atau dapat diabaikan (Gambar 7.3).

Gambar 7.2 Menu dialog Matriks Korelasi untuk korelasi Pearson dan Spearman

Berikut adalah hasil keluaran matriks korelasi untuk empat peubah. Dalam matriks ini yang dihitung hanya besarnya korelasi tanpa ada uji apakah korelasinya bermakna atau tidak.
NFis NIng NMat Pkn

NFis 1.0000000 0.3040950 0.8152343 0.3533408 NIng 0.3040950 1.0000000 0.2653100 0.7178789 NMat 0.8152343 0.2653100 1.0000000 0.4906039 Pkn 0.3533408 0.7178789 0.4906039 1.0000000

186

ANALISISKORELASIDANREGRESI

Gambar 7.3 Menu dan Dialog Uji Korelasi Pearson dan Spearman

Salah satu korelasi dari empat peubah (misalnya antara NFis dengan Nmat) di atas dapat diuji lebih jauh melalui uji korelasi. Hasil analisisnya adalah sebagai berikut ini.
1. Pearson's product-moment correlation 2. data: DataSim$NFis and DataSim$NMat

3. t = 12.4323, df = 78, p-value < 2.2e-16 4. alternative hypothesis: true correlation is not equal to 0 5. 95 percent confidence interval: 0.7254628 0.8777313 6. sample estimates: cor 0.8152343

Keterangan 1. Judul uji yaitu Uji korelas produk momen dari Pearson

AnalisisKorelasi

187

2. Nama data dan peubah yang korelasinya diuji, yaitu data DataSim varianel NFis dan NMat. 3. Besarnya nilai t hitung (12,43), derajat kebebasan (78) dan nilai peluang p (<1%, yang berarti sangat signifikan). 4. Rumusan hipotesis alternatif (yaitu korelasi tidak sama dengan 0) 5. Interval keyakinan 95% dari korelasi populasi yaitu [0,73; 0,88]. 6. Korelasi sampel (cor), yaitu 0,82 yang secara manual pada prinsipnya dapat dihitung dengan menggunakan rumus pada persamaan Pers. 7.1. Dari hasil uji dapat disimpulkan bahwa nilai korelasi kedua peubah tersebut adalah 0,82. Hasil ini sangat signifikan (p-value < 2.2e-16). Interval keyakinan 95% korelasi populasi adalah 0,73 r 0,88.
Koefisien korelasi hanya mengukur derajat asosiasi asosiasi dua peubah acak, yaitu menjelaskan tren umum apakah kenaikan atau penurunan nilai pada salah satu peubah akan diikuti dengan kenaikan atau penurunan pada nilai peubah yang lain. Analisis korelasi belum bisa dijadikan alat untuk memprediksi nilai suatu peubah apabila nilai peubah yang lain diketahui. Jika kepentingannya adalah untuk memprediksi nilai suatu peubah berdasarkan nilai peubah yang lain, maka harus dilakukan uji regresi.

7.2 ANALISIS REGRESI SEDERHANA


Jika dalam analisis korelasi peneliti hanya tertarik pada derajat asosiasi atau kecenderungan umum dua buah peubah atau lebih, maka dalam analisis regresi peneliti ingin memperoleh hubungan fungsional antara dua peubah yang dinyatakan dalam bentuk Y = a + bX , yang merupakan penduga dari fungsi yang ada pada populasi yang biasa dinotasikan dengan Y = + X , atau Y = 0 + 1 X ,

atau

untuk

peubah

bebas

lebih

dari

satu

dinyatakan

sebagai

Y = 0 + 1 X 1 + 2 X 2 ,... Melalui analisis regresi peneliti ingin menghitung nilai


188 ANALISISKORELASIDANREGRESI

penduga untuk j yang sesuai dengan data. Selain melakukan penghitungan nilai penduga untuk j juga sekaligus melakukan uji apakah nilainya signifikan atau dapat diabaikan (tidak signifikan). Analisis regresi sederhana hanya terdiri atas satu peubah bebas (peubah penjelas/eksplanatori) X dan satu peubah terikat (respon) Y dengan hubungan linier. Kedua peubah ini merupakan peubah kuantitatif, khusus untuk Y harus dengan skala interval atau rasio. Dengan visualisasi secara geometris (lihat Gambar 7.9) dapat ditafsirkan bahwa dengan analisis regresi kita ingin menduga garis populasi yang sesungguhnya tidak pernah diketahui (garis lurus putus-putus) berdasarkan sampel pasangan data pada sampel. Persoalanvini merupakan persoalan estimasi uji inferensi daam regresi. Garis regresi penduga ini dapat dipergunakan untuk meramal (prediksi) rentang rata-rata nilai Y pada saat nilai X diketahui, demikian juga rentang nilai-nilai Y pada saat nilai tertentu dari X .Persoalan yang terakhirt ini merupakan persoalan prediksi dalam regresi

AnalisisRegresiSederhana

189

Diagram Pencar & Sabuk Keyakinan


150 y 0 0 50 100

10 x

15

20

25

Gambar 7.4

Ilustrasi Garis regresi populasi, regresi penduga dengan sabuk keyakinannya.

7.2.1

ESTIMASI DAN UJI INFERENSI PARAMETER REGRESI

Pendugan dengan metode statistika selain menghasilkan dugaan (garis lurus langsung), juga menghasilkan batas

berupa garis

simpangan garis secara

keseluruhan yang membentuk sabuk keyakinan. Secara umum, pendugaan termasuk baik, jika garis populasi masih berada didalam batas sabuk keyakinan yang terbentuk. Secara geometris, kita mencari garis yang menjadi penduga garis regresi populasi, adalah garis yang paling mewakili sebaran data yang kita miliki.
190 ANALISISKORELASIDANREGRESI

Garis yang paling mewakili adalah garis lurus sedemikian sehingga simpangan titik-titik data terhadap garis menjadi minimum. Salah satu cara menentukan penduga garis ini adalah dengan metode kuadrat terkecil yang pada dasarnya meminumkan bentuk kuadrat Q = ei2 = [ y ( 0 + 1 xi ) ] ,
2

terhadap parameter j untuk

j=1,2. Dengan kata lain kita mencari 0 , 1

sedemikian sehingga Pers. 7.2 memcapai nilai minimum. see = y 0 + 1 xi i =1


n

Pers. 7.2

Penurunan secara matematus menghasilkan Pers. 7.3

0 = y 1 x ,

Pers. 7.4

1 =

x y
i =1 i n

1/ n xi yi
i =1 i =1 n 2

x 1/ n xi i =1 i =1
2 i

Pers. 7.5 dengan

1 =

s xy s xx

Pers. 7.6

s xy = xi yi
i =1

xi yi
i =1 i =1

n xi n 2 , s xx = xi i =1 n i =1

Jika rumus pada Pers. 7.4 dikaitkan dengan rumus pada Pers. 8.1, maka dengan pengetahuan matematika yang mencukupi dapat ditunjukkan bahwa
Pers. 7.7

1 = rxy

sx , dengan s x = s xx ; s y = s yy sy

AnalisisRegresiSederhana

191

Oleh karena sx dan sy adalah nonnegatif, 8.3 diperoleh hubungan

maka tanda tanda koefisien regresi

(positif atau negatif) sama dengan koefisien korelasi. Selanjutnya dari Pers. 8.2 dan

see = s yy 1s xy ,

n yi n 2 dengan s yy = yi i =1 . n i =1 Selanjutnya penduga ragam populasi


Pers. 7.8

2 = s2 =

see . n2

Hal ini dijadikan dasar perhitungan kesalahan baku untukpenduga koefisien regresi dengan memperhatikan bahwa: 1. Y adalah peubah acak dengan ragam 2 , sementara X bukanlah peubah acak, dan. 2. var( ay + c ) = a 2 var( y ) untuk a dan c konstanta, maka kesalahan baku masingmasing penduga adalah
= s2 1 s2 x2 2 21 = + ,dan s s 0 s xx n s xx ) dan 0 / s 0 masing-masing menghasilkan distribusi t dengan

Pers. 7.9

3. rasio

1 / s 1

derajat kebebasan (n-2). 4. Sedangkan uji keseluruhan F = s xx menghasilkan distribusi F dengan see /( n 2)

2 derajat kebebasan (1,n-2). Secara praktis F diperoleh dari t 1

192

ANALISISKORELASIDANREGRESI

Selain melalui uji, kemanfaatan garis regresi yang diperoleh juga dilihat dari besarnya koefisien determinasi (kuadrat korelasi). Garis regresi akan semakin baik, jika nilai koefisien determinasinya mendekati 1. Dalam buku ini pembahasan lebih difokuskan pada interpretasi hasil perhitungan dengan menggunakan komputer. Prosedur pengujian analisis regresi sederhana adalah seperti berikut ini. 1. Rumusan Tujuan Untuk menguji apakah ada hubungan atau hubungan linier signifikan antara ) ) ) ) dua peubah yang ditunjukkan oleh Y = a + bX = + X = 0 + 1 X . 2. Asumsi a. Data peubah respons Y bedistribusi Normal dengan ragam konstan b. Sisa (residu), yaitu selisih antara data asli dengan garis regresi

berdistribusi normal dengan nilai-tengah nol dan ragam konstan. c. Hubungan antara peubah X dan Y bersifat linier. 3. Rumusan Hipotesis untuk masing-masing koefisien a. Hipotesis nihil Ho: semua koefisien koefisien regresi sama dengan 0. b. Ha untuk uji dua arah (two tails test) Ha: Tidak semua semua koefisien regresi sama dengan 0. 4. Rumusan Hipotesis untuk uji keseluruhan a. Hipotesis nihil Garis regresi yang diperoleh tidak signifikan b. Hipotesis alternatif

AnalisisRegresiSederhana

193

Garis regresi yang diperoleh signifikan 5. Rumus Manual (lihat persamaan-persamaan sebelumnya) 6. Kriteria a. Uji masing-masing koefisien dilakukan dengan melihat nilai tmasingmasing koefisien atau berdasarkanb p-value-nya. Berdasarkan nilai kritis
,

tn 2, / 2

untuk hipotesis dua arah, Ho ditolak jika dan hanya jika

| thitung | tn 2, / 2 . Sedangkan berdasarkan nilai p (p-value), Ho ditolak


dan Ha diterima jika p-value < 5%. Perhatikan bahwa nilai p berubah

sesuai jenis hipotesis alternatif yang dipilih (satu atau dua arah). Kriteria ini yang banyak diimplemantasikan pada paket-paket statistika. b. Uji keseluruhan dengan melihat nilaistatistik F dan menolak Ho Secara grafis, contoh sebaran data asli dan sisa yang ideal memenuhi asumsi dapat dilihat pada Gambar menyebar dengan 7.5. Pada gambar tersebut terlihat bahwa data dan sisa

lebar dari kiri ke kanan relatif sama (ragam konstan) dan

mengikuti garis lurus.


Sebaran Data Asli
10

Sisa

60

50

sisa

40

30

10

15

20 x

25

30

-10

-5

30

40 pred

50

60

Gambar 7.5 Diagram Pencar Data Asli (sebelah kiri) dan Sisa (sebelah kanan)

Contoh 7.2

Jika data pada Contoh 7.1 diteruskan dengan perhitungan koefisien regresi maka akan diperoleh
194 ANALISISKORELASIDANREGRESI

1 =
=

x y
i

1/ n xi yi
2

xi2 1/ n ( xi )

291 1/10 72 38 17,4 = =0,48 2 41,6 560-72 /10

Sementara itu,

0 = 1/ n yi

xi n = 3,8 0, 42 7, 2 = 0,788

Hasil yang sama diperoleh dengan menggunakan RCommander. Dialog analisis regresi sederhana dengan RCommander dapat dilihat pada Gambar 7.6.

Gambar 7.6 Dialog regresi linier sederhana untuk peubah NFis dan NMat

Contoh 7.3

Berikut adalah uji regresi untuk peubah NFis (Y) dan NMat (X) dari DataSim. Dialog untuk peubah ini dapat dilihat pada Gambar 7.6. Keluaran dari program tersebut adalah seperti berikut ini. Keluaran tersebut diberi nomor untuk

memudahkan penjelasan.
1. Call: AnalisisRegresiSederhana 195

lm(formula = NFis ~ NMat, data = DataSim) 2. Residuals: Min -29.4726 1Q -2.6436 Median -0.5996 3Q 1.0129 Max 34.2166

3. Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) NMat --4. Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 8.55473 0.83811 5.12003 0.06741 1.671 12.432 0.0988 . <2e-16 ***

5. Residual standard error: 7.175 on 78 degrees of freedom 6. Multiple R-Squared: 0.6646, Adjusted R-squared: 0.6603 p-value: < 2.2e-16

7. F-statistic: 154.6 on 1 and 78 DF,

Keterangan keluaran 1. Nama fungsi linier model (lm) R yang dipanggil, dengan data dan peubah terkait. Pada contoh di atas data diambil dari DataSim dengan bentuk model NFis=f(NMat), yaitu peubah respons adalah NFis dan peubah penjelas adalah NMat. Dalam konteks ini peneliti ingin memperoleh hubungan fungsional antara Nilai Ujian Fisika dengan Nilai Ujian Matematika. 2. Sebaran (statistik ringkas) dari kesalahan (sisa), yaitu penyimpangan antara dugaan garis regresi dengan data.Sisa ini secara teoritis harus berpusat di 0 simetris dan dengan ragam konstan. 3. Hasil pendugaan koefisien dan uji signifikansinya. Pada contoh di atas diperoleh:
196 ANALISISKORELASIDANREGRESI

a. intercept (titk potong/konstanta) a=8,55 dengan nilai p = 0,099. Angka ini menunjukkan bahwa konstanta regresi tidak signifikan. Walaupun nilainya cukup besar (8,55) tetapi secara statistik dapat diabaikan. Dengan kata lain model yang lebih tepat adalah model Y=bX. Ini juga menunjukkan bahwa pada saat tingkat nilai X=0, maka Y juga cenderung 0. Namun kusus untuk uji konstanta (intercept), nilai 0,09% dapat dianggap sebagai nilai marjinal (dekat dengan 5%),oleh karena itu konstanta cenderung dibiarkan pada model. b. Koefisien regresi untuk peubah NMat, b,besarnya 0,83 dengan nilai p <2e-16. Ini menunjukkan bahwa koefisien ini sangat signifikan

(walaupun secara matematis nominalnya jauh lebih kecil dibanding konstanta). Pada perhitungan ini dapat dilihat bahwa c. t0 = 1, 67 = Estimate = 8,55 Std .Error = 5,12

d.

t 1 = 12, 43 =

Estimate = 0,83 Std . Error = 0,067

4. Tingkat signifikansi yang diperoleh (0%, 0,1%, 1%, 5%, 10% dan 100%) 5. Kesalahan baku dari sisa dan derajat kebebasannya (besarnya n-2). 6. Koefisien determinasi asli dan koefisien determinasi yang telah disesuaikan. Koefisien determinasi yang baik adalah yang mendekati 1. Semakin mendekati 1, semakin baik. Koefisien determinasi yang rendah menunjukkan banyak data yang pemyebar jauh dari garis regresi. Besarnya koefisien determinasi berbanding terbalik dengan besarnya kesalahan baku sisa. Jika kesalahan baku besar, koefisien determinasi cenderung kecil (Lihat contoh keluaran berikutnya).

AnalisisRegresiSederhana

197

7. Uji signifikansi garis regresi secara keseluruhan yang menggunakan uji F


2 menghasilkan F=154,6 = (12,432)2 = t pada derajat kebebasan (1 dan n-2). 1

Pada contoh ini hasilnya signifikan (p-value: < 2.2e-16). Contoh di atas menunjukkan bahwa secara keseluruhan uji regresi menunjukkan hasil yang signifikan (ada hubungan signifikan antara nilai Fisika dan Matematika), tetapi hubungan yang diperoleh tidak cukup baik dipergunakan untuk prediksi karena koefisien determinasinya relatif rendah (0,66). Ini menunjukkan bahwa banyak nilai yang menyebar jauh dari garis regresi seperti ditunjukkan oleh diagram pencar pada Gambar 7.7.

NFis

50 50

60

70

80

90

60

70 NMat

80

90

Gambar 7.7

Diagram Pencar Data NMat dan Nfis dengan koefisien determinasi relatif rendah

198

ANALISISKORELASIDANREGRESI

Contoh 7.4

Pada contoh berikut ini diberikan ilustrasi hasil analisis regresi antara peubah Y dan X, dengan hasil yang signifikan baik pada koefisien maupun konstantanya serta dengan koefisien determinasi yang lebih tinggi.
Residuals: Min 1Q Median 3Q 0.696098 Max 3.630627

-1.927959 -0.797888 -0.003435

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 4.93500 -2.00117 1.76506 2.796 0.00742 ** < 2e-16 ***

0.03575 -55.973

Residual standard error: 1.083 on 48 degrees of freedom Multiple R-Squared: 0.9849, F-statistic: Adjusted R-squared: 0.9846 p-value: < 2.2e-16

3133 on 1 and 48 DF,

Hasil di atas menunjukkan bahwa uji regresi sangat

signifikan, baik untuk

konstanta maupun koefisien regresinya (semua nilai-p nya kurang dari 1%) demikian juga uji keseluruhan menggunakan uji F. Model yang diperoleh juga dapat digunakan untuk prediksi dengan baik dengan koefisien determinasi yang besar (0,98) dan kesalahan baku yang relatif kecil (1,08). Ini menunjukkan bahwa hubungan kedua peubah hampir sempurna dan sebaran datanya tidak jauh dari garis regresi, seperti ditunjukkan oleh diagram pencar pada Gambar 7.8.

AnalisisRegresiSederhana

199

y1

-110

-100

-90

-80

40

45 x

50

55

Gambar 7.8 Diagram Pencar X dan Y

7.2.2

PREDIKSI DALAM REGRESI

Setelah mendapat penduga regresi yang signifikan, yang ditunjukkan oleh adanya uji signifikansi secara keseluruhan, selanjutnya kita dapat menggunakan hasik tersebut untuk kepentingan prediksi nilai Y atau rata-rata Y pada saat nilai X tertentu (misalnya x). Sebagaimana telah disebutkan sebelumnya, prediksi ini akan bermanfaat atau lebih akurat apabila koefisien deterministiknya cukup besar (mendekati 1) yang berarti data menyebar secara homogin dekat dengan garis regresi. Secara umum ada dua jenis prediksi yang dapat dilakukan, seperti berikut ini: 1. Prediksi nilai rata-rata Y pada saat nilai X tertentu, misalnya xp. 2. Prediksi nilai Y pada saat nilai X tertentu. Prediksi di atas pada dasarnya adalah penduga interval dengan nilai penduga titik = 0 + 1 x . Kesalahan baku dari keduanya adalah sebagai berikut y
2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s s = see + + s xx n s xx n
2 y

Pers. 7.10

200

ANALISISKORELASIDANREGRESI

Pers. 7.11

2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s 1 + + s = see 1 + + s xx n s xx n 2 $ y

Kedua prediksi di atas berbeda dalam lebar interval dugaan karena penduga ratarata dan penduga nilai tunggal nilai Y memiliki kasalahan baku yang berbeda.

Dengan

seseorang

dapat

menghitung

prediksi

tersebut

sekaligus

mengilustrasikannya dalam bentuk grafik seperti pada Gambar 7.9. Pada gambar tersebut prediksi dilakukan pada saat nilai X sama dengan rata-rata X, yaitu
x =12,5. Pada saat itu nilai penduga titiknya adalah 67,66 (10,76 + 4,55x ) dengan

penduga interval 95% untuk rata-rata y |x =12,5 adalah [62,13; 73,18] dan interval

penduga 95% dari y |x =12,5 adalah [28,18; 107,10]

AnalisisRegresiSederhana

201

Diagram Pencar & Sabuk Keyakinan


150

100

Batas interval rata-rata Y Batas interval Y

y 0 0 50

10 x

15

20

25

Gambar 7.9

Ilustrasi Garis regresi populasi, regresi prediksi nilaiY dan ratarata Y pada saat nilai tertentu dari X dengan interval keyakinannya.

7.3 MODEL LINIER: REGRESI PEUBAH GANDA


RCommander menyediakan menu untuk analisis regresi dengan model yang lebih kompleks yaitu model dengan lebih dari satu peubah bebas (penjelas) baik berupa peubah kuantitatif maupun faktor (seperti jenis kelamin atau pengelompokan lain dalam populasi). Dialog untuk model linier diberikan pada Gambar 7.10. Dalam dialog itu ada beberapa hal yang harus diperhatikan yaitu:

202

ANALISISKORELASIDANREGRESI

1. Nama model yang terisi secara otomatis sesuai jenis regresi yang dipanggil (linier model, GLM dan sebagainya) 2. Nama-nama peubah (dengan jenisnya). Kita bisa mengetahui peubah yang berupa kuantitatif maupun faktor. meng-klik. 3. Rumusan formula model. Model dalam R dinyatakan dalam bentuk Y=f(X1,X2,...) dengan Y adalah peubah respons dan Xi adalah peubah bebas. Secara umum untuk peubah kuantitatif penambahan beberapa peubah kuantitatif dinyatakan dengan tanda +, misalnya X1+X2. Peubah-peubah ini bisa dipilih dengan

Gambar 7.10 Dialog Model Linier

Hasil analisis regresi dengan banyak peubah pada dasarnya sama dengan hasil analisis sebelumnya hanya koefisien yang diestimasi lebih banyak yaitu konstanta dan koefisien masing-masing peubah bebas. Berikut adalah contoh keluaran analisis regresi untuk dua peubah bebas NMat dan NIng terhadap NFis. Misalkan kita ingin menguji hubungan NFis = 0 + 1 NMat + 2 NIng . Dalam Formula dituliskan

ModelLinier:RegresiPeubahGanda

203

NFis ~ NMat + NIng Keluaran yang dihasilkan adalah seperti berikut ini.
Call: lm(formula = NFis ~ NMat + NIng, data = DataSim)

Residuals: Min -29.0987 1Q -2.9626 Median -0.4881 3Q 1.7663 Max 32.4172

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) NMat NIng --Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 1.67825 0.81235 0.10519 7.07947 0.06950 0.07528 0.237 11.689 1.397 0.813 <2e-16 *** 0.166

Eksplorasi lebih jauh

1. Aktifkan salah satu data yang ada pada Ratau yang ada pada CD (format excel) 2. Lakukan uji regresi baik dengan 1 atau lebih peubah penjelas. 3. Periksa nilai pengujian masing-masing koefisien 4. Periksa nilai pengujian secara keseluruhan 5. Periksa nilai koefisien determinasinya 6. Jelaskankesimpulan anda terhadaphasil pengujian yang dilakukan.
204 ANALISISKORELASIDANREGRESI

7.4 DIAGNOSTIK MODEL MELALUI GRAFIK


Pemeriksaan terhadap kecocokan analisis regresi dengan kondisi data yang dianalisis disebut diagnostik model. Salah satu cara mendiagnostik model adalah dengan melihat sebaran sisa (residu). Residu atau sisa adalah selisih antara nilai observasi (observed value) dengan nilai dugaan yang diperoleh melalui garis regresi (predicted value). Residu ini merupakan penduga dari kesalahan atau error. Secara geometris, sebenarnya pencaran residu ini sama dengan pencaran data hanya sumbu X nya ditransformasi berimpit dengan garis regresi. Seperti telah disampaikan sebelumnya bahwa asumsi ideal untuk analisis regresi linier adalah bahwa sisa menyebar normal dengan rata-rata 0 dan ragam konstan. Syarat kekonstanan varians ditunjukkan oleh adanya sebaran merata sehingga lebar sebaran dari kiri ke kanan relatif konstan. Adanya ketidak konstanan ragam

ditandai dengan lebar sebaran yang tidak sama dari kiri ke kanan. Data yang mempunyai ragam konstan disebut bersifat homoskedastik sebaliknya disebut bersifat heteroskedastik. Pemeriksaan model dengan RCommander dapat

dilakukan dengan memilih menu model dan opsi grafik pada plot diagnostik dasar seperti terlihat pada Gambar 7.11 Diagnostik grafik ini menampilkan empat grafik dasar seperti berikut ini. 1. Grafik Nilai prediksi dengan sisa. Grafik ini menggambarkan hubungan antara garis regresi yang diperoleh dengan sisa. Secara umum sebaran sisa harus menunjukkan sebaran acak disekitar nilai nol dengan lebar yang relatif sama. Apabila sebaran menunjukkan pola tertentu (misalnya membentuk kurva, lebar tidak konstan), ini mengindikasikan bahwa model yang dipilih kurang baik.

DiagnostikModelMelaluiGrafik

205

Gambar 7.11 Menu dan Dialog Diagnostik Grafik

2. QQPlot Normal dari sisa yang telah dibakukan. QQ-Plot Normal pada dasarnya adalah grak yang mennyajikan sebaran quantil normal teoritis, dengan quantil data. Apabila datanya berdistribusi normal maka sebarannya akan mendekati garis lurus. Penyimpangan yang sangat mencolok pada ujung-ujung grak menunjukkan datanya menyimpang dari distribusi normal. Untuk data yang tidakmemenuhi distribusi normal dapatdilakukan transformasi ataupun dengan memilih alternatifregresi yang lain. 3. Grafik Nilai Prediksidengan akar Sisa baku. Penafsirannya sama dengan grafik pertama, hanya yang diperiksa sekarang adalah sisa yang telah dibakukan (standarized residual). 4. Grafik leverage terhadap sisa baku. Dalam grafik ini juga digambarkan batas jarak Cook (Cooks distance) untuk memeriksa adanya pencilan (outlier). Jika ada nilai residu yang berada di luar batas jarak, ini mengindikasikan adanya pencilan. Perlu diadakan pemeriksaan terhadap pencatatan dataapakah ada kesalahan pencatatan atau tidak. Jika pencilan tidak banyak (1-2 observasi), dapat dipertimbangkan mengecualikan observasi tersebut dalam analisis regresi.

206

ANALISISKORELASIDANREGRESI

Standardized residuals

Residuals vs Fitted
4
50

Normal Q-Q
2
50

Residuals

-6 -4 -2 0

22 43

-3 -2 -1 0

22 43

30

40

50

60

-2

-1

Fitted values

Theoretical Quantiles

Standardized residuals

1.5

43 50 22

Standardized residuals

Scale-Location

Residuals vs Leverage
59 20

1.0

0.5

-1 0

0.0

-3

Cook's distance 0.00 0.02 0.04

43

0.5

30

40

50

60

0.06

0.08

Fitted values

Leverage

Gambar 7.12

Grafik Diagnostik untuk Model Regresi yang relatif memenuhi syarat kenormalan dan bebas dari pencilan.

DiagnostikModelMelaluiGrafik

207

lm(y ~ x)
Standardized residuals

Residuals vs Fitted
60
13 3

Normal Q-Q
2 4
13 3

Residuals

-60 -20 20

-4

20

0
20

35

40

45

50

55

-2

-1

Fitted values

Theoretical Quantiles

Standardized residuals

2.0

1.0

0 2 4

13

3 20

Standardized residuals

Scale-Location

Residuals vs Leverage
3 13 1 0.5

0.0

Cook's distance 20 0.00 0.02 0.04 0.06

0.5 1

35

40

45

50

55

-4

0.08

Fitted values

Leverage

Gambar 7.13

Grafik Diagnostik untuk Model Regresi yang kurang memenuhi syarat kenormalan dan mengandung pencilan

Ada beberapa kondisi data yang menyimpang dari asumsi yang menjadi persyaratan analisis regresi seperti berikut ini. 1. Hubungan antara respon dengan peubah penjelas tidak linier. Kondisi ini dapat ditangani dengan melakukan transformasi pada peubah respon maupun pada peubah penjelas,lalu menganalisis data yang telah ditransformasi sehingga model yang dipergunakan tidak lagi sederhana seperti Y = 0 + 1 X , tetapi

208

ANALISISKORELASIDANREGRESI

model

yang

telah

ditransformasi

seperti

log(Y ) = 0 + 1 X

atau

Y = 0 + 1 log( X ) dan sejenisnya. 2. Respon tidak menyebar normal, termasuk adanya pencilan maupun hasil pengamatan ekstrim. Terhadap kondisi ini cara sederhana untuk menanganinya adalah dengan mencoba analisis tanpa mengikut sertakan pencilan (terutama kalau pencilannya hanya 1-2 pengamatan). Tentang persyaratan normal, secar emperik telah dibuktikan oleh para praktisi melalui simulasi bahwa dampak akibat penyimpangan terhadap distribusi normal tidak seserius seperti yang dikhawatirkan (Stafsof [22]). 3. Respon menyebar dengan ragam tidak konstan. Jika respon tidak homogen tetapi masih memenuhi distribusi normal, kondisi ini dapat ditangani dengan memberikan pembobotan (dengan invers ragam) pada perhitungan estimasi parameter. Metode ini disebut wighted least square yang secara umum telah diimplementasikan pada paket-paket program statistika. 4. Untuk peubah penjelas lebih dari satu, terjadi korelasi signifikan di antara beberapa peubah penjelas. Kondisi ini sering disebut multi kolinieritas. Hal ini akan berakibat pada kurang akuratnya hasil estimasi parameter, karena dalam perhitungannya akan melibatkan matriks yang mendekati singuler sehingga inversnya sulit dihitung. Cara sederhana menangani kondisi ini adalah dengan memilih hanya salahsatu dari peubah-peubah penjelas yang memiliki korelasi tinggi. Misalnya jika ternyata peubah X1, X3, dan X4 berkorelasi signifikan, maka cukup salah satu saja yang dimasukkan ke dalam model regresi.

Contoh 7.5

Dalam contoh berikut diilustrasikan analisis regresi dengan 1-2 nilai pencilan. Analisis regresi dilakukan dua kali dengan mengikutsertakan seluruh data dan mengecualikan data pencilan. Dapat kita lihat adanya perubahan signifikan dari hasil kedua analisis tersebut.

DiagnostikModelMelaluiGrafik

209

Berikut adalah contoh Analisis regresi dengan data yang mengandung satu pencilan. Data dianalisis dua kali msing-masing dengan menyertakan dan mengabaikan pengamatan pencilan tersebut. 1. Analisis data lengkap yang mengandung pencilan
Call: lm(formula = y1 ~ x1, data = DataSimReg)

Residuals: Min -17.842 1Q -5.810 Median -1.492 3Q 2.713 Max 86.675

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x1 --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 31.3226 2.6286 14.0512 0.2769 2.229 0.0318 *

9.492 1.43e-11 ***

Residual standard error: 15.6 on 38 degrees of freedom Multiple R-Squared: 0.7033, Adjusted R-squared: 0.6955 F-statistic: 90.09 on 1 and 38 DF, p-value: 1.426e-11

210

ANALISISKORELASIDANREGRESI

2. Hasil analisis dengan mengecualikan pengamatan yang menjadi pencilan. Pada analisis ini data pencilan dikeluarkan dari analisis (dianggap munculnya pencilan sebagai akibat kesalahan pencatatan data).
Call: lm(formula = y1 ~ x1, data = DataSimReg)

Residuals: Min 1Q Median 0.5353 3Q Max

-9.1295 -3.9094

3.4954 10.4447

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) x1 --Signif. codes: 1 0 *** 0.001 ** 0.01 * 0.05 . 0.1 6.36779 3.08027 4.74300 0.09286 1.343 33.171 0.188 <2e-16 ***

Residual standard error: 5.037 on 37 degrees of freedom (1 observation deleted due to missingness) Multiple R-Squared: 0.9675, Adjusted R-squared: 0.9666 F-statistic: 1100 on 1 and 37 DF, p-value: < 2.2e-16

Ringkasan keduanya adalah sebagaimana disajikan dalam berikut (Diagram pencar diberikan pada Gambar 7.14)
No Komponen Data Lengkap Mengecualikan

DiagnostikModelMelaluiGrafik

211

Pencilan*)

1 2

df Koefisien Konstanta Koefisien X1

38

37

31,32 2,62 0,70

6,36 3,08 0,97

Koef Determinasi

Catatan : *) Dalam analisis ini, Satu observasi diabaikan dan dianggap hilang (yaitu data yang merupakan pencilan), sehingga derajat kebebasan berkurang satu.

220

200

180

160

y1

140

120

100

100 30

120

140

160

y1

180

200

220

30

40

50 x1

60

70

40

50 x1

60

70

Gambar 7.14

Diagram Pencar untuk Data Lengkap (kiri)dan untuk Data tanpa Pengamatan yang Dianggap Pencilan

Jika model memiliki residu yang menunjukkan adanya penyimpangan dari syarat yang harus dipenuhi, maka sebaiknya
212

dilakukan perbaikan model sehingga


ANALISISKORELASIDANREGRESI

persyaratan tersebut menjadi relatif terpenuhi. Salah satu yang biasanya dilakukan adalah dengan mentransformasikan data dengan suatu fungsi yang sesuai. Selanjutnya data hasil transformasi ini dianalisis dengan regresi klasik yang menggunakan asumsi distribusi normal dengan hubangan linier.

7.5 ANALISIS REGRESI ALTERNATIF


Dalam kenyataannya,tidak semua data yang dihadapi memenuhi asumsi regresi linier dengan baik. Selain melakukan hal-hal praktis seperti dianjurkan sebelumnya (misalnya membuang pengamatan, tidak menyertakan beubah), kita dapat juga melakukan hal lain yang lebih matematis, misalnya mentransformasikan data, atau memilih alternatif regresi yang tergolong dalam regresi modern.
7.5.1 TRANSFORMSI DATA

Jika sebaran residu menunjukkan ketidaklinieran, transformasi yang bisa dilakukan untuk mengatasi ketidak linieran diantaranya adalah seperti berikut ini.

AnalisisRegresiAlternatif

213

1. Jika sebaran membentuk kurva naik dan terbuka ke atas maka transformasi dapat dilakukan pada Y dan tranformasi yang bisa dicoba adalah Y1 = log(Y ) atau Y1 =Y atau Y1 =1/Y seperti terlihat pada Gambar 7.15.

120

140

100

log(y) 5 6 7 x 8 9 10

80

40

60

20

3.0 5

3.5

4.0

4.5

5.0

7 x

9 10

Gambar 7.15 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada Y

214

ANALISISKORELASIDANREGRESI

2. Jika sebaran membentuk kurva naik dan terbuka kebawah maka transformasi dilakukan pada X dan transformasi yang bisa dicoba adalah X1 = log(X) atau X1 = X atau X1 =1/X seperti terlihat pada Gambar 7.16

65

60

55

50

45

200

600 x

45 4.5

50

55

60

65

5.5 log(x)

6.5

Gambar 7.16 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X

AnalisisRegresiAlternatif

215

3. Jika residu menyebar membentuk kurva menurun dan terbuka keatas maka transformasi dapat dilakukan pada kedua X atau Y dengan salah satu

transformasi sebelumnya seperti pada Gambar 7.17.

70

60

50

y 0 400 x 800

40

30

30 3

40

50

60

70

5 log(x)

Gambar

7.17 Residu Data Asli dan Residu setelah Ditransformasi Logaritma pada X

Selain masalah keliniearan, masalah yang sering muncul dalam analisis regresi

adalah ketidak seragaman sebaran atau ragam data. Untuk menyeragamkan atau menghomoginkan varians, dapat dicoba beberapa transformasi diantaranya Y1 = log(Y), atau Y1 =Y atau Y1 =1/Y . Gambar 7.18 mengilustrasikan data asli yang

216

ANALISISKORELASIDANREGRESI

ragamnya tidakhomogin dan setelah melalui transformasi ragamnya menjadi homogin.

Plot Data Asli


150 80

Plot Residu

100

Residu 10 20 30 X 40 50

50

-40

20

40

60

40

60 Y-Prediksi

80

100

Plot Data Transformasi


5.0

Plot Residu

4.5

Residu 10 20 30 X 40 50

log(Y)

4.0

3.5

3.0

-1.0 3.4

-0.5

0.0

0.5

3.6

3.8

4.0

4.2

4.4

4.6

4.8

Y-Prediksi

Gambar 7.18Transformasi untuk Menghomoginkan Ragams

Pada dasarnya transformasi data dilakukan agar data yang tidak memenuhi peryaratan asumsi (kelinieran dan homoginitas varians)menjadi memenuhiasumsi dan dapat dianalisis dengan metode regresi klasik, Namun, ada kalanya transformasi untuk menangasi satu permasalahan (misalnya kelinieran), justru mendatangkan persoalan baru (misalnya ketidak seragaman varians), seperti diilustrasikan pada Gambar 7.19.

AnalisisRegresiAlternatif

217

Plot Data Asli


1000 1500 2000 2500

Plot Residu

Residu 20 30 X 40 50

500

-100

100

200

500

1000 Y-Prediksi

1500

2000

Plot Data Transformasi


7.5 0.02

Plot Residu

7.0

Residu 2.6 2.8 3.0 3.2 log(X) 3.4 3.6 3.8

log(Y)

6.5

5.5

6.0

5.0

-0.01 5.0

0.0

0.01

5.5

6.0

6.5 Y-Prediksi

7.0

7.5

Gambar 7.19 Transformasi kelinieran menyebabkan ketidakhomoginan ragam

7.5.2

PENGANTAR REGRESI ALTERNATIF

Ada beberapa kondisi yang menyimpang atau lebih kompleks dari asumsi yang diperlukan untuk dapat melakukan analisis dengan regresi sederhana diantaranya: 1. Data mengandung peubah faktor/kualitatif dan kita ingin mengetahui apakah faktor tersebut mempengaruhi hubungan antara peubah kuantitatif lainnya. Misalnya apakah hubungan antara jumlah penghasilan dan jumlah pengeluaran konsumtif dipengaruhi oleh jenis kelamin atau pendidikan. Untuk melakukan analisis regresi seperti ini, secara teoritis kita dapat memperkenalkan peubah boneka (dummy variabel) yang dapat dilihat pada Neter etal. [20], Wonnacott & Wonnacott [35]. Aplikasi dengan R dapat dilihat pada Chamber & Hastie [2], Vanables & Ripley [32] 2. Terjadi pencilan yang cukupsignifikan mempengaruhi hasil analisis. Untuk data dengan pencilan yang
218

pencilannya tidak mungkin dibuang begitu saja,ada


ANALISISKORELASIDANREGRESI

analisis regresi yang disebut regresi tegar (robust regression) yangdapat mengurangi pengaruh adanyapencilan (lihat Venables & Ripley [32] 3. Respon berupa skala interval atau ordinal misalnya jumlah anak, jumlah istri atau jumlah kendaraan roda empat yang dimiliki, lulus-gagal, jenis merek barang yang banyak dipilih dan sejenisnya. Analisis regresi jenis ini termasuk dalam model linier tergeneralisir atau lebih dikenal dengan GLM (Generalized Linear Models). Analisis lain yang termasuk dalamkelompokinidiantaranya adalah Regresi logistik atau analisis Probit/Logit (untuk respon dengan distribusi Binomial atau bersekala nominal) dan log-linier untuk respon dengan distribusi Poison atau bersekala ordinal). Referensi untuk model linier ini diantaranya adalah McCullagh & Nelder [15], Chamber & Hastie [2], Vaeables & Ripley [32]. 4. Respon berupa peubah ganda, misalnya dalam eksperimen yang diamati

dampak lebih dari satu perlakuan (misalnya satu unit percobaan mendapat tiga atau lebih perlakuan) atau pengaruh satu perlakuan dilihat dalam lebih dari dua kurun waktu. (misalnya hubungan tekanan darah dan kolesterol yang diamati pada pagi, siang, dan sore hari. Percobaan seperti ini sering disebut pengukuran berulang (repeated meassure) atau studi jangka panjang (longoitudinal study). Salah satu analisis regresi atau model linier yang banyak dipakai untuk ini adalah GEE (generalized estimating equations) yang dipelopori oleh Liang & Zeger [13], [36] dan Diggle et al.[3] 5. Terjadi korelasi yang signifikan (multi kolinieritas) diantara peubah penjelas. Multi kolinieritas ini akan berakibat sulitnyamenghitung invers matriks yang diuperlukan dalam menghitung estimasi parameter. Selain menghilangkan dari model peubah yang berkorelasi, kondisi ini dapat juga ditangani melalui beberapa jenis analisi regresi diantaranya adalah regresi gulud (Ridge regression) Neter et al.[20], atau menggabungkan regresi dengan analisis komponen utama

AnalisisRegresiAlternatif

219

7.6 RINGKASAN DAN BACAAN LEBIH LANJUT


7.6.1 RINGKASAN

1. Korelasi dan regresi merupakan dua analisis yang saling terkait. Analisis korelasi hanya mempelajari derajat asosiasi antara beberapa peubah sedangkan analisis regresi mempelajari fungsi atau model hubungan antara beberapa peubah yang diperlukan untuk memprediksi nilai suatu peubah bila nilai peubah lain diketahui. 2. Kondisi hubungan dua peubah, secara kasar dapat dilihat melalui diagram pencar. Pada diagram pencar data harus menyebar secara acak dengan kecenderungan membentuk garis lurus. 3. Koefisien determinasi adalah kuadrat dari koefisien korelasi. Model dengan koefisien determinasi tinggi (mendekati 1) menunjukkan data menyebar dekat dengan garis regresi, karenanya model yang diperoleh bermanfaat dalam melakukan prediksi.
7.6.2 BACAAN LEBIH JAUH

Analisis regresi atau modellinier telah berkembang dari analisis yang sederhana sampai berbagai bentuk khusus untuk menangani kondisi data yang kompleks. Pembahasan tentang regresi linier sederhana dapat dijumpai dalam banyak bukubuku teks statistika (Hadi[8], Sujana[23], Mendenhall[16],[17]). Sedangkan untuk regresi khusus (seperti regresi gulud, lihat Neter et al. [20]) dan regresi modern (misalnya GLM, HGLM, regresi tegar), pembaca dapat membaca Statsoft [22], Chamber & Hastie [2], Garson [5], McCullagh & Nelder [15], Vanables & Ripley [32].

220

ANALISISKORELASIDANREGRESI

DAFTAR PUSTAKA

[1]

Baird JH.2003. How Statistics Can Lie. Green Section Recoed. [Agustus 2008]

[2] [3]

Chamber JM & Hastie TJ.1993. StatisticalModels in S.Chapman & Hall Diggle PJ, Liang K-Y & Zeger SL, 1994. Analysis of Longitudinal Data. Oxford Science Publications.

[4]

Faraway JJ. 2002. Practical Regression and Anova Using R. http://www.stat. Isa.umic.edu/~faraway/book/

[5]

Garson

DG.

StatNotes:

Topics

in

Multivariate

Analysis. [Maret

http://StatNote/www2.chass.ncsu.edu\garson/pa765/statnote.htm 2008] [6]

Gravetter FJ & Wallnau LB. 2004. Statistics for the Behavioral Sciences. Thomson. International Student Eddition (6th Edition).

[7]

Guilford JP & Fruchter. 1978. Fundamental Statistics in Psychology and Education. International Student Edition(6th Edition). McGraw-Hill.

[8]

Hadi S. 1982. Statistika. Andi Offset, Yogyakarta.

RingkasandanBacaanLebihLanjut

221

[9]

Hair JF, Black WC, Babin BC, Anderson RE & Tatham RL. 2006. Multivariate Analysis. Pearson, Prentice Hall.

[10] Hogg RV, McKean JW, Craig AT. 2005. Introduction to Mathematical Statistics. 6-th edt. London: Pearson Education International [11] Kuhnert P & Venables WN. 2005. An Introduction to R: Software for Statistical Modelling & Computing. http://cran.r-project.org/

doc/contrib/Kuhnert+Venables-R_Course_Notes.zip [12] Lewis P. MODULE: Basic Statistics. http://philosophy.hku.hk/think/stat/ 5 Agustus 2008] [13] Liang K-Y. & Zeger.SL. 1986. Longitudinal data analysis using generalized linear models. Biometrka.73:13-22. [14] Maindonald JH. 2001. Using R for Data Analysis and Graphics An Introduction. http://www.r.project.org. [15] McCullagh P & Nelder JA. 1989. Generalized Linear Models. Chapman & Hall [16] Mendenhall W. 1979. Introduction to Probability and Statistics 5th edt. Massachussets:Duxbury. [17] Mendenhall W. 1993. Beginning Statistics A to Z. Duxbury [18] Murrell, P. 2006. R Graphics. Chapman & Hall/CRC [19] Nelder J.A. & Wedderburn, Generalized Linear Models. J.R.Statist.Soc.57: 359-407. [20] Neter J. Wasserman, Kutner. (1985) Applied Statistical Model. Homewood, Illinois :Irwin. [21] NIST/SEMATECH e-Handbook of Statistical Methods,

http://www.itl.nist.gov/div898/handbook/, [Januari 2008]

222

DAFTARPUSTAKA

[22] StatSoft. 2006. Electronic Statistics Textbook. http://www.statsoftinc.com/ textbook/ stathome.html [23] Sudjana. 1996. Metode Statistika. Tarsito, Bandung.
[24] Tirta.2005. Potensi dan Prospek Pemanfaatan OSS-R dalam Analisis Data dan Pengajaran Statistika. Pancaran Pendidikan. XVIII (61): 195-208 [25] Tirta, IM.2005. Panduan Program Statistika R. Penerbit Universitas Jember

[26] Tirta IM, Lestari B & Dewi YS. 2006. Estimasi Efek Tetap dan Acak pada Model Multiplikatif
7:59-66.

dengan Likelihood Bersama. Jurnal ILMU DASAR.

[27] Tirta IM. 2007. Analisis Data dengan Respons tidak Saling Bebas dengan paket hglm dan gee pada OSS-R. Makalah disampaikan pada Seminar Nasional Statistika VIII di ITS Surabaya. 3 Nopember 2007.
[28] Tirta IM. 2007. Pengembangan Piranti Lunak Statistika Berbasis OSS-R

(Development of Statistical Software). disajikan dalam seminar Nasional Statistika ke - 8 (SNS VIII) di FMIPA ITS surabaya pada tanggal 3 Nopember 2007

[29] Tirta IM.2007. R.GUI: Mendesain Paket Analisis dan Media Pembelajaran
Statistika. Penerbit Universitas Jember

[30] Tirta IM. 2008. Paket RcmdrPlugin.StatDemo. http://r.unej.ac.id [31] Tirta IM. 2008. Paket StatDemo. http://r.unej.ac.id [32] Venables WN & Ripley BD. 1994. Modern Applied Statistics with S-plus. Springer. [33] Vezalini J. 2002. Using R for Introductory Statistics.

http://www.r.project.org. [34] Wackerly, DD., Mendenhall W., Scheafer RL., 1996. Mathematical Statistics with Application. Massachussets:Duxbury.

RingkasandanBacaanLebihLanjut

223

[35] Wannacott TH & Wannacott RJ. 1990. Introductory Statisticsfor Business and Economics. Williey International Edition. [36] Zeger SL.& Liang KY. 1986. Longitudinal Data Analysis for Discrete and Continuous Outcomes. Biometrics. 42: 121-130 [37] Zoonekyn V. 2005. Statistics with R. http://zoonek2.free.fr/

UNIX/48_R/all.html

224

DAFTARPUSTAKA

LAMPIRAN
MENGUNDUH DAN MENGINSTAL R
R adalah program open source yang dapat diunduh dari internet. Berikut diuraikan cara mengunduh dan menginstal R terutama pada sistem opeasi Windows.
MENGUNDUH (MEN-DOWNLOAD) R

Ada beberapa cara yang dapat ditempuh untuk memperoleh program R beserta peket-peket pendukung (library)nya diantaranya adalah sebagai berikut. 1. Mengunjungi situs http://www.cran.r-project.org, lalu memilih situs bayangan (mirror) yang paling dekat dengan lokasi kita. Salah satu diantaranya adalah situs yang ada di Australia yaitu http://cran.au.r-project.org. Pengguna dapat mengunduh (download) program secara cuma-cuma. 2. Menghubungi Laboratorium Statistika Jurusan Matematika FMIPA Universitas Jember. Kepada pengguna dikenakan biaya mengunduh (download) dan pengemasan yang tidak mahal; 3. Menghubungi UPT Penerbitann Universitas Jember dan membeli salah satu panduan atau manual tentang R yang berisi paket Program R, diantaranya adalah Tirta [25] [29];

MengunduhdanMenginstalR

225

4. Mengunjungi situs http://r.unej.ac.id yang menyediakan salah satu versi R yang relatif masih baru. Komponen program yang diperlukan untuk dapat menjalankan R dan RCommander dengan baik adalah: 1. program R untuk windows yang biasanya diberi nama R-Versi-win32.exe; 2. semua paket pendukung/pustaka/library versi windows yang dibutuhkan seperti: aaMI_versi.zip,, zoo_versi.zip; 3. bagi yang ingin menggunakan R melalui skrip pemrograman diperlukan juga Tinn-R yaitu Tinn-R_versi_setup.exe. 4. Dalam notasi di atas, versi menunjukkan angka yang terkait dengan versi program bersangkutan, misalnya 2.5.0; 7.0.1 dan sebagainya.

MENGINSTAL R

Setelah memperoleh file R-versi-win32.exe, maka instalasi dilakukan sebagai berikut ini. 1. Klik R-versi-win32.exe, lalu akan muncul jendela dialog pemilihan bahasa. Saat ini belum ada dialog berbahasa Indonesia, untuk itu pilih English dan klik OK

Gambar 0.1 Tampilan Pemilihan Bahasa Instalasi 226 LAMPIRAN

2. Selanjutnya akan muncul dialog pembukaan, seperti berikut ini, kita tinggal klik Next, lalu akan muncul dialog tentang informasi Copy Right. Sempatkan membaca ketentuan yang berlaku, selanjutnya klik next.

Gambar 0.2 Tampilan Mulai Instalasi

Gambar 0.3 Tampilan Konfirmasi Lisensi GPL ( General Public License )

MengunduhdanMenginstalR

227

3. Untuk pemilihan direktori sebaiknya ikuti sesuai yang ada pada dialog, misalnya C:\Program Files\R\... Kecuali, untuk yang menggunakan Windows Vista, sebaiknya R diinstal tidak di hardisk C, tetapi di D atau E.

Gambar 0.4 Konfirmasi Direktori

4. Untuk dokumentasi, jika ruang hardisk anda cukup longgar sebaiknya pilih semua dokumentasi terkait. Jika tidak, pilih yang penting diantaranya adalah: HTML files help, Online (pdf) manual, Support files for tcltk, Message Translation, PDF Reference manuals.

228

LAMPIRAN

Gambar 0.5 Tampilan Konfirmasi Komponen R

5. Kustomisasi atau pengaturan Opsi Startup, pilih yes. Dengan pilihan tersebut selanjutnya akan muncul beberapa dialog berikut. Untuk mengatur agar tampilan grafik dan jendela R terpisah,
pilih SDI.

Untuk dokumentasi

bantuan/help bisa pilih CHM atau HTML. Untuk Startup ikuti pilihan yang telah disiapkan (default) R.

MengunduhdanMenginstalR

229

Gambar 0.6 Tampilan Pemilihan Pengaturan Startup Aplikasi

Gambar 0.7 Tampilan Pemilihan Jenis Tampilan

230

LAMPIRAN

Gambar 0.8 Tampilan Pemilihan Bahasa Instalasi

Gambar 0.9 Tampilan Pemilihan Folder Startmenu

6. Untuk tugas tambahan (Additional Tasks), minimal bisa dipilih (di klik check), Create desktop icon dan Create a Quick launch

MengunduhdanMenginstalR

231

Gambar 0.10 Tampilan Pemilihan Task Tambahan

7. Selanjutnya proses instalasi akan dimulai

Gambar 0.11 Tampilan Proses Instalasi

8. Jika selesai akan muncul dialog terakhir berikut. Klik finish untuk menyelesaikan instalasi R
232 LAMPIRAN

Gambar 0.12 Tampilan Akhir Proses Instalasi

MENGAKTIFKAN R DAN MENGINSTAL PAKET TAMBAHAN


Untuk memanggil atau mengaktifkan R kita bisa klik icon R yang ada di desktop. Untuk memunculkan menu atau dialog dalam Bahasa Indonesia perubahan pada properties icon ini. Pada baris target ditulis lakukan

"C:\Program Files\R\R-2.5.0\bin\Rgui.exe" LANGUAGE=id

Perlu diketahui bahwa, sampai saat ini menu dan dialog dalam Bahasa Indonesia hanya tersedia pada paket RCommander, belum sampai pada menu RGUI (Rconsole). Untuk memulai R, kita dapat mengklik short cut yang ada pada desktop, atau melalui Start Menu. Setelah R dipanggil, kita akan memperoleh tampilan yang disebut Console R dengan RGUInya seperti pada Gambar 0.14 atau Gambar 0.15 tergantung bahasa yang dipilih (Untuk menu RGUI belum ada pilihan Bahasa Indonesia).
MengaktifkanRdanMenginstalPaketTambahan 233

Gambar 0.13 Mengatur Pilihan Bahasa Menu dan Dialog R

234

LAMPIRAN

Gambar 0.14 Tampilan Rconsole dalam Bahasa Inggris

Gambar 0.15 Tampilan Rconsole Dalam Bahasa Indonesia

Berikut adalah langkah-langkah untuk menginstal paket tambahan.

MengaktifkanRdanMenginstalPaketTambahan

235

1. Aktifkan menu Packages sepert terlihat pada Gambar 0.17 Memilih Paket Tambahan
Paket-> Menginstal paket dari Zip lokal.

2. Selanjutnya pilih direktori tempat anda menaruh paket-paket tambahan (library) dari R, seperti pada Error! Reference source not found.. Ada

beberapa paket penting yang harus diinstal untuk dapat mengikuti penjelasan dalam buku ini yaitu: a. Rcmdr beserta paket-paket terkait (car, dsb), merupakan paket RGUI untuk analisis data yang dikembangkan oleh Fox dan dengan kontribusi menu bahasa Indonesia oleh Tirta. b. StatDemo_versi.zip merupakan paket khusus bernahasa Indonesia untuk ilustrasi pembelajaran statistika yang dikembangkan oleh Tirta [31] c. RcmdrPlugin.StatDemo sama dengan statDemo di atas, tetapi menunya bergabung dengan menu RCommander (Tirta [30]) d. RcmdrPlugin.hglm berisi paket hglm dan Menu GEE yang bergabung dengan menu RCommander. Paket hglm ditulis oleh Tirta et al. [26], sedangkan gee merupakan paket yang telah ada pada R, tetapi integrasi menu dalam bahasa Indonesia di RCommander dibuat oleh Tirta[28].

236

LAMPIRAN

Gambar 0.16 Menu Menginstal Paket Tambahan

Gambar 0.17 Memilih Paket Tambahan

MengaktifkanRdanMenginstalPaketTambahan

237

STRUKTUR MENU RCOMMANDER


Panel-----|-|-|-|-|-Data set aktif Edit data set Lihat data set Model aktif Submit (Eksekusi)

Menu Data ------|--Data set Baru |--Impor data --------|--Dari Teks |--Dari SPSS |--Dari Minitab |--Data pada R -------|--Daftar data |--Data dari paket aktif Statistika-|--Ringkasan ---------|--Data set aktif |--Numerik |--Matriks korelasi |--Tabel kontingensi -|--Satu arah |--Multi arah |--Analisis dua arah |--Proporsi ----------|--Sampel Tunggal |--Sampel ganda |--Varians ----------|--Uji F beda varians |--Uji Bartlett |--Uji Levene |--Nonparametrik ------|--Uji Wilcoxon sampel tunggal |--Uji Wilcoxon sampel ganda |--Uji Kruskal Walis |--Regresi -----------|--Regresi Sederhana |--Model Linier |--Model Linier Tergeneralisir (GLM) |--Uji Beda ----------|--Uji |--Uji |--Uji |--Uji |--Uji t sampel tunggal t sampel ganda t sampel berpasangan anava satu faktor anava multi faktor

|--Analisis ---------|--Reliabilitas skala dimensional |--Analisis Komponen Utama (RKU/PCA) |--Analisis faktor |--Analisis klaster Grafik-----|--Grafik indeks

238

LAMPIRAN

|--Histogram |--Boxplot |--QQplot |--Diagram kuantil-kuantil |--Diagram pencar |--Matriks diagram Pencar |--Grafik garis |--Diagram rata-rata |--Grafik batang |--Grafik lingkaran |--Grafik 3D Distribusi-|--Distribusi Kontinu--|--Distribusi |--Distribusi |--Distribusi |--Distribusi |-- ... |--Distribusi Normal t Chi-kuadrat Seragam Gumbel

-|--Distribusi Diskrit--|--Distribusi Binomial |--Distribusi Poisson |-- ... |--Distribusi Hipergeometrik Alat ------|--Aktifkan paket |--Aktifkan Plug-in |--Pilihan Bantuan ---|--Bantuan Commander |--Pengantar RCommander |--Bantuan data (jika ada) |--Tentang Rcmdr

StrukturMenuRCommander

239

GLOSARIUM
Inferensi

pengambilan

kesimpulan

terhadap

sesuatu

berdasarkan sebagian informasi yang ada. Inferensi dapat


Subjek (dalam penelitian) Pustaka(Library)

berupa

pendugaan

(estimasi)

maupun

pengambilan kesimpulan (uji hipotesis) sekumpulan orang atau unit terkecil dalam penelitian yang memiliki karakteristik yang menjadi perhatian. direktori yang memuat kumpulan paket-paket

program yang tersedia untuk R. Library dapat ditambah maupun dikurangi sesuai kebutuhan
Skrip

naskah

yang berisi berbagai perintah yang harus

dilaksanakan oleh komputer melalui suatu bahasa atau program tertentu.


CLI (Command Line Interface)

program yang menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan perintah-perintah yang ditulis dalam baris perintah, tidak menggunakan grafis ataupun maouse. CLI merupakan interface utama dari R.

GUI (Graphical User Interface)

program menjembatani komunikasi antara komputer dengan pengguna dengan menggunakan tampilan

grafis seperti menu atau ikon, yang biasanya siap diklik dengan mouse. Program GUI untuk R biasa disebut RGUI
Paket ( package) pada R

kumpulan fungsi-fungsi dalam bahasa R yang dikemas menjadi satu kesatuan metode analisis atau teori tetertentu sebagai aplikasi

Plugn/Plug-in

adalah program yang dapat digabungkan menjadi

240

LAMPIRAN

bagian dari proram lain yang lebih besar. Dalam buku ini Paket-peket Plug-in R Commander, menunya dapat digabungkan menjadi bagian dari menu R Commander
Distribusi kontinu

sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan nonnegatif, a x b ) interval

(misalnya seluruh bilangan real, bilangan real


Distribusi diskrit

sebaran yang memiliki fungsi kepadatan dengan daerah asal (domain) berupa himpunan titik-titik

yang tercacah (misalnya sebagian himpunan bilangan cacah, sebagian himpunan bilangan asli)
Antarmuka

bagian program/alat yang menjembatani komunikasi antara pengguna dengan komputer, antara alat ukur dengan komputer, dan sejenisnya}

Alpha ()

Taraf signifikansi = peluang kesalahan tipe I, peluang secara keliru menolak hipotesis null yang benar.

AIC (Akaike's Information Criterion)

salah satu kriteria yang dijadikan patokan memilih modelyang baik dengan menghitung perimbangan besarnya maksimum AIC= -2 likelihooddan banyaknya yang

peubah yang dipergunakan dalam model, lebih tepatnya model. log-likelihood dimaksimumkan + 2 banyaknya parameter dalam

Analisis data eksploratori (EDA)

Sekumpulan teknik untuk menampilkan data secara visual dan bermakna.

Analisis variansi (ANAVA) Suatu teknik statistika untuk menguji beda nilai-

tengah kelompok lebih dari dua.


GLOSARIUM 241

ANAVA Satu arah b (Beta) Bimodal Boxplot Densitas Derajat kebebasan (db)

Analisis variansi dengan pengelompokan hanya pada satu peubah bebas. Peluang kesalahan tipe II, yaitu peluang secara keliru menerima hipotesis nol yang salah. Distribusi yang memiliki dua puncak atau peluang maksimum. Presentasi grafik dari posisi median dan sebaran data. Kurva yang menunjukkan niai peluang suatu pengamatan pada interval nilai suatu peubah acak. Angka yang mennjukkan banyaknya informasi yang saling bebas setelah mengestimasi beberapa

parameter.
Deviasi baku Dispersi

Akar kuadrat dari variansi ukuran yang menyatakan sejauh mana data menyebar terhadap nilai-tengah Distribusi suatu peubah acak (Y) untuk nilai X yang tetap. Distribusi yang menggambarkan peluang munculnya sejumlah (misalnya kejadian peluang pada percobaan x Bernouli dari

Distribusi bersyarat Distribusi Binomial

munculnya

Angka

pelemparan uang logam sebanyak n kali).


Distribusi normal baku

Distribusi normal dengan nilai-tengah 0 dan deviasi baku 1, dinotasikan dengan N(0,1).

Distribusi sampling Distribusi sampling beda nilai-tengah Distribusi sampling nilai tengah

Distribusi statistik dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu. Distribution beda nilai-tengah dua kelompok sampel dari pengambilan sampel berulang-ulang Distribusi nilai-tengah dari pengambilan sampel yang berulang-ulang yang berasal dari populasi tertentu.
LAMPIRAN

242

Estimasi titik Faktor Hipotesis alternatif (HA)

Nilai tertentu yang merupakan penduga suatu parameter. Istilah lain untuk peubah independen (umumnya berupa peubah kualitatif) pada analisis variansi. Disebut juga hipotesis kerja yaitu hipotesis yang dirumuskan sesuai dengan hasil kajjian teori yang melandasi penelitian.

Hipotesis nul (H0 )

Disebut juga hipotesis nihil, yaitu hipotesis yang diuji pada prosedur statistika, yang menyatakan kenetralan (tidak ada beda signifikan, tidak ada hubungan signifikan dan sebagainya).

Histogram

Grafik

yang

menggunakan

segiempat

sebagai

representasi frekuensi atau peluang dari observasi pada setiap interval.


Homogenitas variansi Hubungan kurvilinier Intersep/ konstanta Interval keyakinan

Situasi dimana beberapa populasi atau subpopulasi memiliki variansi yang sama. Situasi yang dapat tidak linier. Koefisien dalam regresi yang menyatakan nilai Y, pada saat nilai X sama dengan 0. Disebut juga estimasi interval,yaitu suatu interval yang memiliki peluang tertentu memuat parameter yang diestimasi. diwakili oleh hubungan yang

Jarak Cook Kesalahan baku tengah Kesalahan prediksi Kesalahan sampling


GLOSARIUM

Suatu ukuran yang menunjukkan pengaruh suatu nilai pengamatan pada regresi berganda. Deviasi baku dari distribusi sampling.

Kesalahan baku selisih nilai Deviasibaku dari distribusi sampling beda nilai-

tengah. Selisih antara nilai observasi dengan nilai prediksi. Variabilitas suatu nilai statistik sampelsatu ke sampel
243

lainnya.
Kesalahan Tipe II Kesalahan Tipe I Koefisien korelasi

Kesalahan secara keliru tidak menolak H0 yang salah. Kesalahan secara keliru menolak H0 yang benar. Suatu ukuran yang menunjukkan derajat hubungan atau asosiasi antara beberapa peubah.

Kolinearitas Kombinasi Kovariansi (sxy or covxy)

Kondisi yang dimana peubah penjelas berkorelasi satu sama lain.

saling

Banyaknya cara sejumlah objek dapat dipilih tanpa memperhatikan urutannya. Ukuran statistik yang menunjukkan derajat dua peubah berubah bersama-sama.

Leverage Matriks kovariansi (S)

Ukuran yang menunjukkan penyimpangan nilai observasi terhadap nilai prediktor. Suatu matriks yang menunjukkan nilai variansi dan kovariansi antar beberapa peubah. Istilah lain untuk regresi peubah ganda, terdiri atas

Model

model linier, model linier terampat/tegreneralisir, model nonlinier, model linier campuran dan lain-lain Disebut juga model linier terampat, yaitu analisis

Model linier tergeneralisir Model log-linear Multikolinearitas Nilai kritis

Model/regresi untuk data dengan respon yang tidak berdistribusi normal. Model untuk menangani data kategori berganda. Kondisi yang menunjukan adanya korelasi yang tinggi di antara peubah-peubah prediktor. Suatu nilai statistik yang menjadi batas penerimaan atau penolakan Ho .

Nilai-tengah bersyarat Nilai-tengah geometrik

Nilai-tengah suatu peubah pada nilai tertentu dari peubah yang lain. Nilai tengah yang diambil dari n objek dengan

244

LAMPIRAN

menghitung akar pangkat n dari hasil kali (produk) n objek tadi.


Outlier/pencilan p level

Nilai observasi yang terletak jauh dari distribusi kelompoknya. Peluang kesalahan tipe I, yaitu peluang yang menunjukkan bahwa hasil yang dicapai merupakan hal yang kebetulan jika ternyata Ho benar.

Parameter Peluang bersyarat Percobaan Bernoulli Populasi

Nilai yang menunjukkan pengukuran data populasi. Peluang suatu kejadian pada saat diketahui terjadinya suatu kejadian lain. Percobaan dengan hasil salah satu dari dua kejadian yang saling lepas misalnya lulus-gagal. kumpulan seluruh data yang menjadi perhatian dalam penelitian. Jadi populasi adalah seluruh subjek penelitian beserta karakteristiknya yang menjadi kepentingan

Regresi linier Regresi logistik Regresi multivariat Residu/sisa

Analisis regresi dengan hubungan linier. Analisis regresi untuk data dengan respon bersifat dikotomus (misalnya lulus/gagal). Analisis degression lebih dari dua peubah bebas. Selisih antara nilaiobservasi Y dengan nilai

). prediksinya ( Y
Saling lepas (Mutually exclusive) Sampling

Dua kejadian yang tidak bisa terjadi bersama-sama.

Prosedur unduk memperoleh sampel yang mewakili populasi dengan baik (baik struktur maupun sifatsifatnya)

Skala Nominal

Angka yang hanya dipakai untuk membedakan objek.

GLOSARIUM

245

Skala ordinal Skala rasio Kesalahanbaku penduga Statistik Statistik Deskriptif Statistika inferensial

Angka hanya dipakai untuk menunjukkan urutan objek. Skala yang memiliki nilai 0 mutlak dan rasio/ perbandingan memiliki makna. Rata-rata deviasi kuadrat terhadap garis regresi Angka-angka yang menunjukkan pengukuran pada data. Statistika yang mendeskripsikan sampel tanpa

menarik kesimpulan tentang populasi Bagian statistika berkaitan dengan pengambilan keputusan tentang parameter populasi asal asal sampel.
Teorema limit pusat

Teorema yang sifat alami dari sebaran sampel dari nilai tengah. Apapun distribusinya jika sampling dilakukan banyak kali, distribusi nilai tengah akan mendekati distribusi normal

Tingkat Signifikansi

Nilai yang menunjukkan batas maksimum peluang kita secara keliru menolak H0 yang kenyataannya benar.

Uji bebas distribusi

Disebut juga uji nonparametrik, yaitu statistika yang tidak bergantung pada asumsi distribusi atau asumsi distribusi.

Uji Hipothesis

Suatu proses pengambilan keputusan berkaitan dengan nilai parameter populasi yang sebelumnya telah dinyatakan.

Uji nonparametrik Uji parametrik Ukuran pemusatan


246

Uji statistik yang tidak bergantung pada estimasi parameter atau asumsi distribusi. Uji statistika yang bergantung pada estimasi

parameter populasi atau asumsi distribsi populasi Nilai yang menunjukkan pusat suatu distribusi.
LAMPIRAN

Unimodal Peubah (dari data)

Distribusi maksimum.

yang

memiliki

satu

puncak

atau

karakteristik yang bervariasi antara satu subjek ke subjek lain yang menjadi perhatian dari sampel atau populasi

Peubah dikotomus Peubah independen Peubah tetap Variansi population

Peubah yang hanya memiliki salah satu dai dua nilai yang bebeda. Peubah yang dikontrol dalam percobaan. Suatu peubah bebas (eksplanatori) yang nilainya ditentukan peneliti. Variansi dari populasi yang dalam kenyataannya diestimasi bukan dihitung.

GLOSARIUM

247

DAFTAR PERSAMAAN
Pers. 3.1

P( A| B ) =

P( A B) ......................................................................... 48 P( B )

Pers. 3.2 Pers. 3.3 Pers. 3.4 Pers. 3.5 Pers. 3.6

P ( A B ) = P( A) + P( B ), untuk A B = ...................................... 48

P ( A B ) = 0, untuk A B = ........................................................ 48
A|| B P( A) = P( A| B ) ................................................................... 49 A|| B P( A B ) = P( A) P ( B ) ................................................... 49 P ( A B ) = P( A) + P( B ) P ( A B ), untuk A B ................... 50

Pers. 3.7

n p ( x ) = x (1 ) n x , x = 0,1, 2,..., n ............................................... 55 x

Pers. 3.8

x=

1 n xi .......................................................................................... 57 n i =1

Pers. 3.9

2 sx = i =1

1 n 2 x xi i xx n i =1 i =1 ................................................ 60 = n 1 n 1

Pers. 3.10

r=

n n n n xi yi xi yi i =1 i =1 i =1 n 2 n 2 n 2 n 2 ................................... 61 n xi xi n yi yi i =1 i =1 i =1 i =1

Pers. 4.1

1 x 2 1 exp f ( x) = ; 2 2

< x < .............................. 72

248

LAMPIRAN

Pers. 4.2

z2 1 1 2 f ( z) = e ; 2

< z < .................................... 72

Pers. 4.3

Z=

sebaliknya X = + Z ................................................... 74

Pers. 4.4

n n n Y = ai X i berdistribusi N ai , 2 ai2 ................................ 82 i =1 i =1 i =1

Pers. 4.5 X =

X 1 n 2 ~ N (0,1) ............................... 82 X i ~ N ( , n ) atau Z = n i =1 n

Pers. 7.1

=x=

1 n xi ................................................................................ 135 n i =1

Pers. 7.2

( x x)
i =1 i

........................................................................ 135

n 1

Pers. 7.3 Pers. 7.4

x z / 2
x tn 1, / 2
s

< < x + z / 2
n

. ................................................ 136 ................................................ 136

< < x + tn 1, / 2
n

Pers. 8.1

r=

x y
i =1 i

1
2

x y n
i =1 n i i =1

i n 2

x
i =1 n

2 i

1 xi n i =1
n

y
i =1 2

2 i

1 yi n i =1

............................... 182

Pers. 8.2

see = y 0 + 1 xi ................................................................ 191 i =1

Pers. 8.3

0 = y 1 x , .................................................................................... 191

DaftarPersamaan

249

Pers. 8.4

1 =

xi yi 1/ n xi yi
i =1 i =1 i =1

x 1/ n xi i =1 i =1
n n 2 i

, .......................................................... 191

Pers. 8.5

1 =

s xy s xx

, ........................................................................................... 191

Pers. 8.6

n x y xi i i n n 2 i =1 i =1 , s xx = xi i =1 .............................. 191 s xy = xi yi n n i =1 i =1
n n

Pers. 8.7

1 = rxy

sx , dengan s x = s xx ; s y = s yy .......................................... 191 sy

Pers. 8.8

2 = s2 =

see . ............................................................................... 192 n2

Pers. 8.9

= s2 1

s2 x2 2 21 = + ,dan s s ...................................................... 192 0 s xx n s xx

Pers. 8.10

2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s .............. 200 s = see + + s xx n s xx n 2 y

Pers. 8.11

2 1 ( x x )2 xp x ) ( 1 p dan y = y t / 2 s 1 + + .... 201 s = see 1 + + sxx n s xx n 2 $ y

250

LAMPIRAN

DAFTAR CONTOH
Contoh 1.1. ............................................................................................................. 12 Contoh 1.2 .............................................................................................................. 13 Contoh 1.3 .............................................................................................................. 13 Contoh 3.1 .............................................................................................................. 48 Contoh 3.2 .............................................................................................................. 52 Contoh 3.3 .............................................................................................................. 53 Contoh 3.4. ............................................................................................................. 56 Contoh 3.5. ............................................................................................................. 56 Contoh 3.4 .............................................................................................................. 58 Contoh 3.5 .............................................................................................................. 59 Contoh 3.6 .............................................................................................................. 61 Contoh 4.1 .............................................................................................................. 75 Contoh 4.2 .............................................................................................................. 78 Contoh 4.3 .............................................................................................................. 80 Contoh 7.1 ............................................................................................................ 136 Contoh 7.2 ............................................................................................................ 137 Contoh 8.1 ............................................................................................................ 185 Contoh 8.2 ............................................................................................................ 194 Contoh 8.3 ............................................................................................................ 195 Contoh 8.4 ............................................................................................................ 199
DaftarContoh 251

Contoh 8.5 ............................................................................................................ 209

252

LAMPIRAN

INDEKS

253

INDEKS
Alternatif ........................ 13, 200, 235 Anava ......... xx, 82, 83, 165, 194, 197 Animasi .................................... xv, 44 Berpasangan ............. 12, xx, 185, 196 Binomial............................................. 6, 25, 53, 79, 240, 241, 242, 243, 244, 246, 260, 263 Box-plot ......................................... 21 chi-kwadrat..................... 53, 107, 144 CIS ................................................... 9 Derajat .................................... 57, 208 Deskriptif ................... 5, 90, 127, 267 Determinasi .................................. 234 Deviasi ............................................... ........ xv, 57, 63, 168, 195, 263, 264 Histogram........................................... Diagnostik .......................................... .................. xxi, 227, 228, 229, 230 Distribusi ............................................ xiv, xv, xvi, 25, 29, 32, 33, 34, 35, 52, 53, 56, 59, 60, 61, 62, 67, 68, 69, 70, 75, 76, 86, 106, 143, 240, 242, 260, 262, 263, 267 Intervalxv, 36, 93, 130, 173, 184, 189, 214, 264 Keyakinan ...................... 7, xv, 36, 37 xvi, xvii, xviii, xix, xx, 21, 78, 109, 110, 123, 146, 147, 160, 260, 264 Inferensial......................................... 6 EDA ......................... 5, 108, 145, 262 Eksponensial ................ 25, 53, 60, 79 F 21, 53, 79, 81, 82, 113, 150, 195, 198, 217, 218, 221, 222, 224, 232, 233, 259 Frekuensi............................................ xv, xvii, xviii, 42, 43, 45, 106, 143 GUI.......... iv, 20, 21, 38, 39, 257, 261 HGLM............................................ 84 hipotesis ............................................. 80, 165, 168, 169, 171, 173, 176, 177, 178, 179, 181, 183, 184, 186, 187, 189, 190, 195, 218 Hipotesis............................................. 9, 12, 14, 80, 168, 169, 172, 180, 186, 194, 199, 200, 218, 264

254

LAMPIRAN

Korelasi .............................................. xvii, xviii, xxi, 21, 57, 83, 107, 144, 207, 208, 209, 211, 212, 213, 214, 254 Kuantil................................................ xvii, xviii, xix, 54, 55, 113, 114, 122, 150, 151, 159 kumulatif ............ 59, 60, 73, 243, 248 Library.......................................... 261 Mean... 21, 32, 33, 36, 54, 56, 63, 195 Median ............................................... xv, 54, 55, 56, 61, 62, 104, 105, 112, 141, 142, 149, 220, 223, 226, 232, 233, 247, 248, 249, 251 Modus........................... xv, 54, 56, 62 Nominal.......................... 92, 129, 266 Normal ............................................... xv, xvi, 6, 21, 25, 32, 33, 34, 35, 42, 52, 53, 55, 56, 60, 67, 68, 69, 71, 73, 75, 76, 78, 79, 83, 87, 88, 113, 114, 150, 151, 172, 180, 186, 194, 217, 218, 228, 240, 241, 242, 248, 251, 260 Ordinal ................................... 92, 129 Parameter ........... 11, 32, 37, 165, 266 Pemusatan ................ 8, xv, 54, 62, 63
INDEKS

pencar ................................................. 25, 109, 120, 146, 157, 209, 210, 222, 224, 260 Pencar................................................. 10, 11, xvii, xviii, xix, xx, xxi, 21, 120, 121, 122, 123, 157, 158, 159, 160, 219, 223, 224, 234, 260 Pencilan......................... xxi, 233, 234 Penyebaran ................................. 8, 57 plugin ............................................. 10 Plug-in..................... xiv, 31, 260, 261 Populasi.................................. 14, 266 Proporsi .............................................. xxi, 21, 83, 165, 199, 200, 201, 202, 259 p-value................................................ 106, 143, 173, 174, 177, 178, 181, 184, 185, 187, 188, 189, 190, 195, 201, 203, 213, 214, 218, 221, 222, 224, 232, 233 Ragam ............................. xvi, 69, 191 Range ....................................... 54, 57 Rasio................................. 44, 93, 130 Rcmdr......................... 20, 22, 30, 260

Page255

RCommander .................................... i v, v, xiv, xvi, xviii, 10, 19, 20, 21, 22, 24, 25, 30, 31, 37, 38, 72, 74, 80, 87, 90, 94, 95, 97, 98, 101, 104, 108, 109, 113, 127, 131, 132, 134, 135, 138, 141, 145, 146, 150, 165, 171, 179, 186, 193, 211, 219, 225, 227, 259, 260 Regresi7, 12, 13, xv, xxi, 21, 36, 37, 84, 120, 157, 214, 225, 229, 230, 233, 234, 235, 244, 250, 254, 259, 266 Rentang ........................................ 242 Rerata28, 71, 80, 117, 118, 119, 154, 155, 156, 165, 170, 171, 179, 185, 195 Sampel8, 9, 12, xx, xxi, 14, 42, 49, 54, 76, 171, 175, 176, 182, 199, 201, 202, 259 SciViews ........................................ 20 signifikansi34, 35, 108, 145, 168, 222, 243, 246, 262 simetris ............................................... 34, 35, 52, 53, 55, 56, 60, 62, 67, 69, 86, 109, 112, 146, 149, 221, 240

StatDemo............................................ iv, v, 7, xiv, 10, 19, 21, 22, 23, 30, 31, 32, 41, 45, 62, 75, 87, 174, 179, 181, 185, 190, 257 Statistik............................................... vi, 10, 11, xvi, xviii, 4, 15, 104, 141, 266, 267 Statistika............................................. i, iii, iv, vi, 9, xiv, 4, 5, 6, 7, 9, 10, 15, 23, 25, 28, 30, 39, 42, 79, 80, 90, 127, 255, 256, 257, 259, 267 T .......... 33, 34, 81, 82, 168, 181, 182 Tinn-R ............................................ 20 Unimodal...................................... 267 Variansi .............................................. 57, 118, 155, 191, 193, 197, 259, 268 Wilcoxon................................ 21, 259 Z xv, 35, 68, 75, 78, 81, 82, 168, 256

You might also like