You are on page 1of 274

Metode Statistika II

Dr. Danardono
danardono@ugm.ac.id

Program Studi Statistika

Materi dan Jadual


Tatap
Muka

Pokok Bahasan

Sub Pokok Bahasan

1.

Data Statistik dan


Metode Statistik

1. Pendahuluan
2. Data statistik (review)
3. Metode Statistik

2.

Analisis Variansi

1. Pengantar
2. ANAVA satu arah

3.

Analisis Variansi

1. Pembandingan Ganda
2. Diagnostik

4.

Analisis Variansi

1. ANAVA Dua Arah


2. Topik Lanjut ANAVA

Materi dan Jadual


5.

Analisis Regresi

1. Pengantar
2. Regresi Linear Sederhana
3. Metode Kuadrat Terkecil

6.

Analisis Regresi

1. Inferensi
2. Korelasi

7.

Analisis Regresi

1. Regresi Linear Ganda


2. Inferensi
3. Regresi Polinomial

8.

Analisis Data
Kategorik

1. Data Kategorik
2. Tabel Kategorik 2 2
3. Tabel Kategorik b k

9.

Analisis Data
Kategorik

1. Fishers exact test


2. Ukuran Keeratan Hubungan
3. Uji Goodness of t distribusi multinomial

Materi dan Jadual


10.

Metode
Non-parametrik

1. Pengantar
2. Dua sampel dependen

11.

Metode
Non-parametrik

1. K-sampel dependen
2. Koesien Korelasi Rank

12.

Bilangan indeks

13.

Presentasi

14.

Presentasi

Buku teks:
Soejoeti, Z. (1984). Buku Materi Pokok Metode Statistik II,
Universitas Terbuka, Penerbit Karunika, Jakarta.
Abdurakhman (2004). Modul Metode Statistika II, Program
Studi Statistika, Jurusan Matematika, FMIPA UGM.

Penilaian
Ujian Akhir Semester
Ujian Tengah Semester
Presentasi
Penilaian lisan
Tugas
Kuis
Keaktivan

Analisis Variansi
Analisis Variansi (Anava)
Perluasan dari uji mean dua populasi Normal

(data berasal dari populasi Normal)

Ada k mean populasi yang dibandingkan


Berdasarkan pada pemecahan variansi

Analisis Variansi Satu Arah


Inferensi mean populasi Normal
Uji mean satu populasi
H0 : = 0

Analisis Variansi Satu Arah


Inferensi mean populasi Normal
Uji mean satu populasi
H0 : = 0
Uji mean dua populasi
H0 : 1 = 2

Analisis Variansi Satu Arah


Inferensi mean populasi Normal
Uji mean satu populasi
H0 : = 0
Uji mean dua populasi
H0 : 1 = 2

Uji mean k populasi


H0 : 1 = 2 = 3

Analisis Variansi Satu Arah


Contoh:
Dipunyai empat varitas padi yang akan kita uji produktivitasnya. Dua
puluh empat petak tanah yang kira-kira mempunyai kesuburan yang
sama dipilih. Kemudian 24 petak itu dibagi secara random menjadi
empat kelompok, masing-masing 6 petak yang selanjutnya tiap
kelompok ditanami satu varitas padi. Apakah rata-rata produktivitas 4
varitas padi tersebut sama?

A
24
13
18
24
16
23

varitas
B
C
13 21
21 13
11 26
23 23
28 16
18 12

D
27
30
24
29
26
34

Analisis Variansi Satu Arah


Terminologi
faktor variabel independen yang akan diteliti. Contoh: varitas
padi, merek, temperatur.
tingkat faktor nilai tertentu dari faktor. Contoh: varitas-varitas
padi yang berbeda (varitas A, B, C, D); beberapa merek
telepon seluluer yang berbeda (Nokia, Samsung,
Sony-Ericsson); nilai temperatur yang berbeda (70 C,
80 C, 90 C).
Perlakuan (treatment) Tingkat faktor atau kombinasi dari
beberapa tingkat faktor.

Analisis Variansi Satu Arah


Anava Satu Arah Model I (Fixed Effects)
Model:
Yij

= i + ij
= + i + ij ,

i = 1, 2, . . . , k; j = 1, 2, . . . , ni ,

dimana Yij adalah variabel respon dari perlakuan ke-i


observasi ke-j ; k adalah banyaknya perlakuan dan ni adalah
banyaknya sampel untuk tiap perlakuan; , i dan i adalah
parameter.
Asumsi:
ij adalah variabel random independen yang berdistribusi
Normal N (0, 2 ) dan k i = 0
i=1

Analisis Variansi Satu Arah


Anava Satu Arah Model II (Random Effects)
Model:
Yij

= i + ij
= + Ai + ij ,

i = 1, 2, . . . , k; j = 1, 2, . . . , ni ,

dimana Yij adalah variabel respon dari perlakuan ke-i


observasi ke-j ; k adalah banyaknya perlakuan dan ni adalah
banyaknya sampel untuk tiap perlakuan; , i dan Ai adalah
parameter.
Asumsi:
ij adalah variabel random independen yang berdistribusi
Normal N (0, 2 ) dan Ai adalah variabel random independen
2
yang berdistribusi Normal N (0, ); ij dan Ai independen.

Analisis Variansi Satu Arah


Uji Hipotesis
H0 : 1 = 2 = . . . = k (atau H0 : 1 = 2 = . . . = k = 0)
H1 : minimal ada dua mean yang tidak sama (atau
i = 0
untuk beberapa i)
Statistik Penguji
F =

MST
MSE

dimana F F(k1,nk)
MST: mean square treatment (kuadrat rata-rata perlakuan)
MSE: mean square error (kuadrat rata-rata sesatan)
yang diperoleh dari Tabel Anava (Analisis Variansi)
Daerah Kritis
H0 ditolak jika F > F(k1,nk)

15

20

25

30

Hasil Padi - ANAVA

Hasil Padi - ANAVA


Tabel Anava
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Perlakuan

k1

SST =

k
i=1

Sesatan

N k

SSE =

k
i=1 (ni

Xi =

1
ni

2
Si =

1
N

2
1)Si

ni
j=1 xij

1
ni 1

X=

ni (Xi X)2

ni
j=1 (Xij
k
i=1

X i )2

ni
j=1 xij ,

N=

ni

Rata-rata
Jumlah Kuadrat
(MS)
MST =

SST
k1

MSE =

SSE
N k

rasio F

F =

MST
MSE

Hasil Padi - ANAVA


A
24
13
18
24
16
23

B
13
21
11
23
28
18

varitas
C
21
13
26
23
16
12

D
27
30
24
29
26
34

Hasil Padi - ANAVA

ni

Xi
2
Si

A
24
13
18
24
16
23
6
19,67
21,87

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30

D
27
30
24
29
26
34
6
28,33
12,27

Hasil Padi - ANAVA

ni

Xi
2
Si

X=

1
N

k
i=1

ni
j=1

A
24
13
18
24
16
23
6
19,67
21,87

xij =

513
24

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30
= 21, 38

D
27
30
24
29
26
34
6
28,33
12,27

Hasil Padi - ANAVA

ni

Xi
2
Si

X=

1
N

A
24
13
18
24
16
23
6
19,67
21,87

k
ni
xij = 513
j=1
i=1
24
k

ni (Xi X)2
i=1

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30

D
27
30
24
29
26
34
6
28,33
12,27

= 21, 38

SST =
= 6(19,6721,38)2 +6(19,0021,38)2 +6(18,5021,38)2 +6(28,3321,38)2

Hasil Padi - ANAVA

ni

Xi
2
Si

X=

1
N

A
24
13
18
24
16
23
6
19,67
21,87

k
ni
xij = 513
j=1
i=1
24
k

ni (Xi X)2
i=1

SST =
= 391, 46

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30
= 21, 38

D
27
30
24
29
26
34
6
28,33
12,27

Hasil Padi - ANAVA

ni

Xi
2
Si

X=

1
N

A
24
13
18
24
16
23
6
19,67
21,87

k
ni
xij = 513
j=1
i=1
24
k

ni (Xi X)2
i=1

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30
= 21, 38

SST =
= 391, 46
k
2
SSE = i=1 (ni 1)Si
=(61)21,87+(61)40,40+(61)32,30+(61)12,27

D
27
30
24
29
26
34
6
28,33
12,27

Hasil Padi - ANAVA

ni

Xi
2
Si

X=

1
N

A
24
13
18
24
16
23
6
19,67
21,87

k
ni
xij = 513
j=1
i=1
24
k

ni (Xi X)2
i=1

SST =
= 391, 46
k
2
SSE = i=1 (ni 1)Si
= 534, 17

varitas
B
C
13
21
21
13
11
26
23
23
28
16
18
12
6
6
19,00 18,50
40,40 32,30
= 21, 38

D
27
30
24
29
26
34
6
28,33
12,27

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Perlakuan

k1

Sesatan

N k

Jumlah Kuadrat (SS)

SST =
SSE =

k
i=1

ni (Xi X)2

k
i=1 (ni

2
1)Si

Rata-rata
Jumlah Kuadrat
(MS)
MST =

SST
k1

MSE =

SSE
N k

rasio F

F =

MST
MSE

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

Varitas

SST = 391, 46

MST =

SST
k1

Sesatan

20

SSE = 534, 17

MSE =

SSE
N k

rasio F

F =

MST
MSE

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

Varitas

SST = 391, 46

MST =

Sesatan

20

SSE = 534, 17

MSE =

391,46
3
434,17
20

rasio F

F =

MST
MSE

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

rasio F

Varitas

SST = 391, 46

MST = 130, 49

130,49
26,71

Sesatan

20

SSE = 534, 17

MSE = 26, 71

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

rasio F

Varitas

SST = 391, 46

MST = 130, 49

4, 8856

Sesatan

20

SSE = 534, 17

MSE = 26, 71

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

rasio F

Varitas

SST = 391, 46

MST = 130, 49

4, 8856

Sesatan

20

SSE = 534, 17

MSE = 26, 71

Statistik Penguji
F = 4, 8856

Daerah Kritik ( = 0, 05)


H0 ditolak jika F > F(3,20) = 3, 10

Hasil Padi - ANAVA


Tabel Anava Hasil 4 Varitas Padi
Sumber Variansi

derajad
bebas

Jumlah Kuadrat (SS)

Rata-rata
Jumlah Kuadrat
(MS)

rasio F

Varitas

SST = 391, 46

MST = 130, 49

4, 8856

Sesatan

20

SSE = 534, 17

MSE = 26, 71

Statistik Penguji
F = 4, 8856

Daerah Kritik ( = 0, 05)


H0 ditolak jika F > F(3,20) = 3, 10

Kesimpulan
F = 4, 8856 > 3, 10 H0 ditolak,
paling tidak ada dua mean yang
tidak sama

Pemecahan Jumlah Kuadrat


Notasi:
Total observasi untuk perlakuan ke-i
ni

Yi. =

Yij
j=1

Rerata sampel untuk perlakuan ke-i

Yi. =

ni
j=1 Yij

ni

Yi.
ni

Pemecahan Jumlah Kuadrat


Notasi:
Total seluruh observasi
k

ni

Y.. =

Yij
i=1 j=1

Rerata sampel keseluruhan

Y.. =

k
j=1

ni
j=1 Yij

Y..
=
N

Pemecahan Jumlah Kuadrat

(Yij Y.. )2 =
SSTO

ni (Yi. Y.. )2 +
SST

(Yij Yi. )2
SSE

jumlah kuadrat total = jumlah kuadrat perlakuan+jumlah kuadrat sesatan

Pemecahan Jumlah Kuadrat


Tabel Anava
Sumber Variansi

derajad
bebas

Jumlah Kuadrat
(SS)

Rata-rata Jumlah
Kuadrat (MS)

Perlakuan

k1

SST

MST =

SST
k1

Sesatan

N k

SSE

MSE =

SSE
N k

Total

N 1

SSTO
2
Yij

SSTO =
i

SST =

2
Yi.

ni
2
Yij

SSE =
i

2
Y..

2
Y..

2
Yi.
ni

rasio F
F =

MST
MSE

Pemecahan Jumlah Kuadrat


Sebuah perusahaan cereal mempunyai 4 jenis kemasan
untuk produk cereal yang sama rasanya. Untuk mengetahui
desain kemasan mana yang paling menarik minat pembeli, 10
toko yang masing-masing memiliki total penjualan yang sama
diambil sebagai unit eksperimen. Secara random toko-toko
tersebut menerima salah satu dari 4 jenis kemasan cereal
tersebut. Diperoleh data banyaknya penjualan cereal dari
masing-masing toko sebagai berikut:
Toko
Desain Kemasan 1
2
3
1
12 18
2
14 12 13
3
19 17 21
4
24 30

Pemecahan Jumlah Kuadrat

Selisih antara yij dengan Y..


Y
30
28
26
24
22
20

Y..

18
16
14
12
10

Kemasan 1

Kemasan 2

Kemasan 3

Kemasan 4

Pemecahan Jumlah Kuadrat

Selisih antara yij dengan Yi.


Y
30
28
26
24
22
20
18
16
14
12
10

Kemasan 1

Kemasan 2

Kemasan 3

Kemasan 4

Pemecahan Jumlah Kuadrat

Selisih antara Yi. dengan Y..


Y
30
28
26
24
22
20

Y..

18
16
14
12
10

Kemasan 1

Kemasan 2

Kemasan 3

Kemasan 4

Pengekstrak tanah - ANAVA


Tiga jenis pengekstrak zinc digunakan pada 10 sampel tanah
untuk mengetahui kandungan mineral tanah. Diperoleh hasil
berupa kandungan zinc (dalam ppm - parts per million)
sebagai berikut: Untuk pengekstrak jenis pertama diperoleh
rerata dan deviasi standar 2,40 dan 1,69. Untuk jenis kedua
diperoleh rerata dan deviasi standar 3,19 dan 2,35. Untuk
jenis yang ketiga diperoleh rerata dan deviasi standar 4,72
dan 2,75. Ujilah apakah ketiga pengekstrak tersebut berbeda
dilihat dari banyaknya zinc yang terekstrak.

Hasil Padi - Pembandingan ganda


Pembandingan Ganda (Multiple Comparisons)
Merupakan analisis lanjutan bila H0 ditolak dalam Anava
Uji F Anava hampir pasti menolak H0 bila ukuran sampel

cukup besar

Hasil Padi - Pembandingan ganda


Pembandingan Ganda (Multiple Comparisons)
Merupakan analisis lanjutan bila H0 ditolak dalam Anava
Uji F Anava hampir pasti menolak H0 bila ukuran sampel

cukup besar

Metode:
Tukey
Scheff
Bonferroni
Newman - Keuls

Hasil Padi - Pembandingan ganda


Metode Scheff
Mempunyai asumsi sama seperti Anava
Menggunakan tabel F

Hipotesis
H0 : i = j
H1 : i = j
untuk i = j dan i, j = 1, 2, . . . , k
Daerah Kritik (Keputusan)

H0 ditolak, jika | Xi Xj |>

(S 2 = MSE dalam Anava satu arah)

(k 1)S 2 F,k1,N k

1
ni

1
nj

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |

(k 1)MSEF,k1,N k

1
ni

1
nj

Kesimpulan

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |

3(26, 71)(3, 10)

1
ni

1
nj

Kesimpulan

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |
0,67
1,17
8,66
0,50
9,33
9,83

248, 403

1
ni

1
nj

Kesimpulan

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |
0,67
1,17
8,66
0,50
9,33
9,83

248, 403
248, 403

1
ni

1
nj

1
6

1
6

Kesimpulan

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |
0,67
1,17
8,66
0,50
9,33
9,83

248, 403

1
ni

9,1
9,1
9,1
9,1
9,1
9,1

1
nj

Kesimpulan

Hasil Padi - Pembandingan ganda


Contoh
Pembandingan ganda untuk varitas padi contoh di muka.
Diketahui (dari hitungan di muka):
ni

Xi

A
6
19,67

varitas
B
C
6
6
19,00 18,50

D
6
28,33

MSE = 26, 71

Pembandingan ganda Scheff:


Pembandingan
A
A
A
B
B
C

vs.
vs.
vs.
vs.
vs.
vs.

B
C
D
C
D
D

| Xi Xj |
0,67
1,17
8,66
0,50
9,33
9,83

248, 403

1
ni

9,1
9,1
9,1
9,1
9,1
9,1

1
nj

Kesimpulan
H0
H0
H0
H0
H0
H0

diterima
diterima
diterima
diterima
ditolak
ditolak

Diagnostik Model Anava


Langkah Analisis:
1. Memeriksa apakah model sesuai dengan data
(diagnostik)
2. Jika model tidak sesuai, mungkin perlu dilakukan
transformasi data atau modikasi model
3. Setelah model dipandang sesuai, lakukan inferensi
berdasarkan model tersebut

Diagnostik Model Anava


Langkah Analisis:
1. Memeriksa apakah model sesuai dengan data
(diagnostik)
Untuk model Anava:
Analisis residual
Uji kesamaan variansi
2. Jika model tidak sesuai, mungkin perlu dilakukan
transformasi data atau modikasi model
3. Setelah model dipandang sesuai, lakukan inferensi
berdasarkan model tersebut

Analisis Residual
Residual:
eij

= Yij Yij

= Yij Yi.

Analisis Residual
Residual:
eij

= Yij Yij

= Yij Yi.

Residual standar:

eij

MSE

alternatif standarisasi:
eij
si

Plot Residual

plot residual terhadap Y (nilai pencocokan, tted values)


plot residual terhadap waktu atau urutan yang lain
dotplot, histogram, boxplot dari residual
Normal probability plot

Diagnostik dengan Residual


Residual dapat digunakan untuk memeriksa penyimpangan
asumsi model ANAVA:
variansi dari galat (error ) yang tidak konstan
galat yang tidak independen
pencilan (outliers)
galat yang tidak berdistribusi normal

Diagnostik dengan Residual

0
5

residual

Plot residual eij dengan Y


ij

20

22

24
^
Y

26

28

Diagnostik dengan Residual

Boxplot residual eij untuk tiap perlakuan

Diagnostik dengan Residual

Boxplot residual eij untuk tiap perlakuan

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Uji statistik berdasarkan asumsi bahwa s2 , s2 , . . . , s2
1 2
k
merupakan variansi sampel dari k sampel random yang
amsing-masing berdistribusi Normal, dan (ni 1) adalah
derajad bebas dari masing-masing s2
i
Rata-rata aritmetik s2 adalah:
i
1
MSE =
N k

dengan N k =

k
i=1 ni

k
i=1

(ni 1)s2
i

1 adalah derajad bebas total.

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Uji statistik berdasarkan asumsi bahwa s2 , s2 , . . . , s2
1 2
k
merupakan variansi sampel dari k sampel random yang
amsing-masing berdistribusi Normal, dan (ni 1) adalah
derajad bebas dari masing-masing s2
i
Rata-rata geometrik dari s2 adalah:
i
GMSE =

(s2 )(n1 1) (s2 )(n2 1) . . . (s2 )(nk 1)


1
2
k

1/(N k)

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Untuk sembarang nilai-nilai s2
i
GMSE MSE
Nilai GMSE dan MSE akan dekat jika nilai-nilai s2 saling
i
berdekatan.
MSE/GMSE akan dekat ke 1 atau
log(MSE/GMSE) = log(MSE) log(GMSE) akan dekat ke 0.

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Statistik penguji:
N k
[log(MSE) log(GMSE)]
B=
C

dengan
1
C=1+
3(k 1)
C>1

k
i=1

1
ni 1

N k

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Statistik penguji:
k

1
(ni 1) log(s2 )
(N k) log(MSE)
B=
i
C
i=1
dengan
1
C=1+
3(k 1)

i=1

1
ni 1

1
N k

C>1
Bila H0 benar, B mendekati distribusi 2 dengan derajad bebas k 1

Uji Bartlett
Uji Kesamaan variansi Bartlett:
2
2
2
H0 : 1 = 2 = . . . = k
2
H1 : tidak semua i sama i = 1, . . . , k
Daerah penolakan:
B 2
(1,k1) ,

B > 2
(1,k1) ,

H0 diterima
H0 ditolak

Hasil padi - Uji Bartlett


Uji Kesamaan variansi Bartlett:
2
2
2
2
H0 : A = B = C = D
2
H1 : tidak semua i sama
Statistik penguji:
Diketahui k = 4, ni = 6, s2 = 21,87; 40,40; 32,30; 12,27
i
1
C = 1+
3(4 1)

4
i=1

= 1, 08333

B =

1
(20) log(2,71)
C

= 1,726

1
ni 1

20

k
i=1

(ni 1) log(s2 )
i

Hasil padi - Uji Bartlett


Uji Kesamaan variansi Bartlett:
2
2
2
2
H0 : A = B = C = D
2
H1 : tidak semua i sama
Daerah penolakan ( = 0,05):
2
(0,05; 3) > 7,815
Keputusan:
2
(0,05; 3) < B = 1,726 H0 tidak ditolak.

ANAVA Dua Arah


Model untuk Eksperimen dua faktor:
Yijk = + i + j + ()ij + ijk ,
i = 1, 2, . . . , r, j = 1, 2, . . . , c dan k = 1, 2, . . . , n.

Asumsi:
Eror ikj independen dan berdistribusi normal dengan rerata
nol dan variansi 2 ; r i = 0, c j = 0,
i=1
j=1
r
()ij = c ()ij = 0
i=1
j=1

ANAVA Dua Arah


Sumber
Variasi

derajad bebas

Jumlah
Kuadrat
(SS)

Rata-rata Jumlah
Kuadrat (MS)

Variabel A

a1

SSA

MSA =

SSA
a1

FA =

MSA
MSE

Variabel B

b1

SSB

MSB =

SSB
b1

FB =

MSA
MSE

Interaksi (AB)

(a 1)(b 1)

SSAB

Sesatan

ab(k 1)

SSE

MSAB =

MSE =

Tij

SSA

Yijk

1
bk

h=1
b

Ti.

SSB

Yijk
j=1 h=1
a

T.j

Yijk

T2
abk

SSE

Yijk
i=1 j=1 h=1

i=1

2
Ti. C

1
ak

i=1
b

2
T.j C
k
2
Yijk

i=1 i=1 h=1


a

SSTO

=
=

b
2
Tij

i=1 i=1

i=1 i=1 h=1

SSAB

MSAB
MSE

SSE
ab(k1)

i=1 h=1

FAB =

SSAB
(a1)(b1)

rasio F

2
Yijk C

SSTO SSA SSB SSE

Platelet - ANAVA Dua Arah


Platelet adalah komponen sel darah yang memegang
peranan penting dalam pembekuan darah. Banyak platelet
yang normal dalam tubuh adalah antara 200.000 sampai
400.000 per cc. darah. Obat-obat tertentu yang digunakan
untuk mengobati kanker diketahui akan menurunkan banyak
platelet. Misalkan bahwa tiga obat D1 , D2 dan D3 digunakan
dalam tiga dosis yang berbeda L1 , L2 dan L3 , masing-masing
untuk empat orang pasien, yang kira-kira mempunyai banyak
platelet yang sama, yaitu 300.000. Diperoleh data banyak
platelet untuk 36 orang pasien.

Platelet - ANAVA Dua Arah

Dosis

L1
L2
L3

D1
245
289
246
323
206
137

302
252
250
235
254
237

Jenis obat
D2
248 213
283 255
278 194
278 298
228 241
164 191

D3
355
218
253
326
198
165

298
315
263
234
190
231

300

Platelet - ANAVA Dua Arah

220

240

260

D1
D2
D3

200

banyak platelet

280

obat

L1

L2
dosis

L3

Platelet - ANAVA Dua Arah

Dosis

L1
L2
L3
Jumlah

D1
T11 = 1088
T21 = 1054
T31 = 834
T.1 = 2976

Jenis obat
D2
T12 = 999
T22 = 1048
T32 = 824
T.2 = 2871

D3
T13 = 1186
T23 = 1076
T33 = 784
T.3 = 3046

Jumlah
T1. = 3273
T2. = 3178
T3. = 2442
T = 8892

Platelet - ANAVA Dua Arah


Sumber
Variasi

derajad
bebas

Jumlah Kuadrat
(SS)

Rata-rata Jumlah
Kuadrat (MS)

rasio F

Dosis (L)

34480, 05

17240, 03

FA = 10, 41

Obat (D)

1293, 05

646, 53

FB = 0, 39

Interaksi

3540, 12

885, 03

FAB = 0, 53

Sesatan

27

44697, 75

1655, 47

Lama Belajar - ANAVA dua-arah


Tiga mahasiswa putera dan puteri dipilih secara random dari
tiap-tiap tingkat (I,II,II,IV). Observasi rata-rata banyak jam
belajar per minggu dalam satu semester dicatat untuk
masing-masing 24 mahasiswa tersebut.

Lama Belajar - ANAVA dua-arah

22

24

26

28

30

putera
puteri

20

ratarata jam belajar per minggu

32

jender

II

III
tingkat

IV

Lama Belajar - ANAVA dua-arah


Df
tingkat
3
jkel
1
tingkat:jkel 3
Residuals
16

Sum Sq Mean Sq F value Pr(>F)


161.76
53.92 2.2531 0.12150
6.00
6.00 0.2507 0.62339
257.52
85.84 3.5869 0.03725
382.90
23.93

Pupuk - ANAVA dua-arah


Dua macam pupuk padi (A dan B) digunakan dalam kuantitas
1 kg dan 2 kg per petak. Suatu eksperimen faktorial 2 2
dengan empat observasi replikasi telah dilakukan dan
hasilnya direpresentasikan sebagai grak interaksi mean
(slide berikut). Apakah ada efek interaksi, faktor A atau faktor
2
B? (Diketahui ijk Yijk = 4202)

Pupuk - ANAVA dua-arah


A
B
A:B
Residuals

Df
1
1
1
12

Sum Sq Mean Sq F value


Pr(>F)
25.000 25.000
18.75 0.0009785
64.000 64.000
48.00 1.587e-05
1.000
1.000
0.75 0.4034593
16.000
1.333

50

55

60

65

70

Latihan Anova 2 arah

slow

country

rock

50

55

60

65

70

Latihan Anova 2 arah

Latihan Anova 2 arah

58

60

62

C
B
D
A

56

Tahan hidup bateri (jam)

64

merek

slow

country
jenis musik

rock

Latihan Anova 2 arah


Analysis of Variance Table
Response: life
Df
merek
3
jmusik
2
merek:jmusik 6
Residuals
36

Sum Sq Mean Sq F value Pr(>F)


199.68
66.56 2.9134 0.04748 *
10.23
5.12 0.2239 0.80048
125.76
20.96 0.9174 0.49383
822.47
22.85

Regresi
Analisis Regresi digunakan untuk menyelidiki hubungan
antara variabel dependen (respon) Y dengan variabel
independen (variabel penjelas, prediktor) X .
Hubungan antara Y dan X :
fungsional
statistik

Hubungan Fungsional
Contoh:
1
Y =1+ X
2

3
2
1
0
0

Hubungan Fungsional
Contoh:
Y = (X 3)2
3
2
1
0
0

Hubungan Statistik
Contoh:

3
2
1
0
0

Hubungan Statistik
Contoh:
1
Y =1+ X
2

3
2
1
0
0

Regresi Linear Sederhana


Diperoleh observasi berupa pasangan data (Y, X),
(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )
Model
Yi = 0 + 1 Xi + i

Asumsi: suku eror i independen dan berdistribusi normal


N (0, 2 )
Parameter 0 dan 1 dinamakan koesien regresi.

Regresi Linear Sederhana


Contoh
Dipunyai data umur dan tinggi dari sampel 8 buah pohon jenis tertentu
sbb.:
umur (tahun):
1
2
3
4
5
6
7
8
tinggi (meter): 1,10 1,13 2,38 2,32 3,14 4,27 4,45 5,52

Regresi Linear Sederhana


Contoh
Dipunyai data umur dan tinggi dari sampel 8 buah pohon jenis tertentu
sbb.:
umur (tahun):
1
2
3
4
5
6
7
8
tinggi (meter): 1,10 1,13 2,38 2,32 3,14 4,27 4,45 5,52
6

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Regresi Linear Sederhana


Contoh
Akan dicari garis linear y = b0 + b1 x yang paling "mewakili"

hubungan antara x (umur) dan y (tinggi)

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Metode Kuadrat Terkecil


Prinsip: meminimalkan jumlah kuadrat residu (ei )

JKR = n e2 = n (Yi Yi )2
i
i=1
i=1
Estimasi titik dari 0 dan 1 , yaitu b0 dan b1 (sering juga ditulis

dengan 0 dan 1 ) adalah nilai-nilai yang meminimalkan JKR.


Penduga garis regresi
y = b0 + b1 x

Metode Kuadrat Terkecil


Contoh
Data umur dan tinggi pohon
6

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Metode Kuadrat Terkecil


Contoh
Data umur dan tinggi pohon
6

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Metode Kuadrat Terkecil


Contoh
Data umur dan tinggi pohon
6

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Metode Kuadrat Terkecil


Contoh
Data umur dan tinggi pohon

1
2

Metode Kuadrat Terkecil


Contoh
Data umur dan tinggi pohon

1
2

yy

Metode Kuadrat Terkecil


Persamaan normal
n

yi = nb0 + b1
i=1

i=1
n

xi yi = b0
i=1

xi
n

x2
i

xi + b1
i=1

i=1

Metode Kuadrat Terkecil


n

Sxx =
i=1
n

(xi x)2 =

i=1
n

Syy =
i=1
n

Sxy =
i=1

(yi y ) =

1
2
xi (
n
2
yi

i=1

1
(
n

xi )2
i=1
n

y i )2
i=1

(xi x)(yi y ) =

i=1

xi yi ny
x

Metode Kuadrat Terkecil


Penduga untuk 0 dan 1
Sxy
Sxx
= y b1 x

b1 =
b0

Penduga untuk 2
n
2

s =
i=1

(yi y )2

n2

Regresi Linear Sederhana


Contoh
Data umur dan tinggi pohon:

b1 =
=
b0

=
=
=
=

Sxy
Sxx
27, 015
42
0, 6432
y b1 x

3, 03875 0, 6432(4, 5)
0, 1443

Regresi Linear Sederhana


Contoh
Data umur dan tinggi pohon:
Penduga untuk 2
n
2

=
i=1

(yi yi )2

n2

= Syy b1 Sxy

18, 02709 (0, 6432)27, 015


n2
= 0, 108507

Regresi Linear Sederhana


Contoh

Data umur dan tinggi pohon: y = 0, 1443 + 0, 6432x


6

tinggi (meter)

5
4
3
2
1
0
0

4
5
6
umur (tahun)

Inferensi dalam Regresi


Parameter 0
b0 0
T =
S(b0 )

dengan
S(b0 ) = s

dan T tn2

n
2
i=1 xi

nSxx

Inferensi dalam Regresi


Parameter 1
b1 1
T =
S(b1 )

dengan
s
S(b1 ) =
Sxx

dan T tn2

Inferensi dalam Regresi


Rerata respon Yk

Rerata respon Y untuk X = xk adalah k = 0 + 1 xk .

Variabel random Yk = b0 + b1 xk digunakan untuk


mengestimasi k

Yk k
T =

S(Yk )
dengan

S(Yk ) = s
dan T tn2

1 (xk x)2

+
n
Sxx

Inferensi dalam Regresi


Prediksi dari Yk

Variabel random Yk Yk digunakan untuk inferensi prediksi


dari Yk = 0 + 1 xk + k

Yk Yk
T =

S(Yk Yk )

dengan
1 (xk x)2

k Yk ) = s 1 + +
S(Y
n
Sxx

dan T tn2

Inferensi dalam Regresi

Inferensi dalam Regresi


ANAVA untuk regresi
n

i=1

(yi y )2 =

i=1

(i y )2 +
y

i=1

JKReg

JKTotal

JKTotal = Syy
JKReg = b1 Sxy
2
JKE = n yi b0
i=1

n
i=1 yi

b1

(yi y )2

JKE

n
i=1 xi yi

= Syy b1 Sxy

Inferensi dalam Regresi


ANAVA untuk regresi
Bila observasi Y dilakukan lebih dari satu kali untuk suatu
harga x, jumlah kuadrat eror (JKE) dapat lebih lanjut dipecah
menjadi
JKE =
JKK
+ JKM
total eror

kurang sesuai

murni

Inferensi dalam Regresi


ANAVA untuk regresi
Misalkan ada k harga x yang berbeda,
y11 , . . . , y1n1
y21 , . . . , y1n2
.
.
.
yk1 , . . . , yknk

observasi berulang Y pada x1


observasi berulang Y pada x2
.
.
.
.
.
.
observasi berulang Y pada xk

Inferensi dalam Regresi


ANAVA untuk regresi
k

ni

JKM =
i=1 j=1

(yij yi )2

JKK = JKE JKM

Tabel ANAVA regresi ditambah uji linearitas regresi


JKK/(k2)
F = JKM/(nk) dengan F Fk2,nk

Analisis Korelasi
Koesien korelasi antara Y dan X adalah
=

Kov(X, Y )
Var(X)Var(Y )

1 1

dimana Y dan X dianggap variabel random berdistribusi


bersama tertentu.

Analisis Korelasi
menunjukkan tingkat hubungan linear antara kedua variabel.
Estimasi titik untuk adalah
r =
= b1

i=1 (xi x)(yi y )


n
2
2
i=1 (xi x) (yi y )

Sxx
Syy

Analisis Korelasi
Untuk regresi linear sederhana, kuadrat dari koesien korelasi
sama dengan Koesien determinasi
JKE
JKReg
r =1
=
JKTot
JKTot
2

Analisis Korelasi
Inferensi dapat dilakukan dengan menggunakan statistik
Z=

dengan Z N (0, 1)

n3
log
2

(1 + r)(1 + 0 )
(1 r)(1 + 0 )

Analisis Korelasi

4 5 6 7 8 9

3 4 5 6 7 8 9

11

r=0,82

10

12

14

10

12

14

10

12

10

12

14

10

10

12

12

14

16

18

Regresi Linear Ganda


Diperoleh observasi berupa (x1i , x2i , . . . , xki , yi ), i = 1, . . . , n,
dengan yi adalah variabel dependen dan xi adalah variabel
independen.
Model
Yi = 0 + 1 X1i + . . . + k Xki + i
Asumsi: suku eror i independen dan berdistribusi normal
N (0, 2 )

Regresi Linear Ganda


Penduga kuadrat terkecil untuk 0 , 1 , . . . , k adalah
harga-harga b0 , b1 , . . . , bk yang meminimalkan JKR seperti
dalam regresi linear sederhana. Diperoleh persamaan normal
(1)

nb0

(2)
.
.
.

b0

n
i=1

x1i

(k + 1)

b0

n
i=1

xki

x1i

+...

+bk

+b1

n
i=1
n
i=1

x2
1i

+...

+b1

n
i=1

xki x1i

+...

+b1

xki

+bk

n
i=1
n
i=1

x1i xki

=
.
.
.

+bk

n
i=1

x2
ki

n
i=1
n
i=1

x1i yi

n
i=1

xki yi

yi

Regresi Linear Ganda


Menggunakan matriks


. . . xk1
1
0

. . . xk2 1 2
. . + .
..
. . .
.
. . .

Y1
1 x11 x21

Y2 1 x12 x22
. = .
.
.
. .
.
.
.
.
. .
Yn
1 x1n x21 . . . xkn
Y

dimana N (0, 2 In )

Regresi Linear Ganda


Persamaan normal ditulis dalam bentuk matriks
(XT X)b = XT y

Penduga kuadrat terkecil untuk


b = (XT X)1 XT y

dengan syarat (XT X) tak-singular.

Contoh Regresi Linear Ganda


4

10

30

35

40

10

20

25

10

X1

X2

20

25

30

35

40

10

Contoh Regresi Linear Ganda


Y
25.5
31.2
25.9
38.4
18.4
26.7
26.4
25.9
32
25.2
39.7
35.7
26.5

X1
1.74
6.32
6.22
10.52
1.19
1.22
4.10
6.32
4.08
4.15
10.15
1.72
1.7

X2
5.3
5.42
8.41
4.63
11.60
5.85
6.62
8.72
4.42
7.60
4.83
3.12
5.30

n = 13;

Y = 377, 5;

X1 = 59.43;
X2 = 81, 82;

Y 2 = 11400, 15;

2
X1 = 394, 7255;
2
X2 = 576, 7264;

X1 Y = 1877, 567;

X1 X2 = 360, 6621

X2 Y = 2246, 661;

Contoh Regresi Linear Ganda


Persamaan normal
b0 n
+b1
b0 x1 +b1
b0 x2 +b1

x1
+b2
x2
+b2
1
x1 x2 +b2

x2
=
x1 x2 =
x2
=
2

y
x1 y
x2 y

+59, 43b1
+81, 82b2
= 377, 5
13b0
59, 43b0 +394, 7255b1 +360, 6621b2 = 1877, 567
81, 82b0 +360, 6621b1 +576, 7264b2 = 2246, 661

Contoh Regresi Linear Ganda


Y = 36.095 + 1.031X1 + 1.870X2

Analysis of Variance Table


Response: Y
Df Sum Sq Mean Sq F value
Pr(>F)
X1
1 187.312 187.312 46.821 4.499e-05
X2
1 210.813 210.813 52.695 2.729e-05
Residuals 10 40.006
4.001

Koesien determinasi Ganda


Untuk melihat pengaruh semua variabel independen secara
bersama terhadap variabel dependen.
JK JKE
R =
JK
2

Contoh Koesien determinasi Ganda


Dari data contoh di muka
JK =

Y 2 nY 2

= 11400, 15 (13)(377, 5)2


= 438, 13

438, 13 40, 01
=
438, 13
= 0, 9087

Pengaruh X1 dan X2 secara bersama terhadap Y adalah


90,87%

Koesien Korelasi Parsial


Dapat dihitung bila dipunyai lebih dari dua variabel random
X1 , X2 , . . . , Xp
Untuk Regresi ganda (Y, X1 , X2 )
ryx1 .x2 : koesien korelasi parsial antara Y dan X1

dengan X2 dianggap konstan

ryx2 .x1 : koesien korelasi parsial antara Y dan X2

dengan X1 dianggap konstan

Koesien Korelasi Parsial


ryx1 .x2 =

ryx2 .x1 =

ryx1 ryx2 rx1 x2

1/2

ryx2 ryx1 rx2 x1

1/2

2
2
(1 ryx2 )(1 rx1 x2 )

2
2
(1 ryx1 )(1 rx2 x1 )

dimana ryxi adalah koesien korelasi sederhana antara y dan


xi , i = 1, 2

Koesien Korelasi Parsial


Hubungan antara koesien determinasi ganda dengan
koesien korelasi parsial
2
2
2
(1 Ry.x1 x2 ...xp ) = (1 ryx1 )(1 ryx2 .x1 ) . . . (1 ryxp .x1 x2 ...x(p1) )

Untuk Regresi ganda (Y, X1 , X2 )


2
2
2
(1 Ry.x1 x2 ) = (1 ryx1 )(1 ryx2 .x1 )

Contoh Koesien Korelasi Parsial


4

10

0.786

30

35

0.654

40

10

20

25

0.153

0.654

X1

0.153
8

10

0.786

X2

20

25

30

35

40

10

Contoh Koesien Korelasi Parsial


ryx1 .x2

ryx2 .x1

0, 654 (0, 786)(0, 154)

[(1 (0, 786)2 )(1 (0.024)2 )]1/2


= 0, 873

0, 786 0, 654(0, 154)

[(1 0, 6542 )(1 (0.024)2 )]1/2


= 0, 917

Contoh Koesien determinasi Ganda


Menggunakan korelasi parsial
2
(1 Ry.x1 x2 ) = (1 0, 6542 )(1 0, 9172 )

= 0, 0909

2
jadi Ry.x1 x2 = 0, 9091

Analisis Regresi Ganda: Uji Hipotesis


Uji hipotesis keseluruhan koesien regresi bersama-sama
H0 : 1 = 2 = . . . = p = 0
Statistik Penguji:
F =

JKReg/p
JKE/(n p 1)

dimana JKReg = JK JKE,

dengan JK = Y 2 nY 2
dan F F(p; np1)

Analisis Regresi Ganda: Uji Hipotesis


Uji hipotesis parsial dari koesien regresi,
misalnya
H0 : 1 = 2 = 0
H0 : 1 = 0
Statistik Penguji:
F =

(Tambahan JKReg karena Xi )/1


JKE/(n p 1)

Analisis Regresi Ganda: Uji Hipotesis


Misalnya untuk regresi ganda (Y, X1 , X2 ) dan H0 : 2 = 0
2
(R2 ryx1 )JK
F =
JKE/(n 3)

Analisis Regresi Ganda: Uji Hipotesis


Contoh:
Dari data di muka H0 : 1 = 2 = 0

398, 13/2
=
40, 01/10
= 49, 754

p-value = 6.349957e-06 (< 0, 001, sangat kecil),


persamaan regresi signikan

Analisis Regresi Ganda: Uji Hipotesis


Contoh:
Dari data di muka H0 : 2 = 0 (Uji parsial)

(0, 9087 0, 6542 )438, 13


=
40, 01/10
= 52, 69

p-value = 2.730164e-05 (< 0, 001, sangat kecil)


kontribusi X2 setelah X1 ada di dalam persamaan regresi
adalah signikan

Regresi Polinomial
Variabel X dalam bentuk polinomial berderajat lebih dari satu.
Y = 0 + 1 X +
Y = 0 + 1 X + 2 X 2 +
Y = 0 + 1 X + 2 X 2 + . . . + p X p +

(Variabel independen X mungkin lebih dari satu)

1600
1400
1200

1800

Contoh Regresi Polinomial

1500

2000

2500
X

Contoh Regresi Polinomial

1600
1400
1200

1800

Y = 578.9278 + 0.5403X

1500

2000

2500
X

Contoh Regresi Polinomial

1600
1400
1200

1800

Y = 1216.144 + 2.399X 0.00045X 2

1500

2000

2500
X

Contoh Regresi Polinomial

1600
1400
1200

1800

Pengamatan berulang pada Y

1500

2000

2500
X

Contoh Regresi Polinomial


Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value
Pr(>F)
X
1 2150691 2150691 35725.8 < 2.2e-16
Xf
8 442063
55258
917.9 < 2.2e-16
Residuals 20
1204
60

Contoh Regresi Polinomial

1600
1400
1200

1800

Y = 572.4012 + 0.5452X

1500

2000

2500
X

Contoh Regresi Polinomial

1600
1400
1200

1800

Y = 1265.32 + 2.45X + 0.00046X 2

1500

2000

2500
X

Analisis Data Kategorik


Data kategorik
biologi
kesehatan
ilmu-ilmu sosial

Data kategorik
Tabel data cacah hasil klasikasi silang (contingency table)

Tabel Kategorik 2 2
Uji Hipotesis dalam Tabel kategorik 2 2
Uji homogenitas (dua sampel)

Uji independensi (satu sampel)

baris
b1
b2
Total

kolom
k1
k2
a
b
c
d
a+c b+d

total
a+b
c+d
n

Uji homogenitas
Dua sampel random masing-masing terdiri dari 100 pria dan
100 wanita. Diajukan pertanyaan, "Apakah anda setuju wanita
mempunyai hak dan kewajiban yang sama dengan pria?"
baris
pria
wanita
Total

kolom
setuju tidak
30
70
45
55
75
125

total
100
100
200

Uji homogenitas
baris
populasi 1
populasi 2
Total

kolom
sukses
gagal
a
b
c
d
m1 = a + c m2 = b + d

total
n1 = a + b
n2 = c + d
n

H0 : dua populasi tersebut mempunyai probabilitas untuk


mendapatkan sukses yang sama
H 0 : p1 = p2

Uji homogenitas
H 0 : p1 = p2
H 1 : p1 = p2

Statistik penguji:
n(ad bc)2
W =
m1 m2 n1 n2
H0 ditolak jika W > 2
(1;)

Uji homogenitas
H0 : Homogenitas populasi pria dan wanita atau H0 : p1 = p2

baris
pria
wanita
Total

kolom
setuju tidak
30
70
45
55
75
125

total
100
100
200

Statistik penguji:

200(30 55 70 45)2
600
=
= 4, 8
75 125 100 100
125

Karena W > 2
(1;0,05) = 3,841 maka H0 ditolak: ada perbedaan
sikap antara dua populasi.

Uji Independensi (satu sampel)


kolom
baris

k1

k2

total

b1

P11

P12

P1. = P11 + P12

b2

P21

P22

P2. = P21 + P22

Total

P.1 = P12 + P22

P.2 = P12 + P22

H0 : Independensi antara variabel baris dan


kolom
H0 : Pij = Pi Pj , i = 1, 2 dan j = 1, 2
Prosedur uji sama seperti uji homogenitas

Uji Independensi (satu sampel)


Dari suatu sampel random yang terdiri dari 200 laki-laki
berumur 50 sampai 65 tahun Diperoleh data sebagai berikut:
penyakit gula
ada
tidak ada
Total

penyakit jantung
ada tidak ada
16
20
32
132
48
152

total
36
164
200

H0 : Penyakit jantung dan gula independen


Statistik penguji:

200(16 132 32 20)2


= 10,06
48 152 36 164

Karena W > 2
(1;0,05) = 3,841 maka H0 ditolak: kedua penyakit
tersebut tidak independen

Tabel Kategorik b k
baris
B1
...
Bb
Total

kolom
K1 ... Kk
y11 ... y1k
... ... ...
yb1 ... ybk
m1 ... mk

total
n1
...
nb
n

Tabel Kategorik b k
Statistik penguji:
W =
ij

(Oij Eij )2
Eij

dengan Oij = yij dan Eij = (ni mj )/n


H0 ditolak jika W > 2
((b1)(k1);)

Tabel Kategorik b k
Uji Homogenitas untuk b populasi multinomial
baris
B1
...
Bb

kolom
K1 ... Kk
P11 ... P1k
... ... ...
Pb1 ... Pbk

total
1
...
1

H0 : Pi1 = P1 ; . . . ; Pik = Pk , untuk i = 1, . . . , b dimana P1 , . . . Pk


tidak diketahui tetapi k Pj = 1
j=1

Tabel Kategorik b k : Homogenitas


Dua sampel random masing-masing terdiri dari 100 pria dan
100 wanita. Diajukan pertanyaan, "Apakah anda setuju wanita
mempunyai hak dan kewajiban yang sama dengan pria?"
baris
pria
wanita
Total

kolom
setuju tidak
30
70
(37,5) (62,5)
45
55
(37,5) (62,5)
75
125

total
100
100
200

Statistik penguji:
W

=
ij

(Oij Eij )2
Eij

(30 37, 5)2


(70 62, 5)2
(45 37, 5)2
(55 62, 5)2
=
+
+
+
37, 5
62, 5
37, 5
62, 5
= 4,8

Tabel Kategorik b k
Uji Independensi
baris
B1
...
Bb
Total

kolom
K1 ... Kk
P11 ... P1k
... ... ...
Pb1 ... Pbk
P.1 ... P.k

total
P1.
...
Pb.
1

H0 : Independensi antara dua kategorisasi (variabel)


H0 : Pij = Pi Pj , i = 1, . . . , b dan j = 1, . . . , k

Tabel Kategorik di SPSS


DATA LIST FREE
/jkel (F1) setuju (F1) N (F3).
BEGIN DATA
1 1 30
1 2 70
2 1 45
2 2 55
END DATA.

Tabel Kategorik di SPSS


VARIABLE LABELS jkel jenis kelamin.
VALUE LABELS jkel
1 laki-laki
2 perempuan.
VARIABLE LABELS setuju setuju.
VALUE LABELS setuju
1 Ya
2 Tidak.
WEIGHT
BY n .

Tabel Kategorik di SPSS


CROSSTABS
/TABLES=jkel BY setuju
/FORMAT= AVALUE TABLES
/STATISTIC=CHISQ
/CELLS= COUNT EXPECTED.

Fishers Exact Test


The Lady Tasting Tea
Salah seorang teman Fisher menyatakan bahwa dia bisa
membedakan rasa antara air teh yang dituangkan sebelum
atau dituangkan setelah susu. untuk menguji teman tersebut
Fisher memberikan 8 cangkir minuman, dimana 4 diantaranya
teh-susu (teh dituangkan dulu baru kemudian susu), dan 4
yang lain susu-teh. Urutan penyajian cangkir dibuat random.

Fishers Exact Test


Salah satu kemungkinan hasilnya
dugaan
kenyataan susu teh total
susu
3
1
4
teh
1
3
4
4
4

Fishers Exact Test


Bila semua margin dibuat tetap,
baris
b1
b2
Total

kolom
k1 k2
n11 n12
n21 n22
n.1 n.2

dengan H0 : independen, n11


total
n1.
n2.
n

berdistribusi hipergeometrik

p(n11 = x) =

n1.
x

n2.
n.1 x
n
n.1

Fishers Exact Test


The Lady Tasting Tea
kolom
baris k1 k2 total
b1
3
1
4
b2
1
3
4
Total 4
4

Probabilitas untuk n11 = 3

p(n11 = 3) =

4
3

4
1
8
4

= 0.229

Fishers Exact Test


The Lady Tasting Tea

Probabilitas untuk nilai n11 yang


baris
b1
b2
Total

kolom
k1 k2
3
1
1
3
4
4

lebih ekstrim (mendukung Ha )


total
4
4

p(n11 3) = 0, 243
(nilai dari p-value satu sisi dari
uji ini)

Fishers Exact Test


The Lady Tasting Tea
kolom
baris k1 k2 total
b1
3
1
4
b2
1
3
4
Total 4
4

Probabilitas untuk nilai p-value


dua arah, dihitung jumlahan
p(n11 = x) untuk x sedemikian
sehingga p(N11 ) p(x),

p(n11 = 0) + p(n11 = 1) + p(n11 = 3) + p(n11 = 4) =


0, 0143 + 0, 229 + 0, 229 + 0, 0143 = 0, 486

Ukuran Keeratan Hubungan


Cramer

W
Q1 =
n(q 1)
dengan 0 Q1 1; q = min(b, k); n ukuran sampel
Pearson

Q2 =
dengan 0 Q2

q1
q

W
n+W

Uji Goodness of t
GOF distribusi multinomial
n!
1 n1 2 n2 . . . c nc
p(n1 , n2 , . . . , nc1 ) =
n1 !n2 ! . . . nc !
H0 : frekuensi observasi {y1 , y2 , . . . , yk } berdistribusi
multinomial 1 2 . . . c

Uji Goodness of t
Dalam suatu eksperimen persilangan dua macam
tanaman, Mendel memperoleh hasil seperti tabel di
bawah. Menurut teorinya, perbandingannya adalah
9:3:3:1. Apakah hasil ini cenderung bertentangan dengan
Teori Mendel?
Macam tanaman
yi
npi
pi
bulat dan kuning

315 312,75 9/16

bulat dan hijau

108 104,25 3/16

berkeriput dan kuning 101 104,25 3/16


berkeriput dan hijau
jumlah

32
556

34,75 1/16
556

Uji Goodness of t
H0 : frekuensi observasi {y1 , y2 , . . . , yk } berdistribusi
9 3 3 1
multinomial 16 , 16 , 16 , 16

Statistik penguji W =

(Oi Ei )2
Ei

= 0, 47

Kriteria penolakan 2 (3, 0, 05) = 7, 815


H0 tidak ditolak, data frekuensi pada tabel sesuai dengan
teori Mendel

Uji Goodness of t
Uji Multinomial dengan parameter diestimasi
Bila probabilitas 1 2 . . . c tidak sepenuhnya diketahui tetapi
bergantung pada parameter-parameter 1 , 2 , . . . , q yang tidak
diketahui (q < c 1)
H0 : i = fi (1 , 2 , . . . , q ),

i = 1, 2, . . . , c

Statistik penguji W 2
c1q

Uji Goodness of t
Menurut teori genetika, keturunan suatu perkawinan tertentu
akan termasuk dalam salah satu dari tiga kelompok di bawah
ini dengan probabilitas sbb.:
Kelompok G1
G2
G3
Prob.
2 2(1 ) (1 )2
dengan 0 < < 1 dan tidak diketahui

Uji Goodness of t
H 0 : p1 = 2 ,
diketahui

p2 = (1 ),

p3 = (1 )2

= 2y1 + y2 = y1 + y2

2n
n
2n

Kelompok
Prob.
yi

G1
2
12

G2
2(1 )
56

G3
(1 )2
32

Inferensi Nonparametrik
tanpa asumsi tertentu ttg. bentuk distribusi populasinya
memanfaatkan aspek sederhana dari data (tanda,

urutan, frekuensi, dst.)

skala pengukuran dan jenis data tidak terlalu berarti

Statistik berurut
Misalkan {X1 , X2 , . . . , Xn } suatu sampel random berukuran n
dari suatu populasi
Statistik berurut dari sampel random tersebut di atas:
X(1) X(2) . . . X(n)

Median
Median untuk variabel random kontinu X adalah suatu
bilangan M sedemikian sehingga
P (X M ) = P (X M ) = 0, 5

Median
Median untuk variabel random kontinu X adalah suatu
bilangan M sedemikian sehingga
P (X M ) = P (X M ) = 0, 5

Median
Median untuk variabel random kontinu X adalah suatu
bilangan M sedemikian sehingga
P (X M ) = P (X M ) = 0, 5

Median

Median sampel (X )
Misalkan {X1 , X2 , . . . , Xn suatu sampel random berukuran n
dari suatu populasi

x n+1
jika n ganjil
( 2 )

X= 1
x n +x n
jika n genap
2
( )
( +1)
2

Median

Interval kondensi (1 )100% untuk X


X(r) dan X(s) sedemikian sehingga
P (X(r) M X(s) ) = (1 )

dengan
1
P (Y < r) = Binomial(r 1, n, )
2
r1

=
k=0

n 1 n
( )
2
k 2

Median: Contoh
Data (Xi ):
9850 7223 6421 20118 10670 4274
8641 22087 8400 11200
Data (X(i) ):
4274 6421 7223 8400 8641
9850 10670 11200 20118 22087
= 1 X(5) + X(6) = 1 [8641 + 9850] = 9245.5
X
2
2

Median: Contoh
interval kondensi

0.10

0.20

0.30

X(2) = 6421 M 11200 = X(8)

0.00

0.0547

10

Dua sampel dependen


Data: {(X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn )}
Hipotesis H0 : P (X > Y ) = P (X < Y )
H1 : P (X > Y ) < P (X < Y )
H1 : P (X > Y ) > P (X < Y )
Prosedur uji:
Eliminasikan semua observasi yang sama, Xi = Yi

Uji Tanda (Sign Test)


H0 : p = 0, 5
H1 : p = 0, 5
dimana p = p(X < Y | x = Y )
Statistik uji:
Y

= banyaknya pasangan dengan Xi < Yi


= banyaknya tanda + dari (Yi Xi )

Uji Tanda (Sign Test)


Daerah kritik (sampel kecil)
H0 ditolak jika 0 Y a atau n a + 1 Y n, dimana a
dipilih sedemikian sehingga
1
= 2P (0 Y a) = 2 Binomial(a; n; )
2

Uji Tanda (Sign Test)


Daerah kritik (sampel besar)

n
H0 ditolak jika Y < 2 c 2n atau

Y > n + c 2n
2
dimana c = Z/2 , harga variabel random N (0, 1)

Contoh Dua Sampel Dependen


Berat waktu lahir 10 pasang bayi kembar
X: 2,81 2,13 2,31 2,22 2,77 3,27 2,31 2,59 2,81 2,13
Y: 2,68 1,91 2,40 1,81 2,45 2,40 2,49 2,22 2,63 1,72
+
+
jadi Y = 2 dan B(0,10,0,5)+B(1,10,0,5)+B(2,10,0,5)=0,055

Uji Wilcoxon
H 0 : Md = 0
H 1 : Md = 0
dimana Md adalah median distribusi selisih di = (Yi Xi )

Asumsi:
di adalah sampel random berdistribusi kontinu yang simetrik
terhadap Md sedemikian sehingga Md = x y (median =
mean)

Uji Wilcoxon
H0 : x = y
H1 : x = y

Prosedur uji:
Urutkan | di | dan diberi ranking Ri untuk setiap | di |.
ui =

0
Ri

jika di = Yi Xi < 0
jika di = Yi Xi > 0

Uji Wilcoxon
Statistik uji: T + = u1 + u2 + . . . + un
Daerah kritik H0 ditolak jika T + C1 atau T + C2
C1 diperoleh dari tabel Rank Bertanda Wilcoxon
dan
C2 = n(n+1) C1
2

Uji Wilcoxon
Contoh:
Xi
2,81
2,13
2,31
2,22
2,77
3,27
2,31
2,59
2,81
2,13

Yi
2,68
1,91
2,40
1,81
2,45
2,40
2,49
2,22
2,63
1,72

di = Yi Xi
-0,13
-0,22
0,09
-0,41
-0,32
-0,87
0,18
-0,37
-0,18
-0,41

| di |
0,13
0,22
0,09
0,41
0,32
0,87
0,18
0,37
0,18
0,41

Ri
2,0
5,0
1,0
8,5
6,0
10.0
3,5
7,0
3,5
8,5

ui
0
0
1
0
0
0
3,5
0
0
0

Tabel untuk n = 10
3
.0049
4

...

...

...

...

.0244

...

...

diperoleh T + = 1 + 3, 5 = 4, 5
dari tabel P (T + 8) = 0, 0244, daerah kritik uji ini untuk
= 2 0, 0244:
T + 8 dan T + 47

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II
1
31,7 29,1
1. Lakukan uji Tanda
2
26,9 28,4
2. Lakukan uji rank bertanda
3
26,5 27,0
Wilcoxon
4
19,6 17,8
5
40,8 37,2
6
32,3 28,4
7
27,8 27,0
8
29,2 31,2

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II Yi Xi tanda
1
31,7 29,1
-2,6
Uji Tanda
2
26,9 28,4
1,5
+
3
26,5 27,0
0,5
+
4
19,6 17,8
-1,8
5
40,8 37,2
-3,8
6
32,3 28,4
-3,9
7
27,8 27,0
-0,8
8
29,2 31,2
2,0
+

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II Yi Xi tanda
1
31,7 29,1
-2,6
Uji Tanda
2
26,9 28,4
1,5
+
Dari tabel distribusi bi3
26,5 27,0
0,5
+
nomial kumulatif untuk
4
19,6 17,8
-1,8
x = 3 diperoleh p-value
5
40,8 37,2
-3,8
0,363 (satu sisi) atau
6
32,3 28,4
-3,9
0,727 (dua sisi)
7
27,8 27,0
-0,8
8

29,2

31,2

2,0

+
Y =3

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II Yi Xi Ri ui
1
31,7 29,1
-2,6 6
0
Uji rank bertanda Wilcoxon
2
26,9 28,4
1,5 3
3
3
26,5 27,0
0,5 1
1
4
19,6 17,8
-1,8 4
0
5
40,8 37,2
-3,8 7
0
6
32,3 28,4
-3,9 8
0
7
27,8 27,0
-0,8 2
0
8
29,2 31,2
2,0 5
5
T+ = 9

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II Yi Xi Ri ui
1
31,7 29,1
-2,6 6
0
Uji rank bertanda Wilcoxon
2
26,9 28,4
1,5 3
3
Tabel Rank bertanda Wilcoxon
n=8
3
26,5 27,0
0,5 1
1
0
.0039
4
19,6 17,8
-1,8 4
0
...
...
5
40,8 37,2
-3,8 7
0
6
.0547
6
32,3 28,4
-3,9 8
0
...
...
7
27,8 27,0
-0,8 2
0
8
29,2 31,2
2,0 5
5
T+ = 9

Contoh dua sampel dependen


Tercatat jam belajar waktu tahun pertama dan tahun kedua
dari delapan mahasiswa sbb.:
mhs th I
th II Yi Xi Ri ui
1
31,7 29,1
-2,6 6
0
Uji rank bertanda Wilcoxon
2
26,9 28,4
1,5 3
3
Tabel Rank bertanda Wilcoxon
n=8
3
26,5 27,0
0,5 1
1
0
.0039
4
19,6 17,8
-1,8 4
0
...
...
5
40,8 37,2
-3,8 7
0
6
.0547
6
32,3 28,4
-3,9 8
0
...
...
7
27,8 27,0
-0,8 2
0
H0 ditolak jika T + 6 atau
8
29,2 31,2
2,0 5
5
T + 30
T+ = 9

Dua sampel dependen: SPSS


Menu: Analyze
-Nonparametric Tests
-2 Related Samples
NPAR TEST
/WILCOXON=x WITH y (PAIRED)
/SIGN= x WITH y (PAIRED)
/STATISTICS DESCRIPTIVES.

Dua sampel dependen: SPSS


Wilcoxon Signed Ranks Test
Ranks
tahun 2 - tahun 1

a
b
c

Negative Ranks
Positive Ranks
Ties
Total
tahun 2 < tahun 1
tahun 2 > tahun 1
tahun 1 = tahun 2

Test Statistics
tahun 2 - tahun 1
Z
-1,260
Asymp. Sig. (2-tailed) ,208
a
Based on positive ranks.
b
Wilcoxon Signed Ranks Test

N
5
3
0
8

Mean Rank
Sum of Ranks
5,40
27,00
3,00
9,00

Dua sampel dependen: SPSS


Sign Test
Frequencies
N
tahun 2 - tahun 1
Negative Differences
Positive Differences
3
Ties
0
Total
8
a
tahun 2 < tahun 1
b
tahun 2 > tahun 1
c
tahun 1 = tahun 2
Test Statistics
tahun 2 - tahun 1
Exact Sig. (2-tailed)
,727
a
Binomial distribution used.
b
Sign Test

K sampel dependen
Data:
Subjek
1
2
.
.
.
n

I
X11
X12

II
X21
X22

III
X31
X32

...
...
...

k
Xk1
Xk2

...
X1n

...
X2n

...
X3n

...
...

...
Xkn

K sampel dependen
Data: Ranking per subjek (baris)
Subjek
I
II
III . . .
1
R11 R21 R31 . . .
2
R12 R22 R32 . . .
.
.
...
...
... ...
.
n
jumlah

R1n
R1

R2n
R2

R3n
R3

...
...

k
Rk1
Rk2
...
Rkn
Rk

K sampel dependen
Uji Friedman
12
W =
nk(k + 1)

k
j=1

2
Rj 3n(k + 1)

untuk n dan/atau k tidak terlalu kecil, W k1

K sampel dependen
Contoh:
Dua belas siswa yang dipilih secara random terlibat dalam
eksperimen belajar bahasa. Kepada setiap siswa diberikan
empat daftar (I, II, III, dan IV) kata-kata yang harus dipelajari.
Sehabis mempelajari satu daftar, kepada mereka diberikan
ujian. Hasilnya:

K sampel dependen
Data skor ujian
Siswa
I
II
1
18 14
2
7
6
3
13 14
4
15 10
5
12 11
6
11 10
7
15 16
8
10
8
9
14 12
10
11
8
11
8
6
12
10 11

III
16
5
16
12
13
9
10
11
13
9
9
13

IV
20
10
17
14
18
16
14
16
15
10
14
16

K sampel dependen
Data skor ujian
Siswa
I
II
1
18 14
2
7
6
3
13 14
4
15 10
5
12 11
6
11 10
7
15 16
8
10
8
9
14 12
10
11
8
11
8
6
12
10 11

III
16
5
16
12
13
9
10
11
13
9
9
13

IV
20
10
17
14
18
16
14
16
15
10
14
16

Ranking skor ujian (per siswa)


Siswa I II III IV
1
3 1 2 4
2
3 2 1 4
3
1 2 3 4
4
4 1 2 3
5
2 1 3 4
6
3 2 1 4
7
3 4 1 2
8
2 1 3 4
9
3 1 2 4
10
4 1 2 3
11
2 1 3 4
12
1 2 3 4

K sampel dependen
Data skor ujian
Siswa
I
II
1
18 14
2
7
6
3
13 14
4
15 10
5
12 11
6
11 10
7
15 16
8
10
8
9
14 12
10
11
8
11
8
6
12
10 11

III
16
5
16
12
13
9
10
11
13
9
9
13

IV
20
10
17
14
18
16
14
16
15
10
14
16

Ranking skor ujian (per siswa)


Siswa
I
II III IV
1
3
1
2
4
2
3
2
1
4
3
1
2
3
4
4
4
1
2
3
5
2
1
3
4
6
3
2
1
4
7
3
4
1
2
8
2
1
3
4
9
3
1
2
4
10
4
1
2
3
11
2
1
3
4
12
1
2
3
4
jml
31 19 26 44

K sampel dependen
Statistik penguji
W

12
nk(k + 1)

k
j=1

2
Rj 3n(k + 1)

12
(312 + 192 + 262 + 442 ) 3(12)(5)
12(4)(5)
= 16, 7

Daerah kritis (3,0,01) = 11, 3449


Kesimpulan: H0 ditolak, daftar kata-kata tersebut tidak sama
mudahnya

K sampel dependen
Lima orang kontestan dalam suatu lomba dinilai oleh 7 orang
juri dengan hasil sebagai berikut:
juri
1
2
3
4
5
6
7

A
4
3
4
5
3
1
3

kontestan
B
C D
3
2
1
5
2
4
2
5
1
1
3
2
4
2
5
5
2
4
1
1
2

E
5
1
3
4
1
3
5

Apakah kelima kontestan


mempunyai nilai yang berbeda?

K sampel dependen
Lima orang kontestan dalam suatu lomba dinilai oleh 7 orang
juri dengan hasil sebagai berikut:
juri
1
2
3
4
5
6
7

A
4
3
4
5
3
1
3
23

kontestan
B
C D
3
2
1
5
2
4
2
5
1
1
3
2
4
2
5
5
2
4
1
4
2
21 20 19

E
5
1
3
4
1
3
5
22

Statistik penguji
W

=
=

12
nk(k + 1)

k
j=1

2
Rj 3n(k + 1)

12
(232 + 212 + 202 + 192
7(5)(6)

+ 222 ) 3(7)(6)
= 0, 5714

K sampel dependen
Lima orang kontestan dalam suatu lomba dinilai oleh 7 orang
juri dengan hasil sebagai berikut:
juri
1
2
3
4
5
6
7

A
4
3
4
5
3
1
3
23

kontestan
B
C D
3
2
1
5
2
4
2
5
1
1
3
2
4
2
5
5
2
4
1
4
2
21 20 19

E
5
1
3
4
1
3
5
22

Statistik penguji W = 0, 5714


Daerah kritis (4,0,01) = 13, 277
Kesimpulan: H0 tidak ditolak,
kelima kontestan tersebut
mempunyai nilai yang sama

K sampel dependen:SPSS
NPAR TESTS
/FRIEDMAN = d1 d2 d3 d4
/STATISTICS DESCRIPTIVES.

Test Statistics
N
12
Chi-Square 16,700
df 3
Asymp. Sig. ,001
a
Friedman Test

Dua sampel independen


Uji jumlah rank Wilcoxon atau Mann-Whitney
Data:
Populasi Ukuran sampel
Observasi
1
m
X1 , X2 , . . . , Xm dengan m n
n
Y1 , Y2 , . . . , Yn
2

Dua sampel independen


Asumsi :
Dua sampel random tersebut independen
distribusi probabilitas kontinu
kedua distribusi berbentuk sama

Dua sampel independen


Hipotesis :
H0 : kedua distribusi identik, yaitu x = y
H1 : kedua distribusi tidak identik, yaitu x = y
Prosedur Uji:
Dihitung R(Xi ), rank dari Xi , i = 1, 2, . . . , m dalam sampel
gabungan {X1 , . . . , Xm , Y1 , . . . , Yn }
Statistik Uji:
Tx = R(X1 ) + . . . + R(Xm )

Dua sampel independen


Daerah kritik:
Nilai C1 dan C2 sedemikian sehingga
P (Tx C1 ) = P (Tx C2 ) = p

dengan p adalah harga p-value


Harga C1 dan C2 diperoleh dari tabel Uji Jumlah Rank
Wilcoxon

Dua sampel independen


Contoh:
Murid laki-laki suatu sekolah menengah diklasikasikan
sebagai pemuda kota dan pemuda desa. Suatu ujian "kondisi
sik" diadakan untuk melihat apakah pemuda desa
mempunyai kondisi sik yang lebih "baik" daripada pemuda
kota. Delapan pemuda desa dan sepuluh pemuda kota diuji,
dan hasilnya adalah:

Dua sampel independen


pemuda desa (X) :

14,8 7,3 5,6 6,3 9,0 4,2 10,6 2,7

pemuda kota (Y ) :
7,6 11,3 8,3 6,7 3,6 1,0 2,4 6,4 9,1 18,6

Dua sampel independen


Gabungan X dan Y , diurutkan dan diberi rank
obs. rank sampel
7,3 10
1,0
1
Y
7,6 11
2,4
2
Y
8,3 12
2,7
3
X
9,0 13
3,6
4
Y
9,1 14
4,2
5
X
10,6 15
5,6
6
X
11,3 16
6,3
7
X
14,8 17
6,4
8
Y
18,6 18
6,7
9
Y

X
Y
Y
X
Y
X
Y
X
Y

Dua sampel independen


Gabungan X dan Y , diurutkan dan diberi rank
obs. rank sampel
7,3 10
1,0
1
Y
7,6 11
2,4
2
Y
8,3 12
3
X
2,7
9,0 13
3,6
4
Y
9,1 14
5
X
4,2
10,6 15
5,6
6
X
11,3 16
6,3
7
X
14,8 17
6,4
8
Y
18,6 18
6,7
9
Y

X
Y
Y
X
Y
X
Y
X
Y

Dua sampel independen


Gabungan X dan Y , diurutkan dan diberi rank
obs. rank sampel
7,3 10
1,0
1
Y
7,6 11
2,4
2
Y
8,3 12
2,7
3
X
9,0 13
3,6
4
Y
9,1 14
4,2
5
X
10,6 15
5,6
6
X
11,3 16
6,3
7
X
14,8 17
6,4
8
Y
18,6 18
6,7
9
Y

Tx = 3 + 5 + 6 + 7 + 10 + 13 + 15 + 17 = 76

X
Y
Y
X
Y
X
Y
X
Y

Dua sampel independen


Tabel Uji Jumlah Rank Wilcoxon
Untuk = 0, 05
n
.
.
.
10
.
.
.

...
.
.
.
...
...
.
.
.

C1
.
.
.

m=8
C2
.
.
.

56,
57,
.
.
.

96
95
.
.
.

...
p
.
.
.
.0416
.0506
.
.
.

.
.
.
...
...
.
.
.

Dua sampel independen


Tabel Uji Jumlah Rank Wilcoxon
Untuk = 0, 05
n
.
.
.
10
.
.
.

...
.
.
.
...
...
.
.
.

C1
.
.
.

m=8
C2
.
.
.

56,
57,
.
.
.

96
95
.
.
.

...
p
.
.
.
.0416
.0506
.
.
.

.
.
.
...
...
.
.
.

TX = 76, tidak terletak di


antara C1 dan C2 (daerah
kritik)

H0 tidak ditolak, pemuda desa mempunyai sik yang tidak


lebih "baik" daripada pemuda kota

Dua sampel independen: SPSS


NPAR TESTS
/M-W= nilai BY group(1 2)
/STATISTICS= DESCRIPTIVES.

Mann-Whitney Test
Test Statistics
NILAI
Mann-Whitney U
40.000
Wilcoxon W
95.000
Z
.000
Asymp. Sig. (2-tailed)
1.000
Exact Sig. [2*(1-tailed Sig.)] 1.000
a Not corrected for ties.
b Grouping Variable: GROUP

k sampel independen
sampel 1
X11
X12
Uji Kruskal-Wallis
...
X1n1
R1
N=

k
i=1 ni

sampel 2
X21
X22
...
X2n2
R2

...
...
...
...
...
...

sampel k
Xk1
Xk2
...
Xknk
Rk

k sampel independen
Hipotesis:
H0 : semua k populasi adalah identik
H1 : tidak semua k populasi adalah identik

k sampel independen
Prosedur uji:
R(Xij ) adalah rank observasi Xij
Ri = ni R(Xij )
j=1

=
=

12
N (N + 1)

k
i=1 [Ri

12
N (N + 1)
k

i=1

n1 (N + 1)/2]2
ni

2
Ri
3(N + 1)
ni

k sampel independen
Contoh:

Dipunyai data observasi tahan hidup tiga merek bola


lampu (A, B dan C) sbb. :
Merek
A

73

82

64
Tahan hidup

84
80

79

67

81

71

62

77

73

70

k sampel independen
Contoh:

Dipunyai data observasi tahan hidup tiga merek bola


lampu (A, B dan C) sbb. :
Merek
A

73

13

82

12

80

10

79

67

81

11

71

62

77

73

6,5

70
jumlah

84

64
Tahan hidup

6,5

16,5

42

32,5

k sampel independen
Statistik penguji:
12
T =
N (N + 1)

i=1
2

2
Ri
3(N + 1)
ni

12 16, 5
422 32, 52
=
(
+
+
) 3(14)
13(14) 5
4
4
= 8, 08
H0 ditolak jika T 5, 6176
Kesimpulan: H0 ditolak, tidak
semua tahan hidup ketiga
merek bola lampu tersebut
sama

k sampel independen
Statistik penguji:
12
T =
N (N + 1)

i=1
2

2
Ri
3(N + 1)
ni

12 16, 5
422 32, 52
=
(
+
+
) 3(14)
13(14) 5
4
4
= 8, 08
H0 ditolak jika T 5, 6176
Kesimpulan: H0 ditolak, tidak
semua tahan hidup ketiga
merek bola lampu tersebut
sama

Tabel Harga Kritik Kruskal-Wallis


untuk 3 sampel
Ukuran sampel
n1
n2
n3
5

harga
kritik

...
5.6176
4
...

0.050

k sampel independen: SPSS


NPAR TESTS
/K-W=thidup BY group(1 3)
/STATISTICS DESCRIPTIVES.
Kruskal-Wallis Test
Test Statistics
THIDUP
Chi-Square
8.100
df
2
Asymp. Sig.
.017
a Kruskal Wallis Test
b Grouping Variable: GROUP

Koesien Korelasi Rank


Data: (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn )
Koesien korelasi Pearson

r =

i=1 (xi x)(yi y )


n
2
2
i=1 (xi x) (yi y )

untuk mengukur keeratan hubungan linear antara X dan Y

Koesien Korelasi Rank


Data: {R(X1 ), R(X2 ), . . . , R(Xn )} dan
{R(Y1 ), R(Y2 ), . . . , R(Yn )}
(ranking dari masing-masing X dan Y )
Koesien korelasi Rank (Spearman)

r =

n
i=1

R(Xi ) n+1 R(Yi )


2
n(n2 1)/12

n+1
2

Koesien Korelasi Rank Spearman r


Ekivalen dengan

6D
r = 1
n(n2 1)

dengan
D = n d2 dan di = R(Xi ) R(Yi )
i=1 i

Koesien Korelasi Rank Spearman r


Uji hipotesis
H0 : X, Y independen
H1 : X, Y dependen
Daerah kritik:
Uji dua sisi
{r r1 } atau {r r2 }
dengan r1 = r dan r2 = r
dimana P (r r ) = , r adalah statistik rank Spearman

Koesien Korelasi Rank Spearman r


Data banyaknya kendaraan bermotor (per 1000 penduduk) dan
banyak kecalakaan kendaraan bermotor (per 100.000 penduduk) di 14
negara dalam tahun 1969.
negara
USA
Kanada
Australia
Perancis
Selandia Baru
Denmark
Belanda
Belgia
Norwegia
Jerman Barat
Austria
Inggris
Italia
Jepang

kendaraan
Xi
530
400
390
390
390
370
360
280
270
270
260
260
250
240

kecelakaan
Yi
27
27
31
34
21
24
24
80
14
28
31
14
20
21

Koesien Korelasi Rank Spearman r


Data banyaknya kendaraan bermotor (per 1000 penduduk) dan
banyak kecalakaan kendaraan bermotor (per 100.000 penduduk) di 14
negara dalam tahun 1969.
negara
USA
Kanada
Australia
Perancis
Selandia Baru
Denmark
Belanda
Belgia
Norwegia
Jerman Barat
Austria
Inggris
Italia
Jepang

kendaraan
Xi
530
400
390
390
390
370
360
280
270
270
260
260
250
240

kecelakaan
Yi
27
27
31
34
21
24
24
80
14
28
31
14
20
21

R(Xi )
14
13
11
11
11
9
8
7
5,5
5,5
3,5
3,5
2
1

R(Yi )
8,5
8,5
11,5
13
4,5
6,5
6,5
14
1,5
10
11,5
1,5
3
4,5

Koesien Korelasi Rank Spearman r


Data banyaknya kendaraan bermotor (per 1000 penduduk) dan
banyak kecalakaan kendaraan bermotor (per 100.000 penduduk) di 14
negara dalam tahun 1969.
negara
USA
Kanada
Australia
Perancis
Selandia Baru
Denmark
Belanda
Belgia
Norwegia
Jerman Barat
Austria
Inggris
Italia
Jepang

kendaraan
Xi
530
400
390
390
390
370
360
280
270
270
260
260
250
240

kecelakaan
Yi
27
27
31
34
21
24
24
80
14
28
31
14
20
21

R(Xi )
14
13
11
11
11
9
8
7
5,5
5,5
3,5
3,5
2
1

R(Yi )
8,5
8,5
11,5
13
4,5
6,5
6,5
14
1,5
10
11,5
1,5
3
4,5

di
5,5
4,5
-0,5
2
6,5
2,5
1,5
-7
4
-4,5
-8
2
-1
-3,5

Koesien Korelasi Rank Spearman r


Data banyaknya kendaraan bermotor (per 1000 penduduk) dan
banyak kecalakaan kendaraan bermotor (per 100.000 penduduk) di 14
negara dalam tahun 1969.
negara
USA
Kanada
Australia
Perancis
Selandia Baru
Denmark
Belanda
Belgia
Norwegia
Jerman Barat
Austria
Inggris
Italia
Jepang

kendaraan
Xi
530
400
390
390
390
370
360
280
270
270
260
260
250
240

kecelakaan
Yi
27
27
31
34
21
24
24
80
14
28
31
14
20
21

R(Xi )
14
13
11
11
11
9
8
7
5,5
5,5
3,5
3,5
2
1

R(Yi )
8,5
8,5
11,5
13
4,5
6,5
6,5
14
1,5
10
11,5
1,5
3
4,5

di
5,5
4,5
-0,5
2
6,5
2,5
1,5
-7
4
-4,5
-8
2
-1
-3,5

d2
i
30,25
20,25
0,25
4
42,25
6,25
2,25
49
16
20,25
64
4
1
12,25

Koesien Korelasi Rank Spearman r


Data banyaknya kendaraan bermotor (per 1000 penduduk) dan
banyak kecalakaan kendaraan bermotor (per 100.000 penduduk) di 14
negara dalam tahun 1969.
negara
USA
Kanada
Australia
Perancis
Selandia Baru
Denmark
Belanda
Belgia
Norwegia
Jerman Barat
Austria
Inggris
Italia
Jepang

kendaraan
Xi
530
400
390
390
390
370
360
280
270
270
260
260
250
240

kecelakaan
Yi
27
27
31
34
21
24
24
80
14
28
31
14
20
21

R(Xi )
14
13
11
11
11
9
8
7
5,5
5,5
3,5
3,5
2
1

R(Yi )
8,5
8,5
11,5
13
4,5
6,5
6,5
14
1,5
10
11,5
1,5
3
4,5

di
5,5
4,5
-0,5
2
6,5
2,5
1,5
-7
4
-4,5
-8
2
-1
-3,5

d2
i
30,25
20,25
0,25
4
42,25
6,25
2,25
49
16
20,25
64
4
1
12,25
272

Koesien Korelasi Rank Spearman r


Koesien korelasi rank Spearman
6D
r = 1
n(n2 1)
6(272)
= 1
14(142 1)
= 0, 4022

Harga kritik korelasi rank


Spearman
n
4
5
.
.
.
14
.
.
.

= .10

.05

.025

...

Koesien Korelasi Rank Spearman r


Koesien korelasi rank Spearman
6D
r = 1
n(n2 1)
6(272)
= 1
14(142 1)
= 0, 4022

Harga kritik korelasi rank


Spearman
n

= .10

.05

4
5
.
.
.
14
.
.
.

.4593

.025

...

Koesien Korelasi Rank Spearman r


Koesien korelasi rank Spearman
6D
r = 1
n(n2 1)
6(272)
= 1
14(142 1)
= 0, 4022
Daerah kritik untuk = 0, 10
{r 0, 4593} atau {r 0, 4593}

Harga kritik korelasi rank


Spearman
n

= .10

.05

4
5
.
.
.
14
.
.
.

.4593

.025

...

Koesien Korelasi Rank Spearman r


Koesien korelasi rank Spearman
6D
r = 1
n(n2 1)
6(272)
= 1
14(142 1)
= 0, 4022
Daerah kritik untuk = 0, 10
{r 0, 4593} atau {r 0, 4593}
H0 tidak ditolak, X, Y independen

Harga kritik korelasi rank


Spearman
n

= .10

.05

4
5
.
.
.
14
.
.
.

.4593

.025

...

Koesien Korelasi Rank Kendall


Skala pengukuran paling tidak ordinal
Memanfaatkan rank
Dapat diperluas untuk korelasi parsial

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

Skor
Total Skor

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X
D

juri Y
2

S
= 1
n(n 1)
2

Skor dihitung berdasarkan Y


setelah data X diurutkan

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

+1 urutan biasa (naik)


Skor =
1 urutan tidak biasa

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

skor

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

skor
+1

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor
+1+1

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

S
= 1
n(n 1)
2

skor
+1+1-1

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor

+1+1-1

-1

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor

+1+1-1

-1-1

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor

+1+1-1

-1-1

-1

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor

+1+1-1

-1-1

-1

1
-2

S
= 1
n(n 1)
2

Koesien Korelasi Rank Kendall


Ranking dari juri X dan Y untuk 4 buah karangan
Karangan juri X

juri Y

skor

+1+1-1

-1-1

-1

1
-2
2
= 0, 33
= 1
4(3)
2

Koesien Korelasi Rank Kendall


Koesien korelasi parsial Kendall
Misalkan untuk pasangan (X, Y, Z) bisa dihitung korelasi
parsial XY.Z , XZ.Y dan Y Z.X dengan
XY.Z

XY XZ .Y Z
=
2
2
[(1 XZ )(1 Y Z )]1/2

XZ.Y

XY ZY .Y Z
=
2
2
[(1 XY )(1 ZY )]1/2

Y Z.X

Y Z XZ .Y X
=
2
2
[(1 Y X )(1 ZX )]1/2

Koesien Korelasi Rank Kendall


Contoh: DIketahui 3 variabel dengan 4 subyek

subyek X

c
XY

3
2

d
4 4 4
= 0, 67; Y Z = 0, 67; XZ = 0, 33

Koesien Korelasi Rank Kendall


Contoh: DIketahui 3 variabel dengan 4 subyek

subyek X

c
XY

3
2

d
4 4 4
= 0, 67; Y Z = 0, 67; XZ = 0, 33

XY.Z

XY XZ .Y Z
0, 67 (0, 33)(0, 67)
=
=
2
2
1/2
[(1 XZ )(1 Y Z )]
[(1 0, 332 )(1 0, 672 )]1/2

Koesien Korelasi Rank Kendall


Contoh: Diketahui 3 variabel dengan 4 subyek

subyek X

c
XY

3
2

d
4 4 4
= 0, 67; Y Z = 0, 67; XZ = 0, 33

XY.Z

XY XZ .Y Z
0, 67 (0, 33)(0, 67)
=
=
2
2
1/2
[(1 XZ )(1 Y Z )]
[(1 0, 332 )(1 0, 672 )]1/2
= 0, 63

Koesien Korelasi Rank: SPSS


NONPAR CORR
/VARIABLES=x y z
/PRINT=BOTH TWOTAIL NOSIG.

Koesien Korelasi Rank: SPSS


Correlations
X
Y
Kendalls tau_b X

Z
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N
Correlation Coefficient
Sig. (2-tailed)
N

1.000
.
4
.667
.174
4
.333
.497
4

.667
.174
4
1.000
.
4
.667
.174
4

.333
.497
4
.667
.174
4
1.000
.
4

Koesien Korelasi Rank: SPSS


Spearmans rho

Correlation Coefficient 1.000


Sig. (2-tailed)
.
N
4
Correlation Coefficient .800
Sig. (2-tailed) .200
N
4
Correlation Coefficient .400
Sig. (2-tailed) .600
N
4

.800
.200
4
1.000
.
4
.800
.200
4

.400
.600
4
.800
.200
4
1.000
.
4

Ringkasan Prosedur Inferensi Statistik


Skala interval/Rasio
Banyak sampel
satu

dua indep.

dua dep.

Hipotesis
mean populasi
variansi populasi
perbedaan mean
dua populasi
independen
perbedaan variansi
dua pop. indep.
perbedaan mean
dua populasi
dependen

Inferensi Statistik
z-test ( diketahui) P
t-test ( tidak diketahui) P
Chi-square test P
z-test P
t-test P
Anava P
F -test P
z-test P
t-test P
Anava (within-subject) P

Ringkasan Prosedur Inferensi Statistik


Skala interval/Rasio
Banyak sampel
dua atau
lebih (k) indep.

dua atau
lebih (k) dep.

Hipotesis
perbedaan mean k
populasi indep.
perbedaan variansi k
populasi indep.
perbedaan mean k
populasi dep.

Inferensi Statistik
Anava P
Homogenitas variansi P
Anava (within-subject) P

Ringkasan Prosedur Inferensi Statistik


Skala interval/Rasio
Banyak sampel
satu
dua indep.

dua dep.

dua atau
lebih (k) indep.
dua atau
lebih (k) dep.

Hipotesis
median populasi
perbedaan median
dua populasi
independen
perbedaan median
dua populasi
dependen
perbedaan median k
populasi indep.
perbedaan median k
populasi dep.

Inferensi Statistik
median-test NP
Uji jumlah rank
Wilcoxon NP atau
Mann-Whitney NP
Uji Tanda NP
Wilcoxon NP
Kruskal-Wallis NP
Friedman NP

Ringkasan Prosedur Inferensi Statistik


Skala ordinal/rank-berurut
Banyak sampel
satu
dua indep.

dua dep.

dua atau
lebih (k) indep.
dua atau
lebih (k) dep.

Hipotesis
median populasi
perbedaan median
dua populasi
independen
perbedaan median
dua populasi
dependen
perbedaan median k
populasi indep.
perbedaan median k
populasi dep.

Inferensi Statistik
median-test NP
Uji jumlah rank
Wilcoxon NP atau
Mann-Whitney NP
Uji Tanda NP
Wilcoxon NP
Kruskal-Wallis NP
Friedman NP

Ringkasan Prosedur Inferensi Statistik


Skala nominal/kategorik
Banyak sampel
satu

dua
dua atau
lebih (k)

Hipotesis
distribusi populasi
independensi
variabel
homogenitas dua
pop. binomial
homogenitas k
pop. multinomial

Inferensi Statistik
GOF
Chi-square indep.
Chi-square tabel 2 2
Chi-square tabel b k

Ringkasan Prosedur Inferensi Statistik


Statistik keeratan hubungan
Skala
interval /ratio

Variabel
bivariat
multivariat

ordinal/rank
berurut

bivariat

nominal/
kategorik

multivariat
dua dikotomi

dua non-dikotomi

Statistik
Pearson
korelasi berganda (Pearson)
korelasi parsial (Pearson)
Spearman r
Kendall
Kendall
koesien kontingensi
koesien phi
odds ratio
koesien kontingensi
Cramer
odds ratio

You might also like