Professional Documents
Culture Documents
STATISTIKA
Oleh:
Dr. Samsudi, M.Pd
Samsudi - STATISTIKA 1
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Alloh SWT , yang telah melimpahkan
petunjuk, bimbingan dan kekuatan lahir-batin sehingga dapat menyusun bahan ajar ini.
Sasaran yang akan dicapai dengan buku Statistika ini adalah: (1) memberikan dasar-
dasar pemahanan dan pengertian beberapa istilah statistika serta mafaatnya, (2)
menggunakan statistika sebagai alat bantu dalam penyusunan laporan penelitian, (3)
menggunakan rumus-rumus dan teknik analisis Statistika dan (4) memiliki sikap teliti
dan cermat dalam menerima dan menggunakan sesuatu.
Bahan ini terdiri atas 9 (sembilan) bab, yaitu: (1) Konsep dan Pengertian Statistika, (2)
Distribusi Frekuensi, (3) Ukuran Statistika, (4) Deviasi Rata-rata dan Standar Deviasi,
(5) Uji Hipotesis, (6) Teknik Analisis Korelasional, (7) Teknik Analisis Komparasional,
(8) Teknik Analisis Variansi, (9) Analisis Regresi. Setiap bab terdiri atas beberapa sub
bab serta dilengkapi dengan soal-soal untuk latihan.
Penulis menyampaikan terima kasih sebanyak- banyaknya kepada fihak-fihak yang
telah membantu penyusunan buku ini. Kritik dan saran yang bersifat konstruktif sangat
penulis harapkan untuk kesempurnaan buku ini.
Samsudi - STATISTIKA 2
DAFTAR ISI
KATA PENGANTAR ………………………………………………… ii
DAFTAR ISI …………………………………………………………… iii
Samsudi - STATISTIKA 3
BAB I
Tujuan
Samsudi - STATISTIKA 4
1.1. Pengertian Statistika
Dalam rangka kegiatan penelitian, seperti yang telah disinggung di depan, fungsi
dan peranan statistika dijelaskan sebagai berikut:
1. Statistika memungkinkan pencatatan secara eksak data penelitian.
2. Statistika memandu peneliti menganut tata fikir dan tata kerja yang definit dan
eksak.
3. Statistika menyediakan cara-cara meringkas data ke dalam bentuk yang lebih
banyak artinya dan lebih gampang mengerjakannya.
4. Statistika memberi dasar-dasar untuk menarik kongklusi-kongklusi melalui proses-
proses yang mengikuti tata cara yang dapat diterima oleh ilmu pengetahuan.
5. Statistika memberi landasan untuk meramalkan secara ilmiah tentang sebagaimana
sesuatu gelaja akan terjadi dalam kondisi-kondisi yang telah di ketahui.
6. Statistika memungkinkan peneliti menganalisis, menguraikan sebab-akibat yang
kompleks dan rumit, yang tanpa statistika akan merupakan peristiwa yang
membingungkan, kejadian yang tak teruraikan.
Soal Latihan
Samsudi - STATISTIKA 5
BAB II
DISTRIBUSI FREKUENSI
Tujuan
Samsudi - STATISTIKA 6
2.1. Distribusi Frekuensi
Melihat angka-angka di atas kita belum dapat memperoleh gambaran apa-apa. Untuk
mendapatkan gambaran dan kesimpulan, kita perlu mengatur angka-angka itu menjadi
suatu tabel sebagai berikut :
TABEL 2.1
TABEL NILAI-NILAI BERHITUNG 70 ORANG SISWA
NILAI Jari-jari Frekuensi
8 //// 4
7 //// //// //// //// / 21
6 //// //// //// //// //// /// 28
5 //// //// //// / 16
4 / 1
+
N = 70
Samsudi - STATISTIKA 7
+ N adalah singkatan dari kata Number, yang berarti jumlah frekuensi variabel
Tabel di atas disebut Tabel Distribusi Frekuensi Tunggal. Istilah “Distribusi” digunakan
dalam statistika untuk menunjuk adanya (seolah-olah) “Penyebaran” nilai-nilai dengan
jumlah orang yang mendapat nilai itu, sedang istilah ”Tunggal” menunjukkan tidak
adanya pengelompokan nilai-nilai variabel dalam kolom pertama.
18 13 16 4 10 10 15 17 16 16
21 22 20 7 (23) 10 18 (3) 10 8
10 11 10 10 6 11 23 19 19 20
21 12 10 17 7 12 5 9 12 15
12 12 16 20 14 15 14 15 16 15
17 16 16 14 14 15 19 13 15 14
21 8 19 19 19 13 13 19 14 13
20
Nilai yang tertinggi dari hasil ujian masuk itu adalah 23, sedang nilai terendah adalah
tiga. Jika susun tabel distribusi tunggal, maka kita harus membuatnya sepanjang 21
baris (dari 23-3 plus 1). Dengan demikian kita akan menjumpai tabel sebagai berikut :
TABEL 2.2
TABEL HASIL PSIKOTEST DARI CALON-CALON MAHASISWA
Kelompok Frekuensi
Nilai (f)
21-23 6
18-20 13
15-17 17
12-14 16
9-11 11
6-8 5
3-5 3
Jumlah 71
3 5 6 8 9 11 12 14 15 17 18 20 21 23
Nampak kepada kita dari pemeriksaan lukisan di atas bahwa angka 5 dan angka 6
misalnya, bukanlah batas yang nyata antara kelas yang terendah dengan kelas di
atasnya. Demikian juga angka-angka 20 dan 21.
Lebar Kelas. Kita periksa kembali tabel 3.2 Interval kelas yang tertinggi di
tandai dengan angka 21 dan 23. Kedua angka itu sebenarnya hanyalah batas kelas saja
(batas semu). Antara keduanya masih ada satu angka lagi, yaitu angka 22. Demikian
juga kelas yang keempat dari atas, sebenarnya mengandung angka-angka 3,4, dan 5.
Jadi tiap-tiap kelas itu sebenarnya mengandung atau terdiri atas tiga angka. Inilah yang
disebut lebar kelas dapat didefinisikan sebagai batas lebar atas nyata dikurangi batas
bawah nyata dari kelas-kelas yang bersangkutan. Lebar kelas biasa diberi simbul “i”.
Jika orang mengatakan “i” sama dengan tiga, ini berarti bahwa distribusi frekuensi
disusun dalam tabel atau grafik yang menggunakan interval kelas dengan isi tiga angka
atau nilai dalam tiap-tiap intervalnya.
Titik Tengah. Yang dimaksud dengan “Titik Tengah” adalah angka atau nilai
variabel yang terdapat ditengah-tengah interval kelas. Jika interval kelas memuat angka-
angka 13, 14 dan 15, yang menjadi titik tengahnya adalah angka 14. Jika luas kelasnya
genap, seperti 20, 21, 22 dan 23 titik tengahnya adalah separo dari jumlah angka-angka
tengah, yaitu 21,5 (dari ½ x ( 21 ditmbah 22).
Jumlah Interval . Yang disebut jumlah interval ialah banyaknya interval yang
digunakan dalam penyusunan distribusi. Dalam tabel 3.2 diatas jumlah intervalnya ada
tujuh.
Jarak Pengukuran. Kalau kita mengukur tinggi sejumlah orang, dan kita
menjumpai angka pengukuran yang tertinggi 180 cm. Dan angka pengukuran yang
terendah, 145 cm, kita mempunyai jarak pengukuran 35 cm. (dari 180 cm, dikurangi
145 cm).
Samsudi - STATISTIKA 9
mennggunakan 5 sampai 15 interval. Kalau R besar sekali, biasanya orang
menggunakan 10 smapai 20 interval. Akan tetapi hal ini tidak boleh diikuti secara
membabi buta.
JarakPengukuran( R )
i=
JumlahInterval
Jadi kalau misalnya hasil pengukuran kita tentang tinggi orang yang tertinggi adalah
180 cm dan yang terendah adalah 145 cm, dan kita telah menetapkan jumlah intervalnya
sebanyak 9 buah, maka
180,50 − 144,50 36
i= = =4
9 9
2.2.1. Histogram
Grafik histogram biasa disebut juga Bar Diagram, yaitu suatu grafik yang
berbentuk segi empat.
TABEL 2.3
NILAI-NILAI BERHITUNG 72 ORANG MURID
Nilai Batas Nyata + Frekuensi
8 8,5
7 7,5 4
6 6,5 23
5 5,5 28
4 4,5 16
3,5 1
Samsudi - STATISTIKA 10
Jumlah : -- 72
2.2.2. Poligon
Samsudi - STATISTIKA 11
2.2.3. Ogive
Ogive dapat dibuat baik dari distribusi tunggal maupun dari distribusi tergolong.
Di bawah ini diberikan contoh untuk membuat grafik ogive dari distribusi bergolong.
TABEL 2.4
TABEL DISTRIBUSI UNTUK CONTOH MEMBUAT GRAFIK OGIVE
Interval Batas Frekuensi Frekuensi Meningkat
Nilai Nyata ( f _) (ef)
38,5
2
36-38 35,5 100
3
33-35 32,5 98
2
30-32 29,5 95
6
27-29 26,5 93
5
24-26 23,5 87
5
21-23 20,5 82
5
18-20 17,5 77
14
15-17 14,5 72
10
12-14 11,5 58
17
9-11 8,5 48
15
6-8 5,5 31
14
3-5 2,5 16
2
0-2 0,5 2
Jumlah N = 100 --
Samsudi - STATISTIKA 12
Soal Latihan
7 5 8 3 6 4 6 7 5 9
4 6 8 6 8 5 7 5 9 7
3 4 6 5 5 4 8 6 5 6
9 7 5 8 6 4 6 7 8 10
7 6 3 9 5 7 6 3 8 7
10 8 7 6 6 5 7 7 6 6
Soal : Aturlah (susunlah) dan kemudian sajikanlah data tersebut diatas dalam bentuk:
a. Tabel Distribusi Frekuensi, dengan mengindahkan persyaratan tertentu sehingga
dapat disebut Tabel distribusi frekuensi yang baik.
b. Tabel Persentase
c. Tabel Presentase Kumulatif
8. Lukislah data pada soal nomor 7 diatas dalam bentuk Histrogram Frekuensi!
Samsudi - STATISTIKA 13
BAB III
UKURAN STATISTIKA
Tujuan
Samsudi - STATISTIKA 14
3.1. Pengukuran Tendensi Sentral
3.2. Mean
Mean berarti “angka rata-rata”. Dari segi aritmetik Mean adalah “jumlah nilai-
nilai dibagi dengan jumlah individu”. Sebagai contoh, ada tiga orang berpenghasilan
10, 15 dan 20 rupiah tiap harinya. Rata-rata penghasilan mereka adalah 15 rupiah tiap
harinya. Ini dicari dengan cara sebagai berikut :
10 + 15 + 20 45
Penghasilan rata-rata = = = 15
3 3
Dari pernyataan itu dapat dikemukakan rumus Mean sebagai berikut :
X + X 2 + X 3 .... X n −1 + X n
Mean = 1
N
Rumus itu disingkat sebagai berikut :
M =
∑X
N
Simbul Σ adalah huruf Yunani yang disebut “Sigma” dan mempunyai arti jumlah.
TABEL 3.1
TABEL CONTOH MENCARI MEAN YANG DITIMBANG
Penghasilan Frekuensi
fX
(X) (f)
Samsudi - STATISTIKA 15
20 1 20
15 1 15
10 4 40
N = 6 Σ fX = 75
TABEL 3.2
TABEL CONTOH MENCARI MEAN DARI DISTRIBUSI BERGOLONG
Penghasilan Titik Tengah
f fX
(X) (X)
145-149 147 1 147
140-144 142 3 426
135-139 137 5 685
130-134 132 8 1056
125-129 127 11 1397
120-124 122 17 2074
115-119 117 21 2457
110-114 112 22 2464
105-109 107 24 2568
100-104 102 20 2040
95-99 97 15 1455
90-94 92 12 1104
85-89 87 6 522
80-84 82 2 164
Jumlah -- N = 167 ΣfX =18559
M = ∑ fX
=
18559
= 111 ,13
N 167
3.3. Median
Median dapat dibatasi sebagai “suatu nilai yang membatasi 50 persen frekuensi
distribusi bagian bawah dengan 50 per sen frekuensi distribusi bagian atas.” Kita
misalkan ada distribusi penghasilan dari tujuh orang seperti tersebut dalam tabel
dibawah ini.
TABEL 3.3
TABEL CONTOH DISTRIBUSI PENGHASILAN UNTUK MENCARI MEDIAN
Individu Penghasilan (Rp)
Samsudi - STATISTIKA 16
1 10
2 12
3 13
4 14
5 16
6 16
7 20
Rumus untuk mencari median dari distribusi bergolong adalah sebagai berikut :
⎡1 / 2 N − cfb ⎤
Median = Bb + ⎢ ⎥i (7)
⎣ fd ⎦
Dalam mana :
Bb Adalah batas bawah (nyata) dari interval yang mengandung median
Cfb Frekuensi kumulatif (frekuensi meningkat) di bawah interval yang
mengandung median,
fd Frekuensi dalam interval yang mengandung median
i Lebar interval, dan
N Jumlah frekuensi dalam distribusi
Penggunaan rumus itu dapat kita lihat dari pekerjaan di bawah ini :
TABEL 3.4
TABEL CONTOH MENGHITUNG MEDIAN DARI DISTRIBUSI BERGOLONG
Interval Nilai f cf
100-104 1 55
95-99 3 54
90-94 5 51
85-89 fd 9 46
80-84 (13) 37
75-79 10 (24)
70-74 6 14
65-69 4 8
60-64 3 4
55-59 1 1
55
Jumlah --
Samsudi - STATISTIKA 17
Dalam contoh diatas, jumlah frekuensinya (atau N ) ada 55. Kalau ini kita bagi
dua hasilnya sama dengan 27,5 itu. Setelah ½ N ini kita ketemukan maka langkah
selanjutnya adalah menemukan interval kelas yang mengandung frekuensi kumulatif
27,5 itu, interval kelas yang kita maksudkan adalah 80-84, sebab cf 27,5 terkandung
dalam cf 37.
Batas bawah (nyata) atau Bb dari interval yang mengandung median itu adalah
79,50. Separo dari jumlah frekuensinya, atau ½ N adalah 55/2, sama dengan 27,50.
Frekuensi kumulatif di bawah interval yang mengandung median adalah 24 (24 adalah
cf di bawah 37, sedang cf 37 adalah cf yang mengandung median). Frekuensi dalam
interval adalah 13, sedang lebar interval atau i-nya ada lima. Diisikan dalam rumus kita
jumpai perhitungan sebagai berikut :
⎡1 / 2 N − cfb ⎤ ⎡ 27,50 − 24 ⎤
Mdn = Bb + ⎢ ⎥i = 79,50 + ⎢ ⎥5
⎣ fd ⎦ ⎣ 13 ⎦
⎡ 3,50 × 5 ⎤
= 79,50 + ⎢ ⎥ = 79,50 + 1,346 = 80,846
⎣ 13 ⎦
atau 80,85
3.4. Mode
Samsudi - STATISTIKA 18
Frekuensi yang tertinggi dari distribusi tersebut adalah 18. Nilai yang mempunyai
frekuensi tertinggi itu adalah nilai 7. Jadi yang menjadi modenya adalah nilai 7.
Tempat kedudukan Mean, Median dan Mode dalam satu distribusi sangat
tergantung kepada bentuk distribusinya. Kita ingat kembali ada distribusi yang simetri
dan ada yang juling.
Jika dari suatu distribusi simetri normal kita hitung mean, median, dan modenya,
maka akan kita jumpai sifat yang khas, yaitu bahwa ketiga tendensi sentral itu bersekutu
satu sama lain. Hal ini mudak kita mengerti, sebab pada distribusi normal, mean
membagi dua sama banyak frekuensi variabel di atas dan dibawahnya. Dengan
demikian mean ini mempunyai fungsi seperti median. Karena yang menjadi mode
dalam distribusi normal adalah nilai yang ada pada mean, maka dengan sendirinya
mode itu bersekutu dengan mean. Jadi pada distribusi normal mean, median, dan mode
ketiga-tiganya berimpit. Untuk ilustrasi periksalah grafik 4.1.
frekuensi
N i l a i
Mean Median
Mode
Grafik 3.1 Ilustrasi mean, median dan mode
Soal Latihan
1. Jelaskan tentang segi segi kebaikan dan kelemahan yang dimiliki oleh:
a. Mean; b. Median; c. Modus.
2. Dalam kedaan yang bagaimana seharusnya kita mencari (menghitung);
a. Mean; b. Median; c. Modus.
3. Jelaskan adanya saling hubungan antara Mean, Median dan Modus dengan
mengemukakan contohnya!
4. Jelaskan bahwa Percentile sangat berguna untuk dipergunakan sebagai alat atau
ukuran untuk:
a. Mengubah raw score menjadi Nilai Standart Sebelas (Stanel).
b. Menetapkan Nilai Batas Lulus dalam suatu tes atau seleksi.
Samsudi - STATISTIKA 19
5. Dari sejumlah 266 orang lulusan SMK yang mengikuti Tes Seleksi Penerimaan
Calon Mahasiswa Baru pada sebuah Perguruan Tinggi, berhasil dicatat sekor hasil
ujian mereka dalam mata ujian Fisika sebagai berikut:
Sekor: frekuensi
90-94 4
85-89 10
80-84 14
75-79 19
70-74 30
65-69 33
60-64 40
55-59 32
50-54 25
45-49 21
40-44 18
35-39 10
30-34 6
25-29 3
20-24 1
266=N
Soal:
a. Berapakah Nilai Rata –rata hitung yang berhasil dicapai oleh 266 orang calon
yang mengikuti Tes Seleksi tersebut (dengan catatan bahwa perhitungan Nilai
Rata-rata Hitung itu hendaknya dilakukan dengan menggunakan Metode
Panjang dan Metode Singkat)?
b. Ubahlah hasil tes tersebut menjadi STANEL (Nilai Standart Sekala Sebelas),
dengan menggunakn ukuran Percentile!
c. Sekor berapa yang merupakan modus dari data tersebut diatas?
d. Jika dari jumlah 266 orang calon itu yang akan diluluskan (dinyatakan
diterima sebagai mahasiswa baru) hanya 45 orang, tetapkan Niali Batas
Lulusnya dengan menggunakan ukuran Percentile!
6. Dari kegiatan eksperimen yang dilakukan 6 kali, diperoleh sekor sebagai berikut:
Samsudi - STATISTIKA 20
Carilah Nilai Rata-rata Ukur dari sekor hasil eksperimen tersebut di atas tanpa
menggunakn daftar logarithma.
BAB IV
Tujuan
Samsudi - STATISTIKA 21
4.1. Pengukuran Variabilitas
Ada dua orang atlet loncat tinggi yang sedang dilatih untuk menghadapi
kompetisi nasional atletik. Ahmad menunjukkan loncatan yang tidak dipastikan:
kadang-kadang dia meloncat setinggi 195, tetapi kadang-kadang dia hanya dapat
meloncat setinggi 165 cm. Mahmud, sebaliknya menunjukkan loncatan yang lebih
mantap sungguhpun dia tidak pernah meloncat setinggi 195 cm, tetapi dia juga tidak
pernah meloncat serendah 165 cm. Paling rendah loncatannya adalah 171 cm, sedang
paling tinggi 189 cm. Persoalannya adalah siapa yang akan dimajukan dalam
perlombaan kejuaran nasional itu apabila hanya seorang peloncat saja yang
diperkenankan untuk dimajukan. Loncatan Ahmad agak jauh dari mean loncatannya,
dibandingkan dengan loncatan Mahmud. Dengan istilah statistika dikatakan bahwa
loncatan Ahmad mempunyai variabilitas yang lebih besar dari pada loncatan Mahmud.
Yang dimaksud dengan variabilitas adalah derajat penyebarannilai-nilai variabel
dari suatu tendensi dalam suatu distribusi. Jika dua distribusi, katakana distribusi A dan
distribusi B dibandingkan, dan distribusi A menunjukkan penyebaran nilai-nilai
variabelnya yang lebih besar dari pada distribusi B, maka dikatakan bahwa distribusi A
mempunyai variabilitas yang lebih besar dari distribusi B. Variabilitas ini juga disebut
dispersi.
Untuk memutuskan apakah Ahmad ataukah Mahmud yang harus dimajukan dalam
perlombaan kejuaraan Nasional loncat tinggi, maka pelatih membutuhkan pengukuran
variabilitas loncatan kedua orang itu. Ada beberapa macam cara untuk mencari
variabilitas. Di sini yang akan dibicarakan hanyalah yang pokok-pokok saja, yaitu Mean
Deviation, dan Standard Deviation.
Mean Deviation atau Average Deviation atau Deviasi Rata-rata adalah rata-rata
dari deviasi nilai-nilai dari Mean dalam suatu distribusi, diambil nilainya yang absolute.
Yang dimaksud dengan deviasi absolute adalah nilai-nilai yang negatif. Secara
aritmatika mean deviasi dapat didefinisikan sebagai mean dari harga mutlak dari deviasi
nilai-nilai individual.
Yang pertama dilakukan alada menghitung Mean, kemudian ditentukan berapa
besarnya penyimpangan tiap-tiap nilai dari mean itu. Misalnya, jika seorang mempunyai
IQ 110, sedang mean IQ dari grupnya = 100, maka deviasi IQ orang tesebut adalah 110
– 100 = +10. Jika orang lain dalam grup itu mempunyai IQ 85, maka deviasi orang itu
adalah 85 – 100 = - 15. Deviasi yang bertanda plus menunjukkan deviasi di atas mean,
sedang yang bertanda minus menunjukkan deviasi di bawah mean. Akan tetapi dalam
perhitungan mean deviasi tanda minus ditiadakan. Dalam statistika, deviasi diberi
simbul dengan huruf-huruf kecil seperti x, y, d, dan sebagainya. Rumusnya adalah x =
X – M atau y = Y – M. d = D – M, dan sebagainya.
Samsudi - STATISTIKA 22
Adapun rumus dari Mean deviasi adalah :
MD = ∑ x
N
TABEL 4.1
TABEL CONTOH MENCARI MEAN DEVIATION
Deviasi dari Mean
Nilai Variabel
Dengan nilainya absolut
19 5
18 4
17 3
16 2
15 1
14 0
13 1
12 2
11 3
10 4
9 5
-- ∑ x = 30
Secara matematik Standard Deviasi dibatasi sebagai “Akar dari Jumlah deviasi
kuadrad dibagi banyaknya individu” dalam distribusi. Untuk mencari standard deviasi
pertama-tama kita harus mencari mean ini dapat dicari dengan rumus yang sudah kita
ketahui :
M =
∑x
N
Dengan mengetahui mean ini kita dapat mencari deviasi nilai individual dari
mean. Ini dicantumkan dalam kolom kedua. Jumlah deviasi dari mean ini, yaitu Σ, x1 .
harus sama dengan NOL.
Samsudi - STATISTIKA 23
TABEL 4.2
TABEL CONTOH MENCARI STANDARD DEVIASI
Nilai Deviasi dari Deviasi dari
Variabel Mean Mean Kuadrat
(X) (X) (X2)
19 +5 25
18 +4 16
17 +3 9
16 +2 4
15 +1 1
14 0 0
13 -1 1
12 -2 44
11 -3 9
10 -4 16
9 -5 25
Total 7 80
SD =
∑ X 2
N
Dalam mana :
SD = Standard Deviasi
2
∑x = Jumlah deviasi Kuadrat, dan
N = Jumlah individu / kejadian dalam distribusi
SD kadang-kadang diberi simbul ζ, disebut sigma (dari salah satu huruf Yunani), yang
diartikan Standart Devasi
SD =
∑ fx 2
Samsudi - STATISTIKA 24
Kedua rumus yang telah kita ketahui itu disebut rumus deviasi. Distribusi
demikian karena rumus itu menggunakan deviasi dari mean sebagai salah satu
komponennya. Di halaman berikut contoh mencari SD dengan rumus itu.
TABEL 4.3
TABEL UNTUK MENGHITUNG SD DENGAN RUMUS DEVIASI
X f fx x fx fx2
10 3 30 +3,60 10,80 38,88
9 9 81 +2,60 23,40 60,84
8 13 104 +1,60 20,80 33,28
7 23 161 +0,60 13,80 8,28
6 24 144 -0,40 9,60 3,84
5 13 65 -1,40 18,20 25,48
4 10 40 -2,40 24,00 57,60
3 5 15 -3,40 17,00 57,80
N = 100 ∑ fx = 640 ∑f2 = 286,00
M =
∑ fx SD =
∑ fx 2
N N
268,00
=
640 100
=
100 = 2,86
= 6,40 = 1,69
∑ ∑
2
f 2 ⎡ fx ⎤
SD = − ⎢ ⎥
N ⎣ N ⎦
TABEL 4.4
CONTOH MENGGUNAKAN RUMUS ANGKA KASAR UNTUK MENCARI SD
X f fx fx2
10 3 30 38,88
9 9 81 60,84
8 13 104 33,28
7 23 161 8,28
6 24 144 3,84
5 13 65 25,48
4 10 40 57,60
Samsudi - STATISTIKA 25
3 5 15 57,80
∑ ∑
2
f 2
⎡ fX ⎤
SD = − ⎢ ⎥
N ⎣ N ⎦
2
4382 ⎡ 640 ⎤
SD = − ⎢ ⎥
100 ⎣ 100 ⎦
= 43 , 82 − 40 , 96
= 2 , 86
= 1 , 69
TABEL 4.5
TABEL CONTOH MENCARI SDM
Nilai frekuensi
fx fx2
(X) (f)
8,0 1 8,00 64,00
7,5 0 0,00 00,00
7,0 11 77,00 539,00
6,5 21 136,50 887,25
6,0 24 144,00 864,00
5,5 9 49,50 272,25
5,0 5 25,00 125,00
4,5 1 4,50 20,25
Total : 72 444,50 2771,75
Simbul : N ∑fx ∑ fx2
M =
∑ fx = 444,50 = 6,17
N 72
SD =
∑ fx 2
− M 2
Samsudi - STATISTIKA 26
2771,75
= − 6,17 2
72
= 38,4965 − 38,0689
= 0,4276
= 0,654
SD 0,654 0,654
SDM = = = = 0,078
N −1 72 − 1 8,426
Soal Latihan
1. Berikan sebuah contoh sehingga menjadi cukup jelas, apa yang dimaksud dengan
deviasi!
2. Jelaskan hubungan antara deviasi Rata-rata (Average Deviation) dan deviasi Standart
(Standart deviation)!
3. Semakin kecil Deviasi Standart dari sekelompok data, maka data tersebut semakin
besifat homogen. Betulkah penyataan itu? Jelaskan denagn menggunakan sebuah
contoh!
4. Tunjukkan bahwa antara Deviasi Rata-rata dan Deviasi Standart terdapat saling
hubungan! Berikan contohnya!
5. Kemukakan beberapa keunggulan Deviasi Rata-rata dan Deviasi Standart.
6. Mean dan deviasi standart dapat dipergunakan sebagai alat bantu dalam rangka
Evaluasi Hasil Belajar Anak Didik. Jelaskan pernyataan tersebut!
7. Data yang tertera pada table berikut:
x f fx x x2 fx2
31 4 124
30 4 120
29 5 145
28 7 196
27 12 324
26 8 208
25 5 125
24 3 72
23 2 46
Total 50=N 1360=ΣfX
Soal:
a. Buatlah table distribusi frekuensinya;
b. Carilah Nilai Rata-rata Hitungnya;
c. Carilah Deviasi Rata-ratanya;
d. Carilah deviasi Standartnya dengan menggunakan cara mencari Deviasi Standart
untuk data tunggal yang sebagian atau seluruh sekornya berfrekuensi lebih dari
satu.
Samsudi - STATISTIKA 27
BAB V
Tujuan
Samsudi - STATISTIKA 28
Mahasiswa memiliki pemahaman tentang hipotesis, pengujian hipotesis perbedaan
antara dua mean dan standar kesalahan perbedaan dua mean
Samsudi - STATISTIKA 29
menunjuk kepada tidak adanya perbedaan antara sampel yang satu dengan sampel
lainya dalam sesuatu hal yang diteliti.
2 2
SD bM = SD + SD
M 1 M 2
Keterangan:
SDbM = Standard Kesalahan Perbedaan Mean.
2
SD = KUADRAT Standard kesalahan mean dari sampel I, Disebut juga
M1
N − 1
Contoh:
TABEL 5.1
TABEL DISTRIBUSI HASIL UJIAN SEMESTER SISWA LAKI-LAKI DAN PEREMPUAN
Samsudi - STATISTIKA 30
LAKI-LAKI PEREMPUAN
Interval 2
x f fx fx y f fy fy2
50-54 52 0 0 0 52 1 52 2.704
45-49 47 5 235 11.045 47 1 47 2.209
40-44 42 7 294 12.348 42 9 378 15.876
35-39 37 11 407 15.059 37 5 185 6.845
30-34 32 4 128 4.096 32 7 224 7.168
25-29 27 13 351 9.477 27 12 324 8.748
20-24 22 13 286 6.292 22 7 154 3.388
15-19 17 12 204 3.468 17 16 272 4.624
10-14 12 16 192 2.304 12 20 240 2.880
5-9 7 0 0 0 7 3 21 147
Total : - 81 2.097 64.089 - 81 1.897 54.589
Dengan kode x untuk laki-laki dan y untuk perempuan, maka statistiknya adalah
sebagai berikut :
Mx =
∑ fx
=
2 .007
= 25 ,89
N 81
SD 2
=
∑ fx
− M M2
M
N M
84 .089
= − 25,89
81
= 791, 22 − −670 , 29
= 120 ,93
SDM2 120,93 120,93
SD 2
= = = = 1,51
Mx
N X − 1 81 − 1 80
My =
∑ fy = 1.897 = 23,42
Ny 81
SD Y2 125 , 44
SD M2 = −1 =
SDy2 =
∑ fy 2
− M Y2
N y 81 − 1
Ny 125 , 44
= = 1, 57
80
54.589
= − 23,422
81
= 673,94 − 548,50
= 125,44
= 1 , 51 + 1 , 57
SDbM = SDM2 X + SDM2 y = 3 , 08
= 1 , 75499
Samsudi - STATISTIKA 31
Soal Laihan
1. Data tes kecerdasan siswa yang masuk pagi dan masuk siang:
Hitunglah:
a. Mean masing-masing variabel
b. Standar deviasi
c. Standar deviasi perbedaan mean dari dua variabel
Samsudi - STATISTIKA 32
BAB VI
Tujuan
Samsudi - STATISTIKA 33
Salah satu teknik statistika yang sering digunakan untuk mencari hubungan
antara dua variabel adalah teknik korelasi. Dua variabel yang hendak diteliti
hubungannya itu biasa diberi kode varaibel X dan variabel Y. Jadi misalnya, kita ingin
menetapkan apakah ada hubungan atau tidak antara tinggi badan dan kecerdasan,
variabel tinggi badan kita beri kode X, sedang variabel kecerdasan kita sebut Y, atau
sebaliknya.
Samsudi - STATISTIKA 34
disebut teknik korelasi prouduct moment dari PEARSON. Rumus koefisien korelasi
product moment adalah:
rxy =
∑ xy
N.SDx SDy
Di mana :
rxy = Koefisien korelasi antara x dan y
xy = setujuduct dari x kali y
SDx = Standard deviasi dari varaibel x
SDy = Standard deviasi dari variabel y.
N = Jumlah subyek yang diselidiki
TABEL 6.1
KOEFISIEN KORELASI
ANTARA VARAIBEL KEMAMPUAN BERBAHASA (X) DAN MATEMATIK (Y)
Subyek Kemamp. Matematik Subyek Kemamp. Matematik
No. Berbahasa (Y) No. Berbahasa (Y)
(X) (X)
1. 130 20 16. 178 35
2. 132 24 17. 172 30
3. 152 28 18. 165 28
4. 142 23 19. 160 27
5. 184 37 20. 148 25
6. 190 32 21. 180 24
7. 150 25 22. 149 25
8. 170 23 23. 188 36
9. 181 29 24. 167 29
10. 164 35 25. 162 27
11. 175 32 26. 145 23
12. 135 22 27. 150 29
13. 147 24 28. 160 30
14. 162 26 29. 172 31
15. 136 21 30. 154 30
∑x=0 dan ∑ y = 0
4. Kalikan tiap-tiap x dengan tiap-tiap y yang sebaris, dan masukkan dalam kolom xy,
dan
Samsudi - STATISTIKA 35
5. Jumlahkan kolom xy untuk memperoleh ∑ xy .
TABEL 6.2
TABEL UNTUK MENGHITUNG KOEFISIEN KORELASI
PRODUCT MOMENT, BAHAN DIAMBIL DARI TABEL 6.1
Subyek x y x x2 y y2 xy
(1) (2) (3) (4) (5) (6) (7) (8)
1. 130 20 -30 900 -8 64 +240
2. 132 24 -28 784 -4 16 +112
3. 152 28 -8 64 0 0 0
4. 142 23 -18 324 -5 25 +90
5. 184 37 +24 576 +9 81 +216
6. 190 32 +30 900 +4 16 +120
7. 150 25 -10 100 -3 9 +30
8. 170 23 +10 100 -5 25 -50
9. 181 29 +21 441 +1 1 +21
10. 184 35 +4 16 +7 49 +28
11. 175 32 +15 225 +4 16 +60
12. 135 22 -25 625 -6 36 +150
13. 147 24 -13 169 -4 16 +52
14. 162 26 +2 4 -2 4 -4
15. 136 21 -24 576 -7 49 +168
Samsudi - STATISTIKA 36
Dengan tabel di atas dapat kita peroleh data sebagai berikut:
2. M x =
∑x 2. M Y =
∑Y
N N
4.800 840
= = 160 = = 28
30 30
3. SDx =
∑x 2
3. SDy =
∑y 2
N N
8.304 624
= = 16,64 = = 4,56
30 30
4. ∑ xy = 1.890
Besarnya koefisien korelasi:
rxy =
∑ xy = 1.890
= 0,830
N .SDx SDy (30)(16,64)(4,56)
Soal Latihan
Soal: Selidikilah dengan secara seksama, apakah memang terdapat korelasi positif
yang signifikan antara sekor variabel X dan sekor variabel Y, dengan cara:
a. Merumuskan hipotesis alternatifnya
b. Merumuskan hipotesa Nihilnya
c. Melakukan perhitungan untuk memperoleh angka Indeks Korelasi rxy, dengan
mencari SD-nya lebih dulu!
d. Memberikan interpretasi sederhana (secara kasar) terhadap rxy.
e. Memberikan interpretasi terhadap rxy dengan cara berkonsultasi pada Tabel
Nilai “r” Product moment.
f. Kesimpulan apa yang dapat saudara kemukakan?
6. Data:
Sekor Variabel X:
67 72 66 70 73 72 70 69 71 69
73 74 66 72 73 70 72 73 71 72
70 68 79 66 68 71 73 67 69 72
71 73 69 68 66 72 71 70 69 68
71 60 68 67 69 70 71 72 69 72
Sekor Variabel Y (Urutan sama dengan variabel Y):
59 64 58 62 65 64 62 61 63 61
65 66 58 64 65 62 64 65 63 64
62 60 60 58 60 63 65 59 61 64
63 65 61 60 58 64 63 62 61 60
65 60 62 60 59 64 66 63 59 60
Soal:
Coba selidiki dengan cara seksama, apa memang terdapat kolerasi positif yang
menyakinkan (signifikan) antara sekor variabel X dan sekor variabel Y, dengan cara:
Samsudi - STATISTIKA 38
a. Merumuskan Hipotesis alternative
b. Merumuskan Hipotesa Nihilnya!
c. Melakukan perhitungan untuk memperoleh Angka Indeks Kolerasi “r” Product
Moment, dengan Tabel Nilai “r”!
d. Memberikan interpretasi terhadap rxy denagn menggunakan Tabel nilai “r”!
e. Menarik Kesimpulan.
7. Dalam suatu kegiatan penelitian, diperoleh data sebagaimana tertera dalam table
berikut:
Sekolah Asal dan Prestasi Tes SIPENMARU dari 1760 Calon
Prestasi Tes
Sekolah Asal: Jumlah
SIPENMARU:
SLTA Negeri SLTA Swasta
Lulus 270 470 740
Tidak Lulus 180 840 1020
Jumlah 450 1310 1760
Soal:
a. Rumuskan hipotesis alternatif dan hipotesis nihilnya!
b. Cari / Hitunglah Angka Indeks Korelasinya, dengan menggunakan Teknik Korelasi
Koefisien Phi.
c. Berikan interpretasi terhadap Phi dan kemukakan kesimpulannya
Samsudi - STATISTIKA 39
BAB VII
Tujuan
Mahasiswa mampu menerapkan teknik Chi-Kuadrat dan t-score sebagai alat uji
hipotesis dalam teknik analisis komparasional.
Samsudi - STATISTIKA 40
7.1. Chi Kuadrad
Jika kita ingin mengetahui sikap rakyat terhadap koedukasi (sekolah campuran
murid-murid puteri dan putersa). Untuk ini kita mengambil suatu sampel yang terdiri
dari 200 orang dan mengajukan pertanyaan kepada mereka untuk memperoleh pendapat
mereka. Kita misalkan jawaban mereka adalah 115 orang mengatakan setuju dan 85
orang mengatakan tidak setuju.
Dalam contoh di atas, kalau tidak ada sumber-sumber lain yang memberi
ketentuan, kita mengajukan hipotesis bahasan dalam populasi frekuensi dari mereka
yang setuju dan tidak setuju koedukasi terbagi rata (50% lawan 50%). Kita
menanyakan, mengapa kita peroleh perbandingan 115 dengan 85 antara mereka yang
setuju dan yang tidak setuju dari suatu sampel yang kita ambil secara random? Apakah
perbedaan itu hanya semata-mata disebabkan oleh kesalahan sampling, ataukah
memang dalam populasi terdapat perbedaan semacam itu?
Kalau kita mengharapkan frekuensi dari mereka yang setuju dan yang tidak
setuju terbagi rata, maka frekuensi yang diharapkan adalah yang setuju 100 orang
dan yang tidak setuju 100 orang, dalam sampel yang jumlahnya 200 orang itu.
Frekuensi yang diperoleh (disingkat fo) dan frekuensi yang diharapkan (disingkat fh)
dari mereka yang setuju dan yang tidak setuju dapat ditunjukkan dalam tabel sebagai
berikut:
TABEL 7.1
Samsudi - STATISTIKA 41
FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN
frekuensi frekuensi
Sikap terhadap
Yang diperoleh Yang diharapkan
Ke-edukasi
(fo) (fh)
Setuju 115 100
Tidak setuju 85 100
Total : 200 200
Syarat yang perlu dipenuhi adalah jumlah fo harus sama dengan fh. Dalam tabel
di atas ketentuan ini telah kita indahkan, yaitu masing-masing fo = 200 dan fh = 200.
TABEL 7.2
TABEL KERJA PERHITUNGAN CHI KUADRAT
fh
Pro +15 225
115 100 2,25
tidak -15 225
85 100 2,25
setuju
Total : 200 200 0 - 4,50
Samsudi - STATISTIKA 42
Kategori fO fh
- a b
I
II c d
Jumlah : (a+b) (m+n)
Derajad kebebasan untuk bentuk tabel di atas adalah 1. Dengan d.b = 1 maka
untuk taraf signifikansi 5%, berlaku ketentuan jika χ O2 ≥ χ B2 5%, nilai Chi Kuadrat
yang kita peroleh, atau χ2 itu kita katakan signifikan; dan sebagai konsekuensinya
hipotesis (nihil) akan kita tolak. Sebaliknya jika χ o2 < χ b2 5% nilai χ2 itu kita katakan
nonsignifikan, dan berbagai konsekwensinya hipotesis (nihil) akan kita terima.
Contoh
Suatu penelitian dilakukan dengan tujuan untuk mengetahui apakah ada
hubungan atau tidak antara kualifikasi pendidikan (S1 dan SLTA) dengan cara
mengikuti berita-berita di media masa. Untuk ini diberikan daftar pertanyaan atau
angket kepada dua sampel, yaitu sampel tamatan sekolah tinggi dan sampel tamatan
sekolah menengah. Kepada mereka ditanyakan, apakah mereka mengikuti berita-berita
dengan perantaraan radio ataukah surat kabar. Dari 200 orang tamatan sekolah tinggi
yang ditanyai, 130 orang menjawab melalui “radio” sedang dari 100 orang tamatan
SMA ada 55 orang yang menjawab melalui “radio”. Data tersebut dapat dihimpun
dalam tabel kerja sebagai berikut:
TABEL 7.3
TABEL FREKUENSI YANG DIPEROLEH DAN YANG DIHARAPKAN
Sumber berita
Sampel Total
Radio Surat Kabar
Samsudi - STATISTIKA 43
Tamatan S1 130 70 200
Tamatan SLTA 55 45 100
Total 185 115 300
Hipotesis nihil untuk masalah di atas adalah: “tidak ada perbedaan yang
signifikan antara frekuensi sampel I (tamatan S1) dengan frekuensi sampel II (tamatan
SLTA) dalam memilih sumber-sumber berita. Kita lihat dalam tabel itu bahwa ada 185
orang dari 300 orang yang memilih radio sebagai sumber berita (atau dinyatakan dalam
per se n ada 61,67 %), dan ada 115 orang dari 300 orang yang memilih surat kabar (atau
dinyatakan dalam per se nada 38,33%). Persentase-persentase itulah yang kita gunakan
sebagai dasar menetapkan frekuensi yang kita harapkan bagi sampel tamatan sekolah
menengah atas ada 61,67% dari 100 orang, ada 61,67 orang. Atas dasar data tersebut
dibuat table kerja sebagai berikut:
TABEL 7.4
TABEL KERJA UNTUK MENGETES PERBEDAAN FREKUENSI
Sampel
Sumber
fo fh fo-fh (fo-fh) 2 (f o− fh )
2
Berita
fh
Sekolah Radio 130 123,33 +6,67 44,49 0,36
Tinggi Surat Kabar 70 76,67 -6,67 44,49 0,58
Sekolah Radio 55 61,67 -6,67 44,49 0,72
Menengah Surat 45 38,33 +6,67 44,49 1,16
Atas Kabar
Total : 300 300,00 0,00 - 2,82
χ =
2
∑ fh
= 2 ,82
Dari Tabel di atas 2x2 (dengan 2 baris dan 2 kolom semacam itu derajad
kebebasan diperoleh dari rumus d.b. = (b-1) (k-1) dalam mana d.b. = derajad kebebasan,
b = baris, dan k = kolom. Atau riilnya, untuk tiap-tiap tabel 2x2 d.b. nya = satu,
diperoleh dari (2-1) (2-1). Berdasarkan hasil Chi Kuadrat = 2,82 menunjukkan bahwa
baik atas dasar taraf signifikansi 5% maupun 1% perbedaan frekuensi yang diperoleh
itu tidaklah signifikan. Konsekwensinya adalah hipotesis nihil yang diajukan, yaitu
bahwa tidak ada perbedaan yang signifikan dalam frekuensi pilihan sumber-sumber
berita dari tamatan S1 dan tamatan SLTA diterima.
7.2. t-Score
Pada dasarnya t-score tidak lain adalah z-score hanya saja di sini kita tidak lagi
menghadapi distribusi angka kasar, melainkan distribusi perbedaan. Inilah sebabnya
Samsudi - STATISTIKA 44
mengapa yang dijadikan x bukan sesuatu angka kasar, tetapi angka perbedaan mean,
kedua sampel yang diteliti. Lengkapnya t-score itu adalah sebagai berikut :
Mx −M −Mh
t =
y
SD bM
Dimana :
Mx = Mean dari sampel x
My = Mean dari sampel y
Mh = Mean hipotetik dari distribusi perbedaan mean
SDbM = Standard kesalahan perbedaan mean
M − M
t =
x y
SD bM
Sebagai contoh, data pada tabel 6.1, mean-mean yang kita peroleh adalah 25,89 dan
23,42 dengan SDbM = 1,75499. Jika kita mengisikan bilangan-bilangan itu ke dalam
rumus t- score, akan kita peroleh:
M − M 25 ,89 − 23 , 42 2 , 47
t= = = = 1, 407
x y
SD bM 1, 75499 1, 75499
Jika kita menggunakan taraf kepercayaan atau taraf penerimaan 95% (lebih
sering disebut taraf signifikansi 5%), maka kita tidak mempunyai bukti-bukti untuk
menolak hipotesis “bahwa tidak ada perbedaan antara kecerdasan murid-murid putera
dan murid-murid puteri yang kita teliti”. Atau dengan perkataan lain boleh dinyatakan
bahwa berdasarkan bukti-bukti yang dikumpulkan ternyata bahwa antara kedua jenis
kelamin itu dengan taraf kepercayaan 95% tidak terdapat perbedaan dalam hal
kecerdasan sebagaimana ditunjukkan oleh hasil test kecerdasan.
Ada dua rumus yang dipersiapkan untuk meneliti signifikansi perbedaan mean
dari sampel-sampel yang berkorelasi. Kedua rumus ini akan memberikan hasil yang
sama. Cuma saja rumus yang satu, disebut rumus panjang atau Long method, melalui
jalan yang melingkar-lingkar, sedang rumus yang satunya lagi, dibuat rumus pendek
atau short method, melalui jalan yang langsung dan singkat. Kedua rumus itu berbunyi :
RUMUS PANJANG :
Mk − Me
t=
(SD
2
Mk + SD 2
Me ) − 2r (SD )(SD )
ke Mk Me
Di mana :
SDk2
SDM2 k =
Nk − 1
SDe2
SDM2 e = k = Kelompok Kontrol
Ne − 1
rke =
∑ ke e = Kelompok eksperimen
(∑ k )(∑ e )
2 2
RUMUS PENDEK :
Mk − Me
t=
∑b 2
N ( N − 1)
Untuk segera dapat diketahui penggunaan dari kedua rumus itu akan diberikan
contoh-contohnya. Sekedar catatan perlu diberikan lebih dahulu.
1. Rumus panjang, diperuntukan bagi penelitian eksperimental yang menggunakan
method subjects designs, yaitu eksperimen yang menggunakan kelompok
eksperimen dan kelompok control yang sudah disamakan subyek demi subyek
sebelum eksperimen dijalankan. Yang disamakan adalah satu variabel (atau
lebih) yang telah diketahui mempunyai pengaruh terhadap hasil eksperimen,
yaitu variabel diluar variabel atau faktor yang dieksperimenkan.
Samsudi - STATISTIKA 46
2. Rumus pendek, adalah rumus yang serba guna dan efisien. Rumus ini
dipersiapkan untuk menyelesaikan penelitian eksperimen yang menggunakan
matched subjects designs. Seperti yang disebutkan dalam angka (1) diatas
dengan cara yang lebih singkat dan efisien. Kecuali itu rumus ini juga
disediakan untuk menganalisa eksperimen yang menggunakan designs
treatments by subjecte. Ini adalah eksperimen yang menggunakan hanya satu
kelompok (one group experiment) yang sekaligus menjadi kelompok
eksperimen dan kelompok kontrol pada periode-periode eksperimen yang
berlainan.
TABEL 7.5
TABEL PERSIAPAN UNTUK T-TEST SAMPEL-SAMPEL
YANG BERKORELASI DENGAN RUMUS PENDEK
Pasangan
Subyek K E K2 E2 KE
K-E
(1) (2) (3) (4) (5) - (6)
1 – 12 5,0 5,2 -0,2 +0,2 0,04
2 – 14 5,8 6,5 -0,7 -0,3 0,09
3 – 15 5,8 4,9 +0,9 +1,3 1,69
4 – 17 6,3 7,8 -1,5 -1,1 1,21
5 – 15 6,3 6,6 -0,3 +0,1 0,01
6 – 16 6,5 7,5 -1,0 -0,6 0,36
7 – 13 6,9 6,1 +0,8 +1,2 1,44
8 – 20 7,2 8,3 -1,1 -0,7 0,49
9 – 19 7,4 8,1 -0,7 -0,3 0,09
10 - 18 7,8 8,0 -0,2 +0,2 0,04
Total 65,0 69,0 -4,0 0,0 5,46
MB =
∑B b = B - MB
N
− 4,0
=
10
= −0,4
Harus dicek :
∑B = ∑K − ∑E
Dan
∑ b = 0,0
Samsudi - STATISTIKA 47
Dimasukkan ke dalam rumus:
Soal Latihan
Samsudi - STATISTIKA 48
Soal:
a. Carilah “t” dengan menggunakan rumus dari fisher!
b. Berikan interpretasi terhadap “to” denagn berkonsultasi terhadap table Harga
Kritik “t” pada taraf signifikansi 5%.
10. Sekor Hasil Tes Matematika dari 40 orang siswa SMK sebelum diajar dengan
metode baru adalah sebagai berkut:
68 50 58 40 62 54 66 70 46 56
60 64 42 52 48 44 76 72 43 74
51 65 57 51 55 49 62 59 64 59
53 54 45 55 60 75 70 50 40 53
Sedangkan sekor sasil tes Matematika dari 40 orang siswa yang sama di atas,
setelah diajar dengan metode baru adalah sebagai berikut:
87 55 72 45 71 66 84 90 54 69
75 81 48 51 57 54 99 93 58 96
50 83 69 77 65 58 77 72 64 59
70 60 55 59 69 79 70 59 48 65
Soal:
Selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan Mean
hasil tes Matematika dikalangan 40 siswa SMK tersebut, antara sesudah dan sebelum
diajar dengan metode baru dengan cara:
a. Menemukan Ha dan Ho –nya lebih dahulu
b. Menguji kebenaran / kepalsuan hipotesa tersebut dengan membandingkan
besarnya to dan ttabel pada taraf signifikan 5%
c. Apa kesimpulan yang diperoleh?
11. Dalam suatu kegiatan yang dilaksanakan dengan tujuan untuk mengetahui
bagaimana pendapat para penonton televisi mengenai acara Dakwah yang
dituangkan dalam bentuk ceramah dan Sandiwara televisi, dalam penelitian mana
telah disiapkan 800 orang penonton televisi sebagai sempel penelitian, telah
berhasil dihimpun data jawaban yang mereka berikan kepada tim peneliti, sebagai
berikut:
Pendapat: f
A. Siaran Dakwah melalui sandiwara televise lebih baik daripada 243
ceramah
B. Siaran Dakwah melalui ceramah lebih baik daripada sandiwara 235
televisi
C. Siaran Dakwah melalui Ceramah dan sandiwara televise sama 232
baiknya
D. Saya tidak dapat menemukakan pendapat 90
Soal:
Berdasarkan perimbangan bahwa pendapat para penonton televisi mengenai Siaran
Dakwah itu merupakan faktor determinan (faktor yang menentukan) yang perlu
dipertimbangkan dalam penyusunan program Siaran Dakwah lewat televisi itu, cobalah
Samsudi - STATISTIKA 49
selidiki secara seksama, apakah memang secara signifikan terdapat perbedaan frekuansi
yang diibservasi dan frekuensi toritiknya, dengan cara:
a. Terlebih dahulu menyusun hipitesa alternative dan hipotera Nolnya.
b. Mengetes perbedan frekuensinya dengan menggunakan Teknik Analisis Kai
kuadrat.
c. Memberikan interpretasi terhadap kai kuadrat, dengan menggunakan signifikan
5%.
d. Kemukakan kesimpulannya
12. Sejumlah 300 oarang mahasiswa pada sebuah perguruan tinggi ditetapkan sebagai
sempel dalam rangka kegiatan penelitian yang berjudul “Komparasi Prestasi Studi
Mahasiswa Dalam hubungannya Dengan kegiatan Para Mahasiswa dalam
Organisasi-organisasi kemahasiswaan”. Mereka itu dibagi dalam kedua kelompok,
yaitu: 60 orang mahasiswa yang duduk dalam kepengurusan organisasi-organisasi
kemahasiswaan, dan 240 orang lainnya adalah mahasiswa yang tidak duduk dalam
kepengurusan organisasi kemahasiswaan. Dari kedua kelompok mahasiswa tersebut
berhasil dicatat hasil belajar mereka dalam ujian semester difakultas mereka masing
masing sebagai berikut: Dari sejumlah 60 orang mahasiswa yang menjadi pengurus
organisasi kemahasiswaan, 20 orang diantaranya lulus pada ujian utama; 25
diantaranya dinyatakan lulus dalm ujian ulangan, sedangkan sisanya yaitu 15 orang
dinyatakan gagal. Selanjutnya dari sejumlah 240 orang mahasiswa yang tiadak
menjadi pengurus organisasi kemahasiswaan, 80 orang diantaranya dinyatakan
lulus ujian utama, 120 orang lulus pada ujian utama dan 40 orang selebihnya
dinyatakan gagal dalam ujian tersebut.
Soal:
a. Rumuskan Hipotesis alternatifnya dan Hipotesis Nihilnya!
b. Ujilah Hipotesis tersebut dengan menggunakan Teknik analisis kai kadrat!
c. Berikan interpretasi terhadap Kai Kuadrat dengan menggunakan signifikan 5%.
d, Apa kesimpulan yang dapat dikemukakan?
13. Data:
Jenis Sekolah / sikap Baik Cukup Kurang Total:
keagamaan
Sekolah Umum 100 140 60 300
Sekolah Teknik 40 90 50 180
Sekolah Guru 63 40 17 120
Total 203 270 127 600=N
Soal:
Dengan menggunakan Teknik Analisa Kai Kuadrat, Ujilah hipotesis nol yang
menyatakan bahwa diantara 600 orang siswa SLTA yang berbeda jenis sekolahnya
itu tidak dapat berbeda sikap keagamaan yang signifikan!
Samsudi - STATISTIKA 50
BAB VIII
ANALISIS VARIANSI
Tujuan
Mahasiswa memiliki pemahaman tentang teknik analisis variansi sebagai alat analisis
data dan uji hipotesis yang meliputi mean kuadrat, asumsi-asumsi dalam Anava, Anava
Klasifikasi Tunggal dan Anava Klasifikasi Ganda dan dapat menggunakan Anava
untuk menganalisis data penelitian.
Samsudi - STATISTIKA 51
8.1. Konsep Mean Kuadrat
Perlu diingat kembali apa yang disebut varian dalam pembicaraan tentang SD
(standar deviasi). Varians adalah SD kuadrad, yang diperoleh dengan rumus:
SD 2
=
∑ x2
N
Hanya saja dalam hubungan dengan pembicaraan kita sekarang ini kwalitas itu tidak
disebut varians, melainkan Mean KUADRAT, disingkat dari mean dari jumlah
KUADRAT, dan diberi simbul MK, dan diperoleh dengan rumus:
DK
MK =
d b
DK = jumlah KUADRAT,
d b = derajad kebebasan.
Dalam teknik Anava ini yang menjadi alat pengukuran variabilitas antar
kelompok adalah mean KUADRAT atar kelompok (disingkat dengan MKant), sedang
yang menjadi alat pengukuran variabilitas dalam kelompok adalah mean KUADRAT
dalam kelompok (disingkat dengan MK dal).
Hasil bagi dari kedua komponen ini, yaitu MKant dan MKdal, akan memjadi
petunjuk seberapa jauh jarak penyimpangan mean-mean kelompok kita itu dari mean
hipotetis (yaitu bahwa tidak ada perbedaan antara mean-mena variabel yang diselidiki)
sebagai akibat dari kesalahan sampling. Jadi sebenarnya yang kita cari adalah
menemukan MKant yang mewakili variabilitas dalam kelompok. Jika kedua MKdal yang
mewakili variabilitas dalam kelompok. Jika kedua MK itu sudah kita ketemukan, maka
perbandingan antara keduanya akan dapat digunakan sebagai dasar menarik kesimpulan
statistik tentang obyek yang sedang kita teliti.
Rumus umum untuk mencari MK, yaitu :
Samsudi - STATISTIKA 52
DK an t DK dal
MK ant = MK dal =
db ant dbdal
8.2. F – Ratio
MK
F = ant
MK da l
Besarnya nilai-nilai F yang terjadi hanya 5% dan 1% dari seluruh kejadian dari sample-
sampel yang diambil secara random, sekiranya memang hipotesis nilai adalah benar.
Jika MKant adalah sedemikian besarnya, jauh melebihi MKdal sehingga perbandingan
kedua MK itu menunjukkan nilai yang menyamai atau melebihi nilai F dalam tabel
pada dasar taraf signifikansi 5 % dan 1%, maka kita menyimpulkan bahwa tidak
mungkin nilai F sebesar itu terjadi kalau hipotesis nihil dan mengatakan bahwa F yang
kita peroleh menunjukkan nilai yang signifikan atas dasar taraf signifikansi 5 % dan 1
%.
Misalkan hipotesis nihil yang kita ajukan dalam penelitian kita itu adalah: “tidak
ada perbedaan yang signifikan antara kelima kelompok pelajar-pelajar SMA dari
berbagai daerah dalam soal kecakapan atau pengetahuan kebudayaan” .
MKant yang kita peroleh adalah 4.93, dan MKdal-nya 5,56. Jika harga-harga MK
tersebut kita isikan ke dalam rumus F, maka:
Samsudi - STATISTIKA 53
MK ant 4 , 93
F = =
MK da l 5 , 56
= 0 , 873
MK
F db ant
; db dal = ant
F 4; 45 = 0,873
MK dal
Untuk mengkosultasikan harga F diatas, dapat ditempuh dua cara.
MK yang lebih kecil adalah MKant = 4,93 Derajad kebebasan dari MK ini = 4.
kita cari db = 4 dalam kolom sebelah kiri, kit abaca kekanan sampai menyilang kolom
db = 45 sebagai db dari MK kita yang lebih besar. Karena ternyata tidak ada kolom db =
45, maka kita ambil saja suatu bilangan diantara db = 40 dan db = 50, yaitu bilangan-
bilangan 5,71 dan 5,70, jika kita gunakan taraf signifikansi 5 %, sedang bilangan-
bilangan diantara 5,71 dan 5,70 adalah 5,705, taraf signifikansi 5%, sedang bilangan-
bilangan pada baris bawah adalah bilangan-bilangan batas F pada taraf signifikansi 1%.
Karena itu jika kita gunakan taraf signifikansi 1%, bilangan batas yang kita cari adalah
bilangan diantara 13,74 dan 13,69, yaitu bilangan 13,715.
Dari pemeriksaan pada tabel itu ternyata bahwa F yang kita peroleh sebesar
0,873 berada jauh di bawah batas signifikansi 5%, apalagi sebagai konsekuensinya
hipotesis nihil yang kita ajukan sebelum penelitian kita terima. Kesimpulan kita akan
berbunyi kira-kira sebagai berikut:
“Bahwa menurut bahan-bahan yang dikumpulkan dalam penelitian itu diperoleh bukti-
bukti antara pelajar-pelajar SMA dari berbagai daerah itu tidak terdapat perbedaan yang
signifikan mengenai pengetahuan kebudayaan”.
Tabel 8.1
Tabel Ringkasan Anava
F teoritis
Sumber Derajad Jumlah Mean
F empiris (hipotetis)
Variasi Kebebasan KUADRAT KUADRAT
FO Ft
SV db DK MK
5% 1%
Kelompok
Pelajar 4 19,72 4,93
SMA 0,873 5,705 13,715
Dalam
45 254,30 5,65
Kelompok
Total 49 274,02 - - - -
Samsudi - STATISTIKA 54
Kesimpulan : Karena FO = 0,873 < Ft5% = 5,705 maka HO diterima.
Tabel 8.2
Tabel Ringkasan Anava dari bahan-bahan dalam tabel
Sumber
Variasi db JK RJK FO Ft
SV 5% 1%
Kelompok
(∑ X ) 2
(∑ X ) 2
DK ant
apa ? C–1 ∑ k
− tot
( antar)
nk N C −1 MK ant
? ?
Dalam (∑ X ) 2
DK dal MK
∑X
dal
Kelompok N–C 2
tot − k
(dalam) nk N −C
(∑ X ) 2
Samsudi - STATISTIKA 55
51 2601 57 3249 67 4489 175 10339
41 1681 53 2809 66 4356 160 8846
40 1600 52 2704 62 3844 154 8148
34 1156 48 2304 60 3600 142 7060
27 729 46 2116 54 2916 127 5761
20 400 42 1764 50 2500 112 4664
18 324 27 729 32 1024 77 2077
420 20488 530 29884 640 43618 1590 993950
∑X
2
∑X
2
∑ ∑ ∑ ∑ ∑
2
∑
2
X1 X 2 X 3 X X tot X tot
1 2 3
n1 = 10 n2 = 10 n3 = 10 N = 30
(∑ X ) 2
(1 .590 ) 2
(1) DKtot = ∑X 2
tot −
N
tot
= 93 .950 −
30
2528100
= 93.950−
30
= 93.950− 84270
= 9.680.
(2) DKan t =
(∑ X ) 1
2
+
(∑ X ) 2
2
+
(∑ X ) 3
2
−
(∑ X ) tot
2
n1 n2 n3 N
=
(420) (530) (640) (1.590)
2
+
2
+
2
+
2
10 10 10 30
= 86.690 − 84270
= 2.420
DK ant 2.420
(4) MKant = =
m −1 3 −1
= 1.210
MK dal 7.260
(5) MKdal = =
N − m 30 − 3
= 268,90
MK ant 1.210
(6) Fm – 1; N – m = =
MK dal 268,9
Samsudi - STATISTIKA 56
= 4 , 50
Tabel 8.4
Tabel Ringkasan Anava dari bahan tabel
Sumber
Signifikansi
Variasi db DK MK FO Ft
Nonsignifi
SV
Kelompok t.s.5%
2 2.420 1.210 Sig
“K” 3,35
4,50
Dalam t.s.1%
27 7.260 268,9 Nonsig
Kelompok 5,49
Total 29 9.680 - - - -
Jadi, dengan taraf signifikansi 5% kita akan menolak hipotesis nihilnya yang
mengatakan bahwa tidak ada perbedaan sikap antara ketiga kelompok yang diselidiki.
Kita menolaknya disebabkan karena kita meragukan bahwa variabilitas antar kelompok
sebesar 4,50 itu semata-mata disebabkan karena kesalahan sampling.
Bagaimana halnya jika kita gunakan taraf sigibifikansi 1%?. Bilangan batas
signifikansi atau batas penolakan hipotesis nihil dengan taraf signifikansi 1% adalah
5,49. Dengan demikian hipotesis nihil itu kita terima. Karena batas penolaknnya masih
belum dilewati. F yang kita peroleh = 4,50 dan ini masih di bawah Ft = 5,49 sebagai
batas signifikansinya. Kita menerima hipotesis nihilnya karena jikalau kita
menggunakan dasar taraf signifikansi 1%, kita memandang deviasi-deviasi yang
besarnya terjadi 5 kali dalam 100 atau 4 kali dalam 100 kemungkinan, atau malahan 2
kali dalam 100 kemungkinan masih disebabkan karena kesalahan sampling. Hanya
deviasi-deviasi yang terjadi 1 kali diantara 100 kejadian yang kita pandang tidak
disebabkan oleh kesalahan sampling.
Samsudi - STATISTIKA 57
(2) Bahwa distribusi gejala yang diselidiki dalam masing-masing populasi itu adalah
normal.
(3) Bahwa varians-varians atau SD2 dari masing-masinng populasi tidak menunjukkan
perbedaan yang signifikan satu sama lain.
Bagaimana memenuhi sarat-sarat yang ditentukan itu dapat dituturkan secara singkat
sebagai berikut :
(1) Random samples : dapat kita penuhi dengan cara yang sudah dibicarakan dalam
permulaan bab VII. Gunakan tabel bilangan random untuk mengambil random
clusters, random areas, atau random subjectsnya.
(2) Normal distributions: dapat kita penuhi melalui dua jalan. Pertama, atau kita
mengadakan pengetesan normalitas (test of normality) dengan rumus-rumus yang
sudah kita ketahui. Ini kita lakukan jika kita belum mempunyai bukti-bukti bahwa
gejala yang kita selidiki mengikuti cirri-ciri distribusi normal. Kedua, atau jika kita
telah mempunyai bukti-bukti bahwa varaibel yang kita selidiki telah mengikuti
distribusi normal, baik bukti ini kita peroleh dari penelitian-penelitian pendahuluan
maupun dari penelitian-penelitian orang lain yang mendahului, kita dapat
menggunakan bukti-bukti sebagai landasan untuk memenuhi sarat atau tuntutan
normalitas ini.
(3) Correlated variances : dapat kita penuhi dengan mengadakan pengetesan terhadap
varians-varians (test of variance) yang kita peroleh dari distribusi-distribusi yang
kita peroleh dari distribusi-distribusi yang kita selidiki. Rumus untuk ini adalah :
2
SD
F db Vb ; dbVk = bs
2
SD
kt
Dalam mana db Vb = derajad kebebasan dari Varians yang lebih besar, db Vk = derajad
2 2
kebebasan dari varians yang lebih kecil, dan SD dan SD masing-masing adalah
bs kt
varians yang lebih besar dan varians yang lebih kecil. Kongkritnya, dari bahan tabel 67
hal. 375 kita dapat mengetest variansnya seperti berikut :
Kelompok I
n = 10 ∑ x = 135. ∑x2 = 1881
1881 1352 18825
SD 2 = − 2 = 188,1 −
10 10 100
= 188,10 − 182,25
= 5,85
Kelompok II
n = 10 ∑ x = 153. ∑x2 = 2385
2385 1532 23409
SD =2
− 2 = 238,5 −
10 10 100
Samsudi - STATISTIKA 58
= 238,5 − 234,09
= 4,41
Dari perhitungan itu kita ketahui itu kita ketahui bahwa SD2 atau varians yang
lebih besar adalah varians dari kelompok I. Varians yang lebih besar ini kemudian kita
jadikan pembilang dalam test of variance kita.
5,85
Karena itu F 9;9 = = 1,33
4,41
Dengan melihat tabel pada derajad kebebasan 9 lawan 9 akan kita ketemukan
bahwa FO = 1,33 ini lebih kecil daripada F15% = 3,18. karena itu kita menyimpulkan
bahwa varians dari kelompok I dan kelompok II itu tidak berbeda secara signifikan, hal
mana berarti bahwa varians dari kedua kelompok itu dalam populasinya masing-masing
adalah tidak berbeda.
Analisa varians ternyata dapat digunakan untuk meneliti bahan-bahan yang
telah disusun ke dalam bermacam-macam distribusi. Di bawah ini diberikan contoh-
contoh penggunaan Anava pada (1) distribusi tunggal; (2) distribusi bergolong dan (3)
distribusi deskriptip. Penerapan itu akan dibaca secara berturut-turut.
(1)
DKtot = ∑ fX2tot −
(∑ fX ) tot
2
N
(2)
DKant =
(∑ fX ) − (∑ fX )
1
2
tot
2
+ .........+
(∑ fX ) − (∑ fX )
m
2
tot
2
n1 N nm N
Tabel 8.5
Distribusi hasil tes Potensi Akademik dari tiga kelompok mahasiswa
Kelompok 1 Kelompok II Kelompok III Total
Nilai 2
fX 1
X f fX1 f fX2 fX 22 f fX3 fX 32 f fXt fX t2
Samsudi - STATISTIKA 59
11 1 11 121 1 11 121 2 22 242 4 44 454
10 2 20 200 2 20 200 1 10 100 5 50 500
9 3 27 243 4 36 324 3 27 243 10 90 810
8 5 40 320 7 56 448 7 56 448 19 152 1216
7 9 63 441 11 77 539 5 35 245 25 175 1225
6 7 42 252 5 30 180 8 48 288 20 120 720
5 6 30 150 4 20 100 5 25 125 15 75 375
4 2 8 32 4 16 64 5 20 80 11 44 176
3 4 12 36 3 9 27 3 9 27 10 30 90
2 1 2 4 2 4 8 3 6 12 6 12 24
1 3 3 3 1 1 1 1 1 1 5 5 5
0 1 0 0 0 0 0 2 0 0 3 0 0
Total 44 258 1802 44 280 2012 45 259 1811 133 797 5625
Anava dari bahan tersebut dapat dikerjakan dengan cara-cara yang biasa :
797 2 635209
(1) DK tot = 5625 − = 5625 − = 5625 − 4776,01
133 133
= 848 , 99
db dari MK yang lebih besar adalah 130, sedang db dari MK yang lebih kecil
adalah 2. jika kit abaca tabel F1 dengan db 130 lawan 2 maka akan kita ketahui bahwa
batas penolakan hipotesis pada taraf signifikansi 5% adalah 19,49, dan pada taraf
signifikansi 1% adalah 99,49. Ternyata nilai F yang kita peroleh itu berada sangat jauh
di bawah batas signifikansi 1%. Dengan begitu maka hipotesis nihil yang kita ajukan,
kita terima. Kesimpulan kita adalah bahwa atas dasar bahan-bahan yang kita kumpulkan
sampai sekian jauh, antara kelompok signifikansi tentang pengetahuan psikologi
mereka.
Samsudi - STATISTIKA 60
Tabel Singkatan Anava dari pekerjaan analisa tersebut di atas dapat dilihat
pada tabel 8.6 di bawah ini.
Tabel 8.6
Tabel Ringkasan Anava dari bahan dalam table 8.5
Sumber Signifikansi
db DK MK FO Ft
Variasi
Antar
2 9,32 4,66
Kelompok t.s.5%
0,72 Nonsig
Dalam =19,49
13 839,67 6,46
Kelompok
Total 132 848,99 - - - -
Tabel 8.7
Tabel Distribusi Bergolong
Peria Wanita Total
Kode 2
Interval gaji fX 1
X f fX1 f fX2 fX 22 f fXt fX t2
Rp.7000-7999 6 4 24 144 1 6 36 5 30 180
Rp.6000-6999 5 8 40 200 5 25 125 13 65 325
Rp.5000-5999 4 12 48 192 10 40 160 22 88 352
Rp.4000-4999 3 15 45 135 12 36 108 27 81 243
Rp.3000-3999 2 8 16 32 18 36 72 26 52 104
Rp.2000-2999 1 3 3 3 7 7 7 10 10 10
Rp.1000-1999 0 1 0 0 3 0 0 4 0 0
Total - 51 176 706 56 150 508 107 326 1214
3262 106276
(1) DK tot = 1214 − = 1214 − = 1214 − 993,23
107 107
= 220 , 77
Samsudi - STATISTIKA 61
1762 1502 3262 30976 22500 106276
(2) DK ant = + − = + −
51 56 107 51 56 107
= 607 ,37 + 401,79 − 993,23 = 1009 ,16 − 993,23
= 15,93
(3) DKdal = 220,77 −15,93 = 204,84
15,93
(4) MKant = = 15,93
1
204,84
(5) MKdal = = 1,95
105
15,93
(6) F1;105 = = 8,17
1,95
Dimasukkan dalam tabel ringkasan Anava :
Tabel 8.8
Ringkasan Anava dari bahan dalam tabel
Sumber Signifikansi
db DK MK FO Ft
Variasi
db dari MK yang lebih besar = 1, dan db dari MK yang lebih kecil = 105.
Pemeriksaan pada tabel F menunjukkan bahwa dengan taraf signifikansi 5% dan 1 %
batas penolakan itu maka hipotesis nihilnya kita tolak. Kita menyimpulkan bahwa
berdasarkan bahan-bahan yang masuk ada perbedaan besarnya gaji guru-guru wanita
dna peria. Mean dari gaji peria = 176/51=3,45. sedang mean dari gaji wanita = 150/56 =
2,68. karena gaji peria ternyata lebih besar daripada wanita, dan perbedaan itu
signifikan, maka akhirnya kita menyimpulkan bahwa gaji adalah fungsi daripada jenis
kelamin, dan guru-guru peria mempunyai kecenderungan memperoleh gaji yang lebih
tinggi.
Tabel 8.9
Konsumsi bensin per km dari lima macam merk sepeda motor
M ERK
MODEL TOTAL
A B C D E
Tahun 2008 26 22 22 24 18 112
Tahun 2007 24 21 20 20 20 105
Tahun 2006 22 18 19 19 16 94
Tahun 2005 20 15 17 13 15 80
Tahun 2004 14 12 11 18 12 67
Total 106 88 89 91 81 458
Dengan menggunakan Anava yang biasa kita dapata mengetest hipotesis nihil
: “Bahwa ada perbedaan konsumsi bensin antara kelima merk sepeda motor itu”.
Dengan Anava klasifikasi tunggal akan kita peroleh hasil-hasil sebagai berikut :
4582
(1) DK tot = 26 + 24 + ... + 12 −
2 2 2
= 393,44
25
1062 882 892 942 812 4582
(2) DK ant = + + + + − = 69,04
5 5 5 5 5 25
(3) DKdal = 393,44− 69,04 = 324,40
69,04
(4) MK ant = = 17,26
4
324,40
(5) MKdal = = 16,22
20
17 ,26
(6) F 4;20 = = 1,06
16,22
Tabel 8.10
Samsudi - STATISTIKA 63
Ringkasan Anava dari bahan dalam tabel 9.5
Sumber Signifikansi
db DK MK FO Ft
Variasi
Data dalam tabel di atas dapat juga digunakan untuk menetapkan DK-DK dari
merk maupun model. Analisa varians untuk ini pada prinsipnya adalah sama seperti
yang telah kita pelajari. Beberapa dari pekerjaan kita di atas dapat kita ambil lagi untuk
analisa ini.
2
Perlu dicatat bahwa suku 458 dalam perhitungan-perhitungan DKmerk dan
25
DKmodel di atas kita sebut suku koreksi. Jumlah pembilang pada tiap-tiap pecahan yang
ditambahkan sebelum diKUADRATkan harus sama dengan pembilang dari suku
koreksi. Demikian juga jumlah pembagi pada tiap-tiap pecahan yang ditambahkan
sebelum diKUADRATkan dalam tiap-tiap menghitung DK haruslah sama dengan
pembagi dari suku koreksi. Catatan ini perlu diperhatikan agar kita meneliti kembali
jumlah-jumlah itu sebelum menghitung tiap-tiap DK.
Hasil Anava dari data tersebut yang memasukkan dua jenis klasifikasi yaitu
klasifikasi merk dan klasifikasi odel, ditunjukkan dalam tabel 8.11 di bawah ini. Dari
dua klasifikasi ini dapat perbedaan yang signifikan antara kenihilan yang aseli, yaitu
bahwa tidak ada perbedaan yang signifikan antara kelima macam merk dapat ditest
kembali. Hipotesis yang kedua ialah hipotesis nihil tentang tidak adanya perbedaan
yang signifikan antara kelima mode. Periksalah kembali test hipotesis pertama yang
sudah dikerjakan di muka. Hipotesis nihil itu diterima atas dasar klasifikasi tunggal
(periksa tabel 8.10). Persoalannya sekarang apakah kesimpulan itu masih dapat
dipertahankan jadi faktor model turut diperhitungkan?
Tabel 8.11
Tabel ringkasan Anava tentang konsumsi bensin sepeda motor
ditinjau dari segu merk dan model
Sumber Jumlah Mean setujubabilitas
db FO
Variasi KUADRAT KUADRAT Kejadian (p)x)
Merk 4 69,04 17,26 4,96
p < 1 % xx)
Model 4 286,76 67,19 19,32
p < 1% xx)
Dalam 16 55,64 3,48 -
Samsudi - STATISTIKA 64
Total 24 393,44 - - -
Soal Latihan
1. Distribusi hasil tes Matematika terhadap tiga kelompok siswa disajikan sebagai
berikut:
Nilai Kelompok 1 Kelompok II Kelompok III Total
Matematika f f f f
80 1 1 2 4
79 2 2 1 5
78 3 4 3 10
77 5 7 7 19
76 9 11 5 25
75 7 5 8 20
72 6 4 5 15
68 2 4 5 11
66 4 3 3 10
62 1 2 3 6
61 3 1 1 5
60 1 0 2 3
Total 44 44 45 133
Ujilah pada taraf signifikansi 5%, apakah ada perbedaan secara signifikan nilai
matematika pada tiga kelompok tersebut. Buat/masukkan juga ke dalam tabel
ringkasan Anava.
2. Data di bawah ini menunjukan distribusi interval gaji kelompok guru sekolah
(SMA, MA dan SMK).
Ujilah apakah ada perbedaan secara signifikan distribusi gaji tiga kelompok guru
tersebut, pada taraf signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan
Anava.
3. Data rata-rata suhu mesin pada lima macam merek sepeda motor (A, B, C, D, dan E),
masing-masing untuk tahun pembuatan/model yang berbeda (2004, 2005, 2006,
2007, dan 2008), disajikan sebagai berikut:
M ERK
MODEL TOTAL
A B C D E
Tahun 2004 85 86 85 85 86
Tahun 2005 84 85 84 83 83
Tahun 2006 84 84 83 83 82
Tahun 2007 82 82 81 81 81
Tahun 2008 82 81 80 80 80
Total
Ujilah apakah ada perbedaan secara signifikan rata-rata panas mesin pada lima
merek motor yang berbeda dan model/tahun pembuatan yang berbeda, pada taraf
signifikansi 5%. Buat/masukkan juga ke dalam tabel ringkasan Anava.
Samsudi - STATISTIKA 67
BAB IX
ANALISIS REGRESI
Tujuan
Mahasiswa memiliki pemahaman tentang analisis regresi klasifikasi tunggal dan ganda
dan mampu menggunakannya untuk menganalisis data penelitian.
Samsudi - STATISTIKA 68
Realitas tentang hubungan/keterkaitan antar ubahan dapat dikategorikan dalam
konteks ubahan yang satu menjadi penyebab dari ubahan lainnya. Pola hubungan seperti
ini disebut sebagai kausalitas, artinya ubahan yang satu merupakan predictor, sedangkan
ubahan yang lain sebagai kriterium.
Misalnya, apakah prestasi belajar anak dapat diprediksikan dari angka
kecerdasan dan perbendaharaan bahasa (kosakata); apakah produktivitas kerja
karyawan dapat diprediksikan dari hasil tes seleksi dan lamanya latihan dan sebagainya.
Dalam contoh ini prestasi belajar dan produktivitas kerja merupakan ubahan kriterium,
sedangkan angka kecerdasan, perbendaharaan bahasa, hasil tes seleksi, dan lamanya
latihan merupakan ubahan predictor.
Suatu ubahan dapat diramalkan dari ubahan lain apabila antara ubahan yang
diramalkan, disebut terikat / dependend, dan ubahan yang digunakan untuk
meramalkan, disebut bebas / Independend, terdapat korelasi yang signifikan. Misalnya,
jika antara tinggi badan dan berat badan pada umur-umur tertentu terdapat korelasi yang
signifikan, maka berat badan orang pada umur tersebut dapat diramalkan dari tinggi
badannya.
Korelasi antara ubahan kriterium dengan ubahan predictor dapat dilukiskan
dalam suatu garis. Garis ini disebut garis regresi. Garis regresi mungkin merupakan
garis lurus (linear), mungkin merupakan garis lengkung (parabolic, hiperbolik, dan
sebagainya). Dalam kesempatan ini hanya akan kita bicarakan garis regresi yang linear.
Suatu garis regresi dapat dinyatakan dalam persamaan matematik. Persamaan ini
disebut persamaan regresi. Untuk garis regresi linear dnegan satu ubahan predictor
persamaannya adalah :
Y = aX + K
dalam mana Y = kriterium; X = prediktor; a = bilangan koefisien prediktor ; dan K =
bilangan konstan.
Untuk garus regresi linear dengan dua ubahan predictor persamaan garisnya
adalah :
Y = a1 X 1 + a2 X 2 + K
dan untuk m ubahan prediktor persamaannya adalah :
Y = a1 X 1 + a2 X 2 + ....... + am X m + K
dalam mana
Y = Kriterium
Samsudi - STATISTIKA 69
X1, X2, . . . . …, Xm = Prediktor 1, prediktor 2, prediktor ke- m
a1, a2, . . . . . . .. ., am = Koefisien prediktor 1, koefisien prediktor 2,. . . . .
. . . ., koefisien prediktor ke-m
K = Bilangan konstan
untuk menemukan persamaan guru regresi tersebut harga-harga koefisien prediktor dan
bilangan konstantanya dapat dicari dari data yang diselidiki.
Mengenai tugas kedua dari pembicaraan analisis regresi, yaitu memberi dasar
untuk pembicaraan mengenai analisis kovariansi, akan kita bicarakan pada waktu kita
membicarakan analisis kovariansi.
Jika kita melukis garis regresi untuk meramalkan kriterium dari prediktor, tujuan
kita adalah ingin mendapatkan dasar ramalan yang menghasilkan kesalahan yang
sekecil-kecilnya. Tujuan itu dapat tercapai, jika dari serangkaian ramalan jumlah
kesalahan-kesalahan raalan itu sama dengan nol. Kesalahan ramalan ini disebut residu.
Maksud pernyataan ini akan dapat kita fahami dari contoh-contoh yang akan diberikan
nanti.
Contoh :
Misalkan suatu penelitian ingin memastikan apakah berat badan orang pada
kelompok umur tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu
dikumpulkan data tinggi badan dan berat badan sepuluh orang sebagai berikut :
Tinggi Berat
Subyek
(dalam cm) (dalam kg)
No.
X. y
1 168 63
2 173 81
3 162 54
4 157 49
5 160 52
6 165 62
7 163 56
8 170 78
9 168 64
10 164 61
Korelasi antara prediktor X dengan kriterium Y dapat kita cari melalui teknik
korelasi momen tangkar dari Pearson, dengan rumus umum :
Samsudi - STATISTIKA 70
rxy =
∑ xy
(∑ x )(∑ y )
2 2
( Y)
∑ y = ∑ Y − ∑N
2
2
Jika tekah kita lakukan komputasi terhadap data contoh hasil penelitian tersebut
(gunakan kalkulator yang ada fungsi statistiknya), akan kita temukan :
N = 10
∑X = 1.650 ∑Y = 620 ∑XY = 102.732
∑X2 = 272.460 ∑Y2 = 39.432
Dari itu
(1.650)(620) = 432
∑ xy = 102.732 − 10
1.6502
∑ x 2
= 272.460 −
10
= 210
6202
∑ y = 39.432 − 10 = 992
2
432
rxy = = 0,946
(210)(992)
Untuk menguji apakah harga rxy = 0,946 itu signifikan apa tidak, kita dapat
berkonsultasi dengan tabel r – teoretik dengan dengan N = 10 atau derajat kebebasan db
= 10 – 2 (Catatan: ada tabel r = teoretik yang menggunakan N, ada juga yang
menggunakan db, Ambilah mana saja yang tersedia pada Anda). Dari tabel r – teoretik
dengan N = 10 (atau db = 8) akan kita ketemukan harga r-teoretik pada taraf
signifikansi 1% atau rt1% = 0,765. karena itu harga rxy sebesar 0,946 itu kita nyatakan
sangat signifikan, dan kita dapat menyimpulkan bahwa korelasi antara X dan Y, yaitu
antara tinggi badan dan berat badan, sangat signifikan.
Dengan harga korelasi antara tinggi badan dan berat badan yang sangat
signifikan itu kita mempunyai landasan untuk meramalkan / mengestimasi berat badan
dari tinggi badan (sebenarnya boleh juga sebaliknya, kita dapat meramalkan tinggi
badan dari berat badan), dab karenanya kita dapat membuat garis regresi untuk prediksi
dengan rumus garis regresi untuk prediksi dengan rumus garis regresi satu-prediktor
yang sudah kita ketahui, yaitu :
Y = αX + K → Y = αx + bx → α = Koefisien prediktor
Samsudi - STATISTIKA 71
Untuk mengisi persamaan garis regresi itu harga koefisien prediktor (yaitu harga
a) dan harga bilangan konstan K harus kita ketemukan lebih dahulu. Harga-harga a dan
K itu dapat kita ketemukan melalui dua jalan : (a) dengan metode skor kasar, dan (b)
dengan metode skor deviasi. Kedua metode ini akan menghasilkan harga-harga a dan K
yang sama. Nanti kita akan memilih salah satu dari dua metode itu berdasarkan
pertimbangan efisiensi.
Dengan metode skor kasar harga-harga a dan K dapat dicari dari persamaan :
(1 ) Σ XY = a Σ X 2
+ KΣX
( 2 ) Σ Y = a Σ X + NK
Jika data yang sudah kita ketahui kita masukkan ke dalam rumus-rumus itu
(1) 102.732 = 272.460 a + 1.650 K
(2) 620 = 1.650 a + 10 K
dengan penyelesaian persamaan secara simultan akan kita ketemukan (dengan membagi
persamaan I dengan 1.650 dan persamaan 2 dengan 10) :
Dengan metode skor deviasi harga-harga a dan K dapat kita cari dari persamaan
y = ax
Σ xy
y =Y −Y, x = X − X, a=
Dalam mana dan
Σx 2
Samsudi - STATISTIKA 72
Jika data yang sudah diketemukan dimasukkan ke dalam rumus tersebut :
Σ xy = 432
Σ x 2 = 210
432
a = = 2 , 05
210
y = 2 , 05 x
Dari data yang dikumpulkan dapat dicari :
ΣY 620 ΣX 1.650
Y = = = 62 X = = = 165
N 10 N 10
Karena itu untuk persamaan garis regresi y = ax atau Y - Y = a ( X - X ) dapat
kita selesaikan:
Y − 62 = (2,05)( X − 165)
Y = 2,05 X − 338 , 25 + 62
Y = 2,05 X − 276 , 25
Dengan etode skor kasar kita menemukan persamaan garis regresinya Y = 2X –
268, sedang dengan metode skor deviasi kita menemukan persamaan garis regresinya Y
= 2,05 X – 276,25. Seharusnya dengan kedua metode itu kita tidak menemukan hasil
perhitungan yang berbeda. Perbedaan hasil perhitungan garis regresi yang kita temukan
itu semata-mata disebabkan karena ketelitian perhitungan saja. Dengan jumlah desimal
yang mengambang sampai enam desimal, hasilnya adalah
Y = 2,057143 X − 277 ,428595
Baiklah kita coba dulu meramalkan berat badan dari persamaan garis regresi Y =
2X-268 seperti yang dihasilkan dengan perhitungan dengan metode skor kasar. Maka
untuk tinggi badan atau X tertentu, berat badannya atau Y-nya akan
Untuk X = 175 Y = 2(175)-268 = 82;
Untuk X = 174 Y = 2(174)-268 = 80;
Dan seterusnya . . . .
Untuk X = 150 Y = 2(150) – 268 = 32
Jika dari perhitungan-perhitungan itu kita buat suatu tabel berikut.
Tabel 9.1
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2 X – 268
Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg) Tinggi (cm) Berat (kg)
X Y X Y X Y
175 82 165 62 155 42
174 80 164 60 154 40
173 78 163 58 153 38
172 76 162 56 152 36
171 74 161 54 151 34
170 72 160 52 150 32
169 70 159 50 149 30
168 68 158 48 148 28
Samsudi - STATISTIKA 73
167 66 157 46 147 26
166 64 156 44 146 24
Tabel. 9.2
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,05 X – 276,25
X Y X Y X Y
Tabel 9.3
TABEL RAMALAN BERAT BADAN (Y) DARI TINGGI
BADAN (X) DARI PERSAMAAN GARIS REGRESI Y = 2,057 143X – 277,428 595
X Y X Y X Y
Dari tiga tabel raalan yang telah kita susun itu tabel yang terakhir ini adalah
yang paling teliti, sedang tabel yang pertama merupakan tabel yang paling kurang teliti.
Ketelitian itu mungkin ada akibatnya dalam kesalahan ramalan atau residu. Ini dapat
kita uji dari perbandingan seperti di bawah ini.
Samsudi - STATISTIKA 74
9.2. Analisis Varians Garis Regresi
Sebelum kita melanjutkan pembicaraan mengenai analisis regresi dengan dua
prediktor atau lebih, ada baiknya kita membicarakan dulu apa yang sesungguhnya
disebut analisis regresi.
Jika suatu prediksi hanya menggunakan satu ubahan prediktor seperti contoh
ditas, pekerjaan “analisis regresi” seperti yang sudah kita kerjakan boleh dikatakan
selesai. Sebab besarnya korelasi antara prediktor dengan kriterium telah diketemukan,
uji signifikansinya sudah dijalankan; dan garis regresinya telah dibuat. Akan tetapi, jika
dalam prediksi digunakan beberapa prediktor, untuk menguji signifikansi garis
regresinya perlu dilakukan analisis variansi terhadap garis regresi tersebut. Apa yang
disebut analisis regresi sebenarnya adalah analisis variansi terhadap garis regresi,
dengan maksud untuk menguji signifikansi garis regresi yang bersangkutan. Dari
analisis regresi kita akan menghasilkan bilangan –F sebagaimana halnya jika kita
mengadakan analisis variansi. Untuk analisis regresi bilangan – F diperoleh dari rumus :
RK
F reg =
reg
RK res
Dalam mana Freg = Harga bilangan – F untuk garis regresi;
RKreg = Rerata Kuadrat garis regresi; dan
RKres = Rerata Kuadrat residu.
Jadi bilangan –F regresi diperoleh dari membandingkan (nisbah) RK regresi dengan RK
residu. Makin besar harga RK residu akan makin kecil harga F regresi. RK residu RK
“error” memang mempunyai cirri semacam itu: dalam perhitungan nisbah – F harga
bilangan –F akan sangat ditentukan oleh harga RK “error” nya. Maka, dalam analisis
garis regresi, jika harga F - regresi sangat kecil dan tidak signifikan , maka garis
regresinya tidak akan memberikan landasan untuk prediksi secara efisien.
Walaupun analisis variansi garis regresi lebih efektif untuk menganalisis garis
regresi dengan beberapa prediktor, namun sebagai dasar pemahaman marilah kita coba
menganalisis data satu prediktor dalam contoh di depan.
Dalam analisis variansi perhitungan yang paling banyak harus dilakukan adalah
perhitungan mengenai jumlah Kuadrat JK (Jumlah Kuadrat). Jika hasil perhitungan JK
kita masukkan dalam tabel ringkasan analisis varians, maka perhitungan rerata Kuadrat
RK dan F-nya tidak akan banyak menghadapi kesulitan. Tata kerja itu akan kita tempuh
juga dalam percobaan kita menerapkan rumus-rumus analisis variansi ini.
Samsudi - STATISTIKA 75
6202
JKT = 39.432 − = 992
10
6202
JKreg = 2(102.732) + (− 268)(620) − = 864
10
JKres = 992 − 864 = 128
dbT = 10 − 1 = 9
dbreg = 1
dbres = 9 − 1 = 8
Sumber
db JK RK
Variasi
Regresi (reg) 1 (Σxy )2
JK reg
Σx 2
dbreg
Residu (res) N–2 Σy 2 −
(Σxy ) 2
JK res
Σx 2
dbres
Total T N–1 ΣY 2 -
KRreg
Freg = ; db = 1 lawan N-2
KRres
Sumber
db JK RK Freg
Variasi
Regresi 1 (Σxy )2
(reg) JK reg
Σx 2 RK reg
dbreg
N–2 Σy 2 −
(Σxy )
2
JK res
RK res
Samsudi - STATISTIKA 76
(dari rxy)
Sumber
db JK RK Freg
Variasi
Regresi(reg) 1 (r )(Σ y )
2 2
(r )(Σ y )
2 2
(r )(N − 2)
2
(1 − r )(Σ y )
2 2
1− r2
Residu (res) N–2 (1 − r )(Σ y )
2 2
N − 2
Total ( T ) N–1 ΣY 2
- -
TABEL RINGKASAN
Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 864 864 < 0,01
54,00
Residu (res) 8 128 10
Total ( T ) 9 992 - - -
TABEL RINGKASAN
Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 888,69 888,69 68,84 < 0,01
Residu (res) 8 103,31 12,91 - -
Total ( T ) 9 992 - - -
Melalui rxy :
Samsudi - STATISTIKA 77
JKT = 992 dbT = 10 − 1 = 9
JK reg = (0,946) (992) = 887,76
2
dbreg = 1
JK reg = 992 − 887 , 26 = 1 dbres = 9 − 1 = 8
TABEL RINGKASAN
Sumber
db JK RK Freg p
Variasi
Regresi(reg) 1 887,76 887,76 68,13 < 0,01
Residu (res) 8 104,24 13,03 - -
Total ( T ) 9 992 - - -
Dari tiga perhitungan tersebut kita memperoleh harga F regresi yang berbeda-
beda : yang pertama F = 54,00; yang kedua F= 68,84; dan yang ketiga F = 68,13. Dua
harga F yabf terakhir boleh dikatakan sama, tetapi harga F dari perhitungan yang
pertama ternyata sangat rendah. Seharusnya, dengan metode manapun hasilnya akan
sama saja. Perbedaan itu disebabkan karena ketelitian perhitungan.
Samsudi - STATISTIKA 78
Mhs.
X1 X2 Y
No.
1 57 3,00 27
2 93 2,85 34
3 79 3,20 27
4 26 2,49 24
5 69 3,07 35
6 24 2,38 18
7 76 3,74 33
8 61 2,62 39
9 82 2,53 35
10 29 3,17 25
Jika hasil perhitungan itu kita ubah dalam skor deviasi maka akan kita peroleh :
( X)
∑ = ∑ − ∑N = 41 .214 − 10 = 5 .692 , 4
2 2
2 5962 1
1 1
( X )
∑ = ∑ − ∑ N = 85 ,9537 − 10 = 1,56345
2 2
2 2 29 , 05 2
2 2
( y)
∑ y = ∑ y − ∑N = 9 ,199 − 10 = 378 ,1
2 2
2 297 2
( X )( X )
∑ X X = ∑ X X − ∑ ∑ = 1.765,99 −
(596)(29,05) = 34,61
1 2
1 2 1 2
N 10
(∑ X 1 )(∑ Y ) (596)(297 ) = 1.085,8
∑X Y = ∑X Y −
1 1
10
N
=18.787 −
(∑ X 2 )(∑ Y )
(29,05)(297 ) = 4,965
∑ X 1Y = ∑ X 2Y − N
=867,75 −
10
Persamaan simultan untuk menentukan a1 dan a2 adalah :
(1). ∑x 1 y = a 1 Σ x 12 + a 2 Σ x 1 x 2
(2). ∑ x 2 y = a1Σ x1 x 2 + a 2 ∑ x 22
Samsudi - STATISTIKA 79
Diisikan dan dikerjakan
Persamaan garis regresi dalam skor deviasi yang kita cari adalah :
Y = a1 x1 + a2 x2
( ) (
Y − Y = a1 X 1 − X 1 + a2 X 2 − X 2 )
Y = a (X
1 1 − X ) + a (X
1 2 2 − X2 )+ Y
Dari pekerjaan di muka dapat diketemukan :
596
X1 = = 59,6
10
29,05
X2 = = 2,905
10
297
Y= = 29,7
10
a1 = 0,198100375
a2 = −1,209667071
Jadi,
Y = (0,198100375)( X 1 − 59,6 ) + (− 1,209667071)( X 2 − 2,905) + 29,7
= 0,198100375 X 1−11,80678235 − 1,209667071X 2 + 3,514082841 + 29,7
Y = 0,198100375 X 1 − 1,209667071X 2 + 21.40730049
Jika dibulatkan : Y = 0,2 X 1 − 1,2 X 2 + 21,4 → Y = a1 x1 − a2 x2 + K
Samsudi - STATISTIKA 80
a 1Σ x1 y + a 2 Σ x 2 y
R y (1, 2 ) =
Σy 2
RY(1,2) = Koefisien korelasi antara Y dengan X1 dan X2
a1 = Koefisien prediktor X1
a2 = Koefisien prediktor X2
∑x1y = Jumlah setujuduk antara X1 dengan Y
∑x2y = Jumlah setujuduk antara X2 dengan Y
∑y2 = Jumlah Kuadrat kriterium Y
R y (1, 2 ) =
(0,198100375 )(1 .085 ,8 ) + (− 1, 209667071 )(4,965 )
378 ,1
= 0,553005527 = 0,743643414
Dalam perhitungan tersebut sekaligus dicari harga R2y(1,2) oleh karena dalam analisis
regresi nanti yang kita pakai adalah harga R2y(1,2)
Untuk menjawab pertanyaan, apakah harga Ry(1,2) = 0,744 itu signifikan apa
tidak, analisis regresi tidak lain adalah analisis regresi. Seperti sudah kita kenal, analisis
regresi tidak lain adalah analisis harga F si garis regresi. Dari analisis ini kita akan
menemukan harga F garis regresi, yang kemudian dapat kita uji apakah harga F itu
signifikan ataukah tidak.
Rumus F yang paling efisien, jika koefisien korelasi antara kriterium dengan
prediktor-prediktorny a telah diketemukan, adalah:
R 2 (N − m − 1)
=
( )
F reg
m 1− R2
F reg = Harga F garis regresi
N = Cacah kasus
m = Cacah prediktor
R = Koefisien korelasi antara kriterium dengan prediktor-prediktor.
Derajat kebebasan atau db untuk menguji harga F itu adalah m lawan N – m – 1.
Diisikan :
F reg =
(0 ,553055527 )(10 − 2 − 1) = 4,330 < 4,74
2 (1 − 0 ,553005527 )
Dengan db = m lawan N-m-1 atau 2 lawan 7 harga Ft5% = 4,74 jadi, jika
demikian, harga Freg sebesar 4,330 itu tidak signifikan. Kita menyimpulkan, tidak ada
korelasi antara Y dengan X1 dan X, atau antara nilai statistika Dasar dengan nilai Pretest
Samsudi - STATISTIKA 81
Aljabar dan persen kita tidak berani menggunakan prediktor nilai Pretest Aljabar dan
nilai Indeks Prestasi SMA untuk memprediksi nilai Statistik Dasar.
Rumus F regresi yang baru disebutkan di atas diperoleh dari setujuses analisis
variasi garis regresi yang agak panjang. Keseluruhan setujuse situ dapat dilihat dalam
tabel rangkuman analisis regresi sebagai berikut :
R 2 Σy2 ( )
m R 2 (N − m − 1 )
= =
Freg
(
1 − R 2 Σy2 )( ) (
m 1− R2 )
N − m −1
( )
JK reg = R 2 Σ Y 2 = (0 ,553005527 )(378 ,1) = 209 ,0913897
db reg = m = 2
JK 209 , 0913897
RK reg = = = 104 ,5456948
reg
db reg 2
( )( )
JK res = 1 − R 2 Σ Y 2 = (1 − 0,553005527 )(378 ,1) = 169 ,0086102
dbres = N − m − 1 = 10 − 2 − 1 = 7
JK res 169 ,0086102
RK res = = = 24 ,14408717
dbres 7
RK reg 104 ,5456948
JadiFreg = = = 4,330
RK res 24 ,14408717
Hasil analisis regresi tersebut kemudian dapat kita masukkan dalam tabel
ringkasan analisis sebagai berikut :
Samsudi - STATISTIKA 82
TABEL RINGKASAN ANALISIS REGRESI
Sumber
db JK RK
Variasi
209,091 389 7 104,545 694 8
Regresi(reg) 2
169,008 610 2 24, 144 087 17
Residu (res) 7
Total ( T ) 9 378,1 ----------
F = 4,330
Jika diinginkan mencari harga F regresi dengan rumus skor kasar, rumusnya
adalah :
( N − m − 1 )⎢ a1Σ X 1Y + a 2 Σ X 2Y + K Σ Y − (Σ Y ) ⎥
⎡ 2
⎤
Freg = ⎣ N ⎦
(
m Σ Y − a1Σ x1 y − a 2 Σ X 2Y − K Σ Y
2
)
Untuk mengingat kembali data dan hasil-hasil perhitungan yang sudah kita
ketemukan :
N = 10 m=2
a1 = 0,198 100 375 a2 = 1,209 667 071 K = 21, 407 300 49
∑X1Y = 18.787 ∑X2Y = 867,75
∑Y = 297 ∑Y2 = 9.199
Dikerjakan
N – m – 1 = 10 – 2 – 1 = 7
a1∑X1Y = (0,198 100 375) (18.787) = 3.721,711 745
a2∑X2Y = (-1,209 667 071) (867,75) = - 1.049,688 6
K∑Y = (21,407 300 49) (297) = 6.375, 968 245
(ΣY ) = 297 = 8.820,9
2 2
N 10
Diisikan :
Rumus-rumus skor kasar untuk analisis regresi dapat dirangkum dalam tabel
seperti di bawah ini :
Samsudi - STATISTIKA 83
TABEL RINGKASAN ANALISIS REGRESI
Sumber
db JK RK
Variasi
Regresi(reg) m
a1ΣX 1Y + a2 ΣX 2Y + KΣY −
(ΣY )2 JK reg
N dbreg
Residu (res) N-m-1
ΣY 2 − a1Σx1 y − a2 ΣX 2Y − KΣY JK res
dbres
Total ( T ) N-1 ΣY 2
−
(ΣY )
2
--
N
⎡
(N − m − 1)⎢a1ΣX 1Y + a2ΣX 2Y + KΣY − (ΣY ) ⎤
2
⎥
= ⎣ N ⎦
Jadi Freg
(
m ΣY 2 − a1Σx1 y − a2ΣX 2Y − K ΣY )
Dikerjakan berikutnya :
Sebagaimana biasa dari hasil analisis variansi garis regresi dibuatlah tabel ringkasan
analisis. Maka jika kita buat tabel ringkasan analisis regresi, hasilnya akan nampak
seperti tabel ringkasan analisis regresi seperti yang baru kita buat di muka.
Telah dikemukakan, apabila dalam mengerjakan analisis regresi kita hanya
mempunyai kalkulator tangan, cara yang paling efisien adalah menggunakan metode
Samsudi - STATISTIKA 84
skor deviasi. Karena itu untuk analisis-analisis berikutnya akan kita gunakan saja
metode skor deviasi, dan untuk metode skor kasar hanya akan dikemukakan rumusnya,
saja.
Koefisien Korelasi
a1Σ x1 y + a 2 Σ x 2 y
Dua Prediktor : R (1 , 2 ) =
Σy2
y
a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y
Tiga Prediktor : R (1 , 2 ) =
Σy 2
y
a1Σ x1 y + a 2 Σ x 2 y + a 3 Σ x 3 y + a 4 Σ x 4 y
Empat Prediktor : R y (1, 2 ) =
Σy 2
a 1 Σ x 1 y + ....... + a m Σ x m y
m – Prediktor : R y (1 , 2 ) =
Σy 2
Samsudi - STATISTIKA 85
Soal Latihan
1. Jika suatu penelitian ingin menguji apakah berat badan orang pada kelompok umur
tertentu dapat diramalkan dari tinggi badan. Dalam penelitian itu dikumpulkan data
tinggi badan dan berat badan sepuluh orang sebagai berikut :
Tinggi Berat
Subyek
(dalam cm) (dalam kg)
No.
X. y
1 168 63
2 173 81
3 162 54
4 157 49
5 160 52
6 165 62
7 163 56
8 170 78
9 168 64
10 164 61
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.
2. Seorang peneliti akan menguji apakah nilai Praktik Kelistrikan Otomotif (X1) dan
Praktik Chasis (X2) berpengaruh terhadap nilai Praktik Trouble Shoting (Y)
mahasiswa Pendidikan Teknik Mesin. Untuk itu peneliti tersebut telah
mengumpulkan data sebagai berikut :
Mhs.
X1 X2 Y
No.
1 60 67 78
2 72 66 82
3 79 65 80
4 68 87 81
5 69 75 83
6 78 77 85
7 76 67 78
8 61 65 86
9 82 66 78
10 68 62 77
11 70 63 75
12 71 70 76
13 72 73 73
14 69 68 72
15 82 81 71
Ujilah pada taraf signifikansi 1%, dan gunakan table rangkuman analisis regresi.
Samsudi - STATISTIKA 86
DAFTAR PUSTAKA
Hadi, Sutrisno. 1982. Statistik, Jilid 1, 2 dan 3. Yogyakarta: Fakultas Psikologi UGM
Mendenhall, William; Ott, Lyman; Larson, Ricahrd F. 1974. Statistics: a Tool for the
Social Sciences. California: Duxbury Press.
Sudjana. 1991. Desain dan Analisis Eksperimen. Edisi III. Bandung: Tarsito.
Samsudi - STATISTIKA 87